옵션
뉴스
Google은 Advanced AI 추론 모델 패밀리를 시작합니다

Google은 Advanced AI 추론 모델 패밀리를 시작합니다

2025년 4월 10일
83

Google은 Advanced AI 추론 모델 패밀리를 시작합니다

화요일에 Google은 Gemini 2.5를 출시했는데, 이는 답변을 내놓기 전에 잠시 "생각"하는 새로운 AI 모델 세트입니다. 마치 우리 인간을 흉내 내려는 것 같죠?

선두를 달리는 것은 Gemini 2.5 Pro Experimental로, Google이 지금까지 가장 똑똑한 모델이라고 자랑하는 제품입니다. 이 녀석은 다중 모달을 지원하며 추론 작업을 능숙하게 처리할 수 있습니다. 화요일부터 Google AI Studio에서 사용해볼 수 있으며, Gemini Advanced에 월 20달러를 지불하는 경우 Gemini 앱을 통해 접근할 수 있습니다.

Google은 이 추론 기능에 꽤 진지합니다. 그들은 앞으로 나올 모든 AI 모델에 이를 통합할 계획입니다.

2024년 9월 OpenAI가 최초의 AI 추론 모델인 o1을 공개한 이후, 기술계는 따라잡기 위해 분주히 움직이고 있습니다. 이제 Anthropic, DeepSeek, Google, xAI 모두 각자의 추론 모델로 경쟁에 뛰어들었습니다. 이 모델들은 사실을 재확인하고 문제를 깊이 생각한 후 답변을 제공하기 위해 더 많은 시간과 컴퓨팅 파워를 사용합니다.

추론 기술은 특히 수학 및 코딩 분야에서 AI에 혁신을 가져왔습니다. 기술계의 많은 사람들은 이러한 추론 모델이 AI 에이전트, 즉 인간의 감독 없이 작업을 수행할 수 있는 자율 시스템에 필수적일 것이라고 생각합니다. 하지만, 네, 비용도 더 비쌉니다.

Google은 이미 추론 모델을 다뤄본 경험이 있습니다. 예를 들어, 작년 12월에 출시한 "생각하는" Gemini 버전이 있죠. 하지만 Gemini 2.5는 OpenAI의 "o" 시리즈를 뛰어넘기 위한 Google의 큰 도전입니다.

Google은 Gemini 2.5 Pro가 이전 모델들과 경쟁사의 주요 모델들을 여러 벤치마크에서 앞선다고 주장합니다. 그들은 Gemini 2.5를 시각적으로 멋진 웹 앱과 독립적으로 작동할 수 있는 코딩 프로젝트에서 탁월한 성능을 내도록 조정했습니다.

코드 편집을 위한 Aider Polyglot 테스트에서 Gemini 2.5 Pro는 68.6%라는 높은 점수를 기록하며 OpenAI, Anthropic, DeepSeek의 최고 모델을 앞질렀습니다. 하지만 소프트웨어 개발을 위한 SWE-bench Verified 테스트에서는 63.8%를 기록해 OpenAI의 o3-mini와 DeepSeek의 R1을 이겼지만, Anthropic의 Claude 3.7 Sonnet(70.3%)에는 미치지 못했습니다.

그리고 수학, 인문학, 과학에 관한 수천 개의 질문을 포함하는 까다로운 다중 모달 테스트인 Humanity's Last Exam에서는 Gemini 2.5 Pro가 18.8%를 기록해 대부분의 주요 모델들보다 나은 성적을 냈습니다.

Gemini 2.5 Pro는 출시와 동시에 100만 토큰의 컨텍스트 창을 제공합니다. 이는 마치 "반지의 제왕" 시리즈 전체를 한 번에 읽을 수 있는 것과 같습니다. 그리고 곧 이를 200만 토큰으로 두 배 늘릴 계획입니다.

Google은 현재 API 가격을 비공개로 유지하고 있지만, 앞으로 몇 주 안에 자세한 정보를 공개할 것이라고 약속했습니다.

관련 기사
구글의 최신 제미니 AI 모델은 테스트에서 안전 점수가 하락하고 있습니다. 구글의 최신 제미니 AI 모델은 테스트에서 안전 점수가 하락하고 있습니다. Google의 내부 테스트 결과 최신 AI 모델의 안전 프로토콜이 이전 버전에 비해 성능이 저하된 것으로 나타났습니다. 새로 발표된 벤치마크에 따르면 Gemini 2.5 플래시 모델은 텍스트와 이미지 프롬프트를 모두 처리할 때 주요 안전 지표에서 가이드라인 위반 비율이 4~10% 더 높은 것으로 나타났습니다.이 기술 대기업의 자동화된 평가는 우려스러운 경향
앱 디자인 프로세스를 간소화하는 구글의 스티치 AI 앱 디자인 프로세스를 간소화하는 구글의 스티치 AI 구글, I/O 2025에서 AI 디자인 도구 Stitch 공개Google은 Google I/O 2025 기조연설에서 혁신적인 AI 기반 인터페이스 디자인 도구인 Stitch를 소개했습니다. 이 혁신적인 솔루션은 자연어 프롬프트나 참조 이미지를 프로덕션에 바로 사용할 수 있는 HTML 및 CSS 코드가 포함된 완전한 기능의 UI 디자인으로 변환합니다.Stit
Google, Gmail, 문서 및 동영상용 AI 기반 도구 출시 Google, Gmail, 문서 및 동영상용 AI 기반 도구 출시 Google, I/O 2025에서 AI 기반 Workspace 업데이트 공개Google은 연례 개발자 컨퍼런스에서 사용자가 Gmail, 문서도구, 동영상과 상호작용하는 방식을 근본적으로 변화시키는 혁신적인 AI 기능을 Workspace 제품군에 도입한다고 발표했습니다. 이번 업데이트는 생산성 애플리케이션 전반의 지능형 자동화와 간소화된 워크플로우에 중점을
의견 (37)
0/200
JasonRamirez
JasonRamirez 2025년 8월 24일 오후 10시 1분 19초 GMT+09:00

Whoa, Google’s Gemini 2.5 sounds like it’s got a brain of its own, pausing to ‘think’ before answering! 😮 Makes me wonder if it’ll outsmart us at pub quizzes soon. Cool tech, but I hope it doesn’t start overanalyzing my bad jokes.

EricMiller
EricMiller 2025년 8월 10일 오후 6시 1분 0초 GMT+09:00

Google's Gemini 2.5 sounds like a brainy upgrade! I wonder if it’ll outsmart my math homework. 🤓 Excited to see how it stacks up against other AI models.

RonaldMartinez
RonaldMartinez 2025년 4월 24일 오후 1시 43분 27초 GMT+09:00

Gemini 2.5 is pretty cool! It's like it pauses to think before answering, which is kinda human-like. I tried it out and it's definitely smarter than the last version. Only thing is, sometimes it takes too long to respond, but hey, I guess that's the price of deep thinking! 🤔

RalphHill
RalphHill 2025년 4월 22일 오후 11시 53분 21초 GMT+09:00

O Gemini 2.5 é bem legal, mas às vezes demora muito para 'pensar'. Entendo que está tentando ser mais humano, mas quando preciso de respostas rápidas, é um pouco frustrante. Ainda assim, é mais inteligente que a maioria dos AIs por aí! 🤖💭

HenryJackson
HenryJackson 2025년 4월 20일 오후 3시 8분 13초 GMT+09:00

ジェミニ2.5は結構クールだけど、時々「考える」のに時間がかかりすぎる。もっと人間っぽくなるのは分かるけど、早く答えが欲しい時はちょっとイライラする。でも、他のAIより賢いからね!🤖💭

JerryGonzález
JerryGonzález 2025년 4월 19일 오후 9시 28분 17초 GMT+09:00

ジェミニ2.5、面白いですね!回答前に少し考えるのが人間っぽくて好きです。試してみたら前より賢くなってるのがわかりました。ただ、時々レスポンスが遅いのが気になりますが、深く考えるための代償だと思えば許せますね!🤔

위로 돌아갑니다
OR