구글의 AI 도약 속内幕: Gemini 2.5는 더 깊이 생각하고, 더 영리하게 말하며, 더 빠르게 코딩한다

구글, 보편적인 AI 어시스턴트 비전 실현에 한 걸음 더 다가서다
올해 구글 I/O 행사에서 구글은 Gemini 2.5 시리즈의 중요한 업데이트를 공개했다. 특히 다양한 차원에서 기능을 개선하는 데 초점을 맞췄다. 최신 버전인 Gemini 2.5 Flash와 2.5 Pro는 이제 더 지능적이며 효율적이다. 이러한 발전은 구글이 모든 상황에서 원활하게 맥락을 이해하고 계획을 세우고 작업을 수행할 수 있는 보편적인 AI 어시스턴트를 만드는 비전에 한 걸음 더 가까워지게 한다.
Gemini 2.5 Pro: 지능의 새로운 고도 도달
구글이 현재까지 가장 고급스러운 모델이라고 칭하는 Gemini 2.5 Pro는 무려 1백만 토큰의 컨텍스트 윈도우를 자랑한다. 이 기능은 AI가 방대한 데이터를 처리하고 긴 대화에서도 일관성을 유지할 수 있게 해준다. 행사에서 구글 딥마인드 CEO인 데미스 하사비스는 진보에 대해 큰 기대감을 나타내며 "이것이 Gemini 앱의 궁극적인 목표입니다: 개인적이고 proactive하며 강력한 AI를 만드는 것"이라고 말했다. Gemini 2.5 Pro의 돋보이는 특징 중 하나는 '딥씽(Deep Think)'이라는 실험적인 강화된 추론 모드의 도입이다. 딥씽은 응답하기 전에 여러 가지 가설을 분석하도록 설계되어 AI의 의사결정 능력을 향상시킨다. 하사비스는 이 발전이 알파고 개발 과정에서 얻은 통찰로부터 나온 것임을 언급하며, 더 긴 처리 시간이 더 나은 결과를 가져왔다고 설명했다.
벤치마크 테스트에서의 뛰어난 성능
딥씽은 이미 어려운 벤치마크에서 놀라운 성과를 보여주었다. 예를 들어, 2025년 미국 수학 올림피아드(USAMO)에서 뛰어난 점수를 받았으며, 고급 프로그래밍 기술을 평가하는 LiveCodeBench에서도 우수한 성적을 거두었다. 또한, MMU(Multimodal Understanding)에서 84.0%의 점수를 기록하며 다양한 모드에서의 이해와 추론 능력을 입증했다. 이러한 성과에도 불구하고 구글은 여전히 신중하다. 하사비스는 팀이 안전성 평가를 철저히 진행하고 전문가들의 피드백을 수집한 후 딥씽을 보다 넓게 배포할 계획이라고 밝혔다. 현재는 API를 통해 신뢰할 수 있는 테스터들에게만 접근 가능하다.
Gemini 2.5 Flash: 매일 사용하기 좋은 작업 마차
Gemini 2.5 Pro와 함께 구글은 Gemini 2.5 Flash의 개선된 버전도 발표했다. 이 버전은 속도, 효율성, 경제성을 고려해 설계되었다. 하사비스는 이를 "시리즈의 작업 마차"라고 표현하며, 논리, 다중 모달, 코드, 긴 컨텍스트 등에서 벤치마크에서 두 번째로 뛰어난 성능을 보여준다고 설명했다. 실제로 Gemini 2.5 Pro에 이어 LMArena 리더보드에서 두 번째로 높은 순위를 차지한다. 업데이트된 플래시 모델은 약 20~30% 더 효율적으로 동작하며, 작업을 수행하기 위해 필요한 토큰 수를 줄였다. 개발자 피드백을 바탕으로 구글은 모델을 최적화했으며, Google AI 스튜디오, Vertex AI, 그리고 Gemini 앱에서 미리보기를 제공하고 있다. 본격적인 출시는 6월 초 예정이다.
두 모델 모두에서 새롭게 추가된 기능들
Gemini 2.5 Pro와 Flash 모두 사용자 상호작용을 향상시키기 위해 다양한 새로운 기능을 추가했다. 자연스러운 대화 경험을 위해 내장 오디오 출력이 추가되었으며, 텍스트-투-스피치 기능은 여러 가지 목소리를 지원한다. 사용자는 AI의 음성 톤과 스타일을 조정할 수 있어 멜로드라마틱하거나 진지한 분위기로 설정할 수 있다. 다른 실험적인 음성 기능에는 감정을 인식하는 대화(Affective Dialogue)와 배경 소음을 필터링하는 proactive audio가 포함된다. 또한, 개발자가 응답하기 전에 AI가 사용하는 컴퓨팅 파워를 조절할 수 있는 사고 예산(Thinking Budget) 기능도 도입되었다.
미래를 향한 발걸음
이러한 업데이트는 구글이 AI 기술의 한계를 넘어설 의지를 보여준다. 케브쿠추올루와 도시가 블로그 게시물을 통해 언급한 것처럼 "AI가 새로운 놀라운 미래를 만들어가는 지금은 역사적으로 놀라운 순간이다." 구글의 이러한 발전은 우리의 일상에서 AI 어시스턴트가 필수적인 존재가 되는 미래를 열어갈 것이다.
관련 기사
딥 코그니토, 최고 순위 오픈소스 AI 모델 출시
딥 코지토, 혁명적인 AI 모델 출시샌프란시스코에 본사를 두고 있는 선도적인 AI 연구 스타트업 딥 코지토는 공식적으로 첫 번째 오픈 소스 대규모 언어 모델(Large Language Models, LLMs)인 '코지토 v1' 라인업을 발표했습니다. 이 모델들은 메타의 Llama 3.2에서 미세조정되었으며, 하이브리드 추
마이크로소프트, 빌드 2025에서 '自律형 웹'을 위한 50개 이상의 AI 도구 발표
마이크로소프트, 빌드 컨퍼런스에서 오픈 에이전틱 웹 비전 공개오늘 아침, 마이크로소프트는 연례 빌드 컨퍼런스를 시작하면서 대담한 선언을 내놓았다: "오픈 에이전틱 웹"의 탄생이다. 50개 이상의 발표를 통해 이 거대 기술사는 이 변혁적인 운동의 중심에 서겠다는 종합적인 전략을 밝혔다. GitHub, Azure부터 Wind
구글, 크롬에서 제미니 통합 론칭
Chrome에서 Gemini 통합 소개: AI 기반 브라우징의 새로운 시대2025년 구글 I/O에서 구글은 Chrome 브라우저에 획기적인 추가 기능을 발표하며 파장을 일으켰습니다. 바로 Gemini 통합입니다. 이 움직임은 사용자가 웹과 상호작용하는 방식에 큰 변화를 가져오며, 방문한 페이지에서 답변, 요약, 통찰을 쉽
의견 (0)
0/200
구글, 보편적인 AI 어시스턴트 비전 실현에 한 걸음 더 다가서다
올해 구글 I/O 행사에서 구글은 Gemini 2.5 시리즈의 중요한 업데이트를 공개했다. 특히 다양한 차원에서 기능을 개선하는 데 초점을 맞췄다. 최신 버전인 Gemini 2.5 Flash와 2.5 Pro는 이제 더 지능적이며 효율적이다. 이러한 발전은 구글이 모든 상황에서 원활하게 맥락을 이해하고 계획을 세우고 작업을 수행할 수 있는 보편적인 AI 어시스턴트를 만드는 비전에 한 걸음 더 가까워지게 한다.
Gemini 2.5 Pro: 지능의 새로운 고도 도달
구글이 현재까지 가장 고급스러운 모델이라고 칭하는 Gemini 2.5 Pro는 무려 1백만 토큰의 컨텍스트 윈도우를 자랑한다. 이 기능은 AI가 방대한 데이터를 처리하고 긴 대화에서도 일관성을 유지할 수 있게 해준다. 행사에서 구글 딥마인드 CEO인 데미스 하사비스는 진보에 대해 큰 기대감을 나타내며 "이것이 Gemini 앱의 궁극적인 목표입니다: 개인적이고 proactive하며 강력한 AI를 만드는 것"이라고 말했다. Gemini 2.5 Pro의 돋보이는 특징 중 하나는 '딥씽(Deep Think)'이라는 실험적인 강화된 추론 모드의 도입이다. 딥씽은 응답하기 전에 여러 가지 가설을 분석하도록 설계되어 AI의 의사결정 능력을 향상시킨다. 하사비스는 이 발전이 알파고 개발 과정에서 얻은 통찰로부터 나온 것임을 언급하며, 더 긴 처리 시간이 더 나은 결과를 가져왔다고 설명했다.
벤치마크 테스트에서의 뛰어난 성능
딥씽은 이미 어려운 벤치마크에서 놀라운 성과를 보여주었다. 예를 들어, 2025년 미국 수학 올림피아드(USAMO)에서 뛰어난 점수를 받았으며, 고급 프로그래밍 기술을 평가하는 LiveCodeBench에서도 우수한 성적을 거두었다. 또한, MMU(Multimodal Understanding)에서 84.0%의 점수를 기록하며 다양한 모드에서의 이해와 추론 능력을 입증했다. 이러한 성과에도 불구하고 구글은 여전히 신중하다. 하사비스는 팀이 안전성 평가를 철저히 진행하고 전문가들의 피드백을 수집한 후 딥씽을 보다 넓게 배포할 계획이라고 밝혔다. 현재는 API를 통해 신뢰할 수 있는 테스터들에게만 접근 가능하다.
Gemini 2.5 Flash: 매일 사용하기 좋은 작업 마차
Gemini 2.5 Pro와 함께 구글은 Gemini 2.5 Flash의 개선된 버전도 발표했다. 이 버전은 속도, 효율성, 경제성을 고려해 설계되었다. 하사비스는 이를 "시리즈의 작업 마차"라고 표현하며, 논리, 다중 모달, 코드, 긴 컨텍스트 등에서 벤치마크에서 두 번째로 뛰어난 성능을 보여준다고 설명했다. 실제로 Gemini 2.5 Pro에 이어 LMArena 리더보드에서 두 번째로 높은 순위를 차지한다. 업데이트된 플래시 모델은 약 20~30% 더 효율적으로 동작하며, 작업을 수행하기 위해 필요한 토큰 수를 줄였다. 개발자 피드백을 바탕으로 구글은 모델을 최적화했으며, Google AI 스튜디오, Vertex AI, 그리고 Gemini 앱에서 미리보기를 제공하고 있다. 본격적인 출시는 6월 초 예정이다.
두 모델 모두에서 새롭게 추가된 기능들
Gemini 2.5 Pro와 Flash 모두 사용자 상호작용을 향상시키기 위해 다양한 새로운 기능을 추가했다. 자연스러운 대화 경험을 위해 내장 오디오 출력이 추가되었으며, 텍스트-투-스피치 기능은 여러 가지 목소리를 지원한다. 사용자는 AI의 음성 톤과 스타일을 조정할 수 있어 멜로드라마틱하거나 진지한 분위기로 설정할 수 있다. 다른 실험적인 음성 기능에는 감정을 인식하는 대화(Affective Dialogue)와 배경 소음을 필터링하는 proactive audio가 포함된다. 또한, 개발자가 응답하기 전에 AI가 사용하는 컴퓨팅 파워를 조절할 수 있는 사고 예산(Thinking Budget) 기능도 도입되었다.
미래를 향한 발걸음
이러한 업데이트는 구글이 AI 기술의 한계를 넘어설 의지를 보여준다. 케브쿠추올루와 도시가 블로그 게시물을 통해 언급한 것처럼 "AI가 새로운 놀라운 미래를 만들어가는 지금은 역사적으로 놀라운 순간이다." 구글의 이러한 발전은 우리의 일상에서 AI 어시스턴트가 필수적인 존재가 되는 미래를 열어갈 것이다.












