구글, Gemini 2.5 Pro가 코딩 벤치마크에서 DeepSeek R1 및 Grok 3 베타를 능가한다고 밝혔습니다.

집

뉴스

2025년 10월 24일

RogerNelson

110

# Gemini # Google

Google은 3월에 처음 소개되고 5월에 개선된 플래그십 Gemini 2.5 Pro 모델의 새로운 프리뷰를 공개했습니다. 지금까지 구글의 "가장 지능적인" AI라고 불리는 이 버전은 현재 프리뷰 단계에 있으며 몇 주 내에 정식 출시될 예정입니다.
이제 기업들은 업데이트된 Gemini 2.5 Pro의 "I/O 에디션"을 사용하여 새로운 애플리케이션을 개발하거나 기존 구현을 업그레이드하는 실험을 할 수 있습니다. Google의 공식 발표에 따르면 이 버전은 이전 버전에 비해 더욱 상상력이 풍부한 응답을 제공하고 프로그래밍 및 논리적 추론에서 뛰어난 기능을 보여줍니다.

최신 Gemini 2.5 Pro 업데이트는 현재 미리 보기 중입니다.
코딩, 추론, 과학 + 수학 능력이 향상되었으며, 주요 벤치마크(AIDER Polyglot, GPQA, HLE 등)에서 향상된 성능을 보여주며 이전 버전보다 24점 상승한 Elo 점수로 @lmarena_ai를 앞서고 있습니다.
우리도... pic.twitter.com/SVjdQ2k1tJ
- 순다르 피차이 (@sundarpichai) June 5, 2025

5월 개발자 컨퍼런스에서 Google은 이전의 조용한 릴리스를 능가하는 Gemini 2.5 Pro의 개선 사항을 공개했습니다. 구글 딥마인드의 CEO인 데미스 하사비스는 I/O 버전이 지금까지 구글의 가장 진보된 코딩 모델이라고 강조했습니다.

Gemini 2.5 Pro 프리뷰 06-05 Thinking으로 명명된 이 최신 프리뷰는 I/O 에디션의 기능을 한층 더 발전시켰습니다. 곧 공개될 이 버전은 엔터프라이즈급 성능과 확장성을 약속합니다.

기존 I/O 에디션(gemini-2.5-pro-preview-05-06)은 5월에 개발자 및 기업이 Google AI Studio와 Vertex AI를 통해 액세스할 수 있게 되었습니다. 향상된 Gemini 2.5 Pro 프리뷰 06-05 Thinking은 동일한 채널을 통해 사용할 수 있습니다.

성능 메트릭

업그레이드된 Gemini 2.5 Pro는 이전 버전에 비해 눈에 띄게 개선된 성능을 보여줍니다.

Google은 LMArena에서 24점, WebDevArena에서 35점 상승하여 현재 경쟁사 순위를 선도하고 있다고 보고했습니다. 비교 테스트 결과 OpenAI의 o3, o3-mini, o4-mini, Anthropic의 클로드 4 오퍼스, xAI의 그로크 3 베타, 딥시크 R1 등의 모델에 비해 우수한 성능을 보였습니다.

Google은 발표문에서 "이전 2.5 Pro 릴리스에서 받은 피드백을 반영하여 스타일과 구조를 개선했으며, 더 나은 형식의 응답으로 더 창의적으로 작업할 수 있습니다."라고 설명했습니다.

기업이 기대할 수 있는 사항

Google의 신속한 Gemini 2.5 Pro 개선 사항은 복잡해 보일 수 있지만, 사용자 의견에 대한 직접적인 응답이라는 입장입니다. 새 버전의 가격 구조는 입력 토큰 100만 개당 1.25달러(캐싱 제외), 출력 토큰 100만 개당 10달러입니다.

3월에 Gemini 2.5 Pro가 출시되었을 때 업계 전문가들은 이를 활용도가 낮은 고급 모델로 인식했습니다. 이후 Google은 응답을 생성하기 전에 여러 가설을 평가하는 '딥씽크' 기능을 비롯한 다양한 애플리케이션에 이 기술을 탑재했습니다.

Gemini 2.5 Pro의 출시와 후속 업그레이드를 통해 경쟁이 치열한 대규모 언어 모델 환경에서 Google의 입지가 강화되었으며, DeepSeek 및 OpenAI의 경쟁 추론 모델로부터 다시 주목을 받게 되었습니다.

발표 후 몇 시간 만에 개발자들은 업데이트된 Gemini 2.5 Pro를 테스트하기 시작했습니다. 향상된 기능에 대한 종합적인 평가는 아직 진행 중이지만, 초기 인상은 성능 가속화에 대한 Google의 주장을 확인시켜 줍니다.

"Gemini 2.5 Pro 프리뷰 06-05"의 첫 시간
긍정적:
- 더 빨라졌습니다.
- 더 많은 출력을 생성합니다.
- 더 나은 매크로 플레이(다중 파일 편집, 더 나은 개요)가 있습니다.
- 출력 구조가 더 좋습니다 (가독성)
- 더 간결하고 덜 아포리즘적입니다!!!
전에: "당신은 절대적으로 ...
- 패트릭 바데 (@nishffx) June 5, 2025

여러분은 앱 빌더를 정말 즐기면서 요리했습니다.
게임을 만들어서 테스트하고, 이미지젯을 사용하여 즉석에서 에셋을 만들고, 호스팅하고, 공유하기 쉬워졌습니다. 정말 최고의 노경험 노코드 빌더입니다.
바이브 앱 마켓플레이스를 계속 구축해 나가면...
- 뼈 (@boneGPT) June 5, 2025

Gemini 2.5 Pro Preview는 꽤 좋습니다. 어제 심층 연구를 위해 사용했는데 그 결과가 일부 유명 브랜드보다 낫습니다.
- Janak (@janaks09) June 5, 2025

관련 특별 주제 추천

만화 창작

소년 만화를 위한 최고의 AI 생성기: 박진감 넘치는 액션 장면과 에너지 효과 만들기

XIX.AI에서 2026년 최고의 소년 만화 AI 생성기를 만나보세요. 엄선된 최고 평점 목록에는 박진감 넘치는 액션 장면과 역동적인 에너지 효과를 연출할 수 있는 강력한 도구들이 포함되어 있습니다. 실제 테스트를 통해 무료 버전과 유료 버전을 비교해 보세요. 여러분의 창의력을 마음껏 발휘하여 오늘 바로 장대한 만화를 만들어 보세요!

15 도구

xix.ai

사업

최고의 AI 경비 관리 앱: 영수증을 스캔하고 기업 경비를 자동으로 분류하세요

2026년 최신 최고의 AI 경비 관리 도구: 영수증을 스캔하고 기업 경비를 자동으로 분류해 주는 최고 평점의 도구들. 손쉬운 경비 관리, 정확한 재무 추적, 효율적인 규정 준수를 위한 강력하고 혁신적인 솔루션을 만나보세요. 무료 및 유료 옵션을 엄선하여 매주 업데이트되는 비교 자료를 통해 귀사에 딱 맞는 도구를 찾으실 수 있습니다. XIX.AI의 전문가 추천 목록으로 AI의 장점을 최대한 활용하세요.

10 도구

xix.ai

사업

최고의 AI 채용 도구: 이력서 심사 및 후보자 면접 일정 자동화

XIX.AI에서 2026년 최신 최고 평점을 받은 AI 채용 도구를 확인해 보세요. 저희가 엄선한 이 목록에는 이력서 심사 및 후보자 면접 일정 자동화를 위한 강력하고 혁신적인 솔루션이 포함되어 있습니다. 실제 테스트 결과와 매주 업데이트되는 순위를 바탕으로 무료 및 유료 옵션을 비교해 보세요. 지금 바로 귀사에 딱 맞는 채용 도우미를 찾아 채용 프로세스를 효율화하세요!

10 도구

xix.ai

생산력

AI 개인 웰니스 및 집중력 코치: 번아웃 관리 및 정신적 에너지 수준 향상

XIX.AI에서 2026년 최고의 AI 기반 개인 웰니스 및 집중력 코치들을 만나보세요. 저희가 엄선한 순위 목록에는 번아웃을 관리하고 정신적 에너지를 높여주는 최고 평점을 받은 혁신적인 도구들이 소개되어 있습니다. 실제 사용 후기를 바탕으로 무료 버전과 유료 버전을 비교해 보세요. 지금 바로 최고의 생산성과 웰빙을 향한 길을 열어보세요.

10 도구

xix.ai

챗봇

최고 평점을 받은 AI 로맨틱 챗봇: 일관된 성격으로 장기적인 관계를 구축하세요

진정성 있는 장기적인 관계를 형성할 수 있는 2026년 최신 최고 평점 AI 로맨틱 챗봇을 만나보세요. 저희가 엄선한 이 목록에는 강력하고 일관된 캐릭터, 무료 및 유료 버전 비교, 실제 사용 후기가 담겨 있습니다. XIX.AI에서 나에게 딱 맞는 파트너를 찾아 오늘 바로 관계를 시작해 보세요.

10 도구

xix.ai

교육 및 학습

최고의 AI 데이터 과학 멘토들: SQL, Pandas 및 머신 러닝 워크플로우 마스터하기

2026년 최고의 AI 데이터 과학 멘토들을 만나 SQL, Pandas 및 머신러닝 워크플로우를 마스터하세요. XIX.AI에서 선별한 최고의 멘토들을 통해 강력하고 혁신적인 지도를 받아보세요. 무료 옵션과 유료 옵션을 실제 사례를 바탕으로 비교해 보세요. 오늘 바로 데이터 과학의 전문성을 확보하세요.

10 도구

xix.ai

의견 (1)

0/500

먼저 로그인하십시오

JohnYoung

2026년 5월 17일 오전 9시 0분 11초 GMT+09:00

Interesting to see Google claiming coding benchmark wins, but I'm curious about real-world dev experience. Does it handle messy legacy codebases as well as it does clean competition problems? The 'most intelligent' tag feels a bit marketing-heavy until we see more hands-on results. 🤔

최고의 뉴스

AI Builder와 Power Automate가 문서 요약을 혁신하다 AI Notebooklm Podcast의 AI 호스트는 이제 인터뷰에 참여할 수 있습니다 중국, 국가 휴머노이드 로봇 및 구현 지능 표준 공개 기업 AI 도입 정체기, 램프 데이터에 따르면 Bing 이미지 크리에이터 튜토리얼: AI 아트 생성 가이드 당신의 목소리를 사용하여 AI 음악 만들기 배우기 : 단계별 Suno 튜토리얼 iMyFone MagicMic: 실시간 AI 음성 변환기 리뷰 및 튜토리얼 2025 최고 AI 비디오 생성기: Pika Labs 대 비교 딥시크 V4, 다중 모달 AI의 판도를 바꾸는 혁신으로 부상하다 엠보디드 인텔리전스, 무분별한 확장을 억제하기 위한 업계 최초의 표준을 발표하다

더