옵션
뉴스
구글, Gemini 2.5 Pro가 코딩 벤치마크에서 DeepSeek R1 및 Grok 3 베타를 능가한다고 밝혔습니다.

구글, Gemini 2.5 Pro가 코딩 벤치마크에서 DeepSeek R1 및 Grok 3 베타를 능가한다고 밝혔습니다.

2025년 10월 24일
110

Google은 3월에 처음 소개되고 5월에 개선된 플래그십 Gemini 2.5 Pro 모델의 새로운 프리뷰를 공개했습니다. 지금까지 구글의 "가장 지능적인" AI라고 불리는 이 버전은 현재 프리뷰 단계에 있으며 몇 주 내에 정식 출시될 예정입니다.

이제 기업들은 업데이트된 Gemini 2.5 Pro의 "I/O 에디션"을 사용하여 새로운 애플리케이션을 개발하거나 기존 구현을 업그레이드하는 실험을 할 수 있습니다. Google의 공식 발표에 따르면 이 버전은 이전 버전에 비해 더욱 상상력이 풍부한 응답을 제공하고 프로그래밍 및 논리적 추론에서 뛰어난 기능을 보여줍니다.

최신 Gemini 2.5 Pro 업데이트는 현재 미리 보기 중입니다.

코딩, 추론, 과학 + 수학 능력이 향상되었으며, 주요 벤치마크(AIDER Polyglot, GPQA, HLE 등)에서 향상된 성능을 보여주며 이전 버전보다 24점 상승한 Elo 점수로 @lmarena_ai를 앞서고 있습니다.

우리도... pic.twitter.com/SVjdQ2k1tJ

- 순다르 피차이 (@sundarpichai) June 5, 2025

5월 개발자 컨퍼런스에서 Google은 이전의 조용한 릴리스를 능가하는 Gemini 2.5 Pro의 개선 사항을 공개했습니다. 구글 딥마인드의 CEO인 데미스 하사비스는 I/O 버전이 지금까지 구글의 가장 진보된 코딩 모델이라고 강조했습니다.

Gemini 2.5 Pro 프리뷰 06-05 Thinking으로 명명된 이 최신 프리뷰는 I/O 에디션의 기능을 한층 더 발전시켰습니다. 곧 공개될 이 버전은 엔터프라이즈급 성능과 확장성을 약속합니다.

기존 I/O 에디션(gemini-2.5-pro-preview-05-06)은 5월에 개발자 및 기업이 Google AI Studio와 Vertex AI를 통해 액세스할 수 있게 되었습니다. 향상된 Gemini 2.5 Pro 프리뷰 06-05 Thinking은 동일한 채널을 통해 사용할 수 있습니다.

성능 메트릭

업그레이드된 Gemini 2.5 Pro는 이전 버전에 비해 눈에 띄게 개선된 성능을 보여줍니다.

Google은 LMArena에서 24점, WebDevArena에서 35점 상승하여 현재 경쟁사 순위를 선도하고 있다고 보고했습니다. 비교 테스트 결과 OpenAI의 o3, o3-mini, o4-mini, Anthropic의 클로드 4 오퍼스, xAI의 그로크 3 베타, 딥시크 R1 등의 모델에 비해 우수한 성능을 보였습니다.

Google은 발표문에서 "이전 2.5 Pro 릴리스에서 받은 피드백을 반영하여 스타일과 구조를 개선했으며, 더 나은 형식의 응답으로 더 창의적으로 작업할 수 있습니다."라고 설명했습니다.

기업이 기대할 수 있는 사항

Google의 신속한 Gemini 2.5 Pro 개선 사항은 복잡해 보일 수 있지만, 사용자 의견에 대한 직접적인 응답이라는 입장입니다. 새 버전의 가격 구조는 입력 토큰 100만 개당 1.25달러(캐싱 제외), 출력 토큰 100만 개당 10달러입니다.

3월에 Gemini 2.5 Pro가 출시되었을 때 업계 전문가들은 이를 활용도가 낮은 고급 모델로 인식했습니다. 이후 Google은 응답을 생성하기 전에 여러 가설을 평가하는 '딥씽크' 기능을 비롯한 다양한 애플리케이션에 이 기술을 탑재했습니다.

Gemini 2.5 Pro의 출시와 후속 업그레이드를 통해 경쟁이 치열한 대규모 언어 모델 환경에서 Google의 입지가 강화되었으며, DeepSeek 및 OpenAI의 경쟁 추론 모델로부터 다시 주목을 받게 되었습니다.

발표 후 몇 시간 만에 개발자들은 업데이트된 Gemini 2.5 Pro를 테스트하기 시작했습니다. 향상된 기능에 대한 종합적인 평가는 아직 진행 중이지만, 초기 인상은 성능 가속화에 대한 Google의 주장을 확인시켜 줍니다.

"Gemini 2.5 Pro 프리뷰 06-05"의 첫 시간

긍정적:

- 더 빨라졌습니다.
- 더 많은 출력을 생성합니다.
- 더 나은 매크로 플레이(다중 파일 편집, 더 나은 개요)가 있습니다.
- 출력 구조가 더 좋습니다 (가독성)
- 더 간결하고 덜 아포리즘적입니다!!!

전에: "당신은 절대적으로 ...

- 패트릭 바데 (@nishffx) June 5, 2025

여러분은 앱 빌더를 정말 즐기면서 요리했습니다.

게임을 만들어서 테스트하고, 이미지젯을 사용하여 즉석에서 에셋을 만들고, 호스팅하고, 공유하기 쉬워졌습니다. 정말 최고의 노경험 노코드 빌더입니다.

바이브 앱 마켓플레이스를 계속 구축해 나가면...

- 뼈 (@boneGPT) June 5, 2025

Gemini 2.5 Pro Preview는 꽤 좋습니다. 어제 심층 연구를 위해 사용했는데 그 결과가 일부 유명 브랜드보다 낫습니다.

- Janak (@janaks09) June 5, 2025

관련 기사
구글, 인도에서 크롬용 제미니 서비스 출시 구글, 인도에서 크롬용 제미니 서비스 출시 수요일, 구글은 크롬용 제미니(Gemini) 통합 기능을 인도, 캐나다, 뉴질랜드를 포함한 새로운 지역으로 확대한다고 발표했습니다. 이번 업데이트를 통해 데스크톱 사용자는 사이드바를 통해 제미니에 접속할 수 있게 되며, 여기서 구글의 AI 챗봇에게 화면상의 콘텐츠에 대해 질문하거나, 지메일(Gmail), 킵(Keep), 드라이브(Drive), 유튜브(You
유튜브, 정치인·공직자·언론인을 대상으로 AI 딥페이크 탐지 기능 확대 유튜브, 정치인·공직자·언론인을 대상으로 AI 딥페이크 탐지 기능 확대 화요일, 유튜브는 딥페이크 탐지 기술을 일부 정부 관계자, 정치 후보자 및 언론인 대상으로 확대한다고 발표했다. 이 도구는 AI로 생성된 유사 영상을 식별하며, 시범 운영 참여자들은 유튜브 정책을 위반한다고 판단되는 무단 콘텐츠의 삭제를 요청할 수 있다.이 탐지 시스템은 초기 테스트 단계를 거친 후, 작년 유튜브 파트너 프로그램에 가입된 약 400만 명의
유튜브, 안내형 답변이 포함된 AI 기반 검색 기능 테스트 중 유튜브, 안내형 답변이 포함된 AI 기반 검색 기능 테스트 중 많은 사용자가 요리법이나 여행 계획을 검색할 때 유튜브를 찾아 관련 동영상을 찾곤 합니다. 이제 유튜브는 텍스트와 동영상 콘텐츠를 결합해 단계별 결과를 제공하는 AI 기반 대화형 검색 도구를 선보입니다.새로운 'Ask YouTube' 기능을 통해 사용자는 "샌프란시스코에서 산타바바라까지 3일간의 로드트립을 계획해 주세요"와 같은 질문을 할 수 있으며, 단순
관련 특별 주제 추천
만화 창작 소년 만화를 위한 최고의 AI 생성기: 박진감 넘치는 액션 장면과 에너지 효과 만들기
소년 만화를 위한 최고의 AI 생성기: 박진감 넘치는 액션 장면과 에너지 효과 만들기

XIX.AI에서 2026년 최고의 소년 만화 AI 생성기를 만나보세요. 엄선된 최고 평점 목록에는 박진감 넘치는 액션 장면과 역동적인 에너지 효과를 연출할 수 있는 강력한 도구들이 포함되어 있습니다. 실제 테스트를 통해 무료 버전과 유료 버전을 비교해 보세요. 여러분의 창의력을 마음껏 발휘하여 오늘 바로 장대한 만화를 만들어 보세요!

15 도구
xix.ai
사업 최고의 AI 경비 관리 앱: 영수증을 스캔하고 기업 경비를 자동으로 분류하세요
최고의 AI 경비 관리 앱: 영수증을 스캔하고 기업 경비를 자동으로 분류하세요

2026년 최신 최고의 AI 경비 관리 도구: 영수증을 스캔하고 기업 경비를 자동으로 분류해 주는 최고 평점의 도구들. 손쉬운 경비 관리, 정확한 재무 추적, 효율적인 규정 준수를 위한 강력하고 혁신적인 솔루션을 만나보세요. 무료 및 유료 옵션을 엄선하여 매주 업데이트되는 비교 자료를 통해 귀사에 딱 맞는 도구를 찾으실 수 있습니다. XIX.AI의 전문가 추천 목록으로 AI의 장점을 최대한 활용하세요.

10 도구
xix.ai
사업 최고의 AI 채용 도구: 이력서 심사 및 후보자 면접 일정 자동화
최고의 AI 채용 도구: 이력서 심사 및 후보자 면접 일정 자동화

XIX.AI에서 2026년 최신 최고 평점을 받은 AI 채용 도구를 확인해 보세요. 저희가 엄선한 이 목록에는 이력서 심사 및 후보자 면접 일정 자동화를 위한 강력하고 혁신적인 솔루션이 포함되어 있습니다. 실제 테스트 결과와 매주 업데이트되는 순위를 바탕으로 무료 및 유료 옵션을 비교해 보세요. 지금 바로 귀사에 딱 맞는 채용 도우미를 찾아 채용 프로세스를 효율화하세요!

10 도구
xix.ai
생산력 AI 개인 웰니스 및 집중력 코치: 번아웃 관리 및 정신적 에너지 수준 향상
AI 개인 웰니스 및 집중력 코치: 번아웃 관리 및 정신적 에너지 수준 향상

XIX.AI에서 2026년 최고의 AI 기반 개인 웰니스 및 집중력 코치들을 만나보세요. 저희가 엄선한 순위 목록에는 번아웃을 관리하고 정신적 에너지를 높여주는 최고 평점을 받은 혁신적인 도구들이 소개되어 있습니다. 실제 사용 후기를 바탕으로 무료 버전과 유료 버전을 비교해 보세요. 지금 바로 최고의 생산성과 웰빙을 향한 길을 열어보세요.

10 도구
xix.ai
챗봇 최고 평점을 받은 AI 로맨틱 챗봇: 일관된 성격으로 장기적인 관계를 구축하세요
최고 평점을 받은 AI 로맨틱 챗봇: 일관된 성격으로 장기적인 관계를 구축하세요

진정성 있는 장기적인 관계를 형성할 수 있는 2026년 최신 최고 평점 AI 로맨틱 챗봇을 만나보세요. 저희가 엄선한 이 목록에는 강력하고 일관된 캐릭터, 무료 및 유료 버전 비교, 실제 사용 후기가 담겨 있습니다. XIX.AI에서 나에게 딱 맞는 파트너를 찾아 오늘 바로 관계를 시작해 보세요.

10 도구
xix.ai
교육 및 학습 최고의 AI 데이터 과학 멘토들: SQL, Pandas 및 머신 러닝 워크플로우 마스터하기
최고의 AI 데이터 과학 멘토들: SQL, Pandas 및 머신 러닝 워크플로우 마스터하기

2026년 최고의 AI 데이터 과학 멘토들을 만나 SQL, Pandas 및 머신러닝 워크플로우를 마스터하세요. XIX.AI에서 선별한 최고의 멘토들을 통해 강력하고 혁신적인 지도를 받아보세요. 무료 옵션과 유료 옵션을 실제 사례를 바탕으로 비교해 보세요. 오늘 바로 데이터 과학의 전문성을 확보하세요.

10 도구
xix.ai
의견 (1)
0/500
JohnYoung
JohnYoung 2026년 5월 17일 오전 9시 0분 11초 GMT+09:00

Interesting to see Google claiming coding benchmark wins, but I'm curious about real-world dev experience. Does it handle messy legacy codebases as well as it does clean competition problems? The 'most intelligent' tag feels a bit marketing-heavy until we see more hands-on results. 🤔

OR