DeepMind의 AI가 2025 수학 올림피아드에서 금메달 획득
DeepMind의 AI는 수학적 추론에서 놀라운 도약을 이루어, 2024년에 은메달을 획득한 지 불과 1년 만에 2025 국제수학올림피아드(IMO)에서 금메달을 차지했습니다. 이 돌파구는 인간과 같은 창의력이 요구되는 복잡하고 추상적인 문제를 해결하는 AI의 성장하는 능력을 강조합니다. 이 기사에서는 DeepMind의 변혁적 여정, 주요 기술적 발전, 그리고 이 이정표의 더 넓은 영향을 탐구합니다.
IMO가 중요한 이유
1959년 이래로 국제수학올림피아드는 고등학생을 위한 세계 최고의 수학 대회입니다. 대회는 대수학, 기하학, 정수론, 조합론에서 6개의 복잡한 문제를 통해 참가자들에게 탁월한 창의력, 논리, 그리고 우아한 증명을 요구합니다.
AI에게 IMO는 강력한 시험입니다. 패턴 인식이나 바둑과 같은 전략 게임과 달리, 올림피아드 수학은 추상적 추론과 새로운 아이디어 합성을 요구하며, 이는 오랫동안 인간만의 고유한 기술로 여겨졌습니다. 따라서 IMO는 AI의 인간과 유사한 지능으로의 진보를 평가하는 벤치마크 역할을 합니다.
2024년 은메달 이정표
2024년, DeepMind는 IMO 문제를 위해 두 개의 AI 시스템, AlphaProof와 AlphaGeometry 2를 선보였으며, 둘 다 대형 언어 모델(LLM)과 상징적 논리를 결합한 "신경-상징적" AI를 활용했습니다.
AlphaProof는 정형 수학 언어인 Lean을 사용하여 명제를 증명했습니다. 이는 DeepMind의 LLM인 Gemini와 보드 게임을 마스터한 것으로 유명한 강화학습 시스템 AlphaZero를 통합했습니다. Gemini는 문제를 Lean으로 번역하여 논리적 단계를 생성했으며, AlphaProof는 수백만 개의 다양한 수학 문제로 훈련하며 자체 개선을 통해 기술을 연마했습니다.
AlphaGeometry 2는 기하학에서 뛰어났으며, Gemini가 보조 구성을 예측하고 상징적 엔진이 연역을 처리했습니다. 이 하이브리드 접근법은 복잡한 기하학 문제를 해결할 수 있게 했습니다.
이 시스템들은 6개의 IMO 문제 중 4개를 해결—대수학 2개, 정수론 1개, 기하학 1개—하여 42점 만점에 28점을 기록하며 은메달을 획득했습니다. 이는 AI의 역사적인 성취를 나타냈지만, 인간 번역과 광범위한 계산 자원에 의존했습니다.
금메달을 위한 주요 혁신
DeepMind의 2025년 금메달로의 도약은 주요 기술적 발전에서 비롯되었습니다.
1. 자연어 증명
중요한 변화는 증명을 위해 자연어를 사용함으로써 전문가 번역을 정형 언어로 변환할 필요를 없앤 것이었습니다. Deep Think 기능을 강화한 업그레이드된 Gemini는 문제를 직접 처리하며 비공식 증명을 스케치하고, 핵심 단계를 내부적으로 정형화하며, 명확한 영어 증명을 제공합니다. 인간 피드백을 통한 강화학습(RLHF)은 간결하고 논리적인 솔루션을 보장했습니다.
Gemini Deep Think는 더 긴 컨텍스트 윈도우와 더 많은 컴퓨팅 토큰을 지원하여 다페이지 추론을 가능하게 합니다. 이는 병렬 추론을 활용하여 수백 개의 솔루션 경로를 생성하고, 감독자가 최적의 경로를 순위 매기는 방식으로, 인간의 브레인스토밍과 유사합니다.
2. 고급 훈련 기법
Gemini Deep Think는 수학 포럼, arXiv, 대학 문제 세트에서 가져온 10만 개의 솔루션 코퍼스로 미세 조정되었으며, 인간 멘토가 오류를 필터링했습니다. 검증된 하위 명제에 대한 단계별 보상을 통한 강화학습은 모델을 간결한 증명으로 안내했습니다. 훈련은 3개월 동안 2,500만 TPU 시간을 사용하여 진행되었습니다.
3. 병렬 처리 능력
병렬화는 여러 추론 분기를 동시에 탐색하며 결정적이었습니다. 자원은 유망한 경로로 동적으로 전환되었으며, 특히 조합론에서 효과적이었습니다. DeepMind의 TPU v5 클러스터가 지원한 이 접근법은 완전한 증명 전에 부등식을 테스트하는 인간 전략을 모방했습니다.
DeepMind의 2025 IMO 승리
공정성을 보장하기 위해 DeepMind는 IMO 3주 전에 모델의 가중치를 동결하고, 미공개 문제 솔루션을 필터링했습니다. 대회 중 Gemini Deep Think는 인터넷 액세스 없이 6개의 텍스트 문제를 노트북 수준의 컴퓨팅 파워로 처리했습니다. 3시간 이내에 증명을 완료하여 5개 문제에서 만점을 받고 총 42점 중 35점을 획득—금메달을 확보했습니다. AI의 증명은 엄격하고 철저하여 인간 기준에 부합한다는 평가를 받았습니다.
AI와 수학에 미친 영향
DeepMind의 성공은 IMO 문제가 고급 추론을 요구하므로 인공지능 일반(AGI)으로의 진보를 나타냅니다. 수학에서는 Gemini Deep Think와 같은 AI 도구가 새로운 정리 탐구, 추측 검증, 증명 간소화를 도와 수학자들이 개념적 작업에 집중할 수 있게 합니다. 그러나 AI의 교육 및 대회에서의 역할은 그 미래 구조에 대한 질문을 제기합니다.
미래 전망
일부 수학적 도전이 남아 있지만, DeepMind의 빠른 진보는 AI가 곧 주요 미해결 문제를 해결할 수 있음을 시사합니다. 2025 IMO 승리는 AI의 발전하는 논리적 추론을 강조하며, AI가 수학에서 인간의 창의성을 보완하거나 재정의할지에 대한 논쟁을 불러일으킵니다.
관련 기사
텐센트의 ‘샤오롱샤’가 예상을 뛰어넘는 급성장을 기록하자, 운영팀은 처리 용량을 10배로 확대하고 사과와 함께 보상 조치를 취했다
텐센트는 모든 시나리오를 아우르는 AI 지능형 에이전트인 ‘WorkBuddy’를 공식 출시하며, 높은 통합성과 낮은 도입 장벽을 바탕으로 대규모 모델 애플리케이션 레이어 경쟁의 새로운 국면을 열었다.출시 당일 이 제품은 업계의 즉각적인 관심을 끌었다. 사용자 트래픽이 예상을 훨씬 뛰어넘으면서 관련 서비스인 텐센트 클라우드 코드 어시스턴트(CodeBuddy)
수노(Suno)의 주요 투자자: 게시물 삭제로는 저작권 소송의 허점을 메울 수 없다
많은 기대를 모았던 AI 음악 생성 플랫폼 ‘수노(Suno)’가 치열한 저작권 분쟁에 휘말린 가운데, 이 플랫폼의 주요 투자자가 한 솔직한 발언이 상대방 측이 바랐던 바로 그 증거를 제공해 준 것으로 보인다. Suno의 핵심 투자사인 멘로 벤처스(Menlo Ventures)의 파트너 C.C. 공은 최근 회사의 현재 법적 방어 전략과 정면으로 배치되는 트윗을
클로드 오푸스 4.7, 인공지능보다 신뢰성을 중시하며 출시
Anthropic은 올해도 거의 이틀에 한 번꼴로 새로운 기능을 출시하며 공격적인 행보를 이어가고 있습니다. 많은 기대를 모았던 Claude Opus 4.7이 방금 공식 출시되었는데, 흥미롭게도 Anthropic은 발표문에서 “이 모델이 우리가 개발한 가장 강력한 모델은 아닙니다”라고 솔직하게 밝혔습니다. 소문으로만 돌던 더 강력한 'Claude Mytho
관련 특별 주제 추천
의견 (1)
0/500
DeepMind의 AI는 수학적 추론에서 놀라운 도약을 이루어, 2024년에 은메달을 획득한 지 불과 1년 만에 2025 국제수학올림피아드(IMO)에서 금메달을 차지했습니다. 이 돌파구는 인간과 같은 창의력이 요구되는 복잡하고 추상적인 문제를 해결하는 AI의 성장하는 능력을 강조합니다. 이 기사에서는 DeepMind의 변혁적 여정, 주요 기술적 발전, 그리고 이 이정표의 더 넓은 영향을 탐구합니다.
IMO가 중요한 이유
1959년 이래로 국제수학올림피아드는 고등학생을 위한 세계 최고의 수학 대회입니다. 대회는 대수학, 기하학, 정수론, 조합론에서 6개의 복잡한 문제를 통해 참가자들에게 탁월한 창의력, 논리, 그리고 우아한 증명을 요구합니다.
AI에게 IMO는 강력한 시험입니다. 패턴 인식이나 바둑과 같은 전략 게임과 달리, 올림피아드 수학은 추상적 추론과 새로운 아이디어 합성을 요구하며, 이는 오랫동안 인간만의 고유한 기술로 여겨졌습니다. 따라서 IMO는 AI의 인간과 유사한 지능으로의 진보를 평가하는 벤치마크 역할을 합니다.
2024년 은메달 이정표
2024년, DeepMind는 IMO 문제를 위해 두 개의 AI 시스템, AlphaProof와 AlphaGeometry 2를 선보였으며, 둘 다 대형 언어 모델(LLM)과 상징적 논리를 결합한 "신경-상징적" AI를 활용했습니다.
AlphaProof는 정형 수학 언어인 Lean을 사용하여 명제를 증명했습니다. 이는 DeepMind의 LLM인 Gemini와 보드 게임을 마스터한 것으로 유명한 강화학습 시스템 AlphaZero를 통합했습니다. Gemini는 문제를 Lean으로 번역하여 논리적 단계를 생성했으며, AlphaProof는 수백만 개의 다양한 수학 문제로 훈련하며 자체 개선을 통해 기술을 연마했습니다.
AlphaGeometry 2는 기하학에서 뛰어났으며, Gemini가 보조 구성을 예측하고 상징적 엔진이 연역을 처리했습니다. 이 하이브리드 접근법은 복잡한 기하학 문제를 해결할 수 있게 했습니다.
이 시스템들은 6개의 IMO 문제 중 4개를 해결—대수학 2개, 정수론 1개, 기하학 1개—하여 42점 만점에 28점을 기록하며 은메달을 획득했습니다. 이는 AI의 역사적인 성취를 나타냈지만, 인간 번역과 광범위한 계산 자원에 의존했습니다.
금메달을 위한 주요 혁신
DeepMind의 2025년 금메달로의 도약은 주요 기술적 발전에서 비롯되었습니다.
1. 자연어 증명
중요한 변화는 증명을 위해 자연어를 사용함으로써 전문가 번역을 정형 언어로 변환할 필요를 없앤 것이었습니다. Deep Think 기능을 강화한 업그레이드된 Gemini는 문제를 직접 처리하며 비공식 증명을 스케치하고, 핵심 단계를 내부적으로 정형화하며, 명확한 영어 증명을 제공합니다. 인간 피드백을 통한 강화학습(RLHF)은 간결하고 논리적인 솔루션을 보장했습니다.
Gemini Deep Think는 더 긴 컨텍스트 윈도우와 더 많은 컴퓨팅 토큰을 지원하여 다페이지 추론을 가능하게 합니다. 이는 병렬 추론을 활용하여 수백 개의 솔루션 경로를 생성하고, 감독자가 최적의 경로를 순위 매기는 방식으로, 인간의 브레인스토밍과 유사합니다.
2. 고급 훈련 기법
Gemini Deep Think는 수학 포럼, arXiv, 대학 문제 세트에서 가져온 10만 개의 솔루션 코퍼스로 미세 조정되었으며, 인간 멘토가 오류를 필터링했습니다. 검증된 하위 명제에 대한 단계별 보상을 통한 강화학습은 모델을 간결한 증명으로 안내했습니다. 훈련은 3개월 동안 2,500만 TPU 시간을 사용하여 진행되었습니다.
3. 병렬 처리 능력
병렬화는 여러 추론 분기를 동시에 탐색하며 결정적이었습니다. 자원은 유망한 경로로 동적으로 전환되었으며, 특히 조합론에서 효과적이었습니다. DeepMind의 TPU v5 클러스터가 지원한 이 접근법은 완전한 증명 전에 부등식을 테스트하는 인간 전략을 모방했습니다.
DeepMind의 2025 IMO 승리
공정성을 보장하기 위해 DeepMind는 IMO 3주 전에 모델의 가중치를 동결하고, 미공개 문제 솔루션을 필터링했습니다. 대회 중 Gemini Deep Think는 인터넷 액세스 없이 6개의 텍스트 문제를 노트북 수준의 컴퓨팅 파워로 처리했습니다. 3시간 이내에 증명을 완료하여 5개 문제에서 만점을 받고 총 42점 중 35점을 획득—금메달을 확보했습니다. AI의 증명은 엄격하고 철저하여 인간 기준에 부합한다는 평가를 받았습니다.
AI와 수학에 미친 영향
DeepMind의 성공은 IMO 문제가 고급 추론을 요구하므로 인공지능 일반(AGI)으로의 진보를 나타냅니다. 수학에서는 Gemini Deep Think와 같은 AI 도구가 새로운 정리 탐구, 추측 검증, 증명 간소화를 도와 수학자들이 개념적 작업에 집중할 수 있게 합니다. 그러나 AI의 교육 및 대회에서의 역할은 그 미래 구조에 대한 질문을 제기합니다.
미래 전망
일부 수학적 도전이 남아 있지만, DeepMind의 빠른 진보는 AI가 곧 주요 미해결 문제를 해결할 수 있음을 시사합니다. 2025 IMO 승리는 AI의 발전하는 논리적 추론을 강조하며, AI가 수학에서 인간의 창의성을 보완하거나 재정의할지에 대한 논쟁을 불러일으킵니다.
텐센트의 ‘샤오롱샤’가 예상을 뛰어넘는 급성장을 기록하자, 운영팀은 처리 용량을 10배로 확대하고 사과와 함께 보상 조치를 취했다
텐센트는 모든 시나리오를 아우르는 AI 지능형 에이전트인 ‘WorkBuddy’를 공식 출시하며, 높은 통합성과 낮은 도입 장벽을 바탕으로 대규모 모델 애플리케이션 레이어 경쟁의 새로운 국면을 열었다.출시 당일 이 제품은 업계의 즉각적인 관심을 끌었다. 사용자 트래픽이 예상을 훨씬 뛰어넘으면서 관련 서비스인 텐센트 클라우드 코드 어시스턴트(CodeBuddy)
수노(Suno)의 주요 투자자: 게시물 삭제로는 저작권 소송의 허점을 메울 수 없다
많은 기대를 모았던 AI 음악 생성 플랫폼 ‘수노(Suno)’가 치열한 저작권 분쟁에 휘말린 가운데, 이 플랫폼의 주요 투자자가 한 솔직한 발언이 상대방 측이 바랐던 바로 그 증거를 제공해 준 것으로 보인다. Suno의 핵심 투자사인 멘로 벤처스(Menlo Ventures)의 파트너 C.C. 공은 최근 회사의 현재 법적 방어 전략과 정면으로 배치되는 트윗을
클로드 오푸스 4.7, 인공지능보다 신뢰성을 중시하며 출시
Anthropic은 올해도 거의 이틀에 한 번꼴로 새로운 기능을 출시하며 공격적인 행보를 이어가고 있습니다. 많은 기대를 모았던 Claude Opus 4.7이 방금 공식 출시되었는데, 흥미롭게도 Anthropic은 발표문에서 “이 모델이 우리가 개발한 가장 강력한 모델은 아닙니다”라고 솔직하게 밝혔습니다. 소문으로만 돌던 더 강력한 'Claude Mytho





집






