옵션
뉴스
DeepMind의 AI가 2025 수학 올림피아드에서 금메달 획득

DeepMind의 AI가 2025 수학 올림피아드에서 금메달 획득

2025년 8월 22일
0

DeepMind의 AI는 수학적 추론에서 놀라운 도약을 이루어, 2024년에 은메달을 획득한 지 불과 1년 만에 2025 국제수학올림피아드(IMO)에서 금메달을 차지했습니다. 이 돌파구는 인간과 같은 창의력이 요구되는 복잡하고 추상적인 문제를 해결하는 AI의 성장하는 능력을 강조합니다. 이 기사에서는 DeepMind의 변혁적 여정, 주요 기술적 발전, 그리고 이 이정표의 더 넓은 영향을 탐구합니다.

IMO가 중요한 이유

1959년 이래로 국제수학올림피아드는 고등학생을 위한 세계 최고의 수학 대회입니다. 대회는 대수학, 기하학, 정수론, 조합론에서 6개의 복잡한 문제를 통해 참가자들에게 탁월한 창의력, 논리, 그리고 우아한 증명을 요구합니다.

AI에게 IMO는 강력한 시험입니다. 패턴 인식이나 바둑과 같은 전략 게임과 달리, 올림피아드 수학은 추상적 추론과 새로운 아이디어 합성을 요구하며, 이는 오랫동안 인간만의 고유한 기술로 여겨졌습니다. 따라서 IMO는 AI의 인간과 유사한 지능으로의 진보를 평가하는 벤치마크 역할을 합니다.

2024년 은메달 이정표

2024년, DeepMind는 IMO 문제를 위해 두 개의 AI 시스템, AlphaProof와 AlphaGeometry 2를 선보였으며, 둘 다 대형 언어 모델(LLM)과 상징적 논리를 결합한 "신경-상징적" AI를 활용했습니다.

AlphaProof는 정형 수학 언어인 Lean을 사용하여 명제를 증명했습니다. 이는 DeepMind의 LLM인 Gemini와 보드 게임을 마스터한 것으로 유명한 강화학습 시스템 AlphaZero를 통합했습니다. Gemini는 문제를 Lean으로 번역하여 논리적 단계를 생성했으며, AlphaProof는 수백만 개의 다양한 수학 문제로 훈련하며 자체 개선을 통해 기술을 연마했습니다.

AlphaGeometry 2는 기하학에서 뛰어났으며, Gemini가 보조 구성을 예측하고 상징적 엔진이 연역을 처리했습니다. 이 하이브리드 접근법은 복잡한 기하학 문제를 해결할 수 있게 했습니다.

이 시스템들은 6개의 IMO 문제 중 4개를 해결—대수학 2개, 정수론 1개, 기하학 1개—하여 42점 만점에 28점을 기록하며 은메달을 획득했습니다. 이는 AI의 역사적인 성취를 나타냈지만, 인간 번역과 광범위한 계산 자원에 의존했습니다.

금메달을 위한 주요 혁신

DeepMind의 2025년 금메달로의 도약은 주요 기술적 발전에서 비롯되었습니다.

1. 자연어 증명

중요한 변화는 증명을 위해 자연어를 사용함으로써 전문가 번역을 정형 언어로 변환할 필요를 없앤 것이었습니다. Deep Think 기능을 강화한 업그레이드된 Gemini는 문제를 직접 처리하며 비공식 증명을 스케치하고, 핵심 단계를 내부적으로 정형화하며, 명확한 영어 증명을 제공합니다. 인간 피드백을 통한 강화학습(RLHF)은 간결하고 논리적인 솔루션을 보장했습니다.

Gemini Deep Think는 더 긴 컨텍스트 윈도우와 더 많은 컴퓨팅 토큰을 지원하여 다페이지 추론을 가능하게 합니다. 이는 병렬 추론을 활용하여 수백 개의 솔루션 경로를 생성하고, 감독자가 최적의 경로를 순위 매기는 방식으로, 인간의 브레인스토밍과 유사합니다.

2. 고급 훈련 기법

Gemini Deep Think는 수학 포럼, arXiv, 대학 문제 세트에서 가져온 10만 개의 솔루션 코퍼스로 미세 조정되었으며, 인간 멘토가 오류를 필터링했습니다. 검증된 하위 명제에 대한 단계별 보상을 통한 강화학습은 모델을 간결한 증명으로 안내했습니다. 훈련은 3개월 동안 2,500만 TPU 시간을 사용하여 진행되었습니다.

3. 병렬 처리 능력

병렬화는 여러 추론 분기를 동시에 탐색하며 결정적이었습니다. 자원은 유망한 경로로 동적으로 전환되었으며, 특히 조합론에서 효과적이었습니다. DeepMind의 TPU v5 클러스터가 지원한 이 접근법은 완전한 증명 전에 부등식을 테스트하는 인간 전략을 모방했습니다.

DeepMind의 2025 IMO 승리

공정성을 보장하기 위해 DeepMind는 IMO 3주 전에 모델의 가중치를 동결하고, 미공개 문제 솔루션을 필터링했습니다. 대회 중 Gemini Deep Think는 인터넷 액세스 없이 6개의 텍스트 문제를 노트북 수준의 컴퓨팅 파워로 처리했습니다. 3시간 이내에 증명을 완료하여 5개 문제에서 만점을 받고 총 42점 중 35점을 획득—금메달을 확보했습니다. AI의 증명은 엄격하고 철저하여 인간 기준에 부합한다는 평가를 받았습니다.

AI와 수학에 미친 영향

DeepMind의 성공은 IMO 문제가 고급 추론을 요구하므로 인공지능 일반(AGI)으로의 진보를 나타냅니다. 수학에서는 Gemini Deep Think와 같은 AI 도구가 새로운 정리 탐구, 추측 검증, 증명 간소화를 도와 수학자들이 개념적 작업에 집중할 수 있게 합니다. 그러나 AI의 교육 및 대회에서의 역할은 그 미래 구조에 대한 질문을 제기합니다.

미래 전망

일부 수학적 도전이 남아 있지만, DeepMind의 빠른 진보는 AI가 곧 주요 미해결 문제를 해결할 수 있음을 시사합니다. 2025 IMO 승리는 AI의 발전하는 논리적 추론을 강조하며, AI가 수학에서 인간의 창의성을 보완하거나 재정의할지에 대한 논쟁을 불러일으킵니다.

관련 기사
AI로 구동되는 패럴랙스 메이커: 역동적인 2.5D 애니메이션 제작 AI로 구동되는 패럴랙스 메이커: 역동적인 2.5D 애니메이션 제작 정적인 이미지를 매혹적인 2.5D 애니메이션으로 변환하세요. 이 오픈 소스 도구는 아티스트와 게임 개발자가 자신의 작업에 깊이와 움직임을 더할 수 있도록 지원합니다. Stability AI API를 활용하여 Parallax Maker는 저사양 하드웨어에서도 원활한 워크플로우를 보장합니다. 이 도구의 기능과 창의적인 프로젝트를 어떻게 향상시킬 수 있는지 알아
Trunk Tools Secures $40M to Advance AI-Driven Construction Solutions Trunk Tools Secures $40M to Advance AI-Driven Construction Solutions Trunk Tools, AI 혁신가로서 건설 전문가들이 프로젝트 데이터를 관리하고 활용하는 방식을 변화시키고 있으며, 시리즈 B 라운드에서 4천만 달러를 조달했습니다. Insight Partners가 주도하고 Redpoint Ventures, Innovation Endeavors, Stepstone, Liberty Mutual Strategic Ventur
AI로 구동되는 부동산 광고: Likely AI로 리드 품질 향상 AI로 구동되는 부동산 광고: Likely AI로 리드 품질 향상 오늘날 빠르게 변화하는 부동산 시장에서 차별화는 핵심입니다. Likely AI의 광고 생성기는 인공지능을 활용하여 고도로 타겟팅된, 영향력 있는 광고 캠페인을 제작함으로써 마케팅을 혁신합니다. 이 혁신적인 도구는 광고 생성을 단순화하여 부동산 전문가들이 이상적인 타겟 고객과 연결되고 놀라운 효율성으로 고품질 리드를 생성할 수 있도록 지원합니다. Likely
의견 (0)
0/200
위로 돌아갑니다
OR