L'IA de Deepmind surpasse les médaillés d'or de l'OMI
La dernière IA de Google Deepmind, Alphageométrie2, a fait des vagues en surpassant le médaillé d'or moyen dans la résolution des problèmes de géométrie à l'Olympiade mathématique internationale (IMO). Cette version avancée de l'alphageométrie précédemment publiée, introduite juste en janvier dernier, aurait résolu 84% des problèmes de géométrie des 25 dernières années de compétitions de l'OMI.
Vous vous demandez peut-être pourquoi DeepMind se concentre sur un concours de mathématiques du secondaire. Eh bien, ils croient que la création de ces problèmes de géométrie euclidiens difficiles pourrait être un tremplin vers le développement d'une IA plus avancée. La résolution de ces problèmes nécessite à la fois un raisonnement logique et la capacité de parcourir divers chemins de solution, des compétences qui pourraient être cruciales pour les futurs systèmes d'IA à usage général.
Cet été, DeepMind a présenté un système combiné Alphageométrie2 avec Alphaproof, un autre modèle d'IA conçu pour le raisonnement mathématique formel. Ensemble, ils ont résolu quatre problèmes sur six de l'OMI 2024. Cette approche pourrait potentiellement s'étendre au-delà de la géométrie à d'autres domaines de mathématiques et de sciences, comme des calculs d'ingénierie complexes.
Alphageométrie2 est alimenté par quelques composants clés, y compris un modèle de langue de la famille Gemini de Google et un "moteur symbolique". Le modèle Gemini aide le moteur symbolique, qui applique des règles mathématiques pour trouver des solutions, dans la création de preuves possibles pour les théorèmes de géométrie.

Un diagramme de problèmes de géométrie typique dans un examen IMO. Crédits d'image: Google (s'ouvre dans une nouvelle fenêtre)
Dans l'OMI, les problèmes de géométrie nécessitent souvent d'ajouter des "constructions" comme des points, des lignes ou des cercles aux diagrammes avant de les résoudre. Le modèle Gemini d'Alphageométrie2 prédit quelles constructions pourraient être utiles, guidant le moteur symbolique pour effectuer des déductions.
Voici comment cela fonctionne: le modèle Gemini suggère des étapes et des constructions dans un langage mathématique formel, que le moteur vérifie ensuite la cohérence logique. Alphageométrie2 utilise un algorithme de recherche pour explorer simultanément plusieurs chemins de solution et stocke des résultats potentiellement utiles dans une base de connaissances partagée.
Un problème est considéré comme «résolu» lorsque Alphageométrie2 combine les suggestions du modèle Gemini avec les principes connus du moteur symbolique pour former une preuve complète.
En raison de la rareté des données de formation en géométrie utilisables, DeepMind a créé des données synthétiques pour former le modèle de langue d'Alphageométrie2, générant plus de 300 millions de théorèmes et de preuves de complexité variable.
L'équipe DeepMind a testé l'alphageométrie2 sur 45 problèmes de géométrie à partir de compétitions d'OMI s'étalant de 2000 à 2024, qu'ils ont étendu à 50 problèmes. Alphageométrie2 en a résolu 42 d'entre eux, dépassant le score médaillé d'or moyen de 40,9.
Cependant, Alphageométrie2 a ses limites. Il se débat avec des problèmes impliquant un nombre variable de points, d'équations non linéaires et d'inégalités. Bien que ce ne soit pas la première IA à atteindre les performances au niveau de la médale or en géométrie, c'est le premier à le faire avec un ensemble de problèmes aussi important.
Face à un ensemble plus difficile de 29 problèmes nominés à l'OMI qui ne sont pas encore apparus dans les compétitions, Alphageométrie2 ne pouvait résoudre que 20.
Les résultats de l'étude sont susceptibles de susciter un débat supplémentaire sur la meilleure approche pour construire des systèmes d'IA. Faut-il nous concentrer sur la manipulation des symboles, où l'IA utilise des règles pour manipuler les symboles représentant les connaissances, ou sur les réseaux de neurones, qui imitent la structure du cerveau humain et apprennent des données?
Alphageométrie2 adopte une approche hybride, combinant l'architecture du réseau neuronal du modèle Gemini avec le moteur symbolique basé sur des règles.
Les partisans des réseaux de neurones soutiennent que le comportement intelligent peut émerger de grandes quantités de données et de puissance de calcul. En revanche, les partisans de l'IA symbolique croient qu'il est mieux adapté à l'encodage des connaissances, au raisonnement à travers des scénarios complexes et à l'explication des solutions.
Vince Conitzer, un professeur d'informatique de l'Université Carnegie Mellon spécialisée dans l'IA, a commenté le contraste entre les progrès impressionnants sur des repères comme l'IMO et les difficultés permanentes de modèles de langues avec de simples problèmes de bon sens. Il a souligné la nécessité de mieux comprendre ces systèmes et les risques qu'ils posent.
Alphageométrie2 suggère que la combinaison de la manipulation des symboles et des réseaux neuronaux pourrait être une voie prometteuse dans la quête de l'IA généralisable. Fait intéressant, l'équipe DeepMind a constaté que le modèle linguistique d'Alphageométrie2 pourrait générer des solutions partielles aux problèmes sans l'aide du moteur symbolique, faisant allusion au potentiel pour que les modèles linguistiques deviennent autosuffisants à l'avenir.
Cependant, l'équipe a noté que jusqu'à ce que la vitesse du modèle de langue s'améliore et que les hallucinations soient résolues, des outils comme les moteurs symboliques resteront essentiels pour les applications mathématiques.
Article connexe
억만장자들이 이번 주 AI 업데이트에서 일자리 자동화에 대해 논의하다
안녕하세요, TechCrunch의 AI 뉴스레터에 다시 오신 것을 환영합니다! 아직 구독하지 않으셨다면, 매주 수요일마다 받은 편지함으로 바로 배달받을 수 있도록 여기를 클릭해 구독하세요.지난주에는 잠시 쉬었지만, 그럴만한 이유가 있었습니다—중국의 AI 회사 DeepSeek의 갑작스러운 급부상 덕분에 AI 뉴스 사이클이 뜨거웠습니다. 정신없는 시간이였지만,
NotebookLM 앱 출시: AI 기반 지식 도구
NotebookLM 모바일 출시: 이제 Android와 iOS에서 만나는 AI 연구 보조 도구NotebookLM에 대한 여러분의 뜨거운 반응에 깊이 감사드립니다. 수백만 사용자가 복잡한 정보를 이해하는 필수 도구로 NotebookLM을 선택해주셨습니다. 하지만 가장 많이 받은 요청은 바로 "언제 모바일에서 사용할 수 있나
Imagen 4: 구글 최신 AI 이미지 생성기
구글이 최신 이미지 생성 AI 모델 '이마젠 4(Imagen 4)'를 공개하며 전작 대비 향상된 시각적 경험을 약속했습니다. 이번 주 초 구글 I/O 2025에서 발표된 이 신형 모델은 품질과 다용도성 측면에서 큰 도약으로 평가받고 있습니다. 구글에 따르면 이마젠 4는 직물 표면, 물방울, 동물 털 같은 정교한 디테일 구
commentaires (25)
0/200
HarryPerez
12 avril 2025 00:00:00 UTC
DeepMind's AlphaGeometry2 beating IMO gold medalists is mind-blowing! It's amazing to see AI tackling such complex problems. But, does it really understand geometry, or is it just pattern matching? Either way, it's a huge step forward for AI in education!
0
JackSanchez
12 avril 2025 00:00:00 UTC
DeepMindのAlphaGeometry2がIMOの金メダリストを上回るなんて驚きです!AIがこんなに複雑な問題に取り組むのを見るのは素晴らしいです。でも、本当に幾何学を理解しているのか、それともただのパターンマッチングなのか?どちらにしても、教育におけるAIの大きな一歩ですね!
0
HenryJackson
11 avril 2025 00:00:00 UTC
DeepMind의 AlphaGeometry2가 IMO 금메달리스트를 능가하다니 놀랍네요! AI가 이렇게 복잡한 문제를 다루는 걸 보는 건 정말 멋져요. 하지만 정말 기하학을 이해하는 건지, 아니면 단순히 패턴 매칭을 하는 건지 궁금해요. 어쨌든 교육에서의 AI 발전에 큰 걸음이에요!
0
HarryRoberts
11 avril 2025 00:00:00 UTC
O AlphaGeometry2 da DeepMind superar os medalhistas de ouro do IMO é impressionante! É incrível ver a IA lidando com problemas tão complexos. Mas, será que ela realmente entende geometria, ou é apenas correspondência de padrões? De qualquer forma, é um grande avanço para a IA na educação!
0
BillyRoberts
10 avril 2025 00:00:00 UTC
¡Que AlphaGeometry2 de DeepMind supere a los medallistas de oro del IMO es alucinante! Es increíble ver a la IA abordando problemas tan complejos. Pero, ¿realmente entiende la geometría, o solo está haciendo coincidencia de patrones? De cualquier manera, es un gran paso adelante para la IA en la educación!
0
AlbertHarris
14 avril 2025 00:00:00 UTC
DeepMind's AlphaGeometry2 is mind-blowing! It's solving geometry problems better than IMO gold medalists. I used it to help with my math homework and it was spot on! The only thing is, it's a bit too advanced for casual users like me. Still, it's a solid 4 out of 5. 📚
0
La dernière IA de Google Deepmind, Alphageométrie2, a fait des vagues en surpassant le médaillé d'or moyen dans la résolution des problèmes de géométrie à l'Olympiade mathématique internationale (IMO). Cette version avancée de l'alphageométrie précédemment publiée, introduite juste en janvier dernier, aurait résolu 84% des problèmes de géométrie des 25 dernières années de compétitions de l'OMI.
Vous vous demandez peut-être pourquoi DeepMind se concentre sur un concours de mathématiques du secondaire. Eh bien, ils croient que la création de ces problèmes de géométrie euclidiens difficiles pourrait être un tremplin vers le développement d'une IA plus avancée. La résolution de ces problèmes nécessite à la fois un raisonnement logique et la capacité de parcourir divers chemins de solution, des compétences qui pourraient être cruciales pour les futurs systèmes d'IA à usage général.
Cet été, DeepMind a présenté un système combiné Alphageométrie2 avec Alphaproof, un autre modèle d'IA conçu pour le raisonnement mathématique formel. Ensemble, ils ont résolu quatre problèmes sur six de l'OMI 2024. Cette approche pourrait potentiellement s'étendre au-delà de la géométrie à d'autres domaines de mathématiques et de sciences, comme des calculs d'ingénierie complexes.
Alphageométrie2 est alimenté par quelques composants clés, y compris un modèle de langue de la famille Gemini de Google et un "moteur symbolique". Le modèle Gemini aide le moteur symbolique, qui applique des règles mathématiques pour trouver des solutions, dans la création de preuves possibles pour les théorèmes de géométrie.
Dans l'OMI, les problèmes de géométrie nécessitent souvent d'ajouter des "constructions" comme des points, des lignes ou des cercles aux diagrammes avant de les résoudre. Le modèle Gemini d'Alphageométrie2 prédit quelles constructions pourraient être utiles, guidant le moteur symbolique pour effectuer des déductions.
Voici comment cela fonctionne: le modèle Gemini suggère des étapes et des constructions dans un langage mathématique formel, que le moteur vérifie ensuite la cohérence logique. Alphageométrie2 utilise un algorithme de recherche pour explorer simultanément plusieurs chemins de solution et stocke des résultats potentiellement utiles dans une base de connaissances partagée.
Un problème est considéré comme «résolu» lorsque Alphageométrie2 combine les suggestions du modèle Gemini avec les principes connus du moteur symbolique pour former une preuve complète.
En raison de la rareté des données de formation en géométrie utilisables, DeepMind a créé des données synthétiques pour former le modèle de langue d'Alphageométrie2, générant plus de 300 millions de théorèmes et de preuves de complexité variable.
L'équipe DeepMind a testé l'alphageométrie2 sur 45 problèmes de géométrie à partir de compétitions d'OMI s'étalant de 2000 à 2024, qu'ils ont étendu à 50 problèmes. Alphageométrie2 en a résolu 42 d'entre eux, dépassant le score médaillé d'or moyen de 40,9.
Cependant, Alphageométrie2 a ses limites. Il se débat avec des problèmes impliquant un nombre variable de points, d'équations non linéaires et d'inégalités. Bien que ce ne soit pas la première IA à atteindre les performances au niveau de la médale or en géométrie, c'est le premier à le faire avec un ensemble de problèmes aussi important.
Face à un ensemble plus difficile de 29 problèmes nominés à l'OMI qui ne sont pas encore apparus dans les compétitions, Alphageométrie2 ne pouvait résoudre que 20.
Les résultats de l'étude sont susceptibles de susciter un débat supplémentaire sur la meilleure approche pour construire des systèmes d'IA. Faut-il nous concentrer sur la manipulation des symboles, où l'IA utilise des règles pour manipuler les symboles représentant les connaissances, ou sur les réseaux de neurones, qui imitent la structure du cerveau humain et apprennent des données?
Alphageométrie2 adopte une approche hybride, combinant l'architecture du réseau neuronal du modèle Gemini avec le moteur symbolique basé sur des règles.
Les partisans des réseaux de neurones soutiennent que le comportement intelligent peut émerger de grandes quantités de données et de puissance de calcul. En revanche, les partisans de l'IA symbolique croient qu'il est mieux adapté à l'encodage des connaissances, au raisonnement à travers des scénarios complexes et à l'explication des solutions.
Vince Conitzer, un professeur d'informatique de l'Université Carnegie Mellon spécialisée dans l'IA, a commenté le contraste entre les progrès impressionnants sur des repères comme l'IMO et les difficultés permanentes de modèles de langues avec de simples problèmes de bon sens. Il a souligné la nécessité de mieux comprendre ces systèmes et les risques qu'ils posent.
Alphageométrie2 suggère que la combinaison de la manipulation des symboles et des réseaux neuronaux pourrait être une voie prometteuse dans la quête de l'IA généralisable. Fait intéressant, l'équipe DeepMind a constaté que le modèle linguistique d'Alphageométrie2 pourrait générer des solutions partielles aux problèmes sans l'aide du moteur symbolique, faisant allusion au potentiel pour que les modèles linguistiques deviennent autosuffisants à l'avenir.
Cependant, l'équipe a noté que jusqu'à ce que la vitesse du modèle de langue s'améliore et que les hallucinations soient résolues, des outils comme les moteurs symboliques resteront essentiels pour les applications mathématiques.




DeepMind's AlphaGeometry2 beating IMO gold medalists is mind-blowing! It's amazing to see AI tackling such complex problems. But, does it really understand geometry, or is it just pattern matching? Either way, it's a huge step forward for AI in education!




DeepMindのAlphaGeometry2がIMOの金メダリストを上回るなんて驚きです!AIがこんなに複雑な問題に取り組むのを見るのは素晴らしいです。でも、本当に幾何学を理解しているのか、それともただのパターンマッチングなのか?どちらにしても、教育におけるAIの大きな一歩ですね!




DeepMind의 AlphaGeometry2가 IMO 금메달리스트를 능가하다니 놀랍네요! AI가 이렇게 복잡한 문제를 다루는 걸 보는 건 정말 멋져요. 하지만 정말 기하학을 이해하는 건지, 아니면 단순히 패턴 매칭을 하는 건지 궁금해요. 어쨌든 교육에서의 AI 발전에 큰 걸음이에요!




O AlphaGeometry2 da DeepMind superar os medalhistas de ouro do IMO é impressionante! É incrível ver a IA lidando com problemas tão complexos. Mas, será que ela realmente entende geometria, ou é apenas correspondência de padrões? De qualquer forma, é um grande avanço para a IA na educação!




¡Que AlphaGeometry2 de DeepMind supere a los medallistas de oro del IMO es alucinante! Es increíble ver a la IA abordando problemas tan complejos. Pero, ¿realmente entiende la geometría, o solo está haciendo coincidencia de patrones? De cualquier manera, es un gran paso adelante para la IA en la educación!




DeepMind's AlphaGeometry2 is mind-blowing! It's solving geometry problems better than IMO gold medalists. I used it to help with my math homework and it was spot on! The only thing is, it's a bit too advanced for casual users like me. Still, it's a solid 4 out of 5. 📚












