option
Maison
Nouvelles
L'IA de Deepmind surpasse les médaillés d'or de l'OMI

L'IA de Deepmind surpasse les médaillés d'or de l'OMI

10 avril 2025
110

L'IA la plus récente de Google DeepMind, AlphaGeometry2, a fait sensation en surpassant le médaillé d'or moyen dans la résolution de problèmes de géométrie à l'Olympiade internationale de mathématiques (IMO). Cette version avancée d'AlphaGeometry, présentée en janvier dernier, a résolu 84 % des problèmes de géométrie des 25 dernières années des compétitions IMO.

Vous vous demandez peut-être pourquoi DeepMind se concentre sur un concours de mathématiques au lycée. Eh bien, ils pensent que résoudre ces problèmes complexes de géométrie euclidienne pourrait être une étape vers le développement d'une IA plus avancée. Résoudre ces problèmes nécessite à la fois un raisonnement logique et la capacité à naviguer parmi diverses voies de solution, des compétences cruciales pour les futurs systèmes d'IA à usage général.

Cet été, DeepMind a présenté un système combinant AlphaGeometry2 avec AlphaProof, un autre modèle d'IA conçu pour le raisonnement mathématique formel. Ensemble, ils ont résolu quatre des six problèmes de l'IMO 2024. Cette approche pourrait potentiellement s'étendre au-delà de la géométrie à d'autres domaines des mathématiques et des sciences, comme les calculs d'ingénierie complexes.

AlphaGeometry2 est alimenté par quelques composants clés, dont un modèle de langage de la famille Gemini de Google et un "moteur symbolique". Le modèle Gemini aide le moteur symbolique, qui applique des règles mathématiques pour trouver des solutions, à créer des preuves réalisables pour les théorèmes de géométrie.

Un diagramme de géométrie typique dans l'IMO.

Un diagramme de problème de géométrie typique dans un examen IMO. Crédits image : Google (s'ouvre dans une nouvelle fenêtre)

Dans l'IMO, les problèmes de géométrie nécessitent souvent l'ajout de "constructions" comme des points, des lignes ou des cercles aux diagrammes avant de les résoudre. Le modèle Gemini d'AlphaGeometry2 prédit quelles constructions pourraient être utiles, guidant le moteur symbolique pour faire des déductions.

Voici comment cela fonctionne : le modèle Gemini suggère des étapes et des constructions dans un langage mathématique formel, que le moteur vérifie ensuite pour la cohérence logique. AlphaGeometry2 utilise un algorithme de recherche pour explorer simultanément plusieurs voies de solution et stocke les découvertes potentiellement utiles dans une base de connaissances partagée.

Un problème est considéré comme "résolu" lorsque AlphaGeometry2 combine les suggestions du modèle Gemini avec les principes connus du moteur symbolique pour former une preuve complète.

En raison de la rareté des données d'entraînement en géométrie utilisables, DeepMind a créé des données synthétiques pour entraîner le modèle de langage d'AlphaGeometry2, générant plus de 300 millions de théorèmes et de preuves de complexité variable.

L'équipe DeepMind a testé AlphaGeometry2 sur 45 problèmes de géométrie des compétitions IMO de 2000 à 2024, qu'ils ont étendus à 50 problèmes. AlphaGeometry2 en a résolu 42, dépassant le score moyen des médaillés d'or de 40,9.

Cependant, AlphaGeometry2 a ses limites. Il a du mal avec les problèmes impliquant un nombre variable de points, des équations non linéaires et des inégalités. Bien qu'il ne soit pas le premier IA à atteindre un niveau de performance de médaille d'or en géométrie, c'est le premier à le faire avec un ensemble de problèmes aussi large.

Face à un ensemble plus difficile de 29 problèmes nominés pour l'IMO qui n'ont pas encore été utilisés en compétition, AlphaGeometry2 n'a pu en résoudre que 20.

Les résultats de l'étude sont susceptibles de relancer le débat sur la meilleure approche pour construire des systèmes d'IA. Faut-il se concentrer sur la manipulation de symboles, où l'IA utilise des règles pour manipuler des symboles représentant la connaissance, ou sur les réseaux neuronaux, qui imitent la structure du cerveau humain et apprennent à partir de données ?

AlphaGeometry2 adopte une approche hybride, combinant l'architecture de réseau neuronal du modèle Gemini avec le moteur symbolique basé sur des règles.

Les partisans des réseaux neuronaux soutiennent qu'un comportement intelligent peut émerger de grandes quantités de données et de puissance de calcul. En revanche, les défenseurs de l'IA symbolique estiment qu'elle est mieux adaptée pour encoder la connaissance, raisonner dans des scénarios complexes et expliquer les solutions.

Vince Conitzer, professeur d'informatique à l'Université Carnegie Mellon spécialisé en IA, a commenté le contraste entre les progrès impressionnants sur des benchmarks comme l'IMO et les difficultés persistantes des modèles de langage avec des problèmes de bon sens simples. Il a souligné la nécessité de mieux comprendre ces systèmes et les risques qu'ils posent.

AlphaGeometry2 suggère que combiner la manipulation de symboles et les réseaux neuronaux pourrait être une voie prometteuse pour la recherche d'une IA généralisable. Fait intéressant, l'équipe DeepMind a constaté que le modèle de langage d'AlphaGeometry2 pouvait générer des solutions partielles à des problèmes sans l'aide du moteur symbolique, laissant entrevoir le potentiel des modèles de langage pour devenir autonomes à l'avenir.

Cependant, l'équipe a noté que tant que la vitesse des modèles de langage ne s'améliore pas et que les hallucinations ne sont pas résolues, des outils comme les moteurs symboliques resteront essentiels pour les applications mathématiques.

Article connexe
Google dévoile les modèles AI Gemini 2.5 prêts pour la production pour rivaliser avec OpenAI sur le marché des entreprises Google dévoile les modèles AI Gemini 2.5 prêts pour la production pour rivaliser avec OpenAI sur le marché des entreprises Google a intensifié sa stratégie AI lundi, lançant ses modèles avancés Gemini 2.5 pour une utilisation en entreprise et introduisant une variante économique pour concurrencer sur le prix et la perform
Meta Renforce la Sécurité IA avec des Outils Llama Avancés Meta Renforce la Sécurité IA avec des Outils Llama Avancés Meta a publié de nouveaux outils de sécurité Llama pour renforcer le développement IA et protéger contre les menaces émergentes.Ces outils de sécurité du modèle IA Llama améliorés sont associés aux no
NotebookLM Dévoile des Carnets Sélectionnés de Publications de Premier Plan et d'Experts NotebookLM Dévoile des Carnets Sélectionnés de Publications de Premier Plan et d'Experts Google améliore son outil de recherche et de prise de notes alimenté par l'IA, NotebookLM, pour en faire un centre de connaissances complet. Lundi, l'entreprise a présenté une collection de carnets so
commentaires (27)
0/200
AlbertSmith
AlbertSmith 9 août 2025 23:00:59 UTC+02:00

Wow, AlphaGeometry2 is killing it at IMO geometry problems! Beating gold medalists is wild—makes me wonder if AI will soon design math contests instead of just solving them. 😮

JackCarter
JackCarter 28 juillet 2025 04:13:31 UTC+02:00

This AI beating IMO champs is wild! 🤯 Makes me wonder if it could tutor me in math or just take over the world one proof at a time.

LarryMartin
LarryMartin 20 avril 2025 11:52:37 UTC+02:00

AlphaGeometry2는 정말 놀랍네요! IMO 기하 문제를 금메달리스트보다 더 잘 풀어요. 하지만 저는 수학 천재가 아니라서 마술 쇼를 보는 기분이에요. 좀 더 이해할 수 있으면 좋겠어요! 🤯

JerryGonzález
JerryGonzález 17 avril 2025 01:58:03 UTC+02:00

DeepMindのAlphaGeometry2がIMOの金メダリストを上回るなんて信じられない!まるでAIが人間より賢いSF映画を見ているよう。でも本当に、私の宿題を手伝ってくれるのかな?😂

RaymondBaker
RaymondBaker 16 avril 2025 13:21:57 UTC+02:00

AlphaGeometry2 is mind-blowing! It's solving IMO geometry problems better than gold medalists. But I'm no math whiz, so it's more like watching a magic show for me. Wish I could understand it better! 🤯

JonathanAllen
JonathanAllen 16 avril 2025 10:15:26 UTC+02:00

AlphaGeometry2 é impressionante! Resolve problemas de geometria do IMO melhor que medalhistas de ouro. Mas eu não sou um gênio em matemática, então pra mim é como assistir a um show de mágica. Queria entender melhor! 🤯

Retour en haut
OR