L'IA de Deepmind surpasse les médaillés d'or de l'OMI

Maison

Nouvelles

10 avril 2025

RoyTaylor

154

# ai # Google # Math

L'IA la plus récente de Google DeepMind, AlphaGeometry2, a fait sensation en surpassant le médaillé d'or moyen dans la résolution de problèmes de géométrie à l'Olympiade internationale de mathématiques (IMO). Cette version avancée d'AlphaGeometry, présentée en janvier dernier, a résolu 84 % des problèmes de géométrie des 25 dernières années des compétitions IMO.

Vous vous demandez peut-être pourquoi DeepMind se concentre sur un concours de mathématiques au lycée. Eh bien, ils pensent que résoudre ces problèmes complexes de géométrie euclidienne pourrait être une étape vers le développement d'une IA plus avancée. Résoudre ces problèmes nécessite à la fois un raisonnement logique et la capacité à naviguer parmi diverses voies de solution, des compétences cruciales pour les futurs systèmes d'IA à usage général.

Cet été, DeepMind a présenté un système combinant AlphaGeometry2 avec AlphaProof, un autre modèle d'IA conçu pour le raisonnement mathématique formel. Ensemble, ils ont résolu quatre des six problèmes de l'IMO 2024. Cette approche pourrait potentiellement s'étendre au-delà de la géométrie à d'autres domaines des mathématiques et des sciences, comme les calculs d'ingénierie complexes.

AlphaGeometry2 est alimenté par quelques composants clés, dont un modèle de langage de la famille Gemini de Google et un "moteur symbolique". Le modèle Gemini aide le moteur symbolique, qui applique des règles mathématiques pour trouver des solutions, à créer des preuves réalisables pour les théorèmes de géométrie.

Un diagramme de géométrie typique dans l'IMO.

Un diagramme de problème de géométrie typique dans un examen IMO. Crédits image : Google (s'ouvre dans une nouvelle fenêtre)

Dans l'IMO, les problèmes de géométrie nécessitent souvent l'ajout de "constructions" comme des points, des lignes ou des cercles aux diagrammes avant de les résoudre. Le modèle Gemini d'AlphaGeometry2 prédit quelles constructions pourraient être utiles, guidant le moteur symbolique pour faire des déductions.

Voici comment cela fonctionne : le modèle Gemini suggère des étapes et des constructions dans un langage mathématique formel, que le moteur vérifie ensuite pour la cohérence logique. AlphaGeometry2 utilise un algorithme de recherche pour explorer simultanément plusieurs voies de solution et stocke les découvertes potentiellement utiles dans une base de connaissances partagée.

Un problème est considéré comme "résolu" lorsque AlphaGeometry2 combine les suggestions du modèle Gemini avec les principes connus du moteur symbolique pour former une preuve complète.

En raison de la rareté des données d'entraînement en géométrie utilisables, DeepMind a créé des données synthétiques pour entraîner le modèle de langage d'AlphaGeometry2, générant plus de 300 millions de théorèmes et de preuves de complexité variable.

L'équipe DeepMind a testé AlphaGeometry2 sur 45 problèmes de géométrie des compétitions IMO de 2000 à 2024, qu'ils ont étendus à 50 problèmes. AlphaGeometry2 en a résolu 42, dépassant le score moyen des médaillés d'or de 40,9.

Cependant, AlphaGeometry2 a ses limites. Il a du mal avec les problèmes impliquant un nombre variable de points, des équations non linéaires et des inégalités. Bien qu'il ne soit pas le premier IA à atteindre un niveau de performance de médaille d'or en géométrie, c'est le premier à le faire avec un ensemble de problèmes aussi large.

Face à un ensemble plus difficile de 29 problèmes nominés pour l'IMO qui n'ont pas encore été utilisés en compétition, AlphaGeometry2 n'a pu en résoudre que 20.

Les résultats de l'étude sont susceptibles de relancer le débat sur la meilleure approche pour construire des systèmes d'IA. Faut-il se concentrer sur la manipulation de symboles, où l'IA utilise des règles pour manipuler des symboles représentant la connaissance, ou sur les réseaux neuronaux, qui imitent la structure du cerveau humain et apprennent à partir de données ?

AlphaGeometry2 adopte une approche hybride, combinant l'architecture de réseau neuronal du modèle Gemini avec le moteur symbolique basé sur des règles.

Les partisans des réseaux neuronaux soutiennent qu'un comportement intelligent peut émerger de grandes quantités de données et de puissance de calcul. En revanche, les défenseurs de l'IA symbolique estiment qu'elle est mieux adaptée pour encoder la connaissance, raisonner dans des scénarios complexes et expliquer les solutions.

Vince Conitzer, professeur d'informatique à l'Université Carnegie Mellon spécialisé en IA, a commenté le contraste entre les progrès impressionnants sur des benchmarks comme l'IMO et les difficultés persistantes des modèles de langage avec des problèmes de bon sens simples. Il a souligné la nécessité de mieux comprendre ces systèmes et les risques qu'ils posent.

AlphaGeometry2 suggère que combiner la manipulation de symboles et les réseaux neuronaux pourrait être une voie prometteuse pour la recherche d'une IA généralisable. Fait intéressant, l'équipe DeepMind a constaté que le modèle de langage d'AlphaGeometry2 pouvait générer des solutions partielles à des problèmes sans l'aide du moteur symbolique, laissant entrevoir le potentiel des modèles de langage pour devenir autonomes à l'avenir.

Cependant, l'équipe a noté que tant que la vitesse des modèles de langage ne s'améliore pas et que les hallucinations ne sont pas résolues, des outils comme les moteurs symboliques resteront essentiels pour les applications mathématiques.

Article connexe

Trump donne la priorité à la croissance de l'IA plutôt qu'à la réglementation dans sa course pour devancer la Chine L'administration Trump a dévoilé mercredi son plan d'action historique en matière d'IA, marquant une rupture décisive avec les politiques de l'administration Biden en matière d'IA, qui étaient peu enc

YouTube intègre l'outil vidéo Veo 3 AI directement dans la plateforme Shorts YouTube Shorts proposera le modèle vidéo Veo 3 AI cet étéNeal Mohan, PDG de YouTube, a révélé lors de sa présentation aux Lions de Cannes que la technologie de pointe Veo 3 de génération de vidéos par

Google Cloud permet des avancées dans le domaine de la recherche et de la découverte scientifiques La révolution numérique transforme les méthodologies scientifiques grâce à des capacités de calcul sans précédent. Les technologies de pointe renforcent désormais les cadres théoriques et les expérien

commentaires (31)

0/200

Soumettre

KevinBrown

3 septembre 2025 14:30:33 UTC+02:00

Impressionnant mais un peu flippant... Si une IA peut battre des médaillés d'or aux Olympiades, qu'est-ce qui nous reste comme domaines où les humains sont encore les meilleurs ? 😅 J'espère qu'on va pas tous devenir obsolètes !

GregoryWalker

20 août 2025 19:01:20 UTC+02:00

This AI beating IMO champs is wild! 🧠 Geometry’s tough, but AlphaGeometry2’s out here crushing it. Makes me wonder if it’ll start tutoring kids soon! 😄

AnthonyMoore

19 août 2025 21:01:23 UTC+02:00

Incroyable, AlphaGeometry2 dépasse les médaillés d'or de l'IMO en géométrie ! 😲 Ça montre à quel point l'IA avance vite, mais je me demande si elle pourrait un jour résoudre des problèmes plus... humains, comme gérer mes impôts !

GaryThomas

14 août 2025 03:00:59 UTC+02:00

This AI beating IMO gold medalists is wild! 🤯 Geometry’s tough, but AlphaGeometry2’s out here making it look easy. Wonder how far it’ll go in other math fields?

AlbertSmith

9 août 2025 23:00:59 UTC+02:00

Wow, AlphaGeometry2 is killing it at IMO geometry problems! Beating gold medalists is wild—makes me wonder if AI will soon design math contests instead of just solving them. 😮

JackCarter

28 juillet 2025 04:13:31 UTC+02:00

This AI beating IMO champs is wild! 🤯 Makes me wonder if it could tutor me in math or just take over the world one proof at a time.

Top nouvelles

Gemini 2.5 Pro maintenant illimité et moins cher que Claude, GPT-4O Meilleurs Générateurs de Vidéos IA en 2025 : Pika Labs vs Alternatives Doublage par IA : Guide ultime pour la création de voix réalistes L'IA du cambium transforme le bois de déchet en bois OpenAI améliore l'assistant vocal AI pour de meilleurs chats Comment vous assurer que vos données sont dignes de confiance pour l'intégration de l'IA Notebooklm se développe à l'échelle mondiale, ajoute des diapositives et une vérification des faits améliorée Les ajustements aux centres de données américains pourraient débloquer 76 GW de nouvelle capacité d'énergie Google utilise l'IA pour suspendre plus de 39 millions de comptes d'annonces pour une fraude présumée Clonage Vocal IA: Guide Ultime pour Maîtriser la Conversion de Voix

Plus

En vedette