A IA da DeepMind supera os medalhistas de ouro da IMO

Lar

Notícias

10 de Abril de 2025

RoyTaylor

154

# ai # Google # Math

A mais recente IA do Google DeepMind, AlphaGeometry2, superou o medalhista de ouro médio ao resolver problemas de geometria na Olimpíada Internacional de Matemática (IMO). Esta versão avançada do AlphaGeometry, lançado em janeiro passado, resolveu 84% dos problemas de geometria das últimas 25 edições do IMO.

Você pode se perguntar por que a DeepMind foca em um concurso de matemática do ensino médio. Eles acreditam que resolver esses desafiadores problemas de geometria euclidiana pode ser um passo para desenvolver IA mais avançada. Resolver esses problemas exige raciocínio lógico e navegação por várias caminhos de solução, habilidades cruciais para futuros sistemas de IA de propósito geral.

Neste verão, a DeepMind apresentou um sistema que combina AlphaGeometry2 com AlphaProof, outro modelo de IA para raciocínio matemático formal. Juntos, eles resolveram quatro dos seis problemas do IMO 2024. Essa abordagem pode se estender além da geometria para outras áreas da matemática e ciência, como cálculos complexos de engenharia.

AlphaGeometry2 é alimentado por componentes-chave, incluindo um modelo de linguagem da família Gemini do Google e um "motor simbólico". O modelo Gemini auxilia o motor simbólico, que aplica regras matemáticas para encontrar soluções, na criação de provas viáveis para teoremas geométricos.

Um diagrama geométrico típico no IMO.

Um diagrama de problema geométrico típico em um exame do IMO. Créditos da imagem: Google (abre em uma nova janela)

No IMO, os problemas de geometria frequentemente exigem adicionar "construções" como pontos, linhas ou círculos aos diagramas antes de resolvê-los. O modelo Gemini do AlphaGeometry2 prevê quais construções podem ser úteis, guiando o motor simbólico para fazer deduções.

Funciona assim: o modelo Gemini sugere passos e construções em uma linguagem matemática formal, que o motor verifica quanto à consistência lógica. O AlphaGeometry2 usa um algoritmo de busca para explorar múltiplos caminhos de solução simultaneamente e armazena descobertas potencialmente úteis em uma base de conhecimento compartilhada.

Um problema é considerado "resolvido" quando o AlphaGeometry2 combina as sugestões do modelo Gemini com os princípios conhecidos do motor simbólico para formar uma prova completa.

Devido à escassez de dados de treinamento geométrico utilizáveis, a DeepMind criou dados sintéticos para treinar o modelo de linguagem do AlphaGeometry2, gerando mais de 300 milhões de teoremas e provas de complexidade variada.

A equipe da DeepMind testou o AlphaGeometry2 em 45 problemas de geometria de competições do IMO de 2000 a 2024, expandidos para 50 problemas. O AlphaGeometry2 resolveu 42 deles, superando a pontuação média de medalhistas de ouro de 40,9.

No entanto, o AlphaGeometry2 tem limitações. Ele enfrenta dificuldades com problemas envolvendo um número variável de pontos, equações não lineares e desigualdades. Embora não seja a primeira IA a atingir desempenho de nível de medalha de ouro em geometria, é a primeira a fazê-lo com um conjunto tão grande de problemas.

Quando confrontado com um conjunto mais difícil de 29 problemas indicados para o IMO que ainda não apareceram em competições, o AlphaGeometry2 resolveu apenas 20.

Os resultados do estudo provavelmente gerarão mais debates sobre a melhor abordagem para construir sistemas de IA. Devemos focar na manipulação de símbolos, onde a IA usa regras para manipular símbolos que representam conhecimento, ou em redes neurais, que imitam a estrutura do cérebro humano e aprendem com dados?

O AlphaGeometry2 adota uma abordagem híbrida, combinando a arquitetura de rede neural do modelo Gemini com o motor simbólico baseado em regras.

Defensores das redes neurais argumentam que comportamentos inteligentes podem surgir de grandes quantidades de dados e poder computacional. Em contraste, proponentes da IA simbólica acreditam que ela é melhor para codificar conhecimento, raciocinar em Facade em cenários complexos e explicar soluções.

Vince Conitzer, professor de ciência da computação da Carnegie Mellon University especializado em IA, comentou sobre o contraste entre o impressionante progresso em benchmarks como o IMO e as dificuldades contínuas dos modelos de linguagem com problemas simples de senso comum. Ele enfatizou a necessidade de entender melhor esses sistemas e os risks que eles representam.

O AlphaGeometry2 sugere que combinar manipulação de símbolos e redes neurais pode ser um caminho promissor para a busca por IA generalizável. Curiosamente, a equipe da DeepMind descobriu que o modelo de linguagem do AlphaGeometry2 pode gerar soluções parciais para problemas sem a ajuda do motor simbólico, sugerindo o potencial para modelos de linguagem se tornarem autossuficientes no futuro.

No entanto, a equipe observou que, até que a velocidade dos modelos de linguagem melhore e as alucinações sejam resolvidas, ferramentas como motores simbólicos continuarão sendo essenciais para aplicações matemáticas.

Artigo relacionado

Midjourney revela gerador de vídeo com IA de última geração para conteúdo criativo Avanço na geração de vídeos com IA da MidjourneyA Midjourney revelou sua primeira ferramenta de geração de vídeo com IA, marcando uma expansão significativa além de seus renomados recursos de criação

O Google evita vazamentos do Pixel 10 ao revelar oficialmente o smartphone antes do previsto O Google está provocando os fãs com um vislumbre antecipado de sua próxima linha de smartphones Pixel 10, mostrando o design oficial apenas algumas semanas antes do evento de lançamento programado par

O aplicativo Gemini do Google adiciona vídeo com IA em tempo real, Deep Research e novos recursos (120 caracteres) O Google revelou melhorias significativas no Gemini AI durante sua conferência de desenvolvedores I/O 2025, expandindo os recursos multimodais, introduzindo modelos de IA de última geração e fortalece

Comentários (31)

0/200

Enviar

KevinBrown

3 de Setembro de 2025 à33 13:30:33 WEST

Impressionnant mais un peu flippant... Si une IA peut battre des médaillés d'or aux Olympiades, qu'est-ce qui nous reste comme domaines où les humains sont encore les meilleurs ? 😅 J'espère qu'on va pas tous devenir obsolètes !

GregoryWalker

20 de Agosto de 2025 à20 18:01:20 WEST

This AI beating IMO champs is wild! 🧠 Geometry’s tough, but AlphaGeometry2’s out here crushing it. Makes me wonder if it’ll start tutoring kids soon! 😄

AnthonyMoore

19 de Agosto de 2025 à23 20:01:23 WEST

Incroyable, AlphaGeometry2 dépasse les médaillés d'or de l'IMO en géométrie ! 😲 Ça montre à quel point l'IA avance vite, mais je me demande si elle pourrait un jour résoudre des problèmes plus... humains, comme gérer mes impôts !

GaryThomas

14 de Agosto de 2025 à59 02:00:59 WEST

This AI beating IMO gold medalists is wild! 🤯 Geometry’s tough, but AlphaGeometry2’s out here making it look easy. Wonder how far it’ll go in other math fields?

AlbertSmith

9 de Agosto de 2025 à59 22:00:59 WEST

Wow, AlphaGeometry2 is killing it at IMO geometry problems! Beating gold medalists is wild—makes me wonder if AI will soon design math contests instead of just solving them. 😮

JackCarter

28 de Julho de 2025 à31 03:13:31 WEST

This AI beating IMO champs is wild! 🤯 Makes me wonder if it could tutor me in math or just take over the world one proof at a time.

Principais notícias

Gemini 2.5 Pro agora ilimitado e mais barato que Claude, GPT-4o Geradores de Vídeo AI Top de 2025: Pika Labs vs Alternativas Dublagem AI: Guia Definitivo para Criação de Voz Realista A IA de Cambium transforma a madeira desperdiçada em madeira serrada O OpenAI aprimora o assistente de voz da IA para bate -papos melhores Como garantir que seus dados sejam confiáveis para a integração de IA Notebooklm se expande globalmente, adiciona slides e verificação de fatos aprimorada Tweaks to Us Data Centers podem desbloquear 76 GW de nova capacidade de energia O Google utiliza a IA para suspender mais de 39 milhões de contas de anúncios por suspeita de fraude Clone de Voz por IA: Guia definitivo para dominar a conversão de voz

Mais

Apresentou