IA da DeepMind Ganha Ouro na Olimpíada de Matemática de 2025
A IA da DeepMind alcançou um salto impressionante no raciocínio matemático, conquistando uma medalha de ouro na Olimpíada Internacional de Matemática (IMO) de 2025, apenas um ano após ganhar prata em 2024. Essa conquista destaca a crescente habilidade da IA em resolver problemas complexos e abstratos que exigem criatividade semelhante à humana. Este artigo explora a jornada transformadora da DeepMind, os principais avanços técnicos e o impacto mais amplo dessa conquista.
Por que a IMO é Importante
Desde 1959, a Olimpíada Internacional de Matemática é a principal competição mundial de matemática para estudantes do ensino médio. Ela desafia os participantes com seis problemas complexos em álgebra, geometria, teoria dos números e combinatória, exigindo criatividade excepcional, lógica e demonstrações elegantes.
Para a IA, a IMO é um teste formidável. Diferentemente do reconhecimento de padrões ou jogos estratégicos como Go, a matemática olímpica requer raciocínio abstrato e síntese de ideias novas — habilidades consideradas exclusivamente humanas por muito tempo. A IMO serve, assim, como um marco para o progresso da IA em direção à inteligência semelhante à humana.
Marco da Medalha de Prata em 2024
Em 2024, a DeepMind estreou dois sistemas de IA para problemas da IMO: AlphaProof e AlphaGeometry 2, ambos utilizando IA "neuro-simbólica", combinando modelos de linguagem de grande escala (LLMs) com lógica simbólica.
O AlphaProof usou Lean, uma linguagem matemática formal, para provar afirmações. Ele integrou o Gemini, o LLM da DeepMind, com o AlphaZero, um sistema de aprendizado por reforço famoso por dominar jogos de tabuleiro. O Gemini traduziu problemas para Lean, gerando passos lógicos, enquanto o AlphaProof treinou em milhões de problemas matemáticos diversos, refinando suas habilidades por meio de autoprogresso.
O AlphaGeometry 2 destacou-se em geometria, com o Gemini prevendo construções auxiliares e um motor simbólico lidando com deduções. Essa abordagem híbrida permitiu resolver problemas geométricos complexos.
Os sistemas resolveram quatro dos seis problemas da IMO — dois em álgebra, um em teoria dos números e um em geometria — marcando 28/42 pontos, conquistando uma medalha de prata. Isso marcou uma conquista histórica para a IA, embora dependesse de traduções humanas e recursos computacionais extensos.
Inovações Chave para o Ouro
O salto da DeepMind para o ouro em 2025 veio de grandes avanços técnicos.
1. Demonstrações em Linguagem Natural
Uma mudança crucial foi o uso de linguagem natural para demonstrações, eliminando a necessidade de traduções especializadas para linguagens formais. Um Gemini atualizado com capacidades Deep Think processa problemas diretamente, esboçando demonstrações informais, formalizando passos-chave internamente e entregando demonstrações claras em inglês. O aprendizado por reforço com feedback humano (RLHF) garantiu soluções concisas e lógicas.
O Gemini Deep Think destaca-se com janelas de contexto mais longas e mais tokens computacionais, suportando raciocínio de várias páginas. Ele emprega raciocínio paralelo, gerando centenas de caminhos de solução, com um supervisor classificando os melhores, semelhante ao brainstorming humano.
2. Técnicas Avançadas de Treinamento
O Gemini Deep Think foi ajustado em um corpus de 100.000 soluções de fóruns de matemática, arXiv e conjuntos de problemas universitários, com mentores humanos filtrando erros. O aprendizado por reforço com recompensas graduais para sublemas verificados guiou o modelo para demonstrações concisas. O treinamento durou três meses, usando 25 milhões de horas de TPU.
3. Poder de Processamento Paralelo
A paralelização foi crucial, com várias ramificações de raciocínio exploradas simultaneamente. Recursos foram dinamicamente alocados para caminhos promissores, especialmente eficazes para combinatória. Essa abordagem, apoiada pelos clusters TPU v5 da DeepMind, espelhou estratégias humanas como testar desigualdades antes de demonstrações completas.
Triunfo da DeepMind na IMO 2025
Para garantir justiça, a DeepMind congelou os pesos de seu modelo três semanas antes da IMO, filtrando soluções de problemas não publicados. Durante o evento, o Gemini Deep Think enfrentou seis problemas em texto simples sem acesso à internet, usando poder computacional equivalente a um laptop. Ele completou demonstrações em menos de três horas, obtendo pontuação perfeita em cinco problemas e um total de 35/42 — garantindo o ouro. As demonstrações da IA foram elogiadas como rigorosas e completas, equiparáveis aos padrões humanos.
Impacto na IA e na Matemática
O sucesso da DeepMind sinaliza o progresso da IA em direção à inteligência geral artificial (AGI), já que os problemas da IMO exigem raciocínio avançado. Para a matemática, ferramentas de IA como o Gemini Deep Think podem ajudar a explorar novos teoremas, verificar conjecturas e simplificar demonstrações, liberando matemáticos para trabalhos conceituais. No entanto, o papel da IA em educação e competições levanta questões sobre sua estrutura futura.
Perspectivas Futuras
Embora alguns desafios matemáticos permaneçam, o rápido progresso da DeepMind sugere que a IA pode em breve enfrentar grandes problemas não resolvidos. A vitória na IMO de 2025 destaca o avanço do raciocínio lógico da IA, desencadeando debates sobre se ela complementará ou redefinirá a criatividade humana na matemática.
Artigo relacionado
O jogo "Xiaolongxia", da Tencent, supera as expectativas; equipe amplia capacidade em 10 vezes, pede desculpas e oferece indenização
A Tencent lançou oficialmente o WorkBuddy, um agente inteligente de IA para todos os cenários, marcando uma nova fase na corrida pela camada de aplicação de modelos de grande porte, com alta integraçã
Principal investidor da Suno: a exclusão de publicações não resolverá o problema do processo por violação de direitos autorais
A tão esperada plataforma de geração musical por IA, Suno, enfrenta uma dura batalha judicial sobre direitos autorais, e um comentário sincero de seu principal investidor pode ter dado ao lado adversá
Claude Opus 4.7 é lançado com a confiabilidade em detrimento da inteligência
A Anthropic manteve um ritmo acelerado este ano, lançando novos recursos quase a cada dois dias. O tão aguardado Claude Opus 4.7 acaba de ser lançado oficialmente e, curiosamente, a Anthropic foi dire
Recomendações de tópicos especiais relacionados
Comentários (1)
A IA da DeepMind alcançou um salto impressionante no raciocínio matemático, conquistando uma medalha de ouro na Olimpíada Internacional de Matemática (IMO) de 2025, apenas um ano após ganhar prata em 2024. Essa conquista destaca a crescente habilidade da IA em resolver problemas complexos e abstratos que exigem criatividade semelhante à humana. Este artigo explora a jornada transformadora da DeepMind, os principais avanços técnicos e o impacto mais amplo dessa conquista.
Por que a IMO é Importante
Desde 1959, a Olimpíada Internacional de Matemática é a principal competição mundial de matemática para estudantes do ensino médio. Ela desafia os participantes com seis problemas complexos em álgebra, geometria, teoria dos números e combinatória, exigindo criatividade excepcional, lógica e demonstrações elegantes.
Para a IA, a IMO é um teste formidável. Diferentemente do reconhecimento de padrões ou jogos estratégicos como Go, a matemática olímpica requer raciocínio abstrato e síntese de ideias novas — habilidades consideradas exclusivamente humanas por muito tempo. A IMO serve, assim, como um marco para o progresso da IA em direção à inteligência semelhante à humana.
Marco da Medalha de Prata em 2024
Em 2024, a DeepMind estreou dois sistemas de IA para problemas da IMO: AlphaProof e AlphaGeometry 2, ambos utilizando IA "neuro-simbólica", combinando modelos de linguagem de grande escala (LLMs) com lógica simbólica.
O AlphaProof usou Lean, uma linguagem matemática formal, para provar afirmações. Ele integrou o Gemini, o LLM da DeepMind, com o AlphaZero, um sistema de aprendizado por reforço famoso por dominar jogos de tabuleiro. O Gemini traduziu problemas para Lean, gerando passos lógicos, enquanto o AlphaProof treinou em milhões de problemas matemáticos diversos, refinando suas habilidades por meio de autoprogresso.
O AlphaGeometry 2 destacou-se em geometria, com o Gemini prevendo construções auxiliares e um motor simbólico lidando com deduções. Essa abordagem híbrida permitiu resolver problemas geométricos complexos.
Os sistemas resolveram quatro dos seis problemas da IMO — dois em álgebra, um em teoria dos números e um em geometria — marcando 28/42 pontos, conquistando uma medalha de prata. Isso marcou uma conquista histórica para a IA, embora dependesse de traduções humanas e recursos computacionais extensos.
Inovações Chave para o Ouro
O salto da DeepMind para o ouro em 2025 veio de grandes avanços técnicos.
1. Demonstrações em Linguagem Natural
Uma mudança crucial foi o uso de linguagem natural para demonstrações, eliminando a necessidade de traduções especializadas para linguagens formais. Um Gemini atualizado com capacidades Deep Think processa problemas diretamente, esboçando demonstrações informais, formalizando passos-chave internamente e entregando demonstrações claras em inglês. O aprendizado por reforço com feedback humano (RLHF) garantiu soluções concisas e lógicas.
O Gemini Deep Think destaca-se com janelas de contexto mais longas e mais tokens computacionais, suportando raciocínio de várias páginas. Ele emprega raciocínio paralelo, gerando centenas de caminhos de solução, com um supervisor classificando os melhores, semelhante ao brainstorming humano.
2. Técnicas Avançadas de Treinamento
O Gemini Deep Think foi ajustado em um corpus de 100.000 soluções de fóruns de matemática, arXiv e conjuntos de problemas universitários, com mentores humanos filtrando erros. O aprendizado por reforço com recompensas graduais para sublemas verificados guiou o modelo para demonstrações concisas. O treinamento durou três meses, usando 25 milhões de horas de TPU.
3. Poder de Processamento Paralelo
A paralelização foi crucial, com várias ramificações de raciocínio exploradas simultaneamente. Recursos foram dinamicamente alocados para caminhos promissores, especialmente eficazes para combinatória. Essa abordagem, apoiada pelos clusters TPU v5 da DeepMind, espelhou estratégias humanas como testar desigualdades antes de demonstrações completas.
Triunfo da DeepMind na IMO 2025
Para garantir justiça, a DeepMind congelou os pesos de seu modelo três semanas antes da IMO, filtrando soluções de problemas não publicados. Durante o evento, o Gemini Deep Think enfrentou seis problemas em texto simples sem acesso à internet, usando poder computacional equivalente a um laptop. Ele completou demonstrações em menos de três horas, obtendo pontuação perfeita em cinco problemas e um total de 35/42 — garantindo o ouro. As demonstrações da IA foram elogiadas como rigorosas e completas, equiparáveis aos padrões humanos.
Impacto na IA e na Matemática
O sucesso da DeepMind sinaliza o progresso da IA em direção à inteligência geral artificial (AGI), já que os problemas da IMO exigem raciocínio avançado. Para a matemática, ferramentas de IA como o Gemini Deep Think podem ajudar a explorar novos teoremas, verificar conjecturas e simplificar demonstrações, liberando matemáticos para trabalhos conceituais. No entanto, o papel da IA em educação e competições levanta questões sobre sua estrutura futura.
Perspectivas Futuras
Embora alguns desafios matemáticos permaneçam, o rápido progresso da DeepMind sugere que a IA pode em breve enfrentar grandes problemas não resolvidos. A vitória na IMO de 2025 destaca o avanço do raciocínio lógico da IA, desencadeando debates sobre se ela complementará ou redefinirá a criatividade humana na matemática.
O jogo "Xiaolongxia", da Tencent, supera as expectativas; equipe amplia capacidade em 10 vezes, pede desculpas e oferece indenização
A Tencent lançou oficialmente o WorkBuddy, um agente inteligente de IA para todos os cenários, marcando uma nova fase na corrida pela camada de aplicação de modelos de grande porte, com alta integraçã
Principal investidor da Suno: a exclusão de publicações não resolverá o problema do processo por violação de direitos autorais
A tão esperada plataforma de geração musical por IA, Suno, enfrenta uma dura batalha judicial sobre direitos autorais, e um comentário sincero de seu principal investidor pode ter dado ao lado adversá
Claude Opus 4.7 é lançado com a confiabilidade em detrimento da inteligência
A Anthropic manteve um ritmo acelerado este ano, lançando novos recursos quase a cada dois dias. O tão aguardado Claude Opus 4.7 acaba de ser lançado oficialmente e, curiosamente, a Anthropic foi dire





Lar






