opção
Lar
Notícias
A IA da DeepMind supera os medalhistas de ouro da IMO

A IA da DeepMind supera os medalhistas de ouro da IMO

10 de Abril de 2025
60

A IA mais recente do Google DeepMind, Alpageometria2, fez ondas superando o medalhista de ouro médio na solução de problemas de geometria na Olimpíada Matemática Internacional (IMO). Esta versão avançada da alfageometria lançada anteriormente, introduzida apenas em janeiro passado, supostamente resolveu 84% dos problemas de geometria nos últimos 25 anos de competições da IMO.

Você pode se perguntar por que o DeepMind está se concentrando em um concurso de matemática do ensino médio. Bem, eles acreditam que quebrar esses problemas de geometria euclidiana desafiadora pode ser um trampolim para desenvolver IA mais avançada. A solução desses problemas requer raciocínio lógico e a capacidade de navegar por vários caminhos de solução, habilidades que podem ser cruciais para futuros sistemas de IA de uso geral.

Neste verão, o DeepMind exibiu um sistema que combinou alfagometria2 com o AlphaProof, outro modelo de IA projetado para o raciocínio formal de matemática. Juntos, eles enfrentaram quatro em cada seis problemas da IMO de 2024. Essa abordagem pode potencialmente se estender além da geometria a outras áreas de matemática e ciências, como cálculos complexos de engenharia.

O alfageometria2 é alimentado por alguns componentes -chave, incluindo um modelo de idioma da família Gemini do Google e um "mecanismo simbólico". O modelo Gemini auxilia o mecanismo simbólico, que aplica regras matemáticas para encontrar soluções, na criação de provas viáveis ​​para os teoremas de geometria.

Um diagrama de geometria típico na IMO.

Um diagrama de problemas de geometria típico em um exame IMO.

Na IMO, os problemas de geometria geralmente exigem adicionar "construções" como pontos, linhas ou círculos para diagramas antes de resolvê -los. O modelo Gemini do Alpageometria2 prevê que as construções podem ser úteis, orientando o motor simbólico a fazer deduções.

Eis como funciona: o modelo Gemini sugere etapas e construções em uma linguagem matemática formal, que o mecanismo verifica a consistência lógica. O Alphageometria2 usa um algoritmo de pesquisa para explorar vários caminhos de solução simultaneamente e armazena achados potencialmente úteis em uma base de conhecimento compartilhada.

Um problema é considerado "resolvido" quando o alfageometria2 combina as sugestões do modelo Gemini com os princípios conhecidos do motor simbólico para formar uma prova completa.

Devido à escassez de dados utilizáveis ​​de treinamento em geometria, o DeepMind criou dados sintéticos para treinar o modelo de linguagem do alfageometria2, gerando mais de 300 milhões de teoremas e provas de complexidade variável.

A equipe DeepMind testou o alfageometria2 em 45 problemas de geometria de competições de IMO que abrangem de 2000 a 2024, que elas expandiram em 50 problemas. Alpageometria2 resolveu 42 destes, superando a pontuação média do medalhista de ouro de 40,9.

No entanto, o alfageometria2 tem suas limitações. Ele luta com problemas que envolvem um número variável de pontos, equações não lineares e desigualdades. Embora não seja a primeira IA a atingir o desempenho no nível da medalha de ouro na geometria, é o primeiro a fazê-lo com um conjunto de problemas tão grande.

Quando confrontado com um conjunto mais difícil de 29 problemas indicados pela IMO que ainda não apareceram em competições, o alfageometria2 só poderia resolver 20.

É provável que os resultados do estudo desencadearão ainda mais a melhor abordagem para a construção de sistemas de IA. Devemos nos concentrar na manipulação de símbolos, onde a IA usa regras para manipular símbolos que representam o conhecimento ou em redes neurais, que imitam a estrutura do cérebro humano e aprendem com os dados?

O alfageometria2 adota uma abordagem híbrida, combinando a arquitetura de rede neural do modelo Gemini com o motor simbólico baseado em regras.

Os defensores das redes neurais argumentam que o comportamento inteligente pode emergir de grandes quantidades de dados e poder de computação. Por outro lado, os proponentes simbólicos da IA ​​acreditam que é mais adequado para codificar conhecimento, raciocínio por meio de cenários complexos e explicar soluções.

Vince Conitzer, professor de Ciência da Computação da Universidade Carnegie Mellon especializado em IA, comentou o contraste entre o progresso impressionante em benchmarks como a IMO e as lutas em andamento dos modelos de idiomas com problemas de senso comum. Ele enfatizou a necessidade de entender melhor esses sistemas e os riscos que eles representam.

Alphageometria2 sugere que a combinação de manipulação de símbolos e redes neurais pode ser um caminho promissor na busca pela IA generalizável. Curiosamente, a equipe DeepMind descobriu que o modelo de linguagem do Alpageometria2 poderia gerar soluções parciais para problemas sem a ajuda do mecanismo simbólico, sugerindo o potencial de modelos de idiomas se tornarem auto-suficientes no futuro.

No entanto, a equipe observou que até que a velocidade do modelo de idioma melhore e as alucinações sejam resolvidas, ferramentas como motores simbólicos permanecerão essenciais para aplicações de matemática.

Artigo relacionado
억만장자들이 이번 주 AI 업데이트에서 일자리 자동화에 대해 논의하다 억만장자들이 이번 주 AI 업데이트에서 일자리 자동화에 대해 논의하다 안녕하세요, TechCrunch의 AI 뉴스레터에 다시 오신 것을 환영합니다! 아직 구독하지 않으셨다면, 매주 수요일마다 받은 편지함으로 바로 배달받을 수 있도록 여기를 클릭해 구독하세요.지난주에는 잠시 쉬었지만, 그럴만한 이유가 있었습니다—중국의 AI 회사 DeepSeek의 갑작스러운 급부상 덕분에 AI 뉴스 사이클이 뜨거웠습니다. 정신없는 시간이였지만,
NotebookLM 앱 출시: AI 기반 지식 도구 NotebookLM 앱 출시: AI 기반 지식 도구 NotebookLM 모바일 출시: 이제 Android와 iOS에서 만나는 AI 연구 보조 도구NotebookLM에 대한 여러분의 뜨거운 반응에 깊이 감사드립니다. 수백만 사용자가 복잡한 정보를 이해하는 필수 도구로 NotebookLM을 선택해주셨습니다. 하지만 가장 많이 받은 요청은 바로 "언제 모바일에서 사용할 수 있나
Imagen 4: 구글 최신 AI 이미지 생성기 Imagen 4: 구글 최신 AI 이미지 생성기 구글이 최신 이미지 생성 AI 모델 '이마젠 4(Imagen 4)'를 공개하며 전작 대비 향상된 시각적 경험을 약속했습니다. 이번 주 초 구글 I/O 2025에서 발표된 이 신형 모델은 품질과 다용도성 측면에서 큰 도약으로 평가받고 있습니다. 구글에 따르면 이마젠 4는 직물 표면, 물방울, 동물 털 같은 정교한 디테일 구
Comentários (25)
0/200
HarryPerez
HarryPerez 12 de Abril de 2025 à0 00:00:00 GMT

DeepMind's AlphaGeometry2 beating IMO gold medalists is mind-blowing! It's amazing to see AI tackling such complex problems. But, does it really understand geometry, or is it just pattern matching? Either way, it's a huge step forward for AI in education!

JackSanchez
JackSanchez 12 de Abril de 2025 à0 00:00:00 GMT

DeepMindのAlphaGeometry2がIMOの金メダリストを上回るなんて驚きです!AIがこんなに複雑な問題に取り組むのを見るのは素晴らしいです。でも、本当に幾何学を理解しているのか、それともただのパターンマッチングなのか?どちらにしても、教育におけるAIの大きな一歩ですね!

HenryJackson
HenryJackson 11 de Abril de 2025 à0 00:00:00 GMT

DeepMind의 AlphaGeometry2가 IMO 금메달리스트를 능가하다니 놀랍네요! AI가 이렇게 복잡한 문제를 다루는 걸 보는 건 정말 멋져요. 하지만 정말 기하학을 이해하는 건지, 아니면 단순히 패턴 매칭을 하는 건지 궁금해요. 어쨌든 교육에서의 AI 발전에 큰 걸음이에요!

HarryRoberts
HarryRoberts 11 de Abril de 2025 à0 00:00:00 GMT

O AlphaGeometry2 da DeepMind superar os medalhistas de ouro do IMO é impressionante! É incrível ver a IA lidando com problemas tão complexos. Mas, será que ela realmente entende geometria, ou é apenas correspondência de padrões? De qualquer forma, é um grande avanço para a IA na educação!

BillyRoberts
BillyRoberts 10 de Abril de 2025 à0 00:00:00 GMT

¡Que AlphaGeometry2 de DeepMind supere a los medallistas de oro del IMO es alucinante! Es increíble ver a la IA abordando problemas tan complejos. Pero, ¿realmente entiende la geometría, o solo está haciendo coincidencia de patrones? De cualquier manera, es un gran paso adelante para la IA en la educación!

AlbertHarris
AlbertHarris 14 de Abril de 2025 à0 00:00:00 GMT

DeepMind's AlphaGeometry2 is mind-blowing! It's solving geometry problems better than IMO gold medalists. I used it to help with my math homework and it was spot on! The only thing is, it's a bit too advanced for casual users like me. Still, it's a solid 4 out of 5. 📚

De volta ao topo
OR