opção
Lar
Notícias
Anthrópico usou Pokémon para comparar seu mais novo modelo de IA

Anthrópico usou Pokémon para comparar seu mais novo modelo de IA

10 de Abril de 2025
313

Num movimento surpreendente, a Anthropic decidiu testar seu mais recente modelo de IA, Claude 3.7 Sonnet, com o clássico jogo de Game Boy, Pokémon Red. De acordo com um post de blog publicado na segunda-feira, a empresa equipou o modelo com o essencial: memória, a capacidade de ler pixels na tela e o poder de pressionar botões e se mover pela tela do jogo. Essa configuração permitiu que o Claude 3.7 Sonnet mergulhasse no mundo de Pokémon e continuasse jogando.

O que diferencia o Claude 3.7 Sonnet é sua habilidade para "pensamento estendido". Semelhante a outros modelos como o o3-mini da OpenAI e o R1 da DeepSeek, ele pode enfrentar problemas difíceis aumentando a potência computacional e tomando seu tempo para refletir sobre as coisas.

Esse recurso provou ser um divisor de águas em Pokémon Red. Enquanto o antigo Claude 3.0 Sonnet não conseguia nem sair da área inicial em Pallet Town, o Claude 3.7 Sonnet conseguiu derrotar três líderes de ginásio e conquistar suas insígnias.

Anthropic Pokémon Red

Créditos da Imagem: Anthropic
Agora, a Anthropic não revelou exatamente quanta potência computacional foi necessária ou quanto tempo levou para o Claude 3.7 Sonnet alcançar esses marcos. Eles apenas mencionaram que o modelo realizou impressionantes 35.000 ações para enfrentar o último líder de ginásio, Surge.

Na última semana, um pesquisador experimentou uma prévia inicial do Claude 3.7 Sonnet.

Os resultados foram impressionantes. Em poucas horas, Claude derrotou Brock. Dias depois, ele arrasou Misty. Progresso que os modelos mais antigos tinham pouca esperança de alcançar.

Acontece que o pensamento estendido é super eficaz. pic.twitter.com/RspsLgj2Uf

— Anthropic (@AnthropicAI) 25 de fevereiro de 2025

Não vai demorar muito até que algum desenvolvedor esperto descubra os detalhes minuciosos.

Embora Pokémon Red possa parecer um teste um tanto divertido, os jogos na verdade têm sido usados para benchmarking de IA há anos. Apenas nos últimos meses, vimos surgir uma série de novos aplicativos e plataformas para testar o quão bem os modelos de IA podem jogar desde Street Fighter até Pictionary.

Artigo relacionado
A IA Gemini do Google conquista o Pokémon Blue com assistência A IA Gemini do Google conquista o Pokémon Blue com assistência Marco da IA do Google: Conquistando uma aventura clássica de PokémonO modelo de IA mais avançado do Google parece ter alcançado um avanço notável nos jogos: completar o título Pokémon Blue, do Game Bo
Debates sobre o benchmarking da IA ​​chegaram a Pokémon Debates sobre o benchmarking da IA ​​chegaram a Pokémon Até o amado mundo dos Pokémon não é imune ao drama em torno dos benchmarks de IA. Um post viral recente em X provocou um burburinho, alegando que o mais recente modelo Gemini do Google havia ultrapassado o principal modelo de Claude do Anthropic na clássica trilogia de videogame Pokémon. De acordo com o post, Gêmeos
A Haier lança o robô exoesqueleto esportivo com IA mais leve do mundo, pesando apenas 1,75 kg A Haier lança o robô exoesqueleto esportivo com IA mais leve do mundo, pesando apenas 1,75 kg O Grupo Haier apresentou o robô exoesqueleto com inteligência artificial mais leve do mundo para esportes — o Haier Exoskeleton Robot W3. Este lançamento estabelece um novo recorde do setor em termos
Recomendações de tópicos especiais relacionados
Negócios Os melhores aplicativos de controle de despesas com IA: digitalize recibos e categorize automaticamente as despesas corporativas
Os melhores aplicativos de controle de despesas com IA: digitalize recibos e categorize automaticamente as despesas corporativas

Os melhores gerenciadores de despesas com IA de 2026: as ferramentas mais bem avaliadas para digitalizar recibos e categorizar despesas corporativas automaticamente. Descubra soluções poderosas e revolucionárias para uma gestão de despesas sem esforço, um acompanhamento financeiro preciso e uma conformidade simplificada. Nossa comparação, cuidadosamente selecionada e atualizada semanalmente, entre opções gratuitas e pagas ajuda você a encontrar a solução ideal. Aproveite ao máximo as vantagens da IA com as recomendações dos especialistas da XIX.AI.

10 ferramentas
xix.ai
Negócios As melhores ferramentas de recrutamento com IA: analise currículos e automatize o agendamento de entrevistas com candidatos
As melhores ferramentas de recrutamento com IA: analise currículos e automatize o agendamento de entrevistas com candidatos

Descubra as melhores ferramentas de recrutamento com IA de 2026 no XIX.AI. Nossa lista selecionada apresenta soluções poderosas e revolucionárias para a triagem de currículos e a automação do agendamento de entrevistas com candidatos. Compare opções gratuitas e pagas com testes práticos e rankings atualizados semanalmente. Encontre o seu assistente de contratação ideal e otimize seu processo de recrutamento hoje mesmo!

10 ferramentas
xix.ai
Produtividade Treinadores de bem-estar e concentração com IA: controle o esgotamento e aumente os níveis de energia mental
Treinadores de bem-estar e concentração com IA: controle o esgotamento e aumente os níveis de energia mental

Descubra os melhores coaches de bem-estar pessoal e concentração com IA de 2026 no XIX.AI. Nossos rankings selecionados apresentam ferramentas de ponta e revolucionárias para lidar com o esgotamento e aumentar a energia mental. Compare opções gratuitas e pagas com informações reais. Descubra hoje mesmo o caminho para atingir o máximo de produtividade e bem-estar.

10 ferramentas
xix.ai
chatbot Os melhores chatbots românticos com IA: construa relacionamentos duradouros com personalidades consistentes
Os melhores chatbots românticos com IA: construa relacionamentos duradouros com personalidades consistentes

Descubra os melhores chatbots românticos com IA de 2026 para construir relacionamentos genuínos e duradouros. Nossa lista selecionada apresenta personalidades marcantes e consistentes, comparações entre versões gratuitas e pagas, além de testes práticos. Encontre seu companheiro ideal e comece a construir seu relacionamento hoje mesmo no XIX.AI.

10 ferramentas
xix.ai
Educação e Aprendizagem Os melhores mentores em ciência de dados e inteligência artificial: domínio avançado em SQL, Pandas e fluxos de trabalho de aprendizado de máquina
Os melhores mentores em ciência de dados e inteligência artificial: domínio avançado em SQL, Pandas e fluxos de trabalho de aprendizado de máquina

Descubra os melhores mentores em ciência de dados com IA para 2026, que o ajudarão a dominar SQL, Pandas e fluxos de trabalho de aprendizado de máquina. Conheça nossa seleção cuidadosamente elaborada e altamente avaliada no XIX.AI para obter orientações poderosas e revolucionárias. Compare opções gratuitas e pagas com informações valiosas da prática real. Domine a ciência de dados hoje mesmo.

10 ferramentas
xix.ai
chatbot Os melhores treinadores de paquera e conversação com IA: melhore seu carisma social e sua autoconfiança em tempo real
Os melhores treinadores de paquera e conversação com IA: melhore seu carisma social e sua autoconfiança em tempo real

Descubra os melhores treinadores de conversação e paquera com IA de 2026 no XIX.AI. Nossa seleção cuidadosamente escolhida e com as melhores avaliações ajuda você a desenvolver carisma social e confiança em tempo real. Explore ferramentas imperdíveis e revolucionárias, com comparações entre versões gratuitas e pagas e rankings atualizados semanalmente. Descubra hoje mesmo o seu diferencial social.

10 ferramentas
xix.ai
Comentários (19)
0/500
GaryWilson
GaryWilson 29 de Outubro de 2025 à10 18:31:10 WET

와, AI로 포켓몬을 플레이하다니 너무 신기하다 🦄 어떤 기술로 게임을 클리어했는지 궁금해요. 아마도 화면 픽셀 인식과 결정 과정을 학습하는 방식이겠죠? 이렇게 발전하다 보면 AI가 슈퍼마리오도 깰 수 있을까?

BillyAdams
BillyAdams 27 de Agosto de 2025 à25 13:59:25 WEST

Whoa, using Pokémon Red to test Claude 3.7? That's such a nostalgic flex! I wonder how it handled the Elite Four—bet it overanalyzed every move like a pro gamer. 😎

FrankSanchez
FrankSanchez 11 de Agosto de 2025 à2 18:01:02 WEST

Whoa, using Pokémon Red to test Claude 3.7? That's such a nostalgic flex! I wonder how it handles those tricky Gym battles—hope it didn't get stuck in Rock Tunnel! 😄

PaulSanchez
PaulSanchez 23 de Julho de 2025 à29 05:59:29 WEST

Whoa, using Pokémon Red to test Claude 3.7? That’s such a nostalgic flex! Makes me wonder if AI could ever master my childhood Pikachu strats. 🕹️

LawrenceLopez
LawrenceLopez 22 de Abril de 2025 à7 05:33:07 WEST

Usar Pokémon Red para testar o Claude 3.7 Sonnet? Isso é loucura! É legal ver a IA enfrentando jogos clássicos, mas será que consegue vencer a Elite Four? As habilidades de memória e leitura de pixels da IA são impressionantes. Talvez na próxima tentem com o Pokémon Blue! 😂

JeffreyRamirez
JeffreyRamirez 20 de Abril de 2025 à48 09:47:48 WEST

Using Pokémon Red to benchmark Claude 3.7 Sonnet? That's wild! It's cool to see AI tackling classic games, but I wonder if it can beat the Elite Four. The AI's memory and pixel reading skills are impressive, though. Maybe next time they'll try it on Pokémon Blue! 😂

OR