Anthrópico usou Pokémon para comparar seu mais novo modelo de IA
Num movimento surpreendente, a Anthropic decidiu testar seu mais recente modelo de IA, Claude 3.7 Sonnet, com o clássico jogo de Game Boy, Pokémon Red. De acordo com um post de blog publicado na segunda-feira, a empresa equipou o modelo com o essencial: memória, a capacidade de ler pixels na tela e o poder de pressionar botões e se mover pela tela do jogo. Essa configuração permitiu que o Claude 3.7 Sonnet mergulhasse no mundo de Pokémon e continuasse jogando.
O que diferencia o Claude 3.7 Sonnet é sua habilidade para "pensamento estendido". Semelhante a outros modelos como o o3-mini da OpenAI e o R1 da DeepSeek, ele pode enfrentar problemas difíceis aumentando a potência computacional e tomando seu tempo para refletir sobre as coisas.
Esse recurso provou ser um divisor de águas em Pokémon Red. Enquanto o antigo Claude 3.0 Sonnet não conseguia nem sair da área inicial em Pallet Town, o Claude 3.7 Sonnet conseguiu derrotar três líderes de ginásio e conquistar suas insígnias.

Créditos da Imagem: Anthropic Agora, a Anthropic não revelou exatamente quanta potência computacional foi necessária ou quanto tempo levou para o Claude 3.7 Sonnet alcançar esses marcos. Eles apenas mencionaram que o modelo realizou impressionantes 35.000 ações para enfrentar o último líder de ginásio, Surge.Na última semana, um pesquisador experimentou uma prévia inicial do Claude 3.7 Sonnet.
Os resultados foram impressionantes. Em poucas horas, Claude derrotou Brock. Dias depois, ele arrasou Misty. Progresso que os modelos mais antigos tinham pouca esperança de alcançar.
Acontece que o pensamento estendido é super eficaz. pic.twitter.com/RspsLgj2Uf
— Anthropic (@AnthropicAI) 25 de fevereiro de 2025
Não vai demorar muito até que algum desenvolvedor esperto descubra os detalhes minuciosos.
Embora Pokémon Red possa parecer um teste um tanto divertido, os jogos na verdade têm sido usados para benchmarking de IA há anos. Apenas nos últimos meses, vimos surgir uma série de novos aplicativos e plataformas para testar o quão bem os modelos de IA podem jogar desde Street Fighter até Pictionary.
Artigo relacionado
Debates sobre o benchmarking da IA chegaram a Pokémon
Até o amado mundo dos Pokémon não é imune ao drama em torno dos benchmarks de IA. Um post viral recente em X provocou um burburinho, alegando que o mais recente modelo Gemini do Google havia ultrapassado o principal modelo de Claude do Anthropic na clássica trilogia de videogame Pokémon. De acordo com o post, Gêmeos
Criando Livros de Colorir Alimentados por IA: Um Guia Completo
Projetar livros de colorir é uma busca recompensadora, combinando expressão artística com experiências calmantes para os usuários. No entanto, o processo pode ser trabalhoso. Felizmente, ferramentas d
Qodo Faz Parceria com Google Cloud para Oferecer Ferramentas Gratuitas de Revisão de Código por IA para Desenvolvedores
Qodo, uma startup de codificação por IA baseada em Israel focada em qualidade de código, lançou uma parceria com Google Cloud para aprimorar a integridade de software gerado por IA.À medida que as emp
Comentários (17)
0/200
FrankSanchez
11 de Agosto de 2025 à2 18:01:02 WEST
Whoa, using Pokémon Red to test Claude 3.7? That's such a nostalgic flex! I wonder how it handles those tricky Gym battles—hope it didn't get stuck in Rock Tunnel! 😄
0
PaulSanchez
23 de Julho de 2025 à29 05:59:29 WEST
Whoa, using Pokémon Red to test Claude 3.7? That’s such a nostalgic flex! Makes me wonder if AI could ever master my childhood Pikachu strats. 🕹️
0
LawrenceLopez
22 de Abril de 2025 à7 05:33:07 WEST
Usar Pokémon Red para testar o Claude 3.7 Sonnet? Isso é loucura! É legal ver a IA enfrentando jogos clássicos, mas será que consegue vencer a Elite Four? As habilidades de memória e leitura de pixels da IA são impressionantes. Talvez na próxima tentem com o Pokémon Blue! 😂
0
JeffreyRamirez
20 de Abril de 2025 à48 09:47:48 WEST
Using Pokémon Red to benchmark Claude 3.7 Sonnet? That's wild! It's cool to see AI tackling classic games, but I wonder if it can beat the Elite Four. The AI's memory and pixel reading skills are impressive, though. Maybe next time they'll try it on Pokémon Blue! 😂
0
FrankSmith
17 de Abril de 2025 à49 15:27:49 WEST
포켓몬으로 AI를 테스트하다니 신기해! 클라우드 3.7 소넷이 포켓몬 레드를 플레이하는 건 멋지지만 좀 이상해. 화면 픽셀을 읽고 기억하는 건 대단한데, 정말 모든 포켓몬을 잡을 수 있을까? 🤔 재미있는 아이디어야, 하지만 실제 생활에서 얼마나 유용할지 궁금해. 다 잡아야지! 😂
0
JoeLee
17 de Abril de 2025 à28 02:15:28 WEST
¿Usar Pokémon para probar IA? ¡Eso es una locura! Que Claude 3.7 Sonnet juegue a Pokémon Rojo es genial, pero un poco raro. Es increíble que pueda leer píxeles de la pantalla y recordar cosas, pero ¿realmente atrapa a todos? 🤔 Idea divertida, pero me pregunto qué tan práctico es en la vida real. ¡A atraparlos a todos, verdad? 😂
0
Num movimento surpreendente, a Anthropic decidiu testar seu mais recente modelo de IA, Claude 3.7 Sonnet, com o clássico jogo de Game Boy, Pokémon Red. De acordo com um post de blog publicado na segunda-feira, a empresa equipou o modelo com o essencial: memória, a capacidade de ler pixels na tela e o poder de pressionar botões e se mover pela tela do jogo. Essa configuração permitiu que o Claude 3.7 Sonnet mergulhasse no mundo de Pokémon e continuasse jogando.
O que diferencia o Claude 3.7 Sonnet é sua habilidade para "pensamento estendido". Semelhante a outros modelos como o o3-mini da OpenAI e o R1 da DeepSeek, ele pode enfrentar problemas difíceis aumentando a potência computacional e tomando seu tempo para refletir sobre as coisas.
Esse recurso provou ser um divisor de águas em Pokémon Red. Enquanto o antigo Claude 3.0 Sonnet não conseguia nem sair da área inicial em Pallet Town, o Claude 3.7 Sonnet conseguiu derrotar três líderes de ginásio e conquistar suas insígnias.
Na última semana, um pesquisador experimentou uma prévia inicial do Claude 3.7 Sonnet.
Os resultados foram impressionantes. Em poucas horas, Claude derrotou Brock. Dias depois, ele arrasou Misty. Progresso que os modelos mais antigos tinham pouca esperança de alcançar.
Acontece que o pensamento estendido é super eficaz. pic.twitter.com/RspsLgj2Uf
— Anthropic (@AnthropicAI) 25 de fevereiro de 2025
Não vai demorar muito até que algum desenvolvedor esperto descubra os detalhes minuciosos.
Embora Pokémon Red possa parecer um teste um tanto divertido, os jogos na verdade têm sido usados para benchmarking de IA há anos. Apenas nos últimos meses, vimos surgir uma série de novos aplicativos e plataformas para testar o quão bem os modelos de IA podem jogar desde Street Fighter até Pictionary.




Whoa, using Pokémon Red to test Claude 3.7? That's such a nostalgic flex! I wonder how it handles those tricky Gym battles—hope it didn't get stuck in Rock Tunnel! 😄




Whoa, using Pokémon Red to test Claude 3.7? That’s such a nostalgic flex! Makes me wonder if AI could ever master my childhood Pikachu strats. 🕹️




Usar Pokémon Red para testar o Claude 3.7 Sonnet? Isso é loucura! É legal ver a IA enfrentando jogos clássicos, mas será que consegue vencer a Elite Four? As habilidades de memória e leitura de pixels da IA são impressionantes. Talvez na próxima tentem com o Pokémon Blue! 😂




Using Pokémon Red to benchmark Claude 3.7 Sonnet? That's wild! It's cool to see AI tackling classic games, but I wonder if it can beat the Elite Four. The AI's memory and pixel reading skills are impressive, though. Maybe next time they'll try it on Pokémon Blue! 😂




포켓몬으로 AI를 테스트하다니 신기해! 클라우드 3.7 소넷이 포켓몬 레드를 플레이하는 건 멋지지만 좀 이상해. 화면 픽셀을 읽고 기억하는 건 대단한데, 정말 모든 포켓몬을 잡을 수 있을까? 🤔 재미있는 아이디어야, 하지만 실제 생활에서 얼마나 유용할지 궁금해. 다 잡아야지! 😂




¿Usar Pokémon para probar IA? ¡Eso es una locura! Que Claude 3.7 Sonnet juegue a Pokémon Rojo es genial, pero un poco raro. Es increíble que pueda leer píxeles de la pantalla y recordar cosas, pero ¿realmente atrapa a todos? 🤔 Idea divertida, pero me pregunto qué tan práctico es en la vida real. ¡A atraparlos a todos, verdad? 😂












