Anthrope usó Pokémon para comparar su nuevo modelo de IA
En un movimiento sorprendente, Anthropic decidió poner a prueba su último modelo de IA, Claude 3.7 Sonnet, con el clásico juego de Game Boy, Pokémon Red. Según una publicación de blog del lunes, la compañía equipó al modelo con lo esencial: memoria, la capacidad de leer píxeles en pantalla y la habilidad para presionar botones y moverse por la pantalla del juego. Esta configuración permitió a Claude 3.7 Sonnet sumergirse en el mundo de Pokémon y seguir jugando.
Lo que distingue a Claude 3.7 Sonnet es su habilidad para el "pensamiento extendido". Similar a otros modelos como o3-mini de OpenAI y R1 de DeepSeek, puede abordar problemas complejos aumentando la potencia computacional y tomándose su tiempo para pensar las cosas a fondo.
Esta característica resultó ser un cambio de juego en Pokémon Red. Mientras que el antiguo Claude 3.0 Sonnet ni siquiera pudo salir de la zona inicial en Pallet Town, Claude 3.7 Sonnet logró derrotar a tres líderes de gimnasio y obtener sus medallas.

Créditos de la imagen: Anthropic Ahora, Anthropic no reveló detalles sobre cuánta potencia computacional se necesitó o cuánto tiempo tomó para que Claude 3.7 Sonnet alcanzara estos hitos. Solo mencionaron que el modelo realizó unas impresionantes 35,000 acciones para enfrentarse al último líder de gimnasio, Surge.La semana pasada, un investigador probó una vista previa temprana de Claude 3.7 Sonnet.
Los resultados fueron impactantes. En cuestión de horas, Claude derrotó a Brock. Días después, aplastó a Misty. Un progreso que los modelos anteriores apenas podían soñar con lograr.
Resulta que el pensamiento extendido es súper efectivo. pic.twitter.com/RspsLgj2Uf
— Anthropic (@AnthropicAI) 25 de febrero de 2025
No pasará mucho tiempo antes de que algún desarrollador astuto descubra los detalles minuciosos.
Aunque Pokémon Red pueda parecer una prueba divertida, los juegos han sido utilizados para evaluar IA durante mucho tiempo. Solo en los últimos meses, hemos visto surgir un montón de nuevas aplicaciones y plataformas para probar qué tan bien los modelos de IA pueden jugar desde Street Fighter hasta Pictionary.
Artículo relacionado
La IA Gemini de Google conquista Pokémon Azul con ayuda
El hito de la IA de Google: Conquistar una aventura clásica de PokémonEl modelo de IA más avanzado de Google parece haber logrado un notable avance en el mundo de los videojuegos: completar el título
Los debates sobre la evaluación comparativa de IA han llegado a Pokémon
Incluso el querido mundo de Pokémon no es inmune al drama que rodea los puntos de referencia de IA. Una publicación viral reciente en X provocó bastante entusiasmo, alegando que el último modelo de Géminis de Google había superado el modelo de Claude de Anthrope en la clásica trilogía de videojuegos de Pokémon. Según el Post, Géminis
Claude Opus 4.7 sale al mercado apostando por la fiabilidad por encima de la inteligencia
Anthropic ha mantenido un ritmo frenético este año, lanzando nuevas funciones casi cada dos días. El tan esperado Claude Opus 4.7 acaba de salir oficialmente al mercado y, curiosamente, Anthropic fue
Recomendaciones de temas especiales relacionados
comentario (19)
0/500
와, AI로 포켓몬을 플레이하다니 너무 신기하다 🦄 어떤 기술로 게임을 클리어했는지 궁금해요. 아마도 화면 픽셀 인식과 결정 과정을 학습하는 방식이겠죠? 이렇게 발전하다 보면 AI가 슈퍼마리오도 깰 수 있을까?
Whoa, using Pokémon Red to test Claude 3.7? That's such a nostalgic flex! I wonder how it handled the Elite Four—bet it overanalyzed every move like a pro gamer. 😎
Whoa, using Pokémon Red to test Claude 3.7? That's such a nostalgic flex! I wonder how it handles those tricky Gym battles—hope it didn't get stuck in Rock Tunnel! 😄
Whoa, using Pokémon Red to test Claude 3.7? That’s such a nostalgic flex! Makes me wonder if AI could ever master my childhood Pikachu strats. 🕹️
Usar Pokémon Red para testar o Claude 3.7 Sonnet? Isso é loucura! É legal ver a IA enfrentando jogos clássicos, mas será que consegue vencer a Elite Four? As habilidades de memória e leitura de pixels da IA são impressionantes. Talvez na próxima tentem com o Pokémon Blue! 😂
En un movimiento sorprendente, Anthropic decidió poner a prueba su último modelo de IA, Claude 3.7 Sonnet, con el clásico juego de Game Boy, Pokémon Red. Según una publicación de blog del lunes, la compañía equipó al modelo con lo esencial: memoria, la capacidad de leer píxeles en pantalla y la habilidad para presionar botones y moverse por la pantalla del juego. Esta configuración permitió a Claude 3.7 Sonnet sumergirse en el mundo de Pokémon y seguir jugando.
Lo que distingue a Claude 3.7 Sonnet es su habilidad para el "pensamiento extendido". Similar a otros modelos como o3-mini de OpenAI y R1 de DeepSeek, puede abordar problemas complejos aumentando la potencia computacional y tomándose su tiempo para pensar las cosas a fondo.
Esta característica resultó ser un cambio de juego en Pokémon Red. Mientras que el antiguo Claude 3.0 Sonnet ni siquiera pudo salir de la zona inicial en Pallet Town, Claude 3.7 Sonnet logró derrotar a tres líderes de gimnasio y obtener sus medallas.

La semana pasada, un investigador probó una vista previa temprana de Claude 3.7 Sonnet.
Los resultados fueron impactantes. En cuestión de horas, Claude derrotó a Brock. Días después, aplastó a Misty. Un progreso que los modelos anteriores apenas podían soñar con lograr.
Resulta que el pensamiento extendido es súper efectivo. pic.twitter.com/RspsLgj2Uf
— Anthropic (@AnthropicAI) 25 de febrero de 2025
No pasará mucho tiempo antes de que algún desarrollador astuto descubra los detalles minuciosos.
Aunque Pokémon Red pueda parecer una prueba divertida, los juegos han sido utilizados para evaluar IA durante mucho tiempo. Solo en los últimos meses, hemos visto surgir un montón de nuevas aplicaciones y plataformas para probar qué tan bien los modelos de IA pueden jugar desde Street Fighter hasta Pictionary.
La IA Gemini de Google conquista Pokémon Azul con ayuda
El hito de la IA de Google: Conquistar una aventura clásica de PokémonEl modelo de IA más avanzado de Google parece haber logrado un notable avance en el mundo de los videojuegos: completar el título
Los debates sobre la evaluación comparativa de IA han llegado a Pokémon
Incluso el querido mundo de Pokémon no es inmune al drama que rodea los puntos de referencia de IA. Una publicación viral reciente en X provocó bastante entusiasmo, alegando que el último modelo de Géminis de Google había superado el modelo de Claude de Anthrope en la clásica trilogía de videojuegos de Pokémon. Según el Post, Géminis
Claude Opus 4.7 sale al mercado apostando por la fiabilidad por encima de la inteligencia
Anthropic ha mantenido un ritmo frenético este año, lanzando nuevas funciones casi cada dos días. El tan esperado Claude Opus 4.7 acaba de salir oficialmente al mercado y, curiosamente, Anthropic fue
와, AI로 포켓몬을 플레이하다니 너무 신기하다 🦄 어떤 기술로 게임을 클리어했는지 궁금해요. 아마도 화면 픽셀 인식과 결정 과정을 학습하는 방식이겠죠? 이렇게 발전하다 보면 AI가 슈퍼마리오도 깰 수 있을까?
Whoa, using Pokémon Red to test Claude 3.7? That's such a nostalgic flex! I wonder how it handled the Elite Four—bet it overanalyzed every move like a pro gamer. 😎
Whoa, using Pokémon Red to test Claude 3.7? That's such a nostalgic flex! I wonder how it handles those tricky Gym battles—hope it didn't get stuck in Rock Tunnel! 😄
Whoa, using Pokémon Red to test Claude 3.7? That’s such a nostalgic flex! Makes me wonder if AI could ever master my childhood Pikachu strats. 🕹️
Usar Pokémon Red para testar o Claude 3.7 Sonnet? Isso é loucura! É legal ver a IA enfrentando jogos clássicos, mas será que consegue vencer a Elite Four? As habilidades de memória e leitura de pixels da IA são impressionantes. Talvez na próxima tentem com o Pokémon Blue! 😂





Hogar






