opción
Hogar
Noticias
Anthrope usó Pokémon para comparar su nuevo modelo de IA

Anthrope usó Pokémon para comparar su nuevo modelo de IA

10 de abril de 2025
138

En un movimiento sorprendente, Anthropic decidió poner a prueba su último modelo de IA, Claude 3.7 Sonnet, con el clásico juego de Game Boy, Pokémon Red. Según una publicación de blog del lunes, la compañía equipó al modelo con lo esencial: memoria, la capacidad de leer píxeles en pantalla y la habilidad para presionar botones y moverse por la pantalla del juego. Esta configuración permitió a Claude 3.7 Sonnet sumergirse en el mundo de Pokémon y seguir jugando.

Lo que distingue a Claude 3.7 Sonnet es su habilidad para el "pensamiento extendido". Similar a otros modelos como o3-mini de OpenAI y R1 de DeepSeek, puede abordar problemas complejos aumentando la potencia computacional y tomándose su tiempo para pensar las cosas a fondo.

Esta característica resultó ser un cambio de juego en Pokémon Red. Mientras que el antiguo Claude 3.0 Sonnet ni siquiera pudo salir de la zona inicial en Pallet Town, Claude 3.7 Sonnet logró derrotar a tres líderes de gimnasio y obtener sus medallas.

Anthropic Pokémon Red

Créditos de la imagen: Anthropic
Ahora, Anthropic no reveló detalles sobre cuánta potencia computacional se necesitó o cuánto tiempo tomó para que Claude 3.7 Sonnet alcanzara estos hitos. Solo mencionaron que el modelo realizó unas impresionantes 35,000 acciones para enfrentarse al último líder de gimnasio, Surge.

La semana pasada, un investigador probó una vista previa temprana de Claude 3.7 Sonnet.

Los resultados fueron impactantes. En cuestión de horas, Claude derrotó a Brock. Días después, aplastó a Misty. Un progreso que los modelos anteriores apenas podían soñar con lograr.

Resulta que el pensamiento extendido es súper efectivo. pic.twitter.com/RspsLgj2Uf

— Anthropic (@AnthropicAI) 25 de febrero de 2025

No pasará mucho tiempo antes de que algún desarrollador astuto descubra los detalles minuciosos.

Aunque Pokémon Red pueda parecer una prueba divertida, los juegos han sido utilizados para evaluar IA durante mucho tiempo. Solo en los últimos meses, hemos visto surgir un montón de nuevas aplicaciones y plataformas para probar qué tan bien los modelos de IA pueden jugar desde Street Fighter hasta Pictionary.

Artículo relacionado
Los debates sobre la evaluación comparativa de IA han llegado a Pokémon Los debates sobre la evaluación comparativa de IA han llegado a Pokémon Incluso el querido mundo de Pokémon no es inmune al drama que rodea los puntos de referencia de IA. Una publicación viral reciente en X provocó bastante entusiasmo, alegando que el último modelo de Géminis de Google había superado el modelo de Claude de Anthrope en la clásica trilogía de videojuegos de Pokémon. Según el Post, Géminis
Creación de Libros para Colorear Impulsados por IA: Una Guía Completa Creación de Libros para Colorear Impulsados por IA: Una Guía Completa Diseñar libros para colorear es una actividad gratificante que combina la expresión artística con experiencias relajantes para los usuarios. Sin embargo, el proceso puede ser intensivo en trabajo. Afo
Qodo se asocia con Google Cloud para ofrecer herramientas gratuitas de revisión de código de IA para desarrolladores Qodo se asocia con Google Cloud para ofrecer herramientas gratuitas de revisión de código de IA para desarrolladores Qodo, una startup de codificación de IA con sede en Israel enfocada en la calidad del código, ha iniciado una asociación con Google Cloud para mejorar la integridad del software generado por IA.A medi
comentario (17)
0/200
FrankSanchez
FrankSanchez 11 de agosto de 2025 19:01:02 GMT+02:00

Whoa, using Pokémon Red to test Claude 3.7? That's such a nostalgic flex! I wonder how it handles those tricky Gym battles—hope it didn't get stuck in Rock Tunnel! 😄

PaulSanchez
PaulSanchez 23 de julio de 2025 06:59:29 GMT+02:00

Whoa, using Pokémon Red to test Claude 3.7? That’s such a nostalgic flex! Makes me wonder if AI could ever master my childhood Pikachu strats. 🕹️

LawrenceLopez
LawrenceLopez 22 de abril de 2025 06:33:07 GMT+02:00

Usar Pokémon Red para testar o Claude 3.7 Sonnet? Isso é loucura! É legal ver a IA enfrentando jogos clássicos, mas será que consegue vencer a Elite Four? As habilidades de memória e leitura de pixels da IA são impressionantes. Talvez na próxima tentem com o Pokémon Blue! 😂

JeffreyRamirez
JeffreyRamirez 20 de abril de 2025 10:47:48 GMT+02:00

Using Pokémon Red to benchmark Claude 3.7 Sonnet? That's wild! It's cool to see AI tackling classic games, but I wonder if it can beat the Elite Four. The AI's memory and pixel reading skills are impressive, though. Maybe next time they'll try it on Pokémon Blue! 😂

FrankSmith
FrankSmith 17 de abril de 2025 16:27:49 GMT+02:00

포켓몬으로 AI를 테스트하다니 신기해! 클라우드 3.7 소넷이 포켓몬 레드를 플레이하는 건 멋지지만 좀 이상해. 화면 픽셀을 읽고 기억하는 건 대단한데, 정말 모든 포켓몬을 잡을 수 있을까? 🤔 재미있는 아이디어야, 하지만 실제 생활에서 얼마나 유용할지 궁금해. 다 잡아야지! 😂

JoeLee
JoeLee 17 de abril de 2025 03:15:28 GMT+02:00

¿Usar Pokémon para probar IA? ¡Eso es una locura! Que Claude 3.7 Sonnet juegue a Pokémon Rojo es genial, pero un poco raro. Es increíble que pueda leer píxeles de la pantalla y recordar cosas, pero ¿realmente atrapa a todos? 🤔 Idea divertida, pero me pregunto qué tan práctico es en la vida real. ¡A atraparlos a todos, verdad? 😂

Volver arriba
OR