option
Maison
Nouvelles
Anthropic a utilisé Pokémon pour comparer son nouveau modèle d'IA

Anthropic a utilisé Pokémon pour comparer son nouveau modèle d'IA

10 avril 2025
138

Dans une décision surprenante, Anthropic a décidé de mettre à l'épreuve son dernier modèle d'IA, Claude 3.7 Sonnet, avec le jeu classique de Game Boy, Pokémon Rouge. Selon un article de blog publié lundi, l'entreprise a équipé le modèle des éléments essentiels : mémoire, capacité à lire les pixels de l'écran, et la possibilité d'appuyer sur des boutons et de se déplacer sur l'écran du jeu. Cette configuration a permis à Claude 3.7 Sonnet de plonger dans l'univers de Pokémon et de continuer à jouer.

Ce qui distingue Claude 3.7 Sonnet est son aptitude à la « pensée prolongée ». Similaire à d'autres modèles comme l'o3-mini d'OpenAI et le R1 de DeepSeek, il peut résoudre des problèmes complexes en augmentant la puissance de calcul et en prenant son temps pour réfléchir.

Cette fonctionnalité s'est révélée déterminante dans Pokémon Rouge. Alors que l'ancien Claude 3.0 Sonnet n'arrivait même pas à sortir de la zone de départ à Pallet Town, Claude 3.7 Sonnet a réussi à vaincre trois champions d'arène et à obtenir leurs badges.

Anthropic Pokémon Rouge

Crédits image : Anthropic
Maintenant, Anthropic n'a pas révélé précisément quelle quantité de puissance de calcul était nécessaire ni combien de temps il a fallu à Claude 3.7 Sonnet pour atteindre ces étapes. Ils ont simplement mentionné que le modèle a effectué pas moins de 35 000 actions pour affronter le dernier champion d'arène, Surge.

La semaine dernière, un chercheur a testé une version préliminaire de Claude 3.7 Sonnet.

Les résultats étaient frappants. En quelques heures, Claude a vaincu Brock. Quelques jours plus tard, il a écrasé Misty. Des progrès que les modèles plus anciens avaient peu de chances d'atteindre.

Il s'avère que la pensée prolongée est super efficace. pic.twitter.com/RspsLgj2Uf

— Anthropic (@AnthropicAI) 25 février 2025

Il ne faudra pas longtemps avant qu'un développeur astucieux découvre les détails précis.

Bien que Pokémon Rouge puisse sembler un test ludique, les jeux sont en réalité utilisés depuis longtemps pour évaluer les performances des IA. Au cours des derniers mois, nous avons vu apparaître de nombreuses nouvelles applications et plateformes pour tester la capacité des modèles d'IA à jouer à tout, de Street Fighter à Pictionary.

Article connexe
Les débats sur l'analyse comparative de l'IA ont atteint Pokémon Les débats sur l'analyse comparative de l'IA ont atteint Pokémon Même le monde bien-aimé de Pokémon n'est pas à l'abri du drame entourant les repères de l'IA. Un récent post viral sur X a suscité tout à fait le buzz, affirmant que le dernier modèle de Gémeaux de Google avait dépassé le principal modèle Claude d'Anthropic dans la trilogie classique du jeu vidéo Pokémon. Selon le poste, Gemini
Création de livres de coloriage alimentés par l'IA : Un guide complet Création de livres de coloriage alimentés par l'IA : Un guide complet Concevoir des livres de coloriage est une entreprise gratifiante, combinant expression artistique et expériences apaisantes pour les utilisateurs. Cependant, le processus peut être laborieux. Heureuse
Qodo s'associe à Google Cloud pour offrir des outils gratuits d'examen de code par IA aux développeurs Qodo s'associe à Google Cloud pour offrir des outils gratuits d'examen de code par IA aux développeurs Qodo, une startup israélienne spécialisée dans le codage par IA et axée sur la qualité du code, a lancé un partenariat avec Google Cloud pour améliorer l'intégrité des logiciels générés par IA.À mesur
commentaires (17)
0/200
FrankSanchez
FrankSanchez 11 août 2025 19:01:02 UTC+02:00

Whoa, using Pokémon Red to test Claude 3.7? That's such a nostalgic flex! I wonder how it handles those tricky Gym battles—hope it didn't get stuck in Rock Tunnel! 😄

PaulSanchez
PaulSanchez 23 juillet 2025 06:59:29 UTC+02:00

Whoa, using Pokémon Red to test Claude 3.7? That’s such a nostalgic flex! Makes me wonder if AI could ever master my childhood Pikachu strats. 🕹️

LawrenceLopez
LawrenceLopez 22 avril 2025 06:33:07 UTC+02:00

Usar Pokémon Red para testar o Claude 3.7 Sonnet? Isso é loucura! É legal ver a IA enfrentando jogos clássicos, mas será que consegue vencer a Elite Four? As habilidades de memória e leitura de pixels da IA são impressionantes. Talvez na próxima tentem com o Pokémon Blue! 😂

JeffreyRamirez
JeffreyRamirez 20 avril 2025 10:47:48 UTC+02:00

Using Pokémon Red to benchmark Claude 3.7 Sonnet? That's wild! It's cool to see AI tackling classic games, but I wonder if it can beat the Elite Four. The AI's memory and pixel reading skills are impressive, though. Maybe next time they'll try it on Pokémon Blue! 😂

FrankSmith
FrankSmith 17 avril 2025 16:27:49 UTC+02:00

포켓몬으로 AI를 테스트하다니 신기해! 클라우드 3.7 소넷이 포켓몬 레드를 플레이하는 건 멋지지만 좀 이상해. 화면 픽셀을 읽고 기억하는 건 대단한데, 정말 모든 포켓몬을 잡을 수 있을까? 🤔 재미있는 아이디어야, 하지만 실제 생활에서 얼마나 유용할지 궁금해. 다 잡아야지! 😂

JoeLee
JoeLee 17 avril 2025 03:15:28 UTC+02:00

¿Usar Pokémon para probar IA? ¡Eso es una locura! Que Claude 3.7 Sonnet juegue a Pokémon Rojo es genial, pero un poco raro. Es increíble que pueda leer píxeles de la pantalla y recordar cosas, pero ¿realmente atrapa a todos? 🤔 Idea divertida, pero me pregunto qué tan práctico es en la vida real. ¡A atraparlos a todos, verdad? 😂

Retour en haut
OR