Anthropic a utilisé Pokémon pour comparer son nouveau modèle d'IA

Maison

Nouvelles

10 avril 2025

AvaHill

313

# pokemon

Dans une décision surprenante, Anthropic a décidé de mettre à l'épreuve son dernier modèle d'IA, Claude 3.7 Sonnet, avec le jeu classique de Game Boy, Pokémon Rouge. Selon un article de blog publié lundi, l'entreprise a équipé le modèle des éléments essentiels : mémoire, capacité à lire les pixels de l'écran, et la possibilité d'appuyer sur des boutons et de se déplacer sur l'écran du jeu. Cette configuration a permis à Claude 3.7 Sonnet de plonger dans l'univers de Pokémon et de continuer à jouer.

Ce qui distingue Claude 3.7 Sonnet est son aptitude à la « pensée prolongée ». Similaire à d'autres modèles comme l'o3-mini d'OpenAI et le R1 de DeepSeek, il peut résoudre des problèmes complexes en augmentant la puissance de calcul et en prenant son temps pour réfléchir.

Cette fonctionnalité s'est révélée déterminante dans Pokémon Rouge. Alors que l'ancien Claude 3.0 Sonnet n'arrivait même pas à sortir de la zone de départ à Pallet Town, Claude 3.7 Sonnet a réussi à vaincre trois champions d'arène et à obtenir leurs badges.

Anthropic Pokémon Rouge

Crédits image : Anthropic

Maintenant, Anthropic n'a pas révélé précisément quelle quantité de puissance de calcul était nécessaire ni combien de temps il a fallu à Claude 3.7 Sonnet pour atteindre ces étapes. Ils ont simplement mentionné que le modèle a effectué pas moins de 35 000 actions pour affronter le dernier champion d'arène, Surge.

La semaine dernière, un chercheur a testé une version préliminaire de Claude 3.7 Sonnet.
Les résultats étaient frappants. En quelques heures, Claude a vaincu Brock. Quelques jours plus tard, il a écrasé Misty. Des progrès que les modèles plus anciens avaient peu de chances d'atteindre.
Il s'avère que la pensée prolongée est super efficace. pic.twitter.com/RspsLgj2Uf
— Anthropic (@AnthropicAI) 25 février 2025

Il ne faudra pas longtemps avant qu'un développeur astucieux découvre les détails précis.

Bien que Pokémon Rouge puisse sembler un test ludique, les jeux sont en réalité utilisés depuis longtemps pour évaluer les performances des IA. Au cours des derniers mois, nous avons vu apparaître de nombreuses nouvelles applications et plateformes pour tester la capacité des modèles d'IA à jouer à tout, de Street Fighter à Pictionary.

Article connexe

L'IA Gemini de Google vainc Pokémon Bleu avec de l'aide L'étape clé de l'IA de Google : La conquête d'une aventure Pokémon classiqueLe modèle d'IA le plus avancé de Google semble avoir réalisé une percée notable dans le domaine des jeux vidéo : il a termin

Les débats sur l'analyse comparative de l'IA ont atteint Pokémon Même le monde bien-aimé de Pokémon n'est pas à l'abri du drame entourant les repères de l'IA. Un récent post viral sur X a suscité tout à fait le buzz, affirmant que le dernier modèle de Gémeaux de Google avait dépassé le principal modèle Claude d'Anthropic dans la trilogie classique du jeu vidéo Pokémon. Selon le poste, Gemini

DeepSeek Code s'apprête à être lancé Alors que les technologies d'IA progressent à grands pas, DeepSeek se trouve à un tournant passionnant. L'entreprise spécialisée dans l'IA a récemment annoncé avoir levé plus de 70 milliards de yuans.

Recommandations de sujets spéciaux liés

Entreprise

Les meilleurs outils de recrutement basés sur l'IA : triez les CV et automatisez la planification des entretiens avec les candidats

Découvrez les meilleurs outils de recrutement basés sur l'IA de 2026 sur XIX.AI. Notre sélection propose des solutions performantes et révolutionnaires pour l'analyse des CV et l'automatisation de la planification des entretiens avec les candidats. Comparez les options gratuites et payantes grâce à des tests concrets et à des classements mis à jour chaque semaine. Trouvez l'assistant de recrutement idéal et optimisez votre processus de recrutement dès aujourd'hui !

10 outils

xix.ai

Productivité

Coaches IA dédiés au bien-être et à la concentration : gérer l'épuisement professionnel et booster son énergie mentale

Découvrez sur XIX.AI les meilleurs coachs IA de 2026 spécialisés dans le bien-être personnel et la concentration. Notre classement, soigneusement établi, présente les outils les mieux notés et les plus innovants pour gérer le surmenage et booster votre énergie mentale. Comparez les options gratuites et payantes grâce à des avis concrets. Ouvrez-vous dès aujourd’hui la voie vers une productivité et un bien-être optimaux.

10 outils

xix.ai

chatbot

Les meilleurs chatbots romantiques basés sur l'IA : nouez des relations durables grâce à des personnalités cohérentes

Découvrez les meilleurs chatbots romantiques basés sur l'IA de 2026, sélectionnés pour vous aider à nouer des relations authentiques et durables. Notre sélection comprend des personnalités fortes et cohérentes, des comparaisons entre versions gratuites et payantes, ainsi que des tests en conditions réelles. Trouvez le compagnon idéal et commencez dès aujourd'hui sur XIX.AI.

10 outils

xix.ai

Éducation et apprentissage

Meilleurs mentors en science des données et intelligence artificielle : maîtrise de SQL, Pandas et des workflows d'apprentissage automatique

Découvrez les meilleurs mentors en sciences des données et en intelligence artificielle pour 2026 afin de maîtriser SQL, Pandas et les workflows d'apprentissage automatique. Explorez notre sélection soigneusement élaborée sur XIX.AI pour bénéficier d'une guidance puissante et révolutionnaire. Comparez les options gratuites et payantes en tenant compte de perspectives pratiques. Développez rapidement vos compétences en sciences des données.

10 outils

xix.ai

chatbot

Les meilleurs outils d'IA pour apprendre à flirter et à converser : renforcez votre charisme social et votre confiance en vous en temps réel

Découvrez les meilleurs outils d'entraînement au flirt et à la conversation basés sur l'IA de 2026 sur XIX.AI. Notre sélection triée sur le volet et très bien notée vous aide à développer votre charisme social et votre confiance en vous en temps réel. Découvrez des outils incontournables qui changent la donne, avec des comparaisons entre versions gratuites et payantes ainsi que des classements mis à jour chaque semaine. Développez dès aujourd'hui vos compétences sociales.

10 outils

xix.ai

code

Meilleurs outils d'IA pour les tests unitaires automatisés : générer des cas de test Jest, PyTest et JUnit en un clic

Découvrez les derniers outils d'IA hautement réputés de 2026 pour les tests unitaires automatisés. Notre sélection rigoureusement élaborée vous propose des solutions puissantes et révolutionnaires pour générer instantanément des cas de test Jest, PyTest et JUnit. Comparez les options gratuites et payantes à l'aide de tests réels et des classements mises à jour chaque semaine sur XIX.AI. Développez un avantage concurrentiel grâce à l'IA et améliorez rapidement votre productivité en développement.

10 outils

xix.ai

commentaires (19)

0/500

Veuillez vous connecter d'abord

GaryWilson

29 octobre 2025 19:31:10 UTC+01:00

와, AI로 포켓몬을 플레이하다니 너무 신기하다 🦄 어떤 기술로 게임을 클리어했는지 궁금해요. 아마도 화면 픽셀 인식과 결정 과정을 학습하는 방식이겠죠? 이렇게 발전하다 보면 AI가 슈퍼마리오도 깰 수 있을까?

BillyAdams

27 août 2025 14:59:25 UTC+02:00

Whoa, using Pokémon Red to test Claude 3.7? That's such a nostalgic flex! I wonder how it handled the Elite Four—bet it overanalyzed every move like a pro gamer. 😎

FrankSanchez

11 août 2025 19:01:02 UTC+02:00

Whoa, using Pokémon Red to test Claude 3.7? That's such a nostalgic flex! I wonder how it handles those tricky Gym battles—hope it didn't get stuck in Rock Tunnel! 😄

PaulSanchez

23 juillet 2025 06:59:29 UTC+02:00

Whoa, using Pokémon Red to test Claude 3.7? That’s such a nostalgic flex! Makes me wonder if AI could ever master my childhood Pikachu strats. 🕹️

LawrenceLopez

22 avril 2025 06:33:07 UTC+02:00

Usar Pokémon Red para testar o Claude 3.7 Sonnet? Isso é loucura! É legal ver a IA enfrentando jogos clássicos, mas será que consegue vencer a Elite Four? As habilidades de memória e leitura de pixels da IA são impressionantes. Talvez na próxima tentem com o Pokémon Blue! 😂

JeffreyRamirez

20 avril 2025 10:47:48 UTC+02:00

Using Pokémon Red to benchmark Claude 3.7 Sonnet? That's wild! It's cool to see AI tackling classic games, but I wonder if it can beat the Elite Four. The AI's memory and pixel reading skills are impressive, though. Maybe next time they'll try it on Pokémon Blue! 😂

Top nouvelles

AI Builder et Power Automate Révolutionnent la Synthèse de Documents Podcast Hosts Of NoteBookLM maintenant disponible pour les interviews La Chine dévoile ses normes nationales relatives aux robots humanoïdes et à l'intelligence incarnée L'adoption de l'IA par les entreprises plafonne, selon les données de Ramp Tutoriel Créateur d'Images Bing : Guide de Génération d'Art IA Apprenez à créer de la musique AI en utilisant votre voix: un tutoriel Suno étape par étape iMyFone MagicMic : Revue et tutoriel sur le changeur de voix AI en temps réel Meilleurs Générateurs de Vidéos IA en 2025 : Pika Labs vs Alternatives DeepSeek V4 s'impose comme une technologie multimodale révolutionnaire dans le domaine de l'IA Embodied Intelligence dévoile la première norme sectorielle visant à freiner la croissance anarchique

Plus

En vedette