Anthropic a utilisé Pokémon pour comparer son nouveau modèle d'IA
Dans une décision surprenante, Anthropic a décidé de mettre à l'épreuve son dernier modèle d'IA, Claude 3.7 Sonnet, avec le jeu classique de Game Boy, Pokémon Rouge. Selon un article de blog publié lundi, l'entreprise a équipé le modèle des éléments essentiels : mémoire, capacité à lire les pixels de l'écran, et la possibilité d'appuyer sur des boutons et de se déplacer sur l'écran du jeu. Cette configuration a permis à Claude 3.7 Sonnet de plonger dans l'univers de Pokémon et de continuer à jouer.
Ce qui distingue Claude 3.7 Sonnet est son aptitude à la « pensée prolongée ». Similaire à d'autres modèles comme l'o3-mini d'OpenAI et le R1 de DeepSeek, il peut résoudre des problèmes complexes en augmentant la puissance de calcul et en prenant son temps pour réfléchir.
Cette fonctionnalité s'est révélée déterminante dans Pokémon Rouge. Alors que l'ancien Claude 3.0 Sonnet n'arrivait même pas à sortir de la zone de départ à Pallet Town, Claude 3.7 Sonnet a réussi à vaincre trois champions d'arène et à obtenir leurs badges.

Crédits image : Anthropic Maintenant, Anthropic n'a pas révélé précisément quelle quantité de puissance de calcul était nécessaire ni combien de temps il a fallu à Claude 3.7 Sonnet pour atteindre ces étapes. Ils ont simplement mentionné que le modèle a effectué pas moins de 35 000 actions pour affronter le dernier champion d'arène, Surge.La semaine dernière, un chercheur a testé une version préliminaire de Claude 3.7 Sonnet.
Les résultats étaient frappants. En quelques heures, Claude a vaincu Brock. Quelques jours plus tard, il a écrasé Misty. Des progrès que les modèles plus anciens avaient peu de chances d'atteindre.
Il s'avère que la pensée prolongée est super efficace. pic.twitter.com/RspsLgj2Uf
— Anthropic (@AnthropicAI) 25 février 2025
Il ne faudra pas longtemps avant qu'un développeur astucieux découvre les détails précis.
Bien que Pokémon Rouge puisse sembler un test ludique, les jeux sont en réalité utilisés depuis longtemps pour évaluer les performances des IA. Au cours des derniers mois, nous avons vu apparaître de nombreuses nouvelles applications et plateformes pour tester la capacité des modèles d'IA à jouer à tout, de Street Fighter à Pictionary.
Article connexe
L'IA Gemini de Google vainc Pokémon Bleu avec de l'aide
L'étape clé de l'IA de Google : La conquête d'une aventure Pokémon classiqueLe modèle d'IA le plus avancé de Google semble avoir réalisé une percée notable dans le domaine des jeux vidéo : il a termin
Les débats sur l'analyse comparative de l'IA ont atteint Pokémon
Même le monde bien-aimé de Pokémon n'est pas à l'abri du drame entourant les repères de l'IA. Un récent post viral sur X a suscité tout à fait le buzz, affirmant que le dernier modèle de Gémeaux de Google avait dépassé le principal modèle Claude d'Anthropic dans la trilogie classique du jeu vidéo Pokémon. Selon le poste, Gemini
Principal investisseur de Suno : la suppression des publications ne comblera pas les lacunes en matière de poursuites pour violation du droit d'auteur
La plateforme de génération musicale par IA très attendue, Suno, est confrontée à une rude bataille en matière de droits d'auteur, et une remarque sans détours de son principal investisseur pourrait b
Recommandations de sujets spéciaux liés
commentaires (19)
와, AI로 포켓몬을 플레이하다니 너무 신기하다 🦄 어떤 기술로 게임을 클리어했는지 궁금해요. 아마도 화면 픽셀 인식과 결정 과정을 학습하는 방식이겠죠? 이렇게 발전하다 보면 AI가 슈퍼마리오도 깰 수 있을까?
Whoa, using Pokémon Red to test Claude 3.7? That's such a nostalgic flex! I wonder how it handled the Elite Four—bet it overanalyzed every move like a pro gamer. 😎
Whoa, using Pokémon Red to test Claude 3.7? That's such a nostalgic flex! I wonder how it handles those tricky Gym battles—hope it didn't get stuck in Rock Tunnel! 😄
Whoa, using Pokémon Red to test Claude 3.7? That’s such a nostalgic flex! Makes me wonder if AI could ever master my childhood Pikachu strats. 🕹️
Usar Pokémon Red para testar o Claude 3.7 Sonnet? Isso é loucura! É legal ver a IA enfrentando jogos clássicos, mas será que consegue vencer a Elite Four? As habilidades de memória e leitura de pixels da IA são impressionantes. Talvez na próxima tentem com o Pokémon Blue! 😂
Dans une décision surprenante, Anthropic a décidé de mettre à l'épreuve son dernier modèle d'IA, Claude 3.7 Sonnet, avec le jeu classique de Game Boy, Pokémon Rouge. Selon un article de blog publié lundi, l'entreprise a équipé le modèle des éléments essentiels : mémoire, capacité à lire les pixels de l'écran, et la possibilité d'appuyer sur des boutons et de se déplacer sur l'écran du jeu. Cette configuration a permis à Claude 3.7 Sonnet de plonger dans l'univers de Pokémon et de continuer à jouer.
Ce qui distingue Claude 3.7 Sonnet est son aptitude à la « pensée prolongée ». Similaire à d'autres modèles comme l'o3-mini d'OpenAI et le R1 de DeepSeek, il peut résoudre des problèmes complexes en augmentant la puissance de calcul et en prenant son temps pour réfléchir.
Cette fonctionnalité s'est révélée déterminante dans Pokémon Rouge. Alors que l'ancien Claude 3.0 Sonnet n'arrivait même pas à sortir de la zone de départ à Pallet Town, Claude 3.7 Sonnet a réussi à vaincre trois champions d'arène et à obtenir leurs badges.

La semaine dernière, un chercheur a testé une version préliminaire de Claude 3.7 Sonnet.
Les résultats étaient frappants. En quelques heures, Claude a vaincu Brock. Quelques jours plus tard, il a écrasé Misty. Des progrès que les modèles plus anciens avaient peu de chances d'atteindre.
Il s'avère que la pensée prolongée est super efficace. pic.twitter.com/RspsLgj2Uf
— Anthropic (@AnthropicAI) 25 février 2025
Il ne faudra pas longtemps avant qu'un développeur astucieux découvre les détails précis.
Bien que Pokémon Rouge puisse sembler un test ludique, les jeux sont en réalité utilisés depuis longtemps pour évaluer les performances des IA. Au cours des derniers mois, nous avons vu apparaître de nombreuses nouvelles applications et plateformes pour tester la capacité des modèles d'IA à jouer à tout, de Street Fighter à Pictionary.
L'IA Gemini de Google vainc Pokémon Bleu avec de l'aide
L'étape clé de l'IA de Google : La conquête d'une aventure Pokémon classiqueLe modèle d'IA le plus avancé de Google semble avoir réalisé une percée notable dans le domaine des jeux vidéo : il a termin
Les débats sur l'analyse comparative de l'IA ont atteint Pokémon
Même le monde bien-aimé de Pokémon n'est pas à l'abri du drame entourant les repères de l'IA. Un récent post viral sur X a suscité tout à fait le buzz, affirmant que le dernier modèle de Gémeaux de Google avait dépassé le principal modèle Claude d'Anthropic dans la trilogie classique du jeu vidéo Pokémon. Selon le poste, Gemini
Principal investisseur de Suno : la suppression des publications ne comblera pas les lacunes en matière de poursuites pour violation du droit d'auteur
La plateforme de génération musicale par IA très attendue, Suno, est confrontée à une rude bataille en matière de droits d'auteur, et une remarque sans détours de son principal investisseur pourrait b
와, AI로 포켓몬을 플레이하다니 너무 신기하다 🦄 어떤 기술로 게임을 클리어했는지 궁금해요. 아마도 화면 픽셀 인식과 결정 과정을 학습하는 방식이겠죠? 이렇게 발전하다 보면 AI가 슈퍼마리오도 깰 수 있을까?
Whoa, using Pokémon Red to test Claude 3.7? That's such a nostalgic flex! I wonder how it handled the Elite Four—bet it overanalyzed every move like a pro gamer. 😎
Whoa, using Pokémon Red to test Claude 3.7? That's such a nostalgic flex! I wonder how it handles those tricky Gym battles—hope it didn't get stuck in Rock Tunnel! 😄
Whoa, using Pokémon Red to test Claude 3.7? That’s such a nostalgic flex! Makes me wonder if AI could ever master my childhood Pikachu strats. 🕹️
Usar Pokémon Red para testar o Claude 3.7 Sonnet? Isso é loucura! É legal ver a IA enfrentando jogos clássicos, mas será que consegue vencer a Elite Four? As habilidades de memória e leitura de pixels da IA são impressionantes. Talvez na próxima tentem com o Pokémon Blue! 😂





Maison






