Anthropisch verwendet Pokémon, um sein neuestes KI -Modell zu bewerten
In einer überraschenden Entscheidung hat Anthropic beschlossen, sein neuestes KI-Modell, Claude 3.7 Sonnet, mit dem klassischen Game Boy-Spiel Pokémon Red zu testen. Laut einem am Montag veröffentlichten Blogbeitrag hat das Unternehmen das Modell mit den Grundlagen ausgestattet: Speicher, die Fähigkeit, Bildschirmpixel zu lesen, und die Möglichkeit, Tasten zu drücken und sich auf dem Spielbildschirm zu bewegen. Diese Ausstattung ermöglichte es Claude 3.7 Sonnet, in die Welt von Pokémon einzutauchen und weiterzuspielen.
Was Claude 3.7 Sonnet auszeichnet, ist seine Fähigkeit zum „erweiterten Denken“. Ähnlich wie andere Modelle wie OpenAI's o3-mini und DeepSeek's R1 kann es schwierige Probleme angehen, indem es die Rechenleistung erhöht und sich Zeit nimmt, um gründlich nachzudenken.
Diese Funktion erwies sich in Pokémon Red als bahnbrechend. Während das ältere Modell Claude 3.0 Sonnet nicht einmal aus dem Startgebiet in Pallet Town herauskam, gelang es Claude 3.7 Sonnet, drei Arenaleiter zu besiegen und ihre Orden zu gewinnen.

Bildnachweis: Anthropic Anthropic hat nicht verraten, wie viel Rechenleistung benötigt wurde oder wie lange es dauerte, bis Claude 3.7 Sonnet diese Meilensteine erreichte. Sie erwähnten lediglich, dass das Modell beeindruckende 35.000 Aktionen ausführte, um sich dem letzten Arenaleiter, Surge, zu stellen.Letzte Woche testete ein Forscher eine frühe Vorschau von Claude 3.7 Sonnet.
Die Ergebnisse waren beeindruckend. Innerhalb von Stunden besiegte Claude Brock. Tage später schlug es Misty. Fortschritte, die ältere Modelle kaum erreichen konnten.
Es stellt sich heraus, dass erweitertes Denken äußerst effektiv ist. pic.twitter.com/RspsLgj2Uf
— Anthropic (@AnthropicAI) 25. Februar 2025
Es wird nicht lange dauern, bis ein cleverer Entwickler die genauen Details herausfindet.
Obwohl Pokémon Red wie ein unterhaltsamer Test erscheinen mag, werden Spiele schon seit Langem für KI-Benchmarks genutzt. Allein in den letzten Monaten sind eine Reihe neuer Apps und Plattformen aufgetaucht, um zu testen, wie gut KI-Modelle alles von Street Fighter bis Pictionary spielen können.
Verwandter Artikel
Debatten über AI -Benchmarking haben Pokémon erreicht
Sogar die geliebte Welt von Pokémon ist nicht immun gegen das Drama, das KI -Benchmarks umgibt. Ein aktueller viraler Beitrag auf X war ein wesentlicher Bestand, und behauptete, dass Googles neuestes Gemini -Modell das führende Claude -Modell von Anthropic in der klassischen Pokémon -Videospiel -Trilogie übertroffen habe. Nach der Post, Gemini
Erhöhen Sie die Qualität Ihrer Bilder mit HitPaw AI Photo Enhancer: Ein umfassender Leitfaden
Möchten Sie Ihre Bildbearbeitung revolutionieren? Dank modernster künstlicher Intelligenz ist die Verbesserung Ihrer Bilder nun mühelos. Dieser detaillierte Leitfaden stellt den HitPaw AI Photo Enhanc
KI-gestützte Musikerstellung: Songs und Videos mühelos erstellen
Musikerstellung kann komplex sein und erfordert Zeit, Ressourcen und Fachwissen. Künstliche Intelligenz hat diesen Prozess revolutioniert und ihn einfach und zugänglich gemacht. Dieser Leitfaden zeigt
Kommentare (17)
0/200
FrankSanchez
11. August 2025 19:01:02 MESZ
Whoa, using Pokémon Red to test Claude 3.7? That's such a nostalgic flex! I wonder how it handles those tricky Gym battles—hope it didn't get stuck in Rock Tunnel! 😄
0
PaulSanchez
23. Juli 2025 06:59:29 MESZ
Whoa, using Pokémon Red to test Claude 3.7? That’s such a nostalgic flex! Makes me wonder if AI could ever master my childhood Pikachu strats. 🕹️
0
LawrenceLopez
22. April 2025 06:33:07 MESZ
Usar Pokémon Red para testar o Claude 3.7 Sonnet? Isso é loucura! É legal ver a IA enfrentando jogos clássicos, mas será que consegue vencer a Elite Four? As habilidades de memória e leitura de pixels da IA são impressionantes. Talvez na próxima tentem com o Pokémon Blue! 😂
0
JeffreyRamirez
20. April 2025 10:47:48 MESZ
Using Pokémon Red to benchmark Claude 3.7 Sonnet? That's wild! It's cool to see AI tackling classic games, but I wonder if it can beat the Elite Four. The AI's memory and pixel reading skills are impressive, though. Maybe next time they'll try it on Pokémon Blue! 😂
0
FrankSmith
17. April 2025 16:27:49 MESZ
포켓몬으로 AI를 테스트하다니 신기해! 클라우드 3.7 소넷이 포켓몬 레드를 플레이하는 건 멋지지만 좀 이상해. 화면 픽셀을 읽고 기억하는 건 대단한데, 정말 모든 포켓몬을 잡을 수 있을까? 🤔 재미있는 아이디어야, 하지만 실제 생활에서 얼마나 유용할지 궁금해. 다 잡아야지! 😂
0
JoeLee
17. April 2025 03:15:28 MESZ
¿Usar Pokémon para probar IA? ¡Eso es una locura! Que Claude 3.7 Sonnet juegue a Pokémon Rojo es genial, pero un poco raro. Es increíble que pueda leer píxeles de la pantalla y recordar cosas, pero ¿realmente atrapa a todos? 🤔 Idea divertida, pero me pregunto qué tan práctico es en la vida real. ¡A atraparlos a todos, verdad? 😂
0
In einer überraschenden Entscheidung hat Anthropic beschlossen, sein neuestes KI-Modell, Claude 3.7 Sonnet, mit dem klassischen Game Boy-Spiel Pokémon Red zu testen. Laut einem am Montag veröffentlichten Blogbeitrag hat das Unternehmen das Modell mit den Grundlagen ausgestattet: Speicher, die Fähigkeit, Bildschirmpixel zu lesen, und die Möglichkeit, Tasten zu drücken und sich auf dem Spielbildschirm zu bewegen. Diese Ausstattung ermöglichte es Claude 3.7 Sonnet, in die Welt von Pokémon einzutauchen und weiterzuspielen.
Was Claude 3.7 Sonnet auszeichnet, ist seine Fähigkeit zum „erweiterten Denken“. Ähnlich wie andere Modelle wie OpenAI's o3-mini und DeepSeek's R1 kann es schwierige Probleme angehen, indem es die Rechenleistung erhöht und sich Zeit nimmt, um gründlich nachzudenken.
Diese Funktion erwies sich in Pokémon Red als bahnbrechend. Während das ältere Modell Claude 3.0 Sonnet nicht einmal aus dem Startgebiet in Pallet Town herauskam, gelang es Claude 3.7 Sonnet, drei Arenaleiter zu besiegen und ihre Orden zu gewinnen.
Letzte Woche testete ein Forscher eine frühe Vorschau von Claude 3.7 Sonnet.
Die Ergebnisse waren beeindruckend. Innerhalb von Stunden besiegte Claude Brock. Tage später schlug es Misty. Fortschritte, die ältere Modelle kaum erreichen konnten.
Es stellt sich heraus, dass erweitertes Denken äußerst effektiv ist. pic.twitter.com/RspsLgj2Uf
— Anthropic (@AnthropicAI) 25. Februar 2025
Es wird nicht lange dauern, bis ein cleverer Entwickler die genauen Details herausfindet.
Obwohl Pokémon Red wie ein unterhaltsamer Test erscheinen mag, werden Spiele schon seit Langem für KI-Benchmarks genutzt. Allein in den letzten Monaten sind eine Reihe neuer Apps und Plattformen aufgetaucht, um zu testen, wie gut KI-Modelle alles von Street Fighter bis Pictionary spielen können.




Whoa, using Pokémon Red to test Claude 3.7? That's such a nostalgic flex! I wonder how it handles those tricky Gym battles—hope it didn't get stuck in Rock Tunnel! 😄




Whoa, using Pokémon Red to test Claude 3.7? That’s such a nostalgic flex! Makes me wonder if AI could ever master my childhood Pikachu strats. 🕹️




Usar Pokémon Red para testar o Claude 3.7 Sonnet? Isso é loucura! É legal ver a IA enfrentando jogos clássicos, mas será que consegue vencer a Elite Four? As habilidades de memória e leitura de pixels da IA são impressionantes. Talvez na próxima tentem com o Pokémon Blue! 😂




Using Pokémon Red to benchmark Claude 3.7 Sonnet? That's wild! It's cool to see AI tackling classic games, but I wonder if it can beat the Elite Four. The AI's memory and pixel reading skills are impressive, though. Maybe next time they'll try it on Pokémon Blue! 😂




포켓몬으로 AI를 테스트하다니 신기해! 클라우드 3.7 소넷이 포켓몬 레드를 플레이하는 건 멋지지만 좀 이상해. 화면 픽셀을 읽고 기억하는 건 대단한데, 정말 모든 포켓몬을 잡을 수 있을까? 🤔 재미있는 아이디어야, 하지만 실제 생활에서 얼마나 유용할지 궁금해. 다 잡아야지! 😂




¿Usar Pokémon para probar IA? ¡Eso es una locura! Que Claude 3.7 Sonnet juegue a Pokémon Rojo es genial, pero un poco raro. Es increíble que pueda leer píxeles de la pantalla y recordar cosas, pero ¿realmente atrapa a todos? 🤔 Idea divertida, pero me pregunto qué tan práctico es en la vida real. ¡A atraparlos a todos, verdad? 😂












