Option
Heim
Nachricht
Anthropisch verwendet Pokémon, um sein neuestes KI -Modell zu bewerten

Anthropisch verwendet Pokémon, um sein neuestes KI -Modell zu bewerten

10. April 2025
313

In einer überraschenden Entscheidung hat Anthropic beschlossen, sein neuestes KI-Modell, Claude 3.7 Sonnet, mit dem klassischen Game Boy-Spiel Pokémon Red zu testen. Laut einem am Montag veröffentlichten Blogbeitrag hat das Unternehmen das Modell mit den Grundlagen ausgestattet: Speicher, die Fähigkeit, Bildschirmpixel zu lesen, und die Möglichkeit, Tasten zu drücken und sich auf dem Spielbildschirm zu bewegen. Diese Ausstattung ermöglichte es Claude 3.7 Sonnet, in die Welt von Pokémon einzutauchen und weiterzuspielen.

Was Claude 3.7 Sonnet auszeichnet, ist seine Fähigkeit zum „erweiterten Denken“. Ähnlich wie andere Modelle wie OpenAI's o3-mini und DeepSeek's R1 kann es schwierige Probleme angehen, indem es die Rechenleistung erhöht und sich Zeit nimmt, um gründlich nachzudenken.

Diese Funktion erwies sich in Pokémon Red als bahnbrechend. Während das ältere Modell Claude 3.0 Sonnet nicht einmal aus dem Startgebiet in Pallet Town herauskam, gelang es Claude 3.7 Sonnet, drei Arenaleiter zu besiegen und ihre Orden zu gewinnen.

Anthropic Pokémon Red

Bildnachweis: Anthropic
Anthropic hat nicht verraten, wie viel Rechenleistung benötigt wurde oder wie lange es dauerte, bis Claude 3.7 Sonnet diese Meilensteine erreichte. Sie erwähnten lediglich, dass das Modell beeindruckende 35.000 Aktionen ausführte, um sich dem letzten Arenaleiter, Surge, zu stellen.

Letzte Woche testete ein Forscher eine frühe Vorschau von Claude 3.7 Sonnet.

Die Ergebnisse waren beeindruckend. Innerhalb von Stunden besiegte Claude Brock. Tage später schlug es Misty. Fortschritte, die ältere Modelle kaum erreichen konnten.

Es stellt sich heraus, dass erweitertes Denken äußerst effektiv ist. pic.twitter.com/RspsLgj2Uf

— Anthropic (@AnthropicAI) 25. Februar 2025

Es wird nicht lange dauern, bis ein cleverer Entwickler die genauen Details herausfindet.

Obwohl Pokémon Red wie ein unterhaltsamer Test erscheinen mag, werden Spiele schon seit Langem für KI-Benchmarks genutzt. Allein in den letzten Monaten sind eine Reihe neuer Apps und Plattformen aufgetaucht, um zu testen, wie gut KI-Modelle alles von Street Fighter bis Pictionary spielen können.

Verwandter Artikel
Googles KI Gemini bezwingt Pokémon Blau mit Unterstützung Googles KI Gemini bezwingt Pokémon Blau mit Unterstützung Googles KI-Meilenstein: Eroberung eines klassischen Pokémon-AbenteuersGoogles fortschrittlichstes KI-Modell scheint einen bemerkenswerten Spieldurchbruch erzielt zu haben - es hat den Game Boy-Titel P
Debatten über AI -Benchmarking haben Pokémon erreicht Debatten über AI -Benchmarking haben Pokémon erreicht Sogar die geliebte Welt von Pokémon ist nicht immun gegen das Drama, das KI -Benchmarks umgibt. Ein aktueller viraler Beitrag auf X war ein wesentlicher Bestand, und behauptete, dass Googles neuestes Gemini -Modell das führende Claude -Modell von Anthropic in der klassischen Pokémon -Videospiel -Trilogie übertroffen habe. Nach der Post, Gemini
Yaoke Medias erste AIGC-Serie „Das Geheimnis der Bronzefiguren im Qinling-Gebirge“ startet heute mit KI-generierten Hauptdarstellern Yaoke Medias erste AIGC-Serie „Das Geheimnis der Bronzefiguren im Qinling-Gebirge“ startet heute mit KI-generierten Hauptdarstellern Heute ist der offizielle Starttag von Yaoke Medias AIGC-Fantasy-Mystery-Kurzserie „Die geheime Geschichte der Qinling-Bronze“. Mit den ersten beiden unter Vertrag genommenen KI-Schauspielern des Unter
Empfehlungen zu verwandten Spezialthemen
Geschäft Die besten KI-basierten Spesenabrechnungsprogramme: Quittungen scannen und Geschäftsausgaben automatisch kategorisieren
Die besten KI-basierten Spesenabrechnungsprogramme: Quittungen scannen und Geschäftsausgaben automatisch kategorisieren

Die besten KI-basierten Spesenmanager 2026: Erstklassige Tools zum Scannen von Belegen und zur automatischen Kategorisierung von Unternehmensausgaben. Entdecken Sie leistungsstarke, bahnbrechende Lösungen für müheloses Spesenmanagement, präzise Finanzüberwachung und optimierte Compliance. Unser sorgfältig zusammengestellter, wöchentlich aktualisierter Vergleich zwischen kostenlosen und kostenpflichtigen Optionen hilft Ihnen dabei, die perfekte Lösung zu finden. Nutzen Sie Ihren KI-Vorteil mit den Expertenempfehlungen von XIX.AI.

10 Tools
xix.ai
Geschäft Die besten KI-Tools für die Personalbeschaffung: Lebensläufe prüfen und die Terminplanung für Vorstellungsgespräche automatisieren
Die besten KI-Tools für die Personalbeschaffung: Lebensläufe prüfen und die Terminplanung für Vorstellungsgespräche automatisieren

Entdecken Sie auf XIX.AI die besten KI-Tools für die Personalbeschaffung des Jahres 2026. Unsere sorgfältig zusammengestellte Liste umfasst leistungsstarke, bahnbrechende Lösungen für die Sichtung von Lebensläufen und die automatisierte Terminplanung für Vorstellungsgespräche. Vergleichen Sie kostenlose und kostenpflichtige Optionen anhand von Praxistests und wöchentlich aktualisierten Rankings. Finden Sie Ihren perfekten Assistenten für die Personalbeschaffung und optimieren Sie noch heute Ihren Rekrutierungsprozess!

10 Tools
xix.ai
Produktivität KI-Coaches für persönliches Wohlbefinden und Konzentration: Burnout bewältigen und die geistige Energie steigern
KI-Coaches für persönliches Wohlbefinden und Konzentration: Burnout bewältigen und die geistige Energie steigern

Entdecken Sie auf XIX.AI die besten KI-basierten Coaches für persönliches Wohlbefinden und Konzentration des Jahres 2026. Unsere sorgfältig zusammengestellte Rangliste umfasst erstklassige, bahnbrechende Tools zur Bewältigung von Burnout und zur Steigerung der mentalen Energie. Vergleichen Sie kostenlose und kostenpflichtige Optionen anhand von Erfahrungsberichten aus der Praxis. Schlagen Sie noch heute den Weg zu höchster Produktivität und Wohlbefinden ein.

10 Tools
xix.ai
Chatbot Die besten KI-basierten Romantik-Chatbots: Bauen Sie langfristige Beziehungen mit beständiger Persönlichkeit auf
Die besten KI-basierten Romantik-Chatbots: Bauen Sie langfristige Beziehungen mit beständiger Persönlichkeit auf

Entdecken Sie die besten KI-Romantik-Chatbots des Jahres 2026, mit denen Sie echte, langfristige Beziehungen aufbauen können. Unsere sorgfältig zusammengestellte Liste bietet Ihnen überzeugende, konsistente Persönlichkeiten, Vergleiche zwischen kostenlosen und kostenpflichtigen Angeboten sowie Tests aus der Praxis. Finden Sie Ihren perfekten Begleiter und legen Sie noch heute bei XIX.AI los.

10 Tools
xix.ai
Bildung und Lernen Die besten AI-Datenwissenschafts-Mentoren: Beherrschen Sie SQL, Pandas und Arbeitsabläufe für maschinelles Lernen.
Die besten AI-Datenwissenschafts-Mentoren: Beherrschen Sie SQL, Pandas und Arbeitsabläufe für maschinelles Lernen.

Entdecken Sie die besten AI-Data-Science-Mentoren von 2026, um SQL, Pandas und ML-Arbeitsabläufe zu meistern. Erfahren Sie mehr über unsere hochbewerteten, sorgfältig ausgewählten Angebote bei XIX.AI – für effektive und bahnbrechende Anleitung. Vergleichen Sie kostenlose und bezahlte Optionen mit praktischen Einblicken aus der Praxis. Entfalten Sie Ihr Potenzial in der Data Science noch heute.

10 Tools
xix.ai
Chatbot Die besten KI-Flirt- und Konversationstrainer: Steigere dein soziales Charisma und dein Selbstvertrauen in Echtzeit
Die besten KI-Flirt- und Konversationstrainer: Steigere dein soziales Charisma und dein Selbstvertrauen in Echtzeit

Entdecken Sie auf XIX.AI die besten KI-Flirt- und Konversationstrainer des Jahres 2026. Unsere sorgfältig zusammengestellte, erstklassige Auswahl hilft Ihnen dabei, Ihr soziales Charisma und Ihr Selbstvertrauen in Echtzeit zu stärken. Entdecken Sie unverzichtbare, bahnbrechende Tools mit Vergleichen zwischen kostenlosen und kostenpflichtigen Angeboten sowie wöchentlich aktualisierten Rankings. Schaffen Sie sich noch heute einen sozialen Vorsprung.

10 Tools
xix.ai
Kommentare (19)
0/500
GaryWilson
GaryWilson 29. Oktober 2025 19:31:10 MEZ

와, AI로 포켓몬을 플레이하다니 너무 신기하다 🦄 어떤 기술로 게임을 클리어했는지 궁금해요. 아마도 화면 픽셀 인식과 결정 과정을 학습하는 방식이겠죠? 이렇게 발전하다 보면 AI가 슈퍼마리오도 깰 수 있을까?

BillyAdams
BillyAdams 27. August 2025 14:59:25 MESZ

Whoa, using Pokémon Red to test Claude 3.7? That's such a nostalgic flex! I wonder how it handled the Elite Four—bet it overanalyzed every move like a pro gamer. 😎

FrankSanchez
FrankSanchez 11. August 2025 19:01:02 MESZ

Whoa, using Pokémon Red to test Claude 3.7? That's such a nostalgic flex! I wonder how it handles those tricky Gym battles—hope it didn't get stuck in Rock Tunnel! 😄

PaulSanchez
PaulSanchez 23. Juli 2025 06:59:29 MESZ

Whoa, using Pokémon Red to test Claude 3.7? That’s such a nostalgic flex! Makes me wonder if AI could ever master my childhood Pikachu strats. 🕹️

LawrenceLopez
LawrenceLopez 22. April 2025 06:33:07 MESZ

Usar Pokémon Red para testar o Claude 3.7 Sonnet? Isso é loucura! É legal ver a IA enfrentando jogos clássicos, mas será que consegue vencer a Elite Four? As habilidades de memória e leitura de pixels da IA são impressionantes. Talvez na próxima tentem com o Pokémon Blue! 😂

JeffreyRamirez
JeffreyRamirez 20. April 2025 10:47:48 MESZ

Using Pokémon Red to benchmark Claude 3.7 Sonnet? That's wild! It's cool to see AI tackling classic games, but I wonder if it can beat the Elite Four. The AI's memory and pixel reading skills are impressive, though. Maybe next time they'll try it on Pokémon Blue! 😂

OR