Anthropisch verwendet Pokémon, um sein neuestes KI -Modell zu bewerten

Heim

Nachricht

10. April 2025

AvaHill

154

# pokemon

In einer überraschenden Entscheidung hat Anthropic beschlossen, sein neuestes KI-Modell, Claude 3.7 Sonnet, mit dem klassischen Game Boy-Spiel Pokémon Red zu testen. Laut einem am Montag veröffentlichten Blogbeitrag hat das Unternehmen das Modell mit den Grundlagen ausgestattet: Speicher, die Fähigkeit, Bildschirmpixel zu lesen, und die Möglichkeit, Tasten zu drücken und sich auf dem Spielbildschirm zu bewegen. Diese Ausstattung ermöglichte es Claude 3.7 Sonnet, in die Welt von Pokémon einzutauchen und weiterzuspielen.

Was Claude 3.7 Sonnet auszeichnet, ist seine Fähigkeit zum „erweiterten Denken“. Ähnlich wie andere Modelle wie OpenAI's o3-mini und DeepSeek's R1 kann es schwierige Probleme angehen, indem es die Rechenleistung erhöht und sich Zeit nimmt, um gründlich nachzudenken.

Diese Funktion erwies sich in Pokémon Red als bahnbrechend. Während das ältere Modell Claude 3.0 Sonnet nicht einmal aus dem Startgebiet in Pallet Town herauskam, gelang es Claude 3.7 Sonnet, drei Arenaleiter zu besiegen und ihre Orden zu gewinnen.

Anthropic Pokémon Red

Bildnachweis: Anthropic

Anthropic hat nicht verraten, wie viel Rechenleistung benötigt wurde oder wie lange es dauerte, bis Claude 3.7 Sonnet diese Meilensteine erreichte. Sie erwähnten lediglich, dass das Modell beeindruckende 35.000 Aktionen ausführte, um sich dem letzten Arenaleiter, Surge, zu stellen.

Letzte Woche testete ein Forscher eine frühe Vorschau von Claude 3.7 Sonnet.
Die Ergebnisse waren beeindruckend. Innerhalb von Stunden besiegte Claude Brock. Tage später schlug es Misty. Fortschritte, die ältere Modelle kaum erreichen konnten.
Es stellt sich heraus, dass erweitertes Denken äußerst effektiv ist. pic.twitter.com/RspsLgj2Uf
— Anthropic (@AnthropicAI) 25. Februar 2025

Es wird nicht lange dauern, bis ein cleverer Entwickler die genauen Details herausfindet.

Obwohl Pokémon Red wie ein unterhaltsamer Test erscheinen mag, werden Spiele schon seit Langem für KI-Benchmarks genutzt. Allein in den letzten Monaten sind eine Reihe neuer Apps und Plattformen aufgetaucht, um zu testen, wie gut KI-Modelle alles von Street Fighter bis Pictionary spielen können.

Verwandter Artikel

Googles KI Gemini bezwingt Pokémon Blau mit Unterstützung Googles KI-Meilenstein: Eroberung eines klassischen Pokémon-AbenteuersGoogles fortschrittlichstes KI-Modell scheint einen bemerkenswerten Spieldurchbruch erzielt zu haben - es hat den Game Boy-Titel P

Debatten über AI -Benchmarking haben Pokémon erreicht Sogar die geliebte Welt von Pokémon ist nicht immun gegen das Drama, das KI -Benchmarks umgibt. Ein aktueller viraler Beitrag auf X war ein wesentlicher Bestand, und behauptete, dass Googles neuestes Gemini -Modell das führende Claude -Modell von Anthropic in der klassischen Pokémon -Videospiel -Trilogie übertroffen habe. Nach der Post, Gemini

Einfaches Generieren von KI-gestützten Grafiken und Visualisierungen für bessere Dateneinblicke Die moderne Datenanalyse erfordert eine intuitive Visualisierung komplexer Informationen. KI-gestützte Lösungen zur Diagrammerstellung haben sich als unverzichtbare Hilfsmittel erwiesen und revolution

Kommentare (18)

0/200

Einreichen

BillyAdams

27. August 2025 14:59:25 MESZ

Whoa, using Pokémon Red to test Claude 3.7? That's such a nostalgic flex! I wonder how it handled the Elite Four—bet it overanalyzed every move like a pro gamer. 😎

FrankSanchez

11. August 2025 19:01:02 MESZ

Whoa, using Pokémon Red to test Claude 3.7? That's such a nostalgic flex! I wonder how it handles those tricky Gym battles—hope it didn't get stuck in Rock Tunnel! 😄

PaulSanchez

23. Juli 2025 06:59:29 MESZ

Whoa, using Pokémon Red to test Claude 3.7? That’s such a nostalgic flex! Makes me wonder if AI could ever master my childhood Pikachu strats. 🕹️

LawrenceLopez

22. April 2025 06:33:07 MESZ

Usar Pokémon Red para testar o Claude 3.7 Sonnet? Isso é loucura! É legal ver a IA enfrentando jogos clássicos, mas será que consegue vencer a Elite Four? As habilidades de memória e leitura de pixels da IA são impressionantes. Talvez na próxima tentem com o Pokémon Blue! 😂

JeffreyRamirez

20. April 2025 10:47:48 MESZ

Using Pokémon Red to benchmark Claude 3.7 Sonnet? That's wild! It's cool to see AI tackling classic games, but I wonder if it can beat the Elite Four. The AI's memory and pixel reading skills are impressive, though. Maybe next time they'll try it on Pokémon Blue! 😂

FrankSmith

17. April 2025 16:27:49 MESZ

포켓몬으로 AI를 테스트하다니 신기해! 클라우드 3.7 소넷이 포켓몬 레드를 플레이하는 건 멋지지만 좀 이상해. 화면 픽셀을 읽고 기억하는 건 대단한데, 정말 모든 포켓몬을 잡을 수 있을까? 🤔 재미있는 아이디어야, 하지만 실제 생활에서 얼마나 유용할지 궁금해. 다 잡아야지! 😂

Top -Nachrichten

Top AI-Videogeneratoren 2025: Pika Labs im Vergleich zu Alternativen Gemini 2.5 Pro jetzt unbegrenzt und billiger als Claude, GPT-4O AI-Synchronisation: Ultimativer Leitfaden zur realistischen Stimmen-Erstellung Die KI von Cambium verwandelt Abfall Holz in Holz AI Builder und Power Automate Revolutionieren die Dokumentenzusammenfassung OpenAI verbessert den AI -Sprachassistenten für bessere Chats So stellen Sie sicher, dass Ihre Daten für die KI -Integration vertrauenswürdig sind Duolingo wechselt zum Energiesystem NotebookLM erweitert weltweit, fügt Folien und eine verbesserte Faktenprüfung hinzu Optimierungen an US -Rechenzentren könnten 76 GW neue Leistungskapazität freischalten

Mehr

Vorgestellt