Anthropisch verwendet Pokémon, um sein neuestes KI -Modell zu bewerten
In einer überraschenden Entscheidung hat Anthropic beschlossen, sein neuestes KI-Modell, Claude 3.7 Sonnet, mit dem klassischen Game Boy-Spiel Pokémon Red zu testen. Laut einem am Montag veröffentlichten Blogbeitrag hat das Unternehmen das Modell mit den Grundlagen ausgestattet: Speicher, die Fähigkeit, Bildschirmpixel zu lesen, und die Möglichkeit, Tasten zu drücken und sich auf dem Spielbildschirm zu bewegen. Diese Ausstattung ermöglichte es Claude 3.7 Sonnet, in die Welt von Pokémon einzutauchen und weiterzuspielen.
Was Claude 3.7 Sonnet auszeichnet, ist seine Fähigkeit zum „erweiterten Denken“. Ähnlich wie andere Modelle wie OpenAI's o3-mini und DeepSeek's R1 kann es schwierige Probleme angehen, indem es die Rechenleistung erhöht und sich Zeit nimmt, um gründlich nachzudenken.
Diese Funktion erwies sich in Pokémon Red als bahnbrechend. Während das ältere Modell Claude 3.0 Sonnet nicht einmal aus dem Startgebiet in Pallet Town herauskam, gelang es Claude 3.7 Sonnet, drei Arenaleiter zu besiegen und ihre Orden zu gewinnen.

Bildnachweis: Anthropic Anthropic hat nicht verraten, wie viel Rechenleistung benötigt wurde oder wie lange es dauerte, bis Claude 3.7 Sonnet diese Meilensteine erreichte. Sie erwähnten lediglich, dass das Modell beeindruckende 35.000 Aktionen ausführte, um sich dem letzten Arenaleiter, Surge, zu stellen.Letzte Woche testete ein Forscher eine frühe Vorschau von Claude 3.7 Sonnet.
Die Ergebnisse waren beeindruckend. Innerhalb von Stunden besiegte Claude Brock. Tage später schlug es Misty. Fortschritte, die ältere Modelle kaum erreichen konnten.
Es stellt sich heraus, dass erweitertes Denken äußerst effektiv ist. pic.twitter.com/RspsLgj2Uf
— Anthropic (@AnthropicAI) 25. Februar 2025
Es wird nicht lange dauern, bis ein cleverer Entwickler die genauen Details herausfindet.
Obwohl Pokémon Red wie ein unterhaltsamer Test erscheinen mag, werden Spiele schon seit Langem für KI-Benchmarks genutzt. Allein in den letzten Monaten sind eine Reihe neuer Apps und Plattformen aufgetaucht, um zu testen, wie gut KI-Modelle alles von Street Fighter bis Pictionary spielen können.
Verwandter Artikel
Googles KI Gemini bezwingt Pokémon Blau mit Unterstützung
Googles KI-Meilenstein: Eroberung eines klassischen Pokémon-AbenteuersGoogles fortschrittlichstes KI-Modell scheint einen bemerkenswerten Spieldurchbruch erzielt zu haben - es hat den Game Boy-Titel P
Debatten über AI -Benchmarking haben Pokémon erreicht
Sogar die geliebte Welt von Pokémon ist nicht immun gegen das Drama, das KI -Benchmarks umgibt. Ein aktueller viraler Beitrag auf X war ein wesentlicher Bestand, und behauptete, dass Googles neuestes Gemini -Modell das führende Claude -Modell von Anthropic in der klassischen Pokémon -Videospiel -Trilogie übertroffen habe. Nach der Post, Gemini
Yaoke Medias erste AIGC-Serie „Das Geheimnis der Bronzefiguren im Qinling-Gebirge“ startet heute mit KI-generierten Hauptdarstellern
Heute ist der offizielle Starttag von Yaoke Medias AIGC-Fantasy-Mystery-Kurzserie „Die geheime Geschichte der Qinling-Bronze“. Mit den ersten beiden unter Vertrag genommenen KI-Schauspielern des Unter
Empfehlungen zu verwandten Spezialthemen
Kommentare (19)
와, AI로 포켓몬을 플레이하다니 너무 신기하다 🦄 어떤 기술로 게임을 클리어했는지 궁금해요. 아마도 화면 픽셀 인식과 결정 과정을 학습하는 방식이겠죠? 이렇게 발전하다 보면 AI가 슈퍼마리오도 깰 수 있을까?
Whoa, using Pokémon Red to test Claude 3.7? That's such a nostalgic flex! I wonder how it handled the Elite Four—bet it overanalyzed every move like a pro gamer. 😎
Whoa, using Pokémon Red to test Claude 3.7? That's such a nostalgic flex! I wonder how it handles those tricky Gym battles—hope it didn't get stuck in Rock Tunnel! 😄
Whoa, using Pokémon Red to test Claude 3.7? That’s such a nostalgic flex! Makes me wonder if AI could ever master my childhood Pikachu strats. 🕹️
Usar Pokémon Red para testar o Claude 3.7 Sonnet? Isso é loucura! É legal ver a IA enfrentando jogos clássicos, mas será que consegue vencer a Elite Four? As habilidades de memória e leitura de pixels da IA são impressionantes. Talvez na próxima tentem com o Pokémon Blue! 😂
In einer überraschenden Entscheidung hat Anthropic beschlossen, sein neuestes KI-Modell, Claude 3.7 Sonnet, mit dem klassischen Game Boy-Spiel Pokémon Red zu testen. Laut einem am Montag veröffentlichten Blogbeitrag hat das Unternehmen das Modell mit den Grundlagen ausgestattet: Speicher, die Fähigkeit, Bildschirmpixel zu lesen, und die Möglichkeit, Tasten zu drücken und sich auf dem Spielbildschirm zu bewegen. Diese Ausstattung ermöglichte es Claude 3.7 Sonnet, in die Welt von Pokémon einzutauchen und weiterzuspielen.
Was Claude 3.7 Sonnet auszeichnet, ist seine Fähigkeit zum „erweiterten Denken“. Ähnlich wie andere Modelle wie OpenAI's o3-mini und DeepSeek's R1 kann es schwierige Probleme angehen, indem es die Rechenleistung erhöht und sich Zeit nimmt, um gründlich nachzudenken.
Diese Funktion erwies sich in Pokémon Red als bahnbrechend. Während das ältere Modell Claude 3.0 Sonnet nicht einmal aus dem Startgebiet in Pallet Town herauskam, gelang es Claude 3.7 Sonnet, drei Arenaleiter zu besiegen und ihre Orden zu gewinnen.

Letzte Woche testete ein Forscher eine frühe Vorschau von Claude 3.7 Sonnet.
Die Ergebnisse waren beeindruckend. Innerhalb von Stunden besiegte Claude Brock. Tage später schlug es Misty. Fortschritte, die ältere Modelle kaum erreichen konnten.
Es stellt sich heraus, dass erweitertes Denken äußerst effektiv ist. pic.twitter.com/RspsLgj2Uf
— Anthropic (@AnthropicAI) 25. Februar 2025
Es wird nicht lange dauern, bis ein cleverer Entwickler die genauen Details herausfindet.
Obwohl Pokémon Red wie ein unterhaltsamer Test erscheinen mag, werden Spiele schon seit Langem für KI-Benchmarks genutzt. Allein in den letzten Monaten sind eine Reihe neuer Apps und Plattformen aufgetaucht, um zu testen, wie gut KI-Modelle alles von Street Fighter bis Pictionary spielen können.
Googles KI Gemini bezwingt Pokémon Blau mit Unterstützung
Googles KI-Meilenstein: Eroberung eines klassischen Pokémon-AbenteuersGoogles fortschrittlichstes KI-Modell scheint einen bemerkenswerten Spieldurchbruch erzielt zu haben - es hat den Game Boy-Titel P
Debatten über AI -Benchmarking haben Pokémon erreicht
Sogar die geliebte Welt von Pokémon ist nicht immun gegen das Drama, das KI -Benchmarks umgibt. Ein aktueller viraler Beitrag auf X war ein wesentlicher Bestand, und behauptete, dass Googles neuestes Gemini -Modell das führende Claude -Modell von Anthropic in der klassischen Pokémon -Videospiel -Trilogie übertroffen habe. Nach der Post, Gemini
Yaoke Medias erste AIGC-Serie „Das Geheimnis der Bronzefiguren im Qinling-Gebirge“ startet heute mit KI-generierten Hauptdarstellern
Heute ist der offizielle Starttag von Yaoke Medias AIGC-Fantasy-Mystery-Kurzserie „Die geheime Geschichte der Qinling-Bronze“. Mit den ersten beiden unter Vertrag genommenen KI-Schauspielern des Unter
와, AI로 포켓몬을 플레이하다니 너무 신기하다 🦄 어떤 기술로 게임을 클리어했는지 궁금해요. 아마도 화면 픽셀 인식과 결정 과정을 학습하는 방식이겠죠? 이렇게 발전하다 보면 AI가 슈퍼마리오도 깰 수 있을까?
Whoa, using Pokémon Red to test Claude 3.7? That's such a nostalgic flex! I wonder how it handled the Elite Four—bet it overanalyzed every move like a pro gamer. 😎
Whoa, using Pokémon Red to test Claude 3.7? That's such a nostalgic flex! I wonder how it handles those tricky Gym battles—hope it didn't get stuck in Rock Tunnel! 😄
Whoa, using Pokémon Red to test Claude 3.7? That’s such a nostalgic flex! Makes me wonder if AI could ever master my childhood Pikachu strats. 🕹️
Usar Pokémon Red para testar o Claude 3.7 Sonnet? Isso é loucura! É legal ver a IA enfrentando jogos clássicos, mas será que consegue vencer a Elite Four? As habilidades de memória e leitura de pixels da IA são impressionantes. Talvez na próxima tentem com o Pokémon Blue! 😂





Heim






