人類はポケモンを使用して、最新のAIモデルをベンチマークしました
驚くべきことに、Anthropicは最新のAIモデルであるClaude 3.7 Sonnetを、クラシックなGame Boyゲーム、ポケモン赤で試すことを決定しました。月曜日に公開されたブログ投稿によると、同社はこのモデルに必要なものを装備しました:メモリ、画面のピクセルを読み取る能力、そしてボタンを押したりゲーム画面内を移動したりする力です。この設定により、Claude 3.7 Sonnetはポケモンの世界に飛び込み、プレイを続けることができました。
Claude 3.7 Sonnetを際立たせるのは、その「拡張思考」の能力です。OpenAIのo3-miniやDeepSeekのR1のような他のモデルと同様に、計算能力を高め、じっくり考える時間を取ることで難しい問題に取り組むことができます。
この機能はポケモン赤でゲームチェンジャーであることが証明されました。古いClaude 3.0 Sonnetはパレットタウンのスタートエリアから抜け出すことさえできませんでしたが、Claude 3.7 Sonnetは3人のジムリーダーを倒し、彼らのバッジを獲得しました。

画像提供:Anthropic さて、AnthropicはClaude 3.7 Sonnetがこれらの成果を達成するのに必要な計算能力や所要時間を具体的に明かしませんでした。彼らはただ、モデルが最後のジムリーダーであるマチスと対決するために、驚くべき35,000のアクションを実行したと述べました。先週、ある研究者がClaude 3.7 Sonnetの早期プレビューを試しました。
結果は驚くべきものでした。数時間以内に、Claudeはカツラを倒しました。数日後にはカスミを圧倒しました。古いモデルではほとんど達成できなかった進歩です。
拡張思考が非常に効果的であることが分かりました。pic.twitter.com/RspsLgj2Uf
— Anthropic (@AnthropicAI) 2025年2月25日
すぐにでも賢い開発者が詳細を解明するでしょう。
ポケモン赤はちょっとした楽しいテストのように思えるかもしれませんが、実際にはゲームはAIのベンチマークとして長い間使われてきました。ここ数ヶ月だけでも、AIモデルがストリートファイターからピクショナリーまで、さまざまなゲームをどれだけうまくプレイできるかをテストする新しいアプリやプラットフォームがたくさん登場しています。
関連記事
グーグルのAI「Gemini」が「ポケモンブルー」をアシストで攻略
グーグルのAIマイルストーン:古典的なポケモンアドベンチャーを制覇グーグルの最先端AIモデルが、1996年にゲームボーイで発売された「ポケモンブルー」を完成させるという、特筆すべきゲーム上のブレークスルーを達成したようだ。CEOのスンダル・ピチャイはソーシャルメディアでこの偉業を祝ったが、この偉業には重要な背景がある。Gemini Plays Pokémonのライブストリーム・プロジェクトは、実際
AIベンチマークに関する議論はポケモンに到達しました
ポケモンの最愛の世界でさえ、AIのベンチマークを取り巻くドラマの影響を受けません。 Xに関する最近のウイルスの投稿は、Googleの最新のGeminiモデルが古典的なポケモンビデオゲームの3部作で人類の主要なクロードモデルを上回っていたと主張し、かなりの話題を刺激しました。投稿によると、ジェミニ
テンセントの「小龍蝦」が予想を上回る大ヒット、チームは生産能力を10倍に拡大し、謝罪と補償を実施
テンセントは、あらゆるシナリオに対応するAIインテリジェントエージェント「WorkBuddy」を正式にリリースした。これは、高い統合性と低い導入ハードルを特徴とし、大規模モデルアプリケーション層における競争に新たな局面をもたらすものである。同製品はリリース当日から業界の注目を集めた。 ユーザーアクセス数が予想を大幅に上回り、関連サービスである「Tencent Cloud Code Assistan
関連特集おすすめ
コメント (19)
0/500
와, AI로 포켓몬을 플레이하다니 너무 신기하다 🦄 어떤 기술로 게임을 클리어했는지 궁금해요. 아마도 화면 픽셀 인식과 결정 과정을 학습하는 방식이겠죠? 이렇게 발전하다 보면 AI가 슈퍼마리오도 깰 수 있을까?
Whoa, using Pokémon Red to test Claude 3.7? That's such a nostalgic flex! I wonder how it handled the Elite Four—bet it overanalyzed every move like a pro gamer. 😎
Whoa, using Pokémon Red to test Claude 3.7? That's such a nostalgic flex! I wonder how it handles those tricky Gym battles—hope it didn't get stuck in Rock Tunnel! 😄
Whoa, using Pokémon Red to test Claude 3.7? That’s such a nostalgic flex! Makes me wonder if AI could ever master my childhood Pikachu strats. 🕹️
Usar Pokémon Red para testar o Claude 3.7 Sonnet? Isso é loucura! É legal ver a IA enfrentando jogos clássicos, mas será que consegue vencer a Elite Four? As habilidades de memória e leitura de pixels da IA são impressionantes. Talvez na próxima tentem com o Pokémon Blue! 😂
驚くべきことに、Anthropicは最新のAIモデルであるClaude 3.7 Sonnetを、クラシックなGame Boyゲーム、ポケモン赤で試すことを決定しました。月曜日に公開されたブログ投稿によると、同社はこのモデルに必要なものを装備しました:メモリ、画面のピクセルを読み取る能力、そしてボタンを押したりゲーム画面内を移動したりする力です。この設定により、Claude 3.7 Sonnetはポケモンの世界に飛び込み、プレイを続けることができました。
Claude 3.7 Sonnetを際立たせるのは、その「拡張思考」の能力です。OpenAIのo3-miniやDeepSeekのR1のような他のモデルと同様に、計算能力を高め、じっくり考える時間を取ることで難しい問題に取り組むことができます。
この機能はポケモン赤でゲームチェンジャーであることが証明されました。古いClaude 3.0 Sonnetはパレットタウンのスタートエリアから抜け出すことさえできませんでしたが、Claude 3.7 Sonnetは3人のジムリーダーを倒し、彼らのバッジを獲得しました。

先週、ある研究者がClaude 3.7 Sonnetの早期プレビューを試しました。
結果は驚くべきものでした。数時間以内に、Claudeはカツラを倒しました。数日後にはカスミを圧倒しました。古いモデルではほとんど達成できなかった進歩です。
拡張思考が非常に効果的であることが分かりました。pic.twitter.com/RspsLgj2Uf
— Anthropic (@AnthropicAI) 2025年2月25日
すぐにでも賢い開発者が詳細を解明するでしょう。
ポケモン赤はちょっとした楽しいテストのように思えるかもしれませんが、実際にはゲームはAIのベンチマークとして長い間使われてきました。ここ数ヶ月だけでも、AIモデルがストリートファイターからピクショナリーまで、さまざまなゲームをどれだけうまくプレイできるかをテストする新しいアプリやプラットフォームがたくさん登場しています。
グーグルのAI「Gemini」が「ポケモンブルー」をアシストで攻略
グーグルのAIマイルストーン:古典的なポケモンアドベンチャーを制覇グーグルの最先端AIモデルが、1996年にゲームボーイで発売された「ポケモンブルー」を完成させるという、特筆すべきゲーム上のブレークスルーを達成したようだ。CEOのスンダル・ピチャイはソーシャルメディアでこの偉業を祝ったが、この偉業には重要な背景がある。Gemini Plays Pokémonのライブストリーム・プロジェクトは、実際
AIベンチマークに関する議論はポケモンに到達しました
ポケモンの最愛の世界でさえ、AIのベンチマークを取り巻くドラマの影響を受けません。 Xに関する最近のウイルスの投稿は、Googleの最新のGeminiモデルが古典的なポケモンビデオゲームの3部作で人類の主要なクロードモデルを上回っていたと主張し、かなりの話題を刺激しました。投稿によると、ジェミニ
テンセントの「小龍蝦」が予想を上回る大ヒット、チームは生産能力を10倍に拡大し、謝罪と補償を実施
テンセントは、あらゆるシナリオに対応するAIインテリジェントエージェント「WorkBuddy」を正式にリリースした。これは、高い統合性と低い導入ハードルを特徴とし、大規模モデルアプリケーション層における競争に新たな局面をもたらすものである。同製品はリリース当日から業界の注目を集めた。 ユーザーアクセス数が予想を大幅に上回り、関連サービスである「Tencent Cloud Code Assistan
와, AI로 포켓몬을 플레이하다니 너무 신기하다 🦄 어떤 기술로 게임을 클리어했는지 궁금해요. 아마도 화면 픽셀 인식과 결정 과정을 학습하는 방식이겠죠? 이렇게 발전하다 보면 AI가 슈퍼마리오도 깰 수 있을까?
Whoa, using Pokémon Red to test Claude 3.7? That's such a nostalgic flex! I wonder how it handled the Elite Four—bet it overanalyzed every move like a pro gamer. 😎
Whoa, using Pokémon Red to test Claude 3.7? That's such a nostalgic flex! I wonder how it handles those tricky Gym battles—hope it didn't get stuck in Rock Tunnel! 😄
Whoa, using Pokémon Red to test Claude 3.7? That’s such a nostalgic flex! Makes me wonder if AI could ever master my childhood Pikachu strats. 🕹️
Usar Pokémon Red para testar o Claude 3.7 Sonnet? Isso é loucura! É legal ver a IA enfrentando jogos clássicos, mas será que consegue vencer a Elite Four? As habilidades de memória e leitura de pixels da IA são impressionantes. Talvez na próxima tentem com o Pokémon Blue! 😂





家






