人類使用神奇寶貝來基准其最新的AI型號
在令人意外的舉動中,Anthropic決定讓其最新的AI模型Claude 3.7 Sonnet接受經典Game Boy遊戲《Pokémon Red》的考驗。根據週一發表的部落格文章,該公司為此模型配備了必要的功能:記憶力、讀取螢幕像素的能力,以及按壓按鈕和在遊戲螢幕中移動的能力。這樣的設定讓Claude 3.7 Sonnet能夠深入Pokémon世界並持續遊戲。
Claude 3.7 Sonnet的獨特之處在於其「延伸思考」的能力。與OpenAI的o3-mini和DeepSeek的R1等其他模型類似,它能透過提升運算能力並花時間仔細思考來解決棘手的問題。
這項功能在《Pokémon Red》中被證明是改變遊戲規則的關鍵。舊版的Claude 3.0 Sonnet甚至無法離開起始地點Pallet Town,而Claude 3.7 Sonnet卻成功擊敗三位道館領袖並獲得他們的徽章。

圖片來源:Anthropic 現在,Anthropic並未透露Claude 3.7 Sonnet達成這些里程碑究竟需要多少運算能力或花費多少時間。他們僅提到該模型執行了多達35,000次動作,以對抗最後一位道館領袖Surge。上週,一位研究人員試用了Claude 3.7 Sonnet的早期預覽版。
結果令人震驚。幾小時內,Claude擊敗了Brock。幾天後,它又輕鬆戰勝Misty。這些進展是舊版模型幾乎無望達成的。
事實證明,延伸思考非常有效。pic.twitter.com/RspsLgj2Uf
— Anthropic (@AnthropicAI) 2025年2月25日
不久後,某位聰明的開發者應該會弄清楚這些細節。
雖然《Pokémon Red》看似只是一個有趣的測試,但遊戲其實長期以來都被用於AI基準測試。就在過去幾個月,我們看到許多新應用程式和平台湧現,測試AI模型在從《Street Fighter》到《Pictionary》等各種遊戲中的表現。
相關文章
Google 的 Gemini AI 在協助下征服 Pokémon Blue
Google 的 AI 里程碑:征服經典 Pokémon 冒險遊戲Google 最先進的 AI 模型似乎取得了顯著的遊戲突破 - 完成 1996 年 Game Boy 遊戲《Pokémon Blue》。首席執行長 Sundar Pichai 在社交媒體上慶祝這項成就,不過這項成就有其重要的背景。Gemini Plays Pokémon Liveestream 專案其實是由軟體工程師 Joel Z
關於AI基準測試的辯論已達到神奇寶貝
即使是神奇寶貝的摯愛世界也不能免疫AI基準的戲劇。最近在X上的病毒帖子引起了轟動,聲稱Google的最新雙子座模特在經典的Pokémon視頻遊戲三部曲中超過了Anthropic的領先Claude模型。根據帖子,雙子座
耀科傳媒首部AIGC劇集《秦嶺青銅之謎》今日上線,主演均由AI選角
今日,耀科傳媒的AIGC奇幻懸疑短劇《秦嶺青銅秘事》正式上線。本劇由該公司首批簽約的兩位AI演員秦凌月與林西妍主演,故事背景設定在神秘莫測的秦嶺礦區。 劇情追隨退休情報官秦月帶領團隊深入該區域,揭開一樁塵封已久的礦難,以及跨越兩代人的血祭真相——這份真相就隱藏在受限的地下區域,正是科學探索與古代巫術交匯之處。作為中國最早完全由AI數位人支持的電影之一,該劇在籌備階段便引發了業界熱烈討論,而關於其A
相關專題推薦
評論 (19)
0/500
와, AI로 포켓몬을 플레이하다니 너무 신기하다 🦄 어떤 기술로 게임을 클리어했는지 궁금해요. 아마도 화면 픽셀 인식과 결정 과정을 학습하는 방식이겠죠? 이렇게 발전하다 보면 AI가 슈퍼마리오도 깰 수 있을까?
Whoa, using Pokémon Red to test Claude 3.7? That's such a nostalgic flex! I wonder how it handled the Elite Four—bet it overanalyzed every move like a pro gamer. 😎
Whoa, using Pokémon Red to test Claude 3.7? That's such a nostalgic flex! I wonder how it handles those tricky Gym battles—hope it didn't get stuck in Rock Tunnel! 😄
Whoa, using Pokémon Red to test Claude 3.7? That’s such a nostalgic flex! Makes me wonder if AI could ever master my childhood Pikachu strats. 🕹️
Usar Pokémon Red para testar o Claude 3.7 Sonnet? Isso é loucura! É legal ver a IA enfrentando jogos clássicos, mas será que consegue vencer a Elite Four? As habilidades de memória e leitura de pixels da IA são impressionantes. Talvez na próxima tentem com o Pokémon Blue! 😂
在令人意外的舉動中,Anthropic決定讓其最新的AI模型Claude 3.7 Sonnet接受經典Game Boy遊戲《Pokémon Red》的考驗。根據週一發表的部落格文章,該公司為此模型配備了必要的功能:記憶力、讀取螢幕像素的能力,以及按壓按鈕和在遊戲螢幕中移動的能力。這樣的設定讓Claude 3.7 Sonnet能夠深入Pokémon世界並持續遊戲。
Claude 3.7 Sonnet的獨特之處在於其「延伸思考」的能力。與OpenAI的o3-mini和DeepSeek的R1等其他模型類似,它能透過提升運算能力並花時間仔細思考來解決棘手的問題。
這項功能在《Pokémon Red》中被證明是改變遊戲規則的關鍵。舊版的Claude 3.0 Sonnet甚至無法離開起始地點Pallet Town,而Claude 3.7 Sonnet卻成功擊敗三位道館領袖並獲得他們的徽章。

上週,一位研究人員試用了Claude 3.7 Sonnet的早期預覽版。
結果令人震驚。幾小時內,Claude擊敗了Brock。幾天後,它又輕鬆戰勝Misty。這些進展是舊版模型幾乎無望達成的。
事實證明,延伸思考非常有效。pic.twitter.com/RspsLgj2Uf
— Anthropic (@AnthropicAI) 2025年2月25日
不久後,某位聰明的開發者應該會弄清楚這些細節。
雖然《Pokémon Red》看似只是一個有趣的測試,但遊戲其實長期以來都被用於AI基準測試。就在過去幾個月,我們看到許多新應用程式和平台湧現,測試AI模型在從《Street Fighter》到《Pictionary》等各種遊戲中的表現。
Google 的 Gemini AI 在協助下征服 Pokémon Blue
Google 的 AI 里程碑:征服經典 Pokémon 冒險遊戲Google 最先進的 AI 模型似乎取得了顯著的遊戲突破 - 完成 1996 年 Game Boy 遊戲《Pokémon Blue》。首席執行長 Sundar Pichai 在社交媒體上慶祝這項成就,不過這項成就有其重要的背景。Gemini Plays Pokémon Liveestream 專案其實是由軟體工程師 Joel Z
關於AI基準測試的辯論已達到神奇寶貝
即使是神奇寶貝的摯愛世界也不能免疫AI基準的戲劇。最近在X上的病毒帖子引起了轟動,聲稱Google的最新雙子座模特在經典的Pokémon視頻遊戲三部曲中超過了Anthropic的領先Claude模型。根據帖子,雙子座
耀科傳媒首部AIGC劇集《秦嶺青銅之謎》今日上線,主演均由AI選角
今日,耀科傳媒的AIGC奇幻懸疑短劇《秦嶺青銅秘事》正式上線。本劇由該公司首批簽約的兩位AI演員秦凌月與林西妍主演,故事背景設定在神秘莫測的秦嶺礦區。 劇情追隨退休情報官秦月帶領團隊深入該區域,揭開一樁塵封已久的礦難,以及跨越兩代人的血祭真相——這份真相就隱藏在受限的地下區域,正是科學探索與古代巫術交匯之處。作為中國最早完全由AI數位人支持的電影之一,該劇在籌備階段便引發了業界熱烈討論,而關於其A
와, AI로 포켓몬을 플레이하다니 너무 신기하다 🦄 어떤 기술로 게임을 클리어했는지 궁금해요. 아마도 화면 픽셀 인식과 결정 과정을 학습하는 방식이겠죠? 이렇게 발전하다 보면 AI가 슈퍼마리오도 깰 수 있을까?
Whoa, using Pokémon Red to test Claude 3.7? That's such a nostalgic flex! I wonder how it handled the Elite Four—bet it overanalyzed every move like a pro gamer. 😎
Whoa, using Pokémon Red to test Claude 3.7? That's such a nostalgic flex! I wonder how it handles those tricky Gym battles—hope it didn't get stuck in Rock Tunnel! 😄
Whoa, using Pokémon Red to test Claude 3.7? That’s such a nostalgic flex! Makes me wonder if AI could ever master my childhood Pikachu strats. 🕹️
Usar Pokémon Red para testar o Claude 3.7 Sonnet? Isso é loucura! É legal ver a IA enfrentando jogos clássicos, mas será que consegue vencer a Elite Four? As habilidades de memória e leitura de pixels da IA são impressionantes. Talvez na próxima tentem com o Pokémon Blue! 😂





首頁






