選項
首頁 消息 人類使用神奇寶貝來基准其最新的AI型號

人類使用神奇寶貝來基准其最新的AI型號

發布日期 發布日期 2025年04月10日
作者 作者 AvaHill
視圖 視圖 41

令人驚訝的是,Anthropic決定將其最新的AI模型Claude 3.7十四行詩與經典遊戲男孩遊戲PokémonRed進行測試。根據周一發布的博客文章,該公司用“基本要素:內存,讀取屏幕像素的能力”以及按下按鈕並在遊戲屏幕上移動的功能。這種設置使Claude 3.7十四行詩能夠潛入神奇寶貝的世界並繼續演奏。

克勞德(Claude)3.7十四行詩(Claude 3.7十四行詩)的原因是其“擴展思維”的訣竅。與其他型號相似,例如OpenAI的O3-Mini和DeepSeek的R1,它可以通過提高計算能力並花時間來思考事物來解決艱難的問題。

事實證明,此功能是PokémonRed的遊戲規則改變者。雖然年長的克勞德3.0十四行詩甚至無法從托盤鎮的起步區域中脫穎而出,但克勞德3.7十四行詩設法擊倒了三名體育館領導者並抓住了徽章。

人類的口袋妖怪紅

圖片來源:擬人化
現在,擬人化並沒有確切地將豆類灑到需要多少計算能力或克勞德3.7十四行詩達到這些里程碑所花費的時間。他們剛剛提到,該模型採取了超過35,000個動作,以與最後一位體育館領導者Surge對抗。

上週,一名研究人員嘗試了Claude 3.7十四行詩的早期預覽。

結果令人驚訝。幾個小時之內,克勞德擊敗了布羅克。幾天后,它擊敗了Misty。較舊模型幾乎沒有實現的希望。

事實證明,擴展的思維非常有效。 pic.twitter.com/rspslgj2uf

- 擬人化(@anthropicai)2025年2月25日

不久之後,一些聰明的開發人員就可以弄清楚細節的細節。

雖然PokémonRed似乎有點有趣,但遊戲實際上已用於AI基準測試。就在過去的幾個月中,我們看到了許多新的應用程序和平台彈出,以測試AI模型如何播放從Street Fighter到Pictionary的所有內容。

相關文章
Debates over AI benchmarking have reached Pokémon Debates over AI benchmarking have reached Pokémon Even the beloved world of Pokémon isn't immune to the drama surrounding AI benchmarks. A recent viral post on X stirred up quite the buzz, claiming that Google's latest Gemini model had outpaced Anthropic's leading Claude model in the classic Pokémon video game trilogy. According to the post, Gemini
AI驅動的Facebook廣告副本:快速生成廣告 AI驅動的Facebook廣告副本:快速生成廣告 AI在製作中的革命吸引Facebook廣告複製《數字營銷的旋風世界》,迅速吸引Facebook廣告副本的能力是必不可少的。輸入人工智能(AI),這是一種改變遊戲規則的人,正在重塑我們如何處理廣告創建。本指南d
AI標題生成器:輕快的教學評估 AI標題生成器:輕快的教學評估 在充滿活力的教育世界中,教師總是在尋找可以簡化工作的工具,同時促進學生學習。輸入Brisk教學的AI標語生成器 - 在評估領域中改變遊戲規則。這種漂亮的工具可幫助教育者在快照中製作個性化的專欄
評論 (15)
0/200
GeorgeWilliams
GeorgeWilliams 2025年04月11日 17:22:08

Using Pokémon to benchmark AI? That's wild! Claude 3.7 Sonnet playing Pokémon Red is pretty cool, but does it really show off its capabilities? I mean, it's fun to watch, but I'm not sure it's the best test. Still, props for creativity! 🤓🎮

StephenGreen
StephenGreen 2025年04月12日 03:40:24

ポケモンを使ってAIをベンチマークするなんて面白い!クロード3.7ソネットがポケモン赤をプレイするのはかっこいいけど、本当にその能力を示しているのかな?楽しめるけど、ベストなテストかどうかはわからないね。それでも、創造性には拍手を!👏🎮

RogerSanchez
RogerSanchez 2025年04月13日 05:05:35

포켓몬으로 AI를 벤치마크하다니 신기해! 클로드 3.7 소넷이 포켓몬 레드를 플레이하는 건 멋지지만, 정말 그 능력을 보여주는 건지 모르겠어. 재미있지만, 최고의 테스트인지 의문이야. 그래도 창의성에 박수를! 👏🎮

HenryTurner
HenryTurner 2025年04月14日 22:24:40

Usar Pokémon para benchmark de IA? Isso é loucura! Claude 3.7 Sonnet jogando Pokémon Red é bem legal, mas será que realmente mostra suas capacidades? É divertido de assistir, mas não tenho certeza se é o melhor teste. Mesmo assim, parabéns pela criatividade! 🤓🎮

JohnGarcia
JohnGarcia 2025年04月14日 19:59:47

¡Usar Pokémon para benchmark de IA? ¡Eso es una locura! Que Claude 3.7 Sonnet juegue a Pokémon Red es genial, pero ¿realmente muestra sus capacidades? Es divertido verlo, pero no estoy seguro de que sea la mejor prueba. Aún así, ¡felicidades por la creatividad! 🤓🎮

TerryGonzález
TerryGonzález 2025年04月12日 04:11:07

Using Pokémon to test AI? That's wild! Claude 3.7 Sonnet tackling Pokémon Red is so cool, but kinda weird too. It's neat that it can read screen pixels and remember stuff, but does it actually catch 'em all? 🤔 Fun idea, but I wonder how practical it is in real life. Gotta catch 'em all, right? 😂

回到頂部
OR