選項
首頁
消息
人類使用神奇寶貝來基准其最新的AI型號

人類使用神奇寶貝來基准其最新的AI型號

2025-04-10
89

令人驚訝的是,Anthropic決定將其最新的AI模型Claude 3.7十四行詩與經典遊戲男孩遊戲PokémonRed進行測試。根據周一發布的博客文章,該公司用“基本要素:內存,讀取屏幕像素的能力”以及按下按鈕並在遊戲屏幕上移動的功能。這種設置使Claude 3.7十四行詩能夠潛入神奇寶貝的世界並繼續演奏。

克勞德(Claude)3.7十四行詩(Claude 3.7十四行詩)的原因是其“擴展思維”的訣竅。與其他型號相似,例如OpenAI的O3-Mini和DeepSeek的R1,它可以通過提高計算能力並花時間來思考事物來解決艱難的問題。

事實證明,此功能是PokémonRed的遊戲規則改變者。雖然年長的克勞德3.0十四行詩甚至無法從托盤鎮的起步區域中脫穎而出,但克勞德3.7十四行詩設法擊倒了三名體育館領導者並抓住了徽章。

人類的口袋妖怪紅

圖片來源:擬人化
現在,擬人化並沒有確切地將豆類灑到需要多少計算能力或克勞德3.7十四行詩達到這些里程碑所花費的時間。他們剛剛提到,該模型採取了超過35,000個動作,以與最後一位體育館領導者Surge對抗。

上週,一名研究人員嘗試了Claude 3.7十四行詩的早期預覽。

結果令人驚訝。幾個小時之內,克勞德擊敗了布羅克。幾天后,它擊敗了Misty。較舊模型幾乎沒有實現的希望。

事實證明,擴展的思維非常有效。 pic.twitter.com/rspslgj2uf

- 擬人化(@anthropicai)2025年2月25日

不久之後,一些聰明的開發人員就可以弄清楚細節的細節。

雖然PokémonRed似乎有點有趣,但遊戲實際上已用於AI基準測試。就在過去的幾個月中,我們看到了許多新的應用程序和平台彈出,以測試AI模型如何播放從Street Fighter到Pictionary的所有內容。

相關文章
Дебаты по сравнению с ИИ достигли покемонов Дебаты по сравнению с ИИ достигли покемонов Даже любимый мир покемонов не застрахован от драмы, окружающей тесты ИИ. Недавний вирусный пост на X разжигал настоящий гул, утверждая, что последняя модель Gemini Google опередила ведущую модель Claude Antropic в классической трилогии видеоигр Pokémon. Согласно сообщению, Близнецы
Fireflies.ai與Microsoft Planner優化會議筆記自動化 Fireflies.ai與Microsoft Planner優化會議筆記自動化 會議筆記與任務管理自動化終極指南想像從此不必手動記錄會議內容。不再匆忙記下行動項目,不再遺忘任務——只需幾次輕鬆點擊即可實現無縫自動化。本指南將帶您體驗結合Fireflies.ai、Make.com、Excel與Microsoft Planner的強大工作流程,實現以下功能:✅ 自動轉錄與總結會議✅ 提取關鍵行動項目✅ 在Excel中記錄任務以便追蹤✅ 直接在Planner中分配任務讓我們開始,永
使用AI驅動的表情符號短片提升參與度以實現病毒式增長 使用AI驅動的表情符號短片提升參與度以實現病毒式增長 使用AI創建病毒式表情符號短片的終極指南(並從中賺錢)想將您的社交媒體存在轉化為賺錢機器嗎?這裏有一個小秘密:一些最病毒化的內容也是最簡單的。我說的是那些讓您無法停止觀看的令人上癮的表情符號短片——最棒的部分?您可以使用AI工具輕鬆創建它們。為什麼表情符號短片是您社交媒體成功的門票讓我為您描繪一幅畫面:短小精悍的視頻,帶有吸引眼球的表情符號動畫,獲得數百萬的觀看量。聽起來好得令人難以置信?並非如此
評論 (15)
0/200
GeorgeWilliams
GeorgeWilliams 2025-04-12 08:00:00

Using Pokémon to benchmark AI? That's wild! Claude 3.7 Sonnet playing Pokémon Red is pretty cool, but does it really show off its capabilities? I mean, it's fun to watch, but I'm not sure it's the best test. Still, props for creativity! 🤓🎮

StephenGreen
StephenGreen 2025-04-12 08:00:00

ポケモンを使ってAIをベンチマークするなんて面白い!クロード3.7ソネットがポケモン赤をプレイするのはかっこいいけど、本当にその能力を示しているのかな?楽しめるけど、ベストなテストかどうかはわからないね。それでも、創造性には拍手を!👏🎮

RogerSanchez
RogerSanchez 2025-04-13 08:00:00

포켓몬으로 AI를 벤치마크하다니 신기해! 클로드 3.7 소넷이 포켓몬 레드를 플레이하는 건 멋지지만, 정말 그 능력을 보여주는 건지 모르겠어. 재미있지만, 최고의 테스트인지 의문이야. 그래도 창의성에 박수를! 👏🎮

HenryTurner
HenryTurner 2025-04-15 08:00:00

Usar Pokémon para benchmark de IA? Isso é loucura! Claude 3.7 Sonnet jogando Pokémon Red é bem legal, mas será que realmente mostra suas capacidades? É divertido de assistir, mas não tenho certeza se é o melhor teste. Mesmo assim, parabéns pela criatividade! 🤓🎮

JohnGarcia
JohnGarcia 2025-04-15 08:00:00

¡Usar Pokémon para benchmark de IA? ¡Eso es una locura! Que Claude 3.7 Sonnet juegue a Pokémon Red es genial, pero ¿realmente muestra sus capacidades? Es divertido verlo, pero no estoy seguro de que sea la mejor prueba. Aún así, ¡felicidades por la creatividad! 🤓🎮

TerryGonzález
TerryGonzález 2025-04-12 08:00:00

Using Pokémon to test AI? That's wild! Claude 3.7 Sonnet tackling Pokémon Red is so cool, but kinda weird too. It's neat that it can read screen pixels and remember stuff, but does it actually catch 'em all? 🤔 Fun idea, but I wonder how practical it is in real life. Gotta catch 'em all, right? 😂

回到頂部
OR