选项
首页 新闻 人类使用神奇宝贝来基准其最新的AI型号

人类使用神奇宝贝来基准其最新的AI型号

发布日期 发布日期 2025年04月10日
作者 作者 AvaHill
浏览量 浏览量 41

令人惊讶的是,Anthropic决定将其最新的AI模型Claude 3.7十四行诗与经典游戏男孩游戏PokémonRed进行测试。根据周一发布的博客文章,该公司用“基本要素:内存,读取屏幕像素的能力”以及按下按钮并在游戏屏幕上移动的功能。这种设置使Claude 3.7十四行诗能够潜入神奇宝贝的世界并继续演奏。

克劳德(Claude)3.7十四行诗(Claude 3.7十四行诗)的原因是其“扩展思维”的诀窍。与其他型号相似,例如OpenAI的O3-Mini和DeepSeek的R1,它可以通过提高计算能力并花时间来思考事物来解决艰难的问题。

事实证明,此功能是PokémonRed的游戏规则改变者。虽然年长的克劳德3.0十四行诗甚至无法从托盘镇的起步区域中脱颖而出,但克劳德3.7十四行诗设法击倒了三名体育馆领导者并抓住了徽章。

人类的口袋妖怪红

图片来源:拟人化
现在,拟人化并没有确切地将豆类洒到需要多少计算能力或克劳德3.7十四行诗达到这些里程碑所花费的时间。他们刚刚提到,该模型采取了超过35,000个动作,以与最后一位体育馆领导者Surge对抗。

上周,一名研究人员尝试了Claude 3.7十四行诗的早期预览。

结果令人惊讶。几个小时之内,克劳德击败了布罗克。几天后,它击败了Misty。较旧模型几乎没有实现的希望。

事实证明,扩展的思维非常有效。 pic.twitter.com/rspslgj2uf

- 拟人化(@anthropicai)2025年2月25日

不久之后,一些聪明的开发人员就可以弄清楚细节的细节。

虽然PokémonRed似乎有点有趣,但游戏实际上已用于AI基准测试。就在过去的几个月中,我们看到了许多新的应用程序和平台弹出,以测试AI模型如何播放从Street Fighter到Pictionary的所有内容。

相关文章
Debates over AI benchmarking have reached Pokémon Debates over AI benchmarking have reached Pokémon Even the beloved world of Pokémon isn't immune to the drama surrounding AI benchmarks. A recent viral post on X stirred up quite the buzz, claiming that Google's latest Gemini model had outpaced Anthropic's leading Claude model in the classic Pokémon video game trilogy. According to the post, Gemini
AI驱动的Facebook广告副本:快速生成广告 AI驱动的Facebook广告副本:快速生成广告 AI在制作中的革命吸引Facebook广告复制《数字营销的旋风世界》,迅速吸引Facebook广告副本的能力是必不可少的。输入人工智能(AI),这是一种改变游戏规则的人,正在重塑我们如何处理广告创建。本指南d
AI标题生成器:轻快的教学评估 AI标题生成器:轻快的教学评估 在充满活力的教育世界中,教师总是在寻找可以简化工作的工具,同时促进学生学习。输入Brisk教学的AI标语生成器 - 在评估领域中改变游戏规则。这种漂亮的工具可帮助教育者在快照中制作个性化的专栏
评论 (15)
0/200
GeorgeWilliams
GeorgeWilliams 2025年04月11日 17:22:08

Using Pokémon to benchmark AI? That's wild! Claude 3.7 Sonnet playing Pokémon Red is pretty cool, but does it really show off its capabilities? I mean, it's fun to watch, but I'm not sure it's the best test. Still, props for creativity! 🤓🎮

StephenGreen
StephenGreen 2025年04月12日 03:40:24

ポケモンを使ってAIをベンチマークするなんて面白い!クロード3.7ソネットがポケモン赤をプレイするのはかっこいいけど、本当にその能力を示しているのかな?楽しめるけど、ベストなテストかどうかはわからないね。それでも、創造性には拍手を!👏🎮

RogerSanchez
RogerSanchez 2025年04月13日 05:05:35

포켓몬으로 AI를 벤치마크하다니 신기해! 클로드 3.7 소넷이 포켓몬 레드를 플레이하는 건 멋지지만, 정말 그 능력을 보여주는 건지 모르겠어. 재미있지만, 최고의 테스트인지 의문이야. 그래도 창의성에 박수를! 👏🎮

HenryTurner
HenryTurner 2025年04月14日 22:24:40

Usar Pokémon para benchmark de IA? Isso é loucura! Claude 3.7 Sonnet jogando Pokémon Red é bem legal, mas será que realmente mostra suas capacidades? É divertido de assistir, mas não tenho certeza se é o melhor teste. Mesmo assim, parabéns pela criatividade! 🤓🎮

JohnGarcia
JohnGarcia 2025年04月14日 19:59:47

¡Usar Pokémon para benchmark de IA? ¡Eso es una locura! Que Claude 3.7 Sonnet juegue a Pokémon Red es genial, pero ¿realmente muestra sus capacidades? Es divertido verlo, pero no estoy seguro de que sea la mejor prueba. Aún así, ¡felicidades por la creatividad! 🤓🎮

TerryGonzález
TerryGonzález 2025年04月12日 04:11:07

Using Pokémon to test AI? That's wild! Claude 3.7 Sonnet tackling Pokémon Red is so cool, but kinda weird too. It's neat that it can read screen pixels and remember stuff, but does it actually catch 'em all? 🤔 Fun idea, but I wonder how practical it is in real life. Gotta catch 'em all, right? 😂

返回顶部
OR