人类使用神奇宝贝来基准其最新的AI型号
令人惊讶的是,Anthropic决定将其最新的AI模型Claude 3.7十四行诗与经典游戏男孩游戏PokémonRed进行测试。根据周一发布的博客文章,该公司用“基本要素:内存,读取屏幕像素的能力”以及按下按钮并在游戏屏幕上移动的功能。这种设置使Claude 3.7十四行诗能够潜入神奇宝贝的世界并继续演奏。
克劳德(Claude)3.7十四行诗(Claude 3.7十四行诗)的原因是其“扩展思维”的诀窍。与其他型号相似,例如OpenAI的O3-Mini和DeepSeek的R1,它可以通过提高计算能力并花时间来思考事物来解决艰难的问题。
事实证明,此功能是PokémonRed的游戏规则改变者。虽然年长的克劳德3.0十四行诗甚至无法从托盘镇的起步区域中脱颖而出,但克劳德3.7十四行诗设法击倒了三名体育馆领导者并抓住了徽章。

图片来源:拟人化 现在,拟人化并没有确切地将豆类洒到需要多少计算能力或克劳德3.7十四行诗达到这些里程碑所花费的时间。他们刚刚提到,该模型采取了超过35,000个动作,以与最后一位体育馆领导者Surge对抗。
上周,一名研究人员尝试了Claude 3.7十四行诗的早期预览。
结果令人惊讶。几个小时之内,克劳德击败了布罗克。几天后,它击败了Misty。较旧模型几乎没有实现的希望。
事实证明,扩展的思维非常有效。 pic.twitter.com/rspslgj2uf
- 拟人化(@anthropicai)2025年2月25日
不久之后,一些聪明的开发人员就可以弄清楚细节的细节。
虽然PokémonRed似乎有点有趣,但游戏实际上已用于AI基准测试。就在过去的几个月中,我们看到了许多新的应用程序和平台弹出,以测试AI模型如何播放从Street Fighter到Pictionary的所有内容。
相关文章
关于AI基准测试的辩论已达到神奇宝贝
即使是神奇宝贝的挚爱世界也不能免疫AI基准的戏剧。最近在X上的病毒帖子引起了轰动,声称Google的最新双子座模特在经典的Pokémon视频游戏三部曲中超过了Anthropic的领先Claude模型。根据帖子,双子座
使用AI驱动的表情包短视频提升参与度以实现病毒式增长
创建病毒式表情包短视频的终极指南(并从中赚钱)想将你的社交媒体影响力变成赚钱机器吗?这里有一个小秘密:一些最病毒化的内容也是最简单的。我指的是那些让人欲罢不能的表情包短视频——最好的部分是?你可以使用AI工具轻松创建它们。为什么表情包短视频是你社交媒体成功的门票让我为你描绘一幅画面:短小精悍的视频,带有引人注目的表情包动画,观看量高达数百万。听起来好得不真实?并非如此。这些小巧的视频已成为内容创作
使用ChatGPT掌握故事板创作:逐步指南
如何使用ChatGPT创建故事板(即使你不会画画)故事板对于电影制作者、动画师和游戏开发者来说是一个改变游戏规则的工具——它帮助你在制作开始前可视化场景、规划镜头角度并优化你的叙事。但如果你不是艺术家怎么办?引入 ChatGPT,一种AI工具,可以在几分钟内生成故事板概念,即使你从未拿过铅笔。 本指南将带你逐步了解如何使用ChatGPT创建专业外观的故事板——从编写完美的提示词到优化最终图像。 为
评论 (15)
0/200
GeorgeWilliams
2025-04-12 08:00:00
Using Pokémon to benchmark AI? That's wild! Claude 3.7 Sonnet playing Pokémon Red is pretty cool, but does it really show off its capabilities? I mean, it's fun to watch, but I'm not sure it's the best test. Still, props for creativity! 🤓🎮
0
StephenGreen
2025-04-12 08:00:00
ポケモンを使ってAIをベンチマークするなんて面白い!クロード3.7ソネットがポケモン赤をプレイするのはかっこいいけど、本当にその能力を示しているのかな?楽しめるけど、ベストなテストかどうかはわからないね。それでも、創造性には拍手を!👏🎮
0
RogerSanchez
2025-04-13 08:00:00
포켓몬으로 AI를 벤치마크하다니 신기해! 클로드 3.7 소넷이 포켓몬 레드를 플레이하는 건 멋지지만, 정말 그 능력을 보여주는 건지 모르겠어. 재미있지만, 최고의 테스트인지 의문이야. 그래도 창의성에 박수를! 👏🎮
0
HenryTurner
2025-04-15 08:00:00
Usar Pokémon para benchmark de IA? Isso é loucura! Claude 3.7 Sonnet jogando Pokémon Red é bem legal, mas será que realmente mostra suas capacidades? É divertido de assistir, mas não tenho certeza se é o melhor teste. Mesmo assim, parabéns pela criatividade! 🤓🎮
0
JohnGarcia
2025-04-15 08:00:00
¡Usar Pokémon para benchmark de IA? ¡Eso es una locura! Que Claude 3.7 Sonnet juegue a Pokémon Red es genial, pero ¿realmente muestra sus capacidades? Es divertido verlo, pero no estoy seguro de que sea la mejor prueba. Aún así, ¡felicidades por la creatividad! 🤓🎮
0
TerryGonzález
2025-04-12 08:00:00
Using Pokémon to test AI? That's wild! Claude 3.7 Sonnet tackling Pokémon Red is so cool, but kinda weird too. It's neat that it can read screen pixels and remember stuff, but does it actually catch 'em all? 🤔 Fun idea, but I wonder how practical it is in real life. Gotta catch 'em all, right? 😂
0
令人惊讶的是,Anthropic决定将其最新的AI模型Claude 3.7十四行诗与经典游戏男孩游戏PokémonRed进行测试。根据周一发布的博客文章,该公司用“基本要素:内存,读取屏幕像素的能力”以及按下按钮并在游戏屏幕上移动的功能。这种设置使Claude 3.7十四行诗能够潜入神奇宝贝的世界并继续演奏。
克劳德(Claude)3.7十四行诗(Claude 3.7十四行诗)的原因是其“扩展思维”的诀窍。与其他型号相似,例如OpenAI的O3-Mini和DeepSeek的R1,它可以通过提高计算能力并花时间来思考事物来解决艰难的问题。
事实证明,此功能是PokémonRed的游戏规则改变者。虽然年长的克劳德3.0十四行诗甚至无法从托盘镇的起步区域中脱颖而出,但克劳德3.7十四行诗设法击倒了三名体育馆领导者并抓住了徽章。
上周,一名研究人员尝试了Claude 3.7十四行诗的早期预览。
结果令人惊讶。几个小时之内,克劳德击败了布罗克。几天后,它击败了Misty。较旧模型几乎没有实现的希望。
事实证明,扩展的思维非常有效。 pic.twitter.com/rspslgj2uf
- 拟人化(@anthropicai)2025年2月25日
不久之后,一些聪明的开发人员就可以弄清楚细节的细节。
虽然PokémonRed似乎有点有趣,但游戏实际上已用于AI基准测试。就在过去的几个月中,我们看到了许多新的应用程序和平台弹出,以测试AI模型如何播放从Street Fighter到Pictionary的所有内容。




Using Pokémon to benchmark AI? That's wild! Claude 3.7 Sonnet playing Pokémon Red is pretty cool, but does it really show off its capabilities? I mean, it's fun to watch, but I'm not sure it's the best test. Still, props for creativity! 🤓🎮




ポケモンを使ってAIをベンチマークするなんて面白い!クロード3.7ソネットがポケモン赤をプレイするのはかっこいいけど、本当にその能力を示しているのかな?楽しめるけど、ベストなテストかどうかはわからないね。それでも、創造性には拍手を!👏🎮




포켓몬으로 AI를 벤치마크하다니 신기해! 클로드 3.7 소넷이 포켓몬 레드를 플레이하는 건 멋지지만, 정말 그 능력을 보여주는 건지 모르겠어. 재미있지만, 최고의 테스트인지 의문이야. 그래도 창의성에 박수를! 👏🎮




Usar Pokémon para benchmark de IA? Isso é loucura! Claude 3.7 Sonnet jogando Pokémon Red é bem legal, mas será que realmente mostra suas capacidades? É divertido de assistir, mas não tenho certeza se é o melhor teste. Mesmo assim, parabéns pela criatividade! 🤓🎮




¡Usar Pokémon para benchmark de IA? ¡Eso es una locura! Que Claude 3.7 Sonnet juegue a Pokémon Red es genial, pero ¿realmente muestra sus capacidades? Es divertido verlo, pero no estoy seguro de que sea la mejor prueba. Aún así, ¡felicidades por la creatividad! 🤓🎮




Using Pokémon to test AI? That's wild! Claude 3.7 Sonnet tackling Pokémon Red is so cool, but kinda weird too. It's neat that it can read screen pixels and remember stuff, but does it actually catch 'em all? 🤔 Fun idea, but I wonder how practical it is in real life. Gotta catch 'em all, right? 😂












