克劳德·艾(Claude AI)以缓慢的节奏在抽搐上扮演神奇宝贝
周二下午,Anthropic在Twitch上开启了一场独特的直播,名为“Claude玩宝可梦”,展示了他们最新的AI模型Claude 3.7 Sonnet挑战《宝可梦红》。这是一个引人入胜的实验,不仅展示了AI的能力,还捕捉了观众对这一尖端技术的反应。
AI研究人员常通过视频游戏如《街头霸王》和《你画我猜》来测试新模型,通常更多是为了娱乐而非实际应用。然而,Anthropic发现《宝可梦》是Claude 3.7 Sonnet的一个有效基准,该模型通过“思考”擅长解决游戏中的谜题。
类似于OpenAI的o3-mini和DeepSeek的R1,Claude 3.7 Sonnet能够应对复杂的挑战,例如玩一款为儿童设计的游戏。其前身Claude 3.5 Sonnet甚至无法离开帕尔特镇玩家的家,而Claude 3.7 Sonnet成功获得了三个道馆徽章。

Claude在《宝可梦红》中挣扎着离开一栋建筑。图片来源:Twitch上的Claude玩宝可梦 尽管取得了进步,Claude 3.7 Sonnet仍会遇到障碍。在Twitch直播中,它被一堵岩壁难住,无论如何尝试都无法通过。
一位Twitch观众幽默地评论道:“谁会赢?一个投入了数千小时编程的计算机AI,还是一个岩壁?”
最终,Claude找到了绕过障碍的方法。
观看Claude玩《宝可梦红》可能会让人感到缓慢得令人沮丧,因为它会一丝不苟地推理每一个动作。然而,这也奇特地引人入胜。直播屏幕左侧显示Claude的“思考过程”,右侧则是实时游戏画面。
在某一时刻,Claude试图在实验室中找到大木博士,却被其他在场的NPC弄糊涂了。
“我注意到一个新角色出现在我下方——一个黑发、似乎穿着白大褂的角色,坐标为(2, 10),”Claude记录道。“这可能是大木博士!让我下去和他对话。”
不幸的是,Claude错误地与一个之前已多次遇到的NPC对话,引发了Twitch聊天室中上千名观众的些许不满。然而,观看较久的观众则更有耐心。
“大家冷静,”一位观众写道。“我们之前在进入和离开大木实验室十次后才弄明白如何继续。”

图片来源:Anthropic 对于长期使用Twitch的用户来说,Anthropic的直播可能唤起怀旧之情。十多年前,Twitch玩宝可梦成为一项开创性的社交实验,数百万用户通过聊天命令集体控制游戏,带来了混乱但令人难忘的游戏体验。
一些AI研究人员从Twitch玩宝可梦中汲取了灵感。2023年10月,西雅图的软件工程师Peter Whidden分享了一段YouTube视频,讲述训练强化学习算法玩《宝可梦》。他的AI花费了超过50,000小时掌握游戏,一个有趣的挑战是它倾向于欣赏像素化的风景而非实际玩游戏。
虽然Whidden和Anthropic的AI驱动重现很有趣,但也带有一丝苦乐参半的意味。最初的Twitch玩宝可梦是一个里程碑时刻,将人们团结在一个共同的、尽管混乱的努力中,共同推进游戏。
然而,到了2025年,我们从积极的参与者变成了单纯的观察者,看着AI在许多人小时候就已熟练掌握的游戏中挣扎。这反映了我们在线体验的更广泛趋势,从群体活动转向更孤立的体验。
相关文章
Anthropic 与 Google 和 Broadrom 扩大计算合作
人工智能研究实验室Anthropic周一宣布,已与谷歌和博通达成一项新协议,旨在大幅提升其Claude AI模型背后的处理和计算能力。随着对其AI产品需求的持续快速增长,该公司对其计算合作伙伴关系进行了此次调整。这些协议将扩大Anthropic对谷歌云张量处理单元(TPUs)——即谷歌专用的AI芯片——的使用范围,并进一步拓展了双方于2025年10月达成的、涉及超过1吉瓦计算容量的合作协议。Ant
随着用户迁移,Claude在ChatGPT面前逐渐占据上风
随着ChatGPT及其母公司OpenAI卷入一系列争议,越来越多的用户正转向Claude。转折点出现在Claude的开发者Anthropic拒绝了美国国防部关于将其AI模型用于大规模国内监控或全自主武器的请求之后。作为报复,特朗普总统下令所有联邦机构停止使用Anthropic的产品,国防部长皮特·赫格塞斯则采取行动,将该公司列为供应链威胁。不久之后,OpenAI披露了其与五角大楼的合作关系,并声称
Anthropic与五角大楼的对峙对国家安全意味着什么
过去两周,Anthropic首席执行官达里奥·阿莫迪与国防部长皮特·赫格塞斯之间围绕军方应用人工智能技术问题展开的公开对峙成为舆论焦点。Anthropic已制定政策,禁止其人工智能模型被用于对美国公民进行大规模监控,或用于未经人类批准即可发起攻击的完全自主武器系统。相比之下,赫格塞斯部长则主张国防部不应受供应商规则的约束,并呼吁允许将该技术用于任何“合法用途”。周四,阿莫迪公开表示,尽管面临可能被
相关专题推荐
评论 (61)
0/500
lol they really gave the AI an emulator and just let it loose? 💀 i half expected it to speedrun but this "watching paint dry" pace is lowkey hilarious. wonder if they had to nerf its processing to make it beatable for twitch chat or if it's actually calculating optimal moves in slow motion. Either way, huge missed opportunity to let it name the rival "Anthropic" for maximum chaos.
Watching an AI play a game slowly is oddly fascinating, like observing a very careful alien learn. I wonder what the actual internal reward mechanism is for 'progress'— or does it just see the stream chat and get influenced? Kinda spooky to think about! 😅
Interesting stream! It's cool to see Claude tackle classic games, but the 'slow pace' concept feels a bit like a stunt. Makes me wonder—is this a fun tech showcase, or are we just bored? 😅 Still, watching AI process that old-school pixel environment is oddly soothing.
Claude a jogar Pokémon? 😂 Parece a coisa mais inútil que já vi, mas mal posso parar de ver! Será que a IA vai conseguir apanhar todos os Pokémon? Tantas perguntas... Acho incrível como a tecnologia está a evoluir, mas também fico um bocado assustado com as possibilidades. Será que as IAs vão começar a jogar todos os nossos jogos? 🤔
Que ideia criativa! 🤯 Ver um IA jogar Pokémon parece simples, mas deve ser incrivelmente complexo nos bastidores. Será que o Claude consegue vencer o Brock sem escolher o Squirtle? #AIgaming
周二下午,Anthropic在Twitch上开启了一场独特的直播,名为“Claude玩宝可梦”,展示了他们最新的AI模型Claude 3.7 Sonnet挑战《宝可梦红》。这是一个引人入胜的实验,不仅展示了AI的能力,还捕捉了观众对这一尖端技术的反应。
AI研究人员常通过视频游戏如《街头霸王》和《你画我猜》来测试新模型,通常更多是为了娱乐而非实际应用。然而,Anthropic发现《宝可梦》是Claude 3.7 Sonnet的一个有效基准,该模型通过“思考”擅长解决游戏中的谜题。
类似于OpenAI的o3-mini和DeepSeek的R1,Claude 3.7 Sonnet能够应对复杂的挑战,例如玩一款为儿童设计的游戏。其前身Claude 3.5 Sonnet甚至无法离开帕尔特镇玩家的家,而Claude 3.7 Sonnet成功获得了三个道馆徽章。

尽管取得了进步,Claude 3.7 Sonnet仍会遇到障碍。在Twitch直播中,它被一堵岩壁难住,无论如何尝试都无法通过。
一位Twitch观众幽默地评论道:“谁会赢?一个投入了数千小时编程的计算机AI,还是一个岩壁?”
最终,Claude找到了绕过障碍的方法。
观看Claude玩《宝可梦红》可能会让人感到缓慢得令人沮丧,因为它会一丝不苟地推理每一个动作。然而,这也奇特地引人入胜。直播屏幕左侧显示Claude的“思考过程”,右侧则是实时游戏画面。
在某一时刻,Claude试图在实验室中找到大木博士,却被其他在场的NPC弄糊涂了。
“我注意到一个新角色出现在我下方——一个黑发、似乎穿着白大褂的角色,坐标为(2, 10),”Claude记录道。“这可能是大木博士!让我下去和他对话。”
不幸的是,Claude错误地与一个之前已多次遇到的NPC对话,引发了Twitch聊天室中上千名观众的些许不满。然而,观看较久的观众则更有耐心。
“大家冷静,”一位观众写道。“我们之前在进入和离开大木实验室十次后才弄明白如何继续。”

对于长期使用Twitch的用户来说,Anthropic的直播可能唤起怀旧之情。十多年前,Twitch玩宝可梦成为一项开创性的社交实验,数百万用户通过聊天命令集体控制游戏,带来了混乱但令人难忘的游戏体验。
一些AI研究人员从Twitch玩宝可梦中汲取了灵感。2023年10月,西雅图的软件工程师Peter Whidden分享了一段YouTube视频,讲述训练强化学习算法玩《宝可梦》。他的AI花费了超过50,000小时掌握游戏,一个有趣的挑战是它倾向于欣赏像素化的风景而非实际玩游戏。
虽然Whidden和Anthropic的AI驱动重现很有趣,但也带有一丝苦乐参半的意味。最初的Twitch玩宝可梦是一个里程碑时刻,将人们团结在一个共同的、尽管混乱的努力中,共同推进游戏。
然而,到了2025年,我们从积极的参与者变成了单纯的观察者,看着AI在许多人小时候就已熟练掌握的游戏中挣扎。这反映了我们在线体验的更广泛趋势,从群体活动转向更孤立的体验。
Anthropic 与 Google 和 Broadrom 扩大计算合作
人工智能研究实验室Anthropic周一宣布,已与谷歌和博通达成一项新协议,旨在大幅提升其Claude AI模型背后的处理和计算能力。随着对其AI产品需求的持续快速增长,该公司对其计算合作伙伴关系进行了此次调整。这些协议将扩大Anthropic对谷歌云张量处理单元(TPUs)——即谷歌专用的AI芯片——的使用范围,并进一步拓展了双方于2025年10月达成的、涉及超过1吉瓦计算容量的合作协议。Ant
随着用户迁移,Claude在ChatGPT面前逐渐占据上风
随着ChatGPT及其母公司OpenAI卷入一系列争议,越来越多的用户正转向Claude。转折点出现在Claude的开发者Anthropic拒绝了美国国防部关于将其AI模型用于大规模国内监控或全自主武器的请求之后。作为报复,特朗普总统下令所有联邦机构停止使用Anthropic的产品,国防部长皮特·赫格塞斯则采取行动,将该公司列为供应链威胁。不久之后,OpenAI披露了其与五角大楼的合作关系,并声称
Anthropic与五角大楼的对峙对国家安全意味着什么
过去两周,Anthropic首席执行官达里奥·阿莫迪与国防部长皮特·赫格塞斯之间围绕军方应用人工智能技术问题展开的公开对峙成为舆论焦点。Anthropic已制定政策,禁止其人工智能模型被用于对美国公民进行大规模监控,或用于未经人类批准即可发起攻击的完全自主武器系统。相比之下,赫格塞斯部长则主张国防部不应受供应商规则的约束,并呼吁允许将该技术用于任何“合法用途”。周四,阿莫迪公开表示,尽管面临可能被
lol they really gave the AI an emulator and just let it loose? 💀 i half expected it to speedrun but this "watching paint dry" pace is lowkey hilarious. wonder if they had to nerf its processing to make it beatable for twitch chat or if it's actually calculating optimal moves in slow motion. Either way, huge missed opportunity to let it name the rival "Anthropic" for maximum chaos.
Watching an AI play a game slowly is oddly fascinating, like observing a very careful alien learn. I wonder what the actual internal reward mechanism is for 'progress'— or does it just see the stream chat and get influenced? Kinda spooky to think about! 😅
Interesting stream! It's cool to see Claude tackle classic games, but the 'slow pace' concept feels a bit like a stunt. Makes me wonder—is this a fun tech showcase, or are we just bored? 😅 Still, watching AI process that old-school pixel environment is oddly soothing.
Claude a jogar Pokémon? 😂 Parece a coisa mais inútil que já vi, mas mal posso parar de ver! Será que a IA vai conseguir apanhar todos os Pokémon? Tantas perguntas... Acho incrível como a tecnologia está a evoluir, mas também fico um bocado assustado com as possibilidades. Será que as IAs vão começar a jogar todos os nossos jogos? 🤔
Que ideia criativa! 🤯 Ver um IA jogar Pokémon parece simples, mas deve ser incrivelmente complexo nos bastidores. Será que o Claude consegue vencer o Brock sem escolher o Squirtle? #AIgaming





首页






