人类的新AI模型运行像人类这样的计算机，包括错误

首页

新闻

2025-05-09

PaulGonzalez

213

人类的新AI模型运行像人类这样的计算机，包括错误

你是否梦想过一种能像人类一样无缝与电脑交互的AI？现在，这个梦想已成为现实，这要归功于Anthropic的最新创新。周二，他们推出了新一代Claude AI模型，名为Claude 3.5 Sonnet，它能以惊人的精细度操作电脑。目前处于测试阶段，此AI可供开发者通过API进行试验。

Anthropic自豪地将Claude 3.5 Sonnet称为“首个人公开测试中提供电脑使用功能的前沿AI模型”。这意味着开发者可编程让其在电脑上执行多种任务，如查看屏幕、移动光标、点击按钮，甚至在虚拟键盘上打字。目标是？复制我们每天与电脑的交互方式。

虽然这款新AI仍处于实验阶段，但并非没有瑕疵。它有时会显得有些笨拙和容易出错。但这正是Anthropic发布测试版的原因——从开发者那里收集宝贵反馈，并随时间完善模型。

为什么我们应该关心AI使用电脑？

Anthropic对此有明确答案：“现代工作的绝大部分通过电脑完成。”通过让AI以人类的方式与软件交互，它们开启了当前AI助手无法处理的大量新应用。

开发者和用户如何受益？

Anthropic没有为每个任务创建特定工具，而是教授Claude通用的电脑技能。这使AI能利用为人类设计的各种标准软件程序。开发者可利用此能力自动化重复任务、构建和测试软件，甚至进行研究。

多家公司已在利用Claude 3.5 Sonnet的电脑技能，包括Asana、Canva、Cognition、DoorDash、Replit和The Browser Company。例如，Replit正利用这些能力增强其Replit Agent产品。

他们如何训练Claude使用电脑？

据Anthropic称，训练Claude导航电脑涉及大量试错。过程要求AI理解并解释电脑屏幕的图像，然后根据所见决定采取哪些行动。Claude 3.5 Sonnet通过分析屏幕截图、计算像素以精确移动光标并发出鼠标命令来实现这一点。

Claude的表现如何？

在OSWorld基准测试中，评估AI模型使用电脑的能力，Claude 3.5 Sonnet得分14.9%。虽然这远低于人类70%-75%的表现，但几乎是同类别次佳AI模型7.7%的两倍。

尽管这些结果令人振奋，Claude的电脑使用仍处于初级阶段。它尚无法执行更复杂的任务，如拖动窗口或缩放屏幕。此外，由于依赖屏幕截图，它可能错过某些动作和通知。

Anthropic保持乐观，表示：“我们预计电脑使用功能将迅速改进，变得更快、更可靠、对用户想完成的任务更有用。”他们还强调，随着技术发展，它将对软件开发经验较少的人更易用，同时保持严格的安全措施。

Claude 3.5 Sonnet现已对所有人开放。开发者可在Anthropic API、Amazon Bedrock和Google Cloud的Vertex AI上开始构建电脑使用测试版的应用。

WordPress.com 现已支持 AI 助手撰写和发布文章，还有更多功能广受欢迎的网站托管和发布平台 WordPress.com 现已开始引入人工智能助手——这一举措或将重塑网络的呈现方式。该公司于周五宣布，将允许人工智能助手在用户网站上起草、编辑和发布内容，同时还能管理评论、更新和修正元数据，并通过标签和分类对内容进行整理。所有这些操作均通过一个界面进行控制，网站所有者只需使用自然语言命令说明其需求即可。凭借这些新功能，网站几乎可以完全由人工指导的AI代理来创建和运

Anthropic公司的实验性人工智能Claude在电子商务测试中完成了谈判和交易随着人工智能的飞速发展，Anthropic上周五悄然启动了一项名为“Project Deal”的内部实验，展示了人工智能在电子商务领域的潜力。该实验让其人工智能模型Claude在封闭的市场环境中自主处理买卖及价格谈判，并涉及真实的金融交易。实验的核心是一个基于Slack构建的内部市场，Claude在其中同时担任买卖双方的谈判代表。它首先对69名员工进行了访谈，收集了他们的买卖意向及个性化指示，随后

DeepSeek Code 即将发布随着人工智能技术的加速发展，DeepSeek正处于一个激动人心的关键时刻。这家人工智能公司近日透露，已获得超过700亿元的融资。公司管理层强调，将致力于开创性的人工智能研究，而非追求眼前的商业利益。这一战略转型表明，DeepSeek将全力投入新产品的开发，尤其是备受期待的DeepSeek Code。DeepSeek Code的规划已初具雏形，公司招聘页面上已发布多个相关职位，例如“Agent Ha

相关专题推荐

商业

最佳人工智能招聘工具：筛选简历并自动安排候选人面试

在 XIX.AI 上探索 2026 年最新、评价最高的人工智能招聘工具。我们精心筛选的清单汇集了功能强大、颠覆传统的解决方案，可帮助您筛选简历并自动安排候选人面试。通过实际测试和每周更新的排名，对比免费与付费选项。立即找到最适合您的招聘助手，优化您的招聘流程！

10 个工具

xix.ai

生产率

AI个人健康与专注力教练：缓解倦怠，提升精神能量

立即访问 XIX.AI，探索 2026 年最优秀的 AI 个人健康与专注力教练。我们的精选排行榜汇集了广受好评、具有颠覆性意义的工具，助您缓解倦怠、提升精神能量。通过真实案例分析，对比免费与付费选项。立即开启通往巅峰生产力和身心健康的道路。

10 个工具

xix.ai

聊天机器人

备受好评的AI浪漫聊天机器人：凭借稳定的个性建立长期关系

探索2026年最新、评价最高的人工智能浪漫聊天机器人，助您建立真实而长久的联系。我们的精选清单涵盖了功能强大且性格鲜明的聊天机器人，并提供了免费与付费版本的对比分析以及实际测试结果。在XIX.AI上找到您的完美伴侣，立即开始建立联系吧。

10 个工具

xix.ai

教育与学习

最佳AI数据科学导师：精通SQL、Pandas及机器学习工作流程

探索2026年最优秀的人工智能数据科学导师，帮助他们掌握SQL、Pandas以及机器学习工作流程。在XIX.AI上查看我们精心挑选的顶级导师名单，获得强大而具有变革性的指导。通过对比免费和付费选项，并结合实际应用案例进行了解，今天就开启你的数据科学精通之路吧。

10 个工具

xix.ai

聊天机器人

最佳AI调情与对话训练工具：实时提升社交魅力与自信

在 XIX.AI 上探索 2026 年最优秀的 AI 调情与对话训练工具。我们精心挑选的高评分工具助您实时提升社交魅力与自信。探索这些必试的、颠覆性的工具，查看免费版与付费版的对比，并了解每周更新的排行榜。立即开启您的社交优势。

10 个工具

xix.ai

代码

最适合自动化单元测试的最佳AI工具：一键生成Jest、PyTest和JUnit测试用例

探索2026年最新评选出的顶级AI工具，这些工具专为自动化单元测试而设计。我们精心挑选了那些功能强大、能够改变开发流程的工具，它们能够帮助您快速生成Jest、PyTest和JUnit测试用例。在XIX.AI平台上，您可以免费查看各种选项，并通过实际测试结果以及每周更新的排名来了解它们的优劣。立即利用这些AI工具，提升您的开发效率吧！

10 个工具

xix.ai

0/500

请登录后再操作

SophiaJones

2026-04-11 08:00:43

這功能太酷了吧！讓AI操作電腦，感覺就像多了個超強助手。不過它也會犯錯這點挺真實的，反而讓人更放心？希望以後能幫忙處理那些重複又煩人的文書工作，解放雙手！🤖💻

PeterMiller

2026-04-05 14:01:03

Когда ИИ начинает делать те же ошибки, что и я в работе с компьютером, это по-своему успокаивает 😂 Меня беспокоит, насколько мы готовы доверить программному обеспечению такое прямое взаимодействие с интерфейсом. Это ведь прямая дорога как к невероятной производительности, так и к полному хаосу, если что-то пойдет не так. Кажется, пора задуматься о новых 'правилах дорожного движения' для роботов-помощников.

KevinTaylor

2026-03-12 08:00:29

Этот AI, который делает ошибки, как человек, звучит одновременно и забавно, и немного тревожно 😅 Получается, мы создали идеального цифрового стажёра, который тоже путает Ctrl+C и Ctrl+V? Интересно, как это повлияет на безопасность — вдруг он случайно удалит что-то важное, пытаясь 'помочь'?

WalterBaker

2025-08-28 01:01:33

Wow, Claude 3.5 Sonnet sounds like a game-changer! An AI that mimics human computer use, errors and all? That’s wild. I wonder how it handles my messy desktop and random browser tabs 😅. Super curious to see it in action!

JackWilson

2025-08-04 14:01:00

This AI acting like a human on computers is wild! 😮 Makes me wonder if it’ll start rage-quitting when apps crash like I Elyse.

JackMitchell

2025-07-31 09:42:05

Whoa, an AI that mimics human computer use, mistakes and all? That's wild! Wonder if Claude 3.5 Sonnet will accidentally open 20 browser tabs like I do. 😅 Curious to see how this plays out in real-world tasks!

头条新闻

AI Builder和Power Automate革新文档摘要 AI寄主Notebooklm播客现已上中国发布人形机器人及具身智能国家标准 Ramp 数据显示企业人工智能应用趋于平稳 Bing图像创建者教程：AI艺术生成指南学习使用您的声音创建AI音乐：逐步Suno教程 iMyFone MagicMic：实时AI变声器评测与教程 2025顶级AI视频生成器：Pika Labs与其他对比 DeepSeek V4 作为多模态人工智能变革者横空出世 Embodied Intelligence 发布首个行业标准，旨在遏制无序增长

精选