人类的新AI模型运行像人类这样的计算机,包括错误
2025年05月08日
PaulGonzalez
1

您是否曾经梦想过像人类一样可以与计算机无缝互动的AI?好吧,由于Anthropic的最新创新,这个梦想现在是现实。周二,他们推出了新一代的Claude AI模型,名为Claude 3.5十四行诗,该模型可以用令人惊讶的技巧操作计算机。目前处于Beta模式,此AI可供开发人员通过API进行实验。
人类自豪地将Claude 3.5十四行诗标记为“首个在公共Beta中提供计算机使用的边境AI模型”。这意味着开发人员可以对IT进行编程以在计算机上执行各种任务,例如查看屏幕,操纵光标,单击按钮,甚至在虚拟键盘上键入。目标?复制我们每天与计算机互动的方式。
现在,尽管这个新的AI仍处于实验阶段,但并非没有打ic。有时可能会有些笨拙,并且容易出错。但这就是为什么Anthropic将其发布在Beta中的原因,可以从开发人员那里收集宝贵的反馈并随着时间的推移来完善模型。
我们为什么要使用计算机关心AI?
人类对这个问题有明确的答案:“大量现代作品通过计算机发生。”通过使AIS与人类相同的方式与软件进行交互,它们可以解锁当前AI助手无法处理的大量新应用程序。
开发人员和用户如何受益?
人类不是为每个任务创建特定的工具,而是教授Claude一般计算机技能。这使AI可以利用为人类设计的广泛的标准软件程序。开发人员可以利用这种能力来自动化重复任务,构建和测试软件,甚至进行研究。
几家公司已经利用Claude 3.5十四行诗的计算机技能,包括Asana,Canva,Cognition,Doordash,Replit和The Browser Company。例如,REPLIT正在使用这些功能来增强其Replit Agent产品。
他们如何训练克劳德使用计算机?
据人道,培训克劳德(Claude)导航计算机涉及大量反复试验。该过程要求AI理解和解释计算机屏幕的图像,然后根据所看到的决定采取哪些操作。 Claude 3.5十四行诗通过分析屏幕截图,计算像素来精确移动光标并发出鼠标命令来实现这一目标。
克劳德的表现如何?
在评估AI模型使用计算机能力的OSWORLD基准测试测试中,Claude 3.5 SONNET的得分为14.9%。虽然这显着低于70%-75%的人类水平的表现,但几乎是同一类别中下一个最佳AI模型得分的7.7%的两倍。
尽管这些有希望的结果,克劳德的计算机使用仍处于起步阶段。它还不能执行更复杂的任务,例如将Windows拖动或放大到屏幕中。此外,由于它依赖于屏幕截图,因此可能会错过某些动作和通知。
拟人化仍然乐观,说:“我们希望计算机使用将迅速改善,以变得更快,更可靠,并且对用户想要完成的任务更有用。”他们还强调,随着技术的发展,具有较少软件开发经验的人将变得更加易于使用,同时保持严格的安全措施。
Claude 3.5十四行诗现在可以访问每个人。开发人员可以在人类API,Amazon Bedrock和Google Cloud的Vertex AI上使用计算机使用Beta来构建应用程序。
相关文章
特朗普和Zelensky冲突:深入了解美国与乌克兰关系
美国与乌克兰之间的关系引起了全球关注,尤其是在地缘政治紧张和转移联盟时期。本文探讨了这种关系的细微差别,特别关注美国前美国总统唐纳德·特朗普之间的互动
流行音乐AI:独立游戏中的声音效果
在独立游戏开发的世界中,在预算紧张的情况下找到高质量的声音效果可能就像追逐海市rage楼。这就是Pop AI的来源 - 一个改变游戏规则的独立开发人员,希望通过自定义音频在不破坏银行的情况下丰富他们的游戏。这个AI驱动的平台提供了一个FRE
生成式AI增加工作量而非节省时间
生成性人工智能的双刃剑生成性人工智能(AI)工具常被称赞为节省时间和提升生产力的利器。它们确实可以帮助你快速运行代码或生成报告,但也有其局限性。开发和维护大型语言模型(LLM)所需的幕后工作可能实际上比最初节省的时间还要多。此外,许多任务可以通过更简单的自动化方法高效处理,无需动用AI的重型武器。宾夕法尼亚大学沃顿商学院的管理学教授彼得·卡佩利(Peter
评论 (0)
0/200






您是否曾经梦想过像人类一样可以与计算机无缝互动的AI?好吧,由于Anthropic的最新创新,这个梦想现在是现实。周二,他们推出了新一代的Claude AI模型,名为Claude 3.5十四行诗,该模型可以用令人惊讶的技巧操作计算机。目前处于Beta模式,此AI可供开发人员通过API进行实验。
人类自豪地将Claude 3.5十四行诗标记为“首个在公共Beta中提供计算机使用的边境AI模型”。这意味着开发人员可以对IT进行编程以在计算机上执行各种任务,例如查看屏幕,操纵光标,单击按钮,甚至在虚拟键盘上键入。目标?复制我们每天与计算机互动的方式。
现在,尽管这个新的AI仍处于实验阶段,但并非没有打ic。有时可能会有些笨拙,并且容易出错。但这就是为什么Anthropic将其发布在Beta中的原因,可以从开发人员那里收集宝贵的反馈并随着时间的推移来完善模型。
我们为什么要使用计算机关心AI?
人类对这个问题有明确的答案:“大量现代作品通过计算机发生。”通过使AIS与人类相同的方式与软件进行交互,它们可以解锁当前AI助手无法处理的大量新应用程序。
开发人员和用户如何受益?
人类不是为每个任务创建特定的工具,而是教授Claude一般计算机技能。这使AI可以利用为人类设计的广泛的标准软件程序。开发人员可以利用这种能力来自动化重复任务,构建和测试软件,甚至进行研究。
几家公司已经利用Claude 3.5十四行诗的计算机技能,包括Asana,Canva,Cognition,Doordash,Replit和The Browser Company。例如,REPLIT正在使用这些功能来增强其Replit Agent产品。
他们如何训练克劳德使用计算机?
据人道,培训克劳德(Claude)导航计算机涉及大量反复试验。该过程要求AI理解和解释计算机屏幕的图像,然后根据所看到的决定采取哪些操作。 Claude 3.5十四行诗通过分析屏幕截图,计算像素来精确移动光标并发出鼠标命令来实现这一目标。
克劳德的表现如何?
在评估AI模型使用计算机能力的OSWORLD基准测试测试中,Claude 3.5 SONNET的得分为14.9%。虽然这显着低于70%-75%的人类水平的表现,但几乎是同一类别中下一个最佳AI模型得分的7.7%的两倍。
尽管这些有希望的结果,克劳德的计算机使用仍处于起步阶段。它还不能执行更复杂的任务,例如将Windows拖动或放大到屏幕中。此外,由于它依赖于屏幕截图,因此可能会错过某些动作和通知。
拟人化仍然乐观,说:“我们希望计算机使用将迅速改善,以变得更快,更可靠,并且对用户想要完成的任务更有用。”他们还强调,随着技术的发展,具有较少软件开发经验的人将变得更加易于使用,同时保持严格的安全措施。
Claude 3.5十四行诗现在可以访问每个人。开发人员可以在人类API,Amazon Bedrock和Google Cloud的Vertex AI上使用计算机使用Beta来构建应用程序。












