选项
首页
新闻
人类的新AI模型运行像人类这样的计算机,包括错误

人类的新AI模型运行像人类这样的计算机,包括错误

2025-05-09
38

人类的新AI模型运行像人类这样的计算机,包括错误

您是否曾经梦想过像人类一样可以与计算机无缝互动的AI?好吧,由于Anthropic的最新创新,这个梦想现在是现实。周二,他们推出了新一代的Claude AI模型,名为Claude 3.5十四行诗,该模型可以用令人惊讶的技巧操作计算机。目前处于Beta模式,此AI可供开发人员通过API进行实验。

人类自豪地将Claude 3.5十四行诗标记为“首个在公共Beta中提供计算机使用的边境AI模型”。这意味着开发人员可以对IT进行编程以在计算机上执行各种任务,例如查看屏幕,操纵光标,单击按钮,甚至在虚拟键盘上键入。目标?复制我们每天与计算机互动的方式。

现在,尽管这个新的AI仍处于实验阶段,但并非没有打ic。有时可能会有些笨拙,并且容易出错。但这就是为什么Anthropic将其发布在Beta中的原因,可以从开发人员那里收集宝贵的反馈并随着时间的推移来完善模型。

我们为什么要使用计算机关心AI?

人类对这个问题有明确的答案:“大量现代作品通过计算机发生。”通过使AIS与人类相同的方式与软件进行交互,它们可以解锁当前AI助手无法处理的大量新应用程序。

开发人员和用户如何受益?

人类不是为每个任务创建特定的工具,而是教授Claude一般计算机技能。这使AI可以利用为人类设计的广泛的标准软件程序。开发人员可以利用这种能力来自动化重复任务,构建和测试软件,甚至进行研究。

几家公司已经利用Claude 3.5十四行诗的计算机技能,包括Asana,Canva,Cognition,Doordash,Replit和The Browser Company。例如,REPLIT正在使用这些功能来增强其Replit Agent产品。

他们如何训练克劳德使用计算机?

据人道,培训克劳德(Claude)导航计算机涉及大量反复试验。该过程要求AI理解和解释计算机屏幕的图像,然后根据所看到的决定采取哪些操作。 Claude 3.5十四行诗通过分析屏幕截图,计算像素来精确移动光标并发出鼠标命令来实现这一目标。

克劳德的表现如何?

在评估AI模型使用计算机能力的OSWORLD基准测试测试中,Claude 3.5 SONNET的得分为14.9%。虽然这显着低于70%-75%的人类水平的表现,但几乎是同一类别中下一个最佳AI模型得分的7.7%的两倍。

尽管这些有希望的结果,克劳德的计算机使用仍处于起步阶段。它还不能执行更复杂的任务,例如将Windows拖动或放大到屏幕中。此外,由于它依赖于屏幕截图,因此可能会错过某些动作和通知。

拟人化仍然乐观,说:“我们希望计算机使用将迅速改善,以变得更快,更可靠,并且对用户想要完成的任务更有用。”他们还强调,随着技术的发展,具有较少软件开发经验的人将变得更加易于使用,同时保持严格的安全措施。

Claude 3.5十四行诗现在可以访问每个人。开发人员可以在人类API,Amazon Bedrock和Google Cloud的Vertex AI上使用计算机使用Beta来构建应用程序。

相关文章
AI驱动的总结:YouTube视频总结完整指南 AI驱动的总结:YouTube视频总结完整指南 在当今快节奏的世界中,快速处理和理解信息的能力比以往任何时候都重要。YouTube拥有无尽的视频资源,是知识的宝库,但谁有时间从头到尾观看每段视频?本指南将展示如何使用AI工具总结YouTube视频,帮助你节省时间并提高生产力。通过AI驱动的总结工具,你可以迅速抓住视频要点,决定是否值得深入观看或继续下一个。让我们探索这些AI工具如何改变你的学习和保持更新的方式。关键点AI驱动的工具让你快速理解Y
AI驱动的超声波变革即时医疗评估 AI驱动的超声波变革即时医疗评估 人工智能正在颠覆医疗领域,超声波技术也随之变革。本文探讨了AI如何转变即时超声波(POCUS)评估,使其更易获取、更高效、更准确。从优化图像采集到提升解读精度,AI将革新超声波,为各种场景带来更好的患者护理。关键要点AI简化超声波图像采集,使非专家也能轻松获取诊断质量的图像。机器学习提升超声波图像解读能力,助力更精确地发现和测量病理。得益于AI,即时超声波(POCUS)变得更易普及,可能提升资源匮
机器学习速查表:人工智能关键快速参考指南 机器学习速查表:人工智能关键快速参考指南 在技术快速发展的世界中,人工智能和云计算推动创新,保持更新和准备至关重要。无论与同事讨论策略、制作教育内容,还是为面试做准备,快速获取关键信息都至关重要。这就是机器学习速查表的作用。它们不是走捷径,而是帮助唤醒记忆,复习基本概念,确保你准备好应对人工智能领域的复杂性。关键点速查表是人工智能和数据科学专业人士的重要工具。它们提供快速复习基本概念的方法。如Aqeel Anwar的速查表等资源对面试和日
评论 (0)
0/200
返回顶部
OR