Openai推出了企业的AI代理开发工具

在周二,OpenAI 发布了一套新工具,旨在帮助开发者和企业使用 OpenAI 的专有 AI 模型和框架打造 AI 代理——能够自主执行任务的系统。
这些工具是 OpenAI 新推出的 Responses API 的一部分,该 API 使企业能够创建自定义 AI 代理,这些代理能够进行网络搜索、筛选公司文件以及浏览网站,类似于 OpenAI 的 Operator 产品。Responses API 将取代公司的 Assistants API,OpenAI 计划在 2026 年上半年逐步淘汰 Assistants API。
近年来,尽管科技行业在明确定义和展示“AI 代理”具体含义方面面临挑战,关于 AI 代理的热议仍在迅速增长。最近的一个例子是中国初创公司 Butterfly Effect,其 Manus AI 代理平台因病毒式传播而受到关注,但用户发现该平台并未达到公司的大胆承诺。
OpenAI 面临着兑现 AI 代理承诺的压力。
“展示你的代理很容易,”OpenAI 的 API 产品负责人 Olivier Godement 在接受 TechCrunch 采访时表示。“但要扩展一个代理相当困难,让人们经常使用它则非常困难。”
今年早些时候,OpenAI 在 ChatGPT 中引入了两个 AI 代理:Operator,它可以代表你浏览网站;以及 deep research,它可以编制研究报告。虽然这些工具展示了代理技术的潜力,但在自主性方面仍有许多不足。
通过 Responses API,OpenAI 旨在提供驱动 AI 代理的核心组件,使开发者能够创建自己的 Operator 和 deep research 风格的应用。目标是让开发者构建比当前可用应用更具自主性的应用程序。
开发者可以利用 Responses API 使用驱动 OpenAI 的 ChatGPT Search 网络搜索工具的相同 AI 模型:GPT-4o search 和 GPT-4o mini search。这些模型可以搜索网络以回答问题,并在生成回答时引用来源。
OpenAI 声称 GPT-4o search 和 GPT-4o mini search 都具有很高的准确性。在公司的 SimpleQA 基准测试中,评估模型回答简短事实性问题的能力,GPT-4o search 得分 90%,而 GPT-4o mini search 得分 88%。相比之下,体量更大的 GPT-4.5 模型仅得 63%。
Responses API 还包括一个文件搜索实用工具,可以快速扫描公司数据库以检索信息。OpenAI 保证不会使用这些文件来训练其模型。此外,开发者可以访问 OpenAI 的 Computer-Using Agent(CUA)模型,该模型驱动 Operator,使他们能够通过生成鼠标和键盘操作来自动化任务,例如数据输入和应用工作流程。
根据 OpenAI 的说法,企业可以选择在自己的系统上运行目前处于研究预览阶段的 CUA 模型。Operator 中可用的消费者版 CUA 仅限于基于网络的操作。
需要注意的是,Responses API 无法解决 AI 代理当前面临的所有技术挑战。
虽然 AI 驱动的搜索工具比传统 AI 模型更准确——考虑到它们能够直接查找答案,这并不令人意外——但网络搜索并不能消除 AI 幻觉问题。GPT-4o search 仍有 10% 的实事性问题回答错误。此外,AI 搜索工具在处理类似“湖人今天比分”这样的简短导航查询时常常遇到困难,近期报告还质疑了 ChatGPT 引用的可靠性。
在与 TechCrunch 分享的一篇博客文章中,OpenAI 承认 CUA 模型“在操作系统上自动化任务的可靠性尚不高”,并且可能会出现“无意”的错误。
然而,OpenAI 强调这些是其代理工具的早期版本,公司正在不断改进。
除了 Responses API,OpenAI 还发布了一个开源工具包,称为 Agents SDK,为开发者提供免费工具,以便将模型与内部系统集成、实施安全措施以及监控 AI 代理活动以进行调试和优化。Agents SDK 是 OpenAI 去年末发布的 Swarm 框架(用于多代理协调)的进化版本。
Godement 表达了希望 OpenAI 能在今年缩小 AI 代理演示与实际产品之间的差距,他表示,在他看来,“代理将是 AI 最具影响力的应用”。这一观点与 OpenAI 首席执行官 Sam Altman 在 1 月的声明一致,他预测 2025 年将是 AI 代理加入劳动力的一年。
无论 2025 年是否真正成为“AI 代理之年”,OpenAI 的最新发布表明公司正从展示令人印象深刻的代理演示转向开发具有现实影响的工具。
相关文章
萨提亚·纳德拉准备利用与OpenAI的新合作关系
周三,一位华尔街分析师直接询问了微软首席执行官萨蒂亚·纳德拉,修订后的OpenAI合作关系将如何影响公司的财务状况。 纳德拉将这一新协议描述为对各方都有利的结果。“我们对与OpenAI的合作感到满意。我始终非常重视任何合作关系,并确保它能够实现双赢。只有这样,双方才能保持良好的合作伙伴关系。” 他强调,微软仍然可以使用OpenAI的知识产权,包括其模型和智能体产品,但不再需要为此向OpenAI支付费用。 谈到在2032年之前可以免费使用OpenAI最先进的人工智能技术,纳德拉表示:“
OpenAI勾勒出以公共财富基金、机器人税和每周四天工作制为核心的人工智能经济蓝图
正当各国政府竭力应对超级智能机器带来的经济影响之际,OpenAI发布了一套政策建议,概述了在“智能时代”财富与工作将如何重塑。这些构想将传统左倾机制——例如公共财富基金和扩大的社会安全网——与根本上属于资本主义、由市场驱动的经济框架相结合。OpenAI的提案本质上是一份愿望清单,这份公开声明旨在帮助民选官员、投资者和公众理解这家市值8520亿美元的公司如何看待人工智能在重塑劳动力和经济过程中带来的
Vercel首席执行官吉列尔莫·劳赫暗示将进行IPO,因AI代理业务推动营收增长
与许多在ChatGPT问世前成立、如今却在AI时代举步维艰的初创公司不同,拥有十年历史的开发工具及网站托管平台Vercel正因AI生成应用和自主代理的激增而蓬勃发展。“在我创立这家公司时,只有数千万用户能够部署应用,”Vercel首席执行官吉列尔莫·劳赫上周在旧金山HumanX大会上对与会者表示。“如今我们看到,全世界每个人都能创建一个应用。”非开发者创建应用数量的激增,显著推动了Vercel的业
相关专题推荐
评论 (27)
0/500
와, 진짜 AI 에이전트 개발 툴이 나왔네. 하지만 자율적인 작업 수행 기능에 대해 약간의 우려도 들고... 비즈니스에 적용하기엔 아직 너무 이른 건 아닐까? OpenAI가 계속 선두를 달리는 게 인상적이긴 해요. 😅
Finalmente ferramentas práticas para criar agentes de IA! A autonomia desses sistemas me faz pensar: será que em breve teremos assistentes que realmente entendem contexto como humanos? 🤔 Ainda estou cético sobre como lidarão com tarefas complexas do mundo real.
Als Entwickler frage ich mich, ob diese Tools wirklich so einfach zu integrieren sind, wie OpenAI behauptet. Die Versprechen klingen gut, aber ich habe Bedenken bezüglich der Daten- und Funktionssicherheit! 😅 Werden uns am Ende die Agenten irgendwann ersetzen?
Super cool that OpenAI's dropping these AI agent tools! Can't wait to see what businesses build with this—maybe smarter chatbots or auto-scheduling systems? 🚀
Super cool that OpenAI is dropping these AI agent tools! Makes me wonder how small businesses will use them to compete with the big dogs. 🐶

在周二,OpenAI 发布了一套新工具,旨在帮助开发者和企业使用 OpenAI 的专有 AI 模型和框架打造 AI 代理——能够自主执行任务的系统。
这些工具是 OpenAI 新推出的 Responses API 的一部分,该 API 使企业能够创建自定义 AI 代理,这些代理能够进行网络搜索、筛选公司文件以及浏览网站,类似于 OpenAI 的 Operator 产品。Responses API 将取代公司的 Assistants API,OpenAI 计划在 2026 年上半年逐步淘汰 Assistants API。
近年来,尽管科技行业在明确定义和展示“AI 代理”具体含义方面面临挑战,关于 AI 代理的热议仍在迅速增长。最近的一个例子是中国初创公司 Butterfly Effect,其 Manus AI 代理平台因病毒式传播而受到关注,但用户发现该平台并未达到公司的大胆承诺。
OpenAI 面临着兑现 AI 代理承诺的压力。
“展示你的代理很容易,”OpenAI 的 API 产品负责人 Olivier Godement 在接受 TechCrunch 采访时表示。“但要扩展一个代理相当困难,让人们经常使用它则非常困难。”
今年早些时候,OpenAI 在 ChatGPT 中引入了两个 AI 代理:Operator,它可以代表你浏览网站;以及 deep research,它可以编制研究报告。虽然这些工具展示了代理技术的潜力,但在自主性方面仍有许多不足。
通过 Responses API,OpenAI 旨在提供驱动 AI 代理的核心组件,使开发者能够创建自己的 Operator 和 deep research 风格的应用。目标是让开发者构建比当前可用应用更具自主性的应用程序。
开发者可以利用 Responses API 使用驱动 OpenAI 的 ChatGPT Search 网络搜索工具的相同 AI 模型:GPT-4o search 和 GPT-4o mini search。这些模型可以搜索网络以回答问题,并在生成回答时引用来源。
OpenAI 声称 GPT-4o search 和 GPT-4o mini search 都具有很高的准确性。在公司的 SimpleQA 基准测试中,评估模型回答简短事实性问题的能力,GPT-4o search 得分 90%,而 GPT-4o mini search 得分 88%。相比之下,体量更大的 GPT-4.5 模型仅得 63%。
Responses API 还包括一个文件搜索实用工具,可以快速扫描公司数据库以检索信息。OpenAI 保证不会使用这些文件来训练其模型。此外,开发者可以访问 OpenAI 的 Computer-Using Agent(CUA)模型,该模型驱动 Operator,使他们能够通过生成鼠标和键盘操作来自动化任务,例如数据输入和应用工作流程。
根据 OpenAI 的说法,企业可以选择在自己的系统上运行目前处于研究预览阶段的 CUA 模型。Operator 中可用的消费者版 CUA 仅限于基于网络的操作。
需要注意的是,Responses API 无法解决 AI 代理当前面临的所有技术挑战。
虽然 AI 驱动的搜索工具比传统 AI 模型更准确——考虑到它们能够直接查找答案,这并不令人意外——但网络搜索并不能消除 AI 幻觉问题。GPT-4o search 仍有 10% 的实事性问题回答错误。此外,AI 搜索工具在处理类似“湖人今天比分”这样的简短导航查询时常常遇到困难,近期报告还质疑了 ChatGPT 引用的可靠性。
在与 TechCrunch 分享的一篇博客文章中,OpenAI 承认 CUA 模型“在操作系统上自动化任务的可靠性尚不高”,并且可能会出现“无意”的错误。
然而,OpenAI 强调这些是其代理工具的早期版本,公司正在不断改进。
除了 Responses API,OpenAI 还发布了一个开源工具包,称为 Agents SDK,为开发者提供免费工具,以便将模型与内部系统集成、实施安全措施以及监控 AI 代理活动以进行调试和优化。Agents SDK 是 OpenAI 去年末发布的 Swarm 框架(用于多代理协调)的进化版本。
Godement 表达了希望 OpenAI 能在今年缩小 AI 代理演示与实际产品之间的差距,他表示,在他看来,“代理将是 AI 最具影响力的应用”。这一观点与 OpenAI 首席执行官 Sam Altman 在 1 月的声明一致,他预测 2025 年将是 AI 代理加入劳动力的一年。
无论 2025 年是否真正成为“AI 代理之年”,OpenAI 的最新发布表明公司正从展示令人印象深刻的代理演示转向开发具有现实影响的工具。
萨提亚·纳德拉准备利用与OpenAI的新合作关系
周三,一位华尔街分析师直接询问了微软首席执行官萨蒂亚·纳德拉,修订后的OpenAI合作关系将如何影响公司的财务状况。 纳德拉将这一新协议描述为对各方都有利的结果。“我们对与OpenAI的合作感到满意。我始终非常重视任何合作关系,并确保它能够实现双赢。只有这样,双方才能保持良好的合作伙伴关系。” 他强调,微软仍然可以使用OpenAI的知识产权,包括其模型和智能体产品,但不再需要为此向OpenAI支付费用。 谈到在2032年之前可以免费使用OpenAI最先进的人工智能技术,纳德拉表示:“
OpenAI勾勒出以公共财富基金、机器人税和每周四天工作制为核心的人工智能经济蓝图
正当各国政府竭力应对超级智能机器带来的经济影响之际,OpenAI发布了一套政策建议,概述了在“智能时代”财富与工作将如何重塑。这些构想将传统左倾机制——例如公共财富基金和扩大的社会安全网——与根本上属于资本主义、由市场驱动的经济框架相结合。OpenAI的提案本质上是一份愿望清单,这份公开声明旨在帮助民选官员、投资者和公众理解这家市值8520亿美元的公司如何看待人工智能在重塑劳动力和经济过程中带来的
Vercel首席执行官吉列尔莫·劳赫暗示将进行IPO,因AI代理业务推动营收增长
与许多在ChatGPT问世前成立、如今却在AI时代举步维艰的初创公司不同,拥有十年历史的开发工具及网站托管平台Vercel正因AI生成应用和自主代理的激增而蓬勃发展。“在我创立这家公司时,只有数千万用户能够部署应用,”Vercel首席执行官吉列尔莫·劳赫上周在旧金山HumanX大会上对与会者表示。“如今我们看到,全世界每个人都能创建一个应用。”非开发者创建应用数量的激增,显著推动了Vercel的业
와, 진짜 AI 에이전트 개발 툴이 나왔네. 하지만 자율적인 작업 수행 기능에 대해 약간의 우려도 들고... 비즈니스에 적용하기엔 아직 너무 이른 건 아닐까? OpenAI가 계속 선두를 달리는 게 인상적이긴 해요. 😅
Finalmente ferramentas práticas para criar agentes de IA! A autonomia desses sistemas me faz pensar: será que em breve teremos assistentes que realmente entendem contexto como humanos? 🤔 Ainda estou cético sobre como lidarão com tarefas complexas do mundo real.
Als Entwickler frage ich mich, ob diese Tools wirklich so einfach zu integrieren sind, wie OpenAI behauptet. Die Versprechen klingen gut, aber ich habe Bedenken bezüglich der Daten- und Funktionssicherheit! 😅 Werden uns am Ende die Agenten irgendwann ersetzen?
Super cool that OpenAI's dropping these AI agent tools! Can't wait to see what businesses build with this—maybe smarter chatbots or auto-scheduling systems? 🚀
Super cool that OpenAI is dropping these AI agent tools! Makes me wonder how small businesses will use them to compete with the big dogs. 🐶





首页






