Openai推出了企業的AI代理開發工具

在週二,OpenAI 推出了一系列新工具,旨在協助開發者和企業利用 OpenAI 的專有 AI 模型和框架打造 AI 代理—能夠自主執行任務的系統。
這些工具是 OpenAI 新推出的 Responses API 的一部分,該 API 使企業能夠創建自訂的 AI 代理,這些代理能夠進行網路搜尋、篩選公司檔案以及瀏覽網站,類似於 OpenAI 的 Operator 產品。Responses API 將取代公司的 Assistants API,OpenAI 計劃在 2026 年上半年逐步淘汰 Assistants API。
近年來,AI 代理的熱潮迅速增長,儘管科技產業在明確定義和展示“AI 代理”實際含義方面面臨挑戰。最近的一個例子是中國初創公司 Butterfly Effect,其 Manus AI 代理平台因病毒式傳播而受到關注,但用戶發現其表現遠低於公司的大膽宣稱。
OpenAI 面臨著兌現 AI 代理承諾的壓力。
「展示你的代理很容易,」OpenAI 的 API 產品負責人 Olivier Godement 在接受 TechCrunch 採訪時表示。「要擴展代理非常困難,讓人們經常使用它則更加困難。」
今年早些時候,OpenAI 在 ChatGPT 中推出了兩個 AI 代理:Operator,可代表你瀏覽網站;以及 deep research,可編纂研究報告。雖然這些工具展示了代理技術的潛力,但在自主性方面仍有許多不足。
透過 Responses API,OpenAI 旨在提供驅動 AI 代理的核心組件,使開發者能夠創建屬於自己的 Operator 和 deep research 風格的應用程式。目標是讓開發者打造出比現有應用更具自主性的應用程式。
開發者可以利用 Responses API 使用驅動 OpenAI 的 ChatGPT Search 網路搜尋工具的相同 AI 模型:GPT-4o search 和 GPT-4o mini search。這些模型可以搜尋網路以回答問題,並在生成回應時引用來源。
OpenAI 聲稱 GPT-4o search 和 GPT-4o mini search 都具有高準確性。在公司的 SimpleQA 基準測試中,該測試評估模型回答簡短、基於事實問題的能力,GPT-4o search 獲得 90% 的分數,而 GPT-4o mini search 達到 88%。相比之下,體型更大的 GPT-4.5 模型僅得 63%。
Responses API 還包括一個檔案搜尋工具,可以快速掃描公司資料庫以檢索資訊。OpenAI 保證不會使用這些檔案來訓練其模型。此外,開發者可以存取 OpenAI 的 Computer-Using Agent(CUA)模型,該模型驅動 Operator,使其能透過生成滑鼠和鍵盤動作來自動化資料輸入和應用程式工作流程等任務。
根據 OpenAI 的說法,企業可以選擇在自己的系統上運行目前處於研究預覽階段的 CUA 模型。Operator 中可用的消費者版本 CUA 僅限於基於網路的動作。
需要注意的是,Responses API 無法解決當前 AI 代理面臨的所有技術挑戰。
雖然 AI 驅動的搜尋工具比傳統 AI 模型更準確—這並不意外,因為它們能夠直接查詢答案—但網路搜尋並未消除 AI 幻覺問題。GPT-4o search 仍有 10% 的實事問題回答錯誤。此外,AI 搜尋工具在處理如「湖人今天比分」這類簡短的導航查詢時常遇到困難,近期報告也質疑 ChatGPT 引用的可靠性。
在與 TechCrunch 分享的部落格文章中,OpenAI 承認 CUA 模型「尚未在操作系統上自動化任務時高度可靠」,且可能會犯「無意」的錯誤。
然而,OpenAI 強調這些是其代理工具的早期版本,公司正在持續改進。
除了 Responses API,OpenAI 還發布了一個開源工具包,稱為 Agents SDK,為開發者提供免費工具,以便將模型與內部系統整合、實施安全措施,並監控 AI 代理活動以進行除錯和優化。Agents SDK 是 OpenAI 去年末發布的 Swarm 框架(用於多代理協調)的進化版本。
Godement 表示希望 OpenAI 能在今年縮小 AI 代理展示與實際產品之間的差距,他認為「代理是 AI 最具影響力的應用」。這與 OpenAI 執行長 Sam Altman 在一月發表的聲明相符,他預測 2025 年將是 AI 代理加入勞動力的年份。
無論 2025 年是否真正成為「AI 代理之年」,OpenAI 的最新發布顯示公司正從展示令人印象深刻的代理演示轉向開發具有現實影響力的工具。
相關文章
非營利組織利用 AI 代理提升慈善募款工作
當各大科技公司將人工智慧「代理」推廣為企業生產力的助推器時,一家非營利組織正在展示人工智慧在社會公益方面的潛力。由 Open Philanthropy 支持的慈善研究組織 Sage Future 最近進行了一項創新實驗,展示 AI 模型如何協同進行慈善募款。該非營利組織將 OpenAI 的 GPT-4o 與 o1,以及 Anthropic 的 Claude 3.6 與 3.7 Sonnet 等
頂尖 AI 實驗室警告人類正在失去理解 AI 系統的能力
來自 OpenAI、Google DeepMind、Anthropic 和 Meta 的研究人員,史無前例地展現團結,擱置競爭分歧,就負責任的 AI 開發發出集體警告。來自這些典型競爭組織的 40 多位頂尖科學家共同撰寫了一份突破性的研究論文,強調確保 AI 決策過程透明化的窗口正在快速關閉。此次合作的重點在於現代人工智能系統的一項關鍵發展 - 在產生最終輸出之前,以人類可讀的語言闡明推理過程的新
ChatGPT 新增 Google Drive 和 Dropbox 整合功能以存取檔案
ChatGPT 利用新的企業功能增強生產力OpenAI 發表了兩項強大的新功能,將 ChatGPT 轉型為全面的企業生產力工具:自動化會議記錄和無縫雲儲存整合。革命性的錄音功能新推出的 「記錄模式 」可自動轉錄和分析以下內容:重要的商務會議有創意的腦力激盪會議 個人思考過程此優質功能目前為 ChatGPT 團隊訂閱者專屬 (每位使用者每月 $25),可提供:精確、有時
評論 (24)
0/200
DennisRodriguez
2025-08-23 11:01:16
Super cool that OpenAI's dropping these AI agent tools! Can't wait to see what businesses build with this—maybe smarter chatbots or auto-scheduling systems? 🚀
0
WilliamAllen
2025-08-08 05:01:02
Super cool that OpenAI is dropping these AI agent tools! Makes me wonder how small businesses will use them to compete with the big dogs. 🐶
0
JoseRoberts
2025-07-28 09:18:39
Wow, OpenAI's new tools sound like a game-changer for businesses! Building AI agents that can handle tasks autonomously is wild—imagine the time saved. But I wonder how accessible these are for smaller companies? 🤔
0
JoseMiller
2025-07-23 12:59:29
Wow, OpenAI's new tools sound like a game-changer for businesses! I’m curious how these AI agents will stack up against competitors like xAI’s Grok. Will they really be user-friendly for devs or just overhyped corporate bait? 🤔
0
AlbertThomas
2025-04-19 03:31:20
As novas ferramentas da OpenAI para empresas são bem legais! Adoro como ficou fácil desenvolver agentes de IA agora. A API de Respostas é um divisor de águas, mas poderia ter mais documentação. No geral, é um grande passo à frente! 🚀
0
PaulAnderson
2025-04-18 01:56:03
Các công cụ mới của OpenAI cho doanh nghiệp thật tuyệt vời! Tôi thích việc phát triển đại lý AI giờ đây dễ dàng hơn. API Phản hồi là một bước đột phá, nhưng có thể cần thêm tài liệu. Nhìn chung, đây là một bước tiến lớn! 🚀
0
在週二,OpenAI 推出了一系列新工具,旨在協助開發者和企業利用 OpenAI 的專有 AI 模型和框架打造 AI 代理—能夠自主執行任務的系統。
這些工具是 OpenAI 新推出的 Responses API 的一部分,該 API 使企業能夠創建自訂的 AI 代理,這些代理能夠進行網路搜尋、篩選公司檔案以及瀏覽網站,類似於 OpenAI 的 Operator 產品。Responses API 將取代公司的 Assistants API,OpenAI 計劃在 2026 年上半年逐步淘汰 Assistants API。
近年來,AI 代理的熱潮迅速增長,儘管科技產業在明確定義和展示“AI 代理”實際含義方面面臨挑戰。最近的一個例子是中國初創公司 Butterfly Effect,其 Manus AI 代理平台因病毒式傳播而受到關注,但用戶發現其表現遠低於公司的大膽宣稱。
OpenAI 面臨著兌現 AI 代理承諾的壓力。
「展示你的代理很容易,」OpenAI 的 API 產品負責人 Olivier Godement 在接受 TechCrunch 採訪時表示。「要擴展代理非常困難,讓人們經常使用它則更加困難。」
今年早些時候,OpenAI 在 ChatGPT 中推出了兩個 AI 代理:Operator,可代表你瀏覽網站;以及 deep research,可編纂研究報告。雖然這些工具展示了代理技術的潛力,但在自主性方面仍有許多不足。
透過 Responses API,OpenAI 旨在提供驅動 AI 代理的核心組件,使開發者能夠創建屬於自己的 Operator 和 deep research 風格的應用程式。目標是讓開發者打造出比現有應用更具自主性的應用程式。
開發者可以利用 Responses API 使用驅動 OpenAI 的 ChatGPT Search 網路搜尋工具的相同 AI 模型:GPT-4o search 和 GPT-4o mini search。這些模型可以搜尋網路以回答問題,並在生成回應時引用來源。
OpenAI 聲稱 GPT-4o search 和 GPT-4o mini search 都具有高準確性。在公司的 SimpleQA 基準測試中,該測試評估模型回答簡短、基於事實問題的能力,GPT-4o search 獲得 90% 的分數,而 GPT-4o mini search 達到 88%。相比之下,體型更大的 GPT-4.5 模型僅得 63%。
Responses API 還包括一個檔案搜尋工具,可以快速掃描公司資料庫以檢索資訊。OpenAI 保證不會使用這些檔案來訓練其模型。此外,開發者可以存取 OpenAI 的 Computer-Using Agent(CUA)模型,該模型驅動 Operator,使其能透過生成滑鼠和鍵盤動作來自動化資料輸入和應用程式工作流程等任務。
根據 OpenAI 的說法,企業可以選擇在自己的系統上運行目前處於研究預覽階段的 CUA 模型。Operator 中可用的消費者版本 CUA 僅限於基於網路的動作。
需要注意的是,Responses API 無法解決當前 AI 代理面臨的所有技術挑戰。
雖然 AI 驅動的搜尋工具比傳統 AI 模型更準確—這並不意外,因為它們能夠直接查詢答案—但網路搜尋並未消除 AI 幻覺問題。GPT-4o search 仍有 10% 的實事問題回答錯誤。此外,AI 搜尋工具在處理如「湖人今天比分」這類簡短的導航查詢時常遇到困難,近期報告也質疑 ChatGPT 引用的可靠性。
在與 TechCrunch 分享的部落格文章中,OpenAI 承認 CUA 模型「尚未在操作系統上自動化任務時高度可靠」,且可能會犯「無意」的錯誤。
然而,OpenAI 強調這些是其代理工具的早期版本,公司正在持續改進。
除了 Responses API,OpenAI 還發布了一個開源工具包,稱為 Agents SDK,為開發者提供免費工具,以便將模型與內部系統整合、實施安全措施,並監控 AI 代理活動以進行除錯和優化。Agents SDK 是 OpenAI 去年末發布的 Swarm 框架(用於多代理協調)的進化版本。
Godement 表示希望 OpenAI 能在今年縮小 AI 代理展示與實際產品之間的差距,他認為「代理是 AI 最具影響力的應用」。這與 OpenAI 執行長 Sam Altman 在一月發表的聲明相符,他預測 2025 年將是 AI 代理加入勞動力的年份。
無論 2025 年是否真正成為「AI 代理之年」,OpenAI 的最新發布顯示公司正從展示令人印象深刻的代理演示轉向開發具有現實影響力的工具。




Super cool that OpenAI's dropping these AI agent tools! Can't wait to see what businesses build with this—maybe smarter chatbots or auto-scheduling systems? 🚀




Super cool that OpenAI is dropping these AI agent tools! Makes me wonder how small businesses will use them to compete with the big dogs. 🐶




Wow, OpenAI's new tools sound like a game-changer for businesses! Building AI agents that can handle tasks autonomously is wild—imagine the time saved. But I wonder how accessible these are for smaller companies? 🤔




Wow, OpenAI's new tools sound like a game-changer for businesses! I’m curious how these AI agents will stack up against competitors like xAI’s Grok. Will they really be user-friendly for devs or just overhyped corporate bait? 🤔




As novas ferramentas da OpenAI para empresas são bem legais! Adoro como ficou fácil desenvolver agentes de IA agora. A API de Respostas é um divisor de águas, mas poderia ter mais documentação. No geral, é um grande passo à frente! 🚀




Các công cụ mới của OpenAI cho doanh nghiệp thật tuyệt vời! Tôi thích việc phát triển đại lý AI giờ đây dễ dàng hơn. API Phản hồi là một bước đột phá, nhưng có thể cần thêm tài liệu. Nhìn chung, đây là một bước tiến lớn! 🚀












