Openai推出了企業的AI代理開發工具

在週二,OpenAI 推出了一系列新工具,旨在協助開發者和企業利用 OpenAI 的專有 AI 模型和框架打造 AI 代理—能夠自主執行任務的系統。
這些工具是 OpenAI 新推出的 Responses API 的一部分,該 API 使企業能夠創建自訂的 AI 代理,這些代理能夠進行網路搜尋、篩選公司檔案以及瀏覽網站,類似於 OpenAI 的 Operator 產品。Responses API 將取代公司的 Assistants API,OpenAI 計劃在 2026 年上半年逐步淘汰 Assistants API。
近年來,AI 代理的熱潮迅速增長,儘管科技產業在明確定義和展示“AI 代理”實際含義方面面臨挑戰。最近的一個例子是中國初創公司 Butterfly Effect,其 Manus AI 代理平台因病毒式傳播而受到關注,但用戶發現其表現遠低於公司的大膽宣稱。
OpenAI 面臨著兌現 AI 代理承諾的壓力。
「展示你的代理很容易,」OpenAI 的 API 產品負責人 Olivier Godement 在接受 TechCrunch 採訪時表示。「要擴展代理非常困難,讓人們經常使用它則更加困難。」
今年早些時候,OpenAI 在 ChatGPT 中推出了兩個 AI 代理:Operator,可代表你瀏覽網站;以及 deep research,可編纂研究報告。雖然這些工具展示了代理技術的潛力,但在自主性方面仍有許多不足。
透過 Responses API,OpenAI 旨在提供驅動 AI 代理的核心組件,使開發者能夠創建屬於自己的 Operator 和 deep research 風格的應用程式。目標是讓開發者打造出比現有應用更具自主性的應用程式。
開發者可以利用 Responses API 使用驅動 OpenAI 的 ChatGPT Search 網路搜尋工具的相同 AI 模型:GPT-4o search 和 GPT-4o mini search。這些模型可以搜尋網路以回答問題,並在生成回應時引用來源。
OpenAI 聲稱 GPT-4o search 和 GPT-4o mini search 都具有高準確性。在公司的 SimpleQA 基準測試中,該測試評估模型回答簡短、基於事實問題的能力,GPT-4o search 獲得 90% 的分數,而 GPT-4o mini search 達到 88%。相比之下,體型更大的 GPT-4.5 模型僅得 63%。
Responses API 還包括一個檔案搜尋工具,可以快速掃描公司資料庫以檢索資訊。OpenAI 保證不會使用這些檔案來訓練其模型。此外,開發者可以存取 OpenAI 的 Computer-Using Agent(CUA)模型,該模型驅動 Operator,使其能透過生成滑鼠和鍵盤動作來自動化資料輸入和應用程式工作流程等任務。
根據 OpenAI 的說法,企業可以選擇在自己的系統上運行目前處於研究預覽階段的 CUA 模型。Operator 中可用的消費者版本 CUA 僅限於基於網路的動作。
需要注意的是,Responses API 無法解決當前 AI 代理面臨的所有技術挑戰。
雖然 AI 驅動的搜尋工具比傳統 AI 模型更準確—這並不意外,因為它們能夠直接查詢答案—但網路搜尋並未消除 AI 幻覺問題。GPT-4o search 仍有 10% 的實事問題回答錯誤。此外,AI 搜尋工具在處理如「湖人今天比分」這類簡短的導航查詢時常遇到困難,近期報告也質疑 ChatGPT 引用的可靠性。
在與 TechCrunch 分享的部落格文章中,OpenAI 承認 CUA 模型「尚未在操作系統上自動化任務時高度可靠」,且可能會犯「無意」的錯誤。
然而,OpenAI 強調這些是其代理工具的早期版本,公司正在持續改進。
除了 Responses API,OpenAI 還發布了一個開源工具包,稱為 Agents SDK,為開發者提供免費工具,以便將模型與內部系統整合、實施安全措施,並監控 AI 代理活動以進行除錯和優化。Agents SDK 是 OpenAI 去年末發布的 Swarm 框架(用於多代理協調)的進化版本。
Godement 表示希望 OpenAI 能在今年縮小 AI 代理展示與實際產品之間的差距,他認為「代理是 AI 最具影響力的應用」。這與 OpenAI 執行長 Sam Altman 在一月發表的聲明相符,他預測 2025 年將是 AI 代理加入勞動力的年份。
無論 2025 年是否真正成為「AI 代理之年」,OpenAI 的最新發布顯示公司正從展示令人印象深刻的代理演示轉向開發具有現實影響力的工具。
相關文章
薩提亞·納德拉準備利用與OpenAI的新合作關係
週三,一位華爾街分析師直接詢問了微軟執行長薩蒂亞·納德拉,修訂後的OpenAI合作關係將如何影響公司的財務狀況。 納德拉將這一新協議描述為對各方都有利的結果。“我們對與OpenAI的合作感到滿意。我始終非常重視任何合作關係,並確保它能夠實現雙贏。只有這樣,雙方才能保持良好的合作伙伴關係。” 他強調,微軟仍然可以使用OpenAI的智慧財產權,包括其模型和智慧體產品,但不再需要為此向OpenAI支付費用。 談到在2032年之前可以免費使用OpenAI最先進的人工智慧技術,納德拉表示:“
OpenAI 勾勒出以公共財富基金、機器人稅及每週四天工作制為核心的人工智慧經濟藍圖
當各國政府正竭力應對超智能機器帶來的經濟衝擊之際,OpenAI 發布了一系列政策提案,闡述在「智能時代」中財富與工作可能如何重塑。這些構想將傳統的左翼機制——例如公共財富基金與擴大的社會安全網——與根本上資本主義、市場導向的經濟框架相融合。OpenAI 的提案本質上是一份願望清單,這份公開聲明有助於民選官員、投資者及公眾理解這家市值 8,520 億美元的公司,如何看待人工智慧在重塑勞動與經濟的過程
Vercel 執行長吉列爾莫·勞赫暗示將進行首次公開募股,因人工智慧代理程式帶動營收成長
與許多在 ChatGPT 問世前成立、如今卻在 AI 時代苦於尋求立足之地的新創公司不同,擁有十年歷史的開發工具與網站託管平台 Vercel,正因 AI 生成應用程式與自主代理程式的蓬勃發展而蓬勃發展。「當我創立這家公司時,只有數千萬人能夠部署應用程式,」Vercel 執行長吉列爾莫·勞赫(Guillermo Rauch)上週在舊金山 HumanX 會議上對與會者表示。「如今我們看到,全世界每個人
相關專題推薦
評論 (27)
0/500
와, 진짜 AI 에이전트 개발 툴이 나왔네. 하지만 자율적인 작업 수행 기능에 대해 약간의 우려도 들고... 비즈니스에 적용하기엔 아직 너무 이른 건 아닐까? OpenAI가 계속 선두를 달리는 게 인상적이긴 해요. 😅
Finalmente ferramentas práticas para criar agentes de IA! A autonomia desses sistemas me faz pensar: será que em breve teremos assistentes que realmente entendem contexto como humanos? 🤔 Ainda estou cético sobre como lidarão com tarefas complexas do mundo real.
Als Entwickler frage ich mich, ob diese Tools wirklich so einfach zu integrieren sind, wie OpenAI behauptet. Die Versprechen klingen gut, aber ich habe Bedenken bezüglich der Daten- und Funktionssicherheit! 😅 Werden uns am Ende die Agenten irgendwann ersetzen?
Super cool that OpenAI's dropping these AI agent tools! Can't wait to see what businesses build with this—maybe smarter chatbots or auto-scheduling systems? 🚀
Super cool that OpenAI is dropping these AI agent tools! Makes me wonder how small businesses will use them to compete with the big dogs. 🐶

在週二,OpenAI 推出了一系列新工具,旨在協助開發者和企業利用 OpenAI 的專有 AI 模型和框架打造 AI 代理—能夠自主執行任務的系統。
這些工具是 OpenAI 新推出的 Responses API 的一部分,該 API 使企業能夠創建自訂的 AI 代理,這些代理能夠進行網路搜尋、篩選公司檔案以及瀏覽網站,類似於 OpenAI 的 Operator 產品。Responses API 將取代公司的 Assistants API,OpenAI 計劃在 2026 年上半年逐步淘汰 Assistants API。
近年來,AI 代理的熱潮迅速增長,儘管科技產業在明確定義和展示“AI 代理”實際含義方面面臨挑戰。最近的一個例子是中國初創公司 Butterfly Effect,其 Manus AI 代理平台因病毒式傳播而受到關注,但用戶發現其表現遠低於公司的大膽宣稱。
OpenAI 面臨著兌現 AI 代理承諾的壓力。
「展示你的代理很容易,」OpenAI 的 API 產品負責人 Olivier Godement 在接受 TechCrunch 採訪時表示。「要擴展代理非常困難,讓人們經常使用它則更加困難。」
今年早些時候,OpenAI 在 ChatGPT 中推出了兩個 AI 代理:Operator,可代表你瀏覽網站;以及 deep research,可編纂研究報告。雖然這些工具展示了代理技術的潛力,但在自主性方面仍有許多不足。
透過 Responses API,OpenAI 旨在提供驅動 AI 代理的核心組件,使開發者能夠創建屬於自己的 Operator 和 deep research 風格的應用程式。目標是讓開發者打造出比現有應用更具自主性的應用程式。
開發者可以利用 Responses API 使用驅動 OpenAI 的 ChatGPT Search 網路搜尋工具的相同 AI 模型:GPT-4o search 和 GPT-4o mini search。這些模型可以搜尋網路以回答問題,並在生成回應時引用來源。
OpenAI 聲稱 GPT-4o search 和 GPT-4o mini search 都具有高準確性。在公司的 SimpleQA 基準測試中,該測試評估模型回答簡短、基於事實問題的能力,GPT-4o search 獲得 90% 的分數,而 GPT-4o mini search 達到 88%。相比之下,體型更大的 GPT-4.5 模型僅得 63%。
Responses API 還包括一個檔案搜尋工具,可以快速掃描公司資料庫以檢索資訊。OpenAI 保證不會使用這些檔案來訓練其模型。此外,開發者可以存取 OpenAI 的 Computer-Using Agent(CUA)模型,該模型驅動 Operator,使其能透過生成滑鼠和鍵盤動作來自動化資料輸入和應用程式工作流程等任務。
根據 OpenAI 的說法,企業可以選擇在自己的系統上運行目前處於研究預覽階段的 CUA 模型。Operator 中可用的消費者版本 CUA 僅限於基於網路的動作。
需要注意的是,Responses API 無法解決當前 AI 代理面臨的所有技術挑戰。
雖然 AI 驅動的搜尋工具比傳統 AI 模型更準確—這並不意外,因為它們能夠直接查詢答案—但網路搜尋並未消除 AI 幻覺問題。GPT-4o search 仍有 10% 的實事問題回答錯誤。此外,AI 搜尋工具在處理如「湖人今天比分」這類簡短的導航查詢時常遇到困難,近期報告也質疑 ChatGPT 引用的可靠性。
在與 TechCrunch 分享的部落格文章中,OpenAI 承認 CUA 模型「尚未在操作系統上自動化任務時高度可靠」,且可能會犯「無意」的錯誤。
然而,OpenAI 強調這些是其代理工具的早期版本,公司正在持續改進。
除了 Responses API,OpenAI 還發布了一個開源工具包,稱為 Agents SDK,為開發者提供免費工具,以便將模型與內部系統整合、實施安全措施,並監控 AI 代理活動以進行除錯和優化。Agents SDK 是 OpenAI 去年末發布的 Swarm 框架(用於多代理協調)的進化版本。
Godement 表示希望 OpenAI 能在今年縮小 AI 代理展示與實際產品之間的差距,他認為「代理是 AI 最具影響力的應用」。這與 OpenAI 執行長 Sam Altman 在一月發表的聲明相符,他預測 2025 年將是 AI 代理加入勞動力的年份。
無論 2025 年是否真正成為「AI 代理之年」,OpenAI 的最新發布顯示公司正從展示令人印象深刻的代理演示轉向開發具有現實影響力的工具。
薩提亞·納德拉準備利用與OpenAI的新合作關係
週三,一位華爾街分析師直接詢問了微軟執行長薩蒂亞·納德拉,修訂後的OpenAI合作關係將如何影響公司的財務狀況。 納德拉將這一新協議描述為對各方都有利的結果。“我們對與OpenAI的合作感到滿意。我始終非常重視任何合作關係,並確保它能夠實現雙贏。只有這樣,雙方才能保持良好的合作伙伴關係。” 他強調,微軟仍然可以使用OpenAI的智慧財產權,包括其模型和智慧體產品,但不再需要為此向OpenAI支付費用。 談到在2032年之前可以免費使用OpenAI最先進的人工智慧技術,納德拉表示:“
OpenAI 勾勒出以公共財富基金、機器人稅及每週四天工作制為核心的人工智慧經濟藍圖
當各國政府正竭力應對超智能機器帶來的經濟衝擊之際,OpenAI 發布了一系列政策提案,闡述在「智能時代」中財富與工作可能如何重塑。這些構想將傳統的左翼機制——例如公共財富基金與擴大的社會安全網——與根本上資本主義、市場導向的經濟框架相融合。OpenAI 的提案本質上是一份願望清單,這份公開聲明有助於民選官員、投資者及公眾理解這家市值 8,520 億美元的公司,如何看待人工智慧在重塑勞動與經濟的過程
Vercel 執行長吉列爾莫·勞赫暗示將進行首次公開募股,因人工智慧代理程式帶動營收成長
與許多在 ChatGPT 問世前成立、如今卻在 AI 時代苦於尋求立足之地的新創公司不同,擁有十年歷史的開發工具與網站託管平台 Vercel,正因 AI 生成應用程式與自主代理程式的蓬勃發展而蓬勃發展。「當我創立這家公司時,只有數千萬人能夠部署應用程式,」Vercel 執行長吉列爾莫·勞赫(Guillermo Rauch)上週在舊金山 HumanX 會議上對與會者表示。「如今我們看到,全世界每個人
와, 진짜 AI 에이전트 개발 툴이 나왔네. 하지만 자율적인 작업 수행 기능에 대해 약간의 우려도 들고... 비즈니스에 적용하기엔 아직 너무 이른 건 아닐까? OpenAI가 계속 선두를 달리는 게 인상적이긴 해요. 😅
Finalmente ferramentas práticas para criar agentes de IA! A autonomia desses sistemas me faz pensar: será que em breve teremos assistentes que realmente entendem contexto como humanos? 🤔 Ainda estou cético sobre como lidarão com tarefas complexas do mundo real.
Als Entwickler frage ich mich, ob diese Tools wirklich so einfach zu integrieren sind, wie OpenAI behauptet. Die Versprechen klingen gut, aber ich habe Bedenken bezüglich der Daten- und Funktionssicherheit! 😅 Werden uns am Ende die Agenten irgendwann ersetzen?
Super cool that OpenAI's dropping these AI agent tools! Can't wait to see what businesses build with this—maybe smarter chatbots or auto-scheduling systems? 🚀
Super cool that OpenAI is dropping these AI agent tools! Makes me wonder how small businesses will use them to compete with the big dogs. 🐶





首頁






