選項
首頁
新聞
OpenAI 致力於打造能夠處理任何任務的通用人工智能

OpenAI 致力於打造能夠處理任何任務的通用人工智能

2025-11-09
64

Hunter Lightman 在 2022 年成為 OpenAI 的研究員後不久,就見證了 ChatGPT 的爆炸性推出--這是科技史上成長最快的產品之一。與此同時,Lightman 較為安靜的工作則是訓練 OpenAI 的模型來應付精英高中數學競賽。

如今,他的團隊 -athGen - 在 OpenAI 尋求建立領先業界的 AI 推理模型的過程中扮演著關鍵的角色。這些系統構成「AI 代理」的骨幹,能夠執行類似人類的電腦任務。

"Lightman 告訴 TechCrunch 有關 MathGen 的起源。

儘管有進展,OpenAI 的模型仍然不完美。即使是其最新的系統也會產生幻覺,在處理複雜的任務時舉步維艱。

然而,數學推理能力已大幅提升。其中一個模型最近在國際數學奧林匹克競賽(International Math Olympiad)中奪得金牌,該競賽是為世界上最聰明的數學學生而設。OpenAI 相信這些推理能力將延伸至其他領域,為其憧憬已久的通用 AI 代理提供動力。

ChatGPT 的成功是偶然的,而 OpenAI 的代理開發則是經過多年的深思熟慮。"執行長 Sam Altman 在 OpenAI 2023 年開發者大會上預言:「不久之後,你只需要請電腦處理任務。"我們稱這些為 「代理」,它們的潛力非常驚人。

科技巨頭已確認參加 Disrupt 2025

Netflix、ElevenLabs、Wayve 和 Sequoia Capital 領導 TechCrunch Disrupt 20 週年慶的全明星陣容。從科技界的頂尖人物身上獲得可行的洞察力 - 立即購買門票,在價格上漲之前最多可節省 675 美元。

科技巨頭已確認參加 Disrupt 2025

Netflix、ElevenLabs、Wayve 和 Sequoia Capital 領導 TechCrunch Disrupt 20 週年慶的全明星陣容。從科技界的頂尖人士獲得可行的洞察力 - 立即購買門票,在價格上漲前可節省高達 675 美元。

舊金山 | 2025 年 10 月 27-29 日 | 立即報名

OpenAI 執行長 Sam Altman 於 2023 年 11 月 6 日在加州舊金山舉行的 OpenAI DevDay 活動中致詞。
OpenAI 執行長 Sam Altman 在 DevDay 2023 發表演說 (照片: Justin Sullivan/Getty Images)

雖然 Altman 的願景仍未得到證實,但 OpenAI 在 2024 年推出的「o1」推理模型已讓科技界瞠目結舌。幾個月之內,它的 21 位研究人員成為矽谷最令人垂涎的人才,Meta 挖走了其中五位,並提供九位數的報酬。

強化學習的復甦

OpenAI 的代理突破與強化學習 (Reinforcement Learning, RL) 息息相關 - AI 模型透過模擬試誤來學習。儘管強化學習可以追溯到 2016 年的 AlphaGo 里程碑,OpenAI 仍花了數年時間,將其改良為適用於電腦使用的代理程式。

早期的 GPT 模型在文字方面表現優異,但在基本數學方面卻乏善可陳。2023 年的「Strawberry」計畫結合了 RL 與測試時計算 - 讓模型在回答前驗證步驟,並開創了「思考鏈」推理。

"研究人員 El Kishky 回憶說:「突然間,模型可以回溯並自我糾正,感覺很人性化。

擴展推理能力

OpenAI 發現了兩個擴充向量:訓練後的運算與反應時間分配。"Lightman 指出:「我們不只是為了今天而設計,也是為了擴充能力而設計。

專門的「Agents」團隊於 2023 年成立,為 o1 奠定基礎。與受限於產品需求的競爭對手不同,OpenAI 將 AGI 研究放在優先地位,這是一項策略性的優勢。

定義 AI 推理

研究人員爭論 AI 是否真的「推理」。有些人強調計算效率,有些人則注重類似人類的輸出。批評者是存在的,但能力是最重要的,就像飛機與鳥類的飛行方式不同一樣。

主觀任務的挑戰

目前的代理程式對於編碼處理得很好,但對於細微的問題,例如線上購物,就很吃力。"Lightman 解釋說:「這根本就是資料的挑戰。新技術允許在較難驗證的任務上進行訓練。

OpenAI 的 IMO 解決方案使用多重代理探索,現在 Google 和 xAI 都在效仿。研究員 Noam Brown 認為快速的進展仍在持續:「沒有放緩的跡象」。

隨著 GPT-5 迫在眉睫,OpenAI 的目標是保持與 Google、Anthropic 和 Meta 對抗的優勢。最終目標?一個能直覺執行任何數位任務的代理程式,完全超越今日的 ChatGPT。

相關文章
薩提亞·納德拉準備利用與OpenAI的新合作關係 薩提亞·納德拉準備利用與OpenAI的新合作關係 週三,一位華爾街分析師直接詢問了微軟執行長薩蒂亞·納德拉,修訂後的OpenAI合作關係將如何影響公司的財務狀況。 納德拉將這一新協議描述為對各方都有利的結果。“我們對與OpenAI的合作感到滿意。我始終非常重視任何合作關係,並確保它能夠實現雙贏。只有這樣,雙方才能保持良好的合作伙伴關係。” 他強調,微軟仍然可以使用OpenAI的智慧財產權,包括其模型和智慧體產品,但不再需要為此向OpenAI支付費用。 談到在2032年之前可以免費使用OpenAI最先進的人工智慧技術,納德拉表示:“
OpenAI 勾勒出以公共財富基金、機器人稅及每週四天工作制為核心的人工智慧經濟藍圖 OpenAI 勾勒出以公共財富基金、機器人稅及每週四天工作制為核心的人工智慧經濟藍圖 當各國政府正竭力應對超智能機器帶來的經濟衝擊之際,OpenAI 發布了一系列政策提案,闡述在「智能時代」中財富與工作可能如何重塑。這些構想將傳統的左翼機制——例如公共財富基金與擴大的社會安全網——與根本上資本主義、市場導向的經濟框架相融合。OpenAI 的提案本質上是一份願望清單,這份公開聲明有助於民選官員、投資者及公眾理解這家市值 8,520 億美元的公司,如何看待人工智慧在重塑勞動與經濟的過程
Vercel 執行長吉列爾莫·勞赫暗示將進行首次公開募股,因人工智慧代理程式帶動營收成長 Vercel 執行長吉列爾莫·勞赫暗示將進行首次公開募股,因人工智慧代理程式帶動營收成長 與許多在 ChatGPT 問世前成立、如今卻在 AI 時代苦於尋求立足之地的新創公司不同,擁有十年歷史的開發工具與網站託管平台 Vercel,正因 AI 生成應用程式與自主代理程式的蓬勃發展而蓬勃發展。「當我創立這家公司時,只有數千萬人能夠部署應用程式,」Vercel 執行長吉列爾莫·勞赫(Guillermo Rauch)上週在舊金山 HumanX 會議上對與會者表示。「如今我們看到,全世界每個人
相關專題推薦
商業 最佳 AI 支出追蹤工具:掃描收據並自動分類公司開支
最佳 AI 支出追蹤工具:掃描收據並自動分類公司開支

2026 年最新最佳 AI 報銷管理工具:備受好評的解決方案,可自動掃描收據並分類企業支出。探索強大且顛覆傳統的解決方案,助您輕鬆管理報銷、精準追蹤財務,並簡化合規流程。我們精心整理並每週更新的免費與付費方案比較指南,將協助您找到最合適的選擇。透過 XIX.AI 的專家精選,釋放您的 AI 優勢。

10 個工具
xix.ai
商業 最佳 AI 招聘工具:篩選履歷與自動化安排候選人面試
最佳 AI 招聘工具:篩選履歷與自動化安排候選人面試

在 XIX.AI 探索 2026 年最新且評價最高的 AI 招聘工具。我們精心挑選的清單收錄了強大且具顛覆性的解決方案,可協助篩選履歷並自動化安排候選人面試。透過實際測試與每週更新的排行榜,比較免費與付費選項。立即找到最適合您的招聘助手,並優化您的招聘流程!

10 個工具
xix.ai
生產率 AI 個人健康與專注力教練:管理倦怠感並提升精神能量
AI 個人健康與專注力教練:管理倦怠感並提升精神能量

立即在 XIX.AI 探索 2026 年最佳 AI 個人健康與專注力教練。我們精心策劃的排行榜收錄了備受好評、能帶來革命性改變的工具,助您管理倦怠感並提升精神能量。透過實際使用心得,比較免費與付費方案的差異。立即開啟通往巔峰生產力與身心健康的道路。

10 個工具
xix.ai
聊天機器人 最受好評的 AI 浪漫聊天機器人:透過一貫的個性建立長期關係
最受好評的 AI 浪漫聊天機器人:透過一貫的個性建立長期關係

探索 2026 年最新、評價最高的 AI 浪漫聊天機器人,助您建立真摯且長久的連結。我們精心整理的清單包含功能強大且性格鮮明的聊天機器人、免費與付費版本的比較,以及實際測試結果。立即前往 XIX.AI 尋找您的完美伴侶,並開始建立這段關係吧。

10 個工具
xix.ai
教育與學習 最佳AI資料科學導師:精通SQL、Pandas及機器學習工作流程
最佳AI資料科學導師:精通SQL、Pandas及機器學習工作流程

探索2026年最優秀的人工智慧資料科學導師,幫助他們掌握SQL、Pandas以及機器學習工作流程。在XIX.AI上檢視我們精心挑選的頂級導師名單,獲得強大而具有變革性的指導。透過對比免費和付費選項,並結合實際應用案例進行了解,今天就開啟你的資料科學精通之路吧。

10 個工具
xix.ai
聊天機器人 最佳 AI 調情與對話訓練工具:即時提升社交魅力與自信
最佳 AI 調情與對話訓練工具:即時提升社交魅力與自信

在 XIX.AI 探索 2026 年最頂尖的 AI 調情與對話訓練工具。我們精心挑選、評價最高的精選清單,能助您即時建立社交魅力與自信。探索這些必試且能徹底改變遊戲規則的工具,並透過免費與付費版本的比較,以及每週更新的排行榜,立即解鎖您的社交優勢。

10 個工具
xix.ai
評論 (0)
0/500
OR