選項
首頁
新聞
OpenAI 推出 GPT-5.4 Pro 及 Thinking 版本

OpenAI 推出 GPT-5.4 Pro 及 Thinking 版本

2026-05-06
52

OpenAI 推出 GPT-5.4 Pro 及 Thinking 版本

週四,OpenAI 推出了 GPT-5.4,這是一款被描述為「我們目前功能最強大且最高效的專業工作前沿模型」的新基礎模型。除了標準版本外,GPT-5.4 還提供專注於推理的變體(GPT-5.4 Thinking)以及性能優化的版本(GPT-5.4 Pro)。

該模型的 API 版本將支援長達 100 萬個標記的上下文視窗,創下 OpenAI 迄今為止提供的最大上下文容量紀錄。

OpenAI 亦強調了提升的標記效率,指出 GPT-5.4 解決相同問題所需的標記數量,遠少於其前代產品。

新模型在基準測試中表現大幅提升,於電腦應用基準測試 OSWorld-Verified 和 WebArena Verified 中創下紀錄分數。此外,在 OpenAI 針對知識型工作任務的 GDPval 測試中,更以 83% 的得分刷新紀錄。

根據 Mercor 執行長 Brendan Foody 的聲明,GPT-5.4 在 Mercor 的 APEX-Agents 基準測試中表現領先,該測試旨在評估法律與金融領域的專業技能。

「[GPT-5.4] 在產出長週期交付成果方面表現卓越,例如簡報檔、財務模型及法律分析,」Foody 表示,「不僅展現頂尖效能,運作速度更勝競品前沿模型,且成本更低。」

GPT-5.4 延續了 OpenAI 降低「幻覺」與事實錯誤的研發成果。該公司報告指出,相較於 GPT-5.2,新模型在單一陳述中出現錯誤的機率降低了 33%,整體回應中包含錯誤的機率則降低了 18%。

作為此次發布的一部分,OpenAI 重新設計了 GPT-5.4 API 處理工具調用的方式,並引入了一套名為「工具搜尋」(Tool Search)的新系統。此前,系統提示必須預先定義所有可用工具——隨著工具庫的擴展,此過程會消耗大量代幣。新系統允許模型按需檢索工具定義,使在擁有眾多工具的環境中,請求處理速度更快且更具成本效益。

OpenAI 還新增了一項安全評估機制,用以檢視其模型的「思維鏈」——這是在執行多步驟任務時,揭示模型推理過程的即時註解。AI 安全研究人員長期以來一直擔憂,推理型模型可能會誤導其思維鏈,而測試結果證實,在特定條件下確實可能發生這種情況。

OpenAI 的新評估顯示,在 GPT-5.4 的「思考版」(Thinking version)中,這種誤導行為發生的機率較低,這「表明該模型缺乏隱藏其推理過程的能力,且 CoT 監控仍是一種有效的安全工具。」

相關文章
薩提亞·納德拉準備利用與OpenAI的新合作關係 薩提亞·納德拉準備利用與OpenAI的新合作關係 週三,一位華爾街分析師直接詢問了微軟執行長薩蒂亞·納德拉,修訂後的OpenAI合作關係將如何影響公司的財務狀況。 納德拉將這一新協議描述為對各方都有利的結果。“我們對與OpenAI的合作感到滿意。我始終非常重視任何合作關係,並確保它能夠實現雙贏。只有這樣,雙方才能保持良好的合作伙伴關係。” 他強調,微軟仍然可以使用OpenAI的智慧財產權,包括其模型和智慧體產品,但不再需要為此向OpenAI支付費用。 談到在2032年之前可以免費使用OpenAI最先進的人工智慧技術,納德拉表示:“
OpenAI 勾勒出以公共財富基金、機器人稅及每週四天工作制為核心的人工智慧經濟藍圖 OpenAI 勾勒出以公共財富基金、機器人稅及每週四天工作制為核心的人工智慧經濟藍圖 當各國政府正竭力應對超智能機器帶來的經濟衝擊之際,OpenAI 發布了一系列政策提案,闡述在「智能時代」中財富與工作可能如何重塑。這些構想將傳統的左翼機制——例如公共財富基金與擴大的社會安全網——與根本上資本主義、市場導向的經濟框架相融合。OpenAI 的提案本質上是一份願望清單,這份公開聲明有助於民選官員、投資者及公眾理解這家市值 8,520 億美元的公司,如何看待人工智慧在重塑勞動與經濟的過程
葛瑞格・布洛克曼揭露伊隆・馬斯克如何離開 OpenAI 葛瑞格・布洛克曼揭露伊隆・馬斯克如何離開 OpenAI 2017年8月下旬,OpenAI(當時還是一家小型非營利研究實驗室)的核心成員召開會議,商討如何成立營利實體以將其技術商業化,並籌集實現通用人工智慧(AGI)所需的資金。伊隆·馬斯克要求對公司擁有完全控制權,並剛向每位共同創辦人贈送了一輛特斯拉Model 3。技術長格雷格·布羅克曼表示,他認為這是在馬斯克與山姆·奧特曼為各自對公司未來的願景爭取支持之際,試圖用這份禮物來收買他們。 OpenAI的研
相關專題推薦
寫作 最適合廣播和播客使用的AI指令碼編寫工具:幫助您創作引人入勝的音訊廣告
最適合廣播和播客使用的AI指令碼編寫工具:幫助您創作引人入勝的音訊廣告

在XIX.AI上,發現2026年最適合用於廣播和播客製作的AI指令碼工具。我們精心挑選的這些高評分工具能夠提供強大的功能,幫助您快速製作出引人入勝的音訊廣告。透過實際測試和每週更新的排名,您可以瞭解免費選項與付費選項之間的差異。今天就釋放您的創造力吧!

10 個工具
xix.ai
商業 最佳 AI 合約審查軟體:即時發現法律漏洞與合規風險
最佳 AI 合約審查軟體:即時發現法律漏洞與合規風險

立即在 XIX.AI 探索 2026 年最佳 AI 合約審查軟體。我們精心挑選的頂級清單收錄了多款強大工具,能即時偵測法律漏洞與合規風險。透過實際測試與每週更新的排行榜,比較免費與付費方案的差異。為您找到能徹底改變遊戲規則的解決方案,實現安全且高效的合約分析。立即探索這份權威指南。

10 個工具
xix.ai
動畫創作 專為東華設計的AI動漫生成器:可用於建立網路小說角色及漫畫頭像
專為東華設計的AI動漫生成器:可用於建立網路小說角色及漫畫頭像

探索2026年最適合製作中文動畫的人工智慧工具。我們精心挑選的頂級列表中包含了各種強大的工具,能夠幫助你建立出令人驚歎的網路小說角色和漫畫頭像。透過實際測試來對比免費選項和付費選項,找到最適合你的創作工具,今天就在XIX.AI上將你的故事變為現實吧。

10 個工具
xix.ai
漫畫創作 漫畫頂尖 AI 自動上色工具:零一致性錯誤地套用平面色彩
漫畫頂尖 AI 自動上色工具:零一致性錯誤地套用平面色彩

立即前往 XIX.AI,探索 2026 年最優秀的漫畫 AI 自動上色工具。我們精心挑選的清單收錄了備受好評、能徹底改變遊戲規則的解決方案,這些工具能以零一致性錯誤的方式套用平面色彩,大幅提升您的工作效率。透過免費與付費版本的比較、實際測試結果,以及每週更新的排行榜,找到最適合您的工具。立即解鎖您的 AI 優勢。

10 個工具
xix.ai
寫作 頂尖 AI 角色設定生成工具:創造一致的角色動機與致命弱點
頂尖 AI 角色設定生成工具:創造一致的角色動機與致命弱點

探索 2026 年最優秀的 AI 角色設定生成工具,打造立體鮮明的角色。XIX.AI 精心整理的清單收錄了備受好評、能徹底改變遊戲規則的工具,這些工具能生成一貫的動機與致命缺陷。透過實際測試,比較免費與付費選項的差異。立即釋放您的說故事潛能。

10 個工具
xix.ai
商業 頂尖 AI 定價優化軟體:追蹤競爭對手並自動調整商店價格
頂尖 AI 定價優化軟體:追蹤競爭對手並自動調整商店價格

立即在 XIX.AI 探索 2026 年最佳 AI 定價優化軟體。我們精心挑選的清單收錄了備受好評、能徹底改變遊戲規則的工具,這些工具不僅能追蹤競爭對手,還能自動調整您的商店價格,以實現利潤最大化。透過實際測試,比較免費與付費方案的差異。立即掌握您的定價優勢。

10 個工具
xix.ai
評論 (0)
0/500
OR