選項
首頁
新聞
OpenAI揭曉進階AI推理模型,o3與o4-mini

OpenAI揭曉進階AI推理模型,o3與o4-mini

2025-07-25
0

OpenAI揭曉進階AI推理模型,o3與o4-mini

OpenAI於週三推出o3與o4-mini,這是兩款新型AI模型,設計為在回答前暫停並分析問題。

OpenAI宣稱o3是其迄今最先進的推理模型,在數學、編碼、推理、科學及視覺理解測試中超越先前模型。同時,o4-mini在成本、速度與性能間取得平衡,是開發者打造AI驅動應用的理想選擇。

與早期模型不同,o3與o4-mini利用ChatGPT工具,如網頁瀏覽、Python程式碼執行、圖像處理及圖像生成。從今日起,這些模型連同o4-mini-high(花費額外時間以提升答案準確度)已對OpenAI的Pro、Plus及Team計劃訂閱者開放。

這些模型是OpenAI在全球AI競賽中力求超越Google、Meta、xAI、Anthropic及DeepSeek等競爭對手的舉措。雖然OpenAI以o1開創AI推理,但競爭者隨後推出相當或更優的模型,使推理模型成為AI實驗室的核心焦點。

最初,o3並未計劃用於ChatGPT發佈。OpenAI執行長Sam Altman於二月暗示將專注於使用o3技術的更進階替代方案。然而,競爭壓力可能促使OpenAI推出o3。

OpenAI報告稱,o3在SWE-bench驗證(無自訂結構)中表現頂尖,編碼任務得分69.1%。o4-mini得分68.1%,o3-mini得分49.3%,相比之下,Claude 3.7 Sonnet得分62.3%。

OpenAI宣稱o3與o4-mini是其首批能有效處理圖像的模型。使用者可上傳白板草圖或PDF圖表等圖像,模型在推理過程中進行分析,能處理模糊或低品質圖像,並執行縮放或旋轉等任務。

除了圖像,o3與o4-mini透過ChatGPT的Canvas功能在瀏覽器中執行Python程式碼,並可搜尋網頁以處理即時事件查詢。

所有三款模型—o3、o4-mini及o4-mini-high—均可透過OpenAI的Chat Completions API及Responses API存取,讓開發者能以基於使用的定價將其整合至應用程式中。

OpenAI為o3定價為每百萬輸入token 10美元(約75萬字),輸出token每百萬40美元。o4-mini與o3-mini定價相同,每百萬輸入token 1.10美元,輸出token每百萬4.40美元。

未來幾週,OpenAI計劃推出o3-pro,這是o3的運算密集型版本,僅限ChatGPT Pro訂閱者使用。

執行長Sam Altman暗示,o3與o4-mini可能是OpenAI在ChatGPT中最後的獨立推理模型,之後將推出GPT-5,整合傳統與推理模型功能。

相關文章
重塑您的家居:AI驅動的Pinterest與ChatGPT裝飾 重塑您的家居:AI驅動的Pinterest與ChatGPT裝飾 難以從眾多選項中重新設計您的家居?結合人工智慧與Pinterest的視覺靈感,打造您的理想空間。本指南揭示如何融合Pinterest的圖像與ChatGPT的創意規劃,創造令人驚艷的家居裝飾。主要亮點利用Pinterest尋找視覺靈感:探索Pinterest以收集多樣的家居裝飾風格,精準定位您的獨特品味。使用ChatGPT進行智能規劃:運用ChatGPT塑造您的願景,制定詳細的裝飾策略,並解決設計難
OpenAI探索「使用ChatGPT登錄」第三方應用程式 OpenAI探索「使用ChatGPT登錄」第三方應用程式 OpenAI正在研究讓使用者以ChatGPT帳號登入第三方應用程式的選項,根據週二發布的網頁顯示。該公司正積極尋求有興趣將此功能整合至其平台的開發者回饋。ChatGPT擁有約6億月活躍使用者,是全球領先的消費應用程式之一。OpenAI希望利用其廣泛的採用率,擴展至電子商務、社交平台和個人設備等領域。可能的「使用ChatGPT登錄」選項,可能使OpenAI成為Apple、Google和Microso
AI研究人員綠卡被拒引發美國人才保留問題的擔憂 AI研究人員綠卡被拒引發美國人才保留問題的擔憂 加拿大AI專家陳凱在OpenAI工作12年後,據公司著名研究科學家Noam Brown透露,其綠卡申請被拒。Brown在X上的帖子中表示,陳於週五得知此決定,且即將離開美國。Brown表示:「令人震驚的是,我合作過的最優秀的AI研究人員之一[…]被拒絕了美國綠卡。一位為美國貢獻12年的加拿大人如今面臨離境。這將威脅美國在AI領域的領導地位,因為我們拒絕了這樣的人才。」OpenAI的另一位同事Dyl
評論 (0)
0/200
回到頂部
OR