選項
首頁
新聞
OpenAI揭曉進階AI推理模型,o3與o4-mini

OpenAI揭曉進階AI推理模型,o3與o4-mini

2025-07-25
53

OpenAI揭曉進階AI推理模型,o3與o4-mini

OpenAI於週三推出o3與o4-mini,這是兩款新型AI模型,設計為在回答前暫停並分析問題。

OpenAI宣稱o3是其迄今最先進的推理模型,在數學、編碼、推理、科學及視覺理解測試中超越先前模型。同時,o4-mini在成本、速度與性能間取得平衡,是開發者打造AI驅動應用的理想選擇。

與早期模型不同,o3與o4-mini利用ChatGPT工具,如網頁瀏覽、Python程式碼執行、圖像處理及圖像生成。從今日起,這些模型連同o4-mini-high(花費額外時間以提升答案準確度)已對OpenAI的Pro、Plus及Team計劃訂閱者開放。

這些模型是OpenAI在全球AI競賽中力求超越Google、Meta、xAI、Anthropic及DeepSeek等競爭對手的舉措。雖然OpenAI以o1開創AI推理,但競爭者隨後推出相當或更優的模型,使推理模型成為AI實驗室的核心焦點。

最初,o3並未計劃用於ChatGPT發佈。OpenAI執行長Sam Altman於二月暗示將專注於使用o3技術的更進階替代方案。然而,競爭壓力可能促使OpenAI推出o3。

OpenAI報告稱,o3在SWE-bench驗證(無自訂結構)中表現頂尖,編碼任務得分69.1%。o4-mini得分68.1%,o3-mini得分49.3%,相比之下,Claude 3.7 Sonnet得分62.3%。

OpenAI宣稱o3與o4-mini是其首批能有效處理圖像的模型。使用者可上傳白板草圖或PDF圖表等圖像,模型在推理過程中進行分析,能處理模糊或低品質圖像,並執行縮放或旋轉等任務。

除了圖像,o3與o4-mini透過ChatGPT的Canvas功能在瀏覽器中執行Python程式碼,並可搜尋網頁以處理即時事件查詢。

所有三款模型—o3、o4-mini及o4-mini-high—均可透過OpenAI的Chat Completions API及Responses API存取,讓開發者能以基於使用的定價將其整合至應用程式中。

OpenAI為o3定價為每百萬輸入token 10美元(約75萬字),輸出token每百萬40美元。o4-mini與o3-mini定價相同,每百萬輸入token 1.10美元,輸出token每百萬4.40美元。

未來幾週,OpenAI計劃推出o3-pro,這是o3的運算密集型版本,僅限ChatGPT Pro訂閱者使用。

執行長Sam Altman暗示,o3與o4-mini可能是OpenAI在ChatGPT中最後的獨立推理模型,之後將推出GPT-5,整合傳統與推理模型功能。

相關文章
美國參議院在爭議中從預算法案中刪除人工智能禁令 美國參議院在爭議中從預算法案中刪除人工智能禁令 參議院以壓倒性的票數廢除人工智能監管禁令周二,美國立法者罕見地表現出兩黨的團結,幾乎一致通過投票,取消了上屆政府通過的里程碑式立法中長達十年之久的禁止州級人工智能監管的規定。在 99-1 的決定性投票之前,雙方就如何在快速發展的 AI 領域中平衡創新與消費者保護進行了激烈的辯論。產業領導者與消費者權益維護者的對決由參議員 Ted Cruz (R-TX) 擁護的這項規定,獲得了包括 Ope
OpenAI 發布兩款先進開源 AI 模型 OpenAI 發布兩款先進開源 AI 模型 OpenAI 於週二宣布推出兩款開源 AI 推理模型,性能媲美其 o 系列。兩款模型均可在 Hugging Face 免費下載,OpenAI 稱其在多項開源模型基準測試中表現「頂尖」。模型分為兩種版本:強大的 gpt-oss-120b,僅需單一 Nvidia GPU 即可運行;輕量級 gpt-oss-20b,設計為可在具備 16GB 記憶體的標準筆電上運行。這是 OpenAI 自五年前推出 GPT
字節跳動推出Seed-Thinking-v1.5 AI模型以提升推理能力 字節跳動推出Seed-Thinking-v1.5 AI模型以提升推理能力 先進推理AI的競賽始於2024年9月OpenAI的o1模型,隨著2025年1月DeepSeek的R1推出而加速。主要AI開發商現正競相打造更快、更具成本效益的推理AI模型,通過思維鏈過程提供精確、深思熟慮的回應,確保回答前的準確性。字節跳動,TikTok的母公司,推出Seed-Thinking-v1.5,一款在技術論文中概述的新大型語言模型(LLM),旨在增強STEM及一般領域的推理能力。該模型尚
評論 (3)
0/200
NicholasWalker
NicholasWalker 2025-09-05 02:30:32

OpenAI又出新模型了,但這次的o3和o4-mini真的能突破現有的推理限制嗎?還是只是換個名字的老套路?🤔 每次聽到『最先進』這種標語就讓人半信半疑...

TimothyEvans
TimothyEvans 2025-08-25 13:33:49

Wow, OpenAI's o3 sounds like a game-changer! Pausing to think before answering? That's some next-level AI. Can't wait to see how it stacks up against other models in real-world tasks! 🤯

TimothyHill
TimothyHill 2025-08-21 23:01:16

The new o3 model sounds like a game-changer! Pausing to think before answering? That's like giving AI a moment to sip coffee and ponder. Can't wait to see how it tackles complex questions! 😎

回到頂部
OR