Name: o3-mini-2025-01-31
Rating: 1 (52 reviews)
Author: OpenAI

首頁

AL模型列表

o3-mini-2025-01-31

添加比較

N/A

模型參數數量

OpenAI

附屬組織

閉源

許可證類型

2025-01-31

發佈時間

官方網站

模型簡介

OpenAI o3-mini 已針對STEM推理進行優化。o3-mini 以中等推理努力程度在數學、程式設計和科學方面達到 o1 的效能，同時提供更快的回應速度。

全面得分語言對話知識儲備推理協會數學計算代碼編寫命令以下

向左向右滑動以查看更多

語言理解能力

通常會做出語義錯誤的判斷，從而導致響應中明顯的邏輯斷開連接。

6.6

知識覆蓋範圍

擁有主流學科的核心知識，但對尖端跨學科領域的覆蓋範圍有限。

8.7

推理能力

可以通過三個以上的步驟執行邏輯推理，儘管在處理非線性關係時效率下降。

7.9

模型比較

o3-mini-2025-01-31 vs Qwen2.5-7B-Instruct 與Qwen2一樣，Qwen2.5語言模型支援高達128K個tokens，並且可以生成高達8K個tokens。它們還持續支援超過29種語言，包括中文、英文、法文、西班牙文、葡萄牙文、德文、義大利文、俄文、日文、韓文、越南文、泰文、阿拉伯文等。

o3-mini-2025-01-31 vs Hunyuan-T1-20250822 騰訊自主研發的深度推理模型採用版本號 hunyuan-t1-20250822。

o3-mini-2025-01-31 vs Spark-X1 科大訊飛發佈的推理模型Spark X1，在國內數學任務領先的基礎上，針對推理、文本生成和語言理解等通用任務的表現，對標OpenAI的o1和DeepSeek的R1。

o3-mini-2025-01-31 vs Doubao-Seed-1.6-251015 (Thinking) ByteDance 發表的深度推理模型，支援手動切換深度推理，效能相較於 doubao-1.5 有顯著的提升。

o3-mini-2025-01-31 vs Doubao-Seed-1.6-thinking-250715 字節跳動推出的種子系列模型的最新版本，支持思考模式。

相關模型

o3-2025-04-16 (high) O3 是 OpenAI 最新發布的推理模型，其基準指標顯著超越先前模型。

o4-mini-2025-04-16 (high) o4-mini 處於高階模式，具備更長的反應時間與更強的推理能力。

gpt-oss-120b (high) GPT-OSS系列，是OpenAI近年來首度發布的開源模型家族。

GPT-5.2-2025-12-11 (high) 由OpenAI正式推出的最新、備受期待且強大的次世代大型語言模型（LLM）——GPT-5，其版本為gpt-5.2。

gpt-oss-120b (high) GPT-OSS 系列，是 OpenAI 近年來發表的第一個開放原始碼機型系列。

相關文件

在獲得 SpaceX 的大筆投資後，人工智慧編程新創公司 Cursor 將在亞太地區招聘 200 名員工人工智慧編碼新創公司 Cursor 宣布了一項重大的全球擴張計畫，預計在未來六個月內於亞太地區招聘 200 名員工。主要職位包括行銷工程師、現場工程師及人工智慧部署工程師。此舉彰顯了這家總部位於舊金山的獨角獸企業，正積極將其核心技術推向國際市場。目前，Cursor 已在新加坡設立辦公室，由資深技術高管 Simon Green 領軍，招聘範圍將涵蓋日本、雪梨、墨爾本及印度等關鍵市場。除了亞太地區的

Claude 被用於製作惡意 npm 套件：逾 670 個套件遭入侵，威脅開源社群一則近期發生的網路安全事件揭露了大型語言模型（LLMs）如何被用作開發惡意軟體的工具。資安研究員 Sibi Moosa 發現一名化名為「mousie-5212-super-formatter」的攻擊者，利用 Anthropic 的 Claude AI 生成有害程式碼，並污染 npm 套件生態系統。在短時間內，超過 670 個惡意套件被上傳至 npm 套件庫，此類攻擊的速度與自動化程度引發了高度警

隨著印度加速推動科技發展，信實集團公布了1,100億美元的人工智慧投資計畫印度信實集團（Reliance）的億萬富豪主席穆克什·安巴尼（Mukesh Ambani）於週四宣布，將斥資10兆盧比（約合1,100億美元），在未來七年間於印度各地建設人工智慧運算基礎設施。安巴尼週四在新德里舉行的「印度人工智慧影響力峰會」上表示，這筆投資將用於支持吉瓦級數據中心、全國性的邊緣運算網路，以及與信實集團旗下Jio電信平台整合的新人工智慧服務。安巴尼指出，信實集團已開始在古吉拉特邦的

智源WITA以首份合規申報書為「裸體」機器人互動畫下句點具身智能領域已達成一項重要里程碑。根據上海市網絡信息辦公室的最新公告，智源研究所研發的WITA大模型已成功完成備案，成為國內首個符合規範部署的具身智能交互大模型。這項成就不僅僅是取得許可證。WITA 的核心宗旨在於讓類人型機器人能夠真正進行對話、感知情緒，並發展出鮮明的個性。它專為機器人互動場景設計，透過自然且富有情感表達的溝通方式，將冰冷的機械軀體轉化為具備連續記憶與個人特質的「矽基夥伴」。作

一項人類學研究指出，經過潤飾的人工智慧產出內容會削弱人類的思考能力當你看到人工智慧瞬間產出一段結構完善、邏輯清晰的程式碼或文件時，是否會不假思索地選擇相信它？根據AIbase 的報導，領先的人工智慧公司Anthropic最近發布了一份名為《AI 流暢度指數》的研究報告。在分析了近 10,000 份匿名Claude對話樣本後，這項研究揭露了一個令人擔憂的趨勢：AI 產出的內容看起來越是精緻，使用者就越不願意去查證事實。報告揭示，當Claude產出小型應用程式、網

模型比較

開始比較