模型簡介
o1模型系列旨在解決複雜問題,透過比先前模型更深入思考的過程,在科學、編碼和數學方面表現出顯著改進。此外,o1系列採用了新的安全性訓練方法,增強了模型遵守安全指南的能力。
向左向右滑動以查看更多
語言理解能力
通常會做出語義錯誤的判斷,從而導致響應中明顯的邏輯斷開連接。
6.1
知識覆蓋範圍
具有重要的知識盲點,經常顯示事實錯誤並重複過時的信息。
6.5
推理能力
可以通過三個以上的步驟執行邏輯推理,儘管在處理非線性關係時效率下降。
7.0
模型比較
o1-mini-2024-09-12 vs Qwen2.5-7B-Instruct
與Qwen2一樣,Qwen2.5語言模型支援高達128K個tokens,並且可以生成高達8K個tokens。它們還持續支援超過29種語言,包括中文、英文、法文、西班牙文、葡萄牙文、德文、義大利文、俄文、日文、韓文、越南文、泰文、阿拉伯文等。
o1-mini-2024-09-12 vs Spark-X1
科大訊飛發佈的推理模型Spark X1,在國內數學任務領先的基礎上,針對推理、文本生成和語言理解等通用任務的表現,對標OpenAI的o1和DeepSeek的R1。
相關模型
o3-2025-04-16 (high)
O3 是 OpenAI 最新發布的推理模型,其基準指標顯著超越先前模型。
o4-mini-2025-04-16 (high)
o4-mini 處於高階模式,具備更長的反應時間與更強的推理能力。
gpt-oss-120b (high)
GPT-OSS系列,是OpenAI近年來首度發布的開源模型家族。
GPT-5.2-2025-12-11 (high)
由OpenAI正式推出的最新、備受期待且強大的次世代大型語言模型(LLM)——GPT-5,其版本為gpt-5.2。
gpt-oss-120b (high)
GPT-OSS 系列,是 OpenAI 近年來發表的第一個開放原始碼機型系列。
相關文件
短劇《紅果》被指控利用人工智慧盜用普通人的面孔;官方尚未回應
短片產業目前正面臨一場涉及人工智慧侵權的爭議。 紅果短劇製作的《桃釵》被指控利用人工智慧「盜用面孔」——未經許可擅自使用普通人的肖像——引發公眾關注。這起事件始於一名社群媒體用戶指控,其個人照片未經授權就被用於人工智慧生成的內容中。比對數據顯示,該劇角色的服裝、妝容、配飾及外貌特徵與受害者照片中的形象高度吻合。此外,由於劇中角色形象負面,關於肖像權與名譽權遭侵害的爭議因而加劇。這並非孤立事件。隨著
解讀新的 ETSI 人工智慧安全標準
ETSI EN 304 223 制定了人工智慧的基礎安全要求,各組織應將其納入其治理架構之中。隨著企業將機器學習整合至核心工作流程,這項歐洲標準針對保護 AI 模型與系統提供了具體規範。這是首項適用於全球的 AI 網路安全歐洲標準,並已獲各國國家標準組織正式批准,這進一步鞏固了其在國際市場上的公信力。作為《歐盟人工智慧法案》的補充性基準,本標準承認人工智慧系統存在獨特風險——包括資料中毒、模型混淆
Gmail 推出個人化 AI 收件匣、搜尋中的 AI 摘要等功能
Google 為 Gmail 推出了一款由 AI 驅動的新收件匣,能為您提供任務的個人化概覽,並讓您隨時掌握重要更新。此外,Gmail 還將在搜尋功能中推出 AI 概覽,並推出一款類似 Grammarly 的校對工具。先前僅限付費訂閱者使用的多項 AI 功能,現已開放給所有使用者使用。新的 AI 收件匣分頁包含兩個區塊:「建議待辦事項」與「待追蹤主題」。 第一個區塊會顯示需要採取行動的高優先級電子
首個山東百度AI漫畫劇集創作基地在淄博正式啟動
4月27日,山東省在淄博師範學院正式啟動了該省首個「百度AI漫畫劇創作基地」,標誌著該省在數位文化創作領域邁出了重要一步。該基地開啟了校企合作的新篇章,旨在透過AI技術與文化創作教育的深度融合,探索培育數位文化創作人才的創新模式。在揭牌儀式上,校方代表強調,該基地將作為創新人才培育及深化政校企合作的重要平台。 展望未來,該校計劃將真實的專案案例引入課堂,擺脫傳統教學方法,建立一個完整的專案式教學循
桑德伯格與克萊格加入 Nscale 董事會,這家被譽為「挪威星際之門」的新創公司估值達 146 億美元
隨著市場對能大規模提供 AI 運算能力的資料中心需求激增,由 Nvidia 支持的英國 AI 基礎設施公司 Nscale 估值已達 146 億美元。這使該公司與 Helsing 及 Mistral AI 並列,成為歐洲最新的「獨角獸」企業之一。Nscale 的策略核心在於垂直整合,涵蓋能源、資料中心、運算及調度軟體等領域。 此次估值是基於一輪20億美元的C輪融資,該公司稱此為「歐洲史上最大規模」,





首頁
