DeepSeek V3.2 人工智慧模型以最低運算成本實現頂尖效能
當大型科技公司投入數十億美元計算資源開發尖端AI模型時,中國的DeepSeek憑藉更聰明的策略而非規模優勢達成了同等成果。DeepSeek V3.2模型在推理基準測試中媲美OpenAI的GPT-5,卻僅耗費「更少的總訓練浮點運算次數」——這項突破或將重新定義業界構建複雜人工智慧的途徑。
對企業而言,此版本釋出表明頂尖AI能力未必需要頂尖運算預算。DeepSeek V3.2的開源特性使組織能在掌控部署基礎設施的前提下,評估其先進推理與智能體功能——隨著成本效益日益成為AI部署計畫的核心考量,此特性至關重要。
這家位於杭州的研究實驗室週一發布了兩個版本:基礎版DeepSeek V3.2與DeepSeek-V3.2-Speciale。後者在2025年國際數學奧林匹克競賽與國際資訊奧林匹克競賽中獲得金牌級表現——這些基準此前僅有美國頂尖人工智慧企業的未發布內部模型能達到。
此成就尤為難得,因受出口管制限制,深思在取得先進半導體晶片方面面臨諸多挑戰。
資源效率成為競爭優勢
DeepSeek的成功挑戰了業界普遍認為「頂尖AI效能需仰賴海量運算資源」的認知。該公司將此效能歸功於架構突破,特別是DeepSeek稀疏注意力機制(DSA),該技術在維持模型效能的前提下大幅降低運算複雜度。
基礎版DeepSeek V3.2模型在2025年美國數學競賽(AIME)題庫中達成93.1%準確率,並取得Codeforces 2386分評級,其推理能力與GPT-5處於同等水準。
其Speciale變體表現更為出色:在2025年美國數學邀請賽(AIME)中取得96.0%成績,於2025年2月哈佛-麻省理工數學競賽(HMMT)獲得99.2%成績,並在2025年國際數學奧林匹克競賽與國際資訊奧林匹克競賽中雙雙奪得金牌。
這些成果尤為難得,因DeepSeek受制於影響中國的各項關稅與出口管制,導致其獲取先進晶片的管道受限。技術報告顯示,該公司投入的訓練後運算預算超過預訓練支出的10%——這項重大投資透過強化學習優化而非暴力擴展,成功培育出先進能力。
技術創新驅動效能提升
DSA機制標誌著注意力架構的革新。相較於以均勻運算強度處理所有標記,DSA採用「閃電索引器」與細粒度標記篩選系統,僅針對每項查詢精準定位並處理最關鍵資訊。
此方法將核心注意力複雜度從 O(L²) 降至 O(Lk),其中 k 代表選取的標記數量——僅佔序列總長度 L 的部分。在基於 DeepSeek-V3.1-Terminus 檢查點的擴展預訓練階段,該公司運用 480 組 128K 標記序列(每訓練步驟),對 DSA 進行了 9437 億標記的訓練。
該架構同時實現了針對工具調用情境的上下文管理機制。有別於早期推理模型在每次用戶訊息後即棄置推理內容,DeepSeek V3.2 模型僅在新增工具相關訊息時保留推理軌跡,透過消除不必要的重複推理,提升多輪對話工作流中的標記效率。
企業應用與實務效能
對於評估AI導入的企業而言,DeepSeek的方法論在基準測試結果之外提供具體效益。在衡量編碼工作流程能力的Terminal Bench 2.0測試中,DeepSeek V3.2達成46.4%準確度。
在軟體工程問題解決基準測試SWE-Verified中,模型得分達73.1%;於多語言測試SWE Multilingual中則達70.2%,彰顯其在開發環境的實務價值。
在需自主工具運用與多步驟推理的代理任務中,該模型較先前開源系統展現顯著提升。公司建構大規模代理任務合成管道,生成逾1,800種獨特環境與85,000個複雜提示,使模型能將推理策略泛化至陌生工具使用情境。
DeepSeek已將基礎V3.2模型開源至Hugging Face平台,企業可免除供應商鎖定限制進行部署與客製化。因需更高代幣消耗量,Speciale變體目前僅透過API提供——此為峰值效能與部署效率間的權衡取捨。
產業影響與認可
此發布在AI研究社群引發熱烈討論。Google DeepMind首席研究工程師Susan Zhang讚譽DeepSeek詳盡的技術文件,特別肯定該公司在模型訓練後穩定性與強化自主能力方面的努力。
適逢神經資訊處理系統會議前夕,此舉更引發高度關注。出席聖地牙哥會議的中國開源AI生態專家Florian Brand觀察到即時反響:「DeepSeek發布消息後,今日所有群組聊天都熱烈討論。」
已知限制與發展路徑
DeepSeek技術報告直面當前與前沿模型的差距。符號效率仍是挑戰——DeepSeek V3.2模型通常需更長生成序列才能達到Gemini 3 Pro等系統的輸出品質。該公司亦承認,受限於整體訓練運算資源較低,其世界知識廣度仍落後於領先的專有模型。
未來發展重點包括:擴充預訓練運算資源以拓展世界知識庫、優化推理鏈效率以提升符號使用率,以及精進基礎架構以強化複雜問題解決能力。
另請參閱:AI商業現實——企業領導者必知要點

想向業界專家深入了解人工智慧與大數據?歡迎探索將於阿姆斯特丹、加州及倫敦舉辦的「人工智慧與大數據博覽會」。此綜合性活動隸屬TechEx系列,與其他重要科技盛會同期舉行。點擊此處獲取更多詳情。
AI News由TechForge Media提供技術支援。點此探索其他即將舉辦的企業科技活動與線上研討會。
相關文章
DeepSeek 推出可與前沿系統匹敵的人工智慧模型
中國人工智慧實驗室 DeepSeek 已發布其最新大型語言模型 DeepSeek V4 的兩個預覽版本,這是對去年 V3.2 模型及其配套的 R1 推理模型的備受期待的更新,該模型曾在人工智慧界引起巨大迴響。該公司表示,DeepSeek V4 Flash 與 V4 Pro 均屬專家混合模型,各自具備 100 萬個標記的上下文視窗——足以處理提示語中的龐大程式碼庫或文件。此專家混合方法會針對每項任務
德國法院支持泰瑞達機器人公司,對 Elite Robots 頒布禁制令
泰瑞達(Teradyne)旗下子公司 Universal Robots 近日在 MODEX 貿易展上展示了其配備 UR 協作機器人手臂的移動式操作機器人。來源:泰瑞達隨著漢諾威工業博覽會本週在德國揭幕,漢堡地區法院針對 Elite Robots Deutschland GmbH 頒布了初步禁制令。此裁決是針對泰瑞達機器人公司(Teradyne Robotics A/S)提起的著作權侵權訴訟所作出的
現代汽車於AW展會首度亮相MobED機器人,人工智慧正重塑製造業格局
現代汽車將於2026年自動化世界博覽會(AW)展示其MobED機器人及其他韓國系統。來源:現代汽車集團隨著機器人與人工智慧在製造、物流等領域的應用日益普及,現代汽車集團機器人實驗室將於下週在首爾舉行的「智慧工廠與自動化世界博覽會」(AW)首度公開其MobED移動平台。本次活動亦將匯聚其他頂尖工業機器人供應商。這款名為「移動偏心機器人」(MobED)的設備於2025年12月首度亮相,採用四組獨立控制
相關專題推薦
評論 (1)
0/500
當大型科技公司投入數十億美元計算資源開發尖端AI模型時,中國的DeepSeek憑藉更聰明的策略而非規模優勢達成了同等成果。DeepSeek V3.2模型在推理基準測試中媲美OpenAI的GPT-5,卻僅耗費「更少的總訓練浮點運算次數」——這項突破或將重新定義業界構建複雜人工智慧的途徑。
對企業而言,此版本釋出表明頂尖AI能力未必需要頂尖運算預算。DeepSeek V3.2的開源特性使組織能在掌控部署基礎設施的前提下,評估其先進推理與智能體功能——隨著成本效益日益成為AI部署計畫的核心考量,此特性至關重要。
這家位於杭州的研究實驗室週一發布了兩個版本:基礎版DeepSeek V3.2與DeepSeek-V3.2-Speciale。後者在2025年國際數學奧林匹克競賽與國際資訊奧林匹克競賽中獲得金牌級表現——這些基準此前僅有美國頂尖人工智慧企業的未發布內部模型能達到。
此成就尤為難得,因受出口管制限制,深思在取得先進半導體晶片方面面臨諸多挑戰。
資源效率成為競爭優勢
DeepSeek的成功挑戰了業界普遍認為「頂尖AI效能需仰賴海量運算資源」的認知。該公司將此效能歸功於架構突破,特別是DeepSeek稀疏注意力機制(DSA),該技術在維持模型效能的前提下大幅降低運算複雜度。
基礎版DeepSeek V3.2模型在2025年美國數學競賽(AIME)題庫中達成93.1%準確率,並取得Codeforces 2386分評級,其推理能力與GPT-5處於同等水準。
其Speciale變體表現更為出色:在2025年美國數學邀請賽(AIME)中取得96.0%成績,於2025年2月哈佛-麻省理工數學競賽(HMMT)獲得99.2%成績,並在2025年國際數學奧林匹克競賽與國際資訊奧林匹克競賽中雙雙奪得金牌。
這些成果尤為難得,因DeepSeek受制於影響中國的各項關稅與出口管制,導致其獲取先進晶片的管道受限。技術報告顯示,該公司投入的訓練後運算預算超過預訓練支出的10%——這項重大投資透過強化學習優化而非暴力擴展,成功培育出先進能力。
技術創新驅動效能提升
DSA機制標誌著注意力架構的革新。相較於以均勻運算強度處理所有標記,DSA採用「閃電索引器」與細粒度標記篩選系統,僅針對每項查詢精準定位並處理最關鍵資訊。
此方法將核心注意力複雜度從 O(L²) 降至 O(Lk),其中 k 代表選取的標記數量——僅佔序列總長度 L 的部分。在基於 DeepSeek-V3.1-Terminus 檢查點的擴展預訓練階段,該公司運用 480 組 128K 標記序列(每訓練步驟),對 DSA 進行了 9437 億標記的訓練。
該架構同時實現了針對工具調用情境的上下文管理機制。有別於早期推理模型在每次用戶訊息後即棄置推理內容,DeepSeek V3.2 模型僅在新增工具相關訊息時保留推理軌跡,透過消除不必要的重複推理,提升多輪對話工作流中的標記效率。
企業應用與實務效能
對於評估AI導入的企業而言,DeepSeek的方法論在基準測試結果之外提供具體效益。在衡量編碼工作流程能力的Terminal Bench 2.0測試中,DeepSeek V3.2達成46.4%準確度。
在軟體工程問題解決基準測試SWE-Verified中,模型得分達73.1%;於多語言測試SWE Multilingual中則達70.2%,彰顯其在開發環境的實務價值。
在需自主工具運用與多步驟推理的代理任務中,該模型較先前開源系統展現顯著提升。公司建構大規模代理任務合成管道,生成逾1,800種獨特環境與85,000個複雜提示,使模型能將推理策略泛化至陌生工具使用情境。
DeepSeek已將基礎V3.2模型開源至Hugging Face平台,企業可免除供應商鎖定限制進行部署與客製化。因需更高代幣消耗量,Speciale變體目前僅透過API提供——此為峰值效能與部署效率間的權衡取捨。
產業影響與認可
此發布在AI研究社群引發熱烈討論。Google DeepMind首席研究工程師Susan Zhang讚譽DeepSeek詳盡的技術文件,特別肯定該公司在模型訓練後穩定性與強化自主能力方面的努力。
適逢神經資訊處理系統會議前夕,此舉更引發高度關注。出席聖地牙哥會議的中國開源AI生態專家Florian Brand觀察到即時反響:「DeepSeek發布消息後,今日所有群組聊天都熱烈討論。」
已知限制與發展路徑
DeepSeek技術報告直面當前與前沿模型的差距。符號效率仍是挑戰——DeepSeek V3.2模型通常需更長生成序列才能達到Gemini 3 Pro等系統的輸出品質。該公司亦承認,受限於整體訓練運算資源較低,其世界知識廣度仍落後於領先的專有模型。
未來發展重點包括:擴充預訓練運算資源以拓展世界知識庫、優化推理鏈效率以提升符號使用率,以及精進基礎架構以強化複雜問題解決能力。
另請參閱:AI商業現實——企業領導者必知要點

想向業界專家深入了解人工智慧與大數據?歡迎探索將於阿姆斯特丹、加州及倫敦舉辦的「人工智慧與大數據博覽會」。此綜合性活動隸屬TechEx系列,與其他重要科技盛會同期舉行。點擊此處獲取更多詳情。
AI News由TechForge Media提供技術支援。點此探索其他即將舉辦的企業科技活動與線上研討會。
DeepSeek 推出可與前沿系統匹敵的人工智慧模型
中國人工智慧實驗室 DeepSeek 已發布其最新大型語言模型 DeepSeek V4 的兩個預覽版本,這是對去年 V3.2 模型及其配套的 R1 推理模型的備受期待的更新,該模型曾在人工智慧界引起巨大迴響。該公司表示,DeepSeek V4 Flash 與 V4 Pro 均屬專家混合模型,各自具備 100 萬個標記的上下文視窗——足以處理提示語中的龐大程式碼庫或文件。此專家混合方法會針對每項任務
德國法院支持泰瑞達機器人公司,對 Elite Robots 頒布禁制令
泰瑞達(Teradyne)旗下子公司 Universal Robots 近日在 MODEX 貿易展上展示了其配備 UR 協作機器人手臂的移動式操作機器人。來源:泰瑞達隨著漢諾威工業博覽會本週在德國揭幕,漢堡地區法院針對 Elite Robots Deutschland GmbH 頒布了初步禁制令。此裁決是針對泰瑞達機器人公司(Teradyne Robotics A/S)提起的著作權侵權訴訟所作出的
現代汽車於AW展會首度亮相MobED機器人,人工智慧正重塑製造業格局
現代汽車將於2026年自動化世界博覽會(AW)展示其MobED機器人及其他韓國系統。來源:現代汽車集團隨著機器人與人工智慧在製造、物流等領域的應用日益普及,現代汽車集團機器人實驗室將於下週在首爾舉行的「智慧工廠與自動化世界博覽會」(AW)首度公開其MobED移動平台。本次活動亦將匯聚其他頂尖工業機器人供應商。這款名為「移動偏心機器人」(MobED)的設備於2025年12月首度亮相,採用四組獨立控制





首頁






