DeepSeek 推出可與前沿系統匹敵的人工智慧模型

首頁

新聞

2026-05-12

JasonMartinez

# DeepSeek # Deepseek V4 # open source ai

DeepSeek 推出可與前沿系統匹敵的人工智慧模型

中國人工智慧實驗室 DeepSeek 已發布其最新大型語言模型 DeepSeek V4 的兩個預覽版本，這是對去年 V3.2 模型及其配套的 R1 推理模型的備受期待的更新，該模型曾在人工智慧界引起巨大迴響。

該公司表示，DeepSeek V4 Flash 與 V4 Pro 均屬專家混合模型，各自具備 100 萬個標記的上下文視窗——足以處理提示語中的龐大程式碼庫或文件。此專家混合方法會針對每項任務僅啟用特定參數子集，以降低推論成本。

Pro 模型擁有總計 1.6 兆個參數（其中 490 億個為活躍參數），使其成為目前規模最大的公開權重模型。其規模超越了 Moonshot AI 的 Kimi K 2.6（1.1 兆）、MiniMax 的 M1（4560 億）等競爭對手，並超過 DeepSeek V3.2（6710 億）的兩倍以上。較小的 V4 Flash 模型則包含 2,840 億個參數（其中 130 億個為活躍參數）。

DeepSeek 聲稱，架構上的改進使這兩款新模型比 DeepSeek V3.2 更高效且性能更強，在推理基準測試上幾乎「縮小了差距」，無論是開源還是閉源的當前領先模型皆然。

該實驗室報告指出，其新款 V4-Pro-Max 模型在各類推理基準測試中表現優於同類開源模型，並在特定任務上超越 OpenAI 的 GPT-5.2 及 Gemini 3.0 Pro。在編碼競賽基準測試中，DeepSeek 表示兩款 V4 模型的表現「可與 GPT-5.4 相媲美」。

然而，在知識型評估中，這些模型似乎略遜於前沿模型，特別是與 OpenAI 的 GPT-5.4 以及最新的 Google Gemini 3.1 Pro 相比。該實驗室指出，此差距顯示其「發展軌跡落後於最先進的前沿模型約 3 至 6 個月」。

與許多支援音訊、影片及圖像生成的閉源同類模型不同，V4 Flash 和 V4 Pro 皆為純文字模型。

其關鍵優勢在於，DeepSeek V4 的成本效益遠高於當前前沿模型。較小的 V4 Flash 定價為每百萬輸入令牌 0.14 美元，每百萬輸出令牌 0.28 美元，價格低於 GPT-5.4 Nano、Gemini 3.1 Flash、GPT-5.4 Mini 及 Claude Haiku 4.5。規模較大的 V4 Pro 模型每百萬輸入令牌收費 0.145 美元，每百萬輸出令牌收費 3.48 美元，其費率同樣低於 Gemini 3.1 Pro、GPT-5.5、Claude Opus 4.7 及 GPT-5.4。

此次發布緊接在美國指控中國利用數千個代理帳戶，對美國人工智慧實驗室進行工業規模的智慧財產權竊取事件的隔日。DeepSeek 自身也曾面臨 Anthropic 和 OpenAI 的指控，指其進行「提煉」（distilling），實質上是複製了這些公司的 AI 模型。

DeepSeek V3.2 人工智慧模型以最低運算成本實現頂尖效能當大型科技公司投入數十億美元計算資源開發尖端AI模型時，中國的DeepSeek憑藉更聰明的策略而非規模優勢達成了同等成果。DeepSeek V3.2模型在推理基準測試中媲美OpenAI的GPT-5，卻僅耗費「更少的總訓練浮點運算次數」——這項突破或將重新定義業界構建複雜人工智慧的途徑。對企業而言，此版本釋出表明頂尖AI能力未必需要頂尖運算預算。DeepSeek V3.2的開源特性使組織能在掌控部署

安全主管敦促迅速監管人工智能，指出 DeepSeek 等工具的風險安全作業中心，尤其是首席資訊安全官 (CISO) 對於來自中國的人工智慧巨擘 DeepSeek 的憂慮與日俱增。雖然人工智慧起初被讚譽為企業效率與創新的突破，但現在卻讓領導企業防禦的人員感到極度不安。絕大多數（81%）的英國 CISO 呼籲政府立即對中國的 AI 聊天機進行監管。他們警告說，如果不迅速採取行動，該工具可能會引發全國性的網路安全危機。這種憂慮並非基於猜測，而是直接源自於該技術不透明的

測試顯示，DeepSeek 的 R1 AI 模型更新引入了更嚴格的內容審查中國人工智能初創公司 DeepSeek 的最新推理模型，是其 R1 系統的增強迭代版本，在編碼、數學和常識基準上表現出眾，接近 OpenAI 的旗艦模型 o3。然而，這個被命名為「R1-0528」的升級版本，在處理有爭議的議題，尤其是中國當局認為敏感的議題時，表現出更多的不情願。這些發現來自 SpeechMap 背後匿名開發者所進行的測試，SpeechMap 是一個評估不同 AI 模型如何處理敏感

相關專題推薦

文字轉語音