DeepSeek 推出可與前沿系統匹敵的人工智慧模型

中國人工智慧實驗室 DeepSeek 已發布其最新大型語言模型 DeepSeek V4 的兩個預覽版本,這是對去年 V3.2 模型及其配套的 R1 推理模型的備受期待的更新,該模型曾在人工智慧界引起巨大迴響。
該公司表示,DeepSeek V4 Flash 與 V4 Pro 均屬專家混合模型,各自具備 100 萬個標記的上下文視窗——足以處理提示語中的龐大程式碼庫或文件。此專家混合方法會針對每項任務僅啟用特定參數子集,以降低推論成本。
Pro 模型擁有總計 1.6 兆個參數(其中 490 億個為活躍參數),使其成為目前規模最大的公開權重模型。其規模超越了 Moonshot AI 的 Kimi K 2.6(1.1 兆)、MiniMax 的 M1(4560 億)等競爭對手,並超過 DeepSeek V3.2(6710 億)的兩倍以上。 較小的 V4 Flash 模型則包含 2,840 億個參數(其中 130 億個為活躍參數)。
DeepSeek 聲稱,架構上的改進使這兩款新模型比 DeepSeek V3.2 更高效且性能更強,在推理基準測試上幾乎「縮小了差距」,無論是開源還是閉源的當前領先模型皆然。
該實驗室報告指出,其新款 V4-Pro-Max 模型在各類推理基準測試中表現優於同類開源模型,並在特定任務上超越 OpenAI 的 GPT-5.2 及 Gemini 3.0 Pro。在編碼競賽基準測試中,DeepSeek 表示兩款 V4 模型的表現「可與 GPT-5.4 相媲美」。
然而,在知識型評估中,這些模型似乎略遜於前沿模型,特別是與 OpenAI 的 GPT-5.4 以及最新的 Google Gemini 3.1 Pro 相比。該實驗室指出,此差距顯示其「發展軌跡落後於最先進的前沿模型約 3 至 6 個月」。
與許多支援音訊、影片及圖像生成的閉源同類模型不同,V4 Flash 和 V4 Pro 皆為純文字模型。
其關鍵優勢在於,DeepSeek V4 的成本效益遠高於當前前沿模型。較小的 V4 Flash 定價為每百萬輸入令牌 0.14 美元,每百萬輸出令牌 0.28 美元,價格低於 GPT-5.4 Nano、Gemini 3.1 Flash、GPT-5.4 Mini 及 Claude Haiku 4.5。 規模較大的 V4 Pro 模型每百萬輸入令牌收費 0.145 美元,每百萬輸出令牌收費 3.48 美元,其費率同樣低於 Gemini 3.1 Pro、GPT-5.5、Claude Opus 4.7 及 GPT-5.4。
此次發布緊接在美國指控中國利用數千個代理帳戶,對美國人工智慧實驗室進行工業規模的智慧財產權竊取事件的隔日。DeepSeek 自身也曾面臨 Anthropic 和 OpenAI 的指控,指其進行「提煉」(distilling),實質上是複製了這些公司的 AI 模型。
相關文章
DeepSeek V3.2 人工智慧模型以最低運算成本實現頂尖效能
當大型科技公司投入數十億美元計算資源開發尖端AI模型時,中國的DeepSeek憑藉更聰明的策略而非規模優勢達成了同等成果。DeepSeek V3.2模型在推理基準測試中媲美OpenAI的GPT-5,卻僅耗費「更少的總訓練浮點運算次數」——這項突破或將重新定義業界構建複雜人工智慧的途徑。對企業而言,此版本釋出表明頂尖AI能力未必需要頂尖運算預算。DeepSeek V3.2的開源特性使組織能在掌控部署
安全主管敦促迅速監管人工智能,指出 DeepSeek 等工具的風險
安全作業中心,尤其是首席資訊安全官 (CISO) 對於來自中國的人工智慧巨擘 DeepSeek 的憂慮與日俱增。雖然人工智慧起初被讚譽為企業效率與創新的突破,但現在卻讓領導企業防禦的人員感到極度不安。絕大多數(81%)的英國 CISO 呼籲政府立即對中國的 AI 聊天機進行監管。他們警告說,如果不迅速採取行動,該工具可能會引發全國性的網路安全危機。這種憂慮並非基於猜測,而是直接源自於該技術不透明的
測試顯示,DeepSeek 的 R1 AI 模型更新引入了更嚴格的內容審查
中國人工智能初創公司 DeepSeek 的最新推理模型,是其 R1 系統的增強迭代版本,在編碼、數學和常識基準上表現出眾,接近 OpenAI 的旗艦模型 o3。然而,這個被命名為「R1-0528」的升級版本,在處理有爭議的議題,尤其是中國當局認為敏感的議題時,表現出更多的不情願。這些發現來自 SpeechMap 背後匿名開發者所進行的測試,SpeechMap 是一個評估不同 AI 模型如何處理敏感
相關專題推薦
評論 (0)
0/500

中國人工智慧實驗室 DeepSeek 已發布其最新大型語言模型 DeepSeek V4 的兩個預覽版本,這是對去年 V3.2 模型及其配套的 R1 推理模型的備受期待的更新,該模型曾在人工智慧界引起巨大迴響。
該公司表示,DeepSeek V4 Flash 與 V4 Pro 均屬專家混合模型,各自具備 100 萬個標記的上下文視窗——足以處理提示語中的龐大程式碼庫或文件。此專家混合方法會針對每項任務僅啟用特定參數子集,以降低推論成本。
Pro 模型擁有總計 1.6 兆個參數(其中 490 億個為活躍參數),使其成為目前規模最大的公開權重模型。其規模超越了 Moonshot AI 的 Kimi K 2.6(1.1 兆)、MiniMax 的 M1(4560 億)等競爭對手,並超過 DeepSeek V3.2(6710 億)的兩倍以上。 較小的 V4 Flash 模型則包含 2,840 億個參數(其中 130 億個為活躍參數)。
DeepSeek 聲稱,架構上的改進使這兩款新模型比 DeepSeek V3.2 更高效且性能更強,在推理基準測試上幾乎「縮小了差距」,無論是開源還是閉源的當前領先模型皆然。
該實驗室報告指出,其新款 V4-Pro-Max 模型在各類推理基準測試中表現優於同類開源模型,並在特定任務上超越 OpenAI 的 GPT-5.2 及 Gemini 3.0 Pro。在編碼競賽基準測試中,DeepSeek 表示兩款 V4 模型的表現「可與 GPT-5.4 相媲美」。
然而,在知識型評估中,這些模型似乎略遜於前沿模型,特別是與 OpenAI 的 GPT-5.4 以及最新的 Google Gemini 3.1 Pro 相比。該實驗室指出,此差距顯示其「發展軌跡落後於最先進的前沿模型約 3 至 6 個月」。
與許多支援音訊、影片及圖像生成的閉源同類模型不同,V4 Flash 和 V4 Pro 皆為純文字模型。
其關鍵優勢在於,DeepSeek V4 的成本效益遠高於當前前沿模型。較小的 V4 Flash 定價為每百萬輸入令牌 0.14 美元,每百萬輸出令牌 0.28 美元,價格低於 GPT-5.4 Nano、Gemini 3.1 Flash、GPT-5.4 Mini 及 Claude Haiku 4.5。 規模較大的 V4 Pro 模型每百萬輸入令牌收費 0.145 美元,每百萬輸出令牌收費 3.48 美元,其費率同樣低於 Gemini 3.1 Pro、GPT-5.5、Claude Opus 4.7 及 GPT-5.4。
此次發布緊接在美國指控中國利用數千個代理帳戶,對美國人工智慧實驗室進行工業規模的智慧財產權竊取事件的隔日。DeepSeek 自身也曾面臨 Anthropic 和 OpenAI 的指控,指其進行「提煉」(distilling),實質上是複製了這些公司的 AI 模型。
DeepSeek V3.2 人工智慧模型以最低運算成本實現頂尖效能
當大型科技公司投入數十億美元計算資源開發尖端AI模型時,中國的DeepSeek憑藉更聰明的策略而非規模優勢達成了同等成果。DeepSeek V3.2模型在推理基準測試中媲美OpenAI的GPT-5,卻僅耗費「更少的總訓練浮點運算次數」——這項突破或將重新定義業界構建複雜人工智慧的途徑。對企業而言,此版本釋出表明頂尖AI能力未必需要頂尖運算預算。DeepSeek V3.2的開源特性使組織能在掌控部署
安全主管敦促迅速監管人工智能,指出 DeepSeek 等工具的風險
安全作業中心,尤其是首席資訊安全官 (CISO) 對於來自中國的人工智慧巨擘 DeepSeek 的憂慮與日俱增。雖然人工智慧起初被讚譽為企業效率與創新的突破,但現在卻讓領導企業防禦的人員感到極度不安。絕大多數(81%)的英國 CISO 呼籲政府立即對中國的 AI 聊天機進行監管。他們警告說,如果不迅速採取行動,該工具可能會引發全國性的網路安全危機。這種憂慮並非基於猜測,而是直接源自於該技術不透明的
測試顯示,DeepSeek 的 R1 AI 模型更新引入了更嚴格的內容審查
中國人工智能初創公司 DeepSeek 的最新推理模型,是其 R1 系統的增強迭代版本,在編碼、數學和常識基準上表現出眾,接近 OpenAI 的旗艦模型 o3。然而,這個被命名為「R1-0528」的升級版本,在處理有爭議的議題,尤其是中國當局認為敏感的議題時,表現出更多的不情願。這些發現來自 SpeechMap 背後匿名開發者所進行的測試,SpeechMap 是一個評估不同 AI 模型如何處理敏感





首頁






