選項
首頁
新聞
DeepSeek 推出可與前沿系統匹敵的人工智慧模型

DeepSeek 推出可與前沿系統匹敵的人工智慧模型

2026-05-12
85

DeepSeek 推出可與前沿系統匹敵的人工智慧模型

中國人工智慧實驗室 DeepSeek 已發布其最新大型語言模型 DeepSeek V4 的兩個預覽版本,這是對去年 V3.2 模型及其配套的 R1 推理模型的備受期待的更新,該模型曾在人工智慧界引起巨大迴響。

該公司表示,DeepSeek V4 Flash 與 V4 Pro 均屬專家混合模型,各自具備 100 萬個標記的上下文視窗——足以處理提示語中的龐大程式碼庫或文件。此專家混合方法會針對每項任務僅啟用特定參數子集,以降低推論成本。

Pro 模型擁有總計 1.6 兆個參數(其中 490 億個為活躍參數),使其成為目前規模最大的公開權重模型。其規模超越了 Moonshot AI 的 Kimi K 2.6(1.1 兆)、MiniMax 的 M1(4560 億)等競爭對手,並超過 DeepSeek V3.2(6710 億)的兩倍以上。 較小的 V4 Flash 模型則包含 2,840 億個參數(其中 130 億個為活躍參數)。

DeepSeek 聲稱,架構上的改進使這兩款新模型比 DeepSeek V3.2 更高效且性能更強,在推理基準測試上幾乎「縮小了差距」,無論是開源還是閉源的當前領先模型皆然。

該實驗室報告指出,其新款 V4-Pro-Max 模型在各類推理基準測試中表現優於同類開源模型,並在特定任務上超越 OpenAI 的 GPT-5.2 及 Gemini 3.0 Pro。在編碼競賽基準測試中,DeepSeek 表示兩款 V4 模型的表現「可與 GPT-5.4 相媲美」。

然而,在知識型評估中,這些模型似乎略遜於前沿模型,特別是與 OpenAI 的 GPT-5.4 以及最新的 Google Gemini 3.1 Pro 相比。該實驗室指出,此差距顯示其「發展軌跡落後於最先進的前沿模型約 3 至 6 個月」。

與許多支援音訊、影片及圖像生成的閉源同類模型不同,V4 Flash 和 V4 Pro 皆為純文字模型。

其關鍵優勢在於,DeepSeek V4 的成本效益遠高於當前前沿模型。較小的 V4 Flash 定價為每百萬輸入令牌 0.14 美元,每百萬輸出令牌 0.28 美元,價格低於 GPT-5.4 Nano、Gemini 3.1 Flash、GPT-5.4 Mini 及 Claude Haiku 4.5。 規模較大的 V4 Pro 模型每百萬輸入令牌收費 0.145 美元,每百萬輸出令牌收費 3.48 美元,其費率同樣低於 Gemini 3.1 Pro、GPT-5.5、Claude Opus 4.7 及 GPT-5.4。

此次發布緊接在美國指控中國利用數千個代理帳戶,對美國人工智慧實驗室進行工業規模的智慧財產權竊取事件的隔日。DeepSeek 自身也曾面臨 Anthropic 和 OpenAI 的指控,指其進行「提煉」(distilling),實質上是複製了這些公司的 AI 模型。

相關文章
DeepSeek V3.2 人工智慧模型以最低運算成本實現頂尖效能 DeepSeek V3.2 人工智慧模型以最低運算成本實現頂尖效能 當大型科技公司投入數十億美元計算資源開發尖端AI模型時,中國的DeepSeek憑藉更聰明的策略而非規模優勢達成了同等成果。DeepSeek V3.2模型在推理基準測試中媲美OpenAI的GPT-5,卻僅耗費「更少的總訓練浮點運算次數」——這項突破或將重新定義業界構建複雜人工智慧的途徑。對企業而言,此版本釋出表明頂尖AI能力未必需要頂尖運算預算。DeepSeek V3.2的開源特性使組織能在掌控部署
安全主管敦促迅速監管人工智能,指出 DeepSeek 等工具的風險 安全主管敦促迅速監管人工智能,指出 DeepSeek 等工具的風險 安全作業中心,尤其是首席資訊安全官 (CISO) 對於來自中國的人工智慧巨擘 DeepSeek 的憂慮與日俱增。雖然人工智慧起初被讚譽為企業效率與創新的突破,但現在卻讓領導企業防禦的人員感到極度不安。絕大多數(81%)的英國 CISO 呼籲政府立即對中國的 AI 聊天機進行監管。他們警告說,如果不迅速採取行動,該工具可能會引發全國性的網路安全危機。這種憂慮並非基於猜測,而是直接源自於該技術不透明的
測試顯示,DeepSeek 的 R1 AI 模型更新引入了更嚴格的內容審查 測試顯示,DeepSeek 的 R1 AI 模型更新引入了更嚴格的內容審查 中國人工智能初創公司 DeepSeek 的最新推理模型,是其 R1 系統的增強迭代版本,在編碼、數學和常識基準上表現出眾,接近 OpenAI 的旗艦模型 o3。然而,這個被命名為「R1-0528」的升級版本,在處理有爭議的議題,尤其是中國當局認為敏感的議題時,表現出更多的不情願。這些發現來自 SpeechMap 背後匿名開發者所進行的測試,SpeechMap 是一個評估不同 AI 模型如何處理敏感
相關專題推薦
文字轉語音 專為閱讀障礙設計的頂尖 AI 語音合成應用程式:協助學生提升學習與閱讀效率
專為閱讀障礙設計的頂尖 AI 語音合成應用程式:協助學生提升學習與閱讀效率

探索 2026 年最新精選、專為閱讀障礙者設計的頂級 AI 語音合成(TTS)應用程式。我們的專家評比將免費與付費工具進行對照,重點介紹能提升閱讀效率與學習成效的強大功能。發掘這些必試且能帶來革命性改變的解決方案,釋放學生的潛能。立即前往 XIX.AI 展開您的探索之旅。

10 個工具
xix.ai
漫畫創作 少年漫畫頂尖 AI 生成器:打造高張力動作場面與能量特效
少年漫畫頂尖 AI 生成器:打造高張力動作場面與能量特效

立即前往 XIX.AI,探索 2026 年最優秀的少年漫畫 AI 生成工具。我們精心挑選的頂級清單,匯集了能打造高張力動作場面與動態能量特效的強大工具。透過實際測試,比較免費與付費選項的差異。釋放您的創作潛能,今天就開始打造史詩級漫畫吧!

15 個工具
xix.ai
商業 最佳 AI 支出追蹤工具:掃描收據並自動分類公司開支
最佳 AI 支出追蹤工具:掃描收據並自動分類公司開支

2026 年最新最佳 AI 報銷管理工具:備受好評的解決方案,可自動掃描收據並分類企業支出。探索強大且顛覆傳統的解決方案,助您輕鬆管理報銷、精準追蹤財務,並簡化合規流程。我們精心整理並每週更新的免費與付費方案比較指南,將協助您找到最合適的選擇。透過 XIX.AI 的專家精選,釋放您的 AI 優勢。

10 個工具
xix.ai
商業 最佳 AI 招聘工具:篩選履歷與自動化安排候選人面試
最佳 AI 招聘工具:篩選履歷與自動化安排候選人面試

在 XIX.AI 探索 2026 年最新且評價最高的 AI 招聘工具。我們精心挑選的清單收錄了強大且具顛覆性的解決方案,可協助篩選履歷並自動化安排候選人面試。透過實際測試與每週更新的排行榜,比較免費與付費選項。立即找到最適合您的招聘助手,並優化您的招聘流程!

10 個工具
xix.ai
生產率 AI 個人健康與專注力教練:管理倦怠感並提升精神能量
AI 個人健康與專注力教練:管理倦怠感並提升精神能量

立即在 XIX.AI 探索 2026 年最佳 AI 個人健康與專注力教練。我們精心策劃的排行榜收錄了備受好評、能帶來革命性改變的工具,助您管理倦怠感並提升精神能量。透過實際使用心得,比較免費與付費方案的差異。立即開啟通往巔峰生產力與身心健康的道路。

10 個工具
xix.ai
聊天機器人 最受好評的 AI 浪漫聊天機器人:透過一貫的個性建立長期關係
最受好評的 AI 浪漫聊天機器人:透過一貫的個性建立長期關係

探索 2026 年最新、評價最高的 AI 浪漫聊天機器人,助您建立真摯且長久的連結。我們精心整理的清單包含功能強大且性格鮮明的聊天機器人、免費與付費版本的比較,以及實際測試結果。立即前往 XIX.AI 尋找您的完美伴侶,並開始建立這段關係吧。

10 個工具
xix.ai
評論 (0)
0/500
OR