DeepSeek 推出可与前沿系统媲美的人工智能模型

首页

新闻

2026-05-12

JasonMartinez

# DeepSeek # Deepseek V4 # open source ai

DeepSeek 推出可与前沿系统媲美的人工智能模型

中国人工智能实验室DeepSeek发布了其最新大型语言模型DeepSeek V4的两个预览版本。作为对去年V3.2模型及其配套的R1推理模型的备受期待的更新，该模型曾在人工智能界引起了巨大反响。

该公司表示，DeepSeek V4 Flash和V4 Pro均为专家混合模型，各自拥有100万令牌的上下文窗口——足以处理提示词中的庞大代码库或文档。这种专家混合方法通过针对每项任务仅激活特定参数子集，从而降低推理成本。

Pro 模型拥有总计 1.6 万亿个参数（其中 490 亿个处于激活状态），使其成为目前可用的最大规模公开权重模型。它超越了 Moonshot AI 的 Kimi K 2.6（1.1 万亿）、MiniMax 的 M1（4560 亿）等竞争对手，其规模更是 DeepSeek V3.2（6710 亿）的两倍多。较小的 V4 Flash 模型包含 2840 亿个参数（其中 130 亿个为活跃参数）。

DeepSeek声称，架构上的改进使得这两款新模型比DeepSeek V3.2更高效、性能更强，在推理基准测试中几乎“缩小了与当前领先模型（包括开源和闭源模型）的差距”。

该实验室报告称，其新推出的 V4-Pro-Max 模型在各类推理基准测试中均优于开源同类模型，并在某些任务上超越了 OpenAI 的 GPT-5.2 和 Gemini 3.0 Pro。在编程竞赛基准测试中，DeepSeek 表示两款 V4 模型的性能“可与 GPT-5.4 媲美”。

然而，在基于知识的评估中，这些模型似乎略逊于前沿模型，特别是与OpenAI的GPT-5.4以及最新的Google Gemini 3.1 Pro相比。该实验室指出，这一差距表明其“发展轨迹落后于最先进的前沿模型约3至6个月”。

与许多支持音频、视频和图像生成的闭源同类模型不同，V4 Flash和V4 Pro均为纯文本模型。

其关键优势在于，DeepSeek V4 的成本效益远高于当前前沿模型。较小的 V4 Flash 定价为每百万输入令牌 0.14 美元、每百万输出令牌 0.28 美元，低于 GPT-5.4 Nano、Gemini 3.1 Flash、GPT-5.4 Mini 以及 Claude Haiku 4.5。规模更大的 V4 Pro 模型每百万输入令牌收费 0.145 美元，每百万输出令牌收费 3.48 美元，其费率同样低于 Gemini 3.1 Pro、GPT-5.5、Claude Opus 4.7 和 GPT-5.4。

此次发布恰逢美国指控中国利用数千个代理账户，对美国人工智能实验室进行工业规模的知识产权盗窃，仅隔一天。DeepSeek 自身也曾面临 Anthropic 和 OpenAI 的指控，称其对这两家公司的 AI 模型进行了“蒸馏”（实质上是复制）。

DeepSeek V3.2人工智能模型以极低计算成本实现顶尖性能当大型科技公司投入数十亿美元计算资源开发尖端人工智能模型时，中国的DeepSeek却通过更智能的方法而非单纯规模实现了同等成果。DeepSeek V3.2模型在推理基准测试中与OpenAI的GPT-5持平，但其"总训练浮点运算次数更少"——这一突破或将重新定义行业构建复杂人工智能的途径。对企业而言，此次发布表明顶级AI能力未必需要顶级计算预算。DeepSeek V3.2的开源特性使机构既能评估其先

安全主管敦促迅速监管人工智能，指出 DeepSeek 等工具的风险安全运营中心内部，尤其是首席信息安全官（CISO）对来自中国的人工智能巨头 DeepSeek 的关注与日俱增。虽然人工智能最初被誉为企业效率和创新的突破，但现在却让那些领导企业防御的人产生了极大的忧虑。绝大多数英国 CISO（81%）呼吁政府立即对中国的人工智能聊天机器人进行监管。他们警告说，如果不迅速采取行动，该工具可能会引发全国性的网络安全危机。这种担忧并非基于猜测，而是直接源于该技术不透明的

测试表明，DeepSeek 的 R1 人工智能模型更新引入了更严格的内容审核机制中国人工智能初创公司 DeepSeek 的最新推理模型是其 R1 系统的增强迭代版，在编码、数学和常识基准测试中表现优异，接近 OpenAI 的旗舰模型 o3。然而，这个被命名为 "R1-0528 "的升级版本在处理有争议的话题，尤其是中国当局认为敏感的话题时表现得更加勉强。SpeechMap 是一个评估不同人工智能模型如何处理敏感话题的平台。这位在 X 平台上被称为 "xlr8harder "的

相关专题推荐

漫画创作