DeepSeek 推出可与前沿系统媲美的人工智能模型

中国人工智能实验室DeepSeek发布了其最新大型语言模型DeepSeek V4的两个预览版本。作为对去年V3.2模型及其配套的R1推理模型的备受期待的更新,该模型曾在人工智能界引起了巨大反响。
该公司表示,DeepSeek V4 Flash和V4 Pro均为专家混合模型,各自拥有100万令牌的上下文窗口——足以处理提示词中的庞大代码库或文档。这种专家混合方法通过针对每项任务仅激活特定参数子集,从而降低推理成本。
Pro 模型拥有总计 1.6 万亿个参数(其中 490 亿个处于激活状态),使其成为目前可用的最大规模公开权重模型。它超越了 Moonshot AI 的 Kimi K 2.6(1.1 万亿)、MiniMax 的 M1(4560 亿)等竞争对手,其规模更是 DeepSeek V3.2(6710 亿)的两倍多。 较小的 V4 Flash 模型包含 2840 亿个参数(其中 130 亿个为活跃参数)。
DeepSeek声称,架构上的改进使得这两款新模型比DeepSeek V3.2更高效、性能更强,在推理基准测试中几乎“缩小了与当前领先模型(包括开源和闭源模型)的差距”。
该实验室报告称,其新推出的 V4-Pro-Max 模型在各类推理基准测试中均优于开源同类模型,并在某些任务上超越了 OpenAI 的 GPT-5.2 和 Gemini 3.0 Pro。在编程竞赛基准测试中,DeepSeek 表示两款 V4 模型的性能“可与 GPT-5.4 媲美”。
然而,在基于知识的评估中,这些模型似乎略逊于前沿模型,特别是与OpenAI的GPT-5.4以及最新的Google Gemini 3.1 Pro相比。该实验室指出,这一差距表明其“发展轨迹落后于最先进的前沿模型约3至6个月”。
与许多支持音频、视频和图像生成的闭源同类模型不同,V4 Flash和V4 Pro均为纯文本模型。
其关键优势在于,DeepSeek V4 的成本效益远高于当前前沿模型。较小的 V4 Flash 定价为每百万输入令牌 0.14 美元、每百万输出令牌 0.28 美元,低于 GPT-5.4 Nano、Gemini 3.1 Flash、GPT-5.4 Mini 以及 Claude Haiku 4.5。 规模更大的 V4 Pro 模型每百万输入令牌收费 0.145 美元,每百万输出令牌收费 3.48 美元,其费率同样低于 Gemini 3.1 Pro、GPT-5.5、Claude Opus 4.7 和 GPT-5.4。
此次发布恰逢美国指控中国利用数千个代理账户,对美国人工智能实验室进行工业规模的知识产权盗窃,仅隔一天。DeepSeek 自身也曾面临 Anthropic 和 OpenAI 的指控,称其对这两家公司的 AI 模型进行了“蒸馏”(实质上是复制)。
相关文章
DeepSeek V3.2人工智能模型以极低计算成本实现顶尖性能
当大型科技公司投入数十亿美元计算资源开发尖端人工智能模型时,中国的DeepSeek却通过更智能的方法而非单纯规模实现了同等成果。DeepSeek V3.2模型在推理基准测试中与OpenAI的GPT-5持平,但其"总训练浮点运算次数更少"——这一突破或将重新定义行业构建复杂人工智能的途径。对企业而言,此次发布表明顶级AI能力未必需要顶级计算预算。DeepSeek V3.2的开源特性使机构既能评估其先
安全主管敦促迅速监管人工智能,指出 DeepSeek 等工具的风险
安全运营中心内部,尤其是首席信息安全官(CISO)对来自中国的人工智能巨头 DeepSeek 的关注与日俱增。虽然人工智能最初被誉为企业效率和创新的突破,但现在却让那些领导企业防御的人产生了极大的忧虑。绝大多数英国 CISO(81%)呼吁政府立即对中国的人工智能聊天机器人进行监管。他们警告说,如果不迅速采取行动,该工具可能会引发全国性的网络安全危机。这种担忧并非基于猜测,而是直接源于该技术不透明的
测试表明,DeepSeek 的 R1 人工智能模型更新引入了更严格的内容审核机制
中国人工智能初创公司 DeepSeek 的最新推理模型是其 R1 系统的增强迭代版,在编码、数学和常识基准测试中表现优异,接近 OpenAI 的旗舰模型 o3。然而,这个被命名为 "R1-0528 "的升级版本在处理有争议的话题,尤其是中国当局认为敏感的话题时表现得更加勉强。SpeechMap 是一个评估不同人工智能模型如何处理敏感话题的平台。这位在 X 平台上被称为 "xlr8harder "的
相关专题推荐
评论 (0)
0/500

中国人工智能实验室DeepSeek发布了其最新大型语言模型DeepSeek V4的两个预览版本。作为对去年V3.2模型及其配套的R1推理模型的备受期待的更新,该模型曾在人工智能界引起了巨大反响。
该公司表示,DeepSeek V4 Flash和V4 Pro均为专家混合模型,各自拥有100万令牌的上下文窗口——足以处理提示词中的庞大代码库或文档。这种专家混合方法通过针对每项任务仅激活特定参数子集,从而降低推理成本。
Pro 模型拥有总计 1.6 万亿个参数(其中 490 亿个处于激活状态),使其成为目前可用的最大规模公开权重模型。它超越了 Moonshot AI 的 Kimi K 2.6(1.1 万亿)、MiniMax 的 M1(4560 亿)等竞争对手,其规模更是 DeepSeek V3.2(6710 亿)的两倍多。 较小的 V4 Flash 模型包含 2840 亿个参数(其中 130 亿个为活跃参数)。
DeepSeek声称,架构上的改进使得这两款新模型比DeepSeek V3.2更高效、性能更强,在推理基准测试中几乎“缩小了与当前领先模型(包括开源和闭源模型)的差距”。
该实验室报告称,其新推出的 V4-Pro-Max 模型在各类推理基准测试中均优于开源同类模型,并在某些任务上超越了 OpenAI 的 GPT-5.2 和 Gemini 3.0 Pro。在编程竞赛基准测试中,DeepSeek 表示两款 V4 模型的性能“可与 GPT-5.4 媲美”。
然而,在基于知识的评估中,这些模型似乎略逊于前沿模型,特别是与OpenAI的GPT-5.4以及最新的Google Gemini 3.1 Pro相比。该实验室指出,这一差距表明其“发展轨迹落后于最先进的前沿模型约3至6个月”。
与许多支持音频、视频和图像生成的闭源同类模型不同,V4 Flash和V4 Pro均为纯文本模型。
其关键优势在于,DeepSeek V4 的成本效益远高于当前前沿模型。较小的 V4 Flash 定价为每百万输入令牌 0.14 美元、每百万输出令牌 0.28 美元,低于 GPT-5.4 Nano、Gemini 3.1 Flash、GPT-5.4 Mini 以及 Claude Haiku 4.5。 规模更大的 V4 Pro 模型每百万输入令牌收费 0.145 美元,每百万输出令牌收费 3.48 美元,其费率同样低于 Gemini 3.1 Pro、GPT-5.5、Claude Opus 4.7 和 GPT-5.4。
此次发布恰逢美国指控中国利用数千个代理账户,对美国人工智能实验室进行工业规模的知识产权盗窃,仅隔一天。DeepSeek 自身也曾面临 Anthropic 和 OpenAI 的指控,称其对这两家公司的 AI 模型进行了“蒸馏”(实质上是复制)。
DeepSeek V3.2人工智能模型以极低计算成本实现顶尖性能
当大型科技公司投入数十亿美元计算资源开发尖端人工智能模型时,中国的DeepSeek却通过更智能的方法而非单纯规模实现了同等成果。DeepSeek V3.2模型在推理基准测试中与OpenAI的GPT-5持平,但其"总训练浮点运算次数更少"——这一突破或将重新定义行业构建复杂人工智能的途径。对企业而言,此次发布表明顶级AI能力未必需要顶级计算预算。DeepSeek V3.2的开源特性使机构既能评估其先
安全主管敦促迅速监管人工智能,指出 DeepSeek 等工具的风险
安全运营中心内部,尤其是首席信息安全官(CISO)对来自中国的人工智能巨头 DeepSeek 的关注与日俱增。虽然人工智能最初被誉为企业效率和创新的突破,但现在却让那些领导企业防御的人产生了极大的忧虑。绝大多数英国 CISO(81%)呼吁政府立即对中国的人工智能聊天机器人进行监管。他们警告说,如果不迅速采取行动,该工具可能会引发全国性的网络安全危机。这种担忧并非基于猜测,而是直接源于该技术不透明的
测试表明,DeepSeek 的 R1 人工智能模型更新引入了更严格的内容审核机制
中国人工智能初创公司 DeepSeek 的最新推理模型是其 R1 系统的增强迭代版,在编码、数学和常识基准测试中表现优异,接近 OpenAI 的旗舰模型 o3。然而,这个被命名为 "R1-0528 "的升级版本在处理有争议的话题,尤其是中国当局认为敏感的话题时表现得更加勉强。SpeechMap 是一个评估不同人工智能模型如何处理敏感话题的平台。这位在 X 平台上被称为 "xlr8harder "的





首页






