选项
首页
新闻
DeepSeek 推出可与前沿系统媲美的人工智能模型

DeepSeek 推出可与前沿系统媲美的人工智能模型

2026-05-12
85

DeepSeek 推出可与前沿系统媲美的人工智能模型

中国人工智能实验室DeepSeek发布了其最新大型语言模型DeepSeek V4的两个预览版本。作为对去年V3.2模型及其配套的R1推理模型的备受期待的更新,该模型曾在人工智能界引起了巨大反响。

该公司表示,DeepSeek V4 Flash和V4 Pro均为专家混合模型,各自拥有100万令牌的上下文窗口——足以处理提示词中的庞大代码库或文档。这种专家混合方法通过针对每项任务仅激活特定参数子集,从而降低推理成本。

Pro 模型拥有总计 1.6 万亿个参数(其中 490 亿个处于激活状态),使其成为目前可用的最大规模公开权重模型。它超越了 Moonshot AI 的 Kimi K 2.6(1.1 万亿)、MiniMax 的 M1(4560 亿)等竞争对手,其规模更是 DeepSeek V3.2(6710 亿)的两倍多。 较小的 V4 Flash 模型包含 2840 亿个参数(其中 130 亿个为活跃参数)。

DeepSeek声称,架构上的改进使得这两款新模型比DeepSeek V3.2更高效、性能更强,在推理基准测试中几乎“缩小了与当前领先模型(包括开源和闭源模型)的差距”。

该实验室报告称,其新推出的 V4-Pro-Max 模型在各类推理基准测试中均优于开源同类模型,并在某些任务上超越了 OpenAI 的 GPT-5.2 和 Gemini 3.0 Pro。在编程竞赛基准测试中,DeepSeek 表示两款 V4 模型的性能“可与 GPT-5.4 媲美”。

然而,在基于知识的评估中,这些模型似乎略逊于前沿模型,特别是与OpenAI的GPT-5.4以及最新的Google Gemini 3.1 Pro相比。该实验室指出,这一差距表明其“发展轨迹落后于最先进的前沿模型约3至6个月”。

与许多支持音频、视频和图像生成的闭源同类模型不同,V4 Flash和V4 Pro均为纯文本模型。

其关键优势在于,DeepSeek V4 的成本效益远高于当前前沿模型。较小的 V4 Flash 定价为每百万输入令牌 0.14 美元、每百万输出令牌 0.28 美元,低于 GPT-5.4 Nano、Gemini 3.1 Flash、GPT-5.4 Mini 以及 Claude Haiku 4.5。 规模更大的 V4 Pro 模型每百万输入令牌收费 0.145 美元,每百万输出令牌收费 3.48 美元,其费率同样低于 Gemini 3.1 Pro、GPT-5.5、Claude Opus 4.7 和 GPT-5.4。

此次发布恰逢美国指控中国利用数千个代理账户,对美国人工智能实验室进行工业规模的知识产权盗窃,仅隔一天。DeepSeek 自身也曾面临 Anthropic 和 OpenAI 的指控,称其对这两家公司的 AI 模型进行了“蒸馏”(实质上是复制)。

相关文章
DeepSeek V3.2人工智能模型以极低计算成本实现顶尖性能 DeepSeek V3.2人工智能模型以极低计算成本实现顶尖性能 当大型科技公司投入数十亿美元计算资源开发尖端人工智能模型时,中国的DeepSeek却通过更智能的方法而非单纯规模实现了同等成果。DeepSeek V3.2模型在推理基准测试中与OpenAI的GPT-5持平,但其"总训练浮点运算次数更少"——这一突破或将重新定义行业构建复杂人工智能的途径。对企业而言,此次发布表明顶级AI能力未必需要顶级计算预算。DeepSeek V3.2的开源特性使机构既能评估其先
安全主管敦促迅速监管人工智能,指出 DeepSeek 等工具的风险 安全主管敦促迅速监管人工智能,指出 DeepSeek 等工具的风险 安全运营中心内部,尤其是首席信息安全官(CISO)对来自中国的人工智能巨头 DeepSeek 的关注与日俱增。虽然人工智能最初被誉为企业效率和创新的突破,但现在却让那些领导企业防御的人产生了极大的忧虑。绝大多数英国 CISO(81%)呼吁政府立即对中国的人工智能聊天机器人进行监管。他们警告说,如果不迅速采取行动,该工具可能会引发全国性的网络安全危机。这种担忧并非基于猜测,而是直接源于该技术不透明的
测试表明,DeepSeek 的 R1 人工智能模型更新引入了更严格的内容审核机制 测试表明,DeepSeek 的 R1 人工智能模型更新引入了更严格的内容审核机制 中国人工智能初创公司 DeepSeek 的最新推理模型是其 R1 系统的增强迭代版,在编码、数学和常识基准测试中表现优异,接近 OpenAI 的旗舰模型 o3。然而,这个被命名为 "R1-0528 "的升级版本在处理有争议的话题,尤其是中国当局认为敏感的话题时表现得更加勉强。SpeechMap 是一个评估不同人工智能模型如何处理敏感话题的平台。这位在 X 平台上被称为 "xlr8harder "的
相关专题推荐
漫画创作 少年漫画顶级AI生成器:打造高能动作场面与特效
少年漫画顶级AI生成器:打造高能动作场面与特效

在 XIX.AI 探索 2026 年最优秀的少年漫画 AI 生成工具。我们精心筛选的这份高评分清单汇集了强大的工具,助您创作充满张力的动作场面和动态能量特效。通过实际测试对比免费与付费选项。释放您的创作潜能,立即开始创作史诗级漫画吧!

15 个工具
xix.ai
商业 最佳 AI 费用追踪工具:扫描收据并自动分类企业开支
最佳 AI 费用追踪工具:扫描收据并自动分类企业开支

2026年最新最佳AI报销管理工具:广受好评的解决方案,可自动扫描收据并分类企业支出。探索这些功能强大、颠覆传统的解决方案,助您轻松管理报销、精准追踪财务并简化合规流程。我们精心整理并每周更新的免费与付费选项对比指南,助您找到最适合的工具。通过XIX.AI的专家精选,释放您的AI优势。

10 个工具
xix.ai
商业 最佳人工智能招聘工具:筛选简历并自动安排候选人面试
最佳人工智能招聘工具:筛选简历并自动安排候选人面试

在 XIX.AI 上探索 2026 年最新、评价最高的人工智能招聘工具。我们精心筛选的清单汇集了功能强大、颠覆传统的解决方案,可帮助您筛选简历并自动安排候选人面试。通过实际测试和每周更新的排名,对比免费与付费选项。立即找到最适合您的招聘助手,优化您的招聘流程!

10 个工具
xix.ai
生产率 AI个人健康与专注力教练:缓解倦怠,提升精神能量
AI个人健康与专注力教练:缓解倦怠,提升精神能量

立即访问 XIX.AI,探索 2026 年最优秀的 AI 个人健康与专注力教练。我们的精选排行榜汇集了广受好评、具有颠覆性意义的工具,助您缓解倦怠、提升精神能量。通过真实案例分析,对比免费与付费选项。立即开启通往巅峰生产力和身心健康的道路。

10 个工具
xix.ai
聊天机器人 备受好评的AI浪漫聊天机器人:凭借稳定的个性建立长期关系
备受好评的AI浪漫聊天机器人:凭借稳定的个性建立长期关系

探索2026年最新、评价最高的人工智能浪漫聊天机器人,助您建立真实而长久的联系。我们的精选清单涵盖了功能强大且性格鲜明的聊天机器人,并提供了免费与付费版本的对比分析以及实际测试结果。在XIX.AI上找到您的完美伴侣,立即开始建立联系吧。

10 个工具
xix.ai
教育与学习 最佳AI数据科学导师:精通SQL、Pandas及机器学习工作流程
最佳AI数据科学导师:精通SQL、Pandas及机器学习工作流程

探索2026年最优秀的人工智能数据科学导师,帮助他们掌握SQL、Pandas以及机器学习工作流程。在XIX.AI上查看我们精心挑选的顶级导师名单,获得强大而具有变革性的指导。通过对比免费和付费选项,并结合实际应用案例进行了解,今天就开启你的数据科学精通之路吧。

10 个工具
xix.ai
评论 (0)
0/500
OR