DeepSeek V3.2人工智能模型以极低计算成本实现顶尖性能
当大型科技公司投入数十亿美元计算资源开发尖端人工智能模型时,中国的DeepSeek却通过更智能的方法而非单纯规模实现了同等成果。DeepSeek V3.2模型在推理基准测试中与OpenAI的GPT-5持平,但其"总训练浮点运算次数更少"——这一突破或将重新定义行业构建复杂人工智能的途径。
对企业而言,此次发布表明顶级AI能力未必需要顶级计算预算。DeepSeek V3.2的开源特性使机构既能评估其先进推理与智能体功能,又能掌控部署基础设施——在成本效益日益成为AI部署核心考量时,这成为关键优势。
这家位于杭州的研究实验室周一发布了两个版本:基础版DeepSeek V3.2和DeepSeek-V3.2-Speciale。后者在2025年国际数学奥林匹克竞赛和国际信息学奥林匹克竞赛中均获得金牌级表现——此前仅有美国顶尖人工智能企业的未公开内部模型达到过该基准。
考虑到出口管制限制了DeepSeek获取先进半导体芯片的渠道,这一成就尤为难得。
资源效率成为竞争优势
DeepSeek的成功挑战了业界普遍认为顶尖AI性能需依赖海量计算资源的认知。该公司将此效率归功于架构突破,特别是DeepSeek稀疏注意力机制(DSA),该技术在不降低模型性能的前提下显著降低了计算复杂度。
基础版DeepSeek V3.2模型在2025年AIME数学竞赛中达到93.1%的准确率,Codeforces评级达2386分,其推理能力与GPT-5处于同等水平。
Speciale版本表现更为出色:在2025年美国数学邀请赛(AIME)中达96.0%准确率,2025年2月哈佛-麻省理工数学竞赛(HMMT)达99.2%,并同时斩获2025年国际数学奥林匹克竞赛与国际信息学奥林匹克竞赛金牌。
考虑到中国面临的关税壁垒和出口管制导致DeepSeek难以获取高端芯片,这些成果尤为难得。技术报告显示,该公司将超出预训练成本10%的预算投入后训练阶段——这种重大投入通过强化学习优化而非蛮力扩展,成功培育了先进能力。
技术创新驱动效能提升
DSA机制标志着注意力架构的革新突破。不同于传统统一计算强度的全量令牌处理,DSA采用"闪电索引器"与精细化令牌筛选系统,仅针对每个查询精准定位并处理最相关信息。
该方法将核心注意力复杂度从O(L²)降至O(Lk),其中k代表选定令牌数(占序列总长L的分数)。基于DeepSeek-V3.1-Terminus检查点的扩展预训练中,公司利用9437亿令牌对DSA进行训练,每训练步处理480个128K令牌序列。
该架构还实现了针对工具调用场景设计的上下文管理机制。不同于早期推理模型在每次用户消息后丢弃推理内容的做法,DeepSeek V3.2模型在仅添加工具相关消息时保留推理轨迹,通过消除不必要的重复推理,显著提升多轮对话工作流中的令牌利用效率。
企业应用与实际性能
对于评估AI实施的企业,DeepSeek的方法论在基准测试之外提供了切实效益。在衡量编码工作流能力的Terminal Bench 2.0测试中,DeepSeek V3.2达到46.4%的准确率。
在软件工程问题解决基准SWE-Verified测试中,该模型得分73.1%,在SWE多语言测试中得分70.2%,彰显其在开发场景中的实用价值。
在需要自主工具使用和多步推理的智能体任务中,该模型较先前开源系统实现显著提升。公司构建了大规模智能体任务合成管道,生成逾1800种独特环境和85000个复杂提示,使模型能够将推理策略泛化至陌生工具使用场景。
DeepSeek已将基础V3.2模型开源至Hugging Face平台,企业可自由部署定制且不受供应商锁定。Speciale变体因更高令牌消耗需求仍仅通过API访问——这是峰值性能与部署效率间的权衡取舍。
行业影响与认可
该发布在人工智能研究界引发广泛讨论。谷歌DeepMind首席研究工程师Susan Zhang盛赞DeepSeek全面的技术文档,特别指出其在模型训练后稳定性优化及智能体能力增强方面的努力。
此次发布恰逢神经信息处理系统大会前夕,引发高度关注。出席圣地亚哥会议的中国开源AI生态专家Florian Brand观察到即时反响:"DeepSeek发布后,今日所有群聊都沸腾了。"
已知局限与发展路径
DeepSeek的技术报告明确了当前与前沿模型的差距。令牌效率仍是挑战——DeepSeek V3.2模型通常需要更长的生成序列才能达到Gemini 3 Pro等系统的输出质量。公司同时承认,由于整体训练计算资源有限,其世界知识广度仍落后于领先的专有模型。
未来发展重点包括:扩展预训练计算资源以拓展世界知识库;优化推理链效率以提升令牌利用率;完善基础架构以应对复杂问题解决任务。
另请参阅:AI商业现实——企业领导者需知

想向行业专家深入了解人工智能与大数据?欢迎探索在阿姆斯特丹、加利福尼亚和伦敦举办的人工智能与大数据博览会。这场综合性活动隶属TechEx系列,与其他重要科技盛会同期举行。点击此处获取更多详情。
AI News由TechForge传媒提供支持。点击此处探索更多即将举办的企业技术活动与网络研讨会。
相关文章
DeepSeek 推出可与前沿系统媲美的人工智能模型
中国人工智能实验室DeepSeek发布了其最新大型语言模型DeepSeek V4的两个预览版本。作为对去年V3.2模型及其配套的R1推理模型的备受期待的更新,该模型曾在人工智能界引起了巨大反响。该公司表示,DeepSeek V4 Flash和V4 Pro均为专家混合模型,各自拥有100万令牌的上下文窗口——足以处理提示词中的庞大代码库或文档。这种专家混合方法通过针对每项任务仅激活特定参数子集,从而
德国法院支持泰瑞达机器人公司,对Elite Robots下达禁令
泰瑞达旗下子公司Universal Robots近日在MODEX展会上展示了其配备UR协作机器人手臂的移动式机械手。来源:泰瑞达随着汉诺威工业博览会本周在德国拉开帷幕,汉堡地区法院针对Elite Robots Deutschland GmbH颁布了初步禁令。该裁决是针对泰瑞达机器人公司(Teradyne Robotics A/S)提起的版权侵权诉讼作出的。泰瑞达公司旗下子公司泰瑞达机器人(Tera
现代汽车在AW展会上推出MobED机器人,人工智能正重塑制造业格局
现代汽车将在2026年自动化世界大会上展示其MobED机器人及其他韩国系统。来源:现代汽车集团随着机器人技术和人工智能在制造业、物流业等领域应用日益广泛,现代汽车集团机器人实验室将于下周在首尔举办的智能工厂与自动化世界(AW)展会上首次亮相其MobED移动平台。本次展会还将汇聚其他顶尖工业机器人供应商。这款"移动偏心机器人"(MobED)于2025年12月首次亮相,通过四组独立控制的车轮及独特的偏
相关专题推荐
评论 (1)
0/500
当大型科技公司投入数十亿美元计算资源开发尖端人工智能模型时,中国的DeepSeek却通过更智能的方法而非单纯规模实现了同等成果。DeepSeek V3.2模型在推理基准测试中与OpenAI的GPT-5持平,但其"总训练浮点运算次数更少"——这一突破或将重新定义行业构建复杂人工智能的途径。
对企业而言,此次发布表明顶级AI能力未必需要顶级计算预算。DeepSeek V3.2的开源特性使机构既能评估其先进推理与智能体功能,又能掌控部署基础设施——在成本效益日益成为AI部署核心考量时,这成为关键优势。
这家位于杭州的研究实验室周一发布了两个版本:基础版DeepSeek V3.2和DeepSeek-V3.2-Speciale。后者在2025年国际数学奥林匹克竞赛和国际信息学奥林匹克竞赛中均获得金牌级表现——此前仅有美国顶尖人工智能企业的未公开内部模型达到过该基准。
考虑到出口管制限制了DeepSeek获取先进半导体芯片的渠道,这一成就尤为难得。
资源效率成为竞争优势
DeepSeek的成功挑战了业界普遍认为顶尖AI性能需依赖海量计算资源的认知。该公司将此效率归功于架构突破,特别是DeepSeek稀疏注意力机制(DSA),该技术在不降低模型性能的前提下显著降低了计算复杂度。
基础版DeepSeek V3.2模型在2025年AIME数学竞赛中达到93.1%的准确率,Codeforces评级达2386分,其推理能力与GPT-5处于同等水平。
Speciale版本表现更为出色:在2025年美国数学邀请赛(AIME)中达96.0%准确率,2025年2月哈佛-麻省理工数学竞赛(HMMT)达99.2%,并同时斩获2025年国际数学奥林匹克竞赛与国际信息学奥林匹克竞赛金牌。
考虑到中国面临的关税壁垒和出口管制导致DeepSeek难以获取高端芯片,这些成果尤为难得。技术报告显示,该公司将超出预训练成本10%的预算投入后训练阶段——这种重大投入通过强化学习优化而非蛮力扩展,成功培育了先进能力。
技术创新驱动效能提升
DSA机制标志着注意力架构的革新突破。不同于传统统一计算强度的全量令牌处理,DSA采用"闪电索引器"与精细化令牌筛选系统,仅针对每个查询精准定位并处理最相关信息。
该方法将核心注意力复杂度从O(L²)降至O(Lk),其中k代表选定令牌数(占序列总长L的分数)。基于DeepSeek-V3.1-Terminus检查点的扩展预训练中,公司利用9437亿令牌对DSA进行训练,每训练步处理480个128K令牌序列。
该架构还实现了针对工具调用场景设计的上下文管理机制。不同于早期推理模型在每次用户消息后丢弃推理内容的做法,DeepSeek V3.2模型在仅添加工具相关消息时保留推理轨迹,通过消除不必要的重复推理,显著提升多轮对话工作流中的令牌利用效率。
企业应用与实际性能
对于评估AI实施的企业,DeepSeek的方法论在基准测试之外提供了切实效益。在衡量编码工作流能力的Terminal Bench 2.0测试中,DeepSeek V3.2达到46.4%的准确率。
在软件工程问题解决基准SWE-Verified测试中,该模型得分73.1%,在SWE多语言测试中得分70.2%,彰显其在开发场景中的实用价值。
在需要自主工具使用和多步推理的智能体任务中,该模型较先前开源系统实现显著提升。公司构建了大规模智能体任务合成管道,生成逾1800种独特环境和85000个复杂提示,使模型能够将推理策略泛化至陌生工具使用场景。
DeepSeek已将基础V3.2模型开源至Hugging Face平台,企业可自由部署定制且不受供应商锁定。Speciale变体因更高令牌消耗需求仍仅通过API访问——这是峰值性能与部署效率间的权衡取舍。
行业影响与认可
该发布在人工智能研究界引发广泛讨论。谷歌DeepMind首席研究工程师Susan Zhang盛赞DeepSeek全面的技术文档,特别指出其在模型训练后稳定性优化及智能体能力增强方面的努力。
此次发布恰逢神经信息处理系统大会前夕,引发高度关注。出席圣地亚哥会议的中国开源AI生态专家Florian Brand观察到即时反响:"DeepSeek发布后,今日所有群聊都沸腾了。"
已知局限与发展路径
DeepSeek的技术报告明确了当前与前沿模型的差距。令牌效率仍是挑战——DeepSeek V3.2模型通常需要更长的生成序列才能达到Gemini 3 Pro等系统的输出质量。公司同时承认,由于整体训练计算资源有限,其世界知识广度仍落后于领先的专有模型。
未来发展重点包括:扩展预训练计算资源以拓展世界知识库;优化推理链效率以提升令牌利用率;完善基础架构以应对复杂问题解决任务。
另请参阅:AI商业现实——企业领导者需知

想向行业专家深入了解人工智能与大数据?欢迎探索在阿姆斯特丹、加利福尼亚和伦敦举办的人工智能与大数据博览会。这场综合性活动隶属TechEx系列,与其他重要科技盛会同期举行。点击此处获取更多详情。
AI News由TechForge传媒提供支持。点击此处探索更多即将举办的企业技术活动与网络研讨会。
DeepSeek 推出可与前沿系统媲美的人工智能模型
中国人工智能实验室DeepSeek发布了其最新大型语言模型DeepSeek V4的两个预览版本。作为对去年V3.2模型及其配套的R1推理模型的备受期待的更新,该模型曾在人工智能界引起了巨大反响。该公司表示,DeepSeek V4 Flash和V4 Pro均为专家混合模型,各自拥有100万令牌的上下文窗口——足以处理提示词中的庞大代码库或文档。这种专家混合方法通过针对每项任务仅激活特定参数子集,从而
德国法院支持泰瑞达机器人公司,对Elite Robots下达禁令
泰瑞达旗下子公司Universal Robots近日在MODEX展会上展示了其配备UR协作机器人手臂的移动式机械手。来源:泰瑞达随着汉诺威工业博览会本周在德国拉开帷幕,汉堡地区法院针对Elite Robots Deutschland GmbH颁布了初步禁令。该裁决是针对泰瑞达机器人公司(Teradyne Robotics A/S)提起的版权侵权诉讼作出的。泰瑞达公司旗下子公司泰瑞达机器人(Tera
现代汽车在AW展会上推出MobED机器人,人工智能正重塑制造业格局
现代汽车将在2026年自动化世界大会上展示其MobED机器人及其他韩国系统。来源:现代汽车集团随着机器人技术和人工智能在制造业、物流业等领域应用日益广泛,现代汽车集团机器人实验室将于下周在首尔举办的智能工厂与自动化世界(AW)展会上首次亮相其MobED移动平台。本次展会还将汇聚其他顶尖工业机器人供应商。这款"移动偏心机器人"(MobED)于2025年12月首次亮相,通过四组独立控制的车轮及独特的偏





首页






