本土机型强势崛起:Doubao跻身全球顶尖行列,小米MiMo在数学推理领域独占鳌头
中国的大型语言模型正迅速从单纯的追随者转变为积极的协作者,甚至在某些领域成为开拓者。
3月30日,中国大型语言模型基准评估项目SuperCLUE 发布了2026年3月的评估结果。本次评估涵盖了来自中国和海外的22款主流模型,测试了包括数学推理、科学推理和代码生成在内的六项核心能力。结果显示,以“豆宝”为首的国内模型现已跻身全球顶尖行列。

全球视角:海外闭源模型仍占主导,"斗宝"紧随其后
在综合排名中,海外闭源模型继续展现出强大的技术实力:
前三名:Anthropic的Claude-Opus-4.6 、谷歌的Gemini-3.1-Pro 以及OpenAI的GPT-5.4 分获全球第一、第二和第三名。
国内亮点:字节跳动“斗宝”(Doubao-Seed-2.0-pro) 以71.53分位居国内榜首。它不仅稳居全球顶尖行列,更将与GPT-5.4的分差缩小至仅0.95分。
智能代理突破:在代理任务规划维度上,Doubao 表现优于多款海外模型,跻身全球前五。
小米表现:MiMo-V2系列在数学推理方面表现突出
作为进军AI领域的智能手机巨头,小米集团的MiMo 系列在本轮评估中表现稳定:
数学之星: MiMo-V2-Pro 以60.67分跻身领先的闭源模型之列,在数学推理任务中取得了84.03分的优异成绩。
双模型上榜:除Pro版本外,开源的MiMo-V2-Flash 也跻身榜单,在代码生成等领域展现出强劲潜力。
开源赛道:国产模型全面领跑
与闭源模型的激烈角逐不同,国产模型在开源领域已确立了明显的统治地位:
前三甲: 包括Kimi-K2. 5-Thinking和Qwen3. 5-397B在内的国产开源模型包揽了开源排行榜前三名。
强势表现:评估数据表明,国内开源模型在性能上明显优于海外竞争对手,使其成为全球开发者的首选。
结论:从参数大战到实战表现
正如2026年3月的排名所示,中国的大模型已不再局限于理解中文语境。如今,它们正在逻辑推理和代码生成等高难度领域与全球领军者展开正面交锋。随着Doubao 排名的上升以及小米MiMo
相关文章
Github Copilot的基于令牌的计费方式引发了开发者的强烈不满
微软GitHub Copilot的黄金时代可能即将结束,尤其是对个人用户而言。该公司正从统一的订阅费模式转向基于代币的计费方式,这可能会大幅增加使用成本。虽然大型企业或许还能承受这种变化,但小型企业和自由职业者可能会发现新的收费机制让他们的月预算难以承受。这些变更将于6月1日正式生效,届时用户将按照工作中消耗的代币数量来支付费用,而不再是按每次请求收取固定费用。一些开发者受到这一财务变动的影响,在Reddit和X平台上表达了他们对这种看似过高的成本增加的担忧。一位Redditor最近写道:“
SpaceX的IPO申请文件重点体现了其在卫星互联网和人工智能领域的发展雄心
在为即将进行的IPO提交的S-1注册文件中,SpaceX公布了一系列令人瞩目的业务数据,这些数据凸显了其在航空航天通信和人工智能领域的强大实力:Starlink用户数突破1000万:截至2026年第一季度,全球付费Starlink用户数量已达到1030万,这一数字在过去一年内翻了一番。这一增长充分证明了作为全球最大的近地轨道卫星星座,Starlink在宽带和移动通信领域的领先地位。目前该卫星网络由大约9600颗卫星组成,这些卫星占在轨所有活跃卫星总数的65%。Grok与X人工智能生态体系:通
阿里巴巴Tuhao M890上市,凭借三重性能优势开启芯片-云-模型-推理的全栈代理时代
2026年5月20日,在阿里云峰会上,阿里云宣布完成了专为“智能体时代”设计的全栈技术系统升级。这一变革重塑了整个技术体系——从底层芯片和云平台到模型与推理方案。此次升级使阿里云成为一家能够让大量智能体实现24/7连续运行的“AI工厂”,从而超越了单纯为人类用户提供服务的范畴。1. 核心基础:腾迅振武M890芯片与超级节点服务器此次升级的核心是腾迅推出的新一代AI芯片——振武M890,该芯片集训练与推理功能于一体。性能提升:M890拥有144GB的内存,其性能是前代产品振武810E的三倍。
相关专题推荐
评论 (0)
0/500
中国的大型语言模型正迅速从单纯的追随者转变为积极的协作者,甚至在某些领域成为开拓者。
3月30日,中国大型语言模型基准评估

全球视角:海外闭源模型仍占主导,"斗宝"紧随其后
在综合排名中,海外闭源模型继续展现出强大的技术实力:
前三名:Anthropic的
国内亮点:字节
智能代理突破:在代理任务规划维度上
小米表现:MiMo-V2系列在数学推理方面表现突出
作为进军AI领域的智能手机巨头
数学之星:
双模型上榜:除Pro版本外,开源的
开源赛道:国产模型全面领跑
与闭源模型的激烈角逐不同,国产模型在开源领域已确立了明显的统治地位:
前三甲:
强势表现:评估数据表明,国内开源模型在性能上明显优于海外竞争对手,使其成为全球开发者的首选。
结论:从参数大战到实战表现
正如2026年3月的排名所示,中国的大模型已不再局限于理解中文语境。如今,它们正在逻辑推理和代码生成等高难度领域与全球领军者展开正面交锋。随着
Github Copilot的基于令牌的计费方式引发了开发者的强烈不满
微软GitHub Copilot的黄金时代可能即将结束,尤其是对个人用户而言。该公司正从统一的订阅费模式转向基于代币的计费方式,这可能会大幅增加使用成本。虽然大型企业或许还能承受这种变化,但小型企业和自由职业者可能会发现新的收费机制让他们的月预算难以承受。这些变更将于6月1日正式生效,届时用户将按照工作中消耗的代币数量来支付费用,而不再是按每次请求收取固定费用。一些开发者受到这一财务变动的影响,在Reddit和X平台上表达了他们对这种看似过高的成本增加的担忧。一位Redditor最近写道:“
SpaceX的IPO申请文件重点体现了其在卫星互联网和人工智能领域的发展雄心
在为即将进行的IPO提交的S-1注册文件中,SpaceX公布了一系列令人瞩目的业务数据,这些数据凸显了其在航空航天通信和人工智能领域的强大实力:Starlink用户数突破1000万:截至2026年第一季度,全球付费Starlink用户数量已达到1030万,这一数字在过去一年内翻了一番。这一增长充分证明了作为全球最大的近地轨道卫星星座,Starlink在宽带和移动通信领域的领先地位。目前该卫星网络由大约9600颗卫星组成,这些卫星占在轨所有活跃卫星总数的65%。Grok与X人工智能生态体系:通
阿里巴巴Tuhao M890上市,凭借三重性能优势开启芯片-云-模型-推理的全栈代理时代
2026年5月20日,在阿里云峰会上,阿里云宣布完成了专为“智能体时代”设计的全栈技术系统升级。这一变革重塑了整个技术体系——从底层芯片和云平台到模型与推理方案。此次升级使阿里云成为一家能够让大量智能体实现24/7连续运行的“AI工厂”,从而超越了单纯为人类用户提供服务的范畴。1. 核心基础:腾迅振武M890芯片与超级节点服务器此次升级的核心是腾迅推出的新一代AI芯片——振武M890,该芯片集训练与推理功能于一体。性能提升:M890拥有144GB的内存,其性能是前代产品振武810E的三倍。





首页






