选项
首页
新闻
本土机型强势崛起:Doubao跻身全球顶尖行列,小米MiMo在数学推理领域独占鳌头

本土机型强势崛起:Doubao跻身全球顶尖行列,小米MiMo在数学推理领域独占鳌头

2026-05-30
52

中国的大型语言模型正迅速从单纯的追随者转变为积极的协作者,甚至在某些领域成为开拓者。

3月30日,中国大型语言模型基准评估项目SuperCLUE发布了2026年3月的评估结果。本次评估涵盖了来自中国和海外的22款主流模型,测试了包括数学推理、科学推理和代码生成在内的六项核心能力。结果显示,以“豆宝”为首的国内模型现已跻身全球顶尖行列。

image.png

全球视角:海外闭源模型仍占主导,"斗宝"紧随其后

在综合排名中,海外闭源模型继续展现出强大的技术实力:

前三名:Anthropic的Claude-Opus-4.6、谷歌的Gemini-3.1-Pro以及OpenAI的GPT-5.4分获全球第一、第二和第三名。

国内亮点:字节跳动“斗宝”(Doubao-Seed-2.0-pro)以71.53分位居国内榜首。它不仅稳居全球顶尖行列,更将与GPT-5.4的分差缩小至仅0.95分。

智能代理突破:在代理任务规划维度上,Doubao表现优于多款海外模型,跻身全球前五。

小米表现:MiMo-V2系列在数学推理方面表现突出

作为进军AI领域的智能手机巨头,小米集团的MiMo系列在本轮评估中表现稳定:

数学之星: MiMo-V2-Pro以60.67分跻身领先的闭源模型之列,在数学推理任务中取得了84.03分的优异成绩。

双模型上榜:除Pro版本外,开源的MiMo-V2-Flash也跻身榜单,在代码生成等领域展现出强劲潜力。

开源赛道:国产模型全面领跑

与闭源模型的激烈角逐不同,国产模型在开源领域已确立了明显的统治地位:

前三甲: 包括Kimi-K2. 5-Thinking和Qwen3.5-397B在内的国产开源模型包揽了开源排行榜前三名。

强势表现:评估数据表明,国内开源模型在性能上明显优于海外竞争对手,使其成为全球开发者的首选。

结论:从参数大战到实战表现

正如2026年3月的排名所示,中国的大模型已不再局限于理解中文语境。如今,它们正在逻辑推理和代码生成等高难度领域与全球领军者展开正面交锋。随着Doubao排名的上升以及小米MiMo

相关文章
Github Copilot的基于令牌的计费方式引发了开发者的强烈不满 Github Copilot的基于令牌的计费方式引发了开发者的强烈不满 微软GitHub Copilot的黄金时代可能即将结束,尤其是对个人用户而言。该公司正从统一的订阅费模式转向基于代币的计费方式,这可能会大幅增加使用成本。虽然大型企业或许还能承受这种变化,但小型企业和自由职业者可能会发现新的收费机制让他们的月预算难以承受。这些变更将于6月1日正式生效,届时用户将按照工作中消耗的代币数量来支付费用,而不再是按每次请求收取固定费用。一些开发者受到这一财务变动的影响,在Reddit和X平台上表达了他们对这种看似过高的成本增加的担忧。一位Redditor最近写道:“
SpaceX的IPO申请文件重点体现了其在卫星互联网和人工智能领域的发展雄心 SpaceX的IPO申请文件重点体现了其在卫星互联网和人工智能领域的发展雄心 在为即将进行的IPO提交的S-1注册文件中,SpaceX公布了一系列令人瞩目的业务数据,这些数据凸显了其在航空航天通信和人工智能领域的强大实力:Starlink用户数突破1000万:截至2026年第一季度,全球付费Starlink用户数量已达到1030万,这一数字在过去一年内翻了一番。这一增长充分证明了作为全球最大的近地轨道卫星星座,Starlink在宽带和移动通信领域的领先地位。目前该卫星网络由大约9600颗卫星组成,这些卫星占在轨所有活跃卫星总数的65%。Grok与X人工智能生态体系:通
阿里巴巴Tuhao M890上市,凭借三重性能优势开启芯片-云-模型-推理的全栈代理时代 阿里巴巴Tuhao M890上市,凭借三重性能优势开启芯片-云-模型-推理的全栈代理时代 2026年5月20日,在阿里云峰会上,阿里云宣布完成了专为“智能体时代”设计的全栈技术系统升级。这一变革重塑了整个技术体系——从底层芯片和云平台到模型与推理方案。此次升级使阿里云成为一家能够让大量智能体实现24/7连续运行的“AI工厂”,从而超越了单纯为人类用户提供服务的范畴。1. 核心基础:腾迅振武M890芯片与超级节点服务器此次升级的核心是腾迅推出的新一代AI芯片——振武M890,该芯片集训练与推理功能于一体。性能提升:M890拥有144GB的内存,其性能是前代产品振武810E的三倍。
相关专题推荐
搜索引擎优化 最佳AI重定向与失效链接查找工具:自动修复爬取错误,节省爬取预算
最佳AI重定向与失效链接查找工具:自动修复爬取错误,节省爬取预算

在XIX.AI上,发现2026年最优秀的人工智能重定向工具和失效链接查找工具。我们精心挑选的这些高评分工具能够自动修复爬取错误,从而帮助您节省爬取预算。通过实际测试和每周更新的排名信息,您可以比较免费选项和付费选项,立即找到最适合您的SEO解决方案!

10 个工具
xix.ai
视频创作 播客创作者必备的顶级AI视频制作工具:将音频波形转化为引人入胜的谈话视频
播客创作者必备的顶级AI视频制作工具:将音频波形转化为引人入胜的谈话视频

立即访问 XIX.AI,探索 2026 年最适合播客创作者的 AI 视频制作工具。我们精心筛选并广受好评的榜单汇集了多款强大工具,可轻松将您的音频转化为引人入胜的“谈话头”视频。通过实际测试和每周更新的排名,对比免费与付费选项。立即开启您的视觉叙事新优势。

10 个工具
xix.ai
聊天机器人 使用这些角色扮演工具,创作属于你的AI爱情故事
使用这些角色扮演工具,创作属于你的AI爱情故事

探索2026年最新、最受好评的AI角色扮演工具,打造身临其境的叙事体验。XIX.AI精心整理的这份清单汇集了功能强大、颠覆传统的助手,助您释放创意叙事潜力,挖掘情感深度。通过实际测试对比免费与付费选项。立即开启您的独特旅程。

10 个工具
xix.ai
文字转语音 独立游戏开发者必备的顶级AI配音工具:为RPG和视觉小说节省配音时间
独立游戏开发者必备的顶级AI配音工具:为RPG和视觉小说节省配音时间

探索2026年最适合游戏开发者的AI配音工具!XIX.AI精心整理的这份清单汇集了广受好评、能彻底改变游戏开发格局的解决方案,助您在角色扮演游戏(RPG)和视觉小说的配音制作中节省时间和成本。了解免费与付费版本的对比分析、实际测试结果以及每周更新的排行榜。立即找到最适合您的配音工具吧!

10 个工具
xix.ai
教育与学习 最佳人工智能间隔重复学习工具:帮助医学生和法律专业学生优化学习计划
最佳人工智能间隔重复学习工具:帮助医学生和法律专业学生优化学习计划

探索由 XIX.AI 精心挑选的 2026 年最佳 AI 间隔重复学习工具。我们推荐的这些极具创新性的工具能帮助医学和法律专业的学生优化学习计划,从而提高知识记忆效果。通过真实案例测试和每周更新的排名信息,你可以了解免费选项与付费选项之间的差异。现在就开启你的学习优势吧!

10 个工具
xix.ai
视频创作 最适合剧本创作和视觉叙事的AI文本转视频平台
最适合剧本创作和视觉叙事的AI文本转视频平台

2026年最新最佳AI文字转视频平台:备受好评的剧本创作与视觉叙事工具。探索这些功能强大、颠覆传统的解决方案,将您的文字转化为引人入胜的视频。通过我们每周更新的排行榜和实际测试,对比免费与付费选项。找到最适合您的平台,激发创意,提升效率。立即访问XIX.AI,探索精心精选的优质平台。

10 个工具
xix.ai
评论 (0)
0/500
OR