小米 MiMo-V2.5 系列 API 产品永久降价,最高可享 99% 折扣
在人工智能模型价格战日益激烈的背景下,小米于5月27日正式宣布,其MiMo大模型将永久下调MiMo-V2.5系列API的价格,同时优化计费系统,通过技术升级进一步降低开发者的调用成本。

一、API价格大幅下调——最高降价99%
此次价格调整于北京时间5月27日00:00在全球范围内生效。调整适用于MiMo-V2.5和MiMo-V2.5Pro两大核心版本,不再根据上下文窗口长度区分价格,简化了定价结构,提高了透明度。
模型版本输入缓存命中价格最高折扣输出价格最高折扣MiMo-V2.5Pro0.025元/百万令牌,最高优惠99%; 输出:每百万代币6元,最高可享86%折扣MiMo-V2.5每百万代币0.02元,最高可享98%折扣;输出:每百万代币2元,最高可享93%折扣II. 计费系统升级——无需额外成本,享受更多价值
除了直接下调API价格外,小米还对Token Plan计费系统进行了深度优化:
配额翻四倍:在原有定价基础上,实际代币使用配额已提升至此前水平的5至8倍。
规则简化:引入“积分”机制取代了以往复杂的计费方式,使开发者对代币消耗和成本计算更加直观。

三、技术基础——为何能持续降价?
小米官方声明指出,此次大幅降价得益于其底层推理系统架构的技术突破:
SWA 推理优化:通过采用全面支持 SWA(滑动窗口注意力机制)的 SGLang HiCache,GPU 内存、CPU 内存与 SSD 之间的数据传输量已降至原量的七分之一。
缓存效率提升:相比早期优化版本,可缓存令牌数量增加了近五倍,从而提升了缓存命中率,并大幅降低了每次推理的成本。
集群吞吐量优化:通过引入专家并行(MoE)和输入长度分桶策略,集群的输入吞吐量实现了质的飞跃,在保持高服务质量的同时,稳步降低了每令牌成本。
小米此举被视为对当前大型模型商业化激烈竞争的主动回应。随着价格门槛持续降低,MiMo系列的成本效益将更加凸显,从而加速AI能力在各垂直行业及开发者工作流中的深度融合。
相关文章
在iPhone时代之前,Horizon Technology大举投资于AI眼镜的供应链,重点开发轻量化材料和芯片技术。
到2026年第二季度,AI眼镜市场正在迅速升温,整个行业已经从早期的“百款眼镜竞赛”阶段进入了更加成熟和专业化的发展阶段。谷歌宣布将于今年秋季推出首款AI眼镜,同时多家制造商也在接连推出新产品,将AI眼镜视为继智能手机之后的下一个计算平台。在这种趋势下,上游供应链中的光学显示组件和主控芯片已经成为极具价值的关键领域。1. 市场势头:从概念到可扩展的转折点IDC的最新预测显示,2026年中国智能眼镜的市场出货量将达到450.8万台,正式进入一个可扩展发展的新阶段。市场趋势:自第二季度以来,荣
Mind Robotics作为Rivian旗下的子公司,获得了5亿美元的融资,用于开发工业用人工智能机器人。
Mind Robotics是一家源自电动汽车制造商Rivian的工业机器人实验室,它刚刚在由风险投资公司Accel和Andreessen Horowitz联合领投的A轮融资中获得了5亿美元的资金。这一消息于周三宣布。在此之前,该公司在2025年底还获得了一笔由Eclipse领投的1.15亿美元种子轮融资。因此,在成立短短几个月内,Mind Robotics筹集到的资金总额就已经达到了6.15亿美元。据最早报道这一消息的《华尔街日报》称,这次融资使这家初创企业的估值约为20亿美元。Mind R
亚马逊的生成式AI助手Alexa+在德国上市,Prime会员可享受免费优惠。
5月8日,亚马逊在德国正式推出了其下一代生成式AI助手Alexa+,这标志着该公司在全球AI战略上又迈出了重要一步。该服务此前已经在美国、英国、德国和奥地利等国家和地区推出。Alexa+将首先通过试点项目向德国用户推出。在接下来的几周里,当地用户将会陆续收到官方邀请,体验这一先进产品。在测试阶段,所有被邀请的用户都可以免费使用这一功能。测试期之后的订阅模式也已初步确定。根据亚马逊的最新政策,Prime会员可以继续免费使用Alexa+,而非Prime会员则需要每月支付22.99欧元的费用。这种
相关专题推荐
评论 (0)
0/500
在人工智能模型价格战日益激烈的背景下,小米于5月27日正式宣布,其MiMo大模型将永久下调MiMo-V2.5系列API的价格,同时优化计费系统,通过技术升级进一步降低开发者的调用成本。

一、API价格大幅下调——最高降价99%
此次价格调整于北京时间5月27日00:00在全球范围内生效。调整适用于MiMo-V2.5和MiMo-V2.5Pro两大核心版本,不再根据上下文窗口长度区分价格,简化了定价结构,提高了透明度。
模型版本输入缓存命中价格最高折扣输出价格最高折扣MiMo-V2.5Pro0.025元/百万令牌,最高优惠99%; 输出:每百万代币6元,最高可享86%折扣MiMo-V2.5每百万代币0.02元,最高可享98%折扣;输出:每百万代币2元,最高可享93%折扣II. 计费系统升级——无需额外成本,享受更多价值
除了直接下调API价格外,小米还对Token Plan计费系统进行了深度优化:
配额翻四倍:在原有定价基础上,实际代币使用配额已提升至此前水平的5至8倍。
规则简化:引入“积分”机制取代了以往复杂的计费方式,使开发者对代币消耗和成本计算更加直观。

三、技术基础——为何能持续降价?
小米官方声明指出,此次大幅降价得益于其底层推理系统架构的技术突破:
SWA 推理优化:通过采用全面支持 SWA(滑动窗口注意力机制)的 SGLang HiCache,GPU 内存、CPU 内存与 SSD 之间的数据传输量已降至原量的七分之一。
缓存效率提升:相比早期优化版本,可缓存令牌数量增加了近五倍,从而提升了缓存命中率,并大幅降低了每次推理的成本。
集群吞吐量优化:通过引入专家并行(MoE)和输入长度分桶策略,集群的输入吞吐量实现了质的飞跃,在保持高服务质量的同时,稳步降低了每令牌成本。
小米此举被视为对当前大型模型商业化激烈竞争的主动回应。随着价格门槛持续降低,MiMo系列的成本效益将更加凸显,从而加速AI能力在各垂直行业及开发者工作流中的深度融合。
在iPhone时代之前,Horizon Technology大举投资于AI眼镜的供应链,重点开发轻量化材料和芯片技术。
到2026年第二季度,AI眼镜市场正在迅速升温,整个行业已经从早期的“百款眼镜竞赛”阶段进入了更加成熟和专业化的发展阶段。谷歌宣布将于今年秋季推出首款AI眼镜,同时多家制造商也在接连推出新产品,将AI眼镜视为继智能手机之后的下一个计算平台。在这种趋势下,上游供应链中的光学显示组件和主控芯片已经成为极具价值的关键领域。1. 市场势头:从概念到可扩展的转折点IDC的最新预测显示,2026年中国智能眼镜的市场出货量将达到450.8万台,正式进入一个可扩展发展的新阶段。市场趋势:自第二季度以来,荣
Mind Robotics作为Rivian旗下的子公司,获得了5亿美元的融资,用于开发工业用人工智能机器人。
Mind Robotics是一家源自电动汽车制造商Rivian的工业机器人实验室,它刚刚在由风险投资公司Accel和Andreessen Horowitz联合领投的A轮融资中获得了5亿美元的资金。这一消息于周三宣布。在此之前,该公司在2025年底还获得了一笔由Eclipse领投的1.15亿美元种子轮融资。因此,在成立短短几个月内,Mind Robotics筹集到的资金总额就已经达到了6.15亿美元。据最早报道这一消息的《华尔街日报》称,这次融资使这家初创企业的估值约为20亿美元。Mind R
亚马逊的生成式AI助手Alexa+在德国上市,Prime会员可享受免费优惠。
5月8日,亚马逊在德国正式推出了其下一代生成式AI助手Alexa+,这标志着该公司在全球AI战略上又迈出了重要一步。该服务此前已经在美国、英国、德国和奥地利等国家和地区推出。Alexa+将首先通过试点项目向德国用户推出。在接下来的几周里,当地用户将会陆续收到官方邀请,体验这一先进产品。在测试阶段,所有被邀请的用户都可以免费使用这一功能。测试期之后的订阅模式也已初步确定。根据亚马逊的最新政策,Prime会员可以继续免费使用Alexa+,而非Prime会员则需要每月支付22.99欧元的费用。这种





首页






