La serie Xiaomi MiMo-V2.5 API tiene una rebaja permanente de hasta el 99 %
En medio de la creciente guerra de precios de los modelos de IA, Xiaomi anunció oficialmente el 27 de mayo que su modelo de gran tamaño MiMo reduciría de forma permanente los precios de la API de la serie MiMo-V2.5, al tiempo que optimizaría el sistema de facturación para reducir aún más los costes de las llamadas de los desarrolladores gracias a los avances tecnológicos.

I. Importantes recortes en los precios de las API: hasta un 99 % de descuento
El cambio de precios entró en vigor a nivel mundial a las 00:00, hora de Pekín, del 27 de mayo. Se aplica a las dos versiones principales, MiMo-V2.5 y MiMo-V2.5Pro, y ya no se diferencia en función de la longitud de la ventana de contexto, lo que simplifica la estructura de precios para una mayor transparencia.
Versión del modelo Precio por acierto en la caché de entrada Descuento máximo Precio de salida Descuento máximoMiMo-V2.5Pro0,025 yuanes por millón de tokens, hasta un 99 % de descuento; salida: 6 yuanes por millón de tokens, hasta un 86 % de descuento; MiMo-V2.5: 0,02 yuanes por millón de tokens, hasta un 98 % de descuento; salida: 2 yuanes por millón de tokens, hasta un 93 % de descuentoII. Actualización del sistema de facturación: más valor sin coste adicional
Más allá de las reducciones directas de precios de la API, Xiaomi ha optimizado considerablemente su sistema de facturación del Plan de tokens:
Cuota cuadruplicada: con respecto a los precios originales, la cuota de uso real de tokens se ha incrementado entre 5 y 8 veces la cantidad anterior.
Reglas simplificadas: la introducción de los créditos sustituye a los complejos métodos de facturación anteriores, lo que hace que el consumo de tokens y el cálculo de costes sean más intuitivos para los desarrolladores.

III. Base técnica: ¿cómo puede seguir bajando los precios?
La declaración oficial de Xiaomi atribuye estas profundas reducciones de precios a los avances técnicos en la arquitectura de su sistema de inferencia subyacente:
Optimización de la inferencia SWA: al aprovechar SGLang HiCache con soporte completo para SWA (mecanismo de atención de ventana deslizante), la transferencia de datos entre la memoria de la GPU, la memoria de la CPU y el SSD se ha reducido a una séptima parte del volumen anterior.
Eficiencia mejorada de la caché: El número de tokens almacenables en caché se ha multiplicado casi por cinco en comparación con la versión optimizada anterior, lo que ha aumentado las tasas de aciertos de caché y ha reducido drásticamente el coste por inferencia.
Optimización del rendimiento del clúster: Con la introducción de estrategias de paralelismo experto (MoE) y de agrupación por longitud de entrada, el rendimiento de entrada del clúster ha experimentado un salto cualitativo, manteniendo una alta calidad de servicio al tiempo que se reduce de forma constante el coste por token.
La iniciativa de Xiaomi se considera una respuesta proactiva a la intensa competencia actual en la comercialización de modelos a gran escala. A medida que las barreras de precio sigan cayendo, la rentabilidad de la serie MiMo será aún más evidente, lo que acelerará la profunda integración de las capacidades de IA en los sectores verticales y los flujos de trabajo de los desarrolladores.
Artículo relacionado
La cadena de suministro de gafas inteligentes se centra en la tecnología de luz y chips, mientras que Horizon Technology invierte significativamente antes de la era del iPhone.
Para el segundo trimestre de 2026, el mercado de gafas inteligentes se está calentando rápidamente, y la industria está pasando de la inicial “carrera de cien gafas” a una fase más refinada y especializada. Google anunció el lanzamiento de sus primer
Mind Robotics, una empresa derivada de Rivian, ha recaudado 500 millones de dólares para desarrollar robots industriales basados en inteligencia artificial.
Mind Robotics, un laboratorio de robótica industrial surgido del fabricante de vehículos eléctricos Rivian, ha recaudado 500 millones de dólares en una ronda de financiación Serie A liderada conjuntamente por las firmas de capital riesgo Accel y Andr
El asistente de IA generativa de Amazon, Alexa+, se lanza en Alemania y los miembros de Prime reciben beneficios gratuitos.
El 8 de mayo, Amazon lanzó oficialmente su asistente de IA generativa de próxima generación, Alexa+, en Alemania, lo que representa otro paso clave en la estrategia global de IA de la empresa. Este servicio ya había sido implementado en varios países
Recomendaciones de temas especiales relacionados
comentario (0)
0/500
En medio de la creciente guerra de precios de los modelos de IA, Xiaomi anunció oficialmente el 27 de mayo que su modelo de gran tamaño MiMo reduciría de forma permanente los precios de la API de la serie MiMo-V2.5, al tiempo que optimizaría el sistema de facturación para reducir aún más los costes de las llamadas de los desarrolladores gracias a los avances tecnológicos.

I. Importantes recortes en los precios de las API: hasta un 99 % de descuento
El cambio de precios entró en vigor a nivel mundial a las 00:00, hora de Pekín, del 27 de mayo. Se aplica a las dos versiones principales, MiMo-V2.5 y MiMo-V2.5Pro, y ya no se diferencia en función de la longitud de la ventana de contexto, lo que simplifica la estructura de precios para una mayor transparencia.
Versión del modelo Precio por acierto en la caché de entrada Descuento máximo Precio de salida Descuento máximoMiMo-V2.5Pro0,025 yuanes por millón de tokens, hasta un 99 % de descuento; salida: 6 yuanes por millón de tokens, hasta un 86 % de descuento; MiMo-V2.5: 0,02 yuanes por millón de tokens, hasta un 98 % de descuento; salida: 2 yuanes por millón de tokens, hasta un 93 % de descuentoII. Actualización del sistema de facturación: más valor sin coste adicional
Más allá de las reducciones directas de precios de la API, Xiaomi ha optimizado considerablemente su sistema de facturación del Plan de tokens:
Cuota cuadruplicada: con respecto a los precios originales, la cuota de uso real de tokens se ha incrementado entre 5 y 8 veces la cantidad anterior.
Reglas simplificadas: la introducción de los créditos sustituye a los complejos métodos de facturación anteriores, lo que hace que el consumo de tokens y el cálculo de costes sean más intuitivos para los desarrolladores.

III. Base técnica: ¿cómo puede seguir bajando los precios?
La declaración oficial de Xiaomi atribuye estas profundas reducciones de precios a los avances técnicos en la arquitectura de su sistema de inferencia subyacente:
Optimización de la inferencia SWA: al aprovechar SGLang HiCache con soporte completo para SWA (mecanismo de atención de ventana deslizante), la transferencia de datos entre la memoria de la GPU, la memoria de la CPU y el SSD se ha reducido a una séptima parte del volumen anterior.
Eficiencia mejorada de la caché: El número de tokens almacenables en caché se ha multiplicado casi por cinco en comparación con la versión optimizada anterior, lo que ha aumentado las tasas de aciertos de caché y ha reducido drásticamente el coste por inferencia.
Optimización del rendimiento del clúster: Con la introducción de estrategias de paralelismo experto (MoE) y de agrupación por longitud de entrada, el rendimiento de entrada del clúster ha experimentado un salto cualitativo, manteniendo una alta calidad de servicio al tiempo que se reduce de forma constante el coste por token.
La iniciativa de Xiaomi se considera una respuesta proactiva a la intensa competencia actual en la comercialización de modelos a gran escala. A medida que las barreras de precio sigan cayendo, la rentabilidad de la serie MiMo será aún más evidente, lo que acelerará la profunda integración de las capacidades de IA en los sectores verticales y los flujos de trabajo de los desarrolladores.
La cadena de suministro de gafas inteligentes se centra en la tecnología de luz y chips, mientras que Horizon Technology invierte significativamente antes de la era del iPhone.
Para el segundo trimestre de 2026, el mercado de gafas inteligentes se está calentando rápidamente, y la industria está pasando de la inicial “carrera de cien gafas” a una fase más refinada y especializada. Google anunció el lanzamiento de sus primer
Mind Robotics, una empresa derivada de Rivian, ha recaudado 500 millones de dólares para desarrollar robots industriales basados en inteligencia artificial.
Mind Robotics, un laboratorio de robótica industrial surgido del fabricante de vehículos eléctricos Rivian, ha recaudado 500 millones de dólares en una ronda de financiación Serie A liderada conjuntamente por las firmas de capital riesgo Accel y Andr
El asistente de IA generativa de Amazon, Alexa+, se lanza en Alemania y los miembros de Prime reciben beneficios gratuitos.
El 8 de mayo, Amazon lanzó oficialmente su asistente de IA generativa de próxima generación, Alexa+, en Alemania, lo que representa otro paso clave en la estrategia global de IA de la empresa. Este servicio ya había sido implementado en varios países





Hogar






