Maison
La gamme Xiaomi MiMo-V2.5 bénéficie d'une baisse de prix définitive, avec jusqu'à 99 % de réduction
Alors que la guerre des prix entre les modèles d'IA s'intensifie, Xiaomi a officiellement annoncé le 27 mai que son grand modèle MiMo allait baisser de manière permanente les tarifs de l'API de la série MiMo-V2.5, tout en optimisant le système de facturation afin de réduire encore davantage les coûts d'appel pour les développeurs grâce à des avancées technologiques.

I. Baisses de prix significatives des API — Jusqu'à 99 % de réduction
La modification des tarifs est entrée en vigueur à l'échelle mondiale à 00 h 00, heure de Pékin, le 27 mai. Elle s'applique aux deux versions principales, MiMo-V2.5 et MiMo-V2.5Pro, et ne fait plus de distinction en fonction de la longueur de la fenêtre de contexte, ce qui simplifie la structure tarifaire pour une plus grande transparence.
Version du modèle Prix en cas d'accès au cache d'entrée Remise maximale Prix de sortie Remise maximaleMiMo-V2.5Pro0,025 yuan par million de jetons, jusqu'à 99 % de réduction ; sortie : 6 yuans par million de jetons, jusqu'à 86 % de réduction MiMo-V2.5 0,02 yuan par million de jetons, jusqu'à 98 % de réduction ; sortie : 2 yuans par million de jetons, jusqu'à 93 % de réductionII. Mise à niveau du système de facturation — Plus de valeur sans frais supplémentaires
Au-delà des baisses de prix directes sur l'API, Xiaomi a considérablement optimisé son système de facturation Token Plan :
Quota quadruplé : par rapport à la tarification initiale, le quota d'utilisation réel de jetons a été multiplié par 5 à 8.
Règles simplifiées : l'introduction des crédits remplace les anciennes méthodes de facturation complexes, rendant la consommation de jetons et le calcul des coûts plus intuitifs pour les développeurs.

III. Fondements techniques — Comment peut-on continuer à baisser les prix ?
Le communiqué officiel de Xiaomi attribue ces baisses de prix importantes à des avancées techniques dans l'architecture de son système d'inférence sous-jacent :
Optimisation de l'inférence SWA : en tirant parti de SGLang HiCache avec une prise en charge complète du SWA (Sliding Window Attention Mechanism), le transfert de données entre la mémoire du GPU, la mémoire du CPU et le SSD a été réduit à un septième du volume précédent.
Efficacité du cache améliorée : le nombre de tokens pouvant être mis en cache a été multiplié par près de cinq par rapport à la version optimisée précédente, ce qui a permis d'augmenter les taux de réussite du cache et de réduire considérablement le coût par inférence.
Optimisation du débit du cluster : grâce à l'introduction de stratégies de parallélisme expert (MoE) et de regroupement par longueur d'entrée, le débit d'entrée du cluster a fait un bond qualitatif, maintenant une qualité de service élevée tout en réduisant progressivement le coût par token.
L'initiative de Xiaomi est considérée comme une réponse proactive à la concurrence intense qui règne actuellement dans la commercialisation des grands modèles. À mesure que les barrières de prix continuent de baisser, le rapport coût-efficacité de la série MiMo deviendra encore plus prononcé, accélérant l'intégration en profondeur des capacités d'IA dans les secteurs verticaux et les flux de travail des développeurs.
Article connexe
La chaîne d’approvisionnement des lunettes de réalité augmentée poursuit l’optimisation des composants optiques et des puces, tandis que Horizon Technology investit massivement en préparation de l’ère des iPhones.
D’ici le deuxième trimestre 2026, le marché des lunettes intelligentes connaîtra une croissance rapide, l’industrie passant d’une phase initiale de concurrence acharnée à une étape plus affinée et spécialisée. Google a annoncé le lancement de ses pre
Mind Robotics, une filiale de Rivian, a obtenu 500 millions de dollars pour le développement de robots intelligents industriels.
Mind Robotics, un laboratoire de robotique industrielle né de la société Rivian spécialisée dans la fabrication de véhicules électriques, a obtenu 500 millions de dollars lors d’une série de financement Series A, co-menée par les sociétés de capital-
L'assistant d'intelligence artificielle générative d'Amazon, Alexa+, est lancé en Allemagne : les membres Prime bénéficient de réductions et d'avantages gratuits.
Le 8 mai, Amazon a officiellement lancé son assistant d'intelligence artificielle générative de nouvelle génération, Alexa+, en Allemagne, marquant ainsi une nouvelle étape importante dans la stratégie mondiale de l'entreprise en matière d'intelligen
Recommandations de sujets spéciaux liés
commentaires (0)
Alors que la guerre des prix entre les modèles d'IA s'intensifie, Xiaomi a officiellement annoncé le 27 mai que son grand modèle MiMo allait baisser de manière permanente les tarifs de l'API de la série MiMo-V2.5, tout en optimisant le système de facturation afin de réduire encore davantage les coûts d'appel pour les développeurs grâce à des avancées technologiques.

I. Baisses de prix significatives des API — Jusqu'à 99 % de réduction
La modification des tarifs est entrée en vigueur à l'échelle mondiale à 00 h 00, heure de Pékin, le 27 mai. Elle s'applique aux deux versions principales, MiMo-V2.5 et MiMo-V2.5Pro, et ne fait plus de distinction en fonction de la longueur de la fenêtre de contexte, ce qui simplifie la structure tarifaire pour une plus grande transparence.
Version du modèle Prix en cas d'accès au cache d'entrée Remise maximale Prix de sortie Remise maximaleMiMo-V2.5Pro0,025 yuan par million de jetons, jusqu'à 99 % de réduction ; sortie : 6 yuans par million de jetons, jusqu'à 86 % de réduction MiMo-V2.5 0,02 yuan par million de jetons, jusqu'à 98 % de réduction ; sortie : 2 yuans par million de jetons, jusqu'à 93 % de réductionII. Mise à niveau du système de facturation — Plus de valeur sans frais supplémentaires
Au-delà des baisses de prix directes sur l'API, Xiaomi a considérablement optimisé son système de facturation Token Plan :
Quota quadruplé : par rapport à la tarification initiale, le quota d'utilisation réel de jetons a été multiplié par 5 à 8.
Règles simplifiées : l'introduction des crédits remplace les anciennes méthodes de facturation complexes, rendant la consommation de jetons et le calcul des coûts plus intuitifs pour les développeurs.

III. Fondements techniques — Comment peut-on continuer à baisser les prix ?
Le communiqué officiel de Xiaomi attribue ces baisses de prix importantes à des avancées techniques dans l'architecture de son système d'inférence sous-jacent :
Optimisation de l'inférence SWA : en tirant parti de SGLang HiCache avec une prise en charge complète du SWA (Sliding Window Attention Mechanism), le transfert de données entre la mémoire du GPU, la mémoire du CPU et le SSD a été réduit à un septième du volume précédent.
Efficacité du cache améliorée : le nombre de tokens pouvant être mis en cache a été multiplié par près de cinq par rapport à la version optimisée précédente, ce qui a permis d'augmenter les taux de réussite du cache et de réduire considérablement le coût par inférence.
Optimisation du débit du cluster : grâce à l'introduction de stratégies de parallélisme expert (MoE) et de regroupement par longueur d'entrée, le débit d'entrée du cluster a fait un bond qualitatif, maintenant une qualité de service élevée tout en réduisant progressivement le coût par token.
L'initiative de Xiaomi est considérée comme une réponse proactive à la concurrence intense qui règne actuellement dans la commercialisation des grands modèles. À mesure que les barrières de prix continuent de baisser, le rapport coût-efficacité de la série MiMo deviendra encore plus prononcé, accélérant l'intégration en profondeur des capacités d'IA dans les secteurs verticaux et les flux de travail des développeurs.
La chaîne d’approvisionnement des lunettes de réalité augmentée poursuit l’optimisation des composants optiques et des puces, tandis que Horizon Technology investit massivement en préparation de l’ère des iPhones.
D’ici le deuxième trimestre 2026, le marché des lunettes intelligentes connaîtra une croissance rapide, l’industrie passant d’une phase initiale de concurrence acharnée à une étape plus affinée et spécialisée. Google a annoncé le lancement de ses pre
Mind Robotics, une filiale de Rivian, a obtenu 500 millions de dollars pour le développement de robots intelligents industriels.
Mind Robotics, un laboratoire de robotique industrielle né de la société Rivian spécialisée dans la fabrication de véhicules électriques, a obtenu 500 millions de dollars lors d’une série de financement Series A, co-menée par les sociétés de capital-
L'assistant d'intelligence artificielle générative d'Amazon, Alexa+, est lancé en Allemagne : les membres Prime bénéficient de réductions et d'avantages gratuits.
Le 8 mai, Amazon a officiellement lancé son assistant d'intelligence artificielle générative de nouvelle génération, Alexa+, en Allemagne, marquant ainsi une nouvelle étape importante dans la stratégie mondiale de l'entreprise en matière d'intelligen











