Die Xiaomi MiMo-V2.5-Serie erhält eine dauerhafte Preissenkung – bis zu 99 % Rabatt
Vor dem Hintergrund des sich verschärfenden Preiskampfs bei KI-Modellen gab Xiaomi am 27. Mai offiziell bekannt, dass das Unternehmen die Preise für die API der MiMo-V2.5-Serie dauerhaft senken und gleichzeitig das Abrechnungssystem optimieren werde, um die Kosten für Entwickler durch technologische Fortschritte weiter zu senken.

I. Deutliche Preissenkungen für APIs – bis zu 99 % Rabatt
Die Preisänderung trat weltweit am 27. Mai um 00:00 Uhr Pekinger Zeit in Kraft. Sie gilt für die beiden Kernversionen MiMo-V2.5 und MiMo-V2.5Pro und unterscheidet nicht mehr nach der Länge des Kontextfensters, was die Preisstruktur vereinfacht und für mehr Transparenz sorgt.
ModellversionEingabe-Cache-Treffer PreisMaximaler RabattAusgabe-PreisMaximaler RabattMiMo-V2.5Pro0,025 Yuan pro Million Token, bis zu 99 % Rabatt; Ausgabe: 6 Yuan pro Million Token, bis zu 86 % Rabatt MiMo-V2.5 0,02 Yuan pro Million Token, bis zu 98 % Rabatt; Ausgabe: 2 Yuan pro Million Token, bis zu 93 % RabattII. Verbesserung des Abrechnungssystems – Mehr Wert ohne zusätzliche Kosten
Über die direkten API-Preissenkungen hinaus hat Xiaomi sein Abrechnungssystem für den Token-Plan umfassend optimiert:
Vervierfachte Quote: Im Vergleich zur ursprünglichen Preisgestaltung hat sich die tatsächliche Token-Nutzungsquote auf das 5- bis 8-fache des bisherigen Betrags erhöht.
Vereinfachte Regeln: Die Einführung von Credits ersetzt die bisherigen komplexen Abrechnungsmethoden und macht den Token-Verbrauch sowie die Kostenberechnung für Entwickler intuitiver.

III. Technische Grundlage – Wie kann das Unternehmen die Preise weiter senken?
In seiner offiziellen Erklärung führt Xiaomi diese drastischen Preissenkungen auf technische Durchbrüche in der Architektur seines zugrunde liegenden Inferenzsystems zurück:
SWA-Inferenzoptimierung: Durch den Einsatz von SGLang HiCache mit vollständiger Unterstützung für SWA (Sliding Window Attention Mechanism) wurde der Datentransfer zwischen GPU-Speicher, CPU-Speicher und SSD auf ein Siebtel des bisherigen Volumens reduziert.
Verbesserte Cache-Effizienz: Die Anzahl der cachefähigen Token hat sich im Vergleich zur früheren optimierten Version fast verfünffacht, was die Cache-Trefferraten erhöht und die Kosten pro Inferenz drastisch senkt.
Optimierung des Cluster-Durchsatzes: Durch die Einführung von Expert-Parallel- (MoE) und Input-Length-Bucketing-Strategien hat der Eingangsdurchsatz des Clusters einen qualitativen Sprung gemacht, wobei eine hohe Servicequalität beibehalten und die Kosten pro Token stetig gesenkt wurden.
Xiaomis Schritt wird als proaktive Reaktion auf den derzeit intensiven Wettbewerb bei der Kommerzialisierung großer Modelle angesehen. Da die Preisbarrieren weiter sinken, wird die Kosteneffizienz der MiMo-Serie noch deutlicher zutage treten und die tiefe Integration von KI-Fähigkeiten in vertikalen Branchen und Entwickler-Workflows beschleunigen.
Verwandter Artikel
Mind Robotics, ein Tochterunternehmen von Rivian, erhält 500 Millionen US-Dollar für industrielle KI-Roboter.
Mind Robotics, ein Industrierobotiklabor, das aus dem Elektrofahrzeughersteller Rivian hervorgegangen ist, hat in einer Series-A-Finanzierungsrunde 500 Millionen US-Dollar eingeworben. Diese Runde wurde gemeinsam von den Risikokapitalgesellschaften A
Amazons generativer KI-Assistent Alexa+ wird in Deutschland eingeführt – Prime-Mitglieder erhalten kostenlose Vorteile.
Am 8. Mai hat Amazon in Deutschland offiziell seinen nächsten Generationen-KI-Assistenten Alexa+ eingeführt, was einen weiteren wichtigen Schritt in der globalen KI-Strategie des Unternehmens darstellt. Der Dienst war bereits in mehreren Ländern und
Alphabet plant eine Finanzierungsrunde in Höhe von 8 Milliarden US-Dollar, um die Ausweitung der globalen KI-Infrastruktur zu beschleunigen.
Alphabet, das Mutterunternehmen von Google, kündigte am Montag an, durch den Verkauf von Aktien 80 Milliarden US-Dollar zu erhöhen. Diese Mittel sollen zur Finanzierung seiner umfangreichen KI-Infrastruktur sowie der Erweiterung seiner globalen Reche
Empfehlungen zu verwandten Spezialthemen
Kommentare (0)
Vor dem Hintergrund des sich verschärfenden Preiskampfs bei KI-Modellen gab Xiaomi am 27. Mai offiziell bekannt, dass das Unternehmen die Preise für die API der MiMo-V2.5-Serie dauerhaft senken und gleichzeitig das Abrechnungssystem optimieren werde, um die Kosten für Entwickler durch technologische Fortschritte weiter zu senken.

I. Deutliche Preissenkungen für APIs – bis zu 99 % Rabatt
Die Preisänderung trat weltweit am 27. Mai um 00:00 Uhr Pekinger Zeit in Kraft. Sie gilt für die beiden Kernversionen MiMo-V2.5 und MiMo-V2.5Pro und unterscheidet nicht mehr nach der Länge des Kontextfensters, was die Preisstruktur vereinfacht und für mehr Transparenz sorgt.
ModellversionEingabe-Cache-Treffer PreisMaximaler RabattAusgabe-PreisMaximaler RabattMiMo-V2.5Pro0,025 Yuan pro Million Token, bis zu 99 % Rabatt; Ausgabe: 6 Yuan pro Million Token, bis zu 86 % Rabatt MiMo-V2.5 0,02 Yuan pro Million Token, bis zu 98 % Rabatt; Ausgabe: 2 Yuan pro Million Token, bis zu 93 % RabattII. Verbesserung des Abrechnungssystems – Mehr Wert ohne zusätzliche Kosten
Über die direkten API-Preissenkungen hinaus hat Xiaomi sein Abrechnungssystem für den Token-Plan umfassend optimiert:
Vervierfachte Quote: Im Vergleich zur ursprünglichen Preisgestaltung hat sich die tatsächliche Token-Nutzungsquote auf das 5- bis 8-fache des bisherigen Betrags erhöht.
Vereinfachte Regeln: Die Einführung von Credits ersetzt die bisherigen komplexen Abrechnungsmethoden und macht den Token-Verbrauch sowie die Kostenberechnung für Entwickler intuitiver.

III. Technische Grundlage – Wie kann das Unternehmen die Preise weiter senken?
In seiner offiziellen Erklärung führt Xiaomi diese drastischen Preissenkungen auf technische Durchbrüche in der Architektur seines zugrunde liegenden Inferenzsystems zurück:
SWA-Inferenzoptimierung: Durch den Einsatz von SGLang HiCache mit vollständiger Unterstützung für SWA (Sliding Window Attention Mechanism) wurde der Datentransfer zwischen GPU-Speicher, CPU-Speicher und SSD auf ein Siebtel des bisherigen Volumens reduziert.
Verbesserte Cache-Effizienz: Die Anzahl der cachefähigen Token hat sich im Vergleich zur früheren optimierten Version fast verfünffacht, was die Cache-Trefferraten erhöht und die Kosten pro Inferenz drastisch senkt.
Optimierung des Cluster-Durchsatzes: Durch die Einführung von Expert-Parallel- (MoE) und Input-Length-Bucketing-Strategien hat der Eingangsdurchsatz des Clusters einen qualitativen Sprung gemacht, wobei eine hohe Servicequalität beibehalten und die Kosten pro Token stetig gesenkt wurden.
Xiaomis Schritt wird als proaktive Reaktion auf den derzeit intensiven Wettbewerb bei der Kommerzialisierung großer Modelle angesehen. Da die Preisbarrieren weiter sinken, wird die Kosteneffizienz der MiMo-Serie noch deutlicher zutage treten und die tiefe Integration von KI-Fähigkeiten in vertikalen Branchen und Entwickler-Workflows beschleunigen.
Mind Robotics, ein Tochterunternehmen von Rivian, erhält 500 Millionen US-Dollar für industrielle KI-Roboter.
Mind Robotics, ein Industrierobotiklabor, das aus dem Elektrofahrzeughersteller Rivian hervorgegangen ist, hat in einer Series-A-Finanzierungsrunde 500 Millionen US-Dollar eingeworben. Diese Runde wurde gemeinsam von den Risikokapitalgesellschaften A
Amazons generativer KI-Assistent Alexa+ wird in Deutschland eingeführt – Prime-Mitglieder erhalten kostenlose Vorteile.
Am 8. Mai hat Amazon in Deutschland offiziell seinen nächsten Generationen-KI-Assistenten Alexa+ eingeführt, was einen weiteren wichtigen Schritt in der globalen KI-Strategie des Unternehmens darstellt. Der Dienst war bereits in mehreren Ländern und
Alphabet plant eine Finanzierungsrunde in Höhe von 8 Milliarden US-Dollar, um die Ausweitung der globalen KI-Infrastruktur zu beschleunigen.
Alphabet, das Mutterunternehmen von Google, kündigte am Montag an, durch den Verkauf von Aktien 80 Milliarden US-Dollar zu erhöhen. Diese Mittel sollen zur Finanzierung seiner umfangreichen KI-Infrastruktur sowie der Erweiterung seiner globalen Reche





Heim






