Дом
На серию Xiaomi MiMo-V2.5 в магазине API объявлено постоянное снижение цен — скидки до 99%
На фоне обостряющейся ценовой войны на рынке моделей искусственного интеллекта компания Xiaomi 27 мая официально объявила о постоянном снижении цен на API серии MiMo-V2.5, а также об оптимизации системы тарификации, что позволит за счет технологических усовершенствований еще больше снизить расходы разработчиков на вызов функций.

I. Значительное снижение цен на API — скидки до 99%
Изменение цен вступило в силу по всему миру в 00:00 по пекинскому времени 27 мая. Оно распространяется на две основные версии, MiMo-V2.5 и MiMo-V2.5Pro, и больше не зависит от длины контекстного окна, что упрощает структуру ценообразования и обеспечивает большую прозрачность.
Версия модели Цена при попадании в кэш ввода Максимальная скидка Цена на выходе Максимальная скидкаMiMo-V2.5Pro 0,025 юаня за миллион токенов, скидка до 99%; выход: 6 юаней за миллион токенов, скидка до 86% MiMo-V2.5 0,02 юаня за миллион токенов, скидка до 98%; выход: 2 юаня за миллион токенов, скидка до 93%II. Модернизация системы биллинга — больше преимуществ без дополнительных затрат
Помимо прямого снижения цен на API, Xiaomi значительно оптимизировала свою систему биллинга Token Plan:
Увеличение квоты в четыре раза: по сравнению с первоначальными ценами фактическая квота на использование токенов увеличилась в 5–8 раз.
Упрощенные правила: введение кредитов заменяет прежние сложные методы биллинга, делая потребление токенов и расчет затрат более интуитивными для разработчиков.

III. Техническая основа — как удается постоянно снижать цены?
В официальном заявлении Xiaomi объясняет такое значительное снижение цен техническими прорывами в архитектуре базовой системы инференса:
Оптимизация вывода SWA: благодаря использованию SGLang HiCache с полной поддержкой SWA (механизма скользящего окна внимания) объем передачи данных между памятью GPU, памятью CPU и SSD сократился до одной седьмой от прежнего.
Повышенная эффективность кэша: количество токенов, поддающихся кэшированию, увеличилось почти в пять раз по сравнению с ранее оптимизированной версией, что повысило частоту попаданий в кэш и резко снизило стоимость одного вывода.
Оптимизация пропускной способности кластера: благодаря внедрению стратегий экспертного параллелизма (MoE) и группировки по длине входных данных пропускная способность кластера по входным данным сделала качественный скачок, сохраняя высокое качество обслуживания и стабильно снижая затраты на один токен.
Действия Xiaomi рассматриваются как проактивный ответ на текущую острую конкуренцию в сфере коммерциализации крупных моделей. По мере дальнейшего снижения ценовых барьеров экономическая эффективность серии MiMo станет еще более заметной, ускорив глубокую интеграцию возможностей ИИ в различных отраслях и рабочих процессах разработчиков.
Связанная статья
Цепочка поставок очков с ИИ стремится к использованию легких материалов и чипов; компания Horizon Technology вкладывает значительные средства на этом пути еще до эры iPhone.
Ко второму кварталу 2026 года рынок умных очков с функциями искусственного интеллекта стремительно развивается, и отрасль переходит от начальной фазы “гонки ста проектов” к более продуманному и специализированному этапу. Google объявила о выпуске сво
Компания Mind Robotics, выделившаяся из группы Rivian, привлекла 500 миллионов долларов для разработки промышленных роботов на основе технологий искусственного интеллекта.
Mind Robotics – это промышленная лаборатория робототехники, возникшая на базе производителя электромобилей Rivian. Компания получила 500 миллионов долларов в рамках первого раунда финансирования, организованного венчурными компаниями Accel и Andreess
Ассистент на основе генеративных ИИ от Amazon Alexa+ запущен в Германии; члены программы Prime получают бесплатные привилегии.
8 мая Amazon официально запустила своего помощника на основе технологий генеративного искусственного интеллекта следующего поколения — Alexa+ — в Германии, что стало ещё одним важным шагом в реализации глобальной стратегии компании в области искусств
Рекомендации по связанным специальным темам
Комментарии (0)
На фоне обостряющейся ценовой войны на рынке моделей искусственного интеллекта компания Xiaomi 27 мая официально объявила о постоянном снижении цен на API серии MiMo-V2.5, а также об оптимизации системы тарификации, что позволит за счет технологических усовершенствований еще больше снизить расходы разработчиков на вызов функций.

I. Значительное снижение цен на API — скидки до 99%
Изменение цен вступило в силу по всему миру в 00:00 по пекинскому времени 27 мая. Оно распространяется на две основные версии, MiMo-V2.5 и MiMo-V2.5Pro, и больше не зависит от длины контекстного окна, что упрощает структуру ценообразования и обеспечивает большую прозрачность.
Версия модели Цена при попадании в кэш ввода Максимальная скидка Цена на выходе Максимальная скидкаMiMo-V2.5Pro 0,025 юаня за миллион токенов, скидка до 99%; выход: 6 юаней за миллион токенов, скидка до 86% MiMo-V2.5 0,02 юаня за миллион токенов, скидка до 98%; выход: 2 юаня за миллион токенов, скидка до 93%II. Модернизация системы биллинга — больше преимуществ без дополнительных затрат
Помимо прямого снижения цен на API, Xiaomi значительно оптимизировала свою систему биллинга Token Plan:
Увеличение квоты в четыре раза: по сравнению с первоначальными ценами фактическая квота на использование токенов увеличилась в 5–8 раз.
Упрощенные правила: введение кредитов заменяет прежние сложные методы биллинга, делая потребление токенов и расчет затрат более интуитивными для разработчиков.

III. Техническая основа — как удается постоянно снижать цены?
В официальном заявлении Xiaomi объясняет такое значительное снижение цен техническими прорывами в архитектуре базовой системы инференса:
Оптимизация вывода SWA: благодаря использованию SGLang HiCache с полной поддержкой SWA (механизма скользящего окна внимания) объем передачи данных между памятью GPU, памятью CPU и SSD сократился до одной седьмой от прежнего.
Повышенная эффективность кэша: количество токенов, поддающихся кэшированию, увеличилось почти в пять раз по сравнению с ранее оптимизированной версией, что повысило частоту попаданий в кэш и резко снизило стоимость одного вывода.
Оптимизация пропускной способности кластера: благодаря внедрению стратегий экспертного параллелизма (MoE) и группировки по длине входных данных пропускная способность кластера по входным данным сделала качественный скачок, сохраняя высокое качество обслуживания и стабильно снижая затраты на один токен.
Действия Xiaomi рассматриваются как проактивный ответ на текущую острую конкуренцию в сфере коммерциализации крупных моделей. По мере дальнейшего снижения ценовых барьеров экономическая эффективность серии MiMo станет еще более заметной, ускорив глубокую интеграцию возможностей ИИ в различных отраслях и рабочих процессах разработчиков.
Цепочка поставок очков с ИИ стремится к использованию легких материалов и чипов; компания Horizon Technology вкладывает значительные средства на этом пути еще до эры iPhone.
Ко второму кварталу 2026 года рынок умных очков с функциями искусственного интеллекта стремительно развивается, и отрасль переходит от начальной фазы “гонки ста проектов” к более продуманному и специализированному этапу. Google объявила о выпуске сво
Компания Mind Robotics, выделившаяся из группы Rivian, привлекла 500 миллионов долларов для разработки промышленных роботов на основе технологий искусственного интеллекта.
Mind Robotics – это промышленная лаборатория робототехники, возникшая на базе производителя электромобилей Rivian. Компания получила 500 миллионов долларов в рамках первого раунда финансирования, организованного венчурными компаниями Accel и Andreess
Ассистент на основе генеративных ИИ от Amazon Alexa+ запущен в Германии; члены программы Prime получают бесплатные привилегии.
8 мая Amazon официально запустила своего помощника на основе технологий генеративного искусственного интеллекта следующего поколения — Alexa+ — в Германии, что стало ещё одним важным шагом в реализации глобальной стратегии компании в области искусств











