A série Xiaomi MiMo-V2.5 ganha redução permanente de preço, com descontos de até 99%
Em meio à crescente guerra de preços dos modelos de IA, a Xiaomi anunciou oficialmente, em 27 de maio, que seu modelo de grande porte MiMo reduziria permanentemente os preços da API da série MiMo-V2.5, ao mesmo tempo em que otimizaria o sistema de cobrança para diminuir ainda mais os custos de uso dos desenvolvedores por meio de avanços tecnológicos.

I. Reduções significativas nos preços da API — até 99% de desconto
A mudança de preço entrou em vigor globalmente às 00:00, horário de Pequim, em 27 de maio. Ela se aplica às duas versões principais, MiMo-V2.5 e MiMo-V2.5Pro, e não faz mais distinção com base no comprimento da janela de contexto, simplificando a estrutura de preços para maior transparência.
Versão do modeloPreço por acerto no cache de entradaDesconto máximoPreço de saídaDesconto máximoMiMo-V2.5Pro0,025 yuan por milhão de tokens, até 99% de desconto; saída: 6 yuans por milhão de tokens, com até 86% de desconto; MiMo-V2.5: 0,02 yuan por milhão de tokens, com até 98% de desconto; saída: 2 yuans por milhão de tokens, com até 93% de descontoII. Atualização do sistema de cobrança — Mais valor sem custo adicional
Além dos cortes diretos nos preços da API, a Xiaomi otimizou significativamente seu sistema de faturamento do Plano de Tokens:
Cota quadruplicada: sob a estrutura de preços original, a cota real de uso de tokens aumentou de 5 a 8 vezes em relação ao valor anterior.
Regras simplificadas: a introdução dos Créditos substitui os métodos complexos de faturamento anteriores, tornando o consumo de tokens e o cálculo de custos mais intuitivos para os desenvolvedores.

III. Base técnica — Como é possível continuar reduzindo os preços?
A declaração oficial da Xiaomi atribui esses profundos cortes de preço a avanços técnicos na arquitetura do sistema de inferência subjacente:
Otimização de inferência SWA: Ao aproveitar o SGLang HiCache com suporte total para SWA (Sliding Window Attention Mechanism), a transferência de dados entre a memória da GPU, a memória da CPU e o SSD foi reduzida para um sétimo do volume anterior.
Eficiência de cache aprimorada: O número de tokens armazenáveis em cache aumentou quase cinco vezes em comparação com a versão otimizada anterior, aumentando as taxas de acerto de cache e reduzindo drasticamente o custo por inferência.
Otimização da taxa de transferência do cluster: Com a introdução de estratégias de paralelismo especializado (MoE) e segmentação por comprimento de entrada, a taxa de transferência de entrada do cluster teve um salto qualitativo, mantendo alta qualidade de serviço enquanto reduz de forma constante o custo por token.
A iniciativa da Xiaomi é vista como uma resposta proativa à intensa concorrência atual na comercialização de modelos de grande porte. À medida que as barreiras de preço continuam a cair, a relação custo-benefício da série MiMo se tornará ainda mais pronunciada, acelerando a integração profunda de recursos de IA em setores verticais e fluxos de trabalho de desenvolvedores.
Artigo relacionado
Cadeia de suprimentos para óculos inteligentes busca tecnologias de luz e chips enquanto a Horizon Technology investe pesadamente antes da era do iPhone
Até o segundo trimestre de 2026, o mercado de óculos inteligentes está aquecendo rapidamente, com a indústria passando da inicial “corrida dos cem óculos” para uma fase mais refinada e especializada. A Google anunciou o lançamento de seus primeiros ó
A Mind Robotics, uma empresa derivada da Rivian, obteve 500 milhões de dólares para o desenvolvimento de robôs industriais inteligentes.
A Mind Robotics, um laboratório de robótica industrial que surgiu a partir da fabricante de veículos elétricos Rivian, obteve 500 milhões de dólares em uma rodada de financiamento Série A, liderada pelas empresas de capital de risco Accel e Andreesse
O Assistente de IA Gerativa da Amazon, Alexa+, foi lançado na Alemanha, e os membros do Prime recebem benefícios gratuitos.
Em 8 de maio, a Amazon lançou oficialmente sua assistente de IA gerativa de próxima geração, Alexa+, na Alemanha, marcando mais um passo importante na estratégia global de IA da empresa. O serviço já havia sido implementado em vários países e regiões
Recomendações de tópicos especiais relacionados
Comentários (0)
Em meio à crescente guerra de preços dos modelos de IA, a Xiaomi anunciou oficialmente, em 27 de maio, que seu modelo de grande porte MiMo reduziria permanentemente os preços da API da série MiMo-V2.5, ao mesmo tempo em que otimizaria o sistema de cobrança para diminuir ainda mais os custos de uso dos desenvolvedores por meio de avanços tecnológicos.

I. Reduções significativas nos preços da API — até 99% de desconto
A mudança de preço entrou em vigor globalmente às 00:00, horário de Pequim, em 27 de maio. Ela se aplica às duas versões principais, MiMo-V2.5 e MiMo-V2.5Pro, e não faz mais distinção com base no comprimento da janela de contexto, simplificando a estrutura de preços para maior transparência.
Versão do modeloPreço por acerto no cache de entradaDesconto máximoPreço de saídaDesconto máximoMiMo-V2.5Pro0,025 yuan por milhão de tokens, até 99% de desconto; saída: 6 yuans por milhão de tokens, com até 86% de desconto; MiMo-V2.5: 0,02 yuan por milhão de tokens, com até 98% de desconto; saída: 2 yuans por milhão de tokens, com até 93% de descontoII. Atualização do sistema de cobrança — Mais valor sem custo adicional
Além dos cortes diretos nos preços da API, a Xiaomi otimizou significativamente seu sistema de faturamento do Plano de Tokens:
Cota quadruplicada: sob a estrutura de preços original, a cota real de uso de tokens aumentou de 5 a 8 vezes em relação ao valor anterior.
Regras simplificadas: a introdução dos Créditos substitui os métodos complexos de faturamento anteriores, tornando o consumo de tokens e o cálculo de custos mais intuitivos para os desenvolvedores.

III. Base técnica — Como é possível continuar reduzindo os preços?
A declaração oficial da Xiaomi atribui esses profundos cortes de preço a avanços técnicos na arquitetura do sistema de inferência subjacente:
Otimização de inferência SWA: Ao aproveitar o SGLang HiCache com suporte total para SWA (Sliding Window Attention Mechanism), a transferência de dados entre a memória da GPU, a memória da CPU e o SSD foi reduzida para um sétimo do volume anterior.
Eficiência de cache aprimorada: O número de tokens armazenáveis em cache aumentou quase cinco vezes em comparação com a versão otimizada anterior, aumentando as taxas de acerto de cache e reduzindo drasticamente o custo por inferência.
Otimização da taxa de transferência do cluster: Com a introdução de estratégias de paralelismo especializado (MoE) e segmentação por comprimento de entrada, a taxa de transferência de entrada do cluster teve um salto qualitativo, mantendo alta qualidade de serviço enquanto reduz de forma constante o custo por token.
A iniciativa da Xiaomi é vista como uma resposta proativa à intensa concorrência atual na comercialização de modelos de grande porte. À medida que as barreiras de preço continuam a cair, a relação custo-benefício da série MiMo se tornará ainda mais pronunciada, acelerando a integração profunda de recursos de IA em setores verticais e fluxos de trabalho de desenvolvedores.
Cadeia de suprimentos para óculos inteligentes busca tecnologias de luz e chips enquanto a Horizon Technology investe pesadamente antes da era do iPhone
Até o segundo trimestre de 2026, o mercado de óculos inteligentes está aquecendo rapidamente, com a indústria passando da inicial “corrida dos cem óculos” para uma fase mais refinada e especializada. A Google anunciou o lançamento de seus primeiros ó
A Mind Robotics, uma empresa derivada da Rivian, obteve 500 milhões de dólares para o desenvolvimento de robôs industriais inteligentes.
A Mind Robotics, um laboratório de robótica industrial que surgiu a partir da fabricante de veículos elétricos Rivian, obteve 500 milhões de dólares em uma rodada de financiamento Série A, liderada pelas empresas de capital de risco Accel e Andreesse
O Assistente de IA Gerativa da Amazon, Alexa+, foi lançado na Alemanha, e os membros do Prime recebem benefícios gratuitos.
Em 8 de maio, a Amazon lançou oficialmente sua assistente de IA gerativa de próxima geração, Alexa+, na Alemanha, marcando mais um passo importante na estratégia global de IA da empresa. O serviço já havia sido implementado em vários países e regiões





Lar






