샤오미 MiMo-V2.5 시리즈 API, 최대 99% 할인된 가격으로 영구 할인
치열해지는 AI 모델 가격 경쟁 속에서 샤오미는 5월 27일, 자사의 대형 모델인 MiMo의 MiMo-V2.5 시리즈 API 가격을 영구적으로 인하하고, 동시에 기술 발전을 통해 청구 시스템을 최적화하여 개발자들의 호출 비용을 더욱 낮추겠다고 공식 발표했다.

I. 대폭적인 API 가격 인하 — 최대 99% 할인
이번 가격 변경은 5월 27일 베이징 시간 00:00부터 전 세계적으로 적용되었습니다. 이는 MiMo-V2.5와 MiMo-V2.5Pro라는 두 가지 핵심 버전에 적용되며, 더 이상 컨텍스트 윈도우 길이에 따라 가격을 차별화하지 않아 가격 구조를 단순화하고 투명성을 높였습니다.
모델 버전입력 캐시 적중 가격최대 할인율출력 가격최대 할인율MiMo-V2.5Pro100만 토큰당 0.025위안, 최대 99% 할인; 출력: 토큰 100만 개당 6위안, 최대 86% 할인 MiMo-V2.5 토큰 100만 개당 0.02위안, 최대 98% 할인; 출력: 토큰 100만 개당 2위안, 최대 93% 할인II. 청구 시스템 업그레이드 — 추가 비용 없이 더 큰 가치 제공
API 가격 인하 외에도 샤오미는 토큰 플랜(Token Plan) 청구 시스템을 대폭 최적화했습니다:
할당량 4배 확대: 기존 가격 정책 대비 실제 토큰 사용 할당량이 이전 대비 5~8배 증가했습니다.
규칙 간소화: 크레딧(Credits) 도입으로 기존의 복잡한 청구 방식이 대체되어, 개발자들이 토큰 소비량과 비용 계산을 더 직관적으로 파악할 수 있게 되었습니다.

III. 기술적 기반 — 어떻게 계속 가격을 낮출 수 있는가?
샤오미의 공식 성명에 따르면, 이러한 대폭적인 가격 인하는 기반 추론 시스템 아키텍처의 기술적 혁신 덕분입니다:
SWA 추론 최적화: SWA(Sliding Window Attention Mechanism)를 완벽하게 지원하는 SGLang HiCache를 활용함으로써, GPU 메모리, CPU 메모리 및 SSD 간의 데이터 전송량이 기존 대비 7분의 1로 감소했습니다.
캐시 효율성 향상: 캐시 가능한 토큰 수가 이전 최적화 버전 대비 약 5배 증가하여 캐시 적중률을 높이고 인퍼런스당 비용을 획기적으로 낮췄습니다.
클러스터 처리량 최적화: 전문가 병렬(MoE) 및 입력 길이 버킷팅 전략을 도입함으로써 클러스터의 입력 처리량이 질적 도약을 이루었으며, 높은 서비스 품질을 유지하면서 토큰당 비용을 꾸준히 절감하고 있습니다.
샤오미의 이번 조치는 대규모 모델 상용화 분야에서 현재 치열하게 벌어지고 있는 경쟁에 대한 선제적인 대응으로 평가됩니다. 가격 장벽이 지속적으로 낮아짐에 따라 MiMo 시리즈의 비용 효율성은 더욱 두드러질 것이며, 이는 다양한 산업 분야와 개발자 워크플로우 전반에 걸쳐 AI 기능의 심층적인 통합을 가속화할 것입니다.
관련 기사
AI 안경 공급망, 라이트 기술과 칩에 주목하며 아이폰 시대 이전부터 대규모 투자 진행 중
2026년 2분기까지 AI 안경 시장은 빠르게 성장하고 있으며, 업계는 초기의 “수백 개의 안경 경쟁”에서 보다 정제되고 전문화된 단계로 진입하고 있습니다. 구글은 올 가을 첫 번째 AI 안경을 출시한다고 발표했으며, 여러 제조업체들도 연이어 새로운 제품을 출시하면서 AI 안경을 스마트폰에 이은 차세대 컴퓨팅 기기로 포지셔닝하고 있습니다. 이러한 추세 하에 상류 공급망에서 광학 디스플레이 부품과 주요 제어 칩이 핵심 가치 영역으로 부상하고 있습
Rivian의 자회사인 Mind Robotics는 산업용 AI 로봇 분야에서 5억 달러의 투자를 유치했습니다.
마인드 로보틱스는 전기차 제조업체 리빈에서 분사된 산업용 로보틱스 연구소로, 벤처캐피털 회사인 액셀과 안드레센 호로위츠의 공동 주도로 5억 달러의 시리즈 A 투자를 유치했습니다.수요일에 발표된 이번 투자는 2025년 말 이클립스가 주도한 1.15억 달러 규모의 시드 라운드에 이은 것으로, 마인드 로보틱스는 설립된 지 불과 몇 달 만에 총 6.15억 달러의 자금을 확보하게 되었습니다. 이 소식을 처음 보도한 월스트리트저널에 따르면, 이번 투자를
아마존의 생성형 AI 어시스턴트 알렉사+가 독일에서 출시되었으며, 프라임 회원들은 무료 혜택을 받을 수 있습니다.
5월 8일, 아마존은 독일에서 차세대 생성형 AI 어시스턴트인 알렉사+를 공식적으로 출시했으며, 이는 회사의 글로벌 AI 전략에서 또 하나의 중요한 단계를 의미합니다. 이 서비스는 이미 미국, 영국, 독일, 오스트리아 등 여러 국가와 지역에서 제공되고 있었습니다.알렉사+는 먼저 독일 사용자들을 대상으로 파일럿 프로그램을 통해 선보일 예정입니다. 앞으로 몇 주 동안 현지 사용자들은 점차적으로 공식 초대를 받아 이 서비스를 체험할 수 있게 될 것
관련 특별 주제 추천
의견 (0)
0/500
치열해지는 AI 모델 가격 경쟁 속에서 샤오미는 5월 27일, 자사의 대형 모델인 MiMo의 MiMo-V2.5 시리즈 API 가격을 영구적으로 인하하고, 동시에 기술 발전을 통해 청구 시스템을 최적화하여 개발자들의 호출 비용을 더욱 낮추겠다고 공식 발표했다.

I. 대폭적인 API 가격 인하 — 최대 99% 할인
이번 가격 변경은 5월 27일 베이징 시간 00:00부터 전 세계적으로 적용되었습니다. 이는 MiMo-V2.5와 MiMo-V2.5Pro라는 두 가지 핵심 버전에 적용되며, 더 이상 컨텍스트 윈도우 길이에 따라 가격을 차별화하지 않아 가격 구조를 단순화하고 투명성을 높였습니다.
모델 버전입력 캐시 적중 가격최대 할인율출력 가격최대 할인율MiMo-V2.5Pro100만 토큰당 0.025위안, 최대 99% 할인; 출력: 토큰 100만 개당 6위안, 최대 86% 할인 MiMo-V2.5 토큰 100만 개당 0.02위안, 최대 98% 할인; 출력: 토큰 100만 개당 2위안, 최대 93% 할인II. 청구 시스템 업그레이드 — 추가 비용 없이 더 큰 가치 제공
API 가격 인하 외에도 샤오미는 토큰 플랜(Token Plan) 청구 시스템을 대폭 최적화했습니다:
할당량 4배 확대: 기존 가격 정책 대비 실제 토큰 사용 할당량이 이전 대비 5~8배 증가했습니다.
규칙 간소화: 크레딧(Credits) 도입으로 기존의 복잡한 청구 방식이 대체되어, 개발자들이 토큰 소비량과 비용 계산을 더 직관적으로 파악할 수 있게 되었습니다.

III. 기술적 기반 — 어떻게 계속 가격을 낮출 수 있는가?
샤오미의 공식 성명에 따르면, 이러한 대폭적인 가격 인하는 기반 추론 시스템 아키텍처의 기술적 혁신 덕분입니다:
SWA 추론 최적화: SWA(Sliding Window Attention Mechanism)를 완벽하게 지원하는 SGLang HiCache를 활용함으로써, GPU 메모리, CPU 메모리 및 SSD 간의 데이터 전송량이 기존 대비 7분의 1로 감소했습니다.
캐시 효율성 향상: 캐시 가능한 토큰 수가 이전 최적화 버전 대비 약 5배 증가하여 캐시 적중률을 높이고 인퍼런스당 비용을 획기적으로 낮췄습니다.
클러스터 처리량 최적화: 전문가 병렬(MoE) 및 입력 길이 버킷팅 전략을 도입함으로써 클러스터의 입력 처리량이 질적 도약을 이루었으며, 높은 서비스 품질을 유지하면서 토큰당 비용을 꾸준히 절감하고 있습니다.
샤오미의 이번 조치는 대규모 모델 상용화 분야에서 현재 치열하게 벌어지고 있는 경쟁에 대한 선제적인 대응으로 평가됩니다. 가격 장벽이 지속적으로 낮아짐에 따라 MiMo 시리즈의 비용 효율성은 더욱 두드러질 것이며, 이는 다양한 산업 분야와 개발자 워크플로우 전반에 걸쳐 AI 기능의 심층적인 통합을 가속화할 것입니다.
AI 안경 공급망, 라이트 기술과 칩에 주목하며 아이폰 시대 이전부터 대규모 투자 진행 중
2026년 2분기까지 AI 안경 시장은 빠르게 성장하고 있으며, 업계는 초기의 “수백 개의 안경 경쟁”에서 보다 정제되고 전문화된 단계로 진입하고 있습니다. 구글은 올 가을 첫 번째 AI 안경을 출시한다고 발표했으며, 여러 제조업체들도 연이어 새로운 제품을 출시하면서 AI 안경을 스마트폰에 이은 차세대 컴퓨팅 기기로 포지셔닝하고 있습니다. 이러한 추세 하에 상류 공급망에서 광학 디스플레이 부품과 주요 제어 칩이 핵심 가치 영역으로 부상하고 있습
Rivian의 자회사인 Mind Robotics는 산업용 AI 로봇 분야에서 5억 달러의 투자를 유치했습니다.
마인드 로보틱스는 전기차 제조업체 리빈에서 분사된 산업용 로보틱스 연구소로, 벤처캐피털 회사인 액셀과 안드레센 호로위츠의 공동 주도로 5억 달러의 시리즈 A 투자를 유치했습니다.수요일에 발표된 이번 투자는 2025년 말 이클립스가 주도한 1.15억 달러 규모의 시드 라운드에 이은 것으로, 마인드 로보틱스는 설립된 지 불과 몇 달 만에 총 6.15억 달러의 자금을 확보하게 되었습니다. 이 소식을 처음 보도한 월스트리트저널에 따르면, 이번 투자를
아마존의 생성형 AI 어시스턴트 알렉사+가 독일에서 출시되었으며, 프라임 회원들은 무료 혜택을 받을 수 있습니다.
5월 8일, 아마존은 독일에서 차세대 생성형 AI 어시스턴트인 알렉사+를 공식적으로 출시했으며, 이는 회사의 글로벌 AI 전략에서 또 하나의 중요한 단계를 의미합니다. 이 서비스는 이미 미국, 영국, 독일, 오스트리아 등 여러 국가와 지역에서 제공되고 있었습니다.알렉사+는 먼저 독일 사용자들을 대상으로 파일럿 프로그램을 통해 선보일 예정입니다. 앞으로 몇 주 동안 현지 사용자들은 점차적으로 공식 초대를 받아 이 서비스를 체험할 수 있게 될 것





집






