샤오미, 고정밀 VLA 모델의 전체 사후 훈련 과정을 오픈소스로 공개
샤오미는 자사의 시각-언어-행동(VLA) 대형 모델인 ‘Xiaomi-Robotics-0’의 훈련 후 전체 프로세스를 공개하고, 실제 적용을 위해 이를 오픈소스로 공개했습니다. 이번 조치는 샤오미의 체화 지능(embodied intelligence) 개발 노력에 있어 중요한 진전을 의미하며, 로봇이 최소한의 데이터로도 복잡한 작업 기술을 효율적으로 학습할 수 있도록 돕기 위해 고안되었습니다.
20시간 만에 '바늘구멍에 실 꿰기' 성공
연구팀은 사전 훈련된 모델을 기반으로, 실제 로봇의 사후 훈련에 단 20시간 분량의 과제 전용 데이터만을 활용했습니다. 이를 통해 로봇은 이어폰을 케이스에 정밀하게 삽입하는 까다로운 동작을 수행할 수 있게 되었습니다. 이 과제는 탁월한 공간 인식 정확도를 요구하며, 마찰이 극히 낮은 표면으로 인해 발생하는 위치 편차를 보정해야 합니다.
이 모델은 1mm 미만의 오차 범위 내에서 정렬을 달성하며, 동작 편차를 실시간으로 보정할 수 있습니다. 이러한 부드럽고 연속적인 실행은 Xiaomi-Robotics-0가 고정밀 조립 작업에 지닌 강력한 잠재력을 잘 보여줍니다.

오픈소스 생태계가 생산성을 가속화합니다
이 모델을 실용적이고 즉시 사용 가능한 도구로 전환하기 위해 샤오미는 모델 가중치뿐만 아니라 기술 보고서와 전체 소스 코드까지 오픈소스로 공개했습니다. 이러한 포괄적인 엔드투엔드 공개는 체화 지능을 탐구하는 개발자들의 진입 장벽을 크게 낮춥니다.
이 모델은 이미 주요 국제 벤치마크에서 뛰어난 성능을 입증했으며, 전 세계적으로 가장 많이 다운로드된 모델 중 하나로 꼽히고 있습니다. 샤오미는 훈련 후 처리 과정을 공개함으로써 전 세계 개발자들이 협력하여 로봇의 인식 및 실행 로직을 개선할 수 있도록 지원하며, AI 로봇이 실제 생산 현장과 일상생활에 통합되는 속도를 가속화합니다.
프로젝트 웹사이트: https://robotics.xiaomi.com/xiaomi-robotics-0.html
오픈 소스 코드: https://github.com/XiaomiRobotics/Xiaomi-Robotics-0
관련 기사
Anthropic의 실험용 AI ‘클로드(Claude)’가 전자상거래 테스트에서 협상과 거래를 성공적으로 완료했다
인공지능이 급속도로 발전하는 가운데, 앤트로픽(Anthropic)은 지난 금요일 ‘프로젝트 딜(Project Deal)’이라는 내부 실험을 조용히 시작하며 전자상거래 분야에서 AI의 잠재력을 선보였다. 이 실험에서는 AI 모델 ‘클로드(Claude)’가 실제 금융 거래가 이루어지는 폐쇄형 시장 환경 내에서 구매, 판매, 가격 협상을 자율적으로 수행했다.실험
DeepSeek Code, 출시를 앞두고 있다
AI 기술이 가속화됨에 따라 DeepSeek은 흥미진진한 전환점을 맞이하고 있습니다. 이 AI 기업은 최근 700억 위안 이상의 자금을 조달했다고 밝혔습니다. 경영진은 단기적인 상업적 이익보다 획기적인 AI 연구에 전념하겠다는 의지를 강조했습니다. 이러한 전략적 전환은 DeepSeek이 새로운 제품, 특히 많은 기대를 모으고 있는 ‘DeepSeek Code
머스크의 ‘그록(Grok)’: 1조 5천억 개의 파라미터와 커서 코드 통합—게임 체인저인가, 허세인가?
일론 머스크가 드디어 움직이기 시작했다.AI 프로그래밍 경쟁에서 OpenAI와 Anthropic은 속도를 내고 있는 반면, xAI는 뒤처지는 듯하다. 머스크는 클로드(Claude)에 대항하겠다는 목표를 수차례 밝혔으나, Grok4.X 시리즈에 대한 여러 차례의 업데이트에도 불구하고 결과는 이론상으로는 좋아 보이지만 실제 적용에서는 기대에 미치지 못하며, 격
관련 특별 주제 추천
의견 (0)
0/500
샤오미는 자사의 시각-언어-행동(VLA) 대형 모델인 ‘Xiaomi-Robotics-0’의 훈련 후 전체 프로세스를 공개하고, 실제 적용을 위해 이를 오픈소스로 공개했습니다. 이번 조치는 샤오미의 체화 지능(embodied intelligence) 개발 노력에 있어 중요한 진전을 의미하며, 로봇이 최소한의 데이터로도 복잡한 작업 기술을 효율적으로 학습할 수 있도록 돕기 위해 고안되었습니다.
20시간 만에 '바늘구멍에 실 꿰기' 성공
연구팀은 사전 훈련된 모델을 기반으로, 실제 로봇의 사후 훈련에 단 20시간 분량의 과제 전용 데이터만을 활용했습니다. 이를 통해 로봇은 이어폰을 케이스에 정밀하게 삽입하는 까다로운 동작을 수행할 수 있게 되었습니다. 이 과제는 탁월한 공간 인식 정확도를 요구하며, 마찰이 극히 낮은 표면으로 인해 발생하는 위치 편차를 보정해야 합니다.
이 모델은 1mm 미만의 오차 범위 내에서 정렬을 달성하며, 동작 편차를 실시간으로 보정할 수 있습니다. 이러한 부드럽고 연속적인 실행은 Xiaomi-Robotics-0가 고정밀 조립 작업에 지닌 강력한 잠재력을 잘 보여줍니다.

오픈소스 생태계가 생산성을 가속화합니다
이 모델을 실용적이고 즉시 사용 가능한 도구로 전환하기 위해 샤오미는 모델 가중치뿐만 아니라 기술 보고서와 전체 소스 코드까지 오픈소스로 공개했습니다. 이러한 포괄적인 엔드투엔드 공개는 체화 지능을 탐구하는 개발자들의 진입 장벽을 크게 낮춥니다.
이 모델은 이미 주요 국제 벤치마크에서 뛰어난 성능을 입증했으며, 전 세계적으로 가장 많이 다운로드된 모델 중 하나로 꼽히고 있습니다. 샤오미는 훈련 후 처리 과정을 공개함으로써 전 세계 개발자들이 협력하여 로봇의 인식 및 실행 로직을 개선할 수 있도록 지원하며, AI 로봇이 실제 생산 현장과 일상생활에 통합되는 속도를 가속화합니다.
프로젝트 웹사이트: https://robotics.xiaomi.com/xiaomi-robotics-0.html
오픈 소스 코드: https://github.com/XiaomiRobotics/Xiaomi-Robotics-0
Anthropic의 실험용 AI ‘클로드(Claude)’가 전자상거래 테스트에서 협상과 거래를 성공적으로 완료했다
인공지능이 급속도로 발전하는 가운데, 앤트로픽(Anthropic)은 지난 금요일 ‘프로젝트 딜(Project Deal)’이라는 내부 실험을 조용히 시작하며 전자상거래 분야에서 AI의 잠재력을 선보였다. 이 실험에서는 AI 모델 ‘클로드(Claude)’가 실제 금융 거래가 이루어지는 폐쇄형 시장 환경 내에서 구매, 판매, 가격 협상을 자율적으로 수행했다.실험
DeepSeek Code, 출시를 앞두고 있다
AI 기술이 가속화됨에 따라 DeepSeek은 흥미진진한 전환점을 맞이하고 있습니다. 이 AI 기업은 최근 700억 위안 이상의 자금을 조달했다고 밝혔습니다. 경영진은 단기적인 상업적 이익보다 획기적인 AI 연구에 전념하겠다는 의지를 강조했습니다. 이러한 전략적 전환은 DeepSeek이 새로운 제품, 특히 많은 기대를 모으고 있는 ‘DeepSeek Code
머스크의 ‘그록(Grok)’: 1조 5천억 개의 파라미터와 커서 코드 통합—게임 체인저인가, 허세인가?
일론 머스크가 드디어 움직이기 시작했다.AI 프로그래밍 경쟁에서 OpenAI와 Anthropic은 속도를 내고 있는 반면, xAI는 뒤처지는 듯하다. 머스크는 클로드(Claude)에 대항하겠다는 목표를 수차례 밝혔으나, Grok4.X 시리즈에 대한 여러 차례의 업데이트에도 불구하고 결과는 이론상으로는 좋아 보이지만 실제 적용에서는 기대에 미치지 못하며, 격





집






