Lar
A Xiaomi torna público o processo completo pós-treinamento para um modelo VLA de alta precisão
A Xiaomi revelou o processo completo pós-treinamento de seu grande modelo de linguagem visual e ação (VLA), o Xiaomi-Robotics-0, tornando-o de código aberto para aplicações no mundo real. Essa iniciativa representa um avanço significativo nos esforços da Xiaomi em inteligência incorporada, projetada para ajudar os robôs a aprender habilidades operacionais complexas de forma eficiente com o mínimo de dados.
Dominando a tarefa “Agulha no Palha” em 20 horas
Com base em um treinamento prévio, a equipe de pesquisa utilizou apenas 20 horas de dados específicos da tarefa para o pós-treinamento do robô real. Isso permitiu que o robô executasse a manobra desafiadora de inserir fones de ouvido com precisão em um estojo. A tarefa exige excepcional precisão de percepção espacial e deve compensar o deslocamento causado por superfícies com atrito extremamente baixo.
O modelo alcança alinhamento com tolerâncias submilimétricas e pode corrigir desvios de ação em tempo real. Essa execução suave e contínua destaca o forte potencial do Xiaomi-Robotics-0 para operações de montagem de alta precisão.

Ecossistema de código aberto acelera a produtividade
Para transformar este modelo em uma ferramenta prática e pronta para uso, a Xiaomi disponibilizou em código aberto não apenas os pesos do modelo, mas também o relatório técnico e o código-fonte completo. Este lançamento abrangente e de ponta a ponta reduz significativamente a barreira de entrada para desenvolvedores que exploram a inteligência incorporada.
O modelo já demonstrou forte desempenho nos principais benchmarks internacionais, figurando entre os mais baixados globalmente. Ao abrir o processo pós-treinamento, a Xiaomi permite que desenvolvedores em todo o mundo refinem colaborativamente a percepção robótica e a lógica de execução, acelerando a integração de robôs com IA na produção do mundo real e na vida cotidiana.
Site do projeto: https://robotics.xiaomi.com/xiaomi-robotics-0.html
Código-fonte aberto: https://github.com/XiaomiRobotics/Xiaomi-Robotics-0
Artigo relacionado
DeepSeek Code pronto para ser lançado
À medida que a tecnologia de IA avança, a DeepSeek encontra-se em um momento emocionante. A empresa de IA revelou recentemente que garantiu mais de 70 bilhões de yuans em financiamento. A direção enfa
O Grok de Musk: 1,5 trilhão de parâmetros e absorção de código de cursor — uma revolução ou um blefe?
Elon Musk finalmente está entrando em ação.Na corrida pela programação de IA, a OpenAI e a Anthropic estão acelerando, enquanto a xAI parece estar ficando para trás. Musk já declarou várias vezes seu
A OpenAI altera secretamente seus estatutos para dificultar a demissão de Altman
Após o incidente semelhante a um golpe ocorrido em 2023, a OpenAI reforçou ainda mais as proteções ao CEO Sam Altman por meio da atualização de seu estatuto social. Documentos judiciais divulgados rec
Recomendações de tópicos especiais relacionados
Comentários (0)
A Xiaomi revelou o processo completo pós-treinamento de seu grande modelo de linguagem visual e ação (VLA), o Xiaomi-Robotics-0, tornando-o de código aberto para aplicações no mundo real. Essa iniciativa representa um avanço significativo nos esforços da Xiaomi em inteligência incorporada, projetada para ajudar os robôs a aprender habilidades operacionais complexas de forma eficiente com o mínimo de dados.
Dominando a tarefa “Agulha no Palha” em 20 horas
Com base em um treinamento prévio, a equipe de pesquisa utilizou apenas 20 horas de dados específicos da tarefa para o pós-treinamento do robô real. Isso permitiu que o robô executasse a manobra desafiadora de inserir fones de ouvido com precisão em um estojo. A tarefa exige excepcional precisão de percepção espacial e deve compensar o deslocamento causado por superfícies com atrito extremamente baixo.
O modelo alcança alinhamento com tolerâncias submilimétricas e pode corrigir desvios de ação em tempo real. Essa execução suave e contínua destaca o forte potencial do Xiaomi-Robotics-0 para operações de montagem de alta precisão.

Ecossistema de código aberto acelera a produtividade
Para transformar este modelo em uma ferramenta prática e pronta para uso, a Xiaomi disponibilizou em código aberto não apenas os pesos do modelo, mas também o relatório técnico e o código-fonte completo. Este lançamento abrangente e de ponta a ponta reduz significativamente a barreira de entrada para desenvolvedores que exploram a inteligência incorporada.
O modelo já demonstrou forte desempenho nos principais benchmarks internacionais, figurando entre os mais baixados globalmente. Ao abrir o processo pós-treinamento, a Xiaomi permite que desenvolvedores em todo o mundo refinem colaborativamente a percepção robótica e a lógica de execução, acelerando a integração de robôs com IA na produção do mundo real e na vida cotidiana.
Site do projeto: https://robotics.xiaomi.com/xiaomi-robotics-0.html
Código-fonte aberto: https://github.com/XiaomiRobotics/Xiaomi-Robotics-0
DeepSeek Code pronto para ser lançado
À medida que a tecnologia de IA avança, a DeepSeek encontra-se em um momento emocionante. A empresa de IA revelou recentemente que garantiu mais de 70 bilhões de yuans em financiamento. A direção enfa
O Grok de Musk: 1,5 trilhão de parâmetros e absorção de código de cursor — uma revolução ou um blefe?
Elon Musk finalmente está entrando em ação.Na corrida pela programação de IA, a OpenAI e a Anthropic estão acelerando, enquanto a xAI parece estar ficando para trás. Musk já declarou várias vezes seu
A OpenAI altera secretamente seus estatutos para dificultar a demissão de Altman
Após o incidente semelhante a um golpe ocorrido em 2023, a OpenAI reforçou ainda mais as proteções ao CEO Sam Altman por meio da atualização de seu estatuto social. Documentos judiciais divulgados rec











