opção
RogerMartinez
RogerMartinez
28 de Maio de 2026

O X Square Robot lançou o Wall-OSS-0.5, um modelo de Visão-Linguagem-Ação para inteligência incorporada. Este modelo conseguiu ser implementado diretamente em robôs reais em 17 tarefas desafiadoras sem necessidade de ajustes finos, alcançando uma pontuação de até 82 em tarefas que envolviam objetos flexíveis nunca antes vistas. Em comparação com o padrão da indústria π0.5, ele superou este por uma média de 17,5 pontos e apresentou uma melhoria significativa na precisão das operações. As principais inovações incluem o uso de técnicas de ponteamento de gradientes, um tokenizer para alinhamento visual, supervisão do espaço de ação e otimização distribuída com DMuon. Os pesos do modelo, o código de treinamento e as interfaces dos conjuntos de dados estão totalmente disponíveis em código aberto.

O X Square Robot lançou o Wall-OSS-0.5, um modelo de Visão-Linguagem-Ação para inteligência incorporada. Este modelo conseguiu ser implementado diretamente em robôs reais em 17 tarefas desafiadoras sem necessidade de ajustes finos, alcançando uma pontuação de até 82 em tarefas que envolviam objetos flexíveis nunca antes vistas. Em comparação com o padrão da indústria π0.5, ele superou este por uma média de 17,5 pontos e apresentou uma melhoria significativa na precisão das operações. As principais inovações incluem o uso de técnicas de ponteamento de gradientes, um tokenizer para alinhamento visual, supervisão do espaço de ação e otimização distribuída com DMuon. Os pesos do modelo, o código de treinamento e as interfaces dos conjuntos de dados estão totalmente disponíveis em código aberto.
Comentários (0)
0/300
OR