option
Maison
Flash info
Contenu
RogerMartinez
RogerMartinez
28 mai 2026

X Square Robot a mis à disposition sous licence libre Wall-OSS-0.5, un modèle Vision-Language-Action destiné à l'intelligence incarnée. Ce modèle a permis de déployer des solutions sans aucune adaptation préalable sur 17 tâches difficiles sur des robots réels, atteignant même 82 points dans des missions impliquant des objets flexibles non vus auparavant. Comparé au benchmark industriel π0.5, il se distingue par une avance moyenne de 17,5 points et montre une amélioration significative en termes de précision dans les opérations. Les innovations clés incluent l'utilisation de techniques de pontage des gradients, un tokenizer permettant l'alignement visuel, une supervision de l'espace d'action et une optimisation distribuée utilisant des DMuons. Les poids du modèle, le code d'entraînement ainsi que les interfaces des données sont entièrement disponibles sous licence libre.

X Square Robot a mis à disposition sous licence libre Wall-OSS-0.5, un modèle Vision-Language-Action destiné à l'intelligence incarnée. Ce modèle a permis de déployer des solutions sans aucune adaptation préalable sur 17 tâches difficiles sur des robots réels, atteignant même 82 points dans des missions impliquant des objets flexibles non vus auparavant. Comparé au benchmark industriel π0.5, il se distingue par une avance moyenne de 17,5 points et montre une amélioration significative en termes de précision dans les opérations. Les innovations clés incluent l'utilisation de techniques de pontage des gradients, un tokenizer permettant l'alignement visuel, une supervision de l'espace d'action et une optimisation distribuée utilisant des DMuons. Les poids du modèle, le code d'entraînement ainsi que les interfaces des données sont entièrement disponibles sous licence libre.
commentaires (0)
0/300
OR