Maison
Présentation de l'architecture du robot humanoïde OmniXtreme : l'adaptation du flux permet de relever les défis liés aux mouvements hautement dynamiques
Unitree a officiellement publié et mis en open source son architecture de contrôle des mouvements pour robots humanoïdes, baptisée OmniXtreme, accompagnée d’un article technique rédigé par son fondateur, Wang Xingxing. Cette architecture apporte une réponse complète aux défis liés à la perte de fidélité des mouvements et à l’instabilité physique lors de l’exécution de vastes bibliothèques de mouvements dans des environnements hautement dynamiques, tels que les spectacles sur scène pour robots humanoïdes.

L'architecture OmniXtreme utilise un cadre d'entraînement en deux étapes. La première étape, le pré-entraînement évolutif basé sur les flux, synthétise des compétences complexes et hautement dynamiques — notamment les sauts périlleux arrière, les arts martiaux et la danse de rue — issues de diverses stratégies d'experts en un modèle unifié. Elle apprend les trajectoires de mouvement grâce à la correspondance de flux générative, surmontant ainsi efficacement les conflits de gradient typiques de l'apprentissage par renforcement multitâche. La deuxième étape, le post-entraînement tenant compte de l'actionnement, intègre un apprentissage par renforcement résiduel et une modélisation détaillée de l'enveloppe couple-vitesse. Cela permet au robot d'ajuster de manière autonome ses actions en fonction des limites physiques des moteurs en temps réel et de la dynamique de la puissance régénérative.
Les résultats expérimentaux indiquent que cette architecture a atteint un taux de réussite de 96,36 % pour les sauts périlleux arrière sur la plateforme matérielle Unitree G1, avec une latence d'inférence de bout en bout réduite à 10 millisecondes. La publication en open source d'OmniXtreme met non seulement en évidence la forte évolutivité de la technologie de correspondance de flux dans l'IA incarnée, mais marque également un tournant pour les robots humanoïdes, qui passent de la reproduction de compétences isolées à la possession d'une mobilité générale de haute fidélité. Elle établit un cadre technique crucial permettant à l'industrie de développer des systèmes de contrôle robustes dans des environnements réels complexes.
Article connexe
L'Administration chinoise du cyberespace impose l'étiquetage des courtes vidéos générées par l'IA et des vidéos de fiction
L'Administration chinoise du cyberespace a mis en place un plan global visant à normaliser l'étiquetage des contenus vidéo courts, en imposant aux plateformes l'utilisation de six balises obligatoires
DeepL, réputé pour la traduction de textes, se lance désormais dans la traduction vocale
DeepL, une entreprise de traduction surtout connue pour ses outils textuels, a lancé aujourd’hui une suite de traduction voix-voix destinée à des situations telles que les réunions, les conversations
Les notes de réunion générées par l'IA de Talat sont stockées directement sur votre appareil, et non dans le cloud
Granola, l'application de prise de notes basée sur l'IA et évaluée à 250 millions de dollars, a conquis les fondateurs d'entreprises technologiques et les investisseurs en capital-risque. Mais un déve
Recommandations de sujets spéciaux liés
commentaires (0)
Unitree a officiellement publié et mis en open source son architecture de contrôle des mouvements pour robots humanoïdes, baptisée OmniXtreme, accompagnée d’un article technique rédigé par son fondateur, Wang Xingxing. Cette architecture apporte une réponse complète aux défis liés à la perte de fidélité des mouvements et à l’instabilité physique lors de l’exécution de vastes bibliothèques de mouvements dans des environnements hautement dynamiques, tels que les spectacles sur scène pour robots humanoïdes.

L'architecture OmniXtreme utilise un cadre d'entraînement en deux étapes. La première étape, le pré-entraînement évolutif basé sur les flux, synthétise des compétences complexes et hautement dynamiques — notamment les sauts périlleux arrière, les arts martiaux et la danse de rue — issues de diverses stratégies d'experts en un modèle unifié. Elle apprend les trajectoires de mouvement grâce à la correspondance de flux générative, surmontant ainsi efficacement les conflits de gradient typiques de l'apprentissage par renforcement multitâche. La deuxième étape, le post-entraînement tenant compte de l'actionnement, intègre un apprentissage par renforcement résiduel et une modélisation détaillée de l'enveloppe couple-vitesse. Cela permet au robot d'ajuster de manière autonome ses actions en fonction des limites physiques des moteurs en temps réel et de la dynamique de la puissance régénérative.
Les résultats expérimentaux indiquent que cette architecture a atteint un taux de réussite de 96,36 % pour les sauts périlleux arrière sur la plateforme matérielle Unitree G1, avec une latence d'inférence de bout en bout réduite à 10 millisecondes. La publication en open source d'OmniXtreme met non seulement en évidence la forte évolutivité de la technologie de correspondance de flux dans l'IA incarnée, mais marque également un tournant pour les robots humanoïdes, qui passent de la reproduction de compétences isolées à la possession d'une mobilité générale de haute fidélité. Elle établit un cadre technique crucial permettant à l'industrie de développer des systèmes de contrôle robustes dans des environnements réels complexes.
L'Administration chinoise du cyberespace impose l'étiquetage des courtes vidéos générées par l'IA et des vidéos de fiction
L'Administration chinoise du cyberespace a mis en place un plan global visant à normaliser l'étiquetage des contenus vidéo courts, en imposant aux plateformes l'utilisation de six balises obligatoires
DeepL, réputé pour la traduction de textes, se lance désormais dans la traduction vocale
DeepL, une entreprise de traduction surtout connue pour ses outils textuels, a lancé aujourd’hui une suite de traduction voix-voix destinée à des situations telles que les réunions, les conversations
Les notes de réunion générées par l'IA de Talat sont stockées directement sur votre appareil, et non dans le cloud
Granola, l'application de prise de notes basée sur l'IA et évaluée à 250 millions de dollars, a conquis les fondateurs d'entreprises technologiques et les investisseurs en capital-risque. Mais un déve











