OmniXtremeヒューマノイドロボットのアーキテクチャが公開:フローマッチング技術が高度な動的動作の課題を解決
Unitreeは、同社のヒューマノイドロボット用モーション制御アーキテクチャ「OmniXtreme」を正式にリリースし、オープンソース化するとともに、創業者である王星星氏による技術論文を公開した。このアーキテクチャは、ヒューマノイドロボットの舞台公演など、動的な環境下で大規模なモーションライブラリを実行する際に生じる、動作の忠実度の低下や物理的な不安定性といった課題に包括的に対処するものである。

OmniXtremeアーキテクチャは、2段階のトレーニングフレームワークを採用しています。第1段階である「スケーラブルなフローベースの事前学習(Scalable Flow-based Pretraining)」では、バックフリップ、武術、ストリートダンスなど、複雑で高動的なスキルを様々なエキスパート戦略から抽出し、統一されたモデルに集約します。この段階では、生成フローマッチングを通じて動作軌道を学習し、マルチタスク強化学習で典型的な勾配の競合を効果的に克服します。 第2段階である「アクチュエーション対応ポストトレーニング」では、残差強化学習と詳細なトルク・速度エンベロープモデリングが組み込まれています。これにより、ロボットはモーターの物理的限界や回生電力のダイナミクスに基づいて、リアルタイムで動作を自律的に調整できるようになります。
実験結果によると、このアーキテクチャはUnitree G1ハードウェアプラットフォーム上でバックフリップの成功率96.36%を達成し、エンドツーエンドの推論遅延は10ミリ秒に短縮されました。 OmniXtremeのオープンソース化は、具現化AIにおけるフローマッチング技術の強力なスケーラビリティを実証するだけでなく、ヒューマノイドロボットが孤立した技能の再現から、汎用的かつ高精度な移動能力の獲得へと移行することを意味する。これは、業界が複雑な実世界環境において堅牢な制御システムを開発するための、極めて重要な技術的枠組みを確立するものである。
関連記事
中国サイバー空間管理局、AI生成およびフィクションのショート動画へのタグ付けを義務化
中国サイバー空間管理局は、ショート動画コンテンツの表示を標準化するための包括的な計画を打ち出し、プラットフォームに対し「AI生成コンテンツ」を含む6つの必須タグの表示を義務付けた。これにより、ショート動画のガバナンスにおいて、透明性の確保が義務付けられる新たな時代が幕を開けた。コンテンツの出所が不明確であったり、事実と虚構の区別が困難であったりするといった問題に対処するため、規制当局は、Douyi
テキスト翻訳で知られるDeepLが、今度は音声翻訳に注力している
テキスト翻訳ツールで知られる翻訳企業DeepLは本日、カスタムアプリケーションを通じて、会議やモバイル・ウェブ上の会話、現場担当者のグループディスカッションといった場面に対応する音声翻訳スイートをリリースした。 また同社は、外部の開発者や企業がコールセンターなどの特定のユースケースに合わせてDeepLの技術を応用できるようにするAPIも導入した。「長年にわたりテキスト翻訳に注力してきた私たちにとっ
タラットのAI会議メモは、クラウドではなく、お使いのデバイスに保存されます
評価額2億5000万ドルに達するAI搭載ノートアプリ「Granola」は、テック系スタートアップの創業者やベンチャーキャピタリストの間で人気を集めている。しかし、ある開発者は、サブスクリプション制ではなく、一度きりの料金で利用でき、よりプライバシーが守られ、完全にローカルで動作する代替アプリへの需要を見出していた。そのビジョンから生まれたのが、新しいMacアプリ「Talat」だ。イングランドのヨー
関連特集おすすめ
コメント (0)
0/500
Unitreeは、同社のヒューマノイドロボット用モーション制御アーキテクチャ「OmniXtreme」を正式にリリースし、オープンソース化するとともに、創業者である王星星氏による技術論文を公開した。このアーキテクチャは、ヒューマノイドロボットの舞台公演など、動的な環境下で大規模なモーションライブラリを実行する際に生じる、動作の忠実度の低下や物理的な不安定性といった課題に包括的に対処するものである。

OmniXtremeアーキテクチャは、2段階のトレーニングフレームワークを採用しています。第1段階である「スケーラブルなフローベースの事前学習(Scalable Flow-based Pretraining)」では、バックフリップ、武術、ストリートダンスなど、複雑で高動的なスキルを様々なエキスパート戦略から抽出し、統一されたモデルに集約します。この段階では、生成フローマッチングを通じて動作軌道を学習し、マルチタスク強化学習で典型的な勾配の競合を効果的に克服します。 第2段階である「アクチュエーション対応ポストトレーニング」では、残差強化学習と詳細なトルク・速度エンベロープモデリングが組み込まれています。これにより、ロボットはモーターの物理的限界や回生電力のダイナミクスに基づいて、リアルタイムで動作を自律的に調整できるようになります。
実験結果によると、このアーキテクチャはUnitree G1ハードウェアプラットフォーム上でバックフリップの成功率96.36%を達成し、エンドツーエンドの推論遅延は10ミリ秒に短縮されました。 OmniXtremeのオープンソース化は、具現化AIにおけるフローマッチング技術の強力なスケーラビリティを実証するだけでなく、ヒューマノイドロボットが孤立した技能の再現から、汎用的かつ高精度な移動能力の獲得へと移行することを意味する。これは、業界が複雑な実世界環境において堅牢な制御システムを開発するための、極めて重要な技術的枠組みを確立するものである。
中国サイバー空間管理局、AI生成およびフィクションのショート動画へのタグ付けを義務化
中国サイバー空間管理局は、ショート動画コンテンツの表示を標準化するための包括的な計画を打ち出し、プラットフォームに対し「AI生成コンテンツ」を含む6つの必須タグの表示を義務付けた。これにより、ショート動画のガバナンスにおいて、透明性の確保が義務付けられる新たな時代が幕を開けた。コンテンツの出所が不明確であったり、事実と虚構の区別が困難であったりするといった問題に対処するため、規制当局は、Douyi
テキスト翻訳で知られるDeepLが、今度は音声翻訳に注力している
テキスト翻訳ツールで知られる翻訳企業DeepLは本日、カスタムアプリケーションを通じて、会議やモバイル・ウェブ上の会話、現場担当者のグループディスカッションといった場面に対応する音声翻訳スイートをリリースした。 また同社は、外部の開発者や企業がコールセンターなどの特定のユースケースに合わせてDeepLの技術を応用できるようにするAPIも導入した。「長年にわたりテキスト翻訳に注力してきた私たちにとっ
タラットのAI会議メモは、クラウドではなく、お使いのデバイスに保存されます
評価額2億5000万ドルに達するAI搭載ノートアプリ「Granola」は、テック系スタートアップの創業者やベンチャーキャピタリストの間で人気を集めている。しかし、ある開発者は、サブスクリプション制ではなく、一度きりの料金で利用でき、よりプライバシーが守られ、完全にローカルで動作する代替アプリへの需要を見出していた。そのビジョンから生まれたのが、新しいMacアプリ「Talat」だ。イングランドのヨー





家






