Xiaomi、高精度VLAモデルのトレーニング後の全プロセスをオープンソース化
Xiaomiは、視覚・言語・動作(VLA)大規模モデル「Xiaomi-Robotics-0」のトレーニング後の全プロセスを公開し、実世界での応用に向けてオープンソース化した。この取り組みは、Xiaomiの「エンボディド・インテリジェンス」分野における大きな進展であり、最小限のデータでロボットが複雑な操作スキルを効率的に習得できるよう設計されている。
20時間で「藁の中の針」を習得
研究チームは、事前学習済みの基盤を活用し、実ロボットでのポストトレーニングにタスク固有のデータをわずか20時間分のみ使用しました。これにより、ロボットはイヤホンをケースに正確に挿入するという困難な操作を実行できるようになりました。このタスクには卓越した空間認識精度が求められ、極めて摩擦の少ない表面によって生じる位置ずれを補正する必要があります。
このモデルは、1ミリメートル未満の許容誤差内で位置合わせを実現し、動作のずれをリアルタイムで補正できる。この滑らかで連続的な動作は、高精度な組立作業における「Xiaomi-Robotics-0」の大きな可能性を浮き彫りにしている。

オープンソース・エコシステムが生産性を加速
このモデルを実用的で即戦力となるツールに変えるため、Xiaomiはモデルの重みだけでなく、技術レポートや完全なソースコードもオープンソース化しました。この包括的なエンドツーエンドの公開により、具現化された知能(エンボディド・インテリジェンス)を探求する開発者の参入障壁が大幅に低減されます。
本モデルはすでに主要な国際ベンチマークで高い性能を発揮しており、世界中で最も多くダウンロードされているモデルの一つにランクインしています。Xiaomiはトレーニング後のプロセスを公開することで、世界中の開発者が協力してロボットの知覚および実行ロジックを洗練できるようにし、AIロボットの実際の生産現場や日常生活への統合を加速させます。
プロジェクトウェブサイト:https://robotics.xiaomi.com/xiaomi-robotics-0.html
オープンソースコード:https://github.com/XiaomiRobotics/Xiaomi-Robotics-0
関連記事
Anthropic社の実験用AI「Claude」が、Eコマースのテストにおいて交渉と取引を完了した
人工知能(AI)が急速に進化する中、Anthropicは先週金曜日、「Project Deal」と呼ばれる社内実験をひっそりと開始し、EコマースにおけるAIの可能性を披露した。この実験では、同社のAIモデル「Claude」が、実際の金銭取引を伴うクローズドな市場環境において、購入、販売、価格交渉を自律的に行うよう設計された。実験の中核となったのは、Slack上に構築された社内マーケットプレイスであ
DeepSeek Code、まもなくリリースへ
AI技術の進展が加速する中、DeepSeekは今、まさに刺激的な転換点を迎えています。同社は最近、700億元を超える資金調達に成功したことを明らかにしました。経営陣は、目先の商業的利益よりも、画期的なAI研究への取り組みを重視する姿勢を強調しています。この戦略的転換は、新製品、とりわけ待望の「DeepSeek Code」の開発に全力を注ぐというDeepSeekの決意を示しています。DeepSeek
マスク氏の「Grok」:1.5兆のパラメータとカーソルコードの統合――ゲームチェンジャーか、それともブラフか?
イーロン・マスクがついに動き出した。AI開発競争において、OpenAIとAnthropicは加速している一方、xAIは出遅れているようだ。マスクはたびたび「Claude」に対抗する意向を表明してきたが、Grok4.Xシリーズへの度重なるアップデートにもかかわらず、結果は理論上は良好に見えても実用面では不十分であり、その差はほとんど縮まっていない。しかし、今回、彼には新たな切り札がある。マスクはX(
関連特集おすすめ
コメント (0)
0/500
Xiaomiは、視覚・言語・動作(VLA)大規模モデル「Xiaomi-Robotics-0」のトレーニング後の全プロセスを公開し、実世界での応用に向けてオープンソース化した。この取り組みは、Xiaomiの「エンボディド・インテリジェンス」分野における大きな進展であり、最小限のデータでロボットが複雑な操作スキルを効率的に習得できるよう設計されている。
20時間で「藁の中の針」を習得
研究チームは、事前学習済みの基盤を活用し、実ロボットでのポストトレーニングにタスク固有のデータをわずか20時間分のみ使用しました。これにより、ロボットはイヤホンをケースに正確に挿入するという困難な操作を実行できるようになりました。このタスクには卓越した空間認識精度が求められ、極めて摩擦の少ない表面によって生じる位置ずれを補正する必要があります。
このモデルは、1ミリメートル未満の許容誤差内で位置合わせを実現し、動作のずれをリアルタイムで補正できる。この滑らかで連続的な動作は、高精度な組立作業における「Xiaomi-Robotics-0」の大きな可能性を浮き彫りにしている。

オープンソース・エコシステムが生産性を加速
このモデルを実用的で即戦力となるツールに変えるため、Xiaomiはモデルの重みだけでなく、技術レポートや完全なソースコードもオープンソース化しました。この包括的なエンドツーエンドの公開により、具現化された知能(エンボディド・インテリジェンス)を探求する開発者の参入障壁が大幅に低減されます。
本モデルはすでに主要な国際ベンチマークで高い性能を発揮しており、世界中で最も多くダウンロードされているモデルの一つにランクインしています。Xiaomiはトレーニング後のプロセスを公開することで、世界中の開発者が協力してロボットの知覚および実行ロジックを洗練できるようにし、AIロボットの実際の生産現場や日常生活への統合を加速させます。
プロジェクトウェブサイト:https://robotics.xiaomi.com/xiaomi-robotics-0.html
オープンソースコード:https://github.com/XiaomiRobotics/Xiaomi-Robotics-0
Anthropic社の実験用AI「Claude」が、Eコマースのテストにおいて交渉と取引を完了した
人工知能(AI)が急速に進化する中、Anthropicは先週金曜日、「Project Deal」と呼ばれる社内実験をひっそりと開始し、EコマースにおけるAIの可能性を披露した。この実験では、同社のAIモデル「Claude」が、実際の金銭取引を伴うクローズドな市場環境において、購入、販売、価格交渉を自律的に行うよう設計された。実験の中核となったのは、Slack上に構築された社内マーケットプレイスであ
DeepSeek Code、まもなくリリースへ
AI技術の進展が加速する中、DeepSeekは今、まさに刺激的な転換点を迎えています。同社は最近、700億元を超える資金調達に成功したことを明らかにしました。経営陣は、目先の商業的利益よりも、画期的なAI研究への取り組みを重視する姿勢を強調しています。この戦略的転換は、新製品、とりわけ待望の「DeepSeek Code」の開発に全力を注ぐというDeepSeekの決意を示しています。DeepSeek
マスク氏の「Grok」:1.5兆のパラメータとカーソルコードの統合――ゲームチェンジャーか、それともブラフか?
イーロン・マスクがついに動き出した。AI開発競争において、OpenAIとAnthropicは加速している一方、xAIは出遅れているようだ。マスクはたびたび「Claude」に対抗する意向を表明してきたが、Grok4.Xシリーズへの度重なるアップデートにもかかわらず、結果は理論上は良好に見えても実用面では不十分であり、その差はほとんど縮まっていない。しかし、今回、彼には新たな切り札がある。マスクはX(





家






