クラウドを活用したNvidiaのヒューマノイドロボティクス進展
NVIDIAは人型ロボティクスの領域にフルスロットルで突入しており、その動きにはブレがありません。台湾でのComputex 2025展示会では、ロボティクス開発の地平線を再定義する一連の革新が発表されました。その中でも注目すべきは、NVIDIA Isaac GR00T N1.5です。これは、人型ロボットの推論やスキルに関するオープンで完全にカスタマイズ可能な基礎モデルの最新バージョンです。また、同社はIsaac GR00T-Dreams(合成動作データ生成用の設計図)と強力なNVIDIA Blackwellシステムを同時に発表しました。これらの技術は、人型ロボットの開発を加速させるでしょう。
先進的な人型ロボットやロボティクス開発企業、例えばAgility Robotics、Boston Dynamics、Fourier、Foxlink、Galbot、Mentee Robotics、NEURA Robotics、General Robotics、Skild AI、XPENG Roboticsなどはすでに参加しており、NVIDIAのIsaacプラットフォーム技術を利用して、人型ロボットの可能性を広げています。
NVIDIAのCEOであるジェンセン・フアンは興奮を抑えきれず、「物理AIとロボティクスは次の産業革命を引き起こすだろう。ロボット用のAI頭脳、シミュレーションワールド、または基礎モデルのAIスーパーコンピューターなど、NVIDIAはロボティクス開発の各段階に必要なビルディングブロックを提供する」と述べました。
新しいIsaac GR00Tデータ生成設計図がデータギャップを埋める
自分専属の人型ロボットを持ちたいと思ったことはありませんか?Computexでのフアンの基調講演では、NVIDIA Isaac GR00T-Dreamsが紹介されました。これはゲームチェンジャーとなる設計図で、大量の合成動作データやニューラル軌跡を生み出します。このデータは物理AI開発者にとってまさに宝の山であり、ロボットに新しい行動を教え、変化する環境に適応させる助けとなります。
プロセスは、開発者がCosmos Predictワールドファウンデーションモデル(WFM)を事後学習させることから始まります。そして、単一の画像を入力として受け取り、GR00T-Dreamsはロボットが新しい設定で新しいタスクに取り組む様子を映像で生成します。さらに、ロボットが新しいタスクを学ぶための「アクショントークン」と呼ばれる小さなデータピースを抽出します。
GR00T-Dreamsは、以前NVIDIA GTCカンファレンスで発表されたIsaac GR00T-Mimic設計図と連携して働きます。GR00T-MimicはNVIDIA OmniverseとCosmosを使用して既存のデータを向上させますが、GR00T-DreamsはCosmosを使って全く新しいデータをゼロから生成します。
AIおよびディスティンギッシュドサイエンティストのジム・ファンはプレスブリーフィングで熱狂的に語りました。「NVIDIAには非常に強力なロボティクス戦略があり、それはジェンセンが言う『三つのコンピュータ問題』に基づいています。OVXコンピュータはシミュレーションとグラフィックシミュレーション物理エンジンを処理し、DGXコンピュータは基礎モデルの訓練に必要なデータを生成します。このデータはHXコンピュータに展開され、人型ロボットなどのエッジプラットフォームで運用されます。」
ファンはGr00tを物理AIとロボットベースのワークフローのライフサイクルと呼んで誇らしげに述べ、「これは三つのコンピュータ問題の具体例です。」彼はProject Gr00tの二大進化、Gr00t DreamsとGr00t N1.5について強調し、ジョークを交えて「その名前にもとても誇りを持っています」と付け加えました。
Gr00t Dreamsに関しては、ファンはそれをロボットを訓練するためのビデオ生成モデルと説明し、多数のビデオを展示しました。これらはすべてNVIDIA Cosmosによって生成され、「我々は高度なビデオ生成モデルであるCosmosを人型ロボティクスに適用する方法を見つけました。高レベルで言えば、まず我々のラボで撮影されたロボットのビデオをCosmosに微調整し、その結果、ラボのロボットに特化したモデルを作成します。その後、この微調整されたモデルを多様なプロンプトを与えることで無限に近い夢のようなビデオを生成できます。これが、実際のロボットデータセットを補完する合成データになります。多くの皆さんも知っている通り、実際のロボットでデータを集めることは非常に時間がかかり、コストがかかります。なぜなら、ロボットは一日に24時間しか稼働できないからです。しかし、Gr00t Dreamsによる新しいワークフローとアルゴリズムのおかげで、この物理的な制約を破り、比類ない規模でデータを増やせるようになりました。」
その結果、キュウリを拾ったり、オレンジジュースを注いだり、ラップトップを開けたりといった、ロボットがこれまで訓練されていない行動を確実に行うことが可能となりました。ファンは指摘しましたが、これらの行動はCosmosによるビデオモデルのトレーニングのおかげで、ロボットが「これらの動詞の物理的意味を理解し、それらを実行できるようになった」というのです。
新しいIsaac GR00Tモデルが人型ロボットの開発を進化させる
Isaac GR00T-Dreams設計図はただの話ではありません。わずか36時間でGR00T N1.5を開発するために合成トレーニングデータを生成し、これを行うのに通常は3ヶ月近くかかるタスクを大幅に短縮しました。GR00T N1.5は、新たな環境やワークスペース構成への適応能力が向上し、ユーザー指示を通じて物体を認識できるようになりました。このアップデートにより、一般的なタスク(例えば物の仕分けや収納)での成功率が大幅に向上し、今年後半にリリースされるJetson Thor上で展開可能です。
GR00T N1.5基礎モデルは合成データ生成パイプラインにGr00t Dreamsを統合しています。ファンによれば、NVIDIAは視覚言語バックボーンをアップグレードしており、GR00T N1.5はより優れた適応力と言語指示との互換性を持つ予定です。
GR00T N1.5はComputexで初披露され、6月9日までにオープンソースとしてリリースされます。一方、Gr00t Dreamsについては、ファンはタイムラインを微調整中ですが、可能な限りオープンソースを目指すことを強調しました。
GR00T Nの初期採用者にはAeiRobot、Foxlink、Lightwheel、NEURA Roboticsが含まれます。AeiRobotはALICE4に自然言語指示を理解させ、工業環境での複雑なピック&プレイスワークフローを実行できるようにしています。Foxlinkグループは、工業用ロボットマニピュレーターの柔軟性と効率を向上させるために活用しています。Lightwheelは工場での人型ロボットの迅速な導入を支援するために合成データを検証しています。NEURA Roboticsは、家庭向け自動化の開発を加速するためにモデルを試験しています。
新しいロボットシミュレーションとデータ生成フレームワークがトレーニングパイプラインを加速
高度な技能を持つ人型ロボットを作るのはハードウェアだけではありません。彼らに多様なデータを与えることが重要で、これはコストがかさむだけでなく、収集と処理に時間がかかります。さらに、現実世界でのロボットのテストには独自の課題やリスクがあります。
これらのギャップを埋めるために、N
関連記事
新しい研究がLLMが実際にどれだけデータを記憶するかを明らかに
AIモデルは実際にどれだけ記憶するのか? 新しい研究が驚くべき洞察を明らかにChatGPT、Claude、Geminiなどの大規模言語モデル(LLM)は、本、ウェブサイト、コード、そして画像や音声などのマルチメディアからなる膨大なデータセット—何兆もの単語—で訓練されています。しかし、そのデータはどうなるのでしょうか? これらのモデルは本当に言語を「理解」しているのか、それとも記憶した断片をただ繰
NvidiaがAI工場デジタルツインのためのOmniverse Blueprintを提供
NVIDIA、AI工場デジタルツインのためのOmniverse Blueprintの大幅な拡張を発表2025年の台北でのComputexでの主要な発表において、NVIDIAはAI工場デジタルツインのためのOmniverse Blueprintの範囲を大幅に拡大し、現在プレビューとして利用可能です。このアップデートは、AI駆動の製造施設に対する前例のない需要の急増を背景に、デジタルインフラの可能性の
MIPSからエクサフロップスへわずか数十年で:計算能力は爆発的に増大し、AIを革新する
||最近のNvidia GTCカンファレンスで、テクノロジー大手は画期的な成果を発表しました:1エクサフロップに達する初のシングルラックサーバーシステムです。これは驚異的な1秒あたり10億の10億(ビリオン・ビリオン)の浮動小数点演算(FLOPS)です。この偉業は、Nvidiaの最新GB200 NVL72システムによって実現され、最先端のBlackwellグラフィックス処理ユニット(GPU)を搭載
コメント (0)
0/200
NVIDIAは人型ロボティクスの領域にフルスロットルで突入しており、その動きにはブレがありません。台湾でのComputex 2025展示会では、ロボティクス開発の地平線を再定義する一連の革新が発表されました。その中でも注目すべきは、NVIDIA Isaac GR00T N1.5です。これは、人型ロボットの推論やスキルに関するオープンで完全にカスタマイズ可能な基礎モデルの最新バージョンです。また、同社はIsaac GR00T-Dreams(合成動作データ生成用の設計図)と強力なNVIDIA Blackwellシステムを同時に発表しました。これらの技術は、人型ロボットの開発を加速させるでしょう。
先進的な人型ロボットやロボティクス開発企業、例えばAgility Robotics、Boston Dynamics、Fourier、Foxlink、Galbot、Mentee Robotics、NEURA Robotics、General Robotics、Skild AI、XPENG Roboticsなどはすでに参加しており、NVIDIAのIsaacプラットフォーム技術を利用して、人型ロボットの可能性を広げています。
NVIDIAのCEOであるジェンセン・フアンは興奮を抑えきれず、「物理AIとロボティクスは次の産業革命を引き起こすだろう。ロボット用のAI頭脳、シミュレーションワールド、または基礎モデルのAIスーパーコンピューターなど、NVIDIAはロボティクス開発の各段階に必要なビルディングブロックを提供する」と述べました。
新しいIsaac GR00Tデータ生成設計図がデータギャップを埋める
自分専属の人型ロボットを持ちたいと思ったことはありませんか?Computexでのフアンの基調講演では、NVIDIA Isaac GR00T-Dreamsが紹介されました。これはゲームチェンジャーとなる設計図で、大量の合成動作データやニューラル軌跡を生み出します。このデータは物理AI開発者にとってまさに宝の山であり、ロボットに新しい行動を教え、変化する環境に適応させる助けとなります。
プロセスは、開発者がCosmos Predictワールドファウンデーションモデル(WFM)を事後学習させることから始まります。そして、単一の画像を入力として受け取り、GR00T-Dreamsはロボットが新しい設定で新しいタスクに取り組む様子を映像で生成します。さらに、ロボットが新しいタスクを学ぶための「アクショントークン」と呼ばれる小さなデータピースを抽出します。
GR00T-Dreamsは、以前NVIDIA GTCカンファレンスで発表されたIsaac GR00T-Mimic設計図と連携して働きます。GR00T-MimicはNVIDIA OmniverseとCosmosを使用して既存のデータを向上させますが、GR00T-DreamsはCosmosを使って全く新しいデータをゼロから生成します。
AIおよびディスティンギッシュドサイエンティストのジム・ファンはプレスブリーフィングで熱狂的に語りました。「NVIDIAには非常に強力なロボティクス戦略があり、それはジェンセンが言う『三つのコンピュータ問題』に基づいています。OVXコンピュータはシミュレーションとグラフィックシミュレーション物理エンジンを処理し、DGXコンピュータは基礎モデルの訓練に必要なデータを生成します。このデータはHXコンピュータに展開され、人型ロボットなどのエッジプラットフォームで運用されます。」
ファンはGr00tを物理AIとロボットベースのワークフローのライフサイクルと呼んで誇らしげに述べ、「これは三つのコンピュータ問題の具体例です。」彼はProject Gr00tの二大進化、Gr00t DreamsとGr00t N1.5について強調し、ジョークを交えて「その名前にもとても誇りを持っています」と付け加えました。
Gr00t Dreamsに関しては、ファンはそれをロボットを訓練するためのビデオ生成モデルと説明し、多数のビデオを展示しました。これらはすべてNVIDIA Cosmosによって生成され、「我々は高度なビデオ生成モデルであるCosmosを人型ロボティクスに適用する方法を見つけました。高レベルで言えば、まず我々のラボで撮影されたロボットのビデオをCosmosに微調整し、その結果、ラボのロボットに特化したモデルを作成します。その後、この微調整されたモデルを多様なプロンプトを与えることで無限に近い夢のようなビデオを生成できます。これが、実際のロボットデータセットを補完する合成データになります。多くの皆さんも知っている通り、実際のロボットでデータを集めることは非常に時間がかかり、コストがかかります。なぜなら、ロボットは一日に24時間しか稼働できないからです。しかし、Gr00t Dreamsによる新しいワークフローとアルゴリズムのおかげで、この物理的な制約を破り、比類ない規模でデータを増やせるようになりました。」
その結果、キュウリを拾ったり、オレンジジュースを注いだり、ラップトップを開けたりといった、ロボットがこれまで訓練されていない行動を確実に行うことが可能となりました。ファンは指摘しましたが、これらの行動はCosmosによるビデオモデルのトレーニングのおかげで、ロボットが「これらの動詞の物理的意味を理解し、それらを実行できるようになった」というのです。
新しいIsaac GR00Tモデルが人型ロボットの開発を進化させる
Isaac GR00T-Dreams設計図はただの話ではありません。わずか36時間でGR00T N1.5を開発するために合成トレーニングデータを生成し、これを行うのに通常は3ヶ月近くかかるタスクを大幅に短縮しました。GR00T N1.5は、新たな環境やワークスペース構成への適応能力が向上し、ユーザー指示を通じて物体を認識できるようになりました。このアップデートにより、一般的なタスク(例えば物の仕分けや収納)での成功率が大幅に向上し、今年後半にリリースされるJetson Thor上で展開可能です。
GR00T N1.5基礎モデルは合成データ生成パイプラインにGr00t Dreamsを統合しています。ファンによれば、NVIDIAは視覚言語バックボーンをアップグレードしており、GR00T N1.5はより優れた適応力と言語指示との互換性を持つ予定です。
GR00T N1.5はComputexで初披露され、6月9日までにオープンソースとしてリリースされます。一方、Gr00t Dreamsについては、ファンはタイムラインを微調整中ですが、可能な限りオープンソースを目指すことを強調しました。
GR00T Nの初期採用者にはAeiRobot、Foxlink、Lightwheel、NEURA Roboticsが含まれます。AeiRobotはALICE4に自然言語指示を理解させ、工業環境での複雑なピック&プレイスワークフローを実行できるようにしています。Foxlinkグループは、工業用ロボットマニピュレーターの柔軟性と効率を向上させるために活用しています。Lightwheelは工場での人型ロボットの迅速な導入を支援するために合成データを検証しています。NEURA Roboticsは、家庭向け自動化の開発を加速するためにモデルを試験しています。
新しいロボットシミュレーションとデータ生成フレームワークがトレーニングパイプラインを加速
高度な技能を持つ人型ロボットを作るのはハードウェアだけではありません。彼らに多様なデータを与えることが重要で、これはコストがかさむだけでなく、収集と処理に時間がかかります。さらに、現実世界でのロボットのテストには独自の課題やリスクがあります。
これらのギャップを埋めるために、N












