DeepMindの新AIモデルはロボット上でネイティブに動作し、より高速なパフォーマンスを実現
グーグル・ディープマインドは、インターネット接続を必要とせずに機能するジェミニ・ロボティクスのAIモデルのオンデバイス版をリリースする。この視覚言語行動モデル(VLA)には、3月に導入されたのと同じ器用な機能が含まれているが、グーグルは、ロボット上で直接実行できるほどコンパクトで効率的になったと述べている。
ジェミニ・ロボティクスのフラッグシップ・モデルは、ロボットが多様な物理的作業を行うことを可能にする。新しいシナリオの汎化、指示の理解と反応、微細な運動制御を伴う活動をサポートする。
グーグル・ディープマインドのロボティクス責任者であるカロリナ・パラダによると、ジェミニ・ロボティクスのオリジナルモデルは、デバイス上とクラウド上の両方で動作するハイブリッド方式を採用している。しかし、この新しいデバイス専用モデルでは、ユーザーはフラッグシップ・バージョンとほぼ同じ性能を提供するオフライン機能にアクセスすることができる。

Apptronikの人型ロボットApolloに続くGoogleのALOHAシステム. GIF:グーグルオンデバイス・モデルは、複数のタスクを即座に処理し、不慣れな状況にも「わずか50~100回のデモンストレーションで」適応できる、とパラダ氏は説明する。グーグルは当初、このモデルを自社のALOHAロボットでのみトレーニングしたが、アプトロニックのヒューマノイド型ロボットApolloやデュアルアーム型ロボットFranka FR3など、他のロボットプラットフォームにも適応させることに成功した。
「ジェミニ・ロボティクスのハイブリッド・モデルの方がよりパワフルであることに変わりはありませんが、このオンデバイス・バージョンのパフォーマンスには本当に感心させられました」とパラダ氏は付け加える。「エントリーモデルとして、あるいはインターネットが不安定な環境での理想的なソリューションとして利用できます。また、厳格なセキュリティ・プロトコルを持つ組織にも適しています」。
新モデルに加えて、グーグルは開発者がテストやカスタマイズを行うためのソフトウェア開発キット(SDK)を公開している。
オンデバイスのGemini Roboticsモデルとそれに付随するSDKは、グーグルが潜在的な安全性への懸念への対応と最小化を続ける間、当初は信頼できる一部のテスターに提供される。
関連記事
WordPress.comでは、AIエージェントによる投稿の作成や公開が可能になりました。その他にもさまざまな機能が追加されています。
人気のウェブホスティング・パブリッシングプラットフォームであるWordPress.comが、AIエージェントの導入に乗り出した。この動きは、ウェブのあり方を一変させる可能性がある。同社は金曜日、AIエージェントが顧客のウェブサイト上でコンテンツの下書き作成、編集、公開を行うほか、コメントの管理、メタデータの更新・修正、タグやカテゴリを用いたコンテンツの整理も可能になると発表した。これらすべての操作
カカオ・モビリティ、物理AIに向けたレベル4自動運転のロードマップを提示
カカオ・モビリティは、フィジカルAI戦略の一環として、レベル4の自動運転技術を自社開発する計画だ。ソウルCOEXで開催された「2026ワールドITショー」のカンファレンスにおいて、カカオモビリティのフィジカルAI部門長兼副社長であるキム・ジンギュ氏がロードマップを発表した。同氏の講演は、フィジカルAI時代におけるモビリティプラットフォームを軸とした自動運転サービスに焦点を当てたものだった。聯合
Google、インドでChrome向け「Gemini」の提供を開始
水曜日、GoogleはChrome向けGeminiの統合機能を、インド、カナダ、ニュージーランドを含む新たな地域へ拡大すると発表した。この展開により、デスクトップユーザーはサイドバーからGeminiにアクセスできるようになり、画面上のコンテンツについてGoogleのAIチャットボットに質問したり、Gmail、Keep、Drive、YouTubeから情報を取得したり、タブの内容を比較したりすることが
関連特集おすすめ
コメント (1)
0/500
That's a huge step forward for robotics! On-device processing is finally catching up, but I'm kinda wondering how expensive the hardware will be - can small startups afford it? 🤔 Also, curious if offline functionality means it's less likely to be updated or influenced remotely, which might be a double-edged sword.
グーグル・ディープマインドは、インターネット接続を必要とせずに機能するジェミニ・ロボティクスのAIモデルのオンデバイス版をリリースする。この視覚言語行動モデル(VLA)には、3月に導入されたのと同じ器用な機能が含まれているが、グーグルは、ロボット上で直接実行できるほどコンパクトで効率的になったと述べている。
ジェミニ・ロボティクスのフラッグシップ・モデルは、ロボットが多様な物理的作業を行うことを可能にする。新しいシナリオの汎化、指示の理解と反応、微細な運動制御を伴う活動をサポートする。
グーグル・ディープマインドのロボティクス責任者であるカロリナ・パラダによると、ジェミニ・ロボティクスのオリジナルモデルは、デバイス上とクラウド上の両方で動作するハイブリッド方式を採用している。しかし、この新しいデバイス専用モデルでは、ユーザーはフラッグシップ・バージョンとほぼ同じ性能を提供するオフライン機能にアクセスすることができる。

オンデバイス・モデルは、複数のタスクを即座に処理し、不慣れな状況にも「わずか50~100回のデモンストレーションで」適応できる、とパラダ氏は説明する。グーグルは当初、このモデルを自社のALOHAロボットでのみトレーニングしたが、アプトロニックのヒューマノイド型ロボットApolloやデュアルアーム型ロボットFranka FR3など、他のロボットプラットフォームにも適応させることに成功した。
「ジェミニ・ロボティクスのハイブリッド・モデルの方がよりパワフルであることに変わりはありませんが、このオンデバイス・バージョンのパフォーマンスには本当に感心させられました」とパラダ氏は付け加える。「エントリーモデルとして、あるいはインターネットが不安定な環境での理想的なソリューションとして利用できます。また、厳格なセキュリティ・プロトコルを持つ組織にも適しています」。
新モデルに加えて、グーグルは開発者がテストやカスタマイズを行うためのソフトウェア開発キット(SDK)を公開している。
オンデバイスのGemini Roboticsモデルとそれに付随するSDKは、グーグルが潜在的な安全性への懸念への対応と最小化を続ける間、当初は信頼できる一部のテスターに提供される。
WordPress.comでは、AIエージェントによる投稿の作成や公開が可能になりました。その他にもさまざまな機能が追加されています。
人気のウェブホスティング・パブリッシングプラットフォームであるWordPress.comが、AIエージェントの導入に乗り出した。この動きは、ウェブのあり方を一変させる可能性がある。同社は金曜日、AIエージェントが顧客のウェブサイト上でコンテンツの下書き作成、編集、公開を行うほか、コメントの管理、メタデータの更新・修正、タグやカテゴリを用いたコンテンツの整理も可能になると発表した。これらすべての操作
Google、インドでChrome向け「Gemini」の提供を開始
水曜日、GoogleはChrome向けGeminiの統合機能を、インド、カナダ、ニュージーランドを含む新たな地域へ拡大すると発表した。この展開により、デスクトップユーザーはサイドバーからGeminiにアクセスできるようになり、画面上のコンテンツについてGoogleのAIチャットボットに質問したり、Gmail、Keep、Drive、YouTubeから情報を取得したり、タブの内容を比較したりすることが
That's a huge step forward for robotics! On-device processing is finally catching up, but I'm kinda wondering how expensive the hardware will be - can small startups afford it? 🤔 Also, curious if offline functionality means it's less likely to be updated or influenced remotely, which might be a double-edged sword.





家






