Google推出設備端Gemini AI模型用於機器人
Google DeepMind揭曉Gemini Robotics On-Device以實現離線機器人控制
Google DeepMind剛剛在機器人領域發布了一項令人振奮的更新—Gemini Robotics On-Device,這是一款新型語言模型,讓機器人能夠在無需網路連接的情況下執行任務。這基於他們早先於三月發布的Gemini Robotics模型,但關鍵升級在於:本地處理。
開發者現在可以通過自然語言提示微調機器人動作,使機器人更容易適應不同任務。Google聲稱其性能幾乎與雲端版本相當,並超越其他設備端模型(儘管未具體說明是哪些模型)。

圖片來源:Google 現實世界的機器人技能:從洗衣到流水線作業
在展示中,運行此模型的機器人成功完成了以下任務:
- 解開袋子拉鍊
- 折疊衣服
- 適應新物件(如在工業流水線上組裝零件)
該模型最初為ALOHA機器人進行訓練,後來適配到以下機器人:
- Franka FR3(雙臂工業機器人)
- Apptronik的Apollo人形機器人
Gemini Robotics SDK:通過展示訓練機器人
Google還宣布了Gemini Robotics SDK,允許開發者使用50-100次任務展示在MuJoCo物理模擬器中訓練機器人。這可能加速機器人學習在現實世界中的應用。
更宏大的願景:AI進軍機器人領域
Google並非這場競賽中的唯一參與者:
- Nvidia正在為人形機器人構建基礎模型
- Hugging Face正在開發開放模型—以及實際的機器人
- RLWRLD(一家韓國初創公司)正在開發機器人基礎模型
AI驅動的機器人的未來正在升溫—而且這一切正在離線、設備端、實時發生。
想要更多科技洞見?
加入我們在馬薩諸塞州波士頓(7月15日)舉辦的TechCrunch Disrupt,深入探討AI、機器人及風險投資趨勢。全階段通行證可節省200美元以上,與來自Precursor Ventures、NEA、Index Ventures及Underscore VC的領袖交流。
👉 立即註冊
相關文章
Google I/O 2026 發表了與 Gmail 收件匣的語音互動功能
Google 持續將人工智慧整合至您的收件匣中。在週二舉行的 IO 2026 開發者大會上,該公司透過對話式人工智慧擴充了 Gmail 的「AI 收件匣」功能,讓使用者能針對收件匣內容提出問題,而非僅依賴搜尋關鍵字。據 Google 表示,這項由 Gemini AI 驅動的工具名為「Gmail Live」,能協助使用者快速找出埋藏在收件匣中的資訊。圖片來源:Google舉例來說,您可能需要查詢即將
Google 在印度的 Chrome 瀏覽器中推出 Gemini
週三,Google 宣布將把 Chrome 瀏覽器的 Gemini 整合功能擴展至新地區,包括印度、加拿大和新西蘭。此項更新讓桌面版使用者能透過側邊欄存取 Gemini,藉此向 Google 的 AI 聊天機器人詢問螢幕上的內容、從 Gmail、Keep、Drive 和 YouTube 檢索資訊,以及比較不同分頁的內容。隨著此次擴展,Gemini 除英語及近期新增的 Chrome 支援語言外,亦將
YouTube 將 AI 深度偽造偵測功能擴展至政治人物、政府官員及記者
週二,YouTube 宣布將其深度偽造(deepfake)偵測技術擴展至特定群體,包括政府官員、政治候選人及記者。該工具能識別由人工智慧生成的肖像,並允許試點計畫的參與者要求移除其認為違反 YouTube 政策且未經授權的內容。該偵測系統在經過前期測試階段後,去年首度向約 400 萬名 YouTube 合作夥伴計畫的創作者推出。與 YouTube 現有的版權內容識別系統(Content ID)類似
相關專題推薦
評論 (3)
0/500
Super cool that robots can now think offline with Gemini! Imagine them zipping around without Wi-Fi, making decisions on the fly. Can’t wait to see this in action at home! 🤖
This is wild! Robots running Gemini AI offline? Google’s pushing the future hard. Can’t wait to see how this shakes up industries, but I’m low-key worried about robots getting too smart too fast. 😅
Google DeepMind揭曉Gemini Robotics On-Device以實現離線機器人控制
Google DeepMind剛剛在機器人領域發布了一項令人振奮的更新—Gemini Robotics On-Device,這是一款新型語言模型,讓機器人能夠在無需網路連接的情況下執行任務。這基於他們早先於三月發布的Gemini Robotics模型,但關鍵升級在於:本地處理。
開發者現在可以通過自然語言提示微調機器人動作,使機器人更容易適應不同任務。Google聲稱其性能幾乎與雲端版本相當,並超越其他設備端模型(儘管未具體說明是哪些模型)。

現實世界的機器人技能:從洗衣到流水線作業
在展示中,運行此模型的機器人成功完成了以下任務:
- 解開袋子拉鍊
- 折疊衣服
- 適應新物件(如在工業流水線上組裝零件)
該模型最初為ALOHA機器人進行訓練,後來適配到以下機器人:
- Franka FR3(雙臂工業機器人)
- Apptronik的Apollo人形機器人
Gemini Robotics SDK:通過展示訓練機器人
Google還宣布了Gemini Robotics SDK,允許開發者使用50-100次任務展示在MuJoCo物理模擬器中訓練機器人。這可能加速機器人學習在現實世界中的應用。
更宏大的願景:AI進軍機器人領域
Google並非這場競賽中的唯一參與者:
- Nvidia正在為人形機器人構建基礎模型
- Hugging Face正在開發開放模型—以及實際的機器人
- RLWRLD(一家韓國初創公司)正在開發機器人基礎模型
AI驅動的機器人的未來正在升溫—而且這一切正在離線、設備端、實時發生。
想要更多科技洞見?
加入我們在馬薩諸塞州波士頓(7月15日)舉辦的TechCrunch Disrupt,深入探討AI、機器人及風險投資趨勢。全階段通行證可節省200美元以上,與來自Precursor Ventures、NEA、Index Ventures及Underscore VC的領袖交流。
👉 立即註冊
Google I/O 2026 發表了與 Gmail 收件匣的語音互動功能
Google 持續將人工智慧整合至您的收件匣中。在週二舉行的 IO 2026 開發者大會上,該公司透過對話式人工智慧擴充了 Gmail 的「AI 收件匣」功能,讓使用者能針對收件匣內容提出問題,而非僅依賴搜尋關鍵字。據 Google 表示,這項由 Gemini AI 驅動的工具名為「Gmail Live」,能協助使用者快速找出埋藏在收件匣中的資訊。圖片來源:Google舉例來說,您可能需要查詢即將
Google 在印度的 Chrome 瀏覽器中推出 Gemini
週三,Google 宣布將把 Chrome 瀏覽器的 Gemini 整合功能擴展至新地區,包括印度、加拿大和新西蘭。此項更新讓桌面版使用者能透過側邊欄存取 Gemini,藉此向 Google 的 AI 聊天機器人詢問螢幕上的內容、從 Gmail、Keep、Drive 和 YouTube 檢索資訊,以及比較不同分頁的內容。隨著此次擴展,Gemini 除英語及近期新增的 Chrome 支援語言外,亦將
YouTube 將 AI 深度偽造偵測功能擴展至政治人物、政府官員及記者
週二,YouTube 宣布將其深度偽造(deepfake)偵測技術擴展至特定群體,包括政府官員、政治候選人及記者。該工具能識別由人工智慧生成的肖像,並允許試點計畫的參與者要求移除其認為違反 YouTube 政策且未經授權的內容。該偵測系統在經過前期測試階段後,去年首度向約 400 萬名 YouTube 合作夥伴計畫的創作者推出。與 YouTube 現有的版權內容識別系統(Content ID)類似
Super cool that robots can now think offline with Gemini! Imagine them zipping around without Wi-Fi, making decisions on the fly. Can’t wait to see this in action at home! 🤖
This is wild! Robots running Gemini AI offline? Google’s pushing the future hard. Can’t wait to see how this shakes up industries, but I’m low-key worried about robots getting too smart too fast. 😅





首頁






