選項
首頁
消息
Google推出設備端Gemini AI模型用於機器人

Google推出設備端Gemini AI模型用於機器人

2025-07-08
0

Google DeepMind揭曉Gemini Robotics On-Device以實現離線機器人控制

Google DeepMind剛剛在機器人領域發布了一項令人振奮的更新—Gemini Robotics On-Device,這是一款新型語言模型,讓機器人能夠在無需網路連接的情況下執行任務。這基於他們早先於三月發布的Gemini Robotics模型,但關鍵升級在於:本地處理

開發者現在可以通過自然語言提示微調機器人動作,使機器人更容易適應不同任務。Google聲稱其性能幾乎與雲端版本相當,並超越其他設備端模型(儘管未具體說明是哪些模型)。

圖片來源:Google

現實世界的機器人技能:從洗衣到流水線作業

在展示中,運行此模型的機器人成功完成了以下任務:

  • 解開袋子拉鍊
  • 折疊衣服
  • 適應新物件(如在工業流水線上組裝零件)

該模型最初為ALOHA機器人進行訓練,後來適配到以下機器人:

  • Franka FR3(雙臂工業機器人)
  • Apptronik的Apollo人形機器人

Gemini Robotics SDK:通過展示訓練機器人

Google還宣布了Gemini Robotics SDK,允許開發者使用50-100次任務展示MuJoCo物理模擬器中訓練機器人。這可能加速機器人學習在現實世界中的應用。

更宏大的願景:AI進軍機器人領域

Google並非這場競賽中的唯一參與者:

  • Nvidia正在為人形機器人構建基礎模型
  • Hugging Face正在開發開放模型—以及實際的機器人
  • RLWRLD(一家韓國初創公司)正在開發機器人基礎模型

AI驅動的機器人的未來正在升溫—而且這一切正在離線、設備端、實時發生。


想要更多科技洞見?
加入我們在馬薩諸塞州波士頓(7月15日)舉辦的TechCrunch Disrupt,深入探討AI、機器人及風險投資趨勢。全階段通行證可節省200美元以上,與來自Precursor Ventures、NEA、Index Ventures及Underscore VC的領袖交流。

👉 立即註冊

相關文章
Google tests Audio Overviews for Search queries Google tests Audio Overviews for Search queries Google Search Introduces Audio Overviews for Hands-Free LearningGoogle just rolled out an experimental new feature—Audio Overviews—giving users another way to consume search results. The feature, first tested in NotebookLM (Google’s AI-powered research tool), is now available in Google Search Labs,
New Study Reveals How Much Data LLMs Actually Memorize New Study Reveals How Much Data LLMs Actually Memorize How Much Do AI Models Actually Memorize? New Research Reveals Surprising InsightsWe all know that large language models (LLMs) like ChatGPT, Claude, and Gemini are trained on enormous datasets—trillions of words from books, websites, code, and even multimedia like images and audio. But what exactly
Google Introduces New AI and Accessibility Upgrades for Android and Chrome Google Introduces New AI and Accessibility Upgrades for Android and Chrome Google Expands AI and Accessibility Features for Android and ChromeGoogle just dropped some exciting updates for Android and Chrome, making them smarter and more accessible than ever. The biggest highlight? TalkBack, Android’s built-in screen reader, now lets users ask Gemini AI questions about imag
評論 (0)
0/200
回到頂部
OR