Google推出設備端Gemini AI模型用於機器人
Google DeepMind揭曉Gemini Robotics On-Device以實現離線機器人控制
Google DeepMind剛剛在機器人領域發布了一項令人振奮的更新—Gemini Robotics On-Device,這是一款新型語言模型,讓機器人能夠在無需網路連接的情況下執行任務。這基於他們早先於三月發布的Gemini Robotics模型,但關鍵升級在於:本地處理。
開發者現在可以通過自然語言提示微調機器人動作,使機器人更容易適應不同任務。Google聲稱其性能幾乎與雲端版本相當,並超越其他設備端模型(儘管未具體說明是哪些模型)。

圖片來源:Google 現實世界的機器人技能:從洗衣到流水線作業
在展示中,運行此模型的機器人成功完成了以下任務:
- 解開袋子拉鍊
- 折疊衣服
- 適應新物件(如在工業流水線上組裝零件)
該模型最初為ALOHA機器人進行訓練,後來適配到以下機器人:
- Franka FR3(雙臂工業機器人)
- Apptronik的Apollo人形機器人
Gemini Robotics SDK:通過展示訓練機器人
Google還宣布了Gemini Robotics SDK,允許開發者使用50-100次任務展示在MuJoCo物理模擬器中訓練機器人。這可能加速機器人學習在現實世界中的應用。
更宏大的願景:AI進軍機器人領域
Google並非這場競賽中的唯一參與者:
- Nvidia正在為人形機器人構建基礎模型
- Hugging Face正在開發開放模型—以及實際的機器人
- RLWRLD(一家韓國初創公司)正在開發機器人基礎模型
AI驅動的機器人的未來正在升溫—而且這一切正在離線、設備端、實時發生。
想要更多科技洞見?
加入我們在馬薩諸塞州波士頓(7月15日)舉辦的TechCrunch Disrupt,深入探討AI、機器人及風險投資趨勢。全階段通行證可節省200美元以上,與來自Precursor Ventures、NEA、Index Ventures及Underscore VC的領袖交流。
👉 立即註冊
相關文章
Google tests Audio Overviews for Search queries
Google Search Introduces Audio Overviews for Hands-Free LearningGoogle just rolled out an experimental new feature—Audio Overviews—giving users another way to consume search results. The feature, first tested in NotebookLM (Google’s AI-powered research tool), is now available in Google Search Labs,
New Study Reveals How Much Data LLMs Actually Memorize
How Much Do AI Models Actually Memorize? New Research Reveals Surprising InsightsWe all know that large language models (LLMs) like ChatGPT, Claude, and Gemini are trained on enormous datasets—trillions of words from books, websites, code, and even multimedia like images and audio. But what exactly
Google Introduces New AI and Accessibility Upgrades for Android and Chrome
Google Expands AI and Accessibility Features for Android and ChromeGoogle just dropped some exciting updates for Android and Chrome, making them smarter and more accessible than ever. The biggest highlight? TalkBack, Android’s built-in screen reader, now lets users ask Gemini AI questions about imag
評論 (0)
0/200
Google DeepMind揭曉Gemini Robotics On-Device以實現離線機器人控制
Google DeepMind剛剛在機器人領域發布了一項令人振奮的更新—Gemini Robotics On-Device,這是一款新型語言模型,讓機器人能夠在無需網路連接的情況下執行任務。這基於他們早先於三月發布的Gemini Robotics模型,但關鍵升級在於:本地處理。
開發者現在可以通過自然語言提示微調機器人動作,使機器人更容易適應不同任務。Google聲稱其性能幾乎與雲端版本相當,並超越其他設備端模型(儘管未具體說明是哪些模型)。
現實世界的機器人技能:從洗衣到流水線作業
在展示中,運行此模型的機器人成功完成了以下任務:
- 解開袋子拉鍊
- 折疊衣服
- 適應新物件(如在工業流水線上組裝零件)
該模型最初為ALOHA機器人進行訓練,後來適配到以下機器人:
- Franka FR3(雙臂工業機器人)
- Apptronik的Apollo人形機器人
Gemini Robotics SDK:通過展示訓練機器人
Google還宣布了Gemini Robotics SDK,允許開發者使用50-100次任務展示在MuJoCo物理模擬器中訓練機器人。這可能加速機器人學習在現實世界中的應用。
更宏大的願景:AI進軍機器人領域
Google並非這場競賽中的唯一參與者:
- Nvidia正在為人形機器人構建基礎模型
- Hugging Face正在開發開放模型—以及實際的機器人
- RLWRLD(一家韓國初創公司)正在開發機器人基礎模型
AI驅動的機器人的未來正在升溫—而且這一切正在離線、設備端、實時發生。
想要更多科技洞見?
加入我們在馬薩諸塞州波士頓(7月15日)舉辦的TechCrunch Disrupt,深入探討AI、機器人及風險投資趨勢。全階段通行證可節省200美元以上,與來自Precursor Ventures、NEA、Index Ventures及Underscore VC的領袖交流。
👉 立即註冊



0/200
頭號新聞
2025頂級AI影片生成器:Pika Labs與其他對比
Openai增強了AI語音助手以進行更好的聊天
Gemini 2.5 Pro現在比Claude,GPT-4O更便宜,更便宜
體驗AI驅動的I/O填字遊戲:經典文字遊戲中的現代轉折
創始人說
NotebookLM在全球範圍內擴展,添加幻燈片並增強了事實檢查
NVIDIA首席執行官闡明了對DeepSeek市場影響的誤解
谷歌AI躍升內幕:Gemini 2.5 思維更深、表達更智能且編碼更快
AI語音克隆:掌握語音轉換的終極指南
對美國數據中心的調整可以解鎖76 GW的新電源容量
更多
精選
更多

Claude
認識Claude:您的AI助手智能工作是否希望您有一個知識淵博的同事,他隨時準備

Cici AI
你是否曾經好奇過Cici AI到底是什麼?讓我告訴你,它不僅僅是一個普通的AI聊

Gemini
有沒有想過關於雙子座的嗡嗡聲是什麼?讓我為您分解。雙子座是由Google Dee

DeepSeek
曾經想過什麼是全部意見?讓我為您分解。 DeepSeek不僅是另一個AI平台;無

Grok
聽說過Grok嗎?這是Xai的Nifty AI助手,這一切都是為了給您直接的勺子

ChatGPT
有沒有想過什麼是什麼?好吧,讓我為您分解它 - 聊天不僅僅是您在技術領域的普通喬

OpenAI
有沒有想過Openai周圍的嗡嗡聲是什麼?好吧,讓我為您分解。 Openai不僅

Tencent Hunyuan
騰訊hunyuan-large,是嗎?就像騰訊技術巨頭開發的AI模型的瑞士軍刀一

Qwen AI
有沒有想過Qwen AI是什麼?好吧,讓我向您介紹阿里巴巴雲的這顆寶石。 Qwe

Runway
有沒有想過如何將您的常規視頻剪輯變成非凡的東西?好吧,讓我向您介紹跑道,這是一個