選項
首頁
新聞
我們如何建立新的雙子座機器人技術模型

我們如何建立新的雙子座機器人技術模型

2025-04-10
136

我們如何建立新的雙子座機器人技術模型

當 Google DeepMind 為其關於新款 Gemini 2.0 機器人專用模型的最新公告做準備時,機器人部門負責人卡羅琳娜·帕拉達(Carolina Parada)召集她的團隊,對技術進行最後一次檢查。

他們挑戰了一台雙臂 ALOHA 機器人——你知道的,那些研究人員愛用的靈活金屬手臂,擁有眾多關節和鉗狀手的機器人——讓它執行從未做過的任務,處理從未見過的物體。「我們隨機丟東西給它,比如把我的鞋子放在桌上,然後要求它把一些筆放進去,」卡羅琳娜回憶道。「機器人停頓了一秒鐘以理解指令,然後就去執行了。」

接下來,他們找到了一個玩具籃球框和球,挑戰機器人進行「灌籃」。卡羅琳娜看著它完美完成時,忍不住露出驕傲的笑容。

卡羅琳娜說,看著灌籃的瞬間真是個「哇」的時刻。

「我們一直在訓練模型,幫助機器人完成特定任務並理解自然語言,但這次?這真是個遊戲規則的改變者,」卡羅琳娜解釋道。「這台機器人完全沒有籃球或這個特定玩具的經驗。然而,它理解了『將球灌籃』這個複雜概念,並順利完成了。第一次就成功。

這台多功能機器人由 Gemini Robotics 模型驅動,該模型是專為機器人設計的新一批多模態模型的一部分。這些模型通過針對機器人的特定數據進行微調,增強了 Gemini 2.0,將物理動作與 Gemini 通常的多模態輸出(如文本、視頻和音頻)相結合。「這一里程碑為下一波機器人應用奠定了基礎,」Google 首席執行官桑達爾·皮查伊(Sundar Pichai)在 X 上揭曉新模型時說道。

Gemini Robotics 模型極其多功能、互動性強且通用,使機器人能夠在無需額外訓練的情況下應對新物體、環境和指令。這是一個重大突破,考慮到團隊的目標。

「我們的目標是創造具身 AI,驅動機器人幫助完成現實世界中的日常任務,」卡羅琳娜說,她對機器人的熱情源自小時候看的科幻卡通以及對自動化家務的夢想。「未來,機器人將成為我們與 AI 互動的另一種方式,就像我們的手機或電腦一樣——成為我們世界中的物理代理。」

為了讓機器人安全且高效地完成工作,它們需要兩項關鍵能力:理解與決策,以及行動能力。Gemini Robotics-ER,一種基於 Gemini 2.0 Flash 的「具身推理」模型,專注於前者。它能辨識環境中的元素,評估它們的大小和位置,預測移動它們所需的路徑和抓取方式,然後生成執行動作的代碼。我們現在正將此模型推廣給受信任的測試者和合作夥伴。

Google DeepMind 還推出了 Gemini Robotics,這是其頂級視覺-語言-動作模型,讓機器人能夠分析場景、與用戶互動並採取行動。它在機器人學家頭痛的領域——靈巧性——取得了巨大進展。「對我們人類來說是第二天性的事情,對機器人來說卻很困難,」卡羅琳娜指出。「靈巧性涉及空間推理和複雜的物理操作。在測試中,Gemini Robotics 為靈巧性設定了新基準,以流暢的動作和令人印象深刻的完成時間處理複雜的多步驟任務。」

Gemini Robotics-ER 在具身推理方面表現出色,擅長物體檢測、指向物體的特定部分、尋找匹配點以及 3D 物體檢測。

在 Gemini Robotics 的帶領下,機器人已經製作了沙拉、打包了孩子們的午餐、玩了井字遊戲,甚至還製作了一隻摺紙狐狸。

讓模型準備好應對廣泛的任務並非易事——主要是因為這違背了傳統上為單一特定任務訓練模型直到完美的做法。「我們選擇了廣泛任務學習,用大量任務訓練模型,」卡羅琳娜說。「我們認為,經過一段時間後,它們會開始泛化,我們的判斷是正確的。」

這兩款模型都能適應不同的具身形式,從研究型機器人如雙臂 ALOHA 到我們的合作夥伴 Apptronik 開發的人形機器人 Apollo。

這些模型能夠適應不同的形式,執行諸如打包午餐盒或擦拭白板等任務,適用於各種機器人身體。

這種適應性對於機器人可能承擔多種角色的未來至關重要。

「使用這些高度通用且能力強大的模型的機器人潛力巨大且令人興奮,」卡羅琳娜說。「它們在複雜、需要精確且非為人類設計的空間的行業中可能非常有幫助。它們還能讓以人為中心的空間,如我們的家,生活更輕鬆。這還有很長的路要走,但這些模型正在推動我們前進。」

看起來,家務的幫助可能即將到來——終有一天。

相關文章
WordPress.com 現已允許 AI 代理程式撰寫並發布文章,還有更多功能 WordPress.com 現已允許 AI 代理程式撰寫並發布文章,還有更多功能 廣受歡迎的網站託管與發佈平台 WordPress.com 現正積極導入 AI 代理程式——此舉可能重塑網路的樣貌與使用體驗。該公司於週五宣布,將允許 AI 代理程式在客戶網站上起草、編輯及發佈內容,同時也能管理留言、更新與修正元資料,並透過標籤和分類來整理內容。所有這些操作皆透過一個介面進行控制,網站擁有者只需使用自然語言指令說明其需求即可。憑藉這些新功能,網站幾乎可以完全由人工指導的 AI 代理
Kakao Mobility 概述了針對實體人工智慧的第 4 級自動駕駛路線圖 Kakao Mobility 概述了針對實體人工智慧的第 4 級自動駕駛路線圖 Kakao Mobility 計畫內部開發第 4 級自動駕駛技術,作為其實體人工智慧策略的一環。在首爾COEX舉行的2026年世界資訊科技展(World IT Show)會議上,Kakao Mobility副總裁兼實體AI部門負責人金鎮奎(Kim Jin-kyu)發表了該發展藍圖。他的演講聚焦於實體AI時代以移動平台為核心的自動駕駛服務。據韓聯社報導,這場名為「超越構想,付諸行動:AI 推動現
巴里·迪勒:隨著通用人工智慧(AGI)日益臨近,對山姆·奧特曼的信任已無關緊要 巴里·迪勒:隨著通用人工智慧(AGI)日益臨近,對山姆·奧特曼的信任已無關緊要 儘管近期有報導指出相反的看法,但億萬富翁媒體大亨巴里·迪勒並不認為 OpenAI 執行長山姆·奧特曼不可信。迪勒本週在《華爾街日報》的「萬物未來」會議上發言時,為奧特曼辯護;奧特曼此前曾遭到部分前同事和董事會成員指控,指稱他偶爾會採取操縱和欺騙手段。身為奧特曼好友的迪勒,當時正回應一個關於人們是否應信任奧特曼、以確保人工智慧造福人類的問題。具體而言,提問者探討了被稱為「通用人工智慧」(AGI)的理
相關專題推薦
文字轉語音 專為閱讀障礙設計的頂尖 AI 語音合成應用程式:協助學生提升學習與閱讀效率
專為閱讀障礙設計的頂尖 AI 語音合成應用程式:協助學生提升學習與閱讀效率

探索 2026 年最新精選、專為閱讀障礙者設計的頂級 AI 語音合成(TTS)應用程式。我們的專家評比將免費與付費工具進行對照,重點介紹能提升閱讀效率與學習成效的強大功能。發掘這些必試且能帶來革命性改變的解決方案,釋放學生的潛能。立即前往 XIX.AI 展開您的探索之旅。

10 個工具
xix.ai
漫畫創作 少年漫畫頂尖 AI 生成器:打造高張力動作場面與能量特效
少年漫畫頂尖 AI 生成器:打造高張力動作場面與能量特效

立即前往 XIX.AI,探索 2026 年最優秀的少年漫畫 AI 生成工具。我們精心挑選的頂級清單,匯集了能打造高張力動作場面與動態能量特效的強大工具。透過實際測試,比較免費與付費選項的差異。釋放您的創作潛能,今天就開始打造史詩級漫畫吧!

15 個工具
xix.ai
商業 最佳 AI 支出追蹤工具:掃描收據並自動分類公司開支
最佳 AI 支出追蹤工具:掃描收據並自動分類公司開支

2026 年最新最佳 AI 報銷管理工具:備受好評的解決方案,可自動掃描收據並分類企業支出。探索強大且顛覆傳統的解決方案,助您輕鬆管理報銷、精準追蹤財務,並簡化合規流程。我們精心整理並每週更新的免費與付費方案比較指南,將協助您找到最合適的選擇。透過 XIX.AI 的專家精選,釋放您的 AI 優勢。

10 個工具
xix.ai
商業 最佳 AI 招聘工具:篩選履歷與自動化安排候選人面試
最佳 AI 招聘工具:篩選履歷與自動化安排候選人面試

在 XIX.AI 探索 2026 年最新且評價最高的 AI 招聘工具。我們精心挑選的清單收錄了強大且具顛覆性的解決方案,可協助篩選履歷並自動化安排候選人面試。透過實際測試與每週更新的排行榜,比較免費與付費選項。立即找到最適合您的招聘助手,並優化您的招聘流程!

10 個工具
xix.ai
生產率 AI 個人健康與專注力教練:管理倦怠感並提升精神能量
AI 個人健康與專注力教練:管理倦怠感並提升精神能量

立即在 XIX.AI 探索 2026 年最佳 AI 個人健康與專注力教練。我們精心策劃的排行榜收錄了備受好評、能帶來革命性改變的工具,助您管理倦怠感並提升精神能量。透過實際使用心得,比較免費與付費方案的差異。立即開啟通往巔峰生產力與身心健康的道路。

10 個工具
xix.ai
聊天機器人 最受好評的 AI 浪漫聊天機器人:透過一貫的個性建立長期關係
最受好評的 AI 浪漫聊天機器人:透過一貫的個性建立長期關係

探索 2026 年最新、評價最高的 AI 浪漫聊天機器人,助您建立真摯且長久的連結。我們精心整理的清單包含功能強大且性格鮮明的聊天機器人、免費與付費版本的比較,以及實際測試結果。立即前往 XIX.AI 尋找您的完美伴侶,並開始建立這段關係吧。

10 個工具
xix.ai
評論 (24)
0/500
JoseAdams
JoseAdams 2026-01-07 06:30:30

Ces bras robotiques ALOHA sont impressionnants, mais je me demande vraiment quel sera leur coût réel pour les petites entreprises. L'article montre bien la partie technique, mais dans le monde réel, l'accès financier compte tout autant. C'est un peu inquiétant pour la compétitivité à long terme. 🤔

LarryEvans
LarryEvans 2025-11-12 20:30:35

Cet article sur les robots Gemini est fascinant ! 🤖 L'idée d'utiliser l'IA pour contrôler des bras robotisés comme l'ALOHA pourrait vraiment révolutionner l'automatisation industrielle. Mais ça me fait un peu peur aussi - est-ce qu'on va vers un monde où les humains seront remplacés par des machines trop intelligentes ? 😅

CarlGarcia
CarlGarcia 2025-09-19 12:30:33

Finalmente um modelo de robótica que parece promissor! 🤖 Mas confesso que fico pensando se esses braços robóticos vão substituir humanos em tarefas domésticas... Será que um dia vou ter um robô fazendo meu café da manhã? 😅

KeithLopez
KeithLopez 2025-08-09 01:01:00

The Gemini 2.0 robotics models sound like a game-changer! I’m curious how those bi-arm ALOHA robots handle real-world tasks—hope they don’t get too cocky with all that flexibility! 🤖

WilliamMiller
WilliamMiller 2025-04-14 08:57:22

Os novos modelos de robótica Gemini são de tirar o fôlego! Ver o robô ALOHA em ação foi como ver ficção científica se tornar realidade. Mas, o jargão técnico foi um pouco acima da minha compreensão. Poderia usar uma explicação mais simples para nós, não técnicos. Ainda assim, super legal! 🤖

StephenGreen
StephenGreen 2025-04-13 11:41:57

新しいジェミニロボティクスモデルは驚異的です!ALOHAロボットの動きを見るのは、SFが現実になったようでした。でも、技術用語が少し難しかったです。非技術者向けに簡単な説明が欲しいです。それでも、すごくクール!🤖

OR