Generalist 推出適用於物理系統的 GEN-1 通用人工智慧模型

為了開發 GEN-1,Generalist 強化了訓練穩定性、打造了自訂核心、為即時推論設計了創新的分頁注意力方法、精進了訓練後處理技術,並改進了控制機制,以實現更流暢、更精準的操作。 | 來源:Generalist AI
Generalist AI 公司昨日發表了專為機器人設計的通用型 AI 模型 GEN-1。該公司表示,此系統將平均任務成功率提升至 99%,遠高於先前模型的 64%。據 Generalist 指出,該系統完成任務的速度約為現行方法的三倍,且每項任務僅需一小時的機器人數據即可達成這些成果。
成立於2024年的Generalist專注於開發適用於多功能機器人的具身基礎模型。總部位於加州聖馬刁的Generalist宣稱,GEN-1「為廣泛的應用領域開啟了商業可行性」。此次發布距離其GEN-0模型問世僅五個月,該公司曾表示GEN-0證實了機器人領域中存在規模定律。
儘管對該AI模型的進展持樂觀態度,Generalist也承認GEN-1無法解決所有任務。這家新創公司補充道,某些實際應用需達到超過99%的成功率,才能具備實用價值。
編者註:5月27日至28日於波士頓舉行的2026年機器人峰會暨博覽會(Robotics Summit & Expo)將設有專題講座,探討具身與物理人工智慧的開發。現已開放報名。
GEN-1 基於真實世界數據進行訓練,並從 GEN-0 進行規模擴展
Generalist AI 解釋道,GEN-1 基於 GEN-0 的基礎,透過進一步擴展與演算法改進,開始掌握基本任務。該模型是從頭開始,利用該公司包含 50 萬小時真實世界數據的資料集進行訓練。
透過 GEN-0,Generalist 證明了機器人學習能夠以泛化方式進行擴展,類似於語言模型中可見的可預測進展。該公司指出,其監測的每項零樣本任務均同時展現出進步。然而,該公司也承認該模型的表現「尚不足以進行商業部署」。
Generalist 表示,GEN-1 是數據與運算規模擴展的成果,並在演算法突破的推動下加速發展。該公司報告指出,部分任務的表現現已達到經濟上可行的實務應用所需門檻。
該公司指出,先前成功率超過 90% 的通用機器人模型,皆仰賴龐大、昂貴且難以擴展的遙控操作資料集。相較之下,GEN-0 與 GEN-1 的基礎模型在訓練過程中並未使用任何機器人專屬資料。
取而代之的是,該模型利用了人類在執行數百萬種活動時所佩戴的低成本穿戴式裝置所產生的數據。Generalist 表示,他們已證實這種預訓練方法無需龐大的遙控操作或模擬數據集,即可達到高水準的掌握能力。
Generalist 融合多項技術的進展
根據 Generalist AI 的說法,GEN-1 整合了能提升運算效率的預訓練創新技術。後訓練技術的進展、經驗學習(強化學習)、多模態人類引導,以及新的推論時方法,也都為在任何特定任務上取得更高表現做出了貢獻。
除了這些改進之外,該公司表示,與前代產品相比,GEN-1 的運算規模有了顯著提升。「它展現了快速學習新任務、適應新環境,以及展現物理常識的能力,」Generalist 指出。
該公司聲稱 GEN-1 是一款資料效率高的學習者。在某些測試中,該模型僅使用十分之一的工作特定資料和更少的微調步驟,便達到了與 GEN-0 相當的表現。
Generalist 解釋道,由於預訓練資料集不含機器人資料,當 GEN-1 適應新任務時,它會同時首次學習該特定機器人的具身化表現與任務本身。
GEN-1 提升可靠性與即興應變能力
「具身基礎模型必須具備可靠性、速度,並能從意外情況中恢復,」Generalist 表示。關於可靠性,該公司指出 GEN-1 能在長時間內以高可靠性水準執行多項任務,且無需人工干預。
該公司針對六項任務展示了 GEN-1 的表現:組裝汽車零件超過一小時、連續摺疊 T 恤 86 次、連續維修掃地機器人超過 200 次、連續包裝積木超過 1,800 次、連續摺疊紙箱超過 200 次,以及不間斷地包裝手機超過 100 次。
未經預訓練、從零開始訓練的任務表現不佳,平均成功率僅為 19%。針對這些任務進行微調的 GEN-0 模型成功率達到 64%。Generalist 表示,GEN-1 達到了生產級別的成功率,平均為 99%。
Generalist 表示,這些模型能夠對不可預見的情境做出具創造性的回應。以汽車零件組裝為例,若墊片因碰撞而偏離正確位置,機器人可以將其放下並重新抓取、透過外在靈巧性將其部分插入縫隙,甚至使用另一隻手進行雙手協同抓取。
Generalist 表示,若 T 恤等大型可變形物體出現意外變形,模型也能自行找出恢復方法。「這些行為遠超出訓練資料的分布範圍,能直接協助從罕見且意外的事件中恢復,」該公司指出。
Generalist 模型加速任務完成
Generalist AI 表示,GEN-1 完成任務的速度約為當前示範領域最先進技術 (SOTA) 的三倍。該模型能動態應對新的物體物理特性。
舉例來說,GEN-1 能在 12.1 秒內組裝一個紙箱。Generalist 表示,這比之前的 SOTA 快了 2.8 倍——無論是 GEN-0 還是 π0,在處理相同紙箱時都花了約 34 秒。GEN-1 還能以 15.5 秒的時間將手機裝入保護殼,運作速度是 GEN-0 的 2.8 倍。
據 Generalist 表示,這些速度提升歸功於數項關鍵技術。該模型透過經驗學習,並藉由「諧波推理」(Harmonic Reasoning)實現了推論能力的進化。
該公司同時歸功於其資料蒐集裝置,這些裝置讓模型能接觸到大量來自高速完成各類任務的預訓練資料,從而將從一般情境中獲得的知識轉移至相關動態情境。Generalist 將此與傳統遙控操作系統進行對比,指出後者因缺乏力回饋、延遲及可見度問題,自然會產生較慢且較不流暢的資料。
「開發 GEN-1 充滿挑戰——我們重新設計了分散式訓練基礎架構,使其原生支援數百億位元組的物理互動數據,」Generalist AI 表示。該公司宣布,早期體驗合作夥伴現已可取得該模型的使用權限。
相關文章
MoveIt Pro 9.0 升級版:強化感知與遙控功能
根據 PickNik 的說法,MoveIt Pro 9.0 讓機器人能夠在幾何結構不斷變化且表面多樣的環境中高效運作。 | 來源:PickNik RoboticsPickNik Inc. 已推出 MoveIt Pro 9.0,這是其用於開發機械手臂應用程式的平台最新版本。此更新引入了改良的感知轉動功能,並針對遙控操作與訓練資料收集系統進行了全面重新設計。這家總部位於科羅拉多州博爾德的公司表示,這些
SS Innovations 開發用於無人機配送的外科手術機器人
SSi Vimana 航空無人機系統旨在將關鍵醫療照護直接送達戰場上的受傷士兵手中。 | 來源:SS Innovations InternationalSS Innovations International Inc. 近期於印度新德里舉辦的「全球多專科機器人手術會議」上,展示了四款目前正在開發中的手術機器人系統。這些新平台包括 SSi Vimana 航空無人機系統、SSi Avtara 人形手術
Pebble Time 2 最終設計揭曉
隨著Pebble回歸初心,我們現在獲得了即將推出的Pebble Time 2官方預覽,該產品預計將於今年稍晚出貨給客戶。(今年三月曾首度曝光設計草圖,但當時仍屬初步階段。)Core Devices執行長Eric Migicovsky今日透過個人部落格與YouTube頻道公布設計方案。Time 2將提供四種配色選擇,但最終方案尚未定案——Migicovsky強調公司正積極徵求Pebble社群的意見回
相關專題推薦
評論 (0)
0/500

為了開發 GEN-1,Generalist 強化了訓練穩定性、打造了自訂核心、為即時推論設計了創新的分頁注意力方法、精進了訓練後處理技術,並改進了控制機制,以實現更流暢、更精準的操作。 | 來源:Generalist AI
Generalist AI 公司昨日發表了專為機器人設計的通用型 AI 模型 GEN-1。該公司表示,此系統將平均任務成功率提升至 99%,遠高於先前模型的 64%。據 Generalist 指出,該系統完成任務的速度約為現行方法的三倍,且每項任務僅需一小時的機器人數據即可達成這些成果。
成立於2024年的Generalist專注於開發適用於多功能機器人的具身基礎模型。總部位於加州聖馬刁的Generalist宣稱,GEN-1「為廣泛的應用領域開啟了商業可行性」。此次發布距離其GEN-0模型問世僅五個月,該公司曾表示GEN-0證實了機器人領域中存在規模定律。
儘管對該AI模型的進展持樂觀態度,Generalist也承認GEN-1無法解決所有任務。這家新創公司補充道,某些實際應用需達到超過99%的成功率,才能具備實用價值。
編者註:5月27日至28日於波士頓舉行的2026年機器人峰會暨博覽會(Robotics Summit & Expo)將設有專題講座,探討具身與物理人工智慧的開發。現已開放報名。
GEN-1 基於真實世界數據進行訓練,並從 GEN-0 進行規模擴展
Generalist AI 解釋道,GEN-1 基於 GEN-0 的基礎,透過進一步擴展與演算法改進,開始掌握基本任務。該模型是從頭開始,利用該公司包含 50 萬小時真實世界數據的資料集進行訓練。
透過 GEN-0,Generalist 證明了機器人學習能夠以泛化方式進行擴展,類似於語言模型中可見的可預測進展。該公司指出,其監測的每項零樣本任務均同時展現出進步。然而,該公司也承認該模型的表現「尚不足以進行商業部署」。
Generalist 表示,GEN-1 是數據與運算規模擴展的成果,並在演算法突破的推動下加速發展。該公司報告指出,部分任務的表現現已達到經濟上可行的實務應用所需門檻。
該公司指出,先前成功率超過 90% 的通用機器人模型,皆仰賴龐大、昂貴且難以擴展的遙控操作資料集。相較之下,GEN-0 與 GEN-1 的基礎模型在訓練過程中並未使用任何機器人專屬資料。
取而代之的是,該模型利用了人類在執行數百萬種活動時所佩戴的低成本穿戴式裝置所產生的數據。Generalist 表示,他們已證實這種預訓練方法無需龐大的遙控操作或模擬數據集,即可達到高水準的掌握能力。
Generalist 融合多項技術的進展
根據 Generalist AI 的說法,GEN-1 整合了能提升運算效率的預訓練創新技術。後訓練技術的進展、經驗學習(強化學習)、多模態人類引導,以及新的推論時方法,也都為在任何特定任務上取得更高表現做出了貢獻。
除了這些改進之外,該公司表示,與前代產品相比,GEN-1 的運算規模有了顯著提升。「它展現了快速學習新任務、適應新環境,以及展現物理常識的能力,」Generalist 指出。
該公司聲稱 GEN-1 是一款資料效率高的學習者。在某些測試中,該模型僅使用十分之一的工作特定資料和更少的微調步驟,便達到了與 GEN-0 相當的表現。
Generalist 解釋道,由於預訓練資料集不含機器人資料,當 GEN-1 適應新任務時,它會同時首次學習該特定機器人的具身化表現與任務本身。
GEN-1 提升可靠性與即興應變能力
「具身基礎模型必須具備可靠性、速度,並能從意外情況中恢復,」Generalist 表示。關於可靠性,該公司指出 GEN-1 能在長時間內以高可靠性水準執行多項任務,且無需人工干預。
該公司針對六項任務展示了 GEN-1 的表現:組裝汽車零件超過一小時、連續摺疊 T 恤 86 次、連續維修掃地機器人超過 200 次、連續包裝積木超過 1,800 次、連續摺疊紙箱超過 200 次,以及不間斷地包裝手機超過 100 次。
未經預訓練、從零開始訓練的任務表現不佳,平均成功率僅為 19%。針對這些任務進行微調的 GEN-0 模型成功率達到 64%。Generalist 表示,GEN-1 達到了生產級別的成功率,平均為 99%。
Generalist 表示,這些模型能夠對不可預見的情境做出具創造性的回應。以汽車零件組裝為例,若墊片因碰撞而偏離正確位置,機器人可以將其放下並重新抓取、透過外在靈巧性將其部分插入縫隙,甚至使用另一隻手進行雙手協同抓取。
Generalist 表示,若 T 恤等大型可變形物體出現意外變形,模型也能自行找出恢復方法。「這些行為遠超出訓練資料的分布範圍,能直接協助從罕見且意外的事件中恢復,」該公司指出。
Generalist 模型加速任務完成
Generalist AI 表示,GEN-1 完成任務的速度約為當前示範領域最先進技術 (SOTA) 的三倍。該模型能動態應對新的物體物理特性。
舉例來說,GEN-1 能在 12.1 秒內組裝一個紙箱。Generalist 表示,這比之前的 SOTA 快了 2.8 倍——無論是 GEN-0 還是 π0,在處理相同紙箱時都花了約 34 秒。GEN-1 還能以 15.5 秒的時間將手機裝入保護殼,運作速度是 GEN-0 的 2.8 倍。
據 Generalist 表示,這些速度提升歸功於數項關鍵技術。該模型透過經驗學習,並藉由「諧波推理」(Harmonic Reasoning)實現了推論能力的進化。
該公司同時歸功於其資料蒐集裝置,這些裝置讓模型能接觸到大量來自高速完成各類任務的預訓練資料,從而將從一般情境中獲得的知識轉移至相關動態情境。Generalist 將此與傳統遙控操作系統進行對比,指出後者因缺乏力回饋、延遲及可見度問題,自然會產生較慢且較不流暢的資料。
「開發 GEN-1 充滿挑戰——我們重新設計了分散式訓練基礎架構,使其原生支援數百億位元組的物理互動數據,」Generalist AI 表示。該公司宣布,早期體驗合作夥伴現已可取得該模型的使用權限。
SS Innovations 開發用於無人機配送的外科手術機器人
SSi Vimana 航空無人機系統旨在將關鍵醫療照護直接送達戰場上的受傷士兵手中。 | 來源:SS Innovations InternationalSS Innovations International Inc. 近期於印度新德里舉辦的「全球多專科機器人手術會議」上,展示了四款目前正在開發中的手術機器人系統。這些新平台包括 SSi Vimana 航空無人機系統、SSi Avtara 人形手術
Pebble Time 2 最終設計揭曉
隨著Pebble回歸初心,我們現在獲得了即將推出的Pebble Time 2官方預覽,該產品預計將於今年稍晚出貨給客戶。(今年三月曾首度曝光設計草圖,但當時仍屬初步階段。)Core Devices執行長Eric Migicovsky今日透過個人部落格與YouTube頻道公布設計方案。Time 2將提供四種配色選擇,但最終方案尚未定案——Migicovsky強調公司正積極徵求Pebble社群的意見回





首頁






