OpenClaw 的 AReaL v1.0 框架可實現人工智慧代理的並行訓練
3月4日,螞蟻集團與清華大學合作,發布了開源強化的學習訓練框架 AReaL v1.0 的穩定版。此次發布的核心目標是實現「代理的一鍵式強化學習訓練接入」。該框架無需修改代碼,相容於多種代理框架,並能讓智能代理立即開始強化學習訓練。
自2026年初以來,智能代理(Agents)持續保持強勁的成長動能。LangChain、Claude Code 和 OpenClaw 等框架雖發展迅速,卻凸顯出兩大關鍵瓶頸。首先,訓練門檻過高:現有智能代理框架採用各異的介面,整合時往往需要大量適配程式碼。 其次,智能代理缺乏持續演進能力:多數依賴初始訓練階段產生的固定模型權重。一旦部署,便無法針對特定情境進一步優化,其能力在發布時即已達到上限。
AReaL 是首個完全異步、訓練與推論解耦的大型強化的學習系統。它使代理能透過與真實世界任務的互動,接收反饋並持續精進決策。v1.0 版本讓任何代理都能無需修改即可連接強化的學習訓練。透過在代理與訓練系統之間插入代理工作層,開發人員只需將單一請求地址重新導向,即可啟用訓練。

(圖:無縫整合至代理程式中的 AReaL 異步訓練架構)
以廣受歡迎的 OpenClaw 框架為例。開發者只需將 OpenClaw 配置中的 `base_url` 和 `api_key` 指向 AReaL 閘道,其 OpenClaw 代理便會連接到強化的學習訓練。代理會繼續正常執行任務,同時使用者會定期對其表現進行評分。AReaL 會自動收集這些訓練資料並在後台更新模型,使代理能夠透過持續使用自主進化。
AReaL v1.0 版本同時推出了原生訓練引擎 Archon。該引擎基於 PyTorch 的原生功能,實現了完整的 5D 並行處理——涵蓋資料、管線、張量、上下文及專家並行處理——從而降低了安裝與除錯的門檻。此外,它還提供多種訓練與推論的後端選項,便於在不同環境中靈活部署。 值得注意的是,這個複雜的分散式系統僅耗費一個人月便從零開始開發並完成驗證。在 32 天內,近百萬行程式碼經過修改,完整實現了 Archon 引擎,使其能夠訓練擁有十億參數的專家混合模型(Mixture-of-Experts, MoE)。
這項效率突破的關鍵在於 AReaL 整合的 AI 輔助開發系統,該系統能自動化處理高度複雜的工程任務。

AReaL v1.0 具備 AI 輔助開發工作流程,提供從規劃、編碼到驗證及 PR 建立的端到端支援。在處理 MoE 並行化、記憶體優化及演算法實作等核心模組時,專用的 AI 程式設計助理將扮演資深專家角色。它在程式碼變更過程中提供及時且精準的指導,確保每項修改的正確性。 AReaL 的 AI 輔助程式設計不僅僅是生產力工具;它能夠在複雜的基礎設施專案中承擔「可交付成果」的研發工作,開創了 AI 基礎設施工程的下一代範式。
AReaL 團隊表示,將持續針對訓練引擎、易用性及多模態代理訓練進行迭代。AReaL v1.0 的程式碼與文件現已於 inclusionAI 社群中開源。
· GitHub 儲存庫:https://github.com/inclusionAI/AReaL
· 相關論文:https://arxiv.org/abs/2505.24298
相關文章
WordPress.com 現已允許 AI 代理程式撰寫並發布文章,還有更多功能
廣受歡迎的網站託管與發佈平台 WordPress.com 現正積極導入 AI 代理程式——此舉可能重塑網路的樣貌與使用體驗。該公司於週五宣布,將允許 AI 代理程式在客戶網站上起草、編輯及發佈內容,同時也能管理留言、更新與修正元資料,並透過標籤和分類來整理內容。所有這些操作皆透過一個介面進行控制,網站擁有者只需使用自然語言指令說明其需求即可。憑藉這些新功能,網站幾乎可以完全由人工指導的 AI 代理
Anthropic 的實驗性 AI「Claude」在電子商務測試中完成了談判與交易
隨著人工智慧的快速發展,Anthropic 上週五悄悄推出了一項名為「Project Deal」的內部實驗,展現了人工智慧在電子商務領域的潛力。該實驗讓其人工智慧模型 Claude 在封閉的市場環境中自主處理買賣及價格協商,並涉及真實的金融交易。實驗的核心是一個建構於 Slack 平台上的內部市場,Claude 在其中同時擔任買方與賣方的談判代表。它首先訪談了 69 名員工,以收集他們的買賣意圖及
DeepSeek Code 即將推出
隨著人工智慧技術的加速發展,DeepSeek 正處於一個令人振奮的轉捩點。這家人工智慧公司最近透露,已獲得超過 700 億元的資金。管理層強調,公司致力於突破性的人工智慧研究,而非追求眼前的商業利益。這一戰略轉向表明 DeepSeek 將全力投入新產品的開發,尤其是眾人矚目的 DeepSeek Code。DeepSeek Code 的規劃已逐漸成形,該公司職缺頁面已發布數個相關職位,例如「Agen
相關專題推薦
評論 (1)
0/500
3月4日,螞蟻集團與清華大學合作,發布了開源強化的學習訓練框架 AReaL v1.0 的穩定版。此次發布的核心目標是實現「代理的一鍵式強化學習訓練接入」。該框架無需修改代碼,相容於多種代理框架,並能讓智能代理立即開始強化學習訓練。
自2026年初以來,智能代理(Agents)持續保持強勁的成長動能。LangChain、Claude Code 和 OpenClaw 等框架雖發展迅速,卻凸顯出兩大關鍵瓶頸。首先,訓練門檻過高:現有智能代理框架採用各異的介面,整合時往往需要大量適配程式碼。 其次,智能代理缺乏持續演進能力:多數依賴初始訓練階段產生的固定模型權重。一旦部署,便無法針對特定情境進一步優化,其能力在發布時即已達到上限。
AReaL 是首個完全異步、訓練與推論解耦的大型強化的學習系統。它使代理能透過與真實世界任務的互動,接收反饋並持續精進決策。v1.0 版本讓任何代理都能無需修改即可連接強化的學習訓練。透過在代理與訓練系統之間插入代理工作層,開發人員只需將單一請求地址重新導向,即可啟用訓練。

(圖:無縫整合至代理程式中的 AReaL 異步訓練架構)
以廣受歡迎的 OpenClaw 框架為例。開發者只需將 OpenClaw 配置中的 `base_url` 和 `api_key` 指向 AReaL 閘道,其 OpenClaw 代理便會連接到強化的學習訓練。代理會繼續正常執行任務,同時使用者會定期對其表現進行評分。AReaL 會自動收集這些訓練資料並在後台更新模型,使代理能夠透過持續使用自主進化。
AReaL v1.0 版本同時推出了原生訓練引擎 Archon。該引擎基於 PyTorch 的原生功能,實現了完整的 5D 並行處理——涵蓋資料、管線、張量、上下文及專家並行處理——從而降低了安裝與除錯的門檻。此外,它還提供多種訓練與推論的後端選項,便於在不同環境中靈活部署。 值得注意的是,這個複雜的分散式系統僅耗費一個人月便從零開始開發並完成驗證。在 32 天內,近百萬行程式碼經過修改,完整實現了 Archon 引擎,使其能夠訓練擁有十億參數的專家混合模型(Mixture-of-Experts, MoE)。
這項效率突破的關鍵在於 AReaL 整合的 AI 輔助開發系統,該系統能自動化處理高度複雜的工程任務。

AReaL v1.0 具備 AI 輔助開發工作流程,提供從規劃、編碼到驗證及 PR 建立的端到端支援。在處理 MoE 並行化、記憶體優化及演算法實作等核心模組時,專用的 AI 程式設計助理將扮演資深專家角色。它在程式碼變更過程中提供及時且精準的指導,確保每項修改的正確性。 AReaL 的 AI 輔助程式設計不僅僅是生產力工具;它能夠在複雜的基礎設施專案中承擔「可交付成果」的研發工作,開創了 AI 基礎設施工程的下一代範式。
AReaL 團隊表示,將持續針對訓練引擎、易用性及多模態代理訓練進行迭代。AReaL v1.0 的程式碼與文件現已於 inclusionAI 社群中開源。
· GitHub 儲存庫:https://github.com/inclusionAI/AReaL
· 相關論文:https://arxiv.org/abs/2505.24298
WordPress.com 現已允許 AI 代理程式撰寫並發布文章,還有更多功能
廣受歡迎的網站託管與發佈平台 WordPress.com 現正積極導入 AI 代理程式——此舉可能重塑網路的樣貌與使用體驗。該公司於週五宣布,將允許 AI 代理程式在客戶網站上起草、編輯及發佈內容,同時也能管理留言、更新與修正元資料,並透過標籤和分類來整理內容。所有這些操作皆透過一個介面進行控制,網站擁有者只需使用自然語言指令說明其需求即可。憑藉這些新功能,網站幾乎可以完全由人工指導的 AI 代理
Anthropic 的實驗性 AI「Claude」在電子商務測試中完成了談判與交易
隨著人工智慧的快速發展,Anthropic 上週五悄悄推出了一項名為「Project Deal」的內部實驗,展現了人工智慧在電子商務領域的潛力。該實驗讓其人工智慧模型 Claude 在封閉的市場環境中自主處理買賣及價格協商,並涉及真實的金融交易。實驗的核心是一個建構於 Slack 平台上的內部市場,Claude 在其中同時擔任買方與賣方的談判代表。它首先訪談了 69 名員工,以收集他們的買賣意圖及
DeepSeek Code 即將推出
隨著人工智慧技術的加速發展,DeepSeek 正處於一個令人振奮的轉捩點。這家人工智慧公司最近透露,已獲得超過 700 億元的資金。管理層強調,公司致力於突破性的人工智慧研究,而非追求眼前的商業利益。這一戰略轉向表明 DeepSeek 將全力投入新產品的開發,尤其是眾人矚目的 DeepSeek Code。DeepSeek Code 的規劃已逐漸成形,該公司職缺頁面已發布數個相關職位,例如「Agen





首頁






