OpenClaw 的 AReaL v1.0 框架支持并行 AI 代理训练
3月4日,蚂蚁集团与清华大学联合发布了开源强化学习训练框架AReaL v1.0的稳定版。此次发布的核心在于实现“智能体一键式强化学习训练”。该框架无需修改代码,兼容多种智能体框架,使智能体能够立即开始强化学习训练。
自2026年初以来,智能代理(Agents)一直保持着强劲的增长势头。LangChain、Claude Code和OpenClaw等框架虽发展迅速,但仍暴露出两大显著瓶颈。首先,训练门槛较高:现有智能代理框架采用各异的接口,集成时往往需要大量适配代码。 其次,智能体缺乏持续进化能力:大多数依赖初始训练阶段生成的固定模型权重。一旦部署,便无法针对特定场景进一步优化,其能力在发布时即已达到上限。
AReaL 是首个完全异步、训练与推理解耦的大规模强化学习系统。它使智能体能够通过与现实世界任务的交互接收反馈,并持续优化决策。v1.0 版本允许任何智能体无需修改即可连接到强化学习训练。通过在智能体与训练系统之间插入一个代理工作层,开发者只需重定向一个请求地址即可启用训练。

(图:无缝集成至代理的 AReaL 异步训练架构)
以广受欢迎的 OpenClaw 框架为例。开发者只需将 OpenClaw 配置中的 `base_url` 和 `api_key` 指向 AReaL 网关,其 OpenClaw 智能体便会连接到强化学习训练环境。智能体在继续正常执行任务的同时,用户会定期对其表现进行评分。AReaL 会自动收集这些训练数据并在后台更新模型,从而使智能体能够通过持续使用实现自主进化。
AReaL v1.0 版本还推出了原生训练引擎 Archon。该引擎基于 PyTorch 的原生能力构建,实现了数据、管道、张量、上下文和专家并行这五大维度的全并行处理,从而降低了安装和调试门槛。此外,它还提供了多种训练和推理后端选项,便于在不同环境中灵活部署。 令人惊叹的是,这一复杂的分布式系统仅用一个月的人力就从零开始开发并验证完成。在 32 天内,近百万行代码经过修改,全面实现了 Archon 引擎,使其能够训练数十亿参数的专家混合(MoE)模型。
这一效率突破背后的秘诀在于 AReaL 集成的 AI 辅助开发系统,该系统能够自动化处理高度复杂的工程任务。

AReaL v1.0 具备 AI 辅助开发工作流,提供从规划、编码到验证及 PR 创建的全流程支持。在处理 MoE 并行化、内存优化和算法实现等核心模块时,专用的 AI 编程助手将扮演资深专家的角色。它在代码修改过程中提供及时、精准的指导,确保每次修改的正确性。 AReaL的AI辅助编程不仅仅是一个生产力工具;它能够承担复杂基础设施项目中的“可交付成果”研发工作,开创了AI基础设施工程的下一个范式。
AReaL团队表示,他们将持续迭代训练引擎、用户体验以及多模态代理的训练。AReaL v1.0的代码和文档现已开源,发布于inclusionAI社区。
· GitHub 仓库:https://github.com/inclusionAI/AReaL
· 相关论文:https://arxiv.org/abs/2505.24298
相关文章
Anthropic公司的实验性人工智能Claude在电子商务测试中完成了谈判和交易
随着人工智能的飞速发展,Anthropic上周五悄然启动了一项名为“Project Deal”的内部实验,展示了人工智能在电子商务领域的潜力。该实验让其人工智能模型Claude在封闭的市场环境中自主处理买卖及价格谈判,并涉及真实的金融交易。实验的核心是一个基于Slack构建的内部市场,Claude在其中同时担任买卖双方的谈判代表。它首先对69名员工进行了访谈,收集了他们的买卖意向及个性化指示,随后
DeepSeek Code 即将发布
随着人工智能技术的加速发展,DeepSeek正处于一个激动人心的关键时刻。这家人工智能公司近日透露,已获得超过700亿元的融资。公司管理层强调,将致力于开创性的人工智能研究,而非追求眼前的商业利益。这一战略转型表明,DeepSeek将全力投入新产品的开发,尤其是备受期待的DeepSeek Code。DeepSeek Code的规划已初具雏形,公司招聘页面上已发布多个相关职位,例如“Agent Ha
马斯克的Grok:1.5万亿参数与光标代码吸收——颠覆性突破还是虚张声势?
埃隆·马斯克终于开始行动了。在人工智能编程竞赛中,OpenAI和Anthropic正加速前进,而xAI似乎有些落后。马斯克曾多次表示要与Claude一较高下,尽管Grok4.X系列已多次更新,但其成果在理论上看似不错,实际应用中却未能达到预期,双方的差距几乎未见缩小。不过,这次他手中握有一张新牌。马斯克在X平台确认,Grok的新版本即将问世。 这款基础模型第九版的内部代号已确定,参数规模高达1.5
相关专题推荐
评论 (1)
0/500
3月4日,蚂蚁集团与清华大学联合发布了开源强化学习训练框架AReaL v1.0的稳定版。此次发布的核心在于实现“智能体一键式强化学习训练”。该框架无需修改代码,兼容多种智能体框架,使智能体能够立即开始强化学习训练。
自2026年初以来,智能代理(Agents)一直保持着强劲的增长势头。LangChain、Claude Code和OpenClaw等框架虽发展迅速,但仍暴露出两大显著瓶颈。首先,训练门槛较高:现有智能代理框架采用各异的接口,集成时往往需要大量适配代码。 其次,智能体缺乏持续进化能力:大多数依赖初始训练阶段生成的固定模型权重。一旦部署,便无法针对特定场景进一步优化,其能力在发布时即已达到上限。
AReaL 是首个完全异步、训练与推理解耦的大规模强化学习系统。它使智能体能够通过与现实世界任务的交互接收反馈,并持续优化决策。v1.0 版本允许任何智能体无需修改即可连接到强化学习训练。通过在智能体与训练系统之间插入一个代理工作层,开发者只需重定向一个请求地址即可启用训练。

(图:无缝集成至代理的 AReaL 异步训练架构)
以广受欢迎的 OpenClaw 框架为例。开发者只需将 OpenClaw 配置中的 `base_url` 和 `api_key` 指向 AReaL 网关,其 OpenClaw 智能体便会连接到强化学习训练环境。智能体在继续正常执行任务的同时,用户会定期对其表现进行评分。AReaL 会自动收集这些训练数据并在后台更新模型,从而使智能体能够通过持续使用实现自主进化。
AReaL v1.0 版本还推出了原生训练引擎 Archon。该引擎基于 PyTorch 的原生能力构建,实现了数据、管道、张量、上下文和专家并行这五大维度的全并行处理,从而降低了安装和调试门槛。此外,它还提供了多种训练和推理后端选项,便于在不同环境中灵活部署。 令人惊叹的是,这一复杂的分布式系统仅用一个月的人力就从零开始开发并验证完成。在 32 天内,近百万行代码经过修改,全面实现了 Archon 引擎,使其能够训练数十亿参数的专家混合(MoE)模型。
这一效率突破背后的秘诀在于 AReaL 集成的 AI 辅助开发系统,该系统能够自动化处理高度复杂的工程任务。

AReaL v1.0 具备 AI 辅助开发工作流,提供从规划、编码到验证及 PR 创建的全流程支持。在处理 MoE 并行化、内存优化和算法实现等核心模块时,专用的 AI 编程助手将扮演资深专家的角色。它在代码修改过程中提供及时、精准的指导,确保每次修改的正确性。 AReaL的AI辅助编程不仅仅是一个生产力工具;它能够承担复杂基础设施项目中的“可交付成果”研发工作,开创了AI基础设施工程的下一个范式。
AReaL团队表示,他们将持续迭代训练引擎、用户体验以及多模态代理的训练。AReaL v1.0的代码和文档现已开源,发布于inclusionAI社区。
· GitHub 仓库:https://github.com/inclusionAI/AReaL
· 相关论文:https://arxiv.org/abs/2505.24298
Anthropic公司的实验性人工智能Claude在电子商务测试中完成了谈判和交易
随着人工智能的飞速发展,Anthropic上周五悄然启动了一项名为“Project Deal”的内部实验,展示了人工智能在电子商务领域的潜力。该实验让其人工智能模型Claude在封闭的市场环境中自主处理买卖及价格谈判,并涉及真实的金融交易。实验的核心是一个基于Slack构建的内部市场,Claude在其中同时担任买卖双方的谈判代表。它首先对69名员工进行了访谈,收集了他们的买卖意向及个性化指示,随后
DeepSeek Code 即将发布
随着人工智能技术的加速发展,DeepSeek正处于一个激动人心的关键时刻。这家人工智能公司近日透露,已获得超过700亿元的融资。公司管理层强调,将致力于开创性的人工智能研究,而非追求眼前的商业利益。这一战略转型表明,DeepSeek将全力投入新产品的开发,尤其是备受期待的DeepSeek Code。DeepSeek Code的规划已初具雏形,公司招聘页面上已发布多个相关职位,例如“Agent Ha
马斯克的Grok:1.5万亿参数与光标代码吸收——颠覆性突破还是虚张声势?
埃隆·马斯克终于开始行动了。在人工智能编程竞赛中,OpenAI和Anthropic正加速前进,而xAI似乎有些落后。马斯克曾多次表示要与Claude一较高下,尽管Grok4.X系列已多次更新,但其成果在理论上看似不错,实际应用中却未能达到预期,双方的差距几乎未见缩小。不过,这次他手中握有一张新牌。马斯克在X平台确认,Grok的新版本即将问世。 这款基础模型第九版的内部代号已确定,参数规模高达1.5





首页






