OpenClaw 的 AReaL v1.0 框架支持并行 AI 代理训练

首页

新闻

2026-04-18

BrianGonzález

3月4日，蚂蚁集团与清华大学联合发布了开源强化学习训练框架AReaL v1.0的稳定版。此次发布的核心在于实现“智能体一键式强化学习训练”。该框架无需修改代码，兼容多种智能体框架，使智能体能够立即开始强化学习训练。

自2026年初以来，智能代理（Agents）一直保持着强劲的增长势头。LangChain、Claude Code和OpenClaw等框架虽发展迅速，但仍暴露出两大显著瓶颈。首先，训练门槛较高：现有智能代理框架采用各异的接口，集成时往往需要大量适配代码。其次，智能体缺乏持续进化能力：大多数依赖初始训练阶段生成的固定模型权重。一旦部署，便无法针对特定场景进一步优化，其能力在发布时即已达到上限。

AReaL 是首个完全异步、训练与推理解耦的大规模强化学习系统。它使智能体能够通过与现实世界任务的交互接收反馈，并持续优化决策。v1.0 版本允许任何智能体无需修改即可连接到强化学习训练。通过在智能体与训练系统之间插入一个代理工作层，开发者只需重定向一个请求地址即可启用训练。

（图：无缝集成至代理的 AReaL 异步训练架构）

以广受欢迎的 OpenClaw 框架为例。开发者只需将 OpenClaw 配置中的 `base_url` 和 `api_key` 指向 AReaL 网关，其 OpenClaw 智能体便会连接到强化学习训练环境。智能体在继续正常执行任务的同时，用户会定期对其表现进行评分。AReaL 会自动收集这些训练数据并在后台更新模型，从而使智能体能够通过持续使用实现自主进化。

AReaL v1.0 版本还推出了原生训练引擎 Archon。该引擎基于 PyTorch 的原生能力构建，实现了数据、管道、张量、上下文和专家并行这五大维度的全并行处理，从而降低了安装和调试门槛。此外，它还提供了多种训练和推理后端选项，便于在不同环境中灵活部署。令人惊叹的是，这一复杂的分布式系统仅用一个月的人力就从零开始开发并验证完成。在 32 天内，近百万行代码经过修改，全面实现了 Archon 引擎，使其能够训练数十亿参数的专家混合（MoE）模型。

这一效率突破背后的秘诀在于 AReaL 集成的 AI 辅助开发系统，该系统能够自动化处理高度复杂的工程任务。

AReaL v1.0 具备 AI 辅助开发工作流，提供从规划、编码到验证及 PR 创建的全流程支持。在处理 MoE 并行化、内存优化和算法实现等核心模块时，专用的 AI 编程助手将扮演资深专家的角色。它在代码修改过程中提供及时、精准的指导，确保每次修改的正确性。 AReaL的AI辅助编程不仅仅是一个生产力工具；它能够承担复杂基础设施项目中的“可交付成果”研发工作，开创了AI基础设施工程的下一个范式。

AReaL团队表示，他们将持续迭代训练引擎、用户体验以及多模态代理的训练。AReaL v1.0的代码和文档现已开源，发布于inclusionAI社区。

· GitHub 仓库：https://github.com/inclusionAI/AReaL

· 相关论文：https://arxiv.org/abs/2505.24298

Anthropic公司的实验性人工智能Claude在电子商务测试中完成了谈判和交易随着人工智能的飞速发展，Anthropic上周五悄然启动了一项名为“Project Deal”的内部实验，展示了人工智能在电子商务领域的潜力。该实验让其人工智能模型Claude在封闭的市场环境中自主处理买卖及价格谈判，并涉及真实的金融交易。实验的核心是一个基于Slack构建的内部市场，Claude在其中同时担任买卖双方的谈判代表。它首先对69名员工进行了访谈，收集了他们的买卖意向及个性化指示，随后

DeepSeek Code 即将发布随着人工智能技术的加速发展，DeepSeek正处于一个激动人心的关键时刻。这家人工智能公司近日透露，已获得超过700亿元的融资。公司管理层强调，将致力于开创性的人工智能研究，而非追求眼前的商业利益。这一战略转型表明，DeepSeek将全力投入新产品的开发，尤其是备受期待的DeepSeek Code。DeepSeek Code的规划已初具雏形，公司招聘页面上已发布多个相关职位，例如“Agent Ha

马斯克的Grok：1.5万亿参数与光标代码吸收——颠覆性突破还是虚张声势？埃隆·马斯克终于开始行动了。在人工智能编程竞赛中，OpenAI和Anthropic正加速前进，而xAI似乎有些落后。马斯克曾多次表示要与Claude一较高下，尽管Grok4.X系列已多次更新，但其成果在理论上看似不错，实际应用中却未能达到预期，双方的差距几乎未见缩小。不过，这次他手中握有一张新牌。马斯克在X平台确认，Grok的新版本即将问世。这款基础模型第九版的内部代号已确定，参数规模高达1.5

相关专题推荐

商业

最佳人工智能招聘工具：筛选简历并自动安排候选人面试

在 XIX.AI 上探索 2026 年最新、评价最高的人工智能招聘工具。我们精心筛选的清单汇集了功能强大、颠覆传统的解决方案，可帮助您筛选简历并自动安排候选人面试。通过实际测试和每周更新的排名，对比免费与付费选项。立即找到最适合您的招聘助手，优化您的招聘流程！

10 个工具

xix.ai

生产率

AI个人健康与专注力教练：缓解倦怠，提升精神能量

立即访问 XIX.AI，探索 2026 年最优秀的 AI 个人健康与专注力教练。我们的精选排行榜汇集了广受好评、具有颠覆性意义的工具，助您缓解倦怠、提升精神能量。通过真实案例分析，对比免费与付费选项。立即开启通往巅峰生产力和身心健康的道路。

10 个工具

xix.ai

聊天机器人

备受好评的AI浪漫聊天机器人：凭借稳定的个性建立长期关系

探索2026年最新、评价最高的人工智能浪漫聊天机器人，助您建立真实而长久的联系。我们的精选清单涵盖了功能强大且性格鲜明的聊天机器人，并提供了免费与付费版本的对比分析以及实际测试结果。在XIX.AI上找到您的完美伴侣，立即开始建立联系吧。

10 个工具

xix.ai

教育与学习

最佳AI数据科学导师：精通SQL、Pandas及机器学习工作流程

探索2026年最优秀的人工智能数据科学导师，帮助他们掌握SQL、Pandas以及机器学习工作流程。在XIX.AI上查看我们精心挑选的顶级导师名单，获得强大而具有变革性的指导。通过对比免费和付费选项，并结合实际应用案例进行了解，今天就开启你的数据科学精通之路吧。

10 个工具

xix.ai

聊天机器人

最佳AI调情与对话训练工具：实时提升社交魅力与自信

在 XIX.AI 上探索 2026 年最优秀的 AI 调情与对话训练工具。我们精心挑选的高评分工具助您实时提升社交魅力与自信。探索这些必试的、颠覆性的工具，查看免费版与付费版的对比，并了解每周更新的排行榜。立即开启您的社交优势。

10 个工具

xix.ai

代码

最适合自动化单元测试的最佳AI工具：一键生成Jest、PyTest和JUnit测试用例

探索2026年最新评选出的顶级AI工具，这些工具专为自动化单元测试而设计。我们精心挑选了那些功能强大、能够改变开发流程的工具，它们能够帮助您快速生成Jest、PyTest和JUnit测试用例。在XIX.AI平台上，您可以免费查看各种选项，并通过实际测试结果以及每周更新的排名来了解它们的优劣。立即利用这些AI工具，提升您的开发效率吧！

10 个工具

xix.ai