AReaL v1.0稳定版来了！蚂蚁联合清华大学发布：让任意Agent跑上强化学习 - 心愿游戏

位置：首页 > 新闻资讯 > AReaL v1.0稳定版来了！蚂蚁联合清华大学发布：让任意Agent跑上强化学习

AReaL v1.0稳定版来了！蚂蚁联合清华大学发布：让任意Agent跑上强化学习

时间：2026-03-04 | 作者： | 阅读：0

快科技3月4日消息，今天蚂蚁集团联合清华大学发布开源强化学习训练框架AReaL v1.0稳定版，主打Agent一键接入RL训练，不用改代码即可兼容各类Agent框架，让智能体强化学习训练开箱即用。

近日以LangChain、Claude Code、OpenClaw为代表的智能体框架持续升温，但是还存在两大痛点。

一是接入训练成本高，现有智能体框架接口各异，每接入一个往往需要编写整套适配代码；同时多数Agent能力受限于底层模型的固定权重，部署后无法针对特定场景持续优化。

而AReaL作为首个全异步训推解耦的大模型强化学习训练系统，让Agent能在真实任务交互中获取反馈、持续优化决策。

此次发布的v1.0版本，能让任意Agent零改造接入RL训练成为现实，通过在智能体与训练系统之间加入Proxy Worker中转层，开发者只需修改一个请求地址即可接入训练。

以OpenClaw为例，开发者仅需在配置文件中将base_url和api_key指向AReaL网关，即可让智能体接入强化学习训练。

用户周期性对任务完成质量打分，AReaL后台自动完成数据采集与模型更新，使智能体在使用过程中持续进化。

该版本还推出原生训练引擎Archon，基于PyTorch实现完整的5D并行（数据并行、流水线并行、张量并行、上下文并行、专家并行），便于在不同环境中灵活部署，能够支持千亿参数级MoE模型的分布式训练。

至于未来，将继续围绕训练引擎、易用性和多模态智能体训练等方向迭代，目前AReaL v1.0的代码与文档已在inclusionAI社区开源。

《夸克》非常好用的免费AI浏览器

下载APP查看

来源:https://news.pconline.com.cn/2108/21089672.html
免责声明：文中图文均来自网络，如有侵权请联系删除，心愿游戏发布此文仅为传递信息，不代表心愿游戏认同其观点或证实其描述。

相关文章

更多

被吐槽多年：Win11搜索终于要改了！微软承诺简化结果、修复排序

时间：2026-03-30
莲花For Me超混SUV正式上市：900V架构+420km纯电续航售价50.8万元起

时间：2026-03-30
2026款荣耀MagicBook Pro 14三色曝光月光白青瓷绿星辰灰亮相

时间：2026-03-30
2026年5000元投影仪推荐：从入门到旗舰这3款闭眼冲

时间：2026-03-30
129元！比亚迪推出海洋磁吸充电宝：金属外壳+3C认证

时间：2026-03-30
三星西安厂236层堆叠3D NAND正式量产：最新286层年内落地

时间：2026-03-30
鸿蒙智行尚界Z7/Z7T内饰亮点曝光：首搭水离子空调与零重力座椅

时间：2026-03-30
史上最大改款iPhone！iPhone Fold来了：外观系统全面大改

时间：2026-03-30

精选合集

更多

大家都在玩

热门话题

大家都在看

更多