AReaL v1.0稳定版来了!蚂蚁联合清华大学发布:让任意Agent跑上强化学习
时间:2026-03-04 | 作者: | 阅读:0快科技3月4日消息,今天蚂蚁集团联合清华大学发布开源强化学习训练框架AReaL v1.0稳定版,主打Agent一键接入RL训练,不用改代码即可兼容各类Agent框架,让智能体强化学习训练开箱即用。
近日以LangChain、Claude Code、OpenClaw为代表的智能体框架持续升温,但是还存在两大痛点。
一是接入训练成本高,现有智能体框架接口各异,每接入一个往往需要编写整套适配代码;同时多数Agent能力受限于底层模型的固定权重,部署后无法针对特定场景持续优化。
而AReaL作为首个全异步训推解耦的大模型强化学习训练系统,让Agent能在真实任务交互中获取反馈、持续优化决策。
此次发布的v1.0版本,能让任意Agent零改造接入RL训练成为现实,通过在智能体与训练系统之间加入Proxy Worker中转层,开发者只需修改一个请求地址即可接入训练。
以OpenClaw为例,开发者仅需在配置文件中将base_url和api_key指向AReaL网关,即可让智能体接入强化学习训练。
用户周期性对任务完成质量打分,AReaL后台自动完成数据采集与模型更新,使智能体在使用过程中持续进化。
该版本还推出原生训练引擎Archon,基于PyTorch实现完整的5D并行(数据并行、流水线并行、张量并行、上下文并行、专家并行),便于在不同环境中灵活部署,能够支持千亿参数级MoE模型的分布式训练。
至于未来,将继续围绕训练引擎、易用性和多模态智能体训练等方向迭代,目前AReaL v1.0的代码与文档已在inclusionAI社区开源。
来源:https://news.pconline.com.cn/2108/21089672.html
免责声明:文中图文均来自网络,如有侵权请联系删除,心愿游戏发布此文仅为传递信息,不代表心愿游戏认同其观点或证实其描述。
相关文章
更多-
- 被吐槽多年:Win11搜索终于要改了!微软承诺简化结果、修复排序
- 时间:2026-03-30
-
- 莲花For Me超混SUV正式上市:900V架构+420km纯电续航 售价50.8万元起
- 时间:2026-03-30
-
- 2026款荣耀MagicBook Pro 14三色曝光 月光白青瓷绿星辰灰亮相
- 时间:2026-03-30
-
- 2026年5000元投影仪推荐:从入门到旗舰 这3款闭眼冲
- 时间:2026-03-30
-
- 129元!比亚迪推出海洋磁吸充电宝:金属外壳+3C认证
- 时间:2026-03-30
-
- 三星西安厂236层堆叠3D NAND正式量产:最新286层年内落地
- 时间:2026-03-30
-
- 鸿蒙智行尚界Z7/Z7T内饰亮点曝光:首搭水离子空调与零重力座椅
- 时间:2026-03-30
-
- 史上最大改款iPhone!iPhone Fold来了:外观系统全面大改
- 时间:2026-03-30
精选合集
更多大家都在玩
大家都在看
更多-
- 孙子兵法手游好玩吗
- 时间:2026-03-30
-
- 王国大作战前线上线时间是什么时候
- 时间:2026-03-30
-
- 冷门励志的网名男生霸气(精选100个)
- 时间:2026-03-30
-
- 纵横修仙界炼丹攻略
- 时间:2026-03-30
-
- 决斗学院追击暴力队打法教程
- 时间:2026-03-30
-
- 纵横修仙界镇妖塔怎么玩
- 时间:2026-03-30
-
- 幻世仙途是哪个公司出的
- 时间:2026-03-30
-
- 幻世仙途境界有哪些
- 时间:2026-03-30