AReaL v1.0稳定版来了!蚂蚁联合清华大学发布:让任意Agent跑上强化学习
时间:2026-03-04 | 作者: | 阅读:0快科技3月4日消息,今天蚂蚁集团联合清华大学发布开源强化学习训练框架AReaL v1.0稳定版,主打Agent一键接入RL训练,不用改代码即可兼容各类Agent框架,让智能体强化学习训练开箱即用。
近日以LangChain、Claude Code、OpenClaw为代表的智能体框架持续升温,但是还存在两大痛点。
一是接入训练成本高,现有智能体框架接口各异,每接入一个往往需要编写整套适配代码;同时多数Agent能力受限于底层模型的固定权重,部署后无法针对特定场景持续优化。
而AReaL作为首个全异步训推解耦的大模型强化学习训练系统,让Agent能在真实任务交互中获取反馈、持续优化决策。
此次发布的v1.0版本,能让任意Agent零改造接入RL训练成为现实,通过在智能体与训练系统之间加入Proxy Worker中转层,开发者只需修改一个请求地址即可接入训练。
以OpenClaw为例,开发者仅需在配置文件中将base_url和api_key指向AReaL网关,即可让智能体接入强化学习训练。
用户周期性对任务完成质量打分,AReaL后台自动完成数据采集与模型更新,使智能体在使用过程中持续进化。
该版本还推出原生训练引擎Archon,基于PyTorch实现完整的5D并行(数据并行、流水线并行、张量并行、上下文并行、专家并行),便于在不同环境中灵活部署,能够支持千亿参数级MoE模型的分布式训练。
至于未来,将继续围绕训练引擎、易用性和多模态智能体训练等方向迭代,目前AReaL v1.0的代码与文档已在inclusionAI社区开源。
来源:https://news.pconline.com.cn/2108/21089672.html
免责声明:文中图文均来自网络,如有侵权请联系删除,心愿游戏发布此文仅为传递信息,不代表心愿游戏认同其观点或证实其描述。
相关文章
更多-
- 风投机构反驳AI吞噬应用论调 称软件行业将成为AI最大受益者之一
- 时间:2026-03-04
-
- 全国政协委员曹鹏提出多项建议:激活AI产业效能、推动国补下乡、发展超级供应链
- 时间:2026-03-04
-
- 全新M4 iPad Air首个Geekbench跑分出炉!单核性能提升明显
- 时间:2026-03-04
-
- 便携投影仪推荐哪款 露营带当贝Smart2太香了!
- 时间:2026-03-04
-
- 7万台!飞腾腾锐D系列CPU中标集采
- 时间:2026-03-04
-
- 长焦杀疯了!OPPO Find X9 Ultra入网:原生10倍光变一骑绝尘
- 时间:2026-03-04
-
- 最强游戏小钢炮来了!红魔游戏平板5 Pro官宣
- 时间:2026-03-04
-
- IF椰子水否认产品掺假:天然纯粹!未添加任何外源糖/水/香精
- 时间:2026-03-04
精选合集
更多大家都在玩
大家都在看
更多-
- CF手游通行证怎么刷
- 时间:2026-03-04
-
- 臭字网名大全男生两个字(精选100个)
- 时间:2026-03-04
-
- 宁德时代董事长曾毓群:会把中国的产品卖到全世界
- 时间:2026-03-04
-
- 从AI、机器人到新能源与周期,工银瑞信多维度勾勒硬科技投资图谱
- 时间:2026-03-04
-
- 夜幕之下先锋节奏榜
- 时间:2026-03-04
-
- 失控进化最新版下载链接
- 时间:2026-03-04
-
- 崔姓谐音古风网名男生(精选100个)
- 时间:2026-03-04
-
- 魔兽世界12.0痛苦术怎么玩
- 时间:2026-03-04