位置:首页 > 新闻资讯 > DeepSWE— Together.ai联合Agentica开源的AI Agent框架

DeepSWE— Together.ai联合Agentica开源的AI Agent框架

时间:2025-07-05  |  作者:  |  阅读:0

DeepSWE介绍

deepswe是由together.ai与agentica联合推出的ai agent框架,基于qwen3-32b模型并通过强化学习训练构建。该框架在swe-bench-verified基准测试中表现优异,启用测试时扩展(tts)后准确率达到59.0%,未使用tts时pass@1准确率为42.2%,位居开源agent框架首位。该项目全面开源了模型训练数据、代码及评估日志,有助于开发者学习和优化agent技术,推动强化学习在软件工程领域的应用发展。

DeepSWE的核心功能

  • 代码理解与修改:能够解析并编辑现有代码,解决特定的软件问题或实现新功能。
  • 复杂问题处理:通过与环境的交互,解决如GitHub上的缺陷修复、新增功能实现以及调试等复杂的软件工程任务。
  • 自动化测试与验证:运行shell命令进行代码构建和测试,确保所提出的解决方案有效,并防止修改破坏原有功能。
  • 多阶段推理能力:在执行任务过程中具备多步骤推理和决策能力,逐步优化方案直至任务完成。

DeepSWE的技术机制

  • 纯强化学习训练:完全采用强化学习(RL)从零开始训练,不依赖于监督微调(SFT)或更强的专有教师模型蒸馏。
  • rLLM系统支持:利用rLLM框架进行后期训练,提供高效的数据管理与训练流程,支持大规模RL训练。
  • 稀疏奖励机制:仅当生成的代码补丁通过所有测试时才给予正向奖励,否则无奖励,促使模型追求高质量输出。
  • 测试时扩展策略(TTS):在测试阶段生成多个解决路径,并选择成功解决问题的路径,显著提升准确率。结合执行验证器与非执行验证器的优势,大幅提升性能表现。
  • Kubernetes集成:为应对训练过程中的扩展挑战,集成了Kubernetes支持,实现容器的弹性调度与自动缩放,保障训练的高效与稳定。

DeepSWE的项目链接

  • HuggingFace模型库:https://www.php.cn/link/e04bc8909bb7969ae5488620e00f8c57

DeepSWE的应用领域

  • 代码理解与重构:DeepSWE可自动分析并修改代码,快速定位漏洞、优化性能瓶颈及重构代码结构,从而显著提升代码质量。
  • 软件问题解决:能够高效处理GitHub上的各类问题、实现新功能并将复杂任务拆解为可执行的子任务,快速攻克各种软件难题。
  • 自动化测试与验证:DeepSWE可自动生成测试用例,执行代码构建与自动化测试,进行回归测试以确保软件稳定性,降低人工测试工作量。
  • 多阶段推理与方案优化:通过多步骤推理解决复杂问题,并不断迭代优化解决方案,在实践中积累经验,更好地应对未来挑战。
  • 开发辅助与团队协作:DeepSWE能为开发者提供实时代码建议与补全提示,协助项目管理和任务分配,促进团队合作与交流,提升整体开发效率。

福利游戏

相关文章

更多

精选合集

更多

大家都在玩

热门话题

大家都在看

更多