提升大模型自动修Bug能力 豆包正式开源首个多语言类SWE数据集
时间:2025-04-10 | 作者: | 阅读:0快科技4月10日消息,今日,字节跳动豆包大模型团队宣布,正式开源首个多语言类SWE数据集Multi-SWE-bench,可用于评估和提升大模型自动修 Bug”能力。
在SWE-bench基础上,Multi-SWE-bench首次覆盖Python之外的7种主流编程语言(Java、Go、Rust、C、C、TypeScript、JavaScript),是真正面向全栈工程”的评测基准。
Multi-SWE-bench包含1632个实例,均来自GitHub issue,并经过统一的测试标准和专业开发者的审核筛选,确保每个样本具备清晰的问题描述、正确的修复补丁以及可复现的运行测试环境。
豆包大模型团队希望,Multi-SWE-bench能作为大模型在多种主流编程语言与真实代码环境中的系统性评测基准,推动自动编程能力向更实用、更工程化的方向发展。
团队表示,相比于以往聚焦Python的单语言任务,Multi-SWE-bench更贴近现实中的多语言开发场景,也更能反映当前模型在自动化软件工程”方向上的实际能力边界。
来源:https://www.chinaz.com/2025/0410/1679649.shtml
免责声明:文中图文均来自网络,如有侵权请联系删除,心愿游戏发布此文仅为传递信息,不代表心愿游戏认同其观点或证实其描述。
相关文章
更多-
- 字节跳动一季度80名员工被辞退 有前员工长期出借飞书账号致泄密
- 时间:2026-07-01
-
- 火山引擎总裁:目前暂无拆分独立上市相关计划
- 时间:2026-06-23
-
- 赛豆被误认为是豆包汽车品牌 字节跳动发声明:没有造车计划
- 时间:2026-06-06
-
- 字节火山引擎火山剧创1.0正式上线:短剧制作周期缩短80%以上
- 时间:2026-05-21
-
- 抖音推出“人间观察计划”:扶持百位人间观察员 打造千部优秀作品
- 时间:2026-04-28
-
- 字节跳动“前沿技术领域人才校招”启动 面向全球招募技术人才
- 时间:2026-04-17
-
- 视频生成每秒仅需1元!字节Seedance2.0正式上线API服务
- 时间:2026-04-14
-
- 字节Seed启动大模型校招 全球招募百位AI人才
- 时间:2026-04-01
精选合集
更多大家都在玩
大家都在看
更多-
- 高考志愿填报模板完整版附表格填写示例
- 时间:2026-07-04
-
- 2026好玩的挂机手游推荐
- 时间:2026-07-04
-
- 高考志愿填报规划师职业前景与报考指南
- 时间:2026-07-04
-
- 高考志愿填报实用指导与技巧
- 时间:2026-07-04
-
- 高考志愿填报时间安排
- 时间:2026-07-04
-
- 高考志愿填报系统使用技巧与注意事项
- 时间:2026-07-04
-
- 高考志愿填报模拟系统指南
- 时间:2026-07-04
-
- 高考志愿填报方法与技巧详解
- 时间:2026-07-04