提升大模型自动修Bug能力 豆包正式开源首个多语言类SWE数据集
时间:2025-04-10 | 作者: | 阅读:0快科技4月10日消息,今日,字节跳动豆包大模型团队宣布,正式开源首个多语言类SWE数据集Multi-SWE-bench,可用于评估和提升大模型自动修 Bug”能力。
在SWE-bench基础上,Multi-SWE-bench首次覆盖Python之外的7种主流编程语言(Java、Go、Rust、C、C、TypeScript、JavaScript),是真正面向全栈工程”的评测基准。
Multi-SWE-bench包含1632个实例,均来自GitHub issue,并经过统一的测试标准和专业开发者的审核筛选,确保每个样本具备清晰的问题描述、正确的修复补丁以及可复现的运行测试环境。
豆包大模型团队希望,Multi-SWE-bench能作为大模型在多种主流编程语言与真实代码环境中的系统性评测基准,推动自动编程能力向更实用、更工程化的方向发展。
团队表示,相比于以往聚焦Python的单语言任务,Multi-SWE-bench更贴近现实中的多语言开发场景,也更能反映当前模型在自动化软件工程”方向上的实际能力边界。
来源:https://www.chinaz.com/2025/0410/1679649.shtml
免责声明:文中图文均来自网络,如有侵权请联系删除,心愿游戏发布此文仅为传递信息,不代表心愿游戏认同其观点或证实其描述。
相关文章
更多-
- 字节跳动回应武汉研发中心全部被裁 :内容不实 50人因业务调整换办公地
- 时间:2026-03-14
-
- Seedance2.0排队8小时生成视频被吐槽 客服回应:节后使用人数多很火爆 版权风险会审核不通过
- 时间:2026-02-27
-
- 日本高官称有意调查字节跳动Seedance 2.0:存在侵犯著作权和不妥影像的担忧
- 时间:2026-02-14
-
- Seedance 2.0爆火背后!字节AI一号位亮剑:曾是谷歌17年大牛
- 时间:2026-02-14
-
- 网友用Seedance2.0复刻1670年纽约市 马斯克发文感慨:它发展很快
- 时间:2026-02-12
-
- 字节Seedance 2.0引爆全网!冯骥直呼杀死比赛 贾樟柯要用其拍短片
- 时间:2026-02-12
-
- 字节Seedance 2.0火爆出圈 影视板块掀起涨停潮
- 时间:2026-02-10
-
- 字节Seedance2.0颠覆影视圈!电影人恐慌:全行业岗位或将消失 所学90%技能被替代
- 时间:2026-02-10
精选合集
更多大家都在玩
大家都在看
更多-
- 诗意的id网名男生(精选100个)
- 时间:2026-03-18
-
- 暮光双龙道士技能加点攻略
- 时间:2026-03-18
-
- 王者荣耀网名伤感男生(精选100个)
- 时间:2026-03-18
-
- 男生好听的古诗网名(精选100个)
- 时间:2026-03-18
-
- 天蝎座丧气网名男生霸气(精选100个)
- 时间:2026-03-18
-
- 《空洞骑士 丝之歌》发布DLC前最后的重要更新 新增繁体中文
- 时间:2026-03-18
-
- 这城有良田三星堆宝具强度详解
- 时间:2026-03-18
-
- 2026远程办公远控软件全景测评:多维度对比 兼顾稳定与高效
- 时间:2026-03-18