提升大模型自动修Bug能力 豆包正式开源首个多语言类SWE数据集
时间:2025-04-10 | 作者: | 阅读:0快科技4月10日消息,今日,字节跳动豆包大模型团队宣布,正式开源首个多语言类SWE数据集Multi-SWE-bench,可用于评估和提升大模型自动修 Bug”能力。
在SWE-bench基础上,Multi-SWE-bench首次覆盖Python之外的7种主流编程语言(Java、Go、Rust、C、C、TypeScript、JavaScript),是真正面向全栈工程”的评测基准。
Multi-SWE-bench包含1632个实例,均来自GitHub issue,并经过统一的测试标准和专业开发者的审核筛选,确保每个样本具备清晰的问题描述、正确的修复补丁以及可复现的运行测试环境。
豆包大模型团队希望,Multi-SWE-bench能作为大模型在多种主流编程语言与真实代码环境中的系统性评测基准,推动自动编程能力向更实用、更工程化的方向发展。
团队表示,相比于以往聚焦Python的单语言任务,Multi-SWE-bench更贴近现实中的多语言开发场景,也更能反映当前模型在自动化软件工程”方向上的实际能力边界。
来源:https://www.chinaz.com/2025/0410/1679649.shtml
免责声明:文中图文均来自网络,如有侵权请联系删除,心愿游戏发布此文仅为传递信息,不代表心愿游戏认同其观点或证实其描述。
相关文章
更多-
- 字节Seed启动大模型校招 全球招募百位AI人才
- 时间:2026-04-01
-
- 被字节超60亿美元出售!沐瞳内部信回应:管理架构不会变
- 时间:2026-03-20
-
- 字节跳动回应武汉研发中心全部被裁 :内容不实 50人因业务调整换办公地
- 时间:2026-03-14
-
- Seedance2.0排队8小时生成视频被吐槽 客服回应:节后使用人数多很火爆 版权风险会审核不通过
- 时间:2026-02-27
-
- 日本高官称有意调查字节跳动Seedance 2.0:存在侵犯著作权和不妥影像的担忧
- 时间:2026-02-14
-
- Seedance 2.0爆火背后!字节AI一号位亮剑:曾是谷歌17年大牛
- 时间:2026-02-14
-
- 网友用Seedance2.0复刻1670年纽约市 马斯克发文感慨:它发展很快
- 时间:2026-02-12
-
- 字节Seedance 2.0引爆全网!冯骥直呼杀死比赛 贾樟柯要用其拍短片
- 时间:2026-02-12
精选合集
更多大家都在玩
大家都在看
更多-
- 《放开那三国》04月09日1564区-亲密无间
- 时间:2026-04-08
-
- 小主播名字网名女生霸气(精选100个)
- 时间:2026-04-08
-
- 泰坦之旅2 狮子雕像解谜大,核心要点全掌握
- 时间:2026-04-08
-
- 网络热词热情感叹号是什么意思
- 时间:2026-04-08
-
- vivox30手机桌面返回键怎么显示出来
- 时间:2026-04-08
-
- 猫的帅气网名大全女生可爱(精选100个)
- 时间:2026-04-08
-
- 谷歌浏览器如何设置自动刷新
- 时间:2026-04-08
-
- 网络热词滋养型人格是什么意思
- 时间:2026-04-08