提升大模型自动修Bug能力 豆包正式开源首个多语言类SWE数据集
时间:2025-04-10 | 作者: | 阅读:0快科技4月10日消息,今日,字节跳动豆包大模型团队宣布,正式开源首个多语言类SWE数据集Multi-SWE-bench,可用于评估和提升大模型自动修 Bug”能力。
在SWE-bench基础上,Multi-SWE-bench首次覆盖Python之外的7种主流编程语言(Java、Go、Rust、C、C、TypeScript、JavaScript),是真正面向全栈工程”的评测基准。
Multi-SWE-bench包含1632个实例,均来自GitHub issue,并经过统一的测试标准和专业开发者的审核筛选,确保每个样本具备清晰的问题描述、正确的修复补丁以及可复现的运行测试环境。
豆包大模型团队希望,Multi-SWE-bench能作为大模型在多种主流编程语言与真实代码环境中的系统性评测基准,推动自动编程能力向更实用、更工程化的方向发展。
团队表示,相比于以往聚焦Python的单语言任务,Multi-SWE-bench更贴近现实中的多语言开发场景,也更能反映当前模型在自动化软件工程”方向上的实际能力边界。
福利游戏
相关文章
更多-
- 短剧赛道洗牌,谁能笑到最后
- 时间:2025-04-17
-
- 字节、京东、小红书等多家大厂提前下班 因大风开启居家办公
- 时间:2025-04-11
-
- 特朗普宣布再给予TikTok禁令75天宽限期 字节跳动:与美政府未达成任何协议
- 时间:2025-04-05
-
- 突破经验依赖!字节跳动放宽招聘年限:毕业三年内人才招聘量将扩大一倍
- 时间:2025-04-01
精选合集
更多大家都在玩
大家都在看
更多-
- stk-al00是什么华为手机型号
- 时间:2025-04-21
-
- Win7如何调整烟雾头
- 时间:2025-04-21
-
- 百度网盘如何压缩文件技巧
- 时间:2025-04-21
-
- 抖音取什么名字最吸引人
- 时间:2025-04-21
-
- 微信访客记录查看方法详解
- 时间:2025-04-21
-
- 手机上百度网盘使用教程
- 时间:2025-04-21
-
- 比特币爆仓详解:本金全无风险及应对策略
- 时间:2025-04-21
-
- 怎么用美图秀秀自由拼图
- 时间:2025-04-21