提升大模型自动修Bug能力 豆包正式开源首个多语言类SWE数据集
时间:2025-04-10 | 作者: | 阅读:0快科技4月10日消息,今日,字节跳动豆包大模型团队宣布,正式开源首个多语言类SWE数据集Multi-SWE-bench,可用于评估和提升大模型自动修 Bug”能力。
在SWE-bench基础上,Multi-SWE-bench首次覆盖Python之外的7种主流编程语言(Java、Go、Rust、C、C、TypeScript、JavaScript),是真正面向全栈工程”的评测基准。
Multi-SWE-bench包含1632个实例,均来自GitHub issue,并经过统一的测试标准和专业开发者的审核筛选,确保每个样本具备清晰的问题描述、正确的修复补丁以及可复现的运行测试环境。
豆包大模型团队希望,Multi-SWE-bench能作为大模型在多种主流编程语言与真实代码环境中的系统性评测基准,推动自动编程能力向更实用、更工程化的方向发展。
团队表示,相比于以往聚焦Python的单语言任务,Multi-SWE-bench更贴近现实中的多语言开发场景,也更能反映当前模型在自动化软件工程”方向上的实际能力边界。
来源:https://www.chinaz.com/2025/0410/1679649.shtml
免责声明:文中图文均来自网络,如有侵权请联系删除,心愿游戏发布此文仅为传递信息,不代表心愿游戏认同其观点或证实其描述。
相关文章
更多-
- 字节跳动旗下第五款现象级App诞生 红果短剧日活破亿 成立不到3年
- 时间:2026-02-02
-
- 脉脉:字节等大厂年薪超百万急招 新增AI岗位超10倍
- 时间:2026-01-13
-
- 确保薪资领先于头部水平!字节跳动奖金投入提升35%
- 时间:2025-12-19
-
- 周受资内部信曝TikTok美国方案:字节继续拥有算法知识产权
- 时间:2025-12-19
-
- 字节发布“AI节省计划” 字节高管:用得越多节省越多 最高可节省47%
- 时间:2025-12-18
-
- 腾讯回应双倍薪水挖角字节AI人才:系外界传闻 无法回复
- 时间:2025-12-12
-
- 前字节公关总监杨继斌朋友圈宣布:离开字节跳动 加入理想汽车
- 时间:2025-12-08
-
- 字节跳动架构大整合 成立中国交易与广告部门
- 时间:2025-11-18
精选合集
更多大家都在玩
大家都在看
更多-
- 星际战甲手游孢子流配卡攻略
- 时间:2026-02-03
-
- 荣耀Power2被指外观模仿苹果 客服回应称成熟设计趋向共识
- 时间:2026-02-03
-
- 独特三个字的网名男生(精选100个)
- 时间:2026-02-03
-
- 江南百景图哪里生产刺绣
- 时间:2026-02-03
-
- 二哈是什么意思
- 时间:2026-02-03
-
- 英雄联盟手游英雄之夜宝箱怎么快速升级
- 时间:2026-02-03
-
- 192.168.1.1进行重置的详细操作
- 时间:2026-02-03
-
- 暗黑地牢2配置要求高吗?暗黑地牢2最低配置要求官方推荐
- 时间:2026-02-03