提升大模型自动修Bug能力 豆包正式开源首个多语言类SWE数据集
时间:2025-04-10 | 作者: | 阅读:0快科技4月10日消息,今日,字节跳动豆包大模型团队宣布,正式开源首个多语言类SWE数据集Multi-SWE-bench,可用于评估和提升大模型自动修 Bug”能力。
在SWE-bench基础上,Multi-SWE-bench首次覆盖Python之外的7种主流编程语言(Java、Go、Rust、C、C、TypeScript、JavaScript),是真正面向全栈工程”的评测基准。
Multi-SWE-bench包含1632个实例,均来自GitHub issue,并经过统一的测试标准和专业开发者的审核筛选,确保每个样本具备清晰的问题描述、正确的修复补丁以及可复现的运行测试环境。
豆包大模型团队希望,Multi-SWE-bench能作为大模型在多种主流编程语言与真实代码环境中的系统性评测基准,推动自动编程能力向更实用、更工程化的方向发展。
团队表示,相比于以往聚焦Python的单语言任务,Multi-SWE-bench更贴近现实中的多语言开发场景,也更能反映当前模型在自动化软件工程”方向上的实际能力边界。
来源:https://www.chinaz.com/2025/0410/1679649.shtml
免责声明:文中图文均来自网络,如有侵权请联系删除,心愿游戏发布此文仅为传递信息,不代表心愿游戏认同其观点或证实其描述。
相关文章
更多-
- 抖音推出“人间观察计划”:扶持百位人间观察员 打造千部优秀作品
- 时间:2026-04-28
-
- 字节跳动“前沿技术领域人才校招”启动 面向全球招募技术人才
- 时间:2026-04-17
-
- 视频生成每秒仅需1元!字节Seedance2.0正式上线API服务
- 时间:2026-04-14
-
- 字节Seed启动大模型校招 全球招募百位AI人才
- 时间:2026-04-01
-
- 被字节超60亿美元出售!沐瞳内部信回应:管理架构不会变
- 时间:2026-03-20
-
- 字节跳动回应武汉研发中心全部被裁 :内容不实 50人因业务调整换办公地
- 时间:2026-03-14
-
- Seedance2.0排队8小时生成视频被吐槽 客服回应:节后使用人数多很火爆 版权风险会审核不通过
- 时间:2026-02-27
-
- 日本高官称有意调查字节跳动Seedance 2.0:存在侵犯著作权和不妥影像的担忧
- 时间:2026-02-14
精选合集
更多大家都在玩
大家都在看
更多-
- 修真高手手游贞德阵容搭配指南
- 时间:2026-05-02
-
- 红色沙漠战场之光套装怎么获得
- 时间:2026-05-02
-
- 红色沙漠残响峭壁古代遗迹解谜攻略
- 时间:2026-05-02
-
- 龙魂大陆戒指如何获取-龙魂大陆怎么得到戒指
- 时间:2026-05-02
-
- 牧场气息手游精灵玩法指南
- 时间:2026-05-02
-
- 无限轮回推图的方法是什么-无限轮回如何进行推图
- 时间:2026-05-02
-
- 落落大方的你配上自拍照朋友圈就这么发
- 时间:2026-05-02
-
- 适合五月发的朋友圈文案
- 时间:2026-05-02