提升大模型自动修Bug能力 豆包正式开源首个多语言类SWE数据集
时间:2025-04-10 | 作者: | 阅读:0快科技4月10日消息,今日,字节跳动豆包大模型团队宣布,正式开源首个多语言类SWE数据集Multi-SWE-bench,可用于评估和提升大模型自动修 Bug”能力。
在SWE-bench基础上,Multi-SWE-bench首次覆盖Python之外的7种主流编程语言(Java、Go、Rust、C、C、TypeScript、JavaScript),是真正面向全栈工程”的评测基准。
Multi-SWE-bench包含1632个实例,均来自GitHub issue,并经过统一的测试标准和专业开发者的审核筛选,确保每个样本具备清晰的问题描述、正确的修复补丁以及可复现的运行测试环境。
豆包大模型团队希望,Multi-SWE-bench能作为大模型在多种主流编程语言与真实代码环境中的系统性评测基准,推动自动编程能力向更实用、更工程化的方向发展。
团队表示,相比于以往聚焦Python的单语言任务,Multi-SWE-bench更贴近现实中的多语言开发场景,也更能反映当前模型在自动化软件工程”方向上的实际能力边界。
福利游戏
相关文章
更多-
- 字节跳动辟谣 否认甲骨文等将收购TikTok美国业务
- 时间:2025-07-08
-
- 字节跳动通报:豆包大模型团队涉事员工已辞退 并全额扣发年终奖
- 时间:2025-06-24
-
- 1年存10万太容易!35岁女生晒在字节跳动一天花销上热搜:福利好到让网友羡慕
- 时间:2025-06-23
-
- 智能体时代,还得看豆包大模型
- 时间:2025-06-16
-
- 字节内部回应禁用第三方开发工具:不是一刀切 合规的工具走流程还能用
- 时间:2025-05-29
-
- 字节发内部邮件:将禁用Cursor等AI编程工具 用自研Trae替代
- 时间:2025-05-28
-
- 中国独角兽排行榜2025发布:字节、蚂蚁、vivo等入围
- 时间:2025-05-24
-
- 字节跳动警告合作方 对腐败贿赂员工零容忍
- 时间:2025-05-23
大家都在玩
大家都在看
更多-
- 波场杠杆与原理图解
- 时间:2025-07-08
-
- 新势力周交付量出炉:问界销冠宝座差点被零跑推翻
- 时间:2025-07-08
-
- 女子学滑翔伞 起飞十几秒突然坠落 大树救一命
- 时间:2025-07-08
-
- XRP杠杆与原理图解
- 时间:2025-07-08
-
- 小米深圳总部7月18日举行开园仪式!楼下开设全球最大小米之家
- 时间:2025-07-08
-
- REDMI K90 Pro参数曝光:安排潜望长焦 看齐大哥小米Pro系列
- 时间:2025-07-08
-
- 外卖三国杀:美团夜猫子多、京东抢午间档、淘宝靠全品类破圈
- 时间:2025-07-08
-
- Ripple反对SEC:罚款应限1000万,不超20亿
- 时间:2025-07-08