阿里发布千问Qwen3.7-Max模型:国产最佳,可全自主完成35小时长程任务
时间:2026-05-20 | 作者: | 阅读:05月20日上午消息,阿里巴巴发布新一代千问旗舰模型Qwen3.7-Max,在三方机构Arena全球大模型盲测总榜中,Qwen3.7-Max超过Kimi-K2.6、DeepSeek-v4-pro、GLM-5.1,与GPT、Claude、Gemini最强模型接近,位列国产模型第一。
据悉,千问3.7面向当下智能体(Agent)全新设计,实现了编程、推理等核心能力的持续突破,甚至可全自主完成35小时的超长程智能体复杂任务:在一个全新的芯片平台上,Qwen3.7-Max通过自主编程和超1000次工具调用,实现了一个关键内核的自我进化,推理速度较原版本提升10倍。
当下,编程能力已成为衡量LLM大语言模型的核心指标,Qwen3.7-Max较上代模型实现了大幅提升,从前端原型开发到复杂的多文件工程均能驾驭。在评估AI解决真实世界的实战编程任务SWE-bench系列测评、面向真实科学问题的编程测评SciCode中,Qwen3.7-Max较Qwen3.6-Plus大幅提升,并超越了Claude Opus 4.6-Max、Kimi-K2.6、DeepSeek-v4-Pro-Max等模型。千问3.7是出色的编程智能体,可自主编写代码创造工具,精准执行任务,完成复杂编程的自我纠错迭代,就像个资深工程师,跑完从需求分析到测试迭代的全流程,自主产出可用的工业级成果。
不断提升的编程能力,也为智能体完成更复杂、更长周期的任务打下坚实基础。千问3.7具有极强的Agent能力,并涌现出跨多种智能体框架的泛化能力,在 Claude Code、OpenClaw、Qwen Code 等框架下都能稳定发挥,有望成为各类智能体系统的可靠底座。通过MCP集成和多智能体协作,Qwen3.7-Max在企业级办公场景实现工作流自动化,在办公自动化基准 SpreadSheetBench-v1上斩获87分,处于顶尖水平,是可靠的办公与生产力助手。以往需专业团队耗时一至两周的复杂项目,现由 Qwen3.7-Max 驱动的智能体可在数小时内完成端到端交付闭环。
实战任务测试中,Qwen3.7-Max还展示了当下智能体所能达到的长程任务极限。在一个模型训练时从未接触过的全新硬件平台——平头哥真武M890芯片上,千问3.7自主完成了一个复杂的推理内核优化任务。在没有任何性能分析数据、硬件文档或新架构的示例内核情况下,千问3.7仅从一个包含任务描述、SGLang Triton 参考实现和评测脚本的空白工作空间出发,从“零”开始持续编程 35 小时,独立进行了 432 次内核评估、1158 次工具调用,完全自主地完成了编写、编译、性能分析与迭代改进的全流程。(文猛)
来源:https://finance.sina.com.cn/tech/shenji/2026-05-20/doc-inhyphnk2663903.shtml
免责声明:文中图文均来自网络,如有侵权请联系删除,心愿游戏发布此文仅为传递信息,不代表心愿游戏认同其观点或证实其描述。
相关文章
更多-
- 支付宝发布四款AI新品,与MiniMax、阶跃星辰达成深度合作
- 时间:2026-05-26
-
- 蚂蚁集团CEO韩歆毅:智能体重构决策权,正在从人转移到Agent
- 时间:2026-05-26
-
- 伊朗央行行长赴卡塔尔讨论被冻结资金问题
- 时间:2026-05-26
-
- 数分钟内,Meta与谷歌旗下 AI 模型安全防护机制遭破解移除
- 时间:2026-05-26
-
- 股海导航_2026年5月26日_沪深股市公告与交易提示
- 时间:2026-05-26
-
- 脉脉林凡:机器人还没到GPT-3.5阶段,但机器人创业正当时
- 时间:2026-05-25
-
- 新加坡 4 月通胀率录得 1.8%,低于预期,同时上调经济增长预期
- 时间:2026-05-25
-
- 美伊谈判持续推进,欧洲股市预计高开
- 时间:2026-05-25
精选合集
更多大家都在玩
大家都在看
更多-
- 原神妮露角色强度解析与培养攻略
- 时间:2026-05-26
-
- 王者荣耀世界游戏设置优化指南
- 时间:2026-05-26
-
- 三角洲行动M7战斗步枪最佳改装方案推荐
- 时间:2026-05-26
-
- 卡厄思梦境卢克卡牌技能效果详解
- 时间:2026-05-26
-
- 异环无名医院快速通关攻略与实用技巧
- 时间:2026-05-26
-
- 王者荣耀世界体力高效规划指南与技巧
- 时间:2026-05-26
-
- 烹饪青菜时,以下哪种做法更能保持营养和口感 蚂蚁庄园今日答案5.25
- 时间:2026-05-26
-
- 光遇5月26日每日任务怎么做 图文攻略详解
- 时间:2026-05-26