中文大模型测评出炉:豆包跻身全球第一梯队 小米MiMo上榜
时间:2026-03-30 | 作者: | 阅读:0快科技3月30日消息,中文大模型基准测评SuperCLUE发布2026年3月最新结果,22款国内外主流模型参与角逐。
字节跳动旗下豆包(Doubao-Seed-2.0-pro-260215(high))以71.53分拿下国内第一,成功跻身全球第一梯队;小米集团的MiMo-V2系列两款模型均顺利上榜。
本次测评覆盖数学推理、科学推理、代码生成等六大核心任务,全面检验模型综合能力。海外闭源模型依旧占据总分前列,Anthropic的Claude-Opus-4.6(max)、Google的Gemini-3.1-Pro-Preview(high)和OpenAI的GPT-5.4(xhigh)分列前三。
豆包则紧随其后,总分仅与GPT-5.4相差0.95分,实现全方位追赶,在智能体任务规划维度更是反超部分海外模型,跻身全球前五。
小米此次有两款模型入选测评榜单,其中MiMo-V2-Pro以60.67分位列闭源模型前列,在数学推理任务中取得84.03分的亮眼成绩;开源版本MiMo-V2-Flash虽以49.97分排名靠后,但在代码生成等细分场景中表现出一定潜力。
测评还显示,国产模型整体表现亮眼,开源赛道尤为突出,Kimi-K2.5-Thinking、Qwen3.5-397B-A17B-Thinking等国产开源模型包揽开源榜前三,大幅领先海外同类模型。
来源:https://news.pconline.com.cn/2122/21227532.html
免责声明:文中图文均来自网络,如有侵权请联系删除,心愿游戏发布此文仅为传递信息,不代表心愿游戏认同其观点或证实其描述。
相关文章
更多-
- 六部门公布2025年数字适老助残典型案例 讯飞晓医、讯飞听见双双入选
- 时间:2026-04-11
-
- 理想汽车CEO李想朋友圈飙脏话后二次发声:怒斥某日系品牌持续拉踩
- 时间:2026-04-11
-
- 理想汽车CEO李想指控某日系品牌雇佣水军恶意拉踩 将采取法律手段维权
- 时间:2026-04-11
-
- 法国政府宣布放弃Windows系统 全面转向Linux开源解决方案
- 时间:2026-04-11
-
- 三一重卡董事长梁林河谈电动重卡推广历程:从国内质疑到海外拓展
- 时间:2026-04-11
-
- 仅118元搞定信号黑洞 腾达发布泰山AX3000 Ultra路由器
- 时间:2026-04-11
-
- 夏天神器来了!徕芬首款折叠小风扇官宣 轻松装入口袋
- 时间:2026-04-11
-
- 理想汽车李想朋友圈喊话:伪军往往比鬼子更×× 车企也不例外
- 时间:2026-04-11
精选合集
更多大家都在玩
热门话题
大家都在看
更多-
- 供电更稳了 成都建成西南首个500千伏双环网 承载能力超2500万千瓦
- 时间:2026-04-11
-
- 惊爆 仙境传说重生公测时间大,错过等何时
- 时间:2026-04-11
-
- 改进矩阵工厂在哪里及吉普车制造方法图文详解
- 时间:2026-04-11
-
- 惊爆 魔法工艺游戏究竟藏着哪些令人心动的套装
- 时间:2026-04-11
-
- 空相:无为是行官网在哪下载 最新官方下载安装地址
- 时间:2026-04-11
-
- 惊爆 远光84夜巡玩法大,绝对让你意想不到
- 时间:2026-04-11
-
- 梦幻西游属性点切换攻略大 2026 年必看找谁切换属性点
- 时间:2026-04-11
-
- OpenAI指控马斯克临阵变更诉讼诉求 千亿赔偿案开庭前夕陷法律混战
- 时间:2026-04-11