大模型视觉测评榜单出炉:Gemini遥遥领先 豆包冲进前三
时间:2025-12-31 | 作者: | 阅读:0快科技12月31日消息,近日,SuperCLUE-VLM多模态视觉语言基准测评12月总榜公布。
谷歌的Gemini-3-pro以83.64分遥遥领先,字节跳动的豆包大模型以73.15分跻身前三,展现出国内大模型的竞争力。
此次测评从基础认知、视觉推理、视觉应用三个维度对多模态大模型进行评估。
榜首Gemini-3-pro在三项细分指标中均表现突出,基础认知得分89.01、视觉推理82.82、视觉应用79.09,全面领先其他模型。
国内阵营中,商汤科技SenseNova V6.5 Pro以75.35分位居第二,字节跳动的豆包视觉版紧随其后,其基础认知得分82.70,甚至超过部分国际竞品,仅在视觉推理环节稍显短板。
百度ERNIE-5.0-Preview、阿里巴巴Qwen3-vl等国内模型也进入前五,其中Qwen3-vl是榜单中首个开源且总分超70的模型。
国际头部模型中,Anthropic的Claude-opus-4-5得分71.44,OpenAI的GPT-5.2(high)仅获69.16分,排名相对靠后。
来源:https://news.pconline.com.cn/2051/20516952.html
免责声明:文中图文均来自网络,如有侵权请联系删除,心愿游戏发布此文仅为传递信息,不代表心愿游戏认同其观点或证实其描述。
相关文章
更多-
- 俞敏洪谈人工智能对教育行业冲击 称中国中小学教师面临重大转型挑战
- 时间:2026-01-24
-
- 俞敏洪公开邀请创业者合作 聚焦农村教育及人工智能助农助老领域
- 时间:2026-01-24
-
- OPPO Find X9 Ultra渲染图曝光:拼接材质设计+7300mAh大电池+13.2倍光学变焦
- 时间:2026-01-24
-
- 俞敏洪回应被称'老登':敬畏年轻一代 新东方文旅拓展老年市场
- 时间:2026-01-24
-
- 央视解读12306购票页面标识密码:铺字选卧铺兑字积分换票
- 时间:2026-01-24
-
- 谷歌收购3D图像生成初创企业Common Sense Machines 强化AI领域布局
- 时间:2026-01-24
-
- 华硕推出天选Air锐龙AI Max游戏本 联想拯救者Legion 7新品曝光
- 时间:2026-01-24
-
- 2026高口碑扫地机器人推荐:热门机型真实表现大揭秘
- 时间:2026-01-24
精选合集
更多大家都在玩
大家都在看
更多-
- 非主流可爱网名男生霸气(精选100个)
- 时间:2026-01-24
-
- PUA男是什么意思
- 时间:2026-01-24
-
- 抖音如何关闭免密支付?抖音关闭免密支付方法
- 时间:2026-01-24
-
- 淘宝双十一幻想岛总动员等级红包玩法攻略
- 时间:2026-01-24
-
- 男生雅称网名霸气(精选100个)
- 时间:2026-01-24
-
- 丑萌是什么意思
- 时间:2026-01-24
-
- qq如何设置手势密码锁?qq设置手势密码锁的方法步骤
- 时间:2026-01-24
-
- 双十一助力一般是几天的
- 时间:2026-01-24