大模型视觉测评榜单出炉:Gemini遥遥领先 豆包冲进前三
时间:2025-12-31 | 作者: | 阅读:0快科技12月31日消息,近日,SuperCLUE-VLM多模态视觉语言基准测评12月总榜公布。
谷歌的Gemini-3-pro以83.64分遥遥领先,字节跳动的豆包大模型以73.15分跻身前三,展现出国内大模型的竞争力。
此次测评从基础认知、视觉推理、视觉应用三个维度对多模态大模型进行评估。
榜首Gemini-3-pro在三项细分指标中均表现突出,基础认知得分89.01、视觉推理82.82、视觉应用79.09,全面领先其他模型。
国内阵营中,商汤科技SenseNova V6.5 Pro以75.35分位居第二,字节跳动的豆包视觉版紧随其后,其基础认知得分82.70,甚至超过部分国际竞品,仅在视觉推理环节稍显短板。
百度ERNIE-5.0-Preview、阿里巴巴Qwen3-vl等国内模型也进入前五,其中Qwen3-vl是榜单中首个开源且总分超70的模型。
国际头部模型中,Anthropic的Claude-opus-4-5得分71.44,OpenAI的GPT-5.2(high)仅获69.16分,排名相对靠后。
来源:https://news.pconline.com.cn/2051/20516952.html
免责声明:文中图文均来自网络,如有侵权请联系删除,心愿游戏发布此文仅为传递信息,不代表心愿游戏认同其观点或证实其描述。
相关文章
更多-
- 精粤推出B850M和B650EM两款AURORA系列主板 起售价488元
- 时间:2025-12-31
-
- 2026年“国补”启动:京东一站式服务护航以旧换新资金安全、高效落地
- 时间:2025-12-31
-
- 马斯克官宣xAI买下第三幢建筑:AI训练算力将扩增至近2GW
- 时间:2025-12-31
-
- AOC 预告 2026 年 1 月推出 5K 165Hz / 2K 330Hz 双模显示器 AGP277KX
- 时间:2025-12-31
-
- 罗永浩科技春晚遭遇吐槽 自曝发布会内幕并透露未来可能停办
- 时间:2025-12-31
-
- 董明珠:你一年电费5000元 铝代铜后电费可能飙至1万元!
- 时间:2025-12-31
-
- 京东家政宣布3年投入10亿建设资金 打造养老服务专业人才和AI智能培训体系
- 时间:2025-12-31
-
- 高品质、高口碑、高收益!雅迪华宇电池赋能渠道共赢2026新市场
- 时间:2025-12-31
精选合集
更多大家都在玩
大家都在看
更多-
- 古风二字网名 男生(精选100个)
- 时间:2025-12-31
-
- 漫威超级战争宇宙能量获取全攻略 怎么快速攒满能量,炸毁敌方基地
- 时间:2025-12-31
-
- 绯月絮语礼包码汇总
- 时间:2025-12-31
-
- 彩虹岛匕首带盾牌的操作方法是什么
- 时间:2025-12-31
-
- 橘子沙雕网名男生英文名(精选100个)
- 时间:2025-12-31
-
- 带悦和翊的网名大全男生(精选100个)
- 时间:2025-12-31
-
- 骑士介绍-紫亚《辣妹》
- 时间:2025-12-31
-
- 死亡搁浅2温泉挖掘器怎么用
- 时间:2025-12-31