中兴手机智能体AI性能断层领先登顶
时间:2026-06-11 | 作者:318050 | 阅读:0手机智能体“大考”揭晓:中兴斩获断层第一
6月10日,手机智能体领域迎来了一次硬核“大考”。AgentCLUE-Mobile手机GUI Agent基准测评成绩正式出炉。
结果令人瞩目:中兴GUI手机智能体一举拿下断层第一,领先幅度惊人,第二名被远远甩在身后。
测评核心:考验AI的真实“动手能力”
这次测评的核心非常明确:这些智能体能否在实际手机APP中帮用户自动完成操作?例如点外卖、订车票、查信息等典型任务。简单说,就是考验AI在真实手机环境下的“动手能力”。
具体成绩:断崖式领先18分
中兴产品得分91.29分,而排在第二位的智谱AI旗下Open-AutoGLM仅得73.11分。差距超过18分,在同类技术评测中属于断崖式优势。
幕后功臣:自研Nebula-Pilot V1.0 27B模型
支撑这一成绩的是中兴自研的Nebula-Pilot V1.0 27B模型,采用API调用方式运行。值得关注的是,本次测评前几名全部采用API调用方案,整体得分明显高于本地部署模型。
- 本地部署方案中,得分最高的是阿里MAI-UI,仅65.91分。
- 字节的UI-TARS成绩更低,只有30.19分。
这一细节耐人寻味:API调用的灵活性和资源利用效率,在手机场景下优势明显。
机构排名:中兴、智谱、阿里位居前三
从机构排名来看:
- 中兴通讯稳居榜首
- 智谱AI紧随其后,位列第二
- 阿里巴巴拿下第三
- 阶跃星辰、字节跳动产品排在更靠后位置
不同方案之间的差距,归根结底在于模型能力与调用方式的差异。中兴大模型在界面理解、控件识别、连续操作等关键环节表现更加稳定扎实。
用户期待越来越高:自动跑腿成刚需
如今,大家对手机智能体的期待越来越高。谁都希望它能自动跑腿、处理重复性操作,让自己省点力气。本次测评结果说明,中兴在手机端智能交互的技术储备是实打实的,无论是模型能力还是整体方案都相当成熟。
从不同调用方案的对比来看
API调用方案的整体表现明显优于本地部署模型。中兴采用的API方案稳定性和灵活性更强,这也是它能取得高分的核心原因之一。
可以预期,接下来这类手机智能体产品会越来越多。大家手里的手机,使用体验也会变得更省心、更聪明。
来源:整理自互联网
免责声明:文中图文均来自网络,如有侵权请联系删除,心愿游戏发布此文仅为传递信息,不代表心愿游戏认同其观点或证实其描述。
相关文章
更多-
- 国家互联网应急中心:部分智能体Skills暗藏越狱与挖矿风险
- 时间:2026-06-09
-
- 微信朋友圈加码AI Agent!腾讯美团京东铁三角成型 直面阿里字节
- 时间:2026-06-09
-
- 高通技术公司宣布车端人工智能Claw生态计划 将智能体AI引入智能座舱
- 时间:2026-06-05
-
- 微信AI要来了!腾讯单日大涨超10% 市值一天增4000亿
- 时间:2026-06-02
-
- 不再是资本烧钱黑洞!周鸿祎:AI圈迎来重要拐点 开始赚钱
- 时间:2026-06-01
-
- 如何一步步使用豆包别人智能体详细教程
- 时间:2026-06-01
-
- 突破3亿笔!全球首个大规模商用AI原生支付基建诞生 兼容95%智能体框架
- 时间:2026-05-26
-
- 谷歌Antigravity 2.0发布:多智能体编程优化与定时任务新增详解
- 时间:2026-05-20
精选合集
更多大家都在玩
大家都在看
更多-
- 高清画质投屏软件推荐实用稳定低延迟屏幕镜像工具
- 时间:2026-06-10
-
- 钓鱼种田游戏大全
- 时间:2026-06-10
-
- 小学一年级拼音跟读软件排行榜 好用易上手的APP推荐
- 时间:2026-06-10
-
- 哥特王朝重制版哪些技能值得学
- 时间:2026-06-10
-
- 2026年高音质无广告功能全音乐App下载推荐
- 时间:2026-06-10
-
- 免费好用的一键去水印APP推荐,高清无痕去除视频图片水印
- 时间:2026-06-10
-
- CodeBuddy能否实现前端无障碍代码改造
- 时间:2026-06-10
-
- 支付宝授权登录过的软件查看方法
- 时间:2026-06-10





