智谱新MaaS:10B级效果最好VLM上线,Agents应用空间登场
时间:2025-07-04 | 作者: | 阅读:07月2日,智谱开放平台产业生态大会在上海浦东张江科学会堂隆重举行。本次大会吸引了众多政府领导、头部开发者与企业用户齐聚一堂,集中展示了智谱在多模态智能与maas生态方面取得的突破性成果。会上,浦东创投集团和张江集团联合宣布对智谱进行战略投资,为构建可信的人工智能基础设施注入强大动力。
智谱CEO张鹏在主题演讲中揭晓了智谱携手生态伙伴迈向AGI(通用人工智能)进程中的两大重磅成果:其一是开源推出新一代通用视觉语言模型GLM-4.1V-Thinking,该模型以推理能力为核心优势,刷新了10B级别多模态模型性能纪录;其二是MaaS平台正式上线Agent聚合平台「应用空间」,全面激活行业场景下的AI能力,并联动Z基金启动“Agent开拓者专项扶持计划”。
此外,在大会的主题演讲环节中,智谱高级副总裁吴玮杰、蒙牛集团副总裁兼首席数智官李琤洁、中国银联金融科技研究院副院长吕旭峰分别分享了大模型落地实践的经验。在随后的圆桌讨论环节,捏TA创始人胡修涵、AiPPT联合创始人王振同、flowith CMO拐子以及张江智荟总经理沈玲围绕“bigmodel原生创业”这一话题展开深入交流,碰撞出诸多精彩观点。
全新发布:GLM-4.1V-Thinking
7月2日,智谱正式开源并发布视觉语言大模型GLM-4.1V-Thinking,标志着GLM系列视觉模型实现了从感知到认知的关键跨越。
GLM-4.1V-Thinking是一款支持图像、视频、文档等多模态输入的通用推理型大模型,专为处理复杂认知任务而设计。它基于GLM-4V架构,引入“思维链推理机制(Chain-of-Thought Reasoning)”,并通过“课程采样强化学习策略(RLCS, Reinforcement Learning with Curriculum Sampling)”,系统提升了跨模态因果推理能力与稳定性。
其轻量版本GLM-4.1V-9B-Thinking控制在10B参数规模内,在保持部署效率的同时实现性能飞跃。该模型在MMStar、MMMU-Pro、ChartQAPro、OSWorld等28项权威评测中,有23项达到10B级模型最佳成绩,其中18项甚至超越参数量高达72B的Qwen-2.5-VL,充分展现了小参数模型的巨大潜力。
该模型在以下任务中表现尤为出色,展现出高度的通用性与稳健性:
- 图文理解(Image General):精准识别并综合分析图像与文本信息;
- 数学与科学推理(Math & Science):支持复杂题解、多步演绎与公式理解;
- 视频理解(Video):具备时序分析与事件逻辑建模能力;
- GUI 与网页智能体任务(UI2Code、Agent):理解界面结构,辅助自动化操作;
- 视觉锚定与实体定位(Grounding):实现语言与图像区域精准对齐,提升人机交互可控性。
目前,GLM-4.1V-9B-Thinking已同步在Hugging Face与魔搭社区开源。包括两个版本:GLM-4.1V-9B-Base基座模型,旨在帮助研究者探索视觉语言模型的能力边界;GLM-4.1V-9B-Thinking,则具备深度思考和推理能力,适合实际应用体验。
在面对科学研究、教育、自主Agent及多模态助手等复杂现实应用场景时,增强后的GLM-4.1V-Thinking能够真正解决开放式、信息丰富的行业问题,如长视频理解、图像问答、学科解题、文字识别、文档解读、Grounding、GUI Agent和代码生成。
GLM-4.1V-Thinking是通向通用多模态推理的重要一步。未来,我们将通过更优的奖励模型、更高效的RL算法持续优化该系列模型;同时探索视觉与语言模态之间的协同增强机制,力求在通用推理能力上实现重大突破。
MaaS应用空间:面向千行百业的AI生态市场
7月2日,智谱正式推出全新生态平台——「Agent应用空间」,并同步启动「Agents开拓者计划」,投入数亿元资金,全面扶持AI Agents创业团队。「Agent应用空间」是一个面向企业客户和开发者的AI Agent能力聚合平台,汇聚优秀开发者与企业资源。平台整合了丰富的Agent应用与模型插件(MCP),提供即开即用、灵活编排的组件服务与Agent应用,让企业无需自建大模型团队,即可轻松接入成熟、安全、可控的Agent能力。
「Agent应用空间」配备了一站式开发工具链、完整的模型调用接口与灵活的应用组合机制,成为推动“AI原生化”升级的重要引擎。正如智谱CEO张鹏所言:“AI的未来,不仅是模型性能的比拼,更是生产范式的重构。在这个时代,每一位开发者、设计者、创业者,都是智能生态的共同缔造者。”借助智谱的基座模型、多模态模型与MaaS平台,每个人都能用AI表达想法、生成内容、构建应用,甚至创办一家AI原生公司。这是一场关于智能的共创之旅,也是一次属于开发者的未来变革。
福利游戏
相关文章
更多-
- nef 格式图片降噪处理用什么工具 效果如何
- 时间:2025-07-29
-
- 邮箱长时间未登录被注销了能恢复吗?
- 时间:2025-07-29
-
- Outlook收件箱邮件不同步怎么办?
- 时间:2025-07-29
-
- 为什么客户端收邮件总是延迟?
- 时间:2025-07-29
-
- 一英寸在磁带宽度中是多少 老式设备规格
- 时间:2025-07-29
-
- 大卡和年龄的关系 不同年龄段热量需求
- 时间:2025-07-29
-
- jif 格式是 gif 的变体吗 现在还常用吗
- 时间:2025-07-29
-
- hdr 格式图片在显示器上能完全显示吗 普通显示器有局限吗
- 时间:2025-07-29
大家都在玩
热门话题
大家都在看
更多-
- 币圈主流币都是挖出来的吗?币圈主流币有哪些
- 时间:2025-08-24
-
- 什么是加密货币中的地址投毒攻击,如何避免地址投毒攻击?
- 时间:2025-08-24
-
- 山寨币消亡率有多少,你手里的加密货币会归零吗?
- 时间:2025-08-24
-
- 什么是熊市袭击?巨鲸如何在加密货币交易中使用它们获利?
- 时间:2025-08-24
-
- 币圈三角形图形是什么?币圈三角形图形怎么看?
- 时间:2025-08-24
-
- 币圈十大实用工具:从实时行情监控到数据分析、资产管理
- 时间:2025-08-24
-
- 怎么看加密货币k线图?币圈k线图基础知识分析图解
- 时间:2025-08-24
-
- 加密鲸鱼是什么?如何识别加密货币鲸鱼?为什么很重要?
- 时间:2025-08-24