位置:首页 > 新闻资讯 > 阿里发布Qwen3.5-Omni全模态大模型 多模态能力超越Gemini-3.1 Pro

阿里发布Qwen3.5-Omni全模态大模型 多模态能力超越Gemini-3.1 Pro

时间:2026-03-31  |  作者:  |  阅读:0

阿里发布新一代全模态大模型Qwen3.5-Omni,在音视频理解、识别、交互等215项任务中取得SOTA(性能最佳),超越Gemini-3.1 Pro,成为目前全球最强的全模态大模型之一。

该模型拥有极强的音视频理解与实时交互能力,能够对音视频内容生成详细且可控的结构化描述,可识别语言和方言数量多达113种,还涌现出了音视频Vibe Coding能力,用户对着镜头阐述需求,就能让模型自主生成App、网页、游戏等复杂产品代码。

Qwen3.5-Omni采用混合注意力MoE架构,在海量文本、视觉以及超过1亿小时的音视频数据上进行了原生多模态预训练,可实现图片、视频、语音、文字等全模态内容的输入与输出。

在多项测试中,Qwen3.5-Omni表现优异,例如在聚焦视听交互能力的DailyOmni、QualcommInteractive、Omni Cloze等测试中得分领先Gemini-3.1 Pro,在检测嘈杂环境抗干扰能力的WenetSpeech测试中错误率远低于Gemini。

普通用户可前往Qwen Chat免费体验,开发者和企业可通过阿里云百炼平台调用Qwen3.5-Omni模型,每百万Tokens输入不到0.8元,价格优势显著。

来源:https://news.pconline.com.cn/2123/21233292.html
免责声明:文中图文均来自网络,如有侵权请联系删除,心愿游戏发布此文仅为传递信息,不代表心愿游戏认同其观点或证实其描述。

相关文章

更多

精选合集

更多

大家都在玩

热门话题

大家都在看

更多