阿里两款千问语音新模型齐发：动物也能“原声”说人话了！ - 心愿游戏

位置：首页 > 新闻资讯 > 阿里两款千问语音新模型齐发：动物也能“原声”说人话了！

阿里两款千问语音新模型齐发：动物也能“原声”说人话了！

时间：2025-12-24 | 作者： | 阅读：0

12月24日消息，阿里今日升级语音模型家族Qwen3-TTS，发布音色创造Qwen3-TTS-VD和音色克隆Qwen3-TTS-VC两款全新模型。

在生成效果上，全新模型的表现显著超越GPT-4o。

Qwen3-TTS新模型可实现DIY声音设计和像素级音色模仿，甚至让动物“原生”开口说人话。

其音色自然、效果稳定、生成高效，可大大加速语音大模型在有声小说、AI漫剧、影视配音等多专业领域落地。

其中，音色创造模型支持通过自然语言描述生成定制化的音色形象，具有极强的可控生成能力。

在指令遵循评测InstructTTS-Eval中，Qwen3-TTS综合表现显著优于GPT-4o-mini-tts、Mimo-audio-7b-instruct等同类模型。

在强调表达一致性与沉浸感的角色扮演测试中，模型整体效果超过Gemini-2.5-pro-preview-tts。

音色克隆模型则专注于“音色模仿”，仅需3秒的语音样本，即可精准复刻原始声线。

在MiniMax TTS Multilingual Test Set测试集中，Qwen3-TTS-VC显示出其在多语言语音准确性与稳定性方面的优势。

它的平均词错误率（WER）指标上表现突出，整体结果全面优于 MiniMax、ElevenLabs 以及 GPT-4o-Audio-Preview。

此外，Qwen3-TTS-VC 还可自动生成英文、德语、意大利语、葡萄牙语、西班牙语、日语、韩语、法语、俄语等9种语音。

值得注意的是，它连动物音色也能复刻，只需录入家中宠物的原始声音，就能用模型让它“开口说人话”。

目前，两款模型均在阿里云百炼平台上架Flash版本API，响应速度极快，可完全满足工业级语音合成需求。

千问语音生成模型系列Qwen3-TTS仍在不断升级，目前可支持50种音色，10大主流语言和闽南语、吴语、粤语、四川话、北京话、南京话、天津话、陕西话等8大方言，可真实还原地方口音特色与语言神韵。

《夸克》非常好用的免费AI浏览器

下载APP查看

来源:https://news.mydrivers.com/1/1094/1094447.htm
免责声明：文中图文均来自网络，如有侵权请联系删除，心愿游戏发布此文仅为传递信息，不代表心愿游戏认同其观点或证实其描述。

相关文章

更多

精选合集

更多

大家都在玩

热门话题

大家都在看

更多

iOS 13.5.1电池续航差是电池耗电问题吗

时间：2026-07-25
苹果教育优惠开启附购买攻略

时间：2026-07-25
苹果iOS 14 beta 2 测试版主要更新内容：除细节变化外修复多项Bug

时间：2026-07-25
iOS 14 beta 2 是否解决内存占用过多问题？

时间：2026-07-25
受欢迎的奥特曼游戏有哪些

时间：2026-07-25
iOS 14信息应用5大更新变化

时间：2026-07-25
iOS 14正式版上线时间公布官方全新介绍

时间：2026-07-25
最新苹果iOS 14 Beta 2版本更新内容全解析与升级教程

时间：2026-07-25