位置:首页 > 新闻资讯 > 网易有道发布Confucius4-TTS语音模型 支持14语种无口音免文本克隆并全量开源

近日,网易有道发布“子曰4.0”TTS语音合成引擎Confucius4-TTS。据悉,该模型是业内首个支持14种语言跨语种无口音、且无需参考文本即可完成语音克隆的开源模型,在跨语种语音克隆、免参考文本建模等关键维度上达到国际前沿水平,现已面向全球用户全量开源。

目前,该模型已全面支持中文、英语、西班牙语等14种语言的自然流利表达。用户仅需提供3秒音频素材,模型即可完成音色克隆,克隆音色与原声相似度超过85%,克隆任务准确度高达97%。同时,它支持14种语言无缝切换,消除跨语种口音壁垒,并能实现情感韵律的无损跨语种迁移。

据悉,Confucius4-TTS引入了GPT式语义大模型作为主干,并采用Flow Matching流匹配生成框架。该模型采用Apache开源协议,面向全球开发者开放完整模型权重和配套工具链,商用没有限制。开发者可以下载54G完整资源包进行本地离线部署运行。

来源:https://news.pconline.com.cn/2177/21776382.html
免责声明:文中图文均来自网络,如有侵权请联系删除,心愿游戏发布此文仅为传递信息,不代表心愿游戏认同其观点或证实其描述。

相关文章

更多

精选合集

更多

大家都在玩

热门话题

大家都在看

更多