小米MiMo-V2.5语音模型正式发布:一句话生成声音、克隆真人音色
时间:2026-04-24 | 作者: | 阅读:0快科技4月24日消息,今日,小米正式发布MiMo-V2.5语音模型,带来MiMo-V2.5-TTS系列与MiMo-V2.5-ASR。
这是一套面向Agent时代的全链路语音模型系列,覆盖识别与合成两大核心能力,让语音的输入与输出都可以被语言自由调度。
在语音合成方面,MiMo-V2.5-TTS系列提供三大模型,分别对应不同创作场景:
首先是MiMo-V2.5-TTS,内置多款高质量精品音色,经过专业调优,发音自然、情感贴合,并支持语速、情绪、语气等精细化控制,开箱即用,满足多场景表达。
其次是MiMo-V2.5-TTS-VoiceDesign,支持通过一句自然语言描述生成全新音色,无需任何参考音频。
用户可从年龄、性别、口音、音质乃至性格气质等多个维度自由定义,例如“低沉略带嘶哑的老年学者”或“元气满满的少女”,模型即可自动生成对应声音形象。
依托大规模预训练能力,模型对复杂、模糊、甚至相互矛盾的描述也能合理解读,而不局限于"男/女/青年/老年"这类粗粒度标签。
第三是MiMo-V2.5-TTS-VoiceClone,主打音色克隆能力,用户仅需提供数秒参考音频,无需训练或微调,即可复刻真人播客、配音演员、品牌代言人,或者用户本人声音。
复刻后的声音不仅保留了原始说话人的音色身份,也保留了气息、节奏、习惯性停顿等个人特征。
同时,克隆音色可继续叠加自然语言指令、音频标签、导演剧本级脚本,实现更高自由度的语音创作。
作为全链路语音模型系列的听觉基座,MiMo-V2.5-ASR在中英双语、中文方言、Code-Switch、强噪音、多说话人、高知识密度等复杂真实场景下均达到业界领先水平。
目前,MiMo-V2.5-TTS、MiMo-V2.5-TTS-VoiceDesign、MiMo-V2.5-TTS-VoiceClone已在Xiaomi MiMo API开放平台限时免费。
来源:https://news.pconline.com.cn/2136/21367631.html
免责声明:文中图文均来自网络,如有侵权请联系删除,心愿游戏发布此文仅为传递信息,不代表心愿游戏认同其观点或证实其描述。
相关文章
更多-
- 白敬亭盛赞问界M6驾驶体验 期待驾驶新车欣赏沿途风景
- 时间:2026-04-24
-
- 路由器TOP3加持!中兴摄像头2025年销量同比增长超100%
- 时间:2026-04-24
-
- DeepSeek-V4预览版正式上线:百万字上下文能力 支持复杂场景需求
- 时间:2026-04-24
-
- 雷军宣布小米YU7 GT新车5月底发布 超千匹马力极速300km/h
- 时间:2026-04-24
-
- 何小鹏预测机器人产业将超越新能源汽车发展速度 明年小鹏门店10%销售由机器人完成
- 时间:2026-04-24
-
- OpenAI发布GPT-5.5模型:智能体能力大幅提升 成本降至1/35
- 时间:2026-04-24
-
- SSD全系上调10%!三星金士顿同时出手:4月第二波涨价潮杀到
- 时间:2026-04-24
-
- 何小鹏称自动驾驶L3仍属辅助范畴 全球行业呈现L2直跳L4趋势
- 时间:2026-04-24
精选合集
更多大家都在玩
大家都在看
更多-
- 卡包荒野新手开局怎么用刘易斯简单攻略
- 时间:2026-04-23
-
- 出征吧勇士公测时间是什么时候
- 时间:2026-04-23
-
- 异环粉毛是谁
- 时间:2026-04-23
-
- 新一代国屏之光!京东方为OPPO Find X9 Ultra独家供应2K直屏
- 时间:2026-04-23
-
- 异环海上钓鱼玩法详解
- 时间:2026-04-23
-
- 免费学粤语的App推荐:2024年好用粤语学习软件下载排行榜
- 时间:2026-04-23
-
- 2026必玩的可口披萨主题游戏推荐汇总
- 时间:2026-04-23
-
- 合康新能:2026一季报阶段性承压,正蓄力新一轮增长
- 时间:2026-04-23