腾讯混元发布语音数字人模型:仅需上传图像和音频 图中主角就能说话唱歌
时间:2025-05-28 | 作者: | 阅读:05月28日消息,腾讯混元发布语音数字人模型HunyuanVideo-Avatar。仅需一张图和一段音频,就能让图中的主角自然的说话、唱歌。
据悉,HunyuanVideo-Avatar由腾讯混元视频大模型及腾讯音乐天琴实验室MuseV技术联合研发。
该模型支持头肩、半身与全身景别,以及多风格、多物种与双人场景,面向视频创作者提供高一致性、高动态性的视频生成能力。
用户上传人物图像与音频,HunyuanVideo-Avatar模型就会自动理解图片与音频。让图中人物自然地说话或唱歌,生成包含自然表情、唇形同步及全身动作的视频。
当用户输入一张拿着吉他的坐在沙滩的女性图片和一段抒情音乐。
模型会自行理解“她在海边弹吉他,唱着非常抒情的歌曲”,并生成一段图中人物在弹唱的视频。
目前,HunyuanVideo-Avatar适用于短视频创作、电商与广告等多种应用场景。
可以生成人物在不同场景下的说话、对话、表演等片段,快速制作产品介绍视频或多人互动广告,降低制作成本。
据介绍,HunyuanVideo-Avatar的单主体能力已经开源,并在腾讯混元官网上线,目前支持上传不超过14秒的音频进行视频生成,后续将逐步上线和开源其他能力。
福利游戏
相关文章
更多-
- 中国团队斩获世界大奖:隔空1.2万里操控机器人 灵巧如人类
- 时间:2025-05-29
-
- 腾讯京东等巨头联手接盘48座万达广场:涉及资产估值或超千亿元
- 时间:2025-05-27
-
- 腾讯混元T1-Vision上线元宝:一张图片就能分析出产品研发成本
- 时间:2025-05-13
-
- 腾讯曝光内部工位 网友称这么大又奢华还带拐角
- 时间:2025-05-10
-
- 10倍精度升级!腾讯混元3D模型v2.5版本发布
- 时间:2025-04-23
-
- 腾讯开启史上最大就业计划 三年将新增28000校招岗位
- 时间:2025-04-17
-
- 国内首个!腾讯捐赠1亿元 让文物真正“活”过来
- 时间:2025-04-14
-
- 争议太大!国服妮姬紧急取消庆余年联动引网友吐槽
- 时间:2025-04-13
精选合集
更多大家都在玩
大家都在看
更多-
- 《云顶之弈》S14街头金丝狗阵容推荐
- 时间:2025-05-30
-
- Solana历史价格走势图 Solana最全历史价格明细回顾
- 时间:2025-05-30
-
- 《梦幻西游》驯龙高手联动祥瑞获得方法
- 时间:2025-05-30
-
- 《无畏契约》夜市4月10号具体开启时间介绍
- 时间:2025-05-30
-
- 狗狗币:一分钟速览柴犬币的魅力
- 时间:2025-05-30
-
- 《梦幻西游》重铸黄金甲任务攻略
- 时间:2025-05-30
-
- 5.5折!小米云服务会员618活动来了:50GB包年39元
- 时间:2025-05-30
-
- 英雄联盟手游瑞兹符文怎么选
- 时间:2025-05-30