腾讯混元发布并开源图生视频模型:让照片开口说话唱歌AI神器
时间:2025-03-06 | 作者: | 阅读:0快科技3月6日消息,今日,腾讯混元宣布发布图生视频模型并对外开源,同时上线对口型与动作驱动等玩法,并支持生成背景音效及2K高质量视频。
企业和开发者可在腾讯云申请使用API接口,用户通过混元AI视频官网即可体验。
开源内容包含权重、推理代码和LoRA训练代码,支持开发者基于混元训练专属LoRA等衍生模型,目前在Github、HuggingFace等主流开发者社区均可下载体验。
据介绍,基于图生视频的能力,用户只需上传一张图片,并简短描述希望画面如何运动、镜头如何调度等,混元即可按要求让图片动起来,变成5秒的短视频,还能自动配上背景音效。
此外,上传一张人物图片,并输入希望对口型”的文字或音频,图片中的人物即可说话”或唱歌”;使用动作驱动”能力,还能一键生成同款跳舞视频。
腾讯混元表示,此次开源的图生视频模型,是混元文生视频模型开源工作的延续,模型总参数量保持 130 亿,模型适用于多种类型的角色和场景,包括写实视频制作、动漫角色甚至CGI角色制作的生成。
福利游戏
相关文章
更多-
- 重拳出击!王者荣耀制售外挂案告破:3人被抓
- 时间:2025-07-04
-
- 手机空间有救了!腾讯介绍微信重大更新:聊天记录支持备份U盘、SSD
- 时间:2025-07-04
-
- 腾讯游戏《碳碳岛》今日全平台上线:温馨治愈、轻松解压
- 时间:2025-07-02
-
- 腾讯应用宝电脑版5.0来了!Windows运行安卓应用 CPU占用更低
- 时间:2025-06-25
-
- 用游戏来治病 医生开处方才能玩!腾讯数字疗法软件获批医疗器械证
- 时间:2025-06-23
-
- 腾讯宣布举办算法大赛 百万奖金邀请全球人才 还能拿腾讯Offer
- 时间:2025-06-16
-
- 高盛提出中国“民营十巨头”:腾讯、阿里、小米等都在列
- 时间:2025-06-16
-
- 腾讯健康上新功能:仅需微信扫一扫 就能给药品“验明正身”
- 时间:2025-06-09
大家都在玩
大家都在看
更多-
- 拼多多月卡会员关闭教程
- 时间:2025-07-10
-
- 币圈前50交易所详解:从币安到Gemini
- 时间:2025-07-10
-
- 抖音客服回应短剧疑碰瓷华为小米:投诉后1-3个工作日内核实处理
- 时间:2025-07-10
-
- iPhone直通手势的旁白声音开启方法
- 时间:2025-07-10
-
- 波卡币杠杆是多少倍
- 时间:2025-07-10
-
- 抖音设置了私密账号怎么看她的视频
- 时间:2025-07-10
-
- 咕咚运动app如何在运动时放音乐
- 时间:2025-07-10
-
- TRX怎么样?TRX排名
- 时间:2025-07-10