腾讯混元图像3.0图生图模型发布:自研算法 一句话就能P图
时间:2026-01-26 | 作者: | 阅读:0快科技1月26日消息,今日,腾讯混元宣布,混元图像3.0图生图(HunyuanImage 3.0-Instruct)模型正式发布,支持图片编辑与多图融合。
该模型在元宝同步上线,基于该模型用户可以直接制作表情包、虚拟人物合拍、社交分享、电商海报设计、游戏角色定制、创意图片制作等。
据介绍,混元图像3.0图生图总参数量80亿(激活参数约13亿),采用混合专家(MoE)架构,基于混元图像3.0的原生多模态架构基础模型,引入图生图的多任务数据。
通过指令微调和后训练,实现了对用户输入图像和编辑指令的深度理解与处理。
混元图像3.0图生图指令遵循效果稳定,生成的图片一致性高、真实感强、情绪表现力佳,生成速度明显提升。
模型在收到用户输入的图片和提示词后,首先会先理解图像内容本身,并基于用户的提示词进行推理。
推理出具体的需要进行编辑的区域、详细的编辑步骤以及需要保留的图像区域,形成更加详细的编辑指令,实现良好的输出效果。
据了解,混元图像3.0图生图支持多样化的图片编辑与多图融合能力,比如增、删、改、风格变换、老照片修复、人物与文字修改等图片编辑能力,以及把多张照片中的人物或元素提取出来合成合照与生成新图片等。
在数据层面,混元团队通过图像、视频原始数据挖掘和专家网络合成的方式,构建了千万量级的图生图数据,覆盖80+任务,并在持续训练(CT)阶段注入这些数据,使模型掌握基础编辑功能。
同时,混元团队进一步针对图生图数据构造了思维链,让模型学会先分析用户图像和意图,输出更加详细的编辑指令提升编辑效果。
后训练阶段,混元图像3.0图生图采用自研MixGRPO算法,结合奖励模型多轮迭代,高效对齐用户偏好,大幅提升指令响应和非编辑区域保持一致的效果。
来源:https://news.pconline.com.cn/2077/20775512.html
免责声明:文中图文均来自网络,如有侵权请联系删除,心愿游戏发布此文仅为传递信息,不代表心愿游戏认同其观点或证实其描述。
相关文章
更多-
- 刘强东为宿迁老家送年货 包含数码产品和实用物资
- 时间:2026-01-28
-
- 东方甄选2026财年中报:营收23亿元同比增长5.7% 自营产品GMV占比超50%
- 时间:2026-01-28
-
- 搜狗输入法20周年宣布全面AI化 腾讯混元大模型深度赋能升级
- 时间:2026-01-28
-
- 英特尔确认XeSS-MFG多帧生成技术2月将支持锐炫Arc B580显卡
- 时间:2026-01-28
-
- 卢伟冰发声:质量是高端化通行证!玄戒芯片产品化项目荣获一等奖
- 时间:2026-01-28
-
- 英伟达CEO黄仁勋现身深圳参加年会并与员工互动品尝当地美食
- 时间:2026-01-28
-
- 铁威马D1系列 适配全人群存储需求
- 时间:2026-01-28
-
- 2nm芯片+内存齐涨价:所有手机厂商遭遇双重成本暴击
- 时间:2026-01-28
精选合集
更多大家都在玩
大家都在看
更多-
- 儿童网名高级好听男生(精选100个)
- 时间:2026-01-28
-
- 管大校是什么意思
- 时间:2026-01-28
-
- 逆战未来赛季6升级教程
- 时间:2026-01-28
-
- 支付宝如何开通享攒钱 支付宝享攒钱启用教程
- 时间:2026-01-28
-
- 千兆加速普及!工信部发布2025年全国宽带概况:家庭户均553.4Mbps
- 时间:2026-01-28
-
- 小猿口算怎么改成默认头像
- 时间:2026-01-28
-
- 来不及去爱你来不及去恨你是什么歌
- 时间:2026-01-28
-
- 男生高冷名字现代网名霸气(精选100个)
- 时间:2026-01-28