效果媲美GPT 4o！腾讯混元开源角色定制化图像生成插件 - 心愿游戏

位置：首页 > 新闻资讯 > 效果媲美GPT 4o！腾讯混元开源角色定制化图像生成插件

效果媲美GPT 4o！腾讯混元开源角色定制化图像生成插件

时间：2025-04-18 | 作者： | 阅读：0

4月18日消息，今日，腾讯混元宣布开源定制化图像生成件InstantCharacter，并实现了对开源文生图模型Flux的兼容。

通过该插件，在大模型中，只需要一张图加一句话，就能让任何角色以你想要的姿势出现在任何地方。

据介绍，InstantCharacter的优势在于可以确保角色在不同场景中的一致性和真实性、画质和精度高，同时具有灵活的文本编辑性，用户可以根据需要灵活切换任意场景，让人物生成任意动作。

因此，内容创作者能通过这一插件让生成的角色保持高度一致，能够更高效地创作出符合其需求的视觉作品，可以用于连环画、影片创作等场景。

输入以下原始图片：

+ prompt ：a rabbit is in the kitchen holding a spoon and drinking soup，就能得到下面的图：

+prompt：a rabbit in the city,cyberpunk，就可以得到：

实际的测评中，开源的InstantCharacter实现的效果媲美GPT 4o等业界领先模型。

腾讯混元表示，现有基于学习的方法主要依赖于U-Net架构，但在泛化能力和图像质量上存在局限性，而基于优化的方法则需要针对特定主体进行微调，这不可避免地降低了文本可控性。

为解决这些问题，InstantCharacter利用DiT模型构建了一个创新的框架。

框架引入一个可扩展的适配器（adapter），采用多个transformer encoder，能有效处理开放域的角色特征，并与现代扩散变换器的潜在空间无缝交互，这种设计使得系统能够灵活适应不同的角色特征。

《夸克》非常好用的免费AI浏览器

下载APP查看

来源:https://news.mydrivers.com/1/1042/1042616.htm
免责声明：文中图文均来自网络，如有侵权请联系删除，心愿游戏发布此文仅为传递信息，不代表心愿游戏认同其观点或证实其描述。

相关文章

更多

腾讯混元大模型Hy3已正式发布免费使用实测

时间：2026-07-20
腾讯混元翻译模型Hy-MT2开源：可在手机本地部署没网也能用

时间：2026-05-21
拓竹“印你”手办生成器上线：接入腾讯混元3D大模型一张图打印真人手办

时间：2025-12-13
腾讯混元发布语音数字人模型：仅需上传图像和音频图中主角就能说话唱歌

时间：2025-05-28
腾讯元宝文生图功能重磅升级：混元+DeepSeek双模型支持

时间：2025-05-07
腾讯最强！混元自研深度思考模型T1正式发布：吐字快、能秒回

时间：2025-03-22
秒回！腾讯最新上线快思考模型Turbo S：回答速度提升一倍

时间：2025-02-27

精选合集

更多

大家都在玩

热门话题

大家都在看

更多

iOS 13.5.1电池续航差是电池耗电问题吗

时间：2026-07-25
苹果教育优惠开启附购买攻略

时间：2026-07-25
苹果iOS 14 beta 2 测试版主要更新内容：除细节变化外修复多项Bug

时间：2026-07-25
iOS 14 beta 2 是否解决内存占用过多问题？

时间：2026-07-25
受欢迎的奥特曼游戏有哪些

时间：2026-07-25
iOS 14信息应用5大更新变化

时间：2026-07-25
iOS 14正式版上线时间公布官方全新介绍

时间：2026-07-25
最新苹果iOS 14 Beta 2版本更新内容全解析与升级教程

时间：2026-07-25