DeepSeek大范围开放识图模式实现图文交互并公布高效多模态技术框架 - 心愿游戏

位置：首页 > 新闻资讯 > DeepSeek大范围开放识图模式实现图文交互并公布高效多模态技术框架

DeepSeek大范围开放识图模式实现图文交互并公布高效多模态技术框架

时间：2026-05-09 | 作者： | 阅读：0

据悉，DeepSeek已大范围开放其“识图模式”供用户体验，该模式并非简单的文字识别，而是具备了真正的图片理解能力。在实测中，它能识别文物并推断其历史风格，解答高难度空间推理题，理解网络梗图情绪，并能将截图中的代码或界面解析并还原为可交互的HTML代码。

同时，DeepSeek公布了其多模态模型的技术细节，核心是“以视觉原语思考”框架。该框架将点、边界框等视觉元素直接融入推理链，解决了传统模型在密集场景中的“指代鸿沟”问题，使推理更精准。此外，该框架在算力上极具效率，处理图片消耗的tokens远低于其他主流模型，并在多项基准测试中达到领先水平。

需要指出的是，目前上线的识图模式仍标注为内测，功能集中于视觉理解与分析，暂不支持图像生成或视频理解等更广泛的多模态功能。

《夸克》非常好用的免费AI浏览器

下载APP查看

来源:https://news.pconline.com.cn/2146/21468331.html
免责声明：文中图文均来自网络，如有侵权请联系删除，心愿游戏发布此文仅为传递信息，不代表心愿游戏认同其观点或证实其描述。

相关文章

更多

技术驱动资源重构：AI赋能软文营销开启高质量发展新纪元

时间：2026-05-09
迪士尼新CEO上任首刀砍向漫威核心视觉团队遭整体裁撤引行业震动

时间：2026-05-09
MiniMax大模型认不出马嘉祺！官方终于给出原因

时间：2026-05-09
CHERRY推出新款XTRFY K5 Ultra磁轴键盘采用升级TMR魔晶磁轴与半透明外壳设计

时间：2026-05-09
无忧传媒签约达人王暖暖因工作压力身体不适送医抢救公司宣布暂停其工作直至完全康复

时间：2026-05-09
苹果推送iOS/iPadOS 26.5 RC 2更新预计下周正式版将带来RCS加密等新功能。

时间：2026-05-09
PITAKA 「日落2.0·加州旧梦」芳纶纤维手机壳发布续写日落时刻新篇章

时间：2026-05-09
共享微出行巨头Lime正式递交IPO申请去年营收增长但亏损同步扩大

时间：2026-05-09

精选合集

更多

大家都在玩

热门话题

大家都在看

更多

iPhone白噪音开启教程苹果手机背景声音设置方法

时间：2026-05-09
iCloud空间不足照片会丢失吗满额后注意事项与解决方法

时间：2026-05-09
小米手机内存清理全攻略彻底清除系统缓存方法详解

时间：2026-05-09
男生霸气网名大全：精选100个，怎么选？为什么酷？

时间：2026-05-09
男生网名大全：100个精选推荐，怎么选？为什么火？

时间：2026-05-09
《幻灵召唤师》午夜挽歌版本重磅来袭

时间：2026-05-09
拼多多小编推荐机制解析如何提升商品入选概率

时间：2026-05-09
男生网名“枫落无痕”好听吗？精选100个推荐

时间：2026-05-09