DeepSeek开源OCR 2模型实现视觉编码突破 性能显著提升接近人类逻辑
时间:2026-01-27 | 作者: | 阅读:0DeepSeek团队今日发布《DeepSeek-OCR 2: Visual Causal Flow》论文并开源了DeepSeek-OCR 2模型。据悉,该模型采用创新的DeepEncoder V2架构,实现了视觉编码从固定扫描向语义推理的范式转变,可让AI能够根据图像的含义动态重排图像的各个部分,更接近人类的视觉编码逻辑。
据悉,在维持极高数据压缩效率的同时,DeepSeek-OCR 2在多项基准测试和生产指标上均取得了显著突破。模型仅需256到1120个视觉Token即可覆盖复杂的文档页面,这在同类模型中处于极低水平,显著降低了下游LLM的计算开销。在OmniDocBench v1.5评测中,其综合得分达到91.09%,较前代提升了3.73%,特别是在阅读顺序识别方面表现出了更强的逻辑性。
来源:https://news.pconline.com.cn/2078/20788192.html
免责声明:文中图文均来自网络,如有侵权请联系删除,心愿游戏发布此文仅为传递信息,不代表心愿游戏认同其观点或证实其描述。
相关文章
更多-
- 显卡功耗破天际!微星RTX 5090 Lightning Z显卡2500W BIOS流出
- 时间:2026-02-17
-
- 安钛克发布全新ANTEC 900全塔机箱 支持多规格主板与强大散热系统
- 时间:2026-02-17
-
- Intel Panther Lake续航飞跃!重度电池测试与苹果M5相当
- 时间:2026-02-17
-
- 春晚宇树机器人摔倒了!王兴兴回应:导演安排的剧情需要
- 时间:2026-02-17
-
- 春节不要乱发这种视频 有法律风险
- 时间:2026-02-17
-
- 宇树人形机器人惊艳亮相春晚 创造多项全球第一纪录
- 时间:2026-02-17
-
- 松延动力机器人亮相央视春晚 展示高动态运动能力与具身智能技术
- 时间:2026-02-17
-
- 豆包AI除夕互动量突破19亿次 Seedance2.0技术助力央视春晚创新
- 时间:2026-02-17
精选合集
更多大家都在玩
大家都在看
更多-
- 索尼PS6会用AMD RDNA5:可惜不是完整版!
- 时间:2026-02-17
-
- 修仙搜打撤公测时间是什么时候
- 时间:2026-02-17
-
- 斗破苍穹苏千技能一览
- 时间:2026-02-17
-
- 方舟生存进化河狸窝分布图
- 时间:2026-02-17
-
- 斗破苍穹势力玩法
- 时间:2026-02-17
-
- 西游大乱斗兑换码是什么
- 时间:2026-02-17
-
- 两年都有货!Intel GPU年更计划:Xe3P今年发 Xe-Next明年接力
- 时间:2026-02-17
-
- 龙岛异兽起源龙币怎么兑换
- 时间:2026-02-17