开发者发现DeepSeek新模型线索，MODEL1标识符预示新一代大模型架构

时间：2026-01-21 | 作者： | 阅读：0

【太平洋科技快讯】1 月 21 日消息，据开发者近期在 GitHub 上的发现，DeepSeek 更新了一系列 FlashMLA 相关代码。在涉及的 114 个文件中，有 28 处提到了未知的“MODEL1”大模型标识符，引发业界关注。

据悉，“MODEL1”标识符与已知的现有模型“V32”（即 DeepSeek-V3.2）被并列或区别提及。开发者分析认为，两者在键值缓存布局、稀疏性处理方式以及对FP8数据格式的解码支持等关键技术层面存在明显区别，表明新架构可能在内存优化和计算效率上进行了针对性设计。

这一发现与近期的行业传闻相互印证。The Information 本月早些时候爆料称，DeepSeek 将在今年 2 月中旬农历新年期间推出新一代旗舰 AI 模型——DeepSeek V4。据称其代码能力将显著提升，内部测试显示有望超越包括 GPT 和 Claude 在内的行业领先产品。

值得注意的是，DeepSeek 研究团队此前陆续发表了两篇重要技术论文：一篇介绍了名为“优化残差连接（mHC）”的新训练方法；另一篇提出了“条件记忆”新范式并开源相关记忆模块 Engram。业界猜测，正在开发中的新模型很可能会整合这些研究成果。

《夸克》非常好用的免费AI浏览器

来源:https://news.pconline.com.cn/2073/20734373.html
免责声明：文中图文均来自网络，如有侵权请联系删除，心愿游戏发布此文仅为传递信息，不代表心愿游戏认同其观点或证实其描述。

相关文章