开发者发现DeepSeek新模型线索,MODEL1标识符预示新一代大模型架构
时间:2026-01-21 | 作者: | 阅读:0【太平洋科技快讯】1 月 21 日消息,据开发者近期在 GitHub 上的发现,DeepSeek 更新了一系列 FlashMLA 相关代码。在涉及的 114 个文件中,有 28 处提到了未知的“MODEL1”大模型标识符,引发业界关注。

据悉,“MODEL1”标识符与已知的现有模型“V32”(即 DeepSeek-V3.2)被并列或区别提及。开发者分析认为,两者在键值缓存布局、稀疏性处理方式以及对FP8数据格式的解码支持等关键技术层面存在明显区别,表明新架构可能在内存优化和计算效率上进行了针对性设计。
这一发现与近期的行业传闻相互印证。The Information 本月早些时候爆料称,DeepSeek 将在今年 2 月中旬农历新年期间推出新一代旗舰 AI 模型——DeepSeek V4。据称其代码能力将显著提升,内部测试显示有望超越包括 GPT 和 Claude 在内的行业领先产品。

值得注意的是,DeepSeek 研究团队此前陆续发表了两篇重要技术论文:一篇介绍了名为“优化残差连接(mHC)”的新训练方法;另一篇提出了“条件记忆”新范式并开源相关记忆模块 Engram。业界猜测,正在开发中的新模型很可能会整合这些研究成果。
来源:https://news.pconline.com.cn/2073/20734373.html
免责声明:文中图文均来自网络,如有侵权请联系删除,心愿游戏发布此文仅为传递信息,不代表心愿游戏认同其观点或证实其描述。
相关文章
更多-
- 英特尔发布8425版显卡驱动 新增支持《明日方舟:终末地》等游戏
- 时间:2026-01-21
-
- iPhone17全系国内激活破1700万,Pro Max机型激活超785万台
- 时间:2026-01-21
-
- 绿电占1/3!2025年我国用电量超10万亿千万时背后:充换电服务业增速近50%
- 时间:2026-01-21
-
- REDMI Turbo 5 Max官宣续航配置:100W快充+27W反充,支持100W PPS协议
- 时间:2026-01-21
-
- 百度文心App将推出多AI群聊功能 官方否认对标微信社交
- 时间:2026-01-21
-
- 联力确认隐流二代方屏版水冷USB故障原因并推出升级优化方案
- 时间:2026-01-21
-
- vivo X200 Pro手机京东年货节大促 天玑9400旗舰直降2700元
- 时间:2026-01-21
-
- 海韵PRIME TX-1600电源获国内首张CQC五级能效认证 转换效率超95%
- 时间:2026-01-21
精选合集
更多大家都在玩
大家都在看
更多-
- 修真高手手游元凤好用吗
- 时间:2026-01-21
-
- 白的唯美名字男生霸气网名(精选100个)
- 时间:2026-01-21
-
- 有你才有家第34集剧情介绍
- 时间:2026-01-21
-
- 古墓丽影9游戏手机版窃蛋者成就教程
- 时间:2026-01-21
-
- 云班课如何修改昵称?云班课修改昵称的方法
- 时间:2026-01-21
-
- 《七界梦谭》界里拾异【赤阴子】登场
- 时间:2026-01-21
-
- 有你才有家第33集剧情介绍
- 时间:2026-01-21
-
- 抖音怎么挂小黄车卖货?如何开通抖音商品橱窗?
- 时间:2026-01-21