谷歌新内存技术“炸”了存储芯片市场 闪迪暴跌超11%
时间:2026-03-27 | 作者: | 阅读:03月27日消息,据媒体报道,美东时间3月26日,存储芯片股集体重挫,闪迪跌超11%,希捷跌逾8%,超威半导体、西部数据跌逾7%,美光科技跌近7%。
业内人士分析,这一波动源自谷歌研究院即将在国际学习表征会议(ICLR 2026)上正式亮相的学术论文,该研究推出了一种新型AI内存压缩技术“TurboQuant”。
谷歌宣称,该技术可将大语言模型推理中的缓存内存占用压缩至六分之一,并在英伟达H100 GPU上实现最高8倍的性能加速。
AI模型运行时存在一种“工作内存”,即KV缓存(Key-Value Cache)。每当模型处理信息、生成回答时,KV缓存便会迅速膨胀,且上下文窗口越长,缓存占用的内存越大。
TurboQuant本质上是一种极致的量化压缩算法,传统量化方法需要在压缩精度和额外存储开销之间妥协,而谷歌团队通过PolarQuant(极坐标量化)和QJL(量化JL变换)两项创新,实现了在“零损失”前提下将KV缓存压缩至3-bit精度。
Cloudflare首席执行官将这一成果称为谷歌的“DeepSeek时刻”,认为其有望像DeepSeek一样,通过极致效率大幅拉低AI的运行成本。
不过,摩根士丹利在最新研报中指出,市场对此存在误读。该技术仅作用于推理阶段的键值缓存,并不影响模型权重所占用的高带宽内存(HBM),也与AI训练任务无关。
分析师强调,所谓的“6倍压缩”并非存储总需求的减少,而是通过效率提升增加单GPU的吞吐量。这意味着在相同硬件条件下,可以支持4倍至8倍更长的上下文,或在不触发内存溢出的前提下显著提升批处理规模。
目前,谷歌尚未公布TurboQuant在Gemini等自研模型中的具体部署时间表,研究团队计划在下个月的ICLR 2026会议上正式发布相关成果。
来源:https://news.mydrivers.com/1/1111/1111962.htm
免责声明:文中图文均来自网络,如有侵权请联系删除,心愿游戏发布此文仅为传递信息,不代表心愿游戏认同其观点或证实其描述。
相关文章
更多-
- 中科曙光FlashNexus 9000全闪存存储发布:性能提升至2亿IOPS
- 时间:2026-05-13
-
- 稳芯聚力·共启新章|科摩思全国渠道合作伙伴大会暨新品发布会圆满落幕
- 时间:2026-04-21
-
- 慧荣:2027年存储器供需缺口或进一步扩大 供应持续紧张
- 时间:2026-04-14
-
- 存储涨价风口跑出黑马!香农芯创Q1净利暴增87倍:自主品牌首次年度盈利
- 时间:2026-04-08
-
- 存储涨价冲击供应链!2026年全球手机面板出货将年减7.3%
- 时间:2026-03-05
-
- 存储芯片价格暴涨 三星Q4大赚 重夺DRAM第一宝座
- 时间:2026-02-26
-
- 存储涨价SK海力士赚翻了!年营收破97万亿韩元:利润直接翻倍
- 时间:2026-01-28
-
- 国产存储芯片上新!中微半导将推出低功耗存储芯片 填补Flash领域产品空白
- 时间:2026-01-19
精选合集
更多大家都在玩
热门话题
大家都在看
更多-
- 唯美古风女生网名100个|怎么取?附精选推荐
- 时间:2026-05-14
-
- 高冷女生网名100个 | 怎么选?为什么好听?
- 时间:2026-05-14
-
- 女生英文网名怎么选?100个好听又有质感的推荐
- 时间:2026-05-14
-
-
- 【伤感女生网名】100个寝室文案,一听就想哭
- 时间:2026-05-14
-
- 白云系可爱女生网名精选100个|附含义与灵感
- 时间:2026-05-14
-
- 伤感网名女生精选100个 | 含义、灵感与选择指南
- 时间:2026-05-14
-
- 极限竞速地平线6三菱EVO3获取攻略 全车房宝物位置详解
- 时间:2026-05-14
