NVIDIA要用上X3D堆叠设计！下代Feynman GPU将引入LPU - 心愿游戏

位置：首页 > 电脑资讯 > NVIDIA要用上X3D堆叠设计！下代Feynman GPU将引入LPU

NVIDIA要用上X3D堆叠设计！下代Feynman GPU将引入LPU

时间：2025-12-29 | 作者： | 阅读：0

12月29日消息，虽然NVIDIA目前在AI训练领域无可匹敌，但面对日益增长的即时推理需求，其正筹划一项足以改变行业格局的“秘密武器”。

据AGF透露，NVIDIA计划在2028年推出的Feynman（费曼）架构GPU中，整合来自Groq公司的LPU（语言处理单元），以大幅提升AI推理性能。

Feynman架构将接替Rubin架构，采用台积电最先进的A16（1.6nm）制程，为了突破半导体物理限制，NVIDIA计划利用台积电的SoIC混合键合技术，将专为推理加速设计的LPU单元直接堆叠在GPU之上。

这种设计类似于AMD的3D V-Cache技术，但NVIDIA堆叠的不是普通缓存，而是专为推理加速设计的LPU单元。

设计的核心逻辑在于解决SRAM的微缩困境，在1.6nm这种极致工艺下，直接在主芯片集成大量SRAM成本极高且占用空间。

通过堆叠技术，NVIDIA可以将运算核心留在主芯片，而将需要大量面积的SRAM独立成另一层芯片堆叠上去。

台积电的A16制程一大特色是支持背面供电技术，这项技术可以腾出芯片正面的空间，专供垂直信号连接，确保堆叠的LPU能以极低功耗进行高速数据交换。

结合LPU的“确定性”执行逻辑，未来的NVIDIA GPU在处理即时AI响应（如语音对话、实时翻译）时，速度将实现质的飞跃。

不过这也存在两大潜在挑战，分别是散热问题和CUDA兼容性难题，在运算密度极高的GPU 再加盖一层芯片，如何避免“热当机”是工程团队的头号难题。

同时LPU强调“确定性”执行顺序，需要精确的内存配置，而CUDA生态则是基于硬件抽象化设计的，要让这两者完美协同，需要顶级的软件优化。

《夸克》非常好用的免费AI浏览器

下载APP查看

来源:https://news.mydrivers.com/1/1095/1095424.htm
免责声明：文中图文均来自网络，如有侵权请联系删除，心愿游戏发布此文仅为传递信息，不代表心愿游戏认同其观点或证实其描述。

相关文章

更多

全行业都给三星打工了内存涨价推动利润达1.1万亿：比NV还暴利

时间：2026-03-13
NVIDIA黄仁勋一句话再度带火内存：三星美光等股价飙升

时间：2026-03-11
难怪普通人买硬件越来越贵！NVIDIA CEO黄仁勋：内存、晶圆我全包了

时间：2026-03-09
在中国一颗也卖不出去！NVIDIA无奈停产H200芯片：加速Vera Rubin量产

时间：2026-03-06
NVIDIA H200已停产！解禁两个月对中国销量仍为零

时间：2026-03-05
RTX 5060将被迫“换心”！RTX 5060 Ti 8GB搞太多了

时间：2026-03-05
RTX 5050升级9GB GDDR7显存：位宽反而降到96-bit

时间：2026-03-05
首发“1.6nm”工艺 NVIDIA下代GPU费曼要跟Intel联手：10亿美元合作

时间：2026-03-04

精选合集

更多

大家都在玩

热门话题

大家都在看

更多