位置:首页 > 综合教程 > 英伟达200亿美元收购技术 国产LPU芯片让豆包更智能

英伟达200亿美元收购技术 国产LPU芯片让豆包更智能

时间:2026-05-30  |  作者:318050  |  阅读:0

5月30日消息一出,业内沸腾了。

在AI推理算力需求爆发式增长的背景下,国内芯片研发路线正在发生转向:从GPU为主,逐渐向CPU核心靠拢。

这次的主角是 ByteDance。有消息称,他们正在秘密研发自己的CPU,更准确地说,是一款LPU类型的芯片。

海外分析师爆料:ByteDance与RRAM厂商合作

爆料向来很准的海外分析师Jukan近期透露:ByteDance正与国内一家RRAM存储芯片厂商合作,打算打造一款类似Groq LPU处理器的产品。

Jukan还顺带提了一嘴:NVIDIA的老黄之前说LPU只是个小众市场。话是这么说,但他心里门儿清——无非是有意淡化对手的企图。实际上,所有大厂最终都希望打造属于自己的张量处理器。

LPU:比GPU快10倍,成本仅十分之一

说到LPU,相比GPU和TPU,它的知名度确实还差一截。上一次引发行业震动,还是3月份NVIDIA在GTC大会上发布LPU30。

但很少有人知道,这项技术并非NVIDIA自研,而是去年底花了 200亿美元 从Groq手里买来的授权。能让老黄这么着急掏腰包,LPU的分量可想而知。

Groq创始人来自谷歌TPU团队

创造LPU的公司Groq,创始人乔纳森·罗斯(Jonathan Ross)是什么来头?10年前谷歌TPU芯片的主管之一。2016年,他带着多位TPU核心骨干出走,成立了Groq。

这支团队的DNA决定了LPU从一开始就是奔着大语言模型去的。数据不会骗人:LPU芯片速度比H100快10倍,成本却只有十分之一。换句话说,它精准击中了全球企业对“实时、低延迟”AI推理服务的饥渴需求。

NV曾花200亿美元收购技术 国产也要有LPU芯片了:能让豆包变聪明

LPU30芯片参数:带宽碾压GPU

具体到LPU30这颗芯片上:整合了500MB SRAM缓存,980亿晶体管,FP8下算力达到1.2PFLOPS。单纯看AI算力,确实远不如NVIDIA的Rubin GPU。

但它的恐怖之处在于带宽——150TB/s,而HBM4的带宽不过22TB/s,整整高出近7倍。

到了Groq 3 LPU阶段,更是以Groq 3 LPX机架形式出现:集成256个LPU30芯片,缓存容量飙到128GB,内存总带宽提升到40PB/s,互联带宽也有640TB/s。

一句话总结:LPU在AI算力绝对值上不如GPU,但在带宽、延迟这些AI推理的关键指标上,比GPU强了数倍。这恰恰是当前大模型落地最需要的东西。

自研LPU将让豆包真正变聪明

好了,回到ByteDance身上。如果他们真搞定了自己的类LPU芯片,会带来什么体验变化?

用过豆包的人应该都深有体会——很多人吐槽它情商极高,但智商不详。说到底,就是推理算力不够。

一旦LPU这类芯片加入,不仅成本能大幅降低,更关键的是,豆包会真正变聪明,能干的事可就多了去了。

NV曾花200亿美元收购技术 国产也要有LPU芯片了:能让豆包变聪明

来源:整理自互联网
免责声明:文中图文均来自网络,如有侵权请联系删除,心愿游戏发布此文仅为传递信息,不代表心愿游戏认同其观点或证实其描述。

相关文章

更多

精选合集

更多

大家都在玩

热门话题

大家都在看

更多