位置:首页 > 新闻资讯 > 英伟达适配DeepSeek-V4 AI模型 GB200 NVL72性能超150 tokens/sec/user

英伟达适配DeepSeek-V4 AI模型 GB200 NVL72性能超150 tokens/sec/user

时间:2026-04-26  |  作者:  |  阅读:0

4月25日,英伟达发布博文宣布已适配DeepSeek-V4 AI模型。开发者可通过NVIDIA NIM微服务下载部署,或利用SGLang与vLLM框架进行定制化推理。

DeepSeek-V4-Pro拥有1.6T总参数量与49B激活参数,定位高级推理任务;DeepSeek-V4-Flash版本则为284B总参数量与13B激活参数,主打高速高效场景。两款模型均支持100万Token上下文窗口与最高38.4万Token输出长度,覆盖长文本编码、文档分析等核心应用,并采用MIT开源协议。

实测数据显示,借助vLLM的Day 0配方,开发者可在Blackwell B300上快速部署。随着Dynamo、NVFP4及CUDA内核的深度优化,预期性能将进一步提升。

来源:https://news.pconline.com.cn/2138/21382611.html
免责声明:文中图文均来自网络,如有侵权请联系删除,心愿游戏发布此文仅为传递信息,不代表心愿游戏认同其观点或证实其描述。

相关文章

更多

精选合集

更多

大家都在玩

热门话题

大家都在看

更多