150 tokens/s!NVIDIA为谷歌DiffusionGemma提供首日支持:RTX/DGX全系可用
时间:2026-06-11 | 作者: | 阅读:06月11日消息,NVIDIA宣布为谷歌DeepMind最新发布的开放模型DiffusionGemma提供首日支持,覆盖GeForce RTX GPU、RTX PRO平台和DGX系统全系列。
DiffusionGemma基于Gemma 4架构,总参数25.2亿,推理时仅激活3.8亿参数,支持256K上下文长度,并针对NVIDIA硬件深度优化。。
与传统自回归模型逐个生成token不同,它采用文本扩散架构,每步可并行去噪256个tokens,在NVIDIA GPU上速度提升约4倍。
性能方面,NVIDIA通过Tensor Core架构和CUDA软件栈实现了无需额外调优即可获得优异性能。单块H100 GPU可达每秒1000 token,在DGX Spark上达150 tokens/s。
该模型支持BF16/NVFP4精度格式,开发者可通过Hugging Face Transformers在RTX 5090或DGX Spark上快速原型验证,生产环境可使用vLLM进行部署。
该模型采用Apache 2.0许可证开源,支持文本与图像多模态输入,支持完全运行于本地RTX或DGX平台,无需联网、无需按token付费。
目前已在Hugging Face Transformers、vLLM、Unsloth等框架中获得初始支持。
对于Windows开发者,RTX 5090用户可立即下载体验;专业级用户则可选用RTX PRO 6000工作站或DGX Station完成大规模部署和微调任务。
来源:https://news.mydrivers.com/1/1128/1128773.htm
免责声明:文中图文均来自网络,如有侵权请联系删除,心愿游戏发布此文仅为传递信息,不代表心愿游戏认同其观点或证实其描述。
相关文章
更多-
- 谷歌Google搜索官网地址及核心搜索引擎导航
- 时间:2026-06-11
-
- Google谷歌账户注册官方入口 新用户安全开通步骤
- 时间:2026-06-10
-
- 谷歌地图官方网址 本地服务与导航入口
- 时间:2026-06-09
-
- Nova Launcher负一屏设置与谷歌插件配置查看方法
- 时间:2026-06-09
-
- 谷歌空间省电模式游戏设置教程
- 时间:2026-06-09
-
- 挑战GPU独大格局!谷歌自研TPU冲刺3500万颗:成本比GPU低30%以上
- 时间:2026-06-08
-
- 安卓手机刷机后系统优化与提速指南
- 时间:2026-06-04
-
- 谷歌推出电诈克星:精准拦截AI伪造语音来电
- 时间:2026-06-03
精选合集
更多大家都在玩
大家都在看
更多-
- 剪映抖动特效添加教程:轻松制作酷炫视频效果
- 时间:2026-06-11
-
- 剪映视频格式设置教程:MP4与MOV格式导出方法
- 时间:2026-06-11
-
- 鸣潮洛瑟菈幕间介绍
- 时间:2026-06-11
-
- 剪映时间线放大操作步骤详解
- 时间:2026-06-11
-
- 剪映白色背景设置教程:轻松制作纯色视频画面
- 时间:2026-06-11
-
- 千元机倒退至6GB内存!网友吐槽梦回十年前
- 时间:2026-06-11
-
- 剪映视频变速设置教程 常规速度调整方法详解
- 时间:2026-06-11
-
- 剪映胶片连拍效果制作教程
- 时间:2026-06-11

