DeepSeek V4适配国产芯片!摩尔线程MTT S5000实现Day-0支持
时间:2026-04-24 | 作者: | 阅读:04月24日消息,今日,DeepSeek正式上线V4预览版并宣布开源,该模型支持百万字超长上下文处理。
摩尔线程联合智源众智FlagOS社区宣布,在旗舰AI训推一体GPU MTT S5000上,完成对DeepSeek-V4-Flash大模型的Day-0极速适配,并实现全量核心算子深度优化与部署支持。
DeepSeek-V4-Flash采用MoE架构,总参数284B、激活参数13B,支持百万Token上下文,首次采用FP4+FP8混合精度,对算力芯片提出更高要求。
摩尔线程MTT S5000是国内率先原生支持FP8的全功能GPU,搭载硬件级FP8 Tensor Core,相比BF16/FP16可将显存压力降低50%,计算吞吐量翻倍。
本次适配由智源FlagOS完成FP8量化,团队聚焦FP8算子与Sparse Attention算子两大关键,通过两大方向实现突破:
一是依托FlagTree编译器做精细化shape对齐与矩阵计算加速;
二是通过FlagOS-Tune自动搜索最优内核配置,效果超越手工调优。实测显示,开启自动调优后TTFT时延降低16.5%,ITL时延降低39.7%,吞吐量提升65.7%。
目前,双方已完成DeepSeek-V4-Flash适配,并正在推进更大规模的DeepSeek-V4-Pro(1.6T)在MTT S5000上的迁移适配。
开发者可在魔塔、HuggingFace下载镜像开箱即用。
来源:https://news.mydrivers.com/1/1118/1118225.htm
免责声明:文中图文均来自网络,如有侵权请联系删除,心愿游戏发布此文仅为传递信息,不代表心愿游戏认同其观点或证实其描述。
相关文章
更多-
- DeepSeek动画生成方法教程详解
- 时间:2026-06-07
-
- 腾讯云加入价格战!DeepSeek-V4系列明起降价:最高降97.5%
- 时间:2026-06-02
-
- DeepSeek编写Dart状态管理逻辑指南
- 时间:2026-06-02
-
- 今年高考期间是否管控AI引热议!豆包元宝等多平台回应
- 时间:2026-05-27
-
- DeepSeek V4永久降价75%后:登顶全球性价比!性价比碾压美系旗舰
- 时间:2026-05-25
-
- DeepSeek使用Solr实现高效搜索功能教程
- 时间:2026-05-24
-
- DeepSeek网页版使用入口与详细操作指南
- 时间:2026-05-23
-
- DeepSeek官宣永久降价 降幅力度远超预期 梁文锋魄力十足
- 时间:2026-05-23
精选合集
更多大家都在玩
热门话题
大家都在看
更多-
- 万神殿战略城市建造游戏《Theos: Cities of Myth》将于今年登陆PC平台
- 时间:2026-06-08
-
- 上帝模拟游戏《Ornelia》将以抢先体验的形式登陆PC平台
- 时间:2026-06-08
-
- 美间导入酷家乐户型图矢量文件详细教程
- 时间:2026-06-08
-
- 美间家居海报制作全攻略 快速上手技巧分享
- 时间:2026-06-08
-
- 日语配音秀App核心功能全面解析与使用指南
- 时间:2026-06-08
-
- 单人僵尸撤离类游戏《Pale Tide》将登陆PC平台
- 时间:2026-06-08
-
- 蚂蚁庄园今日答案最新6.9 6月9日庄园每日答题答案
- 时间:2026-06-08
-
- 美间智能排版软件使用教程与操作指南
- 时间:2026-06-08


