硬刚NVIDIA H100!摩尔线程MTT S5000参数首次公开:80GB显存、单卡算力1千万亿次
时间:2026-02-12 | 作者: | 阅读:02月12日消息,智谱发布新一代大模型GLM-5之后,摩尔线程立即宣布,在旗舰级AI训推一体全功能GPU MTT S5000上完成了Day-0全流程适配与验证,第一时间提供支持。
MTT S5000是摩尔线程专为大模型训练、推理及高性能计算设计的全功能GPU智算卡,基于第四代MUSA架构“平湖”,原生适配PyTorch、Megatron-LM、vLLM、SGLang等主流框架。
它早在2024年就已经低调推出,但是具体造型、参数、性能一直没有对外公开,非常神秘。
这次在宣布适配GLM-5的同时,摩尔线程首次公布了MTT S5000的部分参数和性能,非常惊喜!
据悉,MTT S5000单卡配备多达80GB显存,显存带宽高达1.6TB/s,对比上代MTT S4000分别提升了67%、113%,多卡间的互联带宽也有784GB/s。
它完整支持从FP8到FP64的全精度计算,而且是国内最早原生支持FP8精度的训练GPU之一,配置了硬件级FP8 Tensor Core加速单元。
FP8相比BF16/FP16可将数据位宽减半、显存带宽压力降低50%、理论计算吞吐量翻倍,并全面支持DeepSeek、Qwen等架构,训练性能可提升30%以上。
MTT S5000的单卡FP8 AI算力最高可达1000 TFLOPS,首次达到PFLOPS级别,也就是每秒1千万亿次计算。
相比之下,MTT S4000的算力为INT8 256 TOPS、BF16 128 TFLOPS、FP32/64 32/64 TFLOPS。
据业内人士称,MTT S5000实测性能可以对标NVIDIA H100,尤其是在多模态大模型微调任务中,部分性能更是超越H100,甚至开始接近最新的Blackwell架构。
2026年1月,智源研究院基于MTT S5000千卡集群,完成了前沿具身大脑模型RoboBrain 2.5(数千亿参数)的端到端训练与对齐验证,MTT S5000表现出了与H100集群极高的结果一致性,练损失值(loss)差异仅为0.62%,整体训练效果甚至实现小幅超越。
另据互联网厂商的场景实测,MTT S5000在典型端到端推理及训练任务中,性能可以达到NVIDIA H20的2.5倍左右。
目前,基于MTT S5000的夸娥万卡集群已经落地,浮点运算能力达到10Flops(每秒1千亿亿次计算),在Dense稠密模型训练中MFU达到60%,在MoE专家模型中维持在40%左右,有效训练时间占比超过90%,训练线性扩展效率达95%。
基于原生FP8能力,它能完整复现顶尖大模型的训练流程,Flash Attention算力利用率超过95%,多项关键指标均达到国际主流水平。
值得一提的是,MTT S5000在集群通信层面采用独创的ACE技术,将复杂通信任务从计算核心卸载,大幅提升模型算力利用率(MFU)。
实测显示,MTT S5000从64卡扩展至1024卡,系统的线性扩展效率保持在90%以上,训练速度随算力增加几乎同步倍增。
MTT S5000在推理场景同样表现优异,比如在2025年12月,摩尔线程联合硅基流动基于MTT S5000完成了对DeepSeek-V3 671B满血版的深度适配与性能测试。
实测单卡Prefill吞吐超过4000 tokens/s,Decode吞吐超过1000 tokens/s,刷新了国产GPU的推理纪录。
来源:https://news.mydrivers.com/1/1103/1103881.htm
免责声明:文中图文均来自网络,如有侵权请联系删除,心愿游戏发布此文仅为传递信息,不代表心愿游戏认同其观点或证实其描述。
相关文章
更多-
- GTX 1650显存从4GB改到8GB!跑分暴涨近100%
- 时间:2026-06-22
-
- 给显卡装台冰箱:RTX 3060从60°C暴降至22°C
- 时间:2026-06-22
-
- 内存危机波及GPU市场!AMD RX 9000系列计划涨价10-15%
- 时间:2026-06-20
-
- RTX 5090实在太热了!竟然把主板“烤熟了”
- 时间:2026-06-20
-
- 性价比太低:RX 9070 GRE德国零售商两周销量终于突破5张
- 时间:2026-06-19
-
- 中国首款全自研显卡砺算LX7G100第二批创始版今晚3299元开抢
- 时间:2026-06-18
-
- 中国首款全自研显卡 砺算LX 7G100第二批创始版今晚开抢 3299元
- 时间:2026-06-18
-
- 100%纯国产自研!砺算LX 7G100显卡驱动首次更新:变化多达33处
- 时间:2026-06-17
精选合集
更多大家都在玩
大家都在看
更多-
- 谷歌浏览器搜索框输入反应迟钝延迟是什么原因
- 时间:2026-06-22
-
- 米侠浏览器无法识别m3u8视频流的原因解析
- 时间:2026-06-22
-
- 微信发私密朋友圈的正确操作步骤
- 时间:2026-06-22
-
- 如何找回vivo浏览器里误删后的离线视频文件
- 时间:2026-06-22
-
- 淘宝半价活动抢购技巧与下单显示常见问题详解
- 时间:2026-06-22
-
- 爱作业更换头像方法步骤
- 时间:2026-06-22
-
- 谷歌浏览器开发者工具抓取XHR请求参数教程
- 时间:2026-06-22
-
- 淘宝直播流量券使用操作步骤详细教程
- 时间:2026-06-22






