不用独显也能跑AI Intel和AMD罕见达成共识
时间:2026-06-22 | 作者: | 阅读:06月22日消息,Intel与AMD共同发布完整ACE CPU扩展规范,这套面向AI运算的全新指令集落地x86架构,通过优化矩阵乘法实现更高能效与计算密度,大幅降低CPU本地运行AI模型的门槛。
日常AI推理大多依靠GPU完成,但轻量化模型、低延迟任务或是无独显设备,更适合直接在CPU运行,但传统AVX10向量指令并非为矩阵运算打造,执行AI核心矩阵乘法时功耗高、效率偏低。
ACE基于现有AVX10寄存器拓展,新增专用硬件单元处理矩阵计算,无需重新设计底层架构,厂商适配成本更低。
官方数据显示,同等输入向量规模下,ACE计算密度是AVX10的16倍,单条指令可完成更多计算,减少指令调度开销,内存带宽利用率同步提升,同时功耗控制更出色,不过16倍计算密度不代表直接16倍提速,最终性能取决于两家处理器后续硬件设计。
该指令集跨厂商通用,开发者仅需编写一套代码,就能适配Intel、AMD全系支持ACE的CPU,不用针对不同AVX版本做多套适配,PyTorch、TensorFlow等主流AI框架均可无缝兼容,数据格式覆盖 INT8、FP8、BF16等AI常用类型,还原生支持OCP MX块缩放格式,填补AVX10的功能空白。
对于开发者而言,部分临时NPU算力需求可转移至CPU处理,无需适配各家规格不一的 NPU硬件,未来新一代x86处理器将搭载ACE扩展,笔记本、台式机、服务器无需依赖独显,就能流畅运行各类本地 AI 任务,进一步拓宽端侧AI落地场景。
来源:https://news.mydrivers.com/1/1131/1131107.htm
免责声明:文中图文均来自网络,如有侵权请联系删除,心愿游戏发布此文仅为传递信息,不代表心愿游戏认同其观点或证实其描述。
相关文章
更多-
- 美国版幻方量化 没做 DeepSeek 但押注Anthropic爆赚50倍
- 时间:2026-06-23
-
- 如何用豆包AI撰写电商详情页卖点描述
- 时间:2026-06-22
-
- 夸克AI中小学生课外阅读书籍推荐与导读指南
- 时间:2026-06-20
-
- 万店掌AI巡店设置及自动告警配置实用技巧
- 时间:2026-06-20
-
- 星绘APP中AI绘画功能使用教程
- 时间:2026-06-19
-
- AI“抢饭碗”?贝索斯:恰恰相反
- 时间:2026-06-18
-
- 豆包AI生成简历模板的方法步骤
- 时间:2026-06-18
-
- 美国禁掉Fable5后 智谱暴涨47%
- 时间:2026-06-18
精选合集
更多大家都在玩
大家都在看
更多-
- 谷歌浏览器搜索框输入反应迟钝延迟是什么原因
- 时间:2026-06-22
-
- 米侠浏览器无法识别m3u8视频流的原因解析
- 时间:2026-06-22
-
- 微信发私密朋友圈的正确操作步骤
- 时间:2026-06-22
-
- 如何找回vivo浏览器里误删后的离线视频文件
- 时间:2026-06-22
-
- 淘宝半价活动抢购技巧与下单显示常见问题详解
- 时间:2026-06-22
-
- 爱作业更换头像方法步骤
- 时间:2026-06-22
-
- 谷歌浏览器开发者工具抓取XHR请求参数教程
- 时间:2026-06-22
-
- 淘宝直播流量券使用操作步骤详细教程
- 时间:2026-06-22
