阿里云推出全新AI计算解决方案:大模型所需GPU狂降82%!
时间:2025-10-21 | 作者: | 阅读:010月21日消息,在近日于韩国首尔举办的顶级学术会议SOSP 2025(操作系统原理研讨会)上,阿里云发布了其“Aegaeon”计算池化解决方案。
Aegaeon方案的核心在于解决AI模型服务中普遍存在的GPU资源浪费问题,尤其针对那些需求突发或不可预测的大型语言模型。
它打破了传统的“一个模型绑定一个GPU”的低效模式,而是在Token级别虚拟化GPU访问,这意味着单个GPU可以被多个不同模型共享服务,实现精细化的资源调度。
阿里云Aegaeon系统作为一种推理时间调度器,它能在每次生成下一个token后,动态决定是否切换模型,从而将微小的工作片段安排到共享池中。
通过组件复用、显存精细化管理和KV缓存同步优化等全栈技术,Aegaeon将模型切换开销降低了97%,确保了token级调度的实时性,可支持亚秒级的模型切换响应。
在阿里云模型市场为期超三个月的Beta测试中,Aegaeon系统在服务数十个参数量高达720亿的大模型时,所需的NVIDIA H20 GPU数量从1192个锐减至213个,削减比例高达82%。
GPU用量的大幅削减,对于硬件采购成本高昂的大型模型服务商而言,意味着成本将显著降低。
目前,这项核心技术已成功应用在阿里云百炼平台。
来源:https://news.mydrivers.com/1/1081/1081344.htm
免责声明:文中图文均来自网络,如有侵权请联系删除,心愿游戏发布此文仅为传递信息,不代表心愿游戏认同其观点或证实其描述。
相关文章
更多-
- 阿里云域名设置邮箱怎么填
- 时间:2026-04-07
-
- 阿里云发布手机“一键养虾”产品JVS Claw:3分钟实现养虾自由
- 时间:2026-03-13
-
- 阿里云怎么部署OpenClaw?三种方法全教你
- 时间:2026-03-09
-
- 早有预谋!千问核心林俊旸官宣卸任 阿里沟通会吴泳铭曝光资源分配矛盾
- 时间:2026-03-05
-
- 全球唯一!阿里云上线Qwen3.5、GLM-5、MiniMax M2.5、Kimi K2.5四大顶尖开源模型
- 时间:2026-02-25
-
- 阿里云荣获亚太Agentic AI开发平台市场领导者 核心能力比肩AWS、谷歌、微软
- 时间:2026-02-12
-
- 阿里云AI基础设施入选Forrester领导者象限 亚太唯一
- 时间:2025-12-29
-
- Gartner全球云数据库管理系统报告:阿里云连续6年获评“领导者”
- 时间:2025-12-15
精选合集
更多大家都在玩
大家都在看
更多-
- DNF2026魔道技能数据大核心要点全凸显
- 时间:2026-04-12
-
- 太空修仙录什么时候出 公测上线时间预告
- 时间:2026-04-12
-
- 战地6NVO288E好用配件搭配推荐
- 时间:2026-04-12
-
- 惊爆 烈火星辰传奇技能大,超强玩法等你体验,速来一探究竟
- 时间:2026-04-12
-
- 燕云十六声众生宝箱介绍 全面解析与探秘
- 时间:2026-04-12
-
- 地下城手游迷你商店换什么装备 地下城手游迷你商店的装备选择建议是什么
- 时间:2026-04-12
-
- 绝地求生中眼泪一两声是什么意思 怎么在游戏中触发
- 时间:2026-04-12
-
- 迅雷光鸭云盘开启公测招募:不限速、免登录 2TB免费空间
- 时间:2026-04-12
