10月21日消息,在近日于韩国首尔举办的顶级学术会议SOSP 2025(操作系统原理研讨会)上,阿里云发布了其“Aegaeon”计算池化解决方案。
Aegaeon方案的核心在于解决AI模型服务中普遍存在的GPU资源浪费问题,尤其针对那些需求突发或不可预测的大型语言模型。
它打破了传统的“一个模型绑定一个GPU”的低效模式,而是在Token级别虚拟化GPU访问,这意味着单个GPU可以被多个不同模型共享服务,实现精细化的资源调度。
阿里云Aegaeon系统作为一种推理时间调度器,它能在每次生成下一个token后,动态决定是否切换模型,从而将微小的工作片段安排到共享池中。
通过组件复用、显存精细化管理和KV缓存同步优化等全栈技术,Aegaeon将模型切换开销降低了97%,确保了token级调度的实时性,可支持亚秒级的模型切换响应。
在阿里云模型市场为期超三个月的Beta测试中,Aegaeon系统在服务数十个参数量高达720亿的大模型时,所需的NVIDIA H20 GPU数量从1192个锐减至213个,削减比例高达82%。
GPU用量的大幅削减,对于硬件采购成本高昂的大型模型服务商而言,意味着成本将显著降低。
目前,这项核心技术已成功应用在阿里云百炼平台。
免责声明:凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处。非本网作品均来自互联网,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。
同类
徐圩核能供热发电项目顺利完成1号机组安全壳钢衬里首个模块吊装
3月31日8时48分,中核华兴承建的全球首个核能与石化产业大规模耦合项目——徐圩核能供热发电项目顺利完成1号机组安全壳钢衬里首个模块(MK1)吊装,标志核岛主体结构模块化施工正式启动。此次吊装采用整体吊装工艺,在
0评论2026-04-0710
国网盐城供电:“防舞神器”书写科技保电新篇章
最近,国网盐城供电公司成功运用无人机,在220千伏亿牵线上完成了江苏省内该电压等级首次带电安装相间间隔棒的作业。这台由无人机精准吊装的“防舞神器”,不仅是对抗输电线路舞动灾害的利器,更是盐城供电人智慧与
0评论2026-04-077
保变电气全面启动“六面红旗”劳动竞赛
近日,保变电气本部“六面红旗”劳动竞赛全面启动。本次劳动竞赛设置制造质量、生产进度、财务结构优化、设备管理、生产现场、服务保障六个竞赛项目,鼓舞和激励广大职工积极践行“马上就办、真抓实干”的“马真”精
0评论2026-04-075
徐工重卡通过“氢能马拉松”权威验证
日前,中汽中心新能源检验中心发布国内首个氢能产品全产业链耐久性验证体系——“氢能马拉松”权威验证。徐工氢能重卡作为首台参测车辆,顺利完成纯氢续驶里程测试,徐工汽车也成为本届唯一通过该项验证的整车企业。
0评论2026-04-077