10月21日消息,在近日于韩国首尔举办的顶级学术会议SOSP 2025(操作系统原理研讨会)上,阿里云发布了其“Aegaeon”计算池化解决方案。
Aegaeon方案的核心在于解决AI模型服务中普遍存在的GPU资源浪费问题,尤其针对那些需求突发或不可预测的大型语言模型。
它打破了传统的“一个模型绑定一个GPU”的低效模式,而是在Token级别虚拟化GPU访问,这意味着单个GPU可以被多个不同模型共享服务,实现精细化的资源调度。
阿里云Aegaeon系统作为一种推理时间调度器,它能在每次生成下一个token后,动态决定是否切换模型,从而将微小的工作片段安排到共享池中。
通过组件复用、显存精细化管理和KV缓存同步优化等全栈技术,Aegaeon将模型切换开销降低了97%,确保了token级调度的实时性,可支持亚秒级的模型切换响应。
在阿里云模型市场为期超三个月的Beta测试中,Aegaeon系统在服务数十个参数量高达720亿的大模型时,所需的NVIDIA H20 GPU数量从1192个锐减至213个,削减比例高达82%。
GPU用量的大幅削减,对于硬件采购成本高昂的大型模型服务商而言,意味着成本将显著降低。
目前,这项核心技术已成功应用在阿里云百炼平台。
免责声明:凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处。非本网作品均来自互联网,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。
同类
德国Neura机器人中国总部落地萧山
10月16日下午,德国Neura机器人中国总部落地暨生态合作签约仪式活动在萧山经济技术开发区江南科技城机器人小镇举行,为萧山制造业高质量发展再添新引擎。 德国驻沪总领事李德仁,德国商会副执行总裁朱晶晶,Neura
0评论2025-10-2910
法士特智能制动公司成功入选工业和信息化部“卓越级智能工厂”
近日,工业和信息化部公示2025年度卓越级智能工厂项目名单,陕西省有9家单位成功入选,法士特智能制动公司名列其中。 作为法士特集团全资子公司与国内最大的液力缓速器生产基地,法士特智能制动公司自2018年成立
0评论2025-10-2910
2025年三一机器人全球新品发布会圆满落幕
10月24日,“新质征途·智赢未来”2025年三一机器人全球新品发布会隆重举行,来自全球的300余位客户朋友、经销商伙伴、供应商伙伴、媒体朋友齐聚长沙,见证重要时刻。 绘就蓝图 砥砺前行 三一集团高级副总经理
0评论2025-10-299
10余款新车密集上市 新能源车型成主力军
10月28日至30日,汽车市场将迎来一波新车上市潮,其中新能源车型占据主导地位。一汽丰田卡罗拉锐放、腾势N8L、极氪7X等多款新车将集中亮相,为消费者提供更多样化的选择。 一汽丰田卡罗拉锐放将于10月28日焕新上
0评论2025-10-298