在韩国首尔举办的第31届操作系统原理研讨会(SOSP)上,阿里云发布的“Aegaeon”的计算池化解决方案研究成果成功入选,可解决AI模型服务中普遍存在的GPU资源浪费问题。
风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。
在韩国首尔举办的第31届操作系统原理研讨会(SOSP)上,阿里云发布的“Aegaeon”的计算池化解决方案研究成果成功入选,可解决AI模型服务中普遍存在的GPU资源浪费问题。
在阿里云模型市场进行的为期超过三个月的Beta测试中,Aegaeon系统展现了卓越的效能。测试数据显示,服务数十个参数量高达720亿的大模型,所需的英伟达H20 GPU数量从1192个成功减少至213个,数量削减高达82%。