OCP China 2024 CXL论坛 学习笔记
阿里云 数据中心高性能Scale Up 互联系统趋势
孔阳 阿里云超高速互联负责人
胡文普 CXL部分
Scale Up
云的角度 关注两个计算 : 通用计算、GPU计算
通用计算上:
考虑弹性分析:存储上->云盘技术 网络->CIPU网络虚拟化
内存上->CXL
GPU上:
大模型单次任务,数据并行、流水线并行、tensor并行、专家并行,都具有较高的带宽要求
CXL
机柜内的资源弹性实现需要满足高性能接口、资源共享、极致弹性、软件生态兼容性等要求。CXL特性符合这些要求。CXL将一致性访问从CPU内部拓展到CPU和内存之间,实现多服务器之间的互联。
CXL的演进
GIM :
P2P : DSP与type3互联,type3可以分配给DSP或者host
HBR->PBR:不止树状、星状、网络状
E3.s 热插拔,便于可拓展
JBOM 大容量
PEMEM :支持2.0,满足redis实时性持久化等要求
基于
内存与CPU实现资源解耦
CXL在小数据上传输性能大大提高;
intel: CXL on Intel Xeon@ Platform
赵森林
CXL overview
CXL Specification Summary