云计算

AWS新一代P2实例分析

Posted by 云谷计算 on February 8, 2018

背景

P2主要是面向当前热门的机器学习、高性能数据库、计算流体动力学、计算金融学、地震分析、分子建模、基因组学GPGPU的实例类型，一共包括3歌不同的规格，具体配置如下:

CPU

P2和G3一样，采用Intel Xeon E5-2686 v4 (Broadwell) 处理器，这应该是AWS专门定制的一款处理器，根据wikichip 的数据，这款CPU有18核心36线程，主频2.3G, Turbo到2.7G。

网络

xlarge: 10G共享
8xlarge: 10G独享
16xlarge: ENA 20G独享

GPU

服务器

2P服务器，一共36核心72线程.
Dom 0预留72-64=8线程.
插8块全宽K80卡，每卡2显示核心.
至少1块Intel 10G网卡和1块ENA 20G网卡。
P2实例不支持本地磁盘。
因为要支持8x功率300w K80, 要在2U空间内插入这么多卡并实现散热很难，所以猜测用的4U。

PCI-E拓扑

P2实例支持P2P GPU Direct, 其要求设备不能跨QPI和PCIE-SW，猜测其拓扑应该如下：

xlarge: CPU(socket1x2 + socket2x2) + 1 GPU core, 每主机可以装箱16个vm;
8xlarge: CPU(socket1x16 + socket2x16) + 8 GPU core（挂在同一sw上）, 每主机可以装箱2个vm;
16xarge: CPU(socket1x32 + socket2x32), 每主机可以装箱1个vm;