AWS新一代P2实例分析

Posted by 云谷计算 on February 8, 2018

背景

P2主要是面向当前热门的机器学习、高性能数据库、计算流体动力学、计算金融学、地震分析、分子建模、基因组学GPGPU的实例类型,一共包括3歌不同的规格,具体配置如下:

aws-p2.png

CPU

P2和G3一样,采用Intel Xeon E5-2686 v4 (Broadwell) 处理器, 这应该是AWS专门定制的一款处理器,根据wikichip 的数据,这款CPU有18核心36线程,主频2.3G, Turbo到2.7G。

网络

  • xlarge: 10G共享
  • 8xlarge: 10G独享
  • 16xlarge: ENA 20G独享

GPU

k80-vs-p100.png

服务器

  • 2P服务器,一共36核心72线程.
  • Dom 0预留72-64=8线程.
  • 插8块全宽K80卡,每卡2显示核心.
  • 至少1块Intel 10G网卡和1块ENA 20G网卡。
  • P2实例不支持本地磁盘。
  • 因为要支持8x功率300w K80, 要在2U空间内插入这么多卡并实现散热很难,所以猜测用的4U。

PCI-E拓扑

P2实例支持P2P GPU Direct, 其要求设备不能跨QPI和PCIE-SW,猜测其拓扑应该如下: p2-gpu-topu.png

  • xlarge: CPU(socket1x2 + socket2x2) + 1 GPU core, 每主机可以装箱16个vm;
  • 8xlarge: CPU(socket1x16 + socket2x16) + 8 GPU core(挂在同一sw上), 每主机可以装箱2个vm;
  • 16xarge: CPU(socket1x32 + socket2x32), 每主机可以装箱1个vm;