广州沐风信息科技有限公司
在线客服
 工作时间
周一至周五 :8:30-17:30
周六至周日 :9:00-17:00
 联系方式
400电话:400-XX6-8888

沐风高密度GPU计算节点MF2864GH

文章附图

全新高密度GPU计算节点,基于英特尔至强处理器E5-2600高密度计算服务器,在2U空间内提供4个全高全长GPU加速单元,通过GPU承担部分计算量繁重且耗时的代码,为在CPU上运行的应用程序加速,处理更大数据集、缩短应用运行时间。

超凡的科学计算性能采用英特尔®全新八核心16并发线程至强®E5-2600系列处理器,可以在2U空间内提供16核心共32线程,为应用程序提供高达332GFlops(E5-2670)的CPU计算能力。同时,系统可配置的4个GPU计算单元,支持CUDA架构的应用程序,可以从中得到额外提供数万亿次计算能力(根据所选配的GPU计算单元)

灵活可扩展的网络MF2864GH提供了多种不同网络选择:1Gb以太网、10Gb以太网、40Gb QDR InfiniBand、56Gb FDR InfiniBand,可实现增强的高速性能和I/O灵活性,满足不同应用程序的互联需求。保障应用 的无故障运行得益于冗余设计的电源、风扇,硬盘设计,同时所有组件的热插拔设计使维护更简单,无需停机

机箱/尺寸

机架式/2U,HxW x D: 3.5” x 17.2” x 30.5” (89mm x 437mm x 787mm)

处理器

支持两颗Intel Xeon E5-2600V3系列,最高支持E5-2699V3处理器核心:4/6/8/10/12/14/16/18核 (根据所选择处理器)处理器缓存:10MB/15MB/20MB/25MB/30MB/35MB/45MB三级缓存 (根据所选择处理器)QPI:支持最高2x 9.6GT/s, 向下兼容8.0GT/s/7.2GT/s和6.4GT/s

内存

16-DDR4 DIMM插槽,最大支持1TBB16-Channel,2133/1866/1600MHz ECC DDR4 SDRAM支持LRDIMM/RDIMM ECC

芯片组

IntelC612芯片组

网络

集成双口千兆以太网,Intel I350千兆以太网控制器(选配) QDR/FDR InfiniBand版本,QSFP接口(选配) 10Gb 以太网

GPU计算单元

(选配,最大4个)

NVIDIA Tesla K10 GPU卡,3072个CUDA计算核心,8GB GDDR5显存,单卡计算能力为:单精度4577GFlops,双精度190GFlops (1GFlops=10亿次计算能力)NVIDIA Tesla K20 GPU卡, 2496个CUDA计算核心, 5GB GDDR5显存,单卡计算能力为:单精度3.52TFlops,双精度1.17TFlops (1TFlops=1万亿次 计算能力)

NVIDIA Tesla K40 GPU卡, 2688个CUDA计算核心,12GB GDDR5显存,单卡计算能力为:单精度4.29TFlops,双精度1.43TFlops (1TFlops=1万亿次 计算能力)

存储/硬盘

10 SATA 3.0 ports (6Gbps)支持10个2.5”热插拔硬盘,支持SATA/SSD

RAID

支持SATA RAID 0, 1, 5, 10

扩展槽

4 (x16) PCI-E 3.0 slots (支持4张全高全长GPU卡)1 (x8) PCI-E 3.0 (in x16) low-profile slot

显卡

集成Matrox G200eW图形库控制器

管理

集成BMC,支持IPMI 2.0远程管理支持KVM Over IP,具备独立RJ45专用管理端口可选容灾备份功能,实现数据备份/本地数据容灾备份/异地数据数据容灾备份CDP。

输入输出

6个 USB 2.0和1个VGA显示接口1个 PS/2键鼠接口和1个串口

电源

2x 2000W高效1+1冗余电源,白金PMbus电源管理总线

保修

3年标准保修

物理、化学高性能解决方案

需求分析

大部分计算材料和计算化学程序属于计算密集型和访存密集型应用,对处理器的浮点运算能力和内存性能要求很高。计算节点推荐使用双路服务器,根据CPU型号不同,每个计算节点提供16~40核心,平均每个核心配置2~4 GB内存。对于ADF、VASP、Gaussian等以OpenMP共享式内存并行方式为主的并行程序,推荐核心较多和内存较大的SMP胖节点,达到最佳的性能加速比。大部分物理化学软件都是MPI并行程序,并行加速较好,通常可以扩展到32~128进程以上,程序运行方式通常是跨节点并行运行;从并行算法分析,计算材料软件的进程间通信比较频繁,属于通信密集型应用。因此,节点间网络的延迟和带宽对程序的并行加速比起着决定性的作用。使用传统的千兆以太网很难发挥程序的并行性能,跨节点运行时会导致严重的性能下降,成为整个计算过程的瓶颈。因此,推荐用户使用高带宽、低延迟的InfiniBand网络.

解决方案



     上图是典型的计算物理化学集群系统配置,系统具有优异的性能和良好的扩展性。计算节点选用沐风高密度服务器平台,2U双路多节点服务器PR2780H,满足一般计算软件和计算任务的需求;计算系统还可以根据需要配置几台四路或八路SMP胖节点,专为 Gaussian等OpenMP并行程序或其它一些大内存应用配备ADF、VASP; 集群系统配置了两台沐风PR2510R服务器作为管理登录节点,两台登录管理节点配置双机热备,实现双保险,提高整个集群的高可用性;
    计算网络采用高带宽、低延迟的FDR InfiniBand网络,为并行程序提供无阻塞的通信高速通道;另外,配置一套或两套千兆网络,用于集群管理和监控,千兆网络也可作为备用计算网络,提高系统的高可用性; 存储系统采用沐风GS-5120FD 磁盘阵列,提供了海量数据存储能力。
方案优势
    高性能 :本方案选择了业界领先的沐风PR2780H高密度机架服务器,采用最新的Sandy Bridge处理器架构,计算网络使用56Gb的FDR Infiniband,适合计算物理、计算化学这样的计算密集型和通信密集 型应用;大容量、高性能、高容错、高可扩展性的分布式并行存储系统为集群提供了强大的存储支持;双登录管理节点、备用计算网络、存储系统的高容错技术为集群的提供了更高的可靠性;可扩展性 :系统设计为用户预留了自由的可扩展空间,灵活地增配计算节点 绿色节能 :集群选用设备均关注绿色节能,选取低功耗部件;沐风PDCM智能功耗控制系统能够根据集群负载实时调整整个系统功耗,下,实现20%节能。