继NVIDIA公司打造了,世界上第一台专为X86平台人工智能使用的超级计算机DGX-1之后,容天联合IBM及NVIDIA公司打造了基于POWER平台的人工智能与机器学习超级计算机MINSKY(代号“小宇宙“),容天MINSKY作为代表着未来超算架构的美国能源部下一代150-300 PFLOPS超级计算机的雏形机,将用在专注于开放型人工智能研究的研发人员, NVIDIA的小芯片+IBM的大智慧+容天超算技术底蕴,这样的组合堪称“天作之合”。

容天MINISKY的先天优势

一、先进的NVLINK

NVLink — 拉近一切处理器之间遥远的距离,NVLink是一项全新概念的技术,甚至可以说是一项新理念。它并不是一个真的Link,而是一个能横跨在GPU和CPU之间,或者是GPU和GPU之间的快速互联机制,同时可以提供恐怖的高速带宽实现交互通讯。大幅度提高交互效率。它可以让不同类型或者是相同的处理器以巨大的规模连接为一个整体。

首先介绍一下基于X86平台打造的DGX-1和基于POWER平台打造的MINSKY对于NVLINK支持的区别和优势,如下图。

DGX-1目前只能支持GPU-GPU的NVLINK的传输方式,而CPU-GPU之间的传输还只能通过PCI-E+QPI的传输方式,而不能打通CPU-GPU的NVLINK的传输方式。

容天MINSKY可以实现完全的代替PCI-E+QPI的方式完全实现CPU-GPU和GPU-GPU的传输方式,如下图:

容天MINSKY现在已经达到CPU-GPU和GPU-GPU直接的NVLINK传输方式,基本带宽可以达到80GB/S的能力,比DGX-1提升了30%以上的能力。

简单的总结,就是NVLink与PCIe有些相似,但又有很大的区别。相似在于二者都是一种传输技术,所要解决的问题也是各个部件之间的通信问题。所不同的在于,NVLink的性能更高,而且NVLink还有一招杀手锏就是GPU与CPU之间的缓存一致性技术。什么叫缓存一致性,就是CPU可以直接访问GPU的内存、而GPU也可以直接访问CPU的内存。这么做有啥好处?首先,双方可以直接访问对方的内存意味着很多任务不必再经过对方,减少一道手续意味着更高的效率。其次,己方内存不够用时能够借用对方资源,可大幅提高资源利用率,大大降低编程难度 ,显存容量的瓶颈将不复存在。可以说NVLINK打通了高性能计算和深度学习的任督二脉,彻底点燃你的“小宇宙“。

二、先进的结构设计


 

 容天MINISKY系统率先采用美国能源部未来超算架构
△ MINSKY 系统现有 2 颗最新的POWER 8处理器的配置可供选择,该系统由高性能/高可靠性零部件打造而成

△ MINSKY 系统现有 4 颗NVLINK Tesla P100 加速器的配置可供选择,该系统由高性能/高可靠性零部件打造而成

△ 采用 2U 架上型机箱,可单独使用,也可以集成到集群当中

△ 其革命性的性能高达 85 FP16 TFLOPS,可大幅提升训练速度

三、先进的系统

世界最快的深度学习企业级解决方案

全新IBM PowerAI Software Toolkit与针对IBM Power架构优化的NVIDIA NVLink和GPUDL组件完美结合,在AlexNet with Caffe上能实现两倍-四倍的性能突破。

深度学习是一种快速发展的机器学习方法,这种方法通过筛选数百万条数据而检测数据中最重要的方面并进行排序,从而提炼出有用的信息。在知名消费者网络和移动应用公司公开支持下,深度学习已被更多传统商业企业迅速采用。      

深度学习和其他人工智能能力在多个行业得到了应用:在银行业,这些能力通过面部识别增强欺诈监测;在汽车行业,这些能力被用在自动驾驶车辆中;而在零售业,则被用于构建全自动呼叫中心,其中配备的电脑能够更好地理解语音并回答问题。

 

 http://mmbiz.qpic.cn/mmbiz_jpg/mWqnp3jibtKjVkWDu7GcFEXLziaHHqJGyOuYcd8nGQx9FagptbYXQ68DJLzb1r8h268OW2Aeet68Yle48sl6icLRQ/640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy=1

 

 

日前发布的全新深度学习软件工具包名为IBM PowerAI,它运行在最近推出的IBM服务器上,该服务器针对人工智能而构建,配备了专为IBM Power架构而优化的NVIDIA® NVLink™互连技术。这种融合软硬件的解决方案比同类服务器的性能高两倍以上。同样运行Alexnet with BVLC Caffe的4-GPU Power服务器配置的性能也优于基于8个M40 GPU的x86服务器配置,使其成为关键深度学习框架两个版本上全球最快的商用企业系统平台。       

Caffe是由伯克利视觉与学习中心 (BVLC) 开发的深度学习框架,是科技行业最常见的深度学习社区应用之一。Caffe是IBM PowerAI工具包中可用的五个深度学习软件框架之一。该工具包采用了NVIDIA的GPUDL组件,包括cuDNN、cuBLAS和NCCL,这些组件作为NVIDIA SDK的一部分,在IBM服务器上提供了多GPU加速。          

IBM PowerAI可在 IBM OpenPOWER LC产品家族中性能最高的服务器上运行,即MINSKY SCS8848,它采用针对Power架构和NVIDIA最新GPU技术而优化的NVIDIA NVLink技术。这一最新解决方案支持新兴的人工智能计算方法,尤其是深度学习。IBM PowerAI也为IBM的认知解决方案平台 Watson提供了持续的演进路径,旨在通过采用多种深度学习方法训练Watson,从而增强企业中的人工智能能力。

 http://mmbiz.qpic.cn/mmbiz_jpg/mWqnp3jibtKjVkWDu7GcFEXLziaHHqJGyOBN8hBIVe6fy0vUvSmQ3ARWcsf9gdTMVPqQ7zotfD7BbhRmCicY6TaBw/640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy=1

 

“PowerAI通过为企业数据科学家和研究科学家提供易于部署的平台而快速开展AI历程,实现了深度学习和其他先进的分析技术的大众化。无论是用于客户交流的聊天机器人,还是社交媒体数据的实时分析,通过与我们针对AI而构建的高性能计算服务器相结合,IBM都为企业构建基于AI的软件提供了最佳的平台。”     

IBM PowerAI从即日起向MINSKY SCS8848服务器客户免费提供。PowerAI的设计可运行在单台MINSKY SCS8848服务器上,而且也可以通过扩展而在数十、数百或数千台服务器组成的大型超级计算集群中运行。

 

 ced62af.bmp

 

(MINSKY SCS8848 with 4 Tesla P100 Tesla GPUs is 24 percent faster than 8 Tesla M40 GPUs)

 

NVLink的优势

PowerAI是常见深度学习框架的一组二进制版本,包括Caffe、Torch和Theano。其他版本包括IBM和NVIDIA的Caffe深度学习框架版本,即IBM-Caffe和NVCaffe。IBM对每个版本进行了优化,以在MINSKY SCS8848在服务器上利用最新发布的带有NVIDIA NVLink接口的IBM POWER8芯片。

 配有NVIDIA NVLink芯片的POWER8是一种技术领先的处理器设计,而这种设计是OpenPOWER基金会成员IBM和NVIDIA开放协作的结果。新型芯片实现了IBM POWER8 CPU服务器架构与最新Pascal架构的NVIDIA Tesla P100 GPU加速器之间的紧密集成。MINSKY SCS8848中集成的CPU和GPU通过高速NVIDIA NVLink互连技术互相连接。CPU与GPU之间(同时也是GPU之间)这种在业内独特的接口消除了基于Intel x86的大多数服务器中常见的PCIe接口造成的潜在瓶颈。PowerAI的深度学习应用工具包利用这种基于NVLink的新型服务器架构,可优化领先的人工智能、深度学习和机器学习应用的性能。

附件:

容天MINSKY配置信息

配置

数量

CPU

IBM Power8 8核,64线程,3.32GHz

2

内存

8GB DDR4 2133

16

硬盘

1TB SSD

2

GPU

TESLA P100 NVLINK 16GB

4

网络

MELLANOX EDR 100GB

1

电源

1300W 1+1冗余电源

1

系统

LINUX 64+CUDA

1