继NVIDIA公司打造了世界上第一台专为X86平台人工智能使用的超级计算机DGX-1之后,容天联合IBM及NVIDIA公司打造了基于POWER平台的人工智能与机器学习超级计算机MINSKY,容天MINSKY作为代表着未来超算架构的美国能源部下一代150-300 PFLOPS超级计算机的雏形机,将用在专注于开放型人工智能研究的研发人员, NVIDIA的小芯片+IBM的大智慧+容天超算技术底蕴,这样的组合堪称“天作之合”。

容天MINSKY的先天优势

一、先进的NVlink

NVLink — 拉近一切处理器之间遥远的距离,NVLink是一项全新概念的技术,甚至可以说是一项新理念。它并不是一个真的Link,而是一个能横跨在GPU和CPU之间,或者是GPU和GPU之间的快速互联机制,同时可以提供恐怖的高速带宽实现交互通讯。大幅度提高交互效率。它可以让不同类型或者是相同的处理器以巨大的规模连接为一个整体。

首先介绍一下基于X86平台打造的DGX-1和基于POWER平台打造的MINSKY对于NVLink支持的区别和优势,如下图。

DGX-1目前只能支持GPU-GPU的NVLink的传输方式,而CPU-GPU之间的传输还只能通过PCI-E+QPI的传输方式,而不能打通CPU-GPU的NVLink的传输方式。

容天MINSKY可以实现完全的代替PCI-E+QPI的方式完全实现CPU-GPU和GPU-GPU的传输方式,如下图:

容天MINSKY现在已经达到CPU-GPU和GPU-GPU直接的NVLink传输方式,基本带宽可以达到80GB/S的能力,比DGX-1提升了30%以上的能力。

简单的总结,就是NVLink与PCIe有些相似,但又有很大的区别。相似在于二者都是一种传输技术,所要解决的问题也是各个部件之间的通信问题。所不同的在于,NVLink的性能更高,而且NVLink还有一招杀手锏就是GPU与CPU之间的缓存一致性技术。什么叫缓存一致性,就是CPU可以直接访问GPU的内存、而GPU也可以直接访问CPU的内存。这么做有什么好处呢?首先,双方可以直接访问对方的内存意味着很多任务不必再经过对方,减少一道手续意味着更高的效率。其次,己方内存不够用时能够借用对方资源,可大幅提高资源利用率,大大降低编程难度 ,显存容量的瓶颈将不复存在。

二、先进的结构设计


             

 容天MINSKY系统率先采用美国能源部未来超算架构

△ MINSKY 系统现有 2 颗最新的POWER 8处理器的配置可供选择,该系统由高性能/高可靠性零部件打造而成

△ MINSKY 系统现有 4 颗NVLink Tesla P100 加速器的配置可供选择,该系统由高性能/高可靠性零部件打造而成

△ 采用 2U 架上型机箱,可单独使用,也可以集成到集群当中

△ 其革命性的性能高达 85 FP16 TFLOPS,可大幅提升训练速度

三、先进的系统

软硬件单箱一体机—— 一机在手,天下我有

MINSKY的革命性不仅限于“多快好省”,它还提供一整套优化的深度学习软件,这符合其面向深度学习和人工智能领域的角色定位。Deep Learning SDK开发工具包、NVIDIA DIGITS 深度学习管理调度平台、Deep Learning 开源框架等定制化软件为深度学习提供了全方位的软件支持,“开箱即用”可谓是 GPU 深入软件领域支持人工智能产业的匠心之笔。 

其中,Deep Learning SDK 开发工具包内含强大的工具及类库,可用于设计、开发和部署面向 GPU 优化的深度学习应用。其中的类库包括深度学习基础 cuDNN、线性代数、稀疏矩阵、多 GPU 通信以及全面的 CUDA C\C++ 开发环境。NVIDIA DIGITS 深度学习管理调度平台为图像视频类数据分类和识别,提供了包括 LeNet、AlexNet、GoogLeNet等在内的预设优化算法。

容天MINSKY把不可能变为可能——小身材,大实力

容天MINSKY可以帮助众多产业改变行业发展的未来,包括医疗、生命科学、能源、金融服务、汽车、制造业以及娱乐业等。这款体积微型、性能强悍、软硬件兼顾的MINSKY,一经发布即吸引了中国客户的眼光。

附件:

容天MINSKY配置信息

配置

数量

CPU

IBM Power8 8核,64线程,3.32GHz

2

内存

32GB DDR4 2133

8

硬盘

960GB SSD

2

GPU

TESLA P100 NVLINK 16GB

4

网络

MELLANOX EDR 56GB

1

电源

1300W 1+1冗余电源

1

系统

LINUX 64+CUDA

1