人工智能隐藏在海量的数据中

个性化的癌症治疗

预测下一个飓风的来临虚拟助理的自然交流

… …

当数据科学家拥有了必要的工具

这一切终将迎刃而解

NVIDIA近日推出了全球最强大的GPU计算架构 Volta™,旨在推动人工智能和高性能计算的下一波发展。同时,NVIDIA还发布了首款基于Volta的处理器——NVIDIA® Tesla® V100数据中心GPU,它将大幅提升人工智能推理和训练以及加速HPC与图形处理的速度与可扩展性。

第七代GPU架构性能飙升

人工智能并非由某一个行业来定义。它存在于超级计算机领域、医疗保健、金融服务、大数据分析和游戏中。这是每一个行业和市场的未来。不可否认的是:人工智能的引擎就是NVIDIA GPU计算平台。


NVIDIA创始人兼首席执行官黄仁勋在GTC主题演讲中说:“人工智能正在推动人类历史上最大的技术进步。它将实现智能的自动化,掀起继工业革命之后的又一轮前所未有的社会进步。深度学习是探索人工智能的一种开创性方法,它创造出了具备学习能力的计算机软件,对处理能力有着相当高的需求。数千名NVIDIA工程师花费三年多时间打造出Volta,以满足这一需求,从而助力业界充分发挥人工智能改变生活的潜力。”

Volta是 NVIDIA的第七代GPU架构,采用了210亿个晶体管,其深度学习性能相当于100个CPU。Volta的最高浮点运算性能为NVIDIA当前GPU架构Pascal™的5倍,是两年前发布的Maxwell™架构的15倍。这一提升幅度已经超过摩尔定律预测的4倍。

随着各种网络变得日益复杂,数据中心需要提供更强的处理能力。Volta将成为高性能计算的新标准。它为HPC系统提供了一个平台,在计算科学和数据科学领域表现突出,能够助力人们获得深入洞察。

令人振奋的技术突破

通过将CUDA®内核和全新Volta Tensor 内核整合在统一架构中,装有Tesla V100 GPU的单一服务器将取代数百个传统HPC的商用CPU。Tesla V100 GPU凭借其卓越的技术,突破了深度学习每秒100万亿次浮点运算的大关。其技术突破包括:

*Tensor内核旨在加速人工智能工作负载的运行。V100配备640个Tensor内核,可提供120万亿次浮点运算的深度学习性能,相当于100个CPU的性能。


*全新GPU架构配有超过210亿个晶体管。它将CUDA内核和Tensor Core整合在一个统一的架构中,可以在一个GPU中提供人工智能超级计算机的性能。

*NVLink™提供新一代高速互连,在GPU之间以及GPU和CPU之间建立连接,吞吐量是上一代NVLink的2倍。

*速度高达900 GB/秒的 HBM2 DRAM,由NVIDIA与三星合作开发,比上一代GPU的内存带宽提升了50%。其重要意义在于能够为Volta超常的计算吞吐量提供支持。

*Volta优化软件包括CUDA、cuDNN和TensorRT™软件,其领先的框架和应用程序可轻松地推动人工智能研究加速发展。

NVIDIA Volta已获得来自全球诸多行业领先企业和组织的广泛支持,如:亚马逊、Facebook、谷歌云平台、微软人工智能及微软研究事业部、美国橡树岭国家实验室、百度以及腾讯等。


人工智能加速的需求从未如此之大。开发者、数据科学家和研究人员越来越依赖于神经网络来推进其研究以及提供全新的智能客户体验等方面的进展。颠覆行业,NVIDIA推进人工智能进程的脚步从未停歇。