NVIDIA今天发布了一款端到端超大规模数据中心平台,该平台让Web服务公司能够为其浩繁的机器学习工作量加速。

 

NVIDIA超大规模加速器系列产品包含两款加速器。研究人员想要利用人工智能(AI)来为越来越多的应用提供处理动力,其中一款加速器让研究人员能够为这些应用中的每一个应用更快地开发和设计新的深度神经网络。另一款加速器是一款低功耗加速器,旨在将这些网络部署于整个数据中心。该系列加速器还包含一套GPU加速的库。

 

所有这些加在一起,让开发者能够在超大规模数据中心内利用强大的Tesla加速计算平台来驱动机器学习,打造史无前例且基于人工智能的应用。

 

NVIDIA联合创始人兼首席执行官黄仁勋表示:“机器学习对我们这代人来说是一大计算挑战。我们创造了Tesla超大规模加速器系列产品来使机器学习的速度提升10倍。这为数据中心节省了大量时间和成本。”

 

这些全新的硬件与软件产品经过专门设计,可为竞相融入人工智能功能的海量Web应用加速。机器学习领域中的开创性进步让人们能够利用人工智能技术来打造更智能的应用与服务。

 

NVIDIA Tesla平台的这些新成员包括:

 

  • NVIDIA® Tesla® M40 GPU:性能最强的加速器,专为训练深度神经网络而设计

  • NVIDIA Tesla M4 GPU:低功耗的小巧型加速器,用于机器学习推理以及图像与视频处理的流式传输

  • NVIDIA Hyperscale Suite:一套丰富的软件,专为机器学习和视频处理而优化

 

 

 

NVIDIA Tesla M40 GPU加速器

 

数据科学家需要利用海量的数据来训练其深度神经网络以达到更高的整体准确度,NVIDIA Tesla M40 GPU加速器让数据科学家在训练自己的深度神经网络时能够节省数天乃至数周的时间。其主要特性包括:

 

  • 专为机器学习而优化:与CPU相比可令训练时间缩短 8 倍 (在典型AlexNet训练中的对比结果为1.2天比10天)。

  • 可靠性高、专为全年不间断运行而打造:经过专门设计并在数据中心环境中经测试可提供极高的可靠性。

  • 可扩展的性能:对NVIDIA GPUDirect的支持使其能够快速训练多节点神经网络。

 

NVIDIA Tesla M40 GPU加速器

 

NVIDIA Tesla M4 GPU加速器

 

NVIDIA Tesla M4加速器是一款低功耗GPU,专为超大规模环境而打造并针对苛刻的高增长型Web服务应用而进行了优化。这些应用包括视频转码、图像与视频处理以及机器学习推理等等。主要特性包括:

 

  • 吞吐量更高:同时对多路视频流进行转码、增强以及分析的吞吐量最高可达CPU的5倍。

  • 功耗低:借助用户可选的功率配置文件,Tesla M4仅消耗50-75瓦特的功率,在视频处理与机器学习算法方面最多比CPU节能10倍。

  • 外形小巧:刀卡式PCIe设计适合安装到超大规模数据中心系统所需的各种机箱内。

 

NVIDIA Tesla M4 GPU加速器

 

NVIDIA Hyperscale Suite

 

全新的NVIDIA Hyperscale Suite包含针对开发者与数据中心经理的各种工具,这些工具专为部署Web服务而设计,其中包括:

 

  • cuDNN:业界最流行的算法软件,可处理用于人工智能应用的深度卷积神经网络。

  • GPU加速的FFmpeg多媒体软件:可利用应用广泛的 FFmpeg 软件来加速视频转码与视频处理。

  • NVIDIA GPU REST Engine:让人们能够轻松创建和部署高吞吐量低延迟的加速型 Web 服务,这些服务包括动态重调图像尺寸、搜索加速、图像分类以及其它任务。

  • NVIDIA Image Compute Engine:包含 REST API的GPU加速型服务,在重调图像尺寸方面能够比CPU快5倍。

 

业内的Mesosphere公司最近表示支持Tesla加速计算平台,该公司宣布,目前正与NVIDIA携手在Apache Mesos和Mesosphere数据中心操作系统(DCOS)中加入对GPU技术的支持。此举将让Web服务公司能够更轻松地为其下一代应用打造和部署加速的数据中心。

 

Tesla M40 GPU加速器和Hyperscale Suite软件将于今年晚些时候上市。Tesla M4 GPU将于2016年第一季度上市。

 

机器学习让神奇变为现实

 

人们正在利用机器学习来使语音识别变得更加准确。机器学习能够在视频或照片中实现对象识别与场景识别,能够添加标签以便于之后进行搜索。机器学习能够在视频或照片中实现人脸识别,即使是在人脸被部分遮挡的时候也能够识别。机器学习还能够为那些了解个人品味与兴趣的服务提供处理动力,这类服务可制定时间表、提供相关的新闻报道、以对话的口吻准确地对语音指令作出响应。

 

机器学习使这类神奇的功能成为了可能。人们所面临的挑战是如何获得极高的超级计算性能来开发和训练越来越多的深度神经网络、如何获得足够的处理能力来为使用这类服务的消费者即时响应数十亿次查询。NVIDIA超大规模加速器系列产品旨在为这些工作量加速并大幅提升数据中心的吞吐量。