产品中心
Product
首页 > 产品中心 > 数据中心产品 > 英伟达 GPU
返回

NVIDIA L4 Tensor Core GPU


用于高效视频、 AI 和图形的突破性通用加速器 


加速视频、 AI 和图形工作负载


NVIDIA L4 Tensor Core GPU 基于 NVIDIA Ada Lovelace 架构构建,采用低外形尺寸封装的 L4 GPU 是一款经济高效的解决方案,可在从边缘、数据中心到云端的每台服务器中实现高吞吐量和低延迟。


体验实时 AI 视频管线性能


借助 NVIDIA L4 GPU 的强大功能变革视频应用。无论是向数百万观众直播流媒体、帮助用户构建创意故事,还是提供沉浸式增强现实和虚拟现实 (AR / VR) 体验,配备 L4 的服务器均可为移动端用户托管多达 1040 个 720p30 并发 AV1 视频流。(测量性能: 720p30 时 8x L4 AV1 低延迟 P1 预设编码。)


NVIDIA L4 GPU 与 CV - CUDA ® 库搭配使用,可将视频内容推理提升到一个新的水平。 L4 提供的 AI 视频性能比基于 CPU 的解决方案高出 120 倍,可让企业获得实时洞察,从而个性化内容、提高搜索相关性、检测不良内容并实施智能空间解决方案。


1.png


借助 L4 节约更多的能耗和空间


随着 AI 和视频的日益普及,对高效且经济的计算需求也比以往任何时候都更高。 NVIDIA L4 Tensor Core GPU 可将 AI 视频性能提高多达 120 倍,与基于 CPU 的传统基础设施相比,其能源效率提高 99 % , 降低总拥有成本。这使得企业能够减少机架空间并显著降低碳足迹,同时能够将数据中心扩展到更多用户。在 2 兆瓦的数据中心内从 CPU 换为 NVIDIA L4 所节省的能源可为近 2000 户家庭供电一年,或者相当于 10 年内种植 172000 棵树所抵消的碳。(结果来自 EPA 计算器,节省 1.677 兆瓦 。)


2.png


加速生成 AI 性能


用于图像和文本的生成式 AI 使客户的生活更加便利,并在所有行业中获得更加身临其境的体验。 NVIDIA L4 增强了计算密集型生成式 AI 推理,其性能比上一代 GPU 提高了 2.5 倍。 L4 的内存容量增加了 50 % , 可实现更大的图像生成,最高可达 1024x768 , 这是上一代 GPU 所无法实现的。

 

3.png


优化图形性能


采用第三代 RT 核心和 AI 驱动 NVIDIA 深度学习超级采样 3 (DLSS 3), NVIDIA L4 为基于 AI 的头像、 NVIDIA Omniverse ™ 虚拟世界、云游戏和虚拟工作站提供了超过 4 倍的性能提升。这些功能使创作者能够构建实时、电影级的图形和场景,实现 CPU 无法实现的沉浸式视觉体验。

 

4.png


高效且可持续地加速工作负载


NVIDIA L4 是 NVIDIA 数据中心平台的重要组成部分。专为视频、 AI 、NVIDIA RTX ® 虚拟工作站 (vWS) 在图形、仿真、数据科学和数据分析等方面构建,该平台可加速 3000 多个应用,并可在从数据中心到边缘再到云端的任何地方大规模使用,带来显著提升性能和能源效率。


L4 针对主流部署进行了优化,提供了在 72W 低功耗封装中运行的小尺寸外形,使其成为适用于 NVIDIA 合作伙伴生态系统中任何服务器或云实例的高效、经济的解决方案。

 

5.jpeg


借助企业级 AI 软件简化开发和部署


为简化 AI 开发和部署,NVIDIA AI Enterprise 软件套件为包括 AI 解决方案工作流、框架、预训练模型和基础设施而优化,这些都经过认证,并可在通用数据中心平台和装有 NVIDIA L4 GPU 的主流 NVIDIA 认证系统上运行。


NVIDIA AI Enterprise 是 NVIDIA L4 GPU 的新增许可,使几乎每个组织和企业都可以访问 AI ,并在训练、推理和数据科学方面具有最高性能。 NVIDIA AI Enterprise 与 NVIDIA L4 一起简化了 AI 就绪平台的构建,加快了 AI 开发和部署,并提供了性能、安全性和可扩展性,从而更快地收集见解并更快地实现业务价值。

 

6.jpeg


第三代 RT Core


NVIDIA 借助 RT Core 的发明,使实时光线追踪成为现实。RT Core 是 GPU 的处理核心,专为解决性能密集型光线追踪渲染而设计。


Ada Lovelace 架构的第三代 RT Core 具有两倍的光线三角相交吞吐量,将 RT-TFLOP 性能提高了 2 倍以上。 NVIDIA 着色器执行重新排序(SER)将性能提高了 3 倍以上,为虚拟世界带来了深度沉浸式体验,并为基于 AI 的神经图形和云游戏带来了前所未有的生产力。


第四代 Tensor Core


Ada Lovelace 架构 Tensor Core 旨在加速智能聊天机器人、生成式 AI、自然语言处理(NLP)、计算机视觉和 NVIDIA DLSS 3 等变革性的 AI 技术。 Ada Lovelace Tensor Core 释放了结构化稀疏性和 8 位浮点(FP8)运算精度,推理性能相比上一代产品高达 4 倍(L4 FP8 与 T4 FP16 比较)。与更大精度相比,FP8 降低了内存压力,并显著加速了 AI 吞吐量。


先进的视频和视觉 AI 加速


通过优化的 AV1 堆栈,NVIDIA L4 将视频和视觉 AI 加速提升到新的水平,为实时视频转码、流媒体、视频会议、增强现实(AR)、虚拟现实(VR)和视觉 AI 等用例创造了广泛的新可能性。凭借四个视频解码器和两个视频编码器,结合 AV1 视频格式,L4 服务器可以承载超过 1000 个并发视频流(8 卡 L4 AV1 低延迟 P1 预设编码,720p30),AI 视频端到端管线性能比 CPU 解决方案高出 120 倍以上。(8 卡 L4 与双路 Intel 8362 CPU 服务器性能比较: 采用 CV-CUDA 预处理和后处理、解码、推理(SegFormer)、编码、NVIDIA TensorRT(TRT) 8.6 的端到端视频管线,与使用 OpenCV 的纯 CPU 管线比较)。此外,四个 JPEG 解码器进一步加快了需要计算机视觉能力应用的速度。


深度学习超级采样(DLSS)


NVIDIA DLSS 3 是 AI 驱动的图形领域的一项革命性突破,可大幅提升渲染性能。DLSS 3 由 L4 上的全新第四代 TensorCore 和 NVIDIA 光流加速器(OFA)提供支持,使用 AI 为基于图形的工作负载创建更多高质量帧。


虚拟化就绪


凭借 NVIDIA 虚拟GPU(vGPU)软件的新一代改进以及比上一代增加 1.5 倍的 GPU 内存,L4 助力在NVIDIA RTX™ 虚拟工作站(vWS)上运行的中高端设计工作流,将其工作站性能提高 1.7 倍,并为在 NVIDIA 虚拟 PC(vPC)上运行的生产力应用提供加速。


数据中心效率和安全性


NVIDIA L4 针对 7x24小时运营的企业数据中心进行了优化,并由NVIDIA 和合作伙伴设计、构建、广泛测试和提供支持,以实现最高的性能、耐用性和安全性。L4 具有使用信任根技术的安全启动,为数据中心提供额外的安全保障。


技术规格


表格.png


与 NVIDIA 产品相关的图片或视频(完整或部分)的版权均归 NVIDIA Corporation 所有

上一篇:NVIDIA L40s GPU