产品中心
Product
首页 > 产品中心 > 数据中心产品 > 英伟达 GPU
返回

NVIDIA L40s GPU


为数据中心赋予出色的 AI 和图形性能


L40s.png 


功能强大的通用型 GPU


NVIDIA L40S GPU 可提供突破性的多工作负载性能体验。 精心设计的 L40S GPU 将强大的 AI 计算性能与出色的图形和媒体加速功能相结合,旨在为新一代数据中心工作负载提供支持。从生成式 AI 和大型语言模型(LLM)推理与训练,到 3D 图形、渲染和视频,都能应对自如。


亮点


通用性极高的出色性能


Tensor 性能                 1,466 TFLOPS(峰值速率基于 GPU 加速频率)

RT Core 性能               212 TFLOPS

单精度浮点运算性能     91.6 TFLOPS


特性


由 NVIDIA Ada Lovelace 架构提供支持


第四代 Tensor Core


针对结构化具有稀疏性和优化的 TF32 格式提供硬件支持,为更快的 AI 和数据科学模型训练提供开箱即得的性能提升。可利用 DLSS 技术加速 AI 增强型图形功能,从而在特定应用中提供更高的分辨率和更出色的性能。


第三代 RT Core


增加的吞吐量以及并发光线追踪和着色功能可提升光线追踪性能,从而加快产品设计以及架构、工程和施工工作流程的渲染。可利用硬件加速的动态模糊技术提供令人惊艳的实时动画效果,以帮助了解逼真设计的实际效果。


CUDA Core 核心


加速单精度浮点(FP32)吞吐量和更高的能效可显著提升 3D 模型开发和计算机辅助工程(CAE)仿真等工作流程的性能。可使用增强的 16-bit Math Capability(BF16)支持混合精度工作负载。


Transformer 引擎


Transformer 引擎可显著加速 AI 性能,并提高训练和推理的内存利用率。凭借 Ada Lovelace 第四代 Tensor Core 的强大功能,Transformer 引擎可以智能地扫描转换器架构神经网络的各个层,并在 FP8 和 FP16 精度之间自动重铸,从而提供更快的 AI 性能并加速训练和推理。


效率和安全性


L40S GPU 针对全天候企业数据中心运营进行了优化,经过 NVIDIA 的精心设计、构建、测试和支持,可确保更大限度地提高性能、耐用性和正常运行时间。L40S GPU 符合新数据中心标准,支持网络设备构建系统(NEBS)3 级标准,并且采用了信任根技术实现安全启动,可为数据中心提供额外的安全保护。


DLSS 3


依靠 NVIDIA DLSS 3 的加持,L40S GPU 可以支持超快渲染和更高帧率,使画面有如行云流水。这项突破性的帧生成技术利用深度学习及 Ada Lovelace 架构和 L40S GPU 中的新一代硬件创新(包括第 4 代 Tensor Core 和光流加速器)来提升渲染性能,在提高每秒帧数(FPS)的同时显著降低延迟。


技术规格


表格.png


与 NVIDIA 产品相关的图片或视频(完整或部分)的版权均归 NVIDIA Corporation 所有

上一篇:NVIDIA L40 GPU