NVIDIA L40为数据中心提供出色视觉计算性能。
从虚拟工作站应用到大规模建模和仿真,现代视觉计算和科学工作流处理的任务数量不断增长,复杂程度不断提高。企业需要可提供超强性能并借助多种功能实现扩展的数据中心技术,以便在处理日益复杂的工作负载时,满足其多样化的计算需求。
NVIDIA® L40 GPU 为数据中心带来出色的视觉计算性能,提供新*代图形、计算和 AI 功能。NVIDIA L40 基于革命性的 NVIDIA Ada Lovelace 架构构建,利用新*代 RT、Tensor 和 CUDA Core 核心的强大功能,为要求严苛的数据中心工作负载提供突破性的可视化和计算性能。
加速新*代工作负载
NVIDIA Omniverse™ Enterprise
渲染和 3D 图形
搭载 NVIDIA RTX 虚拟工作站 (RTX™ vWS) 软件的高性能虚拟工作站
AI 训练和数据科学
串流和视频内容
NVIDIA L40技术规格:
外形规格 |
L40 |
L40S |
GPU Architecture |
Ada Lovelace |
Ada Lovelace |
GPU 显存 |
48GB |
48GB |
GPU 显存带宽 |
864GB/s |
864GB/s |
CUDA Cores |
18176 |
18176 |
RT Cores |
142 |
142 |
RT Cores Performance TFLOPS |
209 |
209 |
Tensor Cores |
568 |
568 |
FP32 TFLOPS |
90.5 |
91.6 |
FP32 Tensor Core TFLOPS |
90.5 |
183 |
BFLOAT16 Tensor Core TFLOPS |
181.05 |
362.05 |
FP16 Tensor Core TFLOPS |
181.05 |
362.05 |
FP8 Tensor Core TFLOPS |
362 |
733 |
Peak INT8 TOPS |
362 |
733 |
Peak INT4 TOPS |
724 |
733 |
显示端口 |
4×DP 1.4a |
4×DP 1.4a |
PCIe Generation |
PCIe Gen4×16 |
PCIe Gen4×16 |
*大热设计功率 (TDP) |
300 |
350 |
由 NVIDIA Ada Lovelace 架构提供支持
*三代 RT Core
增强的吞吐量以及并发光线追踪和着色功能可提升光线追踪性能,加速产品设计和架构、工程和施工工作流的渲染。借助硬件加速的动态模糊技术,提供令人惊叹的实时动画效果,从而了解逼真设计的实际应用情况。
*四代 Tensor Core
硬件支持面向结构化稀疏和优化的 TF32 格式,为更快的 AI 和数据科学模型训练提供开箱即用的性能提升。加速 AI 增强型图形功能(包括 DLSS),在选定应用中提供更高分辨率和更出色的性能。
大容量显存
超快 GDDR6 显存容量高达 48GB,可处理显存密集型应用和工作负载,例如数据科学、仿真、3D 建模和渲染。使用 vGPU 软件为多个用户分配显存,以便在创意、数据科学和设计团队中分配大型工作负载。
数据中心就绪型
NVIDIA L40 专为全天候企业数据中心运营而设计,配备节能**的硬件和组件,经过优化后,可大规模部署,并为各种数据中心工作负载提供卓越性能。L40 包括搭载硬件信任根技术的安全启动,可提供额外的安全层,并且 L40 已达到 NEBS 3 *标准,符合新的数据中心标准。L40 采用被动冷却、节能**的双插槽设计,适用于** OEM 供应商的各种 NVIDIA 认证系统™。