PNY NVIDIA L40 48GB PCIe 4.0 Data Center GPU (TCSL40PCIE-PB)
Der NVIDIA L40-Grafikprozessor auf Basis der Ada Lovelace-Architektur bietet revolutionäre neuronale Grafik sowie Virtualisierungs-, Rechen- und KI-Funktionen für GPU-Beschleunigte Workloads im Rechenzentrum.
NVIDIA L40 - Technische Daten
Grafikprozessorarchitektur: | NVIDIA Ada Lovelace-Architektur |
GPU-Speicher: | 48 GB GDDR6 mit ECC |
Bildschirmanschlüsse: | 4 x DP 1.4a |
Max. Energieverbrauch: | 300 W |
Formfaktor: | 11,2 cm (H) x 26,7 cm (L); Doppelsteckplatz |
Kühlung: | Passiv |
vGPU-Softwareunterstützung*: | NVIDIA vPC/vApps, NVIDIA RTX Virtual Workstation (vWS) |
NVENC | NVDEC: | 3x | 3x (mit AV1-Kodierung und -Dekodierung) |
Sicheres Booten mit Root-of-Trust: | Ja |
NEBS-fähig: | Ja / Level 3 |
Stromanschluss: | 1x PCIe CEM5 16-polig |
* Unterstützung für Virtualisierungssoftware voraussichtlich Anfang 2023 (siehe NVIDIA Homepage für aktuelle Informationen)
Optimiert für NVIDIA Omniverse Enterprise
Als Motor von NVIDIA® Omniverse™ Enterprise im Rechenzentrum bietet der NVIDIA L40 leistungsstarke RTX- und KI-Funktionen für Workloads wie erweiterte (XR) und Virtual Reality (VR)-Anwendungen, Design Collaboration und digitale Zwillinge. Für die komplexesten Omniverse-Workloads ermöglicht der NVIDIA L40 ein beschleunigtes Ray-Traced- und Path-Traced-Rendering von Materialien, physikalisch exakte Simulationen und die Erzeugung fotorealistischer synthetischer 3D-Daten.
NVIDIA Ada Architecture
Der NVIDIA® L40 bietet eine noch nie dagewesene visuelle Rechenleistung für das Rechenzentrum und stellt leistungsstarke Grafik- und KI-Funktionen für GPU-beschleunigte Anwendungen bereit. Der NVIDIA L40 Grafikprozessor basiert auf der revolutionären neuen Ada Lovelace GPU-Architektur und nutzt die Leistung der neuesten Generation von RT-, Tensor- und CUDA-Cores, um bahnbrechende Raytracing- und Rechenleistung für die anspruchsvollsten Visual Computing- und KI-Workloads im Rechenzentrum zu liefern.
CUDA Cores
Die auf der NVIDIA Ada Architektur basierenden CUDA Kerne bieten im Vergleich zur Vorgängergeneration einen mehr als doppelt so hohen FP32-Durchsatz (90,5 TFLOPS), was erhebliche Leistungssteigerungen für Grafik-Workflows wie die Entwicklung von 3D-Modellen und Berechnungen für Workloads wie Desktop-Simulationen für Computer-Aided Engineering (CAE) bedeutet. Der L40 ermöglicht zwei FP32-Primärdatenpfade, wodurch sich die FP32-Spitzenoperationen verdoppeln.
3rd Generation RT Cores
Mit 142 Raytracing-Engines der 3. Generation bieten die auf der NVIDIA Ada-Architektur basierenden GPUs eine unglaubliche Raytracing-Leistung. Eine einzige L40 Karte kann komplexe professionelle Modelle mit physikalisch exakten Schatten, Reflexionen und Brechungen rendern, so dass der Benutzer sofortige Einblicke erhält. Im Zusammenspiel mit Anwendungen, die APIs wie NVIDIA OptiX, Microsoft DXR und Vulkan-Raytracing nutzen, ermöglichen Systeme auf Basis des L40 wirklich interaktive Design-Workflows, die sofortiges Feedback für ein noch nie dagewesenes Maß an Produktivität liefern. Der L40 bietet einen bis zu 2-fach schnelleren Durchsatz bei der Durchdringung von Strahlen-Dreiecken als die vorherige Generation.
4th Generation Tensor Cores
Der L40 ist spezialisiert auf Deep-Learning-Matrix-Multiplikations- und Akkumulations-Mathematikoperationen, die das Herzstück des Trainings neuronaler Netzwerke und der Inferenzfunktionen bilden. Er enthält 568 Tensor-Cores der vierten Generation, die mehr Datentypen beschleunigen und weiterhin die Fine-Grained Structured Sparsity-Funktion unterstützen, die im Vergleich zur vorherigen Generation einen mehr als 2-fachen Durchsatz für Tensor-Matrix-Operationen liefert. Die neuen Tensor Cores beschleunigen die neuen FP8-Präzisionsmodi. Unabhängige Fließkomma- und Integer-Datenpfade ermöglichen eine effizientere Ausführung von Workloads mit einer Mischung aus Berechnungen und Adressierungsberechnungen.
PCIe Gen 4
Der L40 unterstützt PCI Express Gen 4, das eine doppelt so hohe Bandbreite wie PCIe Gen 3 bietet und die Datenübertragungsgeschwindigkeit vom CPU-Speicher für datenintensive Aufgaben wie KI und Data Science verbessert.
Higher Speed GDDR6 Memory
Der 48 GB große GDDR6-Speicher bietet einen bis zu 25 % höheren Durchsatz für Raytracing, Rendering und KI-Workloads als die vorherige Generation. Der L40 bietet den branchenweit größten Grafikspeicher-Footprint, um die größten Datensätze und Modelle in latenzempfindlichen professionellen Anwendungen zu bewältigen.
Fehlerkorrekturcode (ECC) im Grafikspeicher
Mit Error Correcting Code (ECC) im Grafikspeicher erfüllen Sie strenge Anforderungen an die Datenintegrität für unternehmenskritische Anwendungen mit kompromissloser Rechengenauigkeit und Zuverlässigkeit.
6th Generation NVDEC Engine
NVDEC eignet sich gut für Transkodierungs- und Videowiedergabeanwendungen zur Echtzeitdekodierung. Die folgenden Videocodecs werden für die hardwarebeschleunigte Dekodierung unterstützt: MPEG-2, VC-1, H.264 (AVCHD), H.265 (HEVC), VP8, VP9 und AV1-Videoformate. Für die professionelle Videobearbeitung wird eine Videokodierung mit 8K/60 möglich sein. Durch die Kombination dieser Technologie mit den auf der NVIDIA Ada Lovelace Architektur basierenden Tensor Cores kann der L40 schnell KI und Inferencing auf Echtzeit-Videos anwenden.
8th Generation NVENC Engine
NVENC kann die anspruchsvollsten 4K- oder 8K-Videocodierungsaufgaben übernehmen, um die Grafik-Engine und die CPU für andere Aufgaben freizugeben. Der L40 bietet eine bessere Kodierungsqualität als softwarebasierte x264-Encoder. Der L40 verfügt über eine AV1-Videocodierung, die 30 % effizienter ist als die H.264-Codierung für 4K-HDR-Videos. AV1 bietet eine bessere Qualität bei gleicher Bitraten-Bandbreite.
Graphics Preemption
Graphics Preemption auf Pixelebene ermöglichet eine genauere Steuerung, um zeitkritische Aufgaben wie das VR-Bewegungs-Tracking besser zu unterstützen.
Preemptives Computing
Preemptives Computing auf Anweisungsebene bieten eine feinere Kontrolle über Rechenaufgaben, um zu verhindern, dass langlaufende Anwendungen die Systemressourcen für sich beanspruchen oder die Zeit überziehen.
NVIDIA RTX IO
Beschleunigung der GPU-basierten verlustfreien Dekomprimierungsleistung um das bis zu 100-fache und 20-fach geringere CPU-Auslastung im Vergleich zu herkömmlichen Speicher-APIs unter Verwendung der neuen DirectStorage for Windows-API von Microsoft. RTX IO überträgt Daten vom Speicher zur GPU in einer effizienteren, komprimierten Form und verbessert die E/A-Leistung.
MULTI-GPU TECHNOLOGY
NVIDIA® SLI® Technology
Nutzen Sie mehrere Grafikprozessoren, um die Grafikleistung dynamisch zu skalieren, die Bildqualität zu verbessern, den Anzeigebereich zu erweitern und ein vollständig virtualisiertes System zusammenzustellen.
DISPLAY FEATURES
NVIDIA® Mosaic Technology
Transparente Skalierung der Anwendungen über bis zu 4 GPUs . für Cave automatische virtuelle Umgebungen Bilder und Skalierung der Auflösung einer Anzeigefläche mit mehreren Projektoren oder Displays.
DisplayPort 1.4a
Unterstützt bis zu vier 5K Monitore @ 60Hz, oder zwei 8K Displays @ 60Hz pro Karte. Der NVIDIA L40 unterstützt HDR-Farben für 4K @ 60Hz für 10/12b HEVC-Dekodierung und bis zu 4K @ 60Hz für 10b HEVC-Kodierung. Jeder DisplayPort-Anschluss kann ultrahohe Auflösungen von 4096x2160 @ 120 Hz mit 30-Bit-Farbe verarbeiten.
NVIDIA® Quadro Sync II
Synchronisieren Sie die Anzeige und Bildausgabe von bis zu 32 Displays3 von 8 GPUs (verbunden über zwei Sync II-Karten) in einem einzigen System und reduzieren Sie so die Anzahl der Geräte, die für die Erstellung einer fortschrittlichen Videovisualisierungsumgebung erforderlich sind.
Frame Lock Connector Latch
Jeder Frame-Lock-Anschluss ist mit einem selbstverriegelnden Haltemechanismus ausgestattet, um die Verbindung mit dem Frame-Lock-Kabel zu sichern und eine robuste Konnektivität und maximale Produktivität zu gewährleisten.
Allgemein | |
---|---|
Hersteller | PNY |
Hersteller Artikelnummer | TCSL40PCIE-PB |
Hersteller Garantie (Monate) | 12 Mon. Hersteller Garantie |
Verpackung | retail |
Erweiterungskarten | |
Hostschnittstelle | PCI Express 4.0 x16 |
Bauform kompatibel | full-height |
Slot Belegung | Dual-Slot |
Arbeitsspeicher / Cache | |
Speicher | 48 GB |
Speicher Typ | GDDR6 |
Fehlerkorrektur | ECC |
Arbeitsspeicher Details | |
Speicher Interface | 384 Bit |
Speicher Bandbreite | 864 GB/s |
Grafik- und GPU Karten | |
Externe Anschlüsse | 4x DisplayPort 1.4 |
Graphic APIs | DirectX 12 Ultimate, OpenGL 4.6, Shader Model 6.6, Vulkan 1.3 |
Compute APIs | CUDA, OpenCL |
max. Displays simultan | 4 |
Kühlung | passiv - für GPU Server geeignet [ohne Lüfter] |
CUDA Kerne | 18176 CUDA Cores |
Tensor Kerne | 568 Tensor Cores |
Abmessungen | |
Breite | Dual Slot |
Höhe | 112 mm |
Tiefe | 267 mm |
Weiteres | |
enthaltenes Zubehör | - |
Downloads | |
---|---|
Produktdatenblatt (PDF - 0.10MB) |