PNY NVIDIA L40 48GB PCIe 4.0 Data Center GPU (TCSL40PCIE-PB)

Der NVIDIA L40-Grafikprozessor auf Basis der Ada Lovelace-Architektur bietet revolutionäre neuronale Grafik sowie Virtualisierungs-, Rechen- und KI-Funktionen für GPU-Beschleunigte Workloads im Rechenzentrum.

NVIDIA L40 - Technische Daten

Grafikprozessorarchitektur:	NVIDIA Ada Lovelace-Architektur
GPU-Speicher:	48 GB GDDR6 mit ECC
Bildschirmanschlüsse:	4 x DP 1.4a
Max. Energieverbrauch:	300 W
Formfaktor:	11,2 cm (H) x 26,7 cm (L); Doppelsteckplatz
Kühlung:	Passiv
*vGPU-Softwareunterstützung:**	NVIDIA vPC/vApps, NVIDIA RTX Virtual Workstation (vWS)
NVENC \| NVDEC:	3x \| 3x (mit AV1-Kodierung und -Dekodierung)
Sicheres Booten mit Root-of-Trust:	Ja
NEBS-fähig:	Ja / Level 3
Stromanschluss:	1x PCIe CEM5 16-polig

* Unterstützung für Virtualisierungssoftware voraussichtlich Anfang 2023 (siehe NVIDIA Homepage für aktuelle Informationen)

Optimiert für NVIDIA Omniverse Enterprise

Als Motor von NVIDIA® Omniverse™ Enterprise im Rechenzentrum bietet der NVIDIA L40 leistungsstarke RTX- und KI-Funktionen für Workloads wie erweiterte (XR) und Virtual Reality (VR)-Anwendungen, Design Collaboration und digitale Zwillinge. Für die komplexesten Omniverse-Workloads ermöglicht der NVIDIA L40 ein beschleunigtes Ray-Traced- und Path-Traced-Rendering von Materialien, physikalisch exakte Simulationen und die Erzeugung fotorealistischer synthetischer 3D-Daten.

NVIDIA Ada Architecture

Der NVIDIA® L40 bietet eine noch nie dagewesene visuelle Rechenleistung für das Rechenzentrum und stellt leistungsstarke Grafik- und KI-Funktionen für GPU-beschleunigte Anwendungen bereit. Der NVIDIA L40 Grafikprozessor basiert auf der revolutionären neuen Ada Lovelace GPU-Architektur und nutzt die Leistung der neuesten Generation von RT-, Tensor- und CUDA-Cores, um bahnbrechende Raytracing- und Rechenleistung für die anspruchsvollsten Visual Computing- und KI-Workloads im Rechenzentrum zu liefern.

CUDA Cores

Die auf der NVIDIA Ada Architektur basierenden CUDA Kerne bieten im Vergleich zur Vorgängergeneration einen mehr als doppelt so hohen FP32-Durchsatz (90,5 TFLOPS), was erhebliche Leistungssteigerungen für Grafik-Workflows wie die Entwicklung von 3D-Modellen und Berechnungen für Workloads wie Desktop-Simulationen für Computer-Aided Engineering (CAE) bedeutet. Der L40 ermöglicht zwei FP32-Primärdatenpfade, wodurch sich die FP32-Spitzenoperationen verdoppeln.

3rd Generation RT Cores

Mit 142 Raytracing-Engines der 3. Generation bieten die auf der NVIDIA Ada-Architektur basierenden GPUs eine unglaubliche Raytracing-Leistung. Eine einzige L40 Karte kann komplexe professionelle Modelle mit physikalisch exakten Schatten, Reflexionen und Brechungen rendern, so dass der Benutzer sofortige Einblicke erhält. Im Zusammenspiel mit Anwendungen, die APIs wie NVIDIA OptiX, Microsoft DXR und Vulkan-Raytracing nutzen, ermöglichen Systeme auf Basis des L40 wirklich interaktive Design-Workflows, die sofortiges Feedback für ein noch nie dagewesenes Maß an Produktivität liefern. Der L40 bietet einen bis zu 2-fach schnelleren Durchsatz bei der Durchdringung von Strahlen-Dreiecken als die vorherige Generation.

4th Generation Tensor Cores

Der L40 ist spezialisiert auf Deep-Learning-Matrix-Multiplikations- und Akkumulations-Mathematikoperationen, die das Herzstück des Trainings neuronaler Netzwerke und der Inferenzfunktionen bilden. Er enthält 568 Tensor-Cores der vierten Generation, die mehr Datentypen beschleunigen und weiterhin die Fine-Grained Structured Sparsity-Funktion unterstützen, die im Vergleich zur vorherigen Generation einen mehr als 2-fachen Durchsatz für Tensor-Matrix-Operationen liefert. Die neuen Tensor Cores beschleunigen die neuen FP8-Präzisionsmodi. Unabhängige Fließkomma- und Integer-Datenpfade ermöglichen eine effizientere Ausführung von Workloads mit einer Mischung aus Berechnungen und Adressierungsberechnungen.

PCIe Gen 4

Der L40 unterstützt PCI Express Gen 4, das eine doppelt so hohe Bandbreite wie PCIe Gen 3 bietet und die Datenübertragungsgeschwindigkeit vom CPU-Speicher für datenintensive Aufgaben wie KI und Data Science verbessert.

Higher Speed GDDR6 Memory

Der 48 GB große GDDR6-Speicher bietet einen bis zu 25 % höheren Durchsatz für Raytracing, Rendering und KI-Workloads als die vorherige Generation. Der L40 bietet den branchenweit größten Grafikspeicher-Footprint, um die größten Datensätze und Modelle in latenzempfindlichen professionellen Anwendungen zu bewältigen.

Fehlerkorrekturcode (ECC) im Grafikspeicher

Mit Error Correcting Code (ECC) im Grafikspeicher erfüllen Sie strenge Anforderungen an die Datenintegrität für unternehmenskritische Anwendungen mit kompromissloser Rechengenauigkeit und Zuverlässigkeit.

6th Generation NVDEC Engine

NVDEC eignet sich gut für Transkodierungs- und Videowiedergabeanwendungen zur Echtzeitdekodierung. Die folgenden Videocodecs werden für die hardwarebeschleunigte Dekodierung unterstützt: MPEG-2, VC-1, H.264 (AVCHD), H.265 (HEVC), VP8, VP9 und AV1-Videoformate. Für die professionelle Videobearbeitung wird eine Videokodierung mit 8K/60 möglich sein. Durch die Kombination dieser Technologie mit den auf der NVIDIA Ada Lovelace Architektur basierenden Tensor Cores kann der L40 schnell KI und Inferencing auf Echtzeit-Videos anwenden.

8th Generation NVENC Engine

NVENC kann die anspruchsvollsten 4K- oder 8K-Videocodierungsaufgaben übernehmen, um die Grafik-Engine und die CPU für andere Aufgaben freizugeben. Der L40 bietet eine bessere Kodierungsqualität als softwarebasierte x264-Encoder. Der L40 verfügt über eine AV1-Videocodierung, die 30 % effizienter ist als die H.264-Codierung für 4K-HDR-Videos. AV1 bietet eine bessere Qualität bei gleicher Bitraten-Bandbreite.

Graphics Preemption

Graphics Preemption auf Pixelebene ermöglichet eine genauere Steuerung, um zeitkritische Aufgaben wie das VR-Bewegungs-Tracking besser zu unterstützen.

Preemptives Computing

Preemptives Computing auf Anweisungsebene bieten eine feinere Kontrolle über Rechenaufgaben, um zu verhindern, dass langlaufende Anwendungen die Systemressourcen für sich beanspruchen oder die Zeit überziehen.

NVIDIA RTX IO

Beschleunigung der GPU-basierten verlustfreien Dekomprimierungsleistung um das bis zu 100-fache und 20-fach geringere CPU-Auslastung im Vergleich zu herkömmlichen Speicher-APIs unter Verwendung der neuen DirectStorage for Windows-API von Microsoft. RTX IO überträgt Daten vom Speicher zur GPU in einer effizienteren, komprimierten Form und verbessert die E/A-Leistung.

MULTI-GPU TECHNOLOGY

NVIDIA® SLI® Technology

Nutzen Sie mehrere Grafikprozessoren, um die Grafikleistung dynamisch zu skalieren, die Bildqualität zu verbessern, den Anzeigebereich zu erweitern und ein vollständig virtualisiertes System zusammenzustellen.

DISPLAY FEATURES

NVIDIA® Mosaic Technology

Transparente Skalierung der Anwendungen über bis zu 4 GPUs . für Cave automatische virtuelle Umgebungen Bilder und Skalierung der Auflösung einer Anzeigefläche mit mehreren Projektoren oder Displays.

DisplayPort 1.4a

Unterstützt bis zu vier 5K Monitore @ 60Hz, oder zwei 8K Displays @ 60Hz pro Karte. Der NVIDIA L40 unterstützt HDR-Farben für 4K @ 60Hz für 10/12b HEVC-Dekodierung und bis zu 4K @ 60Hz für 10b HEVC-Kodierung. Jeder DisplayPort-Anschluss kann ultrahohe Auflösungen von 4096x2160 @ 120 Hz mit 30-Bit-Farbe verarbeiten.

NVIDIA® Quadro Sync II

Synchronisieren Sie die Anzeige und Bildausgabe von bis zu 32 Displays3 von 8 GPUs (verbunden über zwei Sync II-Karten) in einem einzigen System und reduzieren Sie so die Anzahl der Geräte, die für die Erstellung einer fortschrittlichen Videovisualisierungsumgebung erforderlich sind.

Frame Lock Connector Latch

Jeder Frame-Lock-Anschluss ist mit einem selbstverriegelnden Haltemechanismus ausgestattet, um die Verbindung mit dem Frame-Lock-Kabel zu sichern und eine robuste Konnektivität und maximale Produktivität zu gewährleisten.

Allgemein
Hersteller	PNY
Hersteller Artikelnummer	TCSL40PCIE-PB
Hersteller Garantie (Monate)	12 Mon. Hersteller Garantie
Verpackung	retail
Erweiterungskarten
Hostschnittstelle	PCI Express 4.0 x16
Bauform kompatibel	full-height
Slot Belegung	Dual-Slot
Arbeitsspeicher / Cache
Speicher	48 GB
Speicher Typ	GDDR6
Fehlerkorrektur	ECC
Arbeitsspeicher Details
Speicher Interface	384 Bit
Speicher Bandbreite	864 GB/s
Grafik- und GPU Karten
Externe Anschlüsse	4x DisplayPort 1.4
Graphic APIs	DirectX 12 Ultimate, OpenGL 4.6, Shader Model 6.6, Vulkan 1.3
Compute APIs	CUDA, OpenCL
max. Displays simultan	4
Kühlung	passiv - für GPU Server geeignet [ohne Lüfter]
CUDA Kerne	18176 CUDA Cores
Tensor Kerne	568 Tensor Cores
Abmessungen
Breite	Dual Slot
Höhe	112 mm
Tiefe	267 mm
Weiteres
enthaltenes Zubehör	-