Server mit NVIDIA L40S GPUs für KI und Grafik Workflows

Starke Rechenleistung für generative KI, Grafik- und Videoanwendungen

Die explosionsartige Entwicklung der generativen KI erhöht den Druck auf viele Branchen, schneller mehr Rechenleistung zur Verfügung zu stellen. Zudem steigt der Bedarf nach universellen Computing-Lösungen, die beschleunigte Rechen-, Grafik- und Videoverarbeitungsfunktionen für eine ständig wachsende Anzahl komplexer und vielfältiger Workloads bieten.

NVIDIA L40S – bessere Performance je Euro für einen schnelleren ROI

Der neue NVIDIA L40S Grafikprozessor basiert auf der Ada Lovelace Architektur und ist der aktuell leistungsstärkste universell einsetzbare Grafikprozessor für den Einsatz in Rechenzentren. Die NVIDIA L40S GPU bietet eine bahnbrechende Multi-Workload-Beschleunigung für Large Language Model (LLM) Inferenz und Training, Grafik- und Videoanwendungen. Als führende Plattform für multimodale generative KI bietet die L40S GPU eine End-to-End-Beschleunigung für Inferenz-, Trainings-, Grafik- und Video-Workflows, um die nächste Generation von KI-fähigen Audio-, Sprach-, 2D-, Video- und 3D-Anwendungen zu unterstützen.

Als NVIDIA Elite Partner sind wir gerne Ihr Ansprechpartner, wenn es um leistungsstarke und hochverfügbare GPU Server Lösungen für Rechenzentren, Forschung und Industrie geht.

NVIDIA L40S Details Beratung anfordern

JavaScript scheint in Ihrem Browser deaktiviert zu sein.
Sie müssen JavaScript in Ihrem Browser aktivieren, um alle Funktionen in diesem Shop nutzen zu können.

Kategorien

Sortieren nach:

Server

Newsletter abonnieren

Immer auf dem neusten Stand mit unserem Newsletter

Jetzt anmelden

1x AMD EPYC bis 400 Watt!

ASUS GPU Server RS521A-E12-RS12U AMD EPYC

2 HE ASUS Rack Server Gehäuse
1600 Watt Netzteil redundant
System on Chip (SoC)
1x AMD EPYC™ 9005 / 9004 Serie
bis zu 2.3 TB DDR5 ECC Reg.
2x 1 Gbit/s LAN + IPMI
bis zu 2x Dual-Slot-GPU
12x 3.5"/2.5" Hot-Swap NVMe, 2x SATA Rear
2x M.2 Key M Port, PCIe 5.0 x4/SATA
3 Jahre Garantie inklusive
Spare-Part Express Vorabaustausch

Hst-Nr: RS521A-E12-RS12U

zzgl. Steuern

4.521,70 €

Jetzt Konfigurieren Details Auf die Vergleichsliste

bis zu 8x NVIDIA H200 / H100

ASUS GPU Server ESC8000A-E13P 4U AMD EPYC™

4 HE ASUS GPU Server Gehäuse
3200 Watt 2+2 / 3+1 redundant
System on Chip
2x AMD EPYC™ 9005 Serie
bis zu 3.0 TB DDR5 ECC Reg.
2x 10 Gbit/s LAN + IPMI
bis zu 8x NVIDIA H200 / H100 GPUs
8x 2.5" NVMe/SAS/SATA Hot-Swap
M.2 optional über PCIe-Karte
3 Jahre Garantie inklusive
Spare-Part Express Vorabaustausch

Hst-Nr: ESC8000A-E13P

zzgl. Steuern

22.552,40 €

Jetzt Konfigurieren Details Auf die Vergleichsliste

bis zu 8x NVIDIA H200 / H100

ASUS GPU Server ESC8000A-E13 4U AMD EPYC™

4 HE ASUS GPU Server Gehäuse
3200 Watt 2+2 / 3+1 redundant
System on Chip
2x AMD EPYC™ 9005 Serie
bis zu 3.0 TB DDR5 ECC Reg.
über Erweiterungskarte + IPMI
bis zu 8x NVIDIA H200 / H100 GPUs
8x 2.5" NVMe/SAS/SATA Hot-Swap
M.2 optional über PCIe-Karte
3 Jahre Garantie inklusive
Spare-Part Express Vorabaustausch

Hst-Nr: ESC8000A-E13

zzgl. Steuern

18.909,20 €

Jetzt Konfigurieren Details Auf die Vergleichsliste

Bis zu 4x PCIe 5.0 Dual-Slot GPU!

ASUS GPU Server ESC4000A-E12 2U AMD EPYC

2 HE ASUS GPU Server Gehäuse
2600 Watt redundant
System on Chip
1x AMD EPYC™ 9005 / 9004 Serie
bis zu 3.0 TB DDR5 ECC Reg.
2x 1 Gbit/s LAN
2x NVIDIA H200 / 4x H100 GPU Support
6x Hot-Swap SAS/SATA (4x NVMe)
nein
3 Jahre Garantie inklusive
Spare-Part Express Vorabaustausch

Hst-Nr: ESC4000A-E12

zzgl. Steuern

5.956,60 €

Jetzt Konfigurieren Details Auf die Vergleichsliste

Der effiziente Allrounder - NVIDIA L40S

Die Datacenter GPU auf Basis der Ada Lovelace Architektur kommt mit einem neuen Streaming-Multiprozessor, der 4. Generation von Tensor-Kernen, der 3. Generation von RT-Kernen und einer FP32-Leistung von 91,6 TeraFLOPS.

Generative KI, LLM-Training und Inferenz Anwendungen profitieren von der FP8 Transformer Engine, einer Tensor-Leistung von über 1,5 PetaFLOPS und einem großem L2-Cache.

Entfesseln Sie beispiellose 3D-Grafik- & Rendering-Fähigkeiten mit einer RT-Core-Leistung von 212 TeraFLOPS, DLSS 3.0 für die KI-Bilderzeugung und dem Shader Execution Reordering Feature.

Verbessern Sie die Medienbeschleunigung mit 3 Encode & Decode Engines, 4 JPEG-Dekodern und Unterstützung für AV1 Encode- & Decoding.

Bis zu acht L40S GPUs können in einem GPU Server verbaut werden, und stellen in Kombination mit leistungsstarken Server Prozessoren eine enorme Rechenleistung für eine große Bandbreite an möglichen Workloads zur Verfügung.

L40S Datenblatt Beratung anfordern

NVIDIA L40S GPU für Server und Datacenter

Erreichen Sie Ihre Ziele schneller - mit weniger Kosten

Fine Tuning LLM

4hrs

GPT-175B 860M Tokens¹

LLM Inference

1.1X

Performance vs. HGX A100²

AI Inference

1.5X

Performance vs. A100 80 SXM³

GPT3 Training

4 days

GPT-175B 300B Tokens⁴

Image Gen AI

>82

Images per minute⁵

Full Video Pipeline

184

AV1 Encode Streams⁶

Vorläufige Leistungsprognosen, Änderungen vorbehalten:

1. Fine-Tuning LoRA (GPT-175B), bs: 128, sl: 256; 64 GPUs: 16 systems with 4x L40S
2. GPT 20B, 300ms: 2 systems with 4x L40S vs. HGX A100 8-GPU
3. L40S vs. A100 80GB SXM, ResNet-50 V1.5 Inference

4. GPT 175B, 300B tokens, Foundational Training: 4K GPUs; 1000 systems with 4x L40S
5. Image Generation, Stable Diffusion v2.1, 512 x 512 resolution; 1x L40S
6. Concurrent Encoding Streams; 720p30; 1x L40S

Universelle Leistung für beschleunigte KI- und Grafikanwendungen

LLM Inferenz & Training

Beschleunigen Sie KI-Training und Inferenz-Workloads mit Tensor Cores der 4. Generation, Transformer Engine und Unterstützung für FP8

Generative KI

Bahnbrechende Inferenzleistung für KI-gestützte Grafik-, Video- und Bildgenerierung

3D-Grafik & Rendering

Kreative Workflows mit hoher Wiedergabetreue durch RTX Gen 3, DLSS 3 und 48 GB GPU-Speicher

Datenverarbeitung

Leistungsstarkes FP32 für wissenschaftliche Datenanalyse und Simulation. Biowissenschaften, Geowissenschaften, Physik, Hochschulwesen und Finanzdienstleistungen

Omniverse Enterprise

Verbindung, Entwicklung und Betrieb von Universal Scene Description (OpenUSD)-basierten 3D-Workflows für die industrielle Digitalisierung

Streaming und Video

Mehr End-to-End-Videodienste, die pro Grafikkarte gehostet werden können, mit höherer Kodierungs-/Dekodierungsdichte und Unterstützung für AV1

NVIDIA L40S vs NVIDIA HGX A100 vs NVIDIA H100

Projekte schneller umsetzten durch bessere Verfügbarkeit der NVIDIA L40S

Modell	NVIDIA L40S	NVIDIA HGX A100	NVIDIA H100 NVL
Anwendungsgebiete	univ. GPU für generative KI & Grafik	hochperformante Multi-Node KI	max. Performance für generative KI
GPU-Architektur	NVIDIA Ada Lovelace	NVIDIA Ampere	NVIDIA Hopper
FP64	N/A	9,7 TFLOPS	68 TFLOPS
FP32	91,6 TFLOPS	19,5 TFLOPS	134 TFLOPS
RT-Core	212 TFLOPS	N/A	N/A
TF-32 Tensor Core	366 TFLOPS	312 TFLOPS	1979 TFLOPS
FB16/BF16 Tensor Core	733 TFLOPS	624 TFLOPS	3958 TFLOPS
FP8 Tensor Core	1466 TFLOPS	N/A	7916 TFLOPS
INT8 Tensor Core	1466 TFLOPS	1248 TFLOPS	7916 TFLOPS
GPU Speicher	48 GB GDDR6	80 GB HBM2e	188 GB HBM3 mit ECC
GPU Speicher Bandbreite	864 GB/s	2039 GB/s	7,8 TB/s
L2 Cache	96 MB	40 MB	100 MB
Media Engines	3 NVENC (+AV1) 3 NVDEC 4 NVJPEG	0 NVENC 5 NVDEC 5 NVJPEG	14 NVDEC 14 NVJPEG
Leistungsaufnahme	bis zu 350 Watt	bis zu 400 Watt	2x 350 - 400 Watt
Formfaktor	2-Slot FHFL	8-Wege HGX	2x 2-Slot FHFL
Verfügbarkeit	kurzfristig lieferbar	sehr lange Lieferzeit	lange Lieferzeit