Server mit NVIDIA L40S GPUs für KI und Grafik Workflows
Starke Rechenleistung für generative KI, Grafik- und Videoanwendungen
Die explosionsartige Entwicklung der generativen KI erhöht den Druck auf viele Branchen, schneller mehr Rechenleistung zur Verfügung zu stellen. Zudem steigt der Bedarf nach universellen Computing-Lösungen, die beschleunigte Rechen-, Grafik- und Videoverarbeitungsfunktionen für eine ständig wachsende Anzahl komplexer und vielfältiger Workloads bieten.
NVIDIA L40S – bessere Performance je Euro für einen schnelleren ROI
Der neue NVIDIA L40S Grafikprozessor basiert auf der Ada Lovelace Architektur und ist der aktuell leistungsstärkste universell einsetzbare Grafikprozessor für den Einsatz in Rechenzentren. Die NVIDIA L40S GPU bietet eine bahnbrechende Multi-Workload-Beschleunigung für Large Language Model (LLM) Inferenz und Training, Grafik- und Videoanwendungen. Als führende Plattform für multimodale generative KI bietet die L40S GPU eine End-to-End-Beschleunigung für Inferenz-, Trainings-, Grafik- und Video-Workflows, um die nächste Generation von KI-fähigen Audio-, Sprach-, 2D-, Video- und 3D-Anwendungen zu unterstützen.
Als NVIDIA Preferred Partner sind wir gerne Ihr Ansprechpartner, wenn es um leistungsstarke und hochverfügbare GPU Server Lösungen für Rechenzentren, Forschung und Industrie geht.
NVIDIA L40S Details Beratung anfordernASUS GPU Server RS520A-E12-RS12U AMD EPYC
- 2 HE Asus Rack Server Gehäuse
- 1600 Watt Netzteil redundant
- System on Chip (SoC)
- 1x AMD EPYC™ 9004 Serie
- bis zu 6.0 TB DDR5 ECC Reg.
- 2x 1 Gbit/s LAN + IPMI
- 4x PCIe 5.0 Zusatzkarte
- 12x 3.5"/2.5" Hot-Swap NVMe, 2x SATA Rear
- 2x M.2 Key M Port, PCIe 5.0 x4/SATA
- 3 Jahre Garantie inklusive
- Spare-Part Express Vorabaustausch
Hst-Nr: RS520A-E12-RS12UASUS GPU Server ESC8000A-E12 4U AMD EPYC™
- 4 HE ASUS GPU Server Gehäuse
- 3000 Watt 2+2 redundant
- System on Chip
- 2x AMD EPYC™ 9004 Serie
- bis zu 6.0 TB DDR5 ECC Reg./LR-DIMM
- 2x 10 Gbit/s LAN + IPMI
- 4x NVIDIA H200 / 8x H100 GPU Support
- 8x 3.5" NVMe/SAS/SATA Hot-Swap
- M.2 optional über PCIe-Karte
- 3 Jahre Garantie inklusive
- Spare-Part Express Vorabaustausch
Hst-Nr: ESC8000A-E12ASUS GPU Server ESC4000A-E12 2U AMD EPYC
- 2 HE ASUS GPU Server Gehäuse
- 2600 Watt redundant
- System on Chip
- 1x AMD EPYC™ 9004 Serie
- bis zu 3.0 TB DDR5 ECC Reg.
- 2x 1 Gbit/s LAN
- 2x NVIDIA H200 / 4x H100 GPU Support
- 6x Hot-Swap SAS/SATA (4x NVMe)
- nein
- 3 Jahre Garantie inklusive
- Spare-Part Express Vorabaustausch
Hst-Nr: ESC4000A-E12
Der effiziente Allrounder - NVIDIA L40S
Die Datacenter GPU auf Basis der Ada Lovelace Architektur kommt mit einem neuen Streaming-Multiprozessor, der 4. Generation von Tensor-Kernen, der 3. Generation von RT-Kernen und einer FP32-Leistung von 91,6 TeraFLOPS.
Generative KI, LLM-Training und Inferenz Anwendungen profitieren von der FP8 Transformer Engine, einer Tensor-Leistung von über 1,5 PetaFLOPS und einem großem L2-Cache.
Entfesseln Sie beispiellose 3D-Grafik- & Rendering-Fähigkeiten mit einer RT-Core-Leistung von 212 TeraFLOPS, DLSS 3.0 für die KI-Bilderzeugung und dem Shader Execution Reordering Feature.
Verbessern Sie die Medienbeschleunigung mit 3 Encode & Decode Engines, 4 JPEG-Dekodern und Unterstützung für AV1 Encode- & Decoding.
Bis zu acht L40S GPUs können in einem GPU Server verbaut werden, und stellen in Kombination mit leistungsstarken Server Prozessoren eine enorme Rechenleistung für eine große Bandbreite an möglichen Workloads zur Verfügung.
Erreichen Sie Ihre Ziele schneller - mit weniger Kosten
Fine Tuning LLM
4hrs
GPT-175B 860M Tokens¹
LLM Inference
1.1X
Performance vs. HGX A100²
AI Inference
1.5X
Performance vs. A100 80 SXM³
GPT3 Training
4 days
GPT-175B 300B Tokens⁴
Image Gen AI
>82
Images per minute⁵
Full Video Pipeline
184
AV1 Encode Streams⁶
- 1. Fine-Tuning LoRA (GPT-175B), bs: 128, sl: 256; 64 GPUs: 16 systems with 4x L40S
- 2. GPT 20B, 300ms: 2 systems with 4x L40S vs. HGX A100 8-GPU
- 3. L40S vs. A100 80GB SXM, ResNet-50 V1.5 Inference
- 4. GPT 175B, 300B tokens, Foundational Training: 4K GPUs; 1000 systems with 4x L40S
- 5. Image Generation, Stable Diffusion v2.1, 512 x 512 resolution; 1x L40S
- 6. Concurrent Encoding Streams; 720p30; 1x L40S
Universelle Leistung für beschleunigte KI- und Grafikanwendungen
LLM Inferenz & Training
Beschleunigen Sie KI-Training und Inferenz-Workloads mit Tensor Cores der 4. Generation, Transformer Engine und Unterstützung für FP8
Generative KI
Bahnbrechende Inferenzleistung für KI-gestützte Grafik-, Video- und Bildgenerierung
3D-Grafik & Rendering
Kreative Workflows mit hoher Wiedergabetreue durch RTX Gen 3, DLSS 3 und 48 GB GPU-Speicher
Datenverarbeitung
Leistungsstarkes FP32 für wissenschaftliche Datenanalyse und Simulation. Biowissenschaften, Geowissenschaften, Physik, Hochschulwesen und Finanzdienstleistungen
Omniverse Enterprise
Verbindung, Entwicklung und Betrieb von Universal Scene Description (OpenUSD)-basierten 3D-Workflows für die industrielle Digitalisierung
Streaming und Video
Mehr End-to-End-Videodienste, die pro Grafikkarte gehostet werden können, mit höherer Kodierungs-/Dekodierungsdichte und Unterstützung für AV1
NVIDIA L40S vs NVIDIA HGX A100 vs NVIDIA H100
Projekte schneller umsetzten durch bessere Verfügbarkeit der NVIDIA L40S
Modell | NVIDIA L40S | NVIDIA HGX A100 | NVIDIA H100 NVL |
Anwendungsgebiete | univ. GPU für generative KI & Grafik | hochperformante Multi-Node KI | max. Performance für generative KI |
GPU-Architektur | NVIDIA Ada Lovelace | NVIDIA Ampere | NVIDIA Hopper |
FP64 | N/A | 9,7 TFLOPS | 68 TFLOPS |
FP32 | 91,6 TFLOPS | 19,5 TFLOPS | 134 TFLOPS |
RT-Core | 212 TFLOPS | N/A | N/A |
TF-32 Tensor Core | 366 TFLOPS | 312 TFLOPS | 1979 TFLOPS |
FB16/BF16 Tensor Core | 733 TFLOPS | 624 TFLOPS | 3958 TFLOPS |
FP8 Tensor Core | 1466 TFLOPS | N/A | 7916 TFLOPS |
INT8 Tensor Core | 1466 TFLOPS | 1248 TFLOPS | 7916 TFLOPS |
GPU Speicher | 48 GB GDDR6 | 80 GB HBM2e | 188 GB HBM3 mit ECC |
GPU Speicher Bandbreite | 864 GB/s | 2039 GB/s | 7,8 TB/s |
L2 Cache | 96 MB | 40 MB | 100 MB |
Media Engines | 3 NVENC (+AV1) 3 NVDEC 4 NVJPEG | 0 NVENC 5 NVDEC 5 NVJPEG | 14 NVDEC 14 NVJPEG |
Leistungsaufnahme | bis zu 350 Watt | bis zu 400 Watt | 2x 350 - 400 Watt |
Formfaktor | 2-Slot FHFL | 8-Wege HGX | 2x 2-Slot FHFL |
Verfügbarkeit | sehr lange Lieferzeit | lange Lieferzeit |