Artikelbild für den Artikel: BLACKWELL: NVIDIA'S MASSIVE GPU

BLACKWELL: NVIDIA’S MASSIVE GPU

NVIDIA hat eine lange Tradition in der Entwicklung von gigantischen GPUs, und die Blackwell-Architektur setzt diese Tradition fort. Die neueste GPU, die GB202, ist mit einer Fläche von 750 mm² und 92,2 Milliarden Transistoren die größte Blackwell-Diode. Diese beeindruckenden Spezifikationen machen die GB202 zu einem bemerkenswerten Beispiel für die Fortschritte in der Grafiktechnologie.

Die Dimensionen der Blackwell-Architektur

Die GB202 ist nicht nur groß, sondern auch leistungsstark. Sie verfügt über 192 Streaming Multiprocessors (SMs), die als das Äquivalent zu CPU-Kernen auf einer GPU betrachtet werden können. Diese SMs werden von einem massiven Speichersubsystem unterstützt, das eine hohe Bandbreite und niedrige Latenz bietet. Die NVIDIA RTX PRO 6000 Blackwell ist die größte Konfiguration der GB202 und steht neben der RTX 5090 in der Produktreihe von NVIDIA, die ebenfalls die GB202 verwendet, jedoch einige SMs deaktiviert.

Vergleich mit AMDs RDNA4

Im Vergleich zu AMDs RDNA4-Linie, die mit der RX 9070 und RX 9070XT antritt, zeigt die GB202 eine überlegene Leistung. Während die RX 9070 leicht abgespeckt ist und vier von 32 WGPs deaktiviert hat, bleibt die GB202 in ihrer vollen Pracht erhalten. Die Architektur von Blackwell ermöglicht es NVIDIA, die Anzahl der SMs zu erhöhen, ohne zusätzliche GPC-Ebene-Hardware zu benötigen, was die Effizienz steigert.

Architektur und Arbeitsverteilung

Die GPUs von NVIDIA verwenden spezialisierte Hardware, um Threads über ihre Kerne zu starten, im Gegensatz zu CPUs, die auf Software-Planung im Betriebssystem angewiesen sind. Diese Hardware-Thread-Starttechnik ist besonders geeignet für die kurzen und einfachen Aufgaben, die oft GPU-Workloads charakterisieren. Die SMs sind in Graphics Processing Clusters (GPCs) gruppiert, die einen Rasterizer und zugehörige Hardware zur Arbeitsverteilung enthalten.

Leistungsmerkmale der Blackwell-Architektur

Die Blackwell-Architektur hat einige Verbesserungen gegenüber früheren Generationen von NVIDIA. Eine der bemerkenswertesten Änderungen ist die Fähigkeit, verschiedene Arbeitslasten auf derselben Warteschlange zu überlappen, ohne dass ein „Subchannel-Switch“ erforderlich ist. Dies ermöglicht eine effizientere Nutzung der Shader-Array, wenn Anwendungen häufig verschiedene Arbeitslasten mischen.

SM-Frontend und Ausführungseinheiten

Das SM-Frontend von Blackwell holt Shader-Programm-Anweisungen und liefert sie an die Ausführungseinheiten. Die Architektur verwendet 128-Bit-Anweisungen und ein zweistufiges Anweisungscaching-System, das die Bandbreitenanforderungen erfüllt und gleichzeitig die Leistung bei größeren Code-Footprints aufrechterhält. Jede SM-Partition hat einen privaten L0-Anweisungscache, während ein L1-Anweisungscache über die SMs geteilt wird.

Speichersubsystem und Bandbreite

Das Speichersubsystem von Blackwell ist ebenfalls beeindruckend. Es verwendet ein konventionelles zweistufiges Daten-Caching-System, das die L2-Kapazität erhöht, um die gleichen Ziele wie AMDs Infinity Cache zu erreichen. Die L2-Bandbreite von Blackwell beträgt etwa 8,7 TB/s, was leicht über der der RX 9070 liegt. NVIDIA hat mit seiner GDDR7 und dem 512-Bit-Speicherbus einen klaren Vorteil gegenüber AMD.

Fazit: NVIDIA dominiert den Markt

Die Blackwell-Architektur ist ein weiteres Beispiel dafür, wie NVIDIA die Grenzen dessen, was mit monolithischen Designs möglich ist, verschiebt. Mit einer Leistungsaufnahme von 575W oder 600W testet die GB202 die Grenzen dessen, was ein Consumer-PC unterstützen kann. NVIDIA hat es geschafft, die größte Consumer-GPU der heutigen Zeit zu entwickeln, die in vielen Bereichen der Konkurrenz weit überlegen ist.

Die Konkurrenz im GPU-Markt ist zwar gestiegen, aber im High-End-Segment bleibt NVIDIA unangefochten. Die RTX PRO 6000 zeigt beeindruckende Leistungen und lässt die Konkurrenz hinter sich. Es bleibt abzuwarten, wie sich der Markt entwickeln wird, aber NVIDIA hat mit Blackwell einen starken Schritt nach vorne gemacht.

Quellenliste:

Dieser Artikel wurde mithilfe von KI verfasst und basiert auf automatisch gesammelten Informationen.
0 Kommentare

Hinterlasse einen Kommentar

An der Diskussion beteiligen?
Hinterlasse uns deinen Kommentar!

Schreibe einen Kommentar