ARTIKEL/TESTS / INNO3D GeForce RTX 3080 Ti X3 OC im Test
GPU-Architektur

Ampere ist die Next-Gen GPU-Architektur, die Nvidia im September letztes Jahr offiziell als Turing-Nachfolger vorgestellt hat und seither im Markt platziert. Flaggschiff der Familie ist der GA102-Grafikchip, der in einem 8-nm-Fertigungsverfahren von Partner Samsung produziert wird und in der maximalen Ausbaustufe satte 28 Mrd. Transistoren beinhaltet. Als abgespecktes Derivat gesellt sich der kleinere GA104 hinzu, der aktuell für die GeForce RTX 3070 und die im Dezember 2020 präsentierte GeForce RTX 3060 Ti als Basis dient. Neu hinzugekommen ist außerdem der GA106-Chip, der für die GeForce RTX 3060 Verwendung findet.

Die Flaggschiffe GeForce RTX 3090 und RTX 3080 bedienen sich derweil der GA102-GPU und bilden die Speerspitze des neuerlichen GeForce-Lineups von Nvidia. Die maximale Ausbaustufe von Ampere nutzen diese aber dennoch nicht ‒ mehr dazu in den folgenden Abschnitten. Ganz nebenbei führte Nvidia mit Ampere auch PCI Express der vierten Generation in sein Produktsortiment ein und tut es somit Konkurrent AMD gleich. Seit wenigen Wochen umfasst die GPU-Familie auch zwei neue Ti-Versionen: GeForce RTX 3070 Ti und RTX 3080 Ti. Das neue 3070er-Modell basiert auf dem GA104-400 Chip, bei der 3080 Ti handelt es sich um eine weitere GA102-Variante, nämlich den GA102-225. Ingesamt gehören nun sieben unterschiedlichen Ausführungen zur GeForce-RTX-3000-Familie: RTX 3060 (Ti), RTX 3070 (Ti), RTX 3080 (Ti) sowie RTX 3090.

Grundsätzlich hat Nvidia einige GPU-Begrifflichkeiten und Grundgerüste beibehalten, denn die Chips werden weiterhin in mehrere Graphics Processor Cluster (GPC) unterteilt, die wiederum weitere Einheiten beinhalten. Je GPC bietet ein Ampere-Grafikchip die bekannten Streaming Multiprocessors (SMs), Texture Processing Clusters (TPCs), Geometrieeinheiten und ROPs. In den SMs befinden sich die Recheneinheiten (ALUs) für konventionelle Gleitkomma- und Ganzzahl-Berechnungen (FP32 und INT32), die bezogen auf einen Streaming Multiprocessor gegenüber Turing verdoppelt wurden. D.h. die neuen Chips verfügen über bei gleicher Anzahl SMs über doppelt so viele ALUs für verschiedene Rechenaufgaben. Auch Nvidia selbst sieht die neuen SMs als wichtigen Baustein für den schnellsten und effizientesten Grafikprozessor aus eigener Entwicklung, der damit den doppelten FP32-Durchsatz der vorherigen Generation und bis zu 30 Shader-TFLOPS an Rechenleistung bietet.

Die Ampere-Architektur ist die zweite GeForce-RTX-Generation (Bildquelle: Nvidia)

Die Ampere-Architektur ist die zweite GeForce-RTX-Generation (Bildquelle: Nvidia)

Neben den herkömmlichen Rechenknechten in den Ampere-Grafikchips, verspricht Nvidia auch bei den Raytracing-Kernen deutliche Verbesserungen und bezeichnet diese als RT-Kerne der zweiten Generation. Diese neuen, dedizierte RT-Cores liefern den doppelten Durchsatz der vorherigen Generation, plus gleichzeitiges Raytracing sowie Shading und arbeiten mit 58 RT-TFLOPS an Rechenleistung. Ebenso weiterentwickelt wurden die Tensor-Kerne, die in der mittlerweile dritten Generation vorliegen. Die aufpolierten und ebenfalls dedizierten Tensor-Kerne erreichen bis zu doppelten Durchsatz gegenüber der Vorgängergeneration, wodurch KI-gestützte Technologien wie DLSS und 238 Tensor-TFLOPS an Rechenleistung schneller und effizienter ausgeführt werden können. Zwar wurde die Anzahl Tensor-Kerne je SM von acht (Turing) auf vier (Ampere) reduziert, doch stieg gleichzeitig die Leistungsfähigkeit um das Vierfache. Ergebnis soll unterm Strich eine massiv gesteigerte KI-Leistung bei Ampere-GPUs sein.

Technische Daten

Nvidia präsentiert die neue GeForce RTX 3080 Ti als die ideale Wahl für Gamer. Preislich wie leistungsmäßig ordnet sich der neue Bolide damit zwischen den bestehenden Modelle RTX 3080 und RTX 3090 ein, was auch im Vorfeld so zu erwarten und bei vorherigen GeForce-Generation so üblich war. Werfen wir einen Blick auf die technischen Daten am Ende dieser Seite fällt direkt auf, dass sich die RTX 3080 Ti aus beiden umgebenden Varianten bedient. Dabei basiert diese GeForce auf einer weiteren Ausführung des abgespeckten GA102-Grafikchips, der gegenüber dem Flaggschiff nur minimal beschnitten wurde. Minimal heißt in diesem Zusammenhang, dass die Ti-Version der 3080 auf volle sieben GPCs setzen kann und nur in Teilen abgespeckt wurde.

Entsprechend umfasst die neue GeForce in Summe 80 SMs mit satten 10.240 ALUs („CUDA-Cores“). Die Anzahl der RT-Kerne entspricht 80, die Tensor-Kerne sind mit 320 ebenfalls deutlich mehr als bei einer GeForce RTX 3080. Ergänzt wird die 3080 Ti durch ein 384 Bit breites Speicherinterface zur Anbindung von GDDR6X-Speicher, der mit 12 GB in der Founders Edition eine solide Größe aufweist. Die Arbeitsfrequenz des Speichers wurde von der Non-Ti-Version übernommen, was zusammen mit dem breiteren Speicherinterface einen theoretischen Durchsatz von üppigen 912 GB/s ergibt. Alles in Allem ist die RTX 3080 Ti viel mehr RTX 3090, als RTX 3080. Der Vergleich der technischen Daten befindet sich am Ende dieser Seite.

Drei 90-mm-Axial-Lüfter zeichnen sich für die Kühlung der GeForce-GPU verantwortlich.

Drei 90-mm-Axial-Lüfter zeichnen sich für die Kühlung der GeForce-GPU verantwortlich.

Die Leistungsaufnahme der Founders Edition gibt Nvidia mit 350 Watt an, was 30 Watt mehr gegenüber der Non-Ti sind und exakt der Angabe der RTX 3090 entspricht. Diesen Wert übernimmt auch Board-Partner INNO3D für seine X3 OC-Version, die über zwei 8-Pin-PCIe-Anschlüsse mit Leistung versorgt wird und somit 375 Watt zur Verfügung hat (75 Watt PCIe Slot + 2 x 150 Watt 8-Pin Anschluss). Mehr zur Leistungsaufnahme gibt es auf Seite 18 des Tests. Den Boost-Takt hat der Hersteller ab Werk um immerhin 15 MHz auf 1.680 MHz angehoben (+0,9%), der Speichertakt ist unverändert.

Die Karte belegt zwei Slots Bauhöhe kommt in einem schwarzen Kühlerdesign.

Die Karte belegt zwei Slots Bauhöhe kommt in einem schwarzen Kühlerdesign.

Das Dual-Slot-Kühlerdesign der X3 OC von INNO3D ist schlicht gehalten und verzichtet auf RGB-LED-Beleuchtung, Lichtleiter oder ähnliche Dinge, die wir z.B. von den iCHILL-Modellen des Unternehmens kennen. Die schwarz lackierte Metallumhausung nimmt drei 90-mm-Lüfter von Scythe auf und bedeckt das PCB vollständig. Im Inneren arbeiten sieben Heatpipes, die für einen effizienten Wärmetransport verantwortlich sind. Auf der Rückseite befindet sich eine schwarze Aluminium-Backplate, deren Oberfläche mit einem großen GeForce-Schriftzug versehen ist. Mehr zur Temperatur- und Geräuschentwicklung erfahren Sie auf Seite 18 des Tests.

Über zwei integrierte 8-Pin-PCIe-Anschlüsse wird der Bolide mit ausreichend Leistung versorgt.

Über zwei integrierte 8-Pin-PCIe-Anschlüsse wird der Bolide mit ausreichend Leistung versorgt.

Am Slot-Bracket der Karte sind insgesamt drei DisplayPort-Anschlüsse und ein HDMI-Port vorhanden.

Am Slot-Bracket der Karte sind insgesamt drei DisplayPort-Anschlüsse und ein HDMI-Port vorhanden.

NVLink ist bei der GeForce RTX 3080 Ti kein Thema und entsprechend auch nicht an der Grafikkarte zu finden. Hinsichtlich der Anschlussmöglichkeiten für Monitore bietet die neue GeForce RTX 1 x HDMI 2.1 und 3 x DisplayPort 1.4a. Die erhöhte Bandbreite von HDMI 2.1 ermöglicht erstmals eine einzige Kabelverbindung zu 8K-HDR-Fernsehern für Spiele mit ultrahoher Auflösung. Dank Unterstützung für AV1-Decodierung sind die Ampere-Grafikchips die ersten dedizierten GPUs, die es Spielern ermöglichen bis zu 8K-HDR-Internet-Videos bei um bis zu 50 Prozent reduzierter Bandbreite zu sehen.

Folgend die technischen Eckdaten im Vergleich mit GeForce RTX 3080 und RTX 3090.

Hersteller Nvidia
Produktbezeichnung GeForce RTX 3080 GeForce RTX 3080 Ti GeForce RTX 3090
Logo
Architektur Ampere
Grafikchip GA102
Fertigung 8 nm
Transistoren ca. 28,0 Mrd.
CUDA-Cores 8.704 10.240 10.496
Tensor-Cores 272 (3. Gen) 320 (3. Gen) 328 (3. Gen)
Raytracing-Cores 68 (2. Gen) 80 (2. Gen) 82 (2. Gen)
Basistakt 1.440 MHz 1.365 MHz 1.400 MHz
Boosttakt 1.710 MHz 1.665 MHz 1.700 MHz
FP32-Rechenleistung 29.768 GFLOPS 34.099 GFLOPS 35.686 GFLOPS
FP16-Rechenleistung 29.768 GFLOPS 34.099 GFLOPS 35.686 GFLOPS
ROPs 96 112
TMUs 272 320 328
Speichertakt 9.504 MHz 9.752 MHz
Speicherinterface 320 Bit 384 Bit
Speicherbandbreite 760.320 MB/s 912.384 MB/s 936.192 MB/s
Speichermenge 10 GB GDDR6X 12 GB GDDR6X 24 GB GDDR6X
Interface PCIe 4.0
Leistungsaufnahme 320 Watt 350 Watt
Auf der Rückseite befindet sich eine große Backplate.

Auf der Rückseite befindet sich eine große Backplate.

Autor: Patrick von Brunn, Stefan Boller
ZOTAC GeForce RTX 3080 AMP Holo im Test
ZOTAC GeForce RTX 3080 AMP Holo im Test
ZOTAC RTX 3080 AMP Holo

Mit der AMP Holo Variante bietet Hersteller ZOTAC eine ab Werk übertaktete und mit extravaganter Kühlung ausgestattete GeForce RTX 3080 an. Wir haben den Boliden im Test ausführlich beleuchtet.

KFA2 RTX 3070 Ti SG (1-Click OC) im Test
KFA2 RTX 3070 Ti SG (1-Click OC) im Test
KFA2 GeForce RTX 3070 Ti SG

Auf der diesjährigen Computex präsentierte Nvidia zwei neue Ti-Versionen im GeForce-RTX-3000-Lineup. Dazu gehört auch die neue GeForce RTX 3070 Ti, die wir heute in Form der KFA2 Serious Gaming (1-Click OC) Karte im Test haben.

INNO3D GeForce RTX 3070 iCHILL X3 im Test
INNO3D GeForce RTX 3070 iCHILL X3 im Test
INNO3D RTX 3070 iCHILL X3

Mit der GeForce RTX 3070 iCHILL X3 bietet Hersteller INNO3D eine RTX 3070 mit Triple-Fan-Kühlung, Overclocking ab Werk und programmierbarer RGB-LED-Beleuchtung an. Wir haben uns die Karte im Test näher angesehen.

INNO3D RTX 3060 iCHILL X3 Red im Test
INNO3D RTX 3060 iCHILL X3 Red im Test
INNO3D RTX 3060 iCHILL X3 Red

Mit der iCHILL X3 Red bietet INNO3D eine GeForce RTX 3060 im extravaganten Design an. Die Karte kommt mit einer starken Triple-Fan-Kühlung, Heatpipe-Technologie und LED-Beleuchtung. Mehr dazu in unserem Praxistest.