ARTIKEL/TESTS / KFA2 GeForce RTX 3060 EX (1-Click OC) Test

GPU-Architektur

Ampere ist die Next-Gen GPU-Architektur, die Nvidia im September offiziell als Turing-Nachfolger vorgestellt hat und seither im Markt platziert. Flaggschiff der neuen Familie ist der GA102-Grafikchip, der in einem 8-nm-Fertigungsverfahren von Partner Samsung produziert wird und in der maximalen Ausbaustufe satte 28 Mrd. Transistoren beinhaltet. Als abgespecktes Derivat gesellt sich der kleinere GA104 hinzu, der aktuell für die GeForce RTX 3070 und die erst im Dezember präsentierte GeForce RTX 3060 Ti als Basis dient. Neu hinzugekommen ist außerdem der GA106-Chip, der für die GeForce RTX 3060 Verwendung findet. Die Flaggschiffe GeForce RTX 3090 und RTX 3080 bedienen sich derweil der GA102-GPU und bilden die Speerspitze des neuerlichen GeForce-Lineups von Nvidia. Die maximale Ausbaustufe von Ampere nutzen diese aber dennoch nicht ‒ mehr dazu in den folgenden Abschnitten. Ganz nebenbei führt Nvidia mit Ampere auch PCI Express der vierten Generation in sein Produktsortiment ein und tut es somit Konkurrent AMD gleich.

Grundsätzlich hat Nvidia einige GPU-Begrifflichkeiten und Grundgerüste beibehalten, denn die Chips werden weiterhin in mehrere Graphics Processor Cluster (GPC) unterteilt, die wiederum weitere Einheiten beinhalten. Je GPC bietet ein Ampere-Grafikchip die bekannten Streaming Multiprocessors (SMs), Texture Processing Clusters (TPCs), Geometrieeinheiten und ROPs. In den SMs befinden sich die Recheneinheiten (ALUs) für konventionelle Gleitkomma- und Ganzzahl-Berechnungen (FP32 und INT32), die bezogen auf einen Streaming Multiprocessor gegenüber Turing verdoppelt wurden. D.h. die neuen Chips verfügen über bei gleicher Anzahl SMs über doppelt so viele ALUs für verschiedene Rechenaufgaben. Auch Nvidia selbst sieht die neuen SMs als wichtigen Baustein für den schnellsten und effizientesten Grafikprozessor aus eigener Entwicklung, der damit den doppelten FP32-Durchsatz der vorherigen Generation und bis zu 30 Shader-TFLOPS an Rechenleistung bietet.

Die Ampere-Architektur ist die zweite GeForce-RTX-Generation (Bildquelle: Nvidia)

Die Ampere-Architektur ist die zweite GeForce-RTX-Generation (Bildquelle: Nvidia)

Neben den herkömmlichen Rechenknechten in den Ampere-Grafikchips, verspricht Nvidia auch bei den Raytracing-Kernen deutliche Verbesserungen und bezeichnet diese als RT-Kerne der zweiten Generation. Diese neuen, dedizierte RT-Cores liefern den doppelten Durchsatz der vorherigen Generation, plus gleichzeitiges Raytracing sowie Shading und arbeiten mit 58 RT-TFLOPS an Rechenleistung. Ebenso weiterentwickelt wurden die Tensor-Kerne, die in der mittlerweile dritten Generation vorliegen. Die aufpolierten und ebenfalls dedizierten Tensor-Kerne erreichen bis zu doppelten Durchsatz gegenüber der Vorgängergeneration, wodurch KI-gestützte Technologien wie DLSS und 238 Tensor-TFLOPS an Rechenleistung schneller und effizienter ausgeführt werden können. Zwar wurde die Anzahl Tensor-Kerne je SM von acht (Turing) auf vier (Ampere) reduziert, doch stieg gleichzeitig die Leistungsfähigkeit um das Vierfache. Ergebnis soll unterm Strich eine massiv gesteigerte KI-Leistung bei Ampere-GPUs sein.

Technische Daten

Die GeForce RTX 3060 ist der jüngste Sprössling in der GeForce-RTX-3000-Familie und basiert auf der GA106-GPU, die gegenüber den größeren Modellen deutlich abgespeckt wurde. Von den ursprünglich ca. 28 Mrd. Transistoren sind beim GA106 derer noch ca. 12 Mrd. übrig geblieben. Daraus resultieren drei GPCs ‒ eine RTX 3070 basiert z.B. auf fünf GPCs. Entsprechend umfasst die neue GeForce in Summe 28 SMs mit 3.584 ALUs („CUDA-Cores“), 48 ROPs sowie 112 TMUs. Die Anzahl der RT-Kerne entspricht 28, die Tensor-Kerne sind mit 112 ebenfalls ebenso etwas weniger als bei dei anderen Modellen. Ergänzt wird die 3060 durch ein 192 Bit breites Speicherinterface zur Anbindung von GDDR6-Speicher, der mit 12 GB in der Founders Edition sehr üppig ausfällt und mit flotten 15 Gbps bzw. 7.500 MHz betrieben wird (360 GB/s).

Der satte Speicherausbau hat dabei einen guten Grund, denn die GeForce RTX 3060 ist die erste Nvidia-GPU, die Resizable BAR unterstützt. Dieses Feature gewährt der CPU Zugriff auf den GPU-VRAM, was eine Vielzahl von Anwendungsfällen beschleunigen kann. Bei Resizable BAR handelt es sich um eine Funktion im PCI Express Protokoll, das z.B. AMD bei seinen Radeon RTX 6000 Grafikkarten unter der Bezeichnung „Smart Access Memory“ (SAM) bewirbt. Verschiedene Mainboard-Hersteller haben in den vergangenen Wochen bereits entsprechende BIOS-Updates für ihre Platinen bereitgestellt, so dass eine Nutzung des VRAMs durch die CPU möglich wird. Für Gaming bei hohen Auflösungen dürfte die Speichermenge wenig Vorteile bringen, da der GPU ohnehin die Luft ausgehen wird.

Zwei 102-mm-Axial-Lüfter zeichnen sich für die Kühlung der GeForce-GPU verantwortlich.

Zwei 102-mm-Axial-Lüfter zeichnen sich für die Kühlung der GeForce-GPU verantwortlich.

Die Leistungsaufnahme der Founders Edition gibt Nvidia mit 170 Watt an. Diese Angabe übernimmt auch Board-Partner KFA2 für seine EX-Variante, die über einen einzelnen 8-Pin-PCIe-Anschluss mit Leistung versorgt wird und somit 225 Watt zur Verfügung hat (75 Watt PCIe Slot + 150 Watt 8-Pin Anschluss). Mehr zur Leistunsaufnahme gibt es auf Seite 18 des Tests. Den Boost-Takt hat der Hersteller ab Werk um 42 MHz auf 1.822 MHz angehoben (+2,4%), der Speichertakt ist unverändert. Der höhere Boost-Takt setzt allerdings die Installation der Xtreme Tuner Plus Software und anschließender Aktivierung des OC Mode voraus. KFA2 bezeichnet dies als 1-Click OC, was der Bolide auch entsprechend mit im Namen trägt. Ohne weiteres Zutun des Nutzers arbeitet die Karte mit den üblichen 1.780 MHz der Founders Edition.

Die Karte im Custom-Design belegt knapp drei Slots Bauhöhe.

Die Karte im Custom-Design belegt knapp drei Slots Bauhöhe.

Die KFA2 GeForce RTX 3060 EX (1-Click OC) wird durch ein wuchtiges Custom-Kühler-Design gekühlt. Integriert in den Kühler sind zwei 102-mm-Axial-Lüfter, die im 2D-Betrieb zum Stillstand kommen und so die Geräuschkulisse im Desktop-Betrieb minimieren. Das Kühlerdesign basiert auf zwei Heatpipes, ist mit einer schwarzen Kunststoffabdeckung versehen und insgesamt etwas mehr als zwei Slots hoch, was aber in jedem Fall drei freie Steckplätze erfordert. Auf der Rückseite befindet sich eine schwarze Aluminium-Backplate, deren Oberfläche mit einem großen GeForce-Schriftzug versehen ist. Die RGB-Beleuchtung der beiden Lüfter sowie des seitlichen GeForce-RTX-Schriftzugs kann per Xtreme Tuner Plus Software gesteuert oder über das Mainboard mit weiteren Sync-fähigen Komponenten gekoppelt werden. Für letzteren Fall legt der Hersteller ein passendes Verbindungskabel bei.

Das Kühlerdesign kennen wir bereits von anderen EX-Grafikkarten des Herstellers.

Das Kühlerdesign kennen wir bereits von anderen EX-Grafikkarten des Herstellers.

Am Slot-Bracket sind insgesamt drei DisplayPort-Anschlüsse und ein einzelner HDMI-Port vorhanden.

Am Slot-Bracket sind insgesamt drei DisplayPort-Anschlüsse und ein einzelner HDMI-Port vorhanden.

NVLink ist bei der GeForce RTX 3060 kein Thema und entsprechend auch nicht an der Grafikkarte zu finden. Hinsichtlich der Anschlussmöglichkeiten für Monitore bietet die neue GeForce RTX 1 x HDMI 2.1 und 3 x DisplayPort 1.4a. Die erhöhte Bandbreite von HDMI 2.1 ermöglicht erstmals eine einzige Kabelverbindung zu 8K-HDR-Fernsehern für Spiele mit ultrahoher Auflösung. Dank Unterstützung für AV1-Decodierung sind die Ampere-Grafikchips die ersten dedizierten GPUs, die es Spielern ermöglichen bis zu 8K-HDR-Internet-Videos bei um bis zu 50 Prozent reduzierter Bandbreite zu sehen.

Folgend die technischen Eckdaten im Vergleich mit der GeForce RTX 2070 SUPER.

Hersteller Nvidia
Produktbezeichnung GeForce RTX 2070 SUPER GeForce RTX 3060 GeForce RTX 3060 Ti
Logo
Architektur Turing Ampere
Grafikchip TU104 GA106 GA104
Fertigung 12 nm 8 nm
Transistoren ca. 13,6 Mrd. ca. 12,0 Mrd. ca. 17,4 Mrd.
CUDA-Cores 3.072 3.584 4.864
Tensor-Cores 384 (2. Gen) 112 (3. Gen) 152 (3. Gen)
Raytracing-Cores 48 (1. Gen) 28 (2. Gen) 38 (2. Gen)
Basistakt 1.650 MHz 1.320 MHz 1.410 MHz
Boosttakt 1.815 MHz 1.780 MHz 1.665 MHz
FP32-Rechenleistung 11.151 GFLOPS 12.759 GFLOPS 16.197 GFLOPS
FP16-Rechenleistung 22.302 GFLOPS 12.759 GFLOPS 16.197 GFLOPS
ROPs 64 48 80
TMUs 192 112 152
Speichertakt 7.000 MHz 7.500 MHz 7.000 MHz
Speicherinterface 256 Bit 192 Bit 256 Bit
Speicherbandbreite 448.000 MB/s 360.000 MB/s 448.000 MB/s
Speichermenge 8 GB GDDR6 12 GB GDDR6 8 GB GDDR6
Interface PCIe 3.0 PCIe 4.0
Leistungsaufnahme 250 Watt 170 Watt 200 Watt
Auf der Rückseite befindet sich eine große Backplate.

Auf der Rückseite befindet sich eine große Backplate.

Autor: Patrick von Brunn, Stefan Boller
Sapphire NITRO+ RX 7900 GRE im Test
Sapphire NITRO+ RX 7900 GRE im Test
NITRO+ RX 7900 GRE

Mit der AMD Radeon RX 7900 GRE hat eine bisher als OEM-Variante vertriebene GPU nun den offiziellen Weg in den Handel gefallen. Passend zum Marktstart haben wir uns die Sapphire NITRO+ RX 7900 GRE im Test angesehen.

KFA2 GeForce RTX 4080 SUPER SG im Test
KFA2 GeForce RTX 4080 SUPER SG im Test
KFA2 RTX 4080 SUPER SG

Die GeForce RTX 4080 SUPER SG von KFA2 kommt mit 1-Click OC und einer wuchtigen Kühlung im Quad-Slot-Design inkl. RGB-Beleuchtung. Wir haben uns den Boliden im Praxistest ausführlich zur Brust genommen.

ZOTAC RTX 4070 Ti SUPER Trinity Black Test
ZOTAC RTX 4070 Ti SUPER Trinity Black Test
Trinity Black Edition

ZOTAC bietet mit der Trinity Black Edition ein Custom-Design der GeForce RTX 4070 Ti SUPER an, die erst kürzlich von Nvidia vorgestellt wurde. Wie sich die extravagante Grafikkarte im Test schlägt, lesen Sie hier in unserem Review.

INNO3D RTX 4080 SUPER iCHILL Frostbite
INNO3D RTX 4080 SUPER iCHILL Frostbite
INNO3D RTX 4080 SUPER iCHILL Frostbite

Mit der GeForce RTX 4080 SUPER iCHILL Frostbite von INNO3D haben wir heute ein Custom-Design für Systeme mit Wasserkühlung im Test. Der Hersteller arbeitet zu diesem Zweck mit Alphacool zusammen. Mehr in unserem Review.