Ampere ist die Next-Gen GPU-Architektur, die Nvidia im September offiziell als Turing-Nachfolger vorgestellt hat und seither im Markt platziert. Flaggschiff der neuen Familie ist der GA102-Grafikchip, der in einem 8-nm-Fertigungsverfahren von Partner Samsung produziert wird und in der maximalen Ausbaustufe satte 28 Mrd. Transistoren beinhaltet. Als abgespecktes Derivat gesellt sich der kleinere GA104 hinzu, der aktuell für die GeForce RTX 3070 und die erst im Dezember präsentierte GeForce RTX 3060 Ti als Basis dient. Neu hinzugekommen ist außerdem der GA106-Chip, der für die GeForce RTX 3060 Verwendung findet. Die Flaggschiffe GeForce RTX 3090 und RTX 3080 bedienen sich derweil der GA102-GPU und bilden die Speerspitze des neuerlichen GeForce-Lineups von Nvidia. Die maximale Ausbaustufe von Ampere nutzen diese aber dennoch nicht ‒ mehr dazu in den folgenden Abschnitten. Ganz nebenbei führt Nvidia mit Ampere auch PCI Express der vierten Generation in sein Produktsortiment ein und tut es somit Konkurrent AMD gleich.
Grundsätzlich hat Nvidia einige GPU-Begrifflichkeiten und Grundgerüste beibehalten, denn die Chips werden weiterhin in mehrere Graphics Processor Cluster (GPC) unterteilt, die wiederum weitere Einheiten beinhalten. Je GPC bietet ein Ampere-Grafikchip die bekannten Streaming Multiprocessors (SMs), Texture Processing Clusters (TPCs), Geometrieeinheiten und ROPs. In den SMs befinden sich die Recheneinheiten (ALUs) für konventionelle Gleitkomma- und Ganzzahl-Berechnungen (FP32 und INT32), die bezogen auf einen Streaming Multiprocessor gegenüber Turing verdoppelt wurden. D.h. die neuen Chips verfügen über bei gleicher Anzahl SMs über doppelt so viele ALUs für verschiedene Rechenaufgaben. Auch Nvidia selbst sieht die neuen SMs als wichtigen Baustein für den schnellsten und effizientesten Grafikprozessor aus eigener Entwicklung, der damit den doppelten FP32-Durchsatz der vorherigen Generation und bis zu 30 Shader-TFLOPS an Rechenleistung bietet.
Die Ampere-Architektur ist die zweite GeForce-RTX-Generation (Bildquelle: Nvidia)
Neben den herkömmlichen Rechenknechten in den Ampere-Grafikchips, verspricht Nvidia auch bei den Raytracing-Kernen deutliche Verbesserungen und bezeichnet diese als RT-Kerne der zweiten Generation. Diese neuen, dedizierte RT-Cores liefern den doppelten Durchsatz der vorherigen Generation, plus gleichzeitiges Raytracing sowie Shading und arbeiten mit 58 RT-TFLOPS an Rechenleistung. Ebenso weiterentwickelt wurden die Tensor-Kerne, die in der mittlerweile dritten Generation vorliegen. Die aufpolierten und ebenfalls dedizierten Tensor-Kerne erreichen bis zu doppelten Durchsatz gegenüber der Vorgängergeneration, wodurch KI-gestützte Technologien wie DLSS und 238 Tensor-TFLOPS an Rechenleistung schneller und effizienter ausgeführt werden können. Zwar wurde die Anzahl Tensor-Kerne je SM von acht (Turing) auf vier (Ampere) reduziert, doch stieg gleichzeitig die Leistungsfähigkeit um das Vierfache. Ergebnis soll unterm Strich eine massiv gesteigerte KI-Leistung bei Ampere-GPUs sein.
Die GeForce RTX 3060 ist der jüngste Sprössling in der GeForce-RTX-3000-Familie und basiert auf der GA106-GPU, die gegenüber den größeren Modellen deutlich abgespeckt wurde. Von den ursprünglich ca. 28 Mrd. Transistoren sind beim GA106 derer noch ca. 12 Mrd. übrig geblieben. Daraus resultieren drei GPCs ‒ eine RTX 3070 basiert z.B. auf fünf GPCs. Entsprechend umfasst die neue GeForce in Summe 28 SMs mit 3.584 ALUs („CUDA-Cores“), 48 ROPs sowie 112 TMUs. Die Anzahl der RT-Kerne entspricht 28, die Tensor-Kerne sind mit 112 ebenfalls ebenso etwas weniger als bei dei anderen Modellen. Ergänzt wird die 3060 durch ein 192 Bit breites Speicherinterface zur Anbindung von GDDR6-Speicher, der mit 12 GB in der Founders Edition sehr üppig ausfällt und mit flotten 15 Gbps bzw. 7.500 MHz betrieben wird (360 GB/s).
Der satte Speicherausbau hat dabei einen guten Grund, denn die GeForce RTX 3060 ist die erste Nvidia-GPU, die Resizable BAR unterstützt. Dieses Feature gewährt der CPU Zugriff auf den GPU-VRAM, was eine Vielzahl von Anwendungsfällen beschleunigen kann. Bei Resizable BAR handelt es sich um eine Funktion im PCI Express Protokoll, das z.B. AMD bei seinen Radeon RTX 6000 Grafikkarten unter der Bezeichnung „Smart Access Memory“ (SAM) bewirbt. Verschiedene Mainboard-Hersteller haben in den vergangenen Wochen bereits entsprechende BIOS-Updates für ihre Platinen bereitgestellt, so dass eine Nutzung des VRAMs durch die CPU möglich wird. Für Gaming bei hohen Auflösungen dürfte die Speichermenge wenig Vorteile bringen, da der GPU ohnehin die Luft ausgehen wird.
Drei axiale 92-mm-Lüfter sind für die Wärmeableitung verantwortlich.
Die Leistungsaufnahme der Founders Edition gibt Nvidia mit 170 Watt an. Diese Angabe übernimmt auch Board-Partner INNO3D für seine iCHILL-X3-Red-Variante, die über einen einzelnen 8-Pin-PCIe-Anschluss mit Leistung versorgt wird und somit 225 Watt zur Verfügung hat (75 Watt PCIe Slot + 150 Watt 8-Pin-Anschluss). Mehr zur Leistunsaufnahme gibt es auf Seite 18 des Tests. Den Boost-Takt hat der Hersteller ab Werk um 57 MHz auf 1.837 MHz angehoben (+3,2%), der Speichertakt ist unverändert. Als passende Software für Overclocking, Monitoring und Beleuchtung bietet INNO3D das „TuneIT OC & RGB Utility“ zum Download an.
Die Karte im Custom-Design belegt drei Slots Bauhöhe.
Die GeForce RTX 3060 iCHILL X3 Red wird durch ein Custom-Kühler-Design gekühlt und wurde dabei, wie der Name vermuten lässt, in INNO3Ds bekanntem iCHILL-Design gestaltet. Unter der überwiegend schwarzen Abdeckung arbeiten drei 92-mm-Axial-Lüfter, die im 2D-Betrieb zum Stillstand kommen und so die Geräuschkulisse im Desktop-Betrieb minimieren. Das wuchtige Kühlerdesign basiert auf sechs Heatpipes, ist mit einer schwarzen Kunststoffabdeckung versehen und insgesamt drei Slots hoch. Auf der Rückseite befindet sich eine schwarze Aluminium-Backplate, deren Oberflächen-Beschaffenheit den Wärmeabtransport unterstützen soll. Im Gegensatz zu anderen Karten des Herstellers, verzichtet die „Red“ auf eine programmierbare LED-Beleuchtung und erstrahlt stattdessen konstant in Rot. Passende Lichtleiter (einer mit „X3“-Schriftzug und einer ohne Beschriftung) sind im Lieferumfang enthalten und müssen separat montiert werden. Eine entsprechende Installationsanleitung liegt bei oder ist auf der Hersteller-Website zu finden.
Das markante iCHILL-X3-Kühlerdesign kennen wir bereits von anderen Grafikkarten des Herstellers.
Am Slot-Bracket sind insgesamt drei DisplayPort-Anschlüsse und ein einzelner HDMI-Port vorhanden.
NVLink ist bei der GeForce RTX 3060 kein Thema und entsprechend auch nicht an der Grafikkarte zu finden. Hinsichtlich der Anschlussmöglichkeiten für Monitore bietet die neue GeForce RTX 1 x HDMI 2.1 und 3 x DisplayPort 1.4a. Die erhöhte Bandbreite von HDMI 2.1 ermöglicht erstmals eine einzige Kabelverbindung zu 8K-HDR-Fernsehern für Spiele mit ultrahoher Auflösung. Dank Unterstützung für AV1-Decodierung sind die Ampere-Grafikchips die ersten dedizierten GPUs, die es Spielern ermöglichen bis zu 8K-HDR-Internet-Videos bei um bis zu 50 Prozent reduzierter Bandbreite zu sehen.
Folgend die technischen Eckdaten im Vergleich mit der GeForce RTX 2070 SUPER.
Hersteller | Nvidia | ||
Produktbezeichnung | GeForce RTX 2070 SUPER | GeForce RTX 3060 | GeForce RTX 3060 Ti |
Logo | |||
Architektur | Turing | Ampere | |
Grafikchip | TU104 | GA106 | GA104 |
Fertigung | 12 nm | 8 nm | |
Transistoren | ca. 13,6 Mrd. | ca. 12,0 Mrd. | ca. 17,4 Mrd. |
CUDA-Cores | 3.072 | 3.584 | 4.864 |
Tensor-Cores | 384 (2. Gen) | 112 (3. Gen) | 152 (3. Gen) |
Raytracing-Cores | 48 (1. Gen) | 28 (2. Gen) | 38 (2. Gen) |
Basistakt | 1.650 MHz | 1.320 MHz | 1.410 MHz |
Boosttakt | 1.815 MHz | 1.780 MHz | 1.665 MHz |
FP32-Rechenleistung | 11.151 GFLOPS | 12.759 GFLOPS | 16.197 GFLOPS |
FP16-Rechenleistung | 22.302 GFLOPS | 12.759 GFLOPS | 16.197 GFLOPS |
ROPs | 64 | 48 | 80 |
TMUs | 192 | 112 | 152 |
Speichertakt | 7.000 MHz | 7.500 MHz | 7.000 MHz |
Speicherinterface | 256 Bit | 192 Bit | 256 Bit |
Speicherbandbreite | 448.000 MB/s | 360.000 MB/s | 448.000 MB/s |
Speichermenge | 8 GB GDDR6 | 12 GB GDDR6 | 8 GB GDDR6 |
Interface | PCIe 3.0 | PCIe 4.0 | |
Leistungsaufnahme | 250 Watt | 170 Watt | 200 Watt |
Auf der Rückseite befindet sich eine große Backplate.
#AMD #Benchmark #BIOS #DLSS #Gamer #Gaming #GeForce #Gigabyte #Grafikchip #Grafikkarte #INNO3D #KFA2 #Kühlung #Lüfter #Mainboard #Monitor #MSI #Netzteil #Nvidia #Overclocking #PCI #PCIe #Prozessor #Radeon #Raytracing #Samsung #Sapphire #SMS #Software #Technologie #Turing #ZOTAC
Wieder einmal und wie immer schneller als gedacht ist nun fast ein ganzes Kalenderjahr vorüber gegangen und die weihnachtliche Bescherung...
GstarCAD ist eine CAD-Software zur Erstellung von 2D- und 3D-Entwürfen, die eine kostengünstige Alternative zu AutoCAD bietet. Dank der intuitiven...
Die SanDisk Corporation gibt einen ersten Einblick in das neue Corporate Branding und ihre zukünftige kreative Ausrichtung. Dies ist der...
KIOXIA stellte heute die EXCERIA PLUS G4 SSD-Serie für Gamer und Content Creator vor, die auf der Suche nach mehr...
AGON by AOC ist nach den neuesten Daten von IDC Research - Gaming Tracker Q1-Q3 2024, weiterhin weltweiter Marktführer im...
Mit der AMD Radeon RX 7900 GRE hat eine bisher als OEM-Variante vertriebene GPU nun den offiziellen Weg in den Handel gefallen. Passend zum Marktstart haben wir uns die Sapphire NITRO+ RX 7900 GRE im Test angesehen.
Die GeForce RTX 4080 SUPER SG von KFA2 kommt mit 1-Click OC und einer wuchtigen Kühlung im Quad-Slot-Design inkl. RGB-Beleuchtung. Wir haben uns den Boliden im Praxistest ausführlich zur Brust genommen.
ZOTAC bietet mit der Trinity Black Edition ein Custom-Design der GeForce RTX 4070 Ti SUPER an, die erst kürzlich von Nvidia vorgestellt wurde. Wie sich die extravagante Grafikkarte im Test schlägt, lesen Sie hier in unserem Review.
Mit der GeForce RTX 4080 SUPER iCHILL Frostbite von INNO3D haben wir heute ein Custom-Design für Systeme mit Wasserkühlung im Test. Der Hersteller arbeitet zu diesem Zweck mit Alphacool zusammen. Mehr in unserem Review.