Ampere ist die Next-Gen GPU-Architektur, die Nvidia im September letztes Jahr offiziell als Turing-Nachfolger vorgestellt hat und seither im Markt platziert. Flaggschiff der Familie ist der GA102-Grafikchip, der in einem 8-nm-Fertigungsverfahren von Partner Samsung produziert wird und in der maximalen Ausbaustufe satte 28 Mrd. Transistoren beinhaltet. Als abgespecktes Derivat gesellt sich der kleinere GA104 hinzu, der aktuell für die GeForce RTX 3070 und die im Dezember 2020 präsentierte GeForce RTX 3060 Ti als Basis dient. Neu hinzugekommen ist außerdem der GA106-Chip, der für die GeForce RTX 3060 Verwendung findet.
Die Flaggschiffe GeForce RTX 3090 und RTX 3080 bedienen sich derweil der GA102-GPU und bilden die Speerspitze des neuerlichen GeForce-Lineups von Nvidia. Die maximale Ausbaustufe von Ampere nutzen diese aber dennoch nicht ‒ mehr dazu in den folgenden Abschnitten. Ganz nebenbei führte Nvidia mit Ampere auch PCI Express der vierten Generation in sein Produktsortiment ein und tut es somit Konkurrent AMD gleich. Seit wenigen Wochen umfasst die GPU-Familie auch zwei neue Ti-Versionen: GeForce RTX 3070 Ti und RTX 3080 Ti. Das neue 3070er-Modell basiert auf dem GA104-400 Chip, bei der 3080 Ti handelt es sich um eine weitere GA102-Variante, nämlich den GA102-225. Ingesamt gehören nun sieben unterschiedlichen Ausführungen zur GeForce-RTX-3000-Familie: RTX 3060 (Ti), RTX 3070 (Ti), RTX 3080 (Ti) sowie RTX 3090.
Grundsätzlich hat Nvidia einige GPU-Begrifflichkeiten und Grundgerüste beibehalten, denn die Chips werden weiterhin in mehrere Graphics Processor Cluster (GPC) unterteilt, die wiederum weitere Einheiten beinhalten. Je GPC bietet ein Ampere-Grafikchip die bekannten Streaming Multiprocessors (SMs), Texture Processing Clusters (TPCs), Geometrieeinheiten und ROPs. In den SMs befinden sich die Recheneinheiten (ALUs) für konventionelle Gleitkomma- und Ganzzahl-Berechnungen (FP32 und INT32), die bezogen auf einen Streaming Multiprocessor gegenüber Turing verdoppelt wurden. D.h. die neuen Chips verfügen über bei gleicher Anzahl SMs über doppelt so viele ALUs für verschiedene Rechenaufgaben. Auch Nvidia selbst sieht die neuen SMs als wichtigen Baustein für den schnellsten und effizientesten Grafikprozessor aus eigener Entwicklung, der damit den doppelten FP32-Durchsatz der vorherigen Generation und bis zu 30 Shader-TFLOPS an Rechenleistung bietet.
Die Ampere-Architektur ist die zweite GeForce-RTX-Generation (Bildquelle: Nvidia)
Neben den herkömmlichen Rechenknechten in den Ampere-Grafikchips, verspricht Nvidia auch bei den Raytracing-Kernen deutliche Verbesserungen und bezeichnet diese als RT-Kerne der zweiten Generation. Diese neuen, dedizierte RT-Cores liefern den doppelten Durchsatz der vorherigen Generation, plus gleichzeitiges Raytracing sowie Shading und arbeiten mit 58 RT-TFLOPS an Rechenleistung. Ebenso weiterentwickelt wurden die Tensor-Kerne, die in der mittlerweile dritten Generation vorliegen. Die aufpolierten und ebenfalls dedizierten Tensor-Kerne erreichen bis zu doppelten Durchsatz gegenüber der Vorgängergeneration, wodurch KI-gestützte Technologien wie DLSS und 238 Tensor-TFLOPS an Rechenleistung schneller und effizienter ausgeführt werden können. Zwar wurde die Anzahl Tensor-Kerne je SM von acht (Turing) auf vier (Ampere) reduziert, doch stieg gleichzeitig die Leistungsfähigkeit um das Vierfache. Ergebnis soll unterm Strich eine massiv gesteigerte KI-Leistung bei Ampere-GPUs sein.
Die GeForce RTX 3080 ordnet Nvidia zwischen den beiden jüngsten Modellen GeForce RTX 3070 Ti und GeForce RTX 3080 Ti ein. Dabei darf sich die 3080 über einen GA102-Grafikchip (GA102-200-KD-A1) freuen, der jedoch gegenüber dem Flaggschiff etwas beschnitten wurde. Die 28 Mrd. Transistoren verhelfen dem GeForce-Modell zu 68 Streaming Multiprocessors, was wiederum gleichbedeutend mit in Summe 8.704 ALUs ist („CUDA-Cores“). Zum Vergleich: Das Flaggschiff alias RTX 3090 kann auf insgesamt 10.496 Einheiten zurückgreifen. Die Anzahl der RT-Kerne entspricht 68, die Tensor-Kerne sind mit 272 ebenfalls leicht gegenüber der GeForce RTX 3090 reduziert.
Ergänzt wird diese GeForce-RTX-3000-Variante durch ein 320 Bit breites Speicherinterface zur Anbindung von GDDR6X-Speicher, der mit 10 GB in der Founders Edition eine solide Größe aufweist und daher auch für hohe Auflösungen Potenzial bietet. Dennoch ist die RTX 3090 mit satten 24 GB eine ganz andere Hausnummer und auch die RTX 3080 Ti hat mit 12 GB nochmals zwei GB mehr zu bieten. Im Vergleich mit der Turing-basierten GeForce RTX 2080 Ti muss die neue RTX 3080 auf ein Gigabyte Speicher verzichten, arbeitet bei 760 GB/s aber mit deutlich höherem Speicherdurchsatz als ihre Vorgänger (RTX 2080 Ti: 616 GB/s). Der Vergleich der technischen Daten befindet sich am Ende dieser Seite.
Drei 90-mm-Axial-Lüfter zeichnen sich für die Kühlung der GeForce-GPU verantwortlich.
Die Leistungsaufnahme der Founders Edition gibt Nvidia mit 320 Watt an, was lediglich 30 Watt weniger sind als bei der momentan maximalen Ausbaustufe. Diesen Wert hebt Board-Partner ZOTAC für seine AMP-Holo-Version auf 340 Watt an. Die Karte wird über zwei 8-Pin-PCIe-Anschlüsse mit Leistung versorgt und hat somit 375 Watt zur Verfügung hat (75 Watt PCIe Slot + 2 x 150 Watt 8-Pin Anschluss). Den Boost-Takt hat der Hersteller ab Werk bereits um satte 60 MHz auf 1.770 MHz angehoben (+3,5%), der Speichertakt ist unverändert. Mehr zur Leistungsaufnahme lesen Sie auf Seite 18 des Artikels.
Die Karte belegt 2,5 Slots Bauhöhe und kommt im ausgefallenen HoloBlack-Kühlerdesign.
Das HoloBlack-Kühlerdesign der AMP-Grafikkarte von ZOTAC ist insgesamt 2,5 Slots hoch und mit einer RGB-LED-Beleuchtung (SPECTRA 2.0 RGB Lighting) versehen. Die Beleuchtung kann mithilfe des FireStorm Utility (Download) personalisiert werden ‒ die Backplate ist mit entsprechenden RGB-LEDs versehen. Die verbesserte IceStorm 2.0 Kühlung basiert auf sieben Kupfer-Heatpipes, die für einen effizienten Wärmetransport zuständig sind. Drei 90-mm-Lüfter mit jeweils elf Lüfterschaufeln erreichen einen bis zu zehn Prozent höheren Luftdurchsatz als die Vorgänger-Generation. Active Fan Control mit FREEZE Fan Stop sorgen dafür, dass die Lüfter stets mit der optimalen Drehzahl drehen und im lastfreien 2D-Betrieb sogar vollständig gestoppt werden. Per FireStorm Utility kann unter anderem auch auf die Lüfterregelung des Boliden Einfluss genommen werden. Mehr zur Temperatur- und Geräuschentwicklung erfahren Sie auf Seite 18 des Tests.
Über zwei integrierte 8-Pin-PCIe-Anschlüsse wird der Bolide mit ausreichend Leistung versorgt.
Am Slot-Bracket der Karte sind insgesamt drei DisplayPort-Anschlüsse und ein HDMI-Port vorhanden.
NVLink ist bei der GeForce RTX 3080 kein Thema und entsprechend auch nicht an der Grafikkarte zu finden. Hinsichtlich der Anschlussmöglichkeiten für Monitore bietet die neue GeForce RTX 1 x HDMI 2.1 und 3 x DisplayPort 1.4a. Die erhöhte Bandbreite von HDMI 2.1 ermöglicht erstmals eine einzige Kabelverbindung zu 8K-HDR-Fernsehern für Spiele mit ultrahoher Auflösung. Dank Unterstützung für AV1-Decodierung sind die Ampere-Grafikchips die ersten dedizierten GPUs, die es Spielern ermöglichen bis zu 8K-HDR-Internet-Videos bei um bis zu 50 Prozent reduzierter Bandbreite zu sehen.
Folgend die technischen Eckdaten im Vergleich mit GeForce RTX 3080 Ti und RTX 3090.
Hersteller | Nvidia | ||
Produktbezeichnung | GeForce RTX 3080 | GeForce RTX 3080 Ti | GeForce RTX 3090 |
Logo | |||
Architektur | Ampere | ||
Grafikchip | GA102 | ||
Fertigung | 8 nm | ||
Transistoren | ca. 28,0 Mrd. | ||
CUDA-Cores | 8.704 | 10.240 | 10.496 |
Tensor-Cores | 272 (3. Gen) | 320 (3. Gen) | 328 (3. Gen) |
Raytracing-Cores | 68 (2. Gen) | 80 (2. Gen) | 82 (2. Gen) |
Basistakt | 1.440 MHz | 1.365 MHz | 1.400 MHz |
Boosttakt | 1.710 MHz | 1.665 MHz | 1.700 MHz |
FP32-Rechenleistung | 29.768 GFLOPS | 34.099 GFLOPS | 35.686 GFLOPS |
FP16-Rechenleistung | 29.768 GFLOPS | 34.099 GFLOPS | 35.686 GFLOPS |
ROPs | 96 | 112 | |
TMUs | 272 | 320 | 328 |
Speichertakt | 9.504 MHz | 9.752 MHz | |
Speicherinterface | 320 Bit | 384 Bit | |
Speicherbandbreite | 760.320 MB/s | 912.384 MB/s | 936.192 MB/s |
Speichermenge | 10 GB GDDR6X | 12 GB GDDR6X | 24 GB GDDR6X |
Interface | PCIe 4.0 | ||
Leistungsaufnahme | 320 Watt | 350 Watt |
Auf der Rückseite befindet sich eine große Backplate mit RGB-LEDs.
#AMD #Benchmark #DLSS #Gaming #GeForce #Gigabyte #Grafikchip #Grafikkarte #INNO3D #KFA2 #Kühlung #Lüfter #Monitor #MSI #Netzteil #Nvidia #Overclocking #PCI #PCIe #Raytracing #Samsung #Sapphire #SMS #Software #Technologie #Turing #ZOTAC
Die SanDisk Corporation gibt einen ersten Einblick in das neue Corporate Branding und ihre zukünftige kreative Ausrichtung. Dies ist der...
KIOXIA stellte heute die EXCERIA PLUS G4 SSD-Serie für Gamer und Content Creator vor, die auf der Suche nach mehr...
AGON by AOC ist nach den neuesten Daten von IDC Research - Gaming Tracker Q1-Q3 2024, weiterhin weltweiter Marktführer im...
AVM hat ein umfassendes Update für die FRITZ!Fon-Modelle X6, C6, C5 und C4 bereitgestellt. Neben zahlreichen Designoptimierungen bietet das Update...
KIOXIA Europe gibt bekannt, dass das Verschlüsselungsmodul der Enterprise-NVMe-PCIe-5.0-SSDs der CM7-Serie den Anforderungen des Federal Information Processing Standard (FIPS) 140-3...
Mit der AMD Radeon RX 7900 GRE hat eine bisher als OEM-Variante vertriebene GPU nun den offiziellen Weg in den Handel gefallen. Passend zum Marktstart haben wir uns die Sapphire NITRO+ RX 7900 GRE im Test angesehen.
Die GeForce RTX 4080 SUPER SG von KFA2 kommt mit 1-Click OC und einer wuchtigen Kühlung im Quad-Slot-Design inkl. RGB-Beleuchtung. Wir haben uns den Boliden im Praxistest ausführlich zur Brust genommen.
ZOTAC bietet mit der Trinity Black Edition ein Custom-Design der GeForce RTX 4070 Ti SUPER an, die erst kürzlich von Nvidia vorgestellt wurde. Wie sich die extravagante Grafikkarte im Test schlägt, lesen Sie hier in unserem Review.
Mit der GeForce RTX 4080 SUPER iCHILL Frostbite von INNO3D haben wir heute ein Custom-Design für Systeme mit Wasserkühlung im Test. Der Hersteller arbeitet zu diesem Zweck mit Alphacool zusammen. Mehr in unserem Review.