Nachdem Konkurrent Nvidia bereits vor einigen Monaten mit der GeForce 8-Generation den Umschwung auf eine Unified-Shader-Architektur geschafft hat, zieht nun auch ATi im Desktop- und Mobile-Bereich nach. Das Design basiert dabei auf dem erfolgreichen "Xenos"-Chip der Xbox 360, den man weiterentwickelt und verbessert hat. Das Ergebniss kann sich (zumindest auf dem Papier) sehen lassen und trägt die Bezeichnung R600 bzw. in den abgespeckten Varianten RV610 und RV630.
Der Trick an Unified-Shader ist dabei relativ leicht nachzuvollziehen. Herkömmliche Architekturen setzen auf verschiedene Arten von Shader-Prozessoren, die jeweils nur für eine Aufgabe bestimmt sind (zum Beispiel Vertex oder Pixel). Shader aus Unified-Shader-GPUs sind in der Lage alle anfallenden Arbeiten zu erledigen und somit auf keinen Typ festgelegt. Diese Einheiten nennt man Stream-Prozessoren und können im Falle der R600-Generation sowohl Vertex- und Pixel- als auch Geometry-Operationen ausführen. Je nach Modell können bis zu 320 dieser SPs integriert sein und superskalar in der Berechnung agieren. Dies heißt konkret, dass bis zu fünf Operationen pro Takt abgearbeitet werden können (bisher: zwei Ops/sec). Superskalar bedeutet dabei auch, dass eine dynamische Zuteilung der Operationen auf die Prozessoren besteht, um eine maximale Parallelität zu erreichen und das System maximal auslasten zu können. Da die Zuteilung eben nicht mehr direkt durch den Compiler vorgenommen wird, sondern während des Betriebs dynamisch geschieht, wird eine entsprechenden Zuteilungseinheit benötigt. Diese nennt sich im Fachschargon "Dispatcher" (Koordinator bzw. Zuteiler). In der zweiten Unified-Shader Generation von ATi hat man auch diese Einheit weiter verbessert und den "Ultra Threaded Dispatch Processor" geschaffen, der eine maximale Auslastung der zur Verfügung stehenden Stream-Prozessoren und somit höchstmögliche Berechnungsgeschwindigkeit erreichen soll.
Ein Blick auf die Architektur des R600 (HD 2900).
Ein einfaches Beispiel zur Verdeutlichung von Flaschenhälsen in einer Nicht-Unified-Architektur: Hat man eine Szene zum Rendern in die GPU geschickt die besonders Vertex-Shader-lastig ist, wie zum Beispiel durch Formveränderungen und Lichteinfalländerungen, werden primär die Vertex-Shader-Einheiten der GPU benutzt und die Pixel-Shader-Einheiten befinden sich überwiegend im Leerlauf. Dieser suboptimale Zustand gilt auch umgekehrt, wenn kaum Vertex-Berechnungen anliegen und die Szene vor allem die Pixel-Shader, beispielsweise durch Interpolationen mit Texturen beim Shading, fordert. Stream-Prozessoren der Unified-GPU sind in der Lage alle anfallenden Operationen durchzuführen und damit im Optimalfall maximal ausgelastet, was Flaschenhälse verhindert und eine beschleunigte Abarbeitung forciert. Diese kann jedoch nur der Fall sein, wenn die Dispatch-Einheit zuverlässig die Threads auf die freien SPs verteilt. R6xx-GPUs können Vertex-, Shader- und Geometry-Operationen je nach Bedarf abarbeiten.
512 Bit: Ringbus-Interface des R600 (HD 2900).
Wieder mit dabei ist das bereits von vorherigen Generationen bekannte Ringbus-Speicherinterface, welches man nun auf insgesamt 1024 Bit (512 Bit in jede Richtung des Rings) aufgestockt hat. Die Daten können somit noch schneller innerhalb der GPU rotieren und von Punkt A nach B gebracht werden. Für die Anbindung von DDR-Speicher hat man wiederum die Unterstützung von GDDR3 und GDDR4 realisiert. Dieser kann an insgesamt vier Schnittstellen paarweise konnektiert werden. Daraus ergeben sich wiederum acht Einzelbusse mit 64 Bit Breite zu je einem Speicherbaustein. Alles in Allem bringt die Radeon HD 2900 also ein 512 Bit Speicherinterface mit in den Kampf gegen ATi und sorgt für neue Rekorde in Sachen Durchsatz. Die Varianten HD 2600 und HD 2400 wurden entsprechend abgespeckt.
Weitere Details zu Features und Neuheiten in der Bildqualität entnehmen Sie der folgenden Seite.
Die SanDisk Corporation gibt einen ersten Einblick in das neue Corporate Branding und ihre zukünftige kreative Ausrichtung. Dies ist der...
KIOXIA stellte heute die EXCERIA PLUS G4 SSD-Serie für Gamer und Content Creator vor, die auf der Suche nach mehr...
AGON by AOC ist nach den neuesten Daten von IDC Research - Gaming Tracker Q1-Q3 2024, weiterhin weltweiter Marktführer im...
AVM hat ein umfassendes Update für die FRITZ!Fon-Modelle X6, C6, C5 und C4 bereitgestellt. Neben zahlreichen Designoptimierungen bietet das Update...
KIOXIA Europe gibt bekannt, dass das Verschlüsselungsmodul der Enterprise-NVMe-PCIe-5.0-SSDs der CM7-Serie den Anforderungen des Federal Information Processing Standard (FIPS) 140-3...
Mit der AMD Radeon RX 7900 GRE hat eine bisher als OEM-Variante vertriebene GPU nun den offiziellen Weg in den Handel gefallen. Passend zum Marktstart haben wir uns die Sapphire NITRO+ RX 7900 GRE im Test angesehen.
Die GeForce RTX 4080 SUPER SG von KFA2 kommt mit 1-Click OC und einer wuchtigen Kühlung im Quad-Slot-Design inkl. RGB-Beleuchtung. Wir haben uns den Boliden im Praxistest ausführlich zur Brust genommen.
ZOTAC bietet mit der Trinity Black Edition ein Custom-Design der GeForce RTX 4070 Ti SUPER an, die erst kürzlich von Nvidia vorgestellt wurde. Wie sich die extravagante Grafikkarte im Test schlägt, lesen Sie hier in unserem Review.
Mit der GeForce RTX 4080 SUPER iCHILL Frostbite von INNO3D haben wir heute ein Custom-Design für Systeme mit Wasserkühlung im Test. Der Hersteller arbeitet zu diesem Zweck mit Alphacool zusammen. Mehr in unserem Review.