L’architettura del G92 è pressochè identica a quella del G80 quindi faremo solo un breve accenno per rinfrescare le idee.
Le diversità più significative rispetto alla versione precedente sono il processo produttivo che passa dai 90nm agli attuali 65nm (si prevede poi nel corso del 2008 un altro dieshrink a 55nm che dovrebbe equipaggiare le proposte 9900GTS con la GPU identificata dal nome G92b) e ciò ha permesso di ridurre in primis i costi di produzione, aumentando la quantità di chip producibili su un wafer di silicio di pari dimensioni, e in seconda battuta di contenere il TDP max abbassando calore prodotto e consumi di corrente del chip stesso.
Architettura Unificata
La 8800GTS512 implementa, come già visto sulle precedenti versioni, un architettura fortemente rivolta al parallelismo utilizzando shader unificati.
Ogni streamprocessor quindi è in grado di allocare dinamicamente ognuno dei 3 elementi grafici di base, VertexGeometry e Pixel shader, o al bisogno anche operazioni per la fisica in modo da avere la massima flessibilità dell’architettura su più ambiti.

Gli streamprocessor sono divisi in 8 blocchi separati gestiti in modo autonomo ognuno dotato di cache di primo livelloin modo da diminuire drasticamente le latenze di accesso ai dati più usati e ogni blocco e dare la possibilità a ogni streamprocessor di accedere ai dati di altri streeamprocessor dello stesso blocco.
StreamProcessor
Gli streamprocessor sono unita scalari di elaborazione molto efficenti, infatti l’output di un unità può essere utilizzato come input per quella seguente riducendo molto la gestione dei processi e l’overhead per passaggio dei dati.
Gli SP’s sono poi raggruppati in gruppi chiamati SIMD (Single Instruction\Multiple Data) che svolgono operazioni simili su diversi tipi di dati, e questo è permesso dalla presenza di memoria all’interno del chip che consente un accesso rapido ai dati a tutti i blocchi e SP.

Scelta che ha pagato molto in termini prestazionali è stata quella di rendere “indipendente” la frequenza degli sp’s rispetto al core. Questa scelta a conti fatti, rispetto alla sceltadi AMD di mantenere invece uguali le 2 frequenze, ha garantito una notevole capacità di mantenere elevato il frame rate anche applicando filtri in modo pesante cosa che non succede con le schede della controparte.
Rop e Memory Controller
Ogni ROP delle 8800 può processare fino a 4 pixel per un totale di 24 per ogni ciclo di clock con capacità di processing Z e color.
Nel caso prendessimo in esame solo il processing Z la scheda riesce a calcolare un massimo di 192 pixel per clock, mentre nel caso si applicasse anche un filtro AA4x il totale verrebbe diviso per 1\4 e si avrebbero 48 pixel per clock.
In questa versione il G92 adotta un controller memory di 256bit di tipo crossbar.
Come è evidente l’ampiezza di bus è stata ridotta rispetto alle precedenti versioni GTS e GTX ma i limiti di questa scelta sembrano non inficiare le performance a risoluzioni “normali”.
Se invece andiamo a esplorare risoluzioni molto elevate nell’ordine dei 1920x1200, con uso intensivo di filtri AA e AF, si nota una perdita di frame rate rispetto alle vecchie soluzioni con bus di memoria molto più ampio.
In ogni caso le perdite di framerate sono esigue e come vedremo si manifestano solo con determinate tipolodie di engine 3D.