Per iniziare un digramma dell’architettura della 8600:

Possiamo vedere facilmente come questa sia una semplificazione del G80. Molti di questi blocchi sono stati velocizzati e potenziati per ottenere un funzionamento più efficiente. Le funzioni fondamentali di ogni blocco rimangono le stesse, e l’interno di ogni SP rimane inalterato, di conseguenza le caratteristiche supportate sono le medesime che troviamo nel G80. Nel G86 ritroviamo un ulteriore riduzione da due blocchi di Shaders e ROPs a uno.
Paragonata ai 681 milioni di transistor presenti nel G80, il G84 è naturalmente di gran lunga più piccolo, con un potenziale di calcolo racchiuso in “solo” 289 milioni di transistor prodotti con una più raffinata tecnologia di produzione a 80nm.
Come ci si aspetta da un derivato della G80, le funzioni pricipali che si trovano nella GeForce 8800 sono presenti. Questo significa pieno supporto alle DX10 con architettura unificata, Anti – Aliasing fino a 16xQ e la migliore qualità di filtraggio di immagine vista fino ad ora nell’ambito delle schede video consumer.

Ora guadiamo cosa è cambiato nel G84. Il cambiamento più facile da notare sta nel numero degli Stream Processor, che se paragonati ai 128 della sorella maggiore 8800 GTX, sono scesi a 32. Nvidia ha cambiato le capacità di texturing del G84. Mentre ogni texturing unit nel G80 può calcolare solamente quattro texture addresses e otto filtering operations per ciclo, una texture unit equivalente nel G84 può calcolare due volte le texture addresses, arrivando a otto texture address e filtering operations per ciclo. In G80 gli Stream Processors erano divisi in clusters da sedici (dove ogni cluster è composto da blocchi di otto SPs), mentre G84 segue una configurazione simile usando due clusters da sedici Stream Processors, ognuno con il suo proprio controllo per tenere queste unità alimentate. Ad ogni cluster viene assegnato una texturing unit che come abbiamo appena menzionato, può calcolare 8 texture per ciclo dandoci la possibilità di lavorare su 16 texture addresses o filtering operations per ciclo.


Ora analizziamo le ROPs del G84, dove I dati sono tenuti quando lasciano gli Stream Processors per essere convertiti da frammenti a pixel e poi applicato l’anti-aliasing (se selezionato) prima che sia spedito al frame buffer dove appare nel nostro schermo. Mentre il core del G80 conteneva sei divisioni ROP, dove ognuna conteneva quattro unità, per un totale di 24 ROP, il G84 ha solo due divisioni, il che significa che in totale dispone di otto ROP. Mettendo da parte il numero delle ROP, la capacità delle ROP nel G80 e nel G84 sono pressappoco identiche. Il che significa che ogni divisione di ROP può controllare 16 colori e 16 Z sample per ciclo, con un picco di 32 colori + Z samples per ciclo. Ogni divisione è inoltre in grado di controllare 32 Z samples per ciclo, avendo una potenza totale di 64 Z samples per ciclo.
Il vantaggio di essere basati sulla stessa architettura dei modelli di fascia alta sta anche nel supporto di tutte le feature previste per queste ultime. Dunque, anche le schede delle famiglie 8600 e 8500, prevedono il supporto per gli Shader Model 4.0, per le API DirectX 10 e per l´accelerazione video PureVideo.
Se architetturalmente le schede GeForce 8600 e 8500 riprendono la stessa struttura già vista nelle schede della famiglia GeForce 8800, con ovviamente le opportune semplificazioni, c''è un nuovo elemento introdotto da NVIDIA specificamente in queste schede. Parliamo del nuovo Video Programmable Engine, giunto alla seconda versione e in grado di sfruttare al meglio le potenzialità dei flussi video in alta definizione.
Il nuovo Video Processor: la seconda generazione del pure video HD engine
A partire dalle GeForce 6800 NVIDIA ha introdotto all’interno delle sue GPU un programmable video engine, un supporto per migliorare sia la qualità che le prestazioni della riproduzione dei flussi video. In primis NVIDIA ha ricercato la qualità e la velocità con flussi video in standard definition, cioè gli stessi utilizzati nei film in DVD.
Successivamente con l’uscita degli standard in alta definizione come HD-DVD e Blu-Ray, NVIDIA ha introdotto nella serie GeForce 7 una tecnologia chiamata Pure Video HD, per una migliore qualità dei flussi video.
Ora con G84 NVIDIA ha lanciato la seconda generazione del pure video HD engine, creando la prima GPU che provvede al 100% delle decodifica video H.264 per Blu-Ray e HD-DVD sgravando il carico dalla CPU. Le schede basate su più potente G80 non hanno ancora questa tecnologia, perché sono dotate ancora della vecchia generazione del Video Processor (VP), lo stesso adottato sulla serie GeForce 7.

Il nuovo VP permette di liberare parte del carico della CPU dalle operazioni legate alla decodifica di flussi video dei supporti Blu-Ray e HD DVD, permettendo quindi di utilizzare processori non necessariamente di facia alta. Questo sgravio di utilizzo della CPU potrebbe rivelarsi molto utile in ambito mobile, allungando la durata della batteria e quindi l’autonomia del sistema durante la riproduzione. Inoltre nelle nuove GPU 8500 e 8600 è presente anche un BSP engine, cioè un nuovo bitstream processor che permette una decodifica full HD.


Il VP2 è disegnato per accelerare la decodifica dei più avanzati codec video come MPEG-2, VC-1 e H.264 ad elevato bit rate. Il Bitstream processor (BSP) è specialmente disegnato per liberare la CPU dalla parte di decompressione a entropia inversa della decodifica H.264. Schemi di decodifica conosciuti come CAVLC (Context Adaptive Variable Length Coding) e il CABAC (Context Adaptive Binary Arithmetic Coding). Il G84 include anche l’ AES128 engine, che è usato per accelerare la decodifica del AES128 encryption protocol, per i contenuti protetti.
Ora tramite dei grafici andiamo ad anlizzare la reale efficacia del nuovo Video Processor.

Il grafico mostra l’utilizzo della CPU durante una decodifica H.264 per la riproduzione di film in HD-DVD e Blu-Rey. La piattaforma utilizzata aveva una CPU Intel Pentium 4 531 abbinata prima ad una Radeon X1950 Pro e poi ad una GeForce 8500 GT. Come si può notare dal grafico durante l’utilizzo della Radeon tutto il carico è affidato alla CPU, mentre con la GeForce 8500 la CPU deve preoccuparsi di fare solo il 30 – 45% del lavoro, perché il restante è a carico della GPU.

Ora andiamo a vedere invece l’incidenza che ha il nuovo Video Processor rispetto alla precedente edizione, con un confronto fra GeForce 8600 GTS (VP2) e 7600 GT (VP1). In un sistema senza Pure Video l’utilizzo della CPU va dal 80 al 100 %. La GeForce 7600 GT, con lo standard pure video HD, è in grado di ridurre l’utilizzo della CPU fino al 60%. Infine, come si può notare dal grafico, con la GeForce 8600 GTS e il nuovo VP2 l’utilizzo della CPU scende fino al 20% perché la decodifica avviene a carico della GPU.

La tecnologia NVIDIA PureVideo HD offre una maggior nitidezza delle immagini, colori vivaci e una grande precisione di scalatura delle immagini di video e film in formato HD DVD e Blu-ray. Questa soluzione offre un’accelerazione e un perfezionamento dei video ad alta definizione in formato H.264, VC-1, WMV e MPEG-2. Le immagini risultanti hanno sino al sestuplo di dettaglio dei normali film in DVD.
Dopo aver visto una panoramica dell’archittetura del G84, ora andiamo ad analizzare le schede che sottoporremo ai nostri test.