Recensioni » Schede video » EVGA GeForce GTX 280 SC: la rivoluzione


Le migliorie



SIMT Architecture

L’architettura a shader unificati di NVIDIA usa due differenti proccesing models: per l’esecuzione attraverso i TPC, l’architettura e MIMD (Multiple Instruction, Multiple Data); per l’esecuzione attraverso le ogni singola SM, l’architettura è SIMT (Single Instruction, Multiple Thread).

Il SIMT è lo sviluppo del SIMD (Single Instruction, Multiple Data) e la differenza principale tra i due è che la dimensione dei vettori nel SIMT viene processata senza una dimensione predefinita. Il SIMT essendo scalare può lavorare sempre al 100%, senza considerare la lunghezza dei vettori che vengono processati.

Un Grande numero di Thread

La GeForce GTX 280 supporta oltre 30 mila thread. Rispetto alla generazione precedente il numero di thread gestibili da ogni SM è passato da 768 a 1024. GT200 esegue thread in gruppi di 32 thread paralleli chiamati “warps”. Quindi GT200 ha un rapporto di 32warps/SM contro le 24 warps/SM della serie GeForce 8 e 9.

Trovare il numero totale di thread è semplice, basta eseguire una semplice moltiplicazione:

32 thread per ogni warps

32 warps ogni SM = 32 x 32 = 1024 thread per SM

3 SM per ogni TPC

10 TPC = 10 x 3 SM = 10 x 3 x 1024 thread = 30720 thread totali

Register File: Raddopialo

La dimensione del register file è stata radoppiata rispetto alla generazione precedente. Questo perché quando si andavano ad eseguire lunghi shader il registro delle GeForce serie 8 e 9 rischiava di essere totalmente riempito generando una situazione di swap to memory. Un register file più ampio invece permette di processare shader più complessi e di dimensioni maggiori più velocemente ed in maniera più efficiente.

In termini di dimensioni del die questo aumento di dimensioni ha preso solo una piccola parte dell’area di ogni SM.

Qui sotto trovate una tabella con gli aumenti di performance utilizzando un register file di dimensioni doppie:

Doppia Precisione

Una delle nuove importanti cose che GT200 introduce è il supporto alla doppia precisione, quindi parliamo di floating point a 64-bit.

Questo beneficio può aiutare la precisione dei risultati nei calcoli scientifici, finanziari, medici, insomma in tutti quei calcoli complessi dove aver molta precisione è fondamentale.

C’è da sottolineare come i 240 SP siano tutti in singola precisione e loro semplicemente non possono fare operazioni a 64-bit. Ma NVIDIA per aggiungere al suo progetto la doppia precisione ha inserito un unità per ogni Shading Multiprocessor (SM) in grado di esegure calcoli in floating point a 64-bit, per un totale di 30 unità in tutto il chip.

Il picco prestazionale in double precision per ciclo è pari 77.78Gflops, 1/8 delle prestazioni rispetto alla precisione singola, ma paragonabile ad una CPU otto core Xeon.

ROP, migliorie anche qui

La generazione precedente di ROP (quella che ritroviamo sulle GeForce serie 8 - 9) era già molto completa, aveva il supporto a 16 e 32 bit floating point frame buffer, con blending e anti-aliasing (fino a 8x oppure 16x in modalità CSAA). Di conseguenza NVIDIA ha solo cercato di migliorare le prestazioni delle sue ROP, senza il bisogno di rivoluzionarle.

Di conseguenza le nuove ROP supportano tutte le feature della precedente generazione e sono in grado di processare un massimo di 32 pixel per clock che equivale a 4 pixel per partizione di ROP, per un totale di 8 partizioni.

Geometry Shading e Stream Out

Le prestazioni del Geometry Shading sono state implementate grazie ad un ampliamento della dimensione del buffer, che rispetto alla precedente generazione è stato aumentato di 6 volte. In questa maniera il buffer non viene saturato e non si hanno perdite di prestazioni, come dimostra la tabella sottostante:

Bus a 512-bit

Il bus di memoria è passato da un interfaccia di 384 bit del G80 (256 bit per le G92) a 512 bit con il GT200, usando 8 unità con ampiezza di 64 bit. Di conseguenza la banda passante di memoria è aumentata parecchio.

In termini di bilanciamento dell’architettura il rapporto texture to frame buffer (TEX:FB) è stato modificato per garantire un miglior supporto. Gli ingegneri NVIDIA hanno testato su molte applicazioni per arrivare al giusto bilanciamento della banda del frame buffer necessaria per garantire alla texture unit un utilizzo completo senza tenerle inutilmente in attesa di dati.

Per migliorare l’efficienza sono stati utilizzati chip DDR3 più veloci dei precedenti.

Tutto questo garantisce miglioramenti delle prestazioni specialmente a risoluzioni elevate.

Efficienza energetica

L’efficienza energetica rispetto alla precedente generazione è migliorata molto, soprattutto nelle situazioni di riposo della scheda, come l’Idle 2D.

Qui vi riportiamo i dati forniti da NVIDIA dove spiegano i consumi energetici della scheda:

  • Idle / 2D power mode (circa 25W)
  • Blu-ray DVD playback mode (circa 35W)
  • Full 3D performance mode (nel peggiore dei casi TDP 236W)
  • HybridPower mode (effettivi 0W)

Come si può notare dai consumi se non si utilizza la scheda nel pieno delle performance i consumi sono molto ridotti e come vi mostreremo le frequenze in Idle scendono notevolmente, questo naturalmente garantisce di avere una scheda in grado di grandi performance nel momento della richiesta, ma allo stesso tempo parca nei consumi per utilizzi office.

Naturlamente supporta la tecnologia HybridPower, quindi abbinata ad un chipset nForce 780a (presto uscirà anche la versione per CPU Intel) il sistema utilizza la GPU integrata “spegnendo” la vostra GTX 280 e di conseguenza senza inutile consumo energetico. Questo avviene anche in condizioni di SLI o 3-Way-SLI.







   Autore:
   Tommaso Morosini
Erik Farsora
   Categoria:
   RSS Schede video
   Data pubblicazione:
   22/06/2008

© Copyright 2006-2009 Hardware Station
E' vietata la riproduzione, anche solo in parte, dei contenuti e della grafica senza autorizzazione del webmaster
Responsabile: Alex Skerlavaj