Recensioni » Processori » AMD Phenom X3 8750: la prima CPU a 3 core


La microarchitettura



Phenom è il nome della famiglia che comprende tutti i processori con core Agena. Questo core è presente in tutte i processori quad core (X4) e triple core (X3) con una frequenza che va da 2.1 GHz fino a 2.5 GHz con processo produttivo a 65nm.

 

Tutti i processori appartenenti alla serie Phenom sono dotati di tre tipi di cache. La cache di primo livello (L1) è di 512 Kb per CPU, divisa in 64Kb (istruction) e 64Kb (data) per ogni core. L'L2 (cache di secondo livello) invece è di 512 Kbyte per core per un totale di 2 Mb a processore. Troviamo infine la cache di terzo livello (L3) che è pari a 2 Mb e, al contrario della L1 e L2, è condivisa e quindi utilizzabile da tutti i core presenti sulla CPU. Il die ha un'area di 285 mm² composto da 600 milioni di transistors.

HyperTransport 3.0, cache di terzo livello (L3), SSE4a ed il memory controller

L'HyperTransport 3.0 è in grado di offrire fino a 20.8Gb/s di banda passante migliorando le prestazioni nelle applicazioni 3D. L'HyperTransport 1.0 è in grado di offrire una banda passante fino a 6.4 Gb/s (1600 MHz), la versione 2.0 invece fino a 8 Gb/s (2000 MHz) e la 3 fino a 20.8Gb/s (3600 MHz), quindi senza dubbio un ottimo vantaggio.

AMD con i processori Phenom ha introdotto un nuovo set di istruzioni SSE4a, o anche SSE128. Grazie a queste si hanno dei benefici durante l'esecuzione di applicazioni multimediali. Purtroppo queste istruzioni non sono compatibili con le SSE4.1 introdotte da Intel nelle cpu Penryn. Phenom ha un'ampiezza di 128 bit contro i 64 bit dell'Athlon. Paralndo delle istruzioni, facciamo notare come AMD abbia introdotto alcune nuove istruzioni: LZCNT/POPCNT, MOVNTSD/MOVNTSS e EXTRQ/INSERTQ.

E' stata raddoppiata anche la banda da tra la cache di primo livello ed i registri SSE passando da 2 load da 64bit a 2 load a 128 bit sfruttando così pienamente il bus. Il memory prefetcher è in grado di mandare i dati provenienti dalla memoria RAM alla cache di primo livello (L1) senza il bisogno di passarli alla cache di secondo lviello (L2) e di conseguenza si risparmia sui tempi e non si satura la cache L2. Oltre ai due prefetcher per ogni core per le istruzioni e per i dati troviamo anche un terzo controller per le RAM integrato nel memory controller.

Branch prediction, Stack counter e virtualizzazione

AMD ha migliorato alcune cose riguardanti le unità di branch prediction. Come ben si sa, i linguaggi di programmazione orientata ad oggetti come Java o C++ creano non pochi problemi a queste unità poichè non si sa a quale riga del codice bisogna fare riferimento per fare un salto (jump). Dopo una analisi effettuata da AMD sui compilatori più utilizzati, ha deciso di cambiare logica per il branch prediction. Al fine di velocizzare l'esecuzione delle applicazioni AMD ha pensato di aggiungere un contatore per lo stack (Stack counter). Durante l'esecuzione di qualsiasi applicazione l'indirizzo di memoria nello stack viene salvato nel registro ESP. Fino ad ora i processori AMD durante l'esecuzione della applicazioni dovevano gestire anche delle microops per la gestione di questo registro. Lo Stack counter si occupa di aggiornare automaticamente il registro EPS e di conseguenza rendere più velcoe l'esecuzione di qualsiasi applicazione.

La virtualizzazione è diventata una cosa che viene utilizzata e richiesta da tanti utenti, non solamente da chi lavora nell'ambito server come si può credere. Per chi nono lo sapesse la virtualizzazione permette di utilizzare più sistemi operativi contemporaneamente. Al giorno d'oggi avendo due, quattro o più core la virtualizzazione diventa ancora più interessante. I processori Opteron (Barcellona) sono dotati di un software dedicato alla virtualizzazione chiamato Hypervisior. Il design dei processori Opteron è identico a quello dei processori Phenom e di conseguenza è stato possibile implemntare questo software anche nelle CPU Phenom dedicato al segmento desktop.

La TLB su questa architettura è di tipo tagged; questo significa che switchando da una macchina virtuale ad un'altra non serve ricaricare la TLB, cosa che rende più veloce il tutto. La TLB dei processori Intel basati sull'architettura Core 2 invece dev'essere svuotata ogni volta il che rende più lento il sistema di virtualizzazione.







   Autore:
   Alex Skerlavaj
   Categoria:
   RSS Processori
   Data pubblicazione:
   17/06/2008

© Copyright 2006-2008 Hardware Station
E' vietata la riproduzione, anche solo in parte, dei contenuti e della grafica senza autorizzazione del webmaster
Responsabile: Alex Skerlavaj