Interfaccia di memoria e distribuzione

Dopo aver fatto una panoramica sulla nuova scheda ATI/AMD HD 2900 XT è giunto il momento di entrare più nel dettaglio con un approfondimento tecnico sull'architettura del chip R600.

Avatar di Andrea Ferrario

a cura di Andrea Ferrario

Editor in Chief

Interfaccia di memoria e distribuzione

Se ricordate, quando ATI lancò il chip R520 (X1900), introdusse un nuovo bus di memoria ad anello. Molti progetti di chip e le stesse generazioni precedenti di ATI usano, invece, modelli a crossbar centralizzato.  Quest'ultimo è un buon sistema di per sé, che mostra però dei limiti con lo scalare verso l'alto dei client da servire (n^2 per la precisione). Per servire un numero maggiore di client bisogna aggiungere più "strade", fino a creare però una situazione di traffico simile a quella delle nostre grandi metropoli. ATI è passata, con R520, a un metodo parzialmente distribuito, che poteva eseguire letture attraverso l'anello esterno e scrivere tramite la crossbar. "La 2900 invece ha un progetto pienamente distribuito. Questo significa che con l'aumentare del numero dei client, si evita la trappola dello scaling n^2."

Come menzionato in precedenza, AMD ha raddoppiato l'ampiezza del bus, passando da 256 a 512 bit su otto canali. Ci sono quattro stop sull'anello, un po' come quattro uscite di una circonvallazione.

ATI uses a stacked I/O design for a bidirectional bus. There are four sets of wires for data reads and four for writes.

ATI utilizza un desing con bus bidirezionale. Sono presenti quattro piste dati per lettura e quattro per scrittura.

Sull'anello scorrono flussi di lettura e scrittura, distribuiti rispettivamente su quattro set di piste ciascuno. Questo consente un'ampiezza bidirezionale di 1024 bit, con quattro piste per ciascuna direzione. Nel chip ci sono duemila piste ultra trafficate, con più banda interna - 6 TB/s - di quanta se ne potrebbe mai usare all'esterno. L'obiettivo è di fornire a tutti i client interni la maggior ampiezza di banda possibile. L'anello lavora in congiunzione con la memoria per dare accesso contemporaneo a fino a 70 client in scrittura e 80 in lettura.

Vi state chiedendo perché ATI non ha implementato questo modello già nella generazione precedente? Il motivo è che richiede un mucchio di spazio. Nel nuovo progetto, AMD è riuscita a rimpicciolire i path di I/O a circa metà dimensioni rispetto alla generazione precedente. I path sono "dispositivi analogici", ovvero non rimpiccioliscono automaticamente con il progredire della tecnologia come i transistor, dovendo obbedire a precise leggi fisiche come la capacitanza, la resistenza dei metalli e la conduttività. AMD ha fatto un buon lavoro quindi, creando nuovi path da 512 bit che occupano pressappoco lo stesso spazio di quelli vecchi da 256.

Il produttore ha dovuto anche inserire parecchia logica per supportare il tutto. Questo ha causato un ulteriore ingrossamento del chip, ma serviva ottenere maggiore banda con l'attuale tecnologia di memoria. AMD poteva risolvere semplicemente adottando memorie GDDR4; per queste però c'è tuttora disponibilità limitata e prezzi elevati. AMD ha quindi pensato a creare una serie limitata con GDDR4 e di offrire al mercato mainstream il modello più accessibile con GDDR3. In termini di rapporto costo/ampiezza di banda AMD ha fatto un buon affare, evitando le costose GDDR4 grazie al raddoppio dell'ampiezza del bus di memoria.

C'è inoltre una regola non scritta che dice che se aumenti le frequenze delle memorie, diventi meno efficiente. Gli accessi alle pagine della DRAM sono tuttora regolati dalle leggi della fisica e della chimica, che non cambieranno a velocità di clock più elevate. L'isteresi, che è la tendenza di un materiale a rimanere per un certo tempo in uno stato eccitato prima di ritornare a quello naturale, porta alla necessità di maggiori latenze quando si applicano clock più elevati. Questi tempi di attesa servono per avere la garanzia che il materiale torni effettivamente allo stato naturale. Far lavorare le memorie a frequenze leggermente inferiori migliora anche l'efficienza energetica e si traduce in ulteriori benefici.

Conclusioni

Qui finisce l'approfondimento tecnico sulla nuova scheda AMD/ATI che, assieme al primo articolo, AMD Radeon HD2900XT: ATI R600 non sale sul trono, offre una panoramica completa sull'architettura e le prestazioni della nuova scheda HD2900 XT. A breve pubblicheremo un ulteriore recensione in cui analizzeremo le prestazioni della scheda in modalità dual-graphics CrossFire. Rimanete sintonizzati!

Leggi altri articoli