Cinque obiettivi
ATI ha affermato di essere giunta a questo design con cinque obiettivi in mente. Il primo della lista, naturalmente, era l'integrazione del supporto DirectX 11, in concomitanza con la presentazione di Windows 7. I tempi non potevano coincidere meglio, considerando che il sistema operativo Microsoft si trova in versione RTM ed è quasi pronto al debutto.
Secondo, ATI voleva più prestazioni con i titoli DirectX 9, 10 e 10.1, visto che i giochi DirectX 11 non sono ancora disponibili, l'obiettivo primario è raggiungere prestazioni superiori che possono essere riscontrate nel mondo reale.
Terzo, l'azienda ha tenuto un occhio puntato sullo stream computing. Questa è un'area dove l'architettura Nvidia CUDA sta dominando, fin dall'inizio. Con OpenCL 1.0 e DirectCompute ormai standardizzati, e la possibilità per gli sviluppatori di usare le funzionalità GPGPU, e per ATI è una chance di accorciare la distanza con Nvidia.
Quarto, l'efficienza energetica doveva essere pari a due volte quella della scheda di generazione precedente. Secondo ATI, questo obiettivo è stato raggiunto. Mentre il TDP massimo è più alto, il consumo in idle è decisamente più basso.
Infine, doveva trattarsi di un prodotto innovativo, obiettivo raggiunto tramite la gestione delle uscite video e alcuni miglioramenti della qualità dell'immagine.
Come raddoppiare le prestazioni?
Il metodo più semplice per duplicare la potenza di una GPU è raddoppiare le risorse a sua disposizione. Il risultato è una potenza di 2,7 TeraFLOPS in single-precision e 544 GigaFLOPS in double-precision.
|
RV770 ha 10 core SIMD, Cypress ne ha 20. Come in precedenza, ogni core contiene 16 stream processor. Ogni stream processor ha cinque ALU, che ATI chiama "stream core". Moltiplicate questi numeri e otterrete 1600 core, o shader. Aggiungiamo all'equazione la frequenza di 850 MHz, e otteniamo la capacità computazionale di 2,7 TFLOPS.
Diagramma a blocchi di Cypress - cliccare sull'immagine per ingrandirla
Come per la precedente generazione, le unità texture sono collegate agli array SIMD - quattro per motore. Con 20 array, il totale di unità texture è 80. L'RV770 ne ha 40.
Il back-end di renderizzazione di Cypress è stato decisamente migliorato. Questa parte del chip era un problema con l'architettura RV770. Le GDDR5 aiutarono a mitigare gli effetti negativi di un bus memoria a 256 bit. Inoltre, i miglioramenti apportati nelle prestazioni anti-aliasing e Z-stencil ha dimostrato che ATI ha sistemato i problemi riscontrati con RV670.