Radeon R9 Fury X, specifiche tecniche
La Radeon R9 Fury X vale il nome che porta? Le specifiche sono promettenti, questo è certo. La GPU è prodotta ancora una volta a 28 nanometri e laddove il GM200 di Nvidia misura 601mm², Fiji arriva a 596 mm2. AMD è riuscita a integrare 8,9 miliardi di transistor in quello spazio e poi ha montato il chip su un interposer in silicio di 1011 mm2, insieme ai quattro chip di High Bandwidth Memory.
Un rapido sguardo al diagramma a blocchi di Fiji ricorda il progetto di Hawaii, se non altro perché entrambe le GPU sono organizzate in quattro Shader Engine, ognuno con il proprio geometry processor e rasterizzatore, più quattro render back-end capaci di gestire 16 pixel per ciclo di clock. AMD ha inserito più Compute Unit in ogni Shader Engine, 16 anziché 11. Con 64 shader per CU, si hanno 1024 stream processor per Shader Engine e un totale di 4096 unità sull'intera GPU. AMD ha inoltre mantenuto 4 unità texture filter per CU, per un totale di 256 unità in Fiji rispetto alle 176 di Hawaii.
Le prestazioni in fatto shading, potenza di calcolo e texture filtering dovrebbero essere, in teoria, maggiori. Senza miglioramenti ai geometry engine o al numero delle ROPs, tuttavia, avremo a che fare con un collo di bottiglia? Dipenderà dal carico. Con Hawaii AMD ha fatto uno sforzo per aumentare il geometry throughput con un layout four-way Shader Engine e un pixel fill rate maggiore.
I rappresentanti dell'azienda, allora, affermavano che il bandwidth di memoria era il freno della GPU, nonostante l'ampio bus a 512 bit. Oggi l'azienda dice che le sue analisi suggeriscono che le raster ops a otto bit per canale raramente frenano le prestazioni. 16 bit per canale ops possono rappresentare più di una sfida; tuttavia, la combinazione di HBM e compressione colore permette a Fiji di supportare 16bpc raster operations "full rate" laddove le GPU precedenti erano, nei fatti, frenate.
Ciò che non vedete nel diagramma sono i miglioramenti incrementali dell'architettura Graphics Core Next, alcuni dei quali risolvono questi potenziali colli di bottiglia. Hawaii usava una seconda generazione di GCN, che è stata successivamente aggiornata per la GPU Tonga della R9 285. Fiji gode dei benefici di quella che AMD definisce GCN di terza generazione. Uno di questi vantaggi è rappresentato dai geometry processor aggiornati che migliorano le prestazioni con la tessellation.
La compressione lossless del colore per letture e scritture dal frame buffer, nuove istruzioni integer/virgola mobile a 16 bit e il raddoppio della cache L2 a 2 MB fanno parte della lista. Meno rilevanti per la pipeline 3D di Fiji ma comunque benvenute sono un display scalar di maggiore qualità e un engine per la decodifica video aggiornato che supporta la riproduzione accelerata di HEVC.
Sul fronte del calcolo, Fiji incorpora un task scheduling migliorato e alcune nuove istruzioni per il calcolo di dati in parallelo. Dati i 4096 shader e la frequenza massima di 1050 MHz, AMD può vantare una potenza a singola precisione di 8,6 TFLOPs. L'azienda però ha scelto di limitare la potenza FP64 a un sedicesimo di quel valore, ottenendo 537,6 GFLOPs - meno di Hawaii.
High Bandwidth Memory, debutto sulla R9 Fury X
AMD è la prima azienda ad adottare la High Bandwidth Memory, una soluzione migliore della memoria GDDR5. Il throughput di picco passa dai 320 GB/s della R9 290X ai 512 GB/s della nuova nata. I dettagli "di basso livello" sono già noti, ma HBM raggiunge un elevato bandwidth impilando verticalmente le DRAM. Ogni die ha un paio di canali a 128 bit, quindi quattro creano un canale aggregato a 1024 bit.
Questa prima generazione di HBM lavora a 500 MHz e trasferisce due bit per clock. La memoria GDDR5, per confronto, arriva a 1750 MHz con quattro bit per clock. Questa è la differenza tra 1 Gb/s e 7 Gb/s, ma tenete conto dell'ampiezza del bus e avete 128 GB/s per stack di HBM contro i 32 GB/s di un package GDDR5 a 32 bit. Una scheda come la GTX 980 Ti usa sei controller di memoria a 64 bit. Moltiplicate tutto e avete i 336 GB/s. La Radeon R9 Fury X usa quattro stack di HBM arrivando a 512 GB/s.
È raro vedere una specifica fare un balzo in avanti del 60% o raggiungere un 50% in più della concorrenza. Non c'è dubbio che HBM giochi un grande ruolo nelle prestazioni della R9 Fury X ma forse in futuro l'impatto sarà ancora maggiore. È logico pensare che il team driver dell'azienda riuscirà a ricavare maggiori prestazioni dalla combinazione di Fiji e HBM. AMD ha senz'altro tracciato una scaletta precisa su quando pubblicherà eventuali miglioramenti, ma nel mentre dovremo trarre conclusioni con quanto disponibile. Comunque è interessante che secondo AMD vi sia del potenziale ancora irrealizzato.
C'è un po' d'incertezza sulle prospettive a lungo termine della Fury X, dati i suoi 4 GB di memoria HBM. Nessuno dei test in 4K suggerische che la Radeon R9 Fury X avrà problemi con 4 GB. Siamo stati in grado di impostare in GTA V dettagli tali da superare l'uso dei 4 GB e ottenere FPS a singola cifra, ma il gioco era già ingiocabile, comunque. A ogni modo AMD afferma che in futuro si potrà fare molto di più nella gestione della memoria.