Nvidia è molto fiduciosa delle prestazioni della nuova GeForce GTX Titan X, mostrata al mondo nel corso della GDC 2015. L'azienda ci ha consegnato non solo la scheda video, ma anche un monitor Acer XB280HK, il primo 4K con G-Sync. Nvidia si aspetta che la sua nuova portabandiera a singola GPU riesca a gestire la risoluzione 3840 x 2160 pixel senza grossi problemi? Può essere. E questo, di per sé, è davvero molto interessante.
La GeForce GTX 980 non è riuscita a portarci al punto in cui una singola GPU può gestire tranquillamente la risoluzione 4K con dettagli elevati. La nuova GeForce GTX Titan X è basata sulla GPU GM200, composta da 8 miliardi di transistor. Sì, avete letto bene, 8 miliardi. Si tratta di quasi tre miliardi in più rispetto al GM204 della GeForce GTX 980 e all'incirca un miliardo in più del GK110, il chip usato per la GTX Titan, la GTX Titan Black e diverse altre schede della serie GTX 700.
L'elevatissimo numero di transistor è stipato in un'area di 601 mm², che è circa il 9 percento in più rispetto al GK110. La GPU GM200 è prodotta con lo stesso processo a 28 nanometri high-k metal gate, quindi si tratta semplicemente di un chip grande e complesso. Inoltre, il TDP rimane di 250 watt, come il predecessore.
GM200, caratteristiche tecniche
Similmente al GM204 integrato nelle GeForce GTX 980 e GTX 970 presentate lo scorso settembre, il GM200 è basato su architettura Maxwell. Piuttosto che i quattro GPC (Graphics Processing Clusters) del GM204, qui ne abbiamo sei. E con quattro Streaming Multiprocessors per GPC, si tratta di un totale di 24 SMM integrati nella GPU.
Moltiplicando questo dato per i 128 CUDA core integrati in ogni SMM si ottengono 3072 CUDA core, che sono le unità totali presenti in questa GTX Titan X. Otto unità texture per SMM portano ad avere un totale di 192 TMU - con una frequenza base di circa 1000 MHz, ossia 192 GTex/s (la GTX Titan originaria raggiungeva 188 GTex/s, nonostante un numero di unità texture maggiore).
Come gli SMM che si trovano in GM204, GM200 offre fino a 96 KB di memoria condivisa e 48KB di cache texture/L1, raddoppiando quanto offerto dal primo chip Maxwell, il GM107, integrato sulle schede GTX 750 Ti. Gli altri elementi dell'architettura, invece, sono simili; ogni SMM è suddiviso in quattro blocchi, ognuno con il proprio buffer istruction, warp scheduler e un paio di unità dispatch.
In realtà, gran parte di questi elementi sono legati alla precisione con calcoli in doppia precisione (FP64) che sono ancora un trentaduesimo della velocità con calcoli a singola precisione (FP32), anche se il GM200 è il miglior esponente della famiglia Maxwell.
Incidentalmente, anche la nuova Quadro M6000 condivide questo destino. Se le prestazioni FP64 sono davvero importanti per voi e volete una scheda di Nvidia, non vi resta che puntare sulle soluzioni Tesla.
GeForce GTX Titan X | GeForce GTX 980 | Radeon R9 290X | GeForce GTX Titan | |
---|---|---|---|---|
Processo produttivo | 28nm | 28nm | 28nm | 28nm |
Transistor | 8 miliardi | 5,2 miliardi | 6,2 miliardi | 7,1 miliardi |
Frequenza GPU | 1000 MHz | 1126 MHz | fino a 1 GHz | 837 MHz |
Shader | 3072 | 2048 | 2816 | 2688 |
Unità textura | 192 | 128 | 176 | 224 |
Texture Fillrate | 192 GT/s | 172.8 GT/s | 176 GT/s | 188 GT/s |
ROPs | 96 | 64 | 64 | 48 |
Pixel Fillrate | 96 GP/s | 72 GP/s | 64 GP/s | 40 GP/s |
Bus | 384 bit | 256 bit | 512 bit | 384 bit |
Memoria | 12 GB GDDR5 | 4 GB GDDR5 | 4 GB GDDR5 | 6 GB GDDR5 |
Frequenza memoria | 7 GT/s | 7 GT/s | 5 GT/s | 6 GT/s |
Bandwidth memoria | 336,5 GB/s | 224,4 GB/s | 320 GB/s | 288 GB/s |
TDP | 250 W | 165 W | 250 W | 250 W |
Le quattro partizioni ROP della GeForce GTX 980 salgono a sei sulla GeForce GTX Titan X. Con 16 unità ciascuna, si parla di 96 integer pixel per clock a 32 bit. Le partizioni ROP sono allineate con 512 KB di cache L2, per un totale di 3 MB a bordo del GM200.
Quando è stata introdotta la GeForce GTX 750 Ti, Nvidia ha parlato dell'ampia cache L2 come di un meccanismo per impedire i colli di bottiglia sull'interfaccia relativamente ridotta a 128 bit. Non è un gran problema con il GM200, dato il bus a 384 bit è popolato da memoria a 7 Gb/s. Il throughput massimo di 336,5 GB/s è alla pari con quello della GeForce GTX 780 Ti e supera quello delle schede GeForce GTX Titan, GeForce GTX 980 e Radeon R9 290X.