GPU Nvidia GM107, com'è fatta

Questa è la prima volta che Nvidia introduce un'architettura partendo da una scheda di fascia media. Con Fermi, l'azienda era partita dal chip GF100. Nel caso di Kepler, Nvidia aveva optato per il GK104, un chip che inizialmente nemmeno la stessa Nvidia credeva così potente. Con GM107 il messaggio che l'azienda vuole dare è ben diverso e lo fa affidandosi alla massima espressione della GPU, composta da cinque SMM in singolo Graphics Processing Cluster con il proprio Raster Engine.

Come le architetture precedenti, le partizioni ROPs e la cache L2 erano allineate. In modo simile al GK106 della GTX 650 Ti, il GM107 offre due partizioni con otto unità ciascuna, offrendo fino a 16 pixel per clock (integer a 32 bit). Le due GPU sono diverse per quanto riguarda la capacità della cache L2. Nel GK106 avete a che fare con "pezzi" da 128 KB, per un massimo di 256 KB in un'implementazione con due partizioni ROP. Il GM107 ha 1 MB per pezzo, portando a 2 MB la memoria disponibile per servire richieste di load, store e texture. Secondo Nvidia questa differenza si traduce in una riduzione del carico sul sistema di memoria esterno, oltre che in un grande risparmio energetico.

Nvidia GM107

Impattare poco sul bandwidth di memoria è una buona mossa, dato che il GM107 ha un paio di controller a 64 bit a cui sono collegati 1 o 2 GB di memoria GDDR5 a 1350 MHz. Il throughput di picco è lo stesso di una GeForce GTX 650 Ti: 86,4 GB/s. La memoria è alimentata da meno CUDA Core, ma questi sono gestiti in modo più efficiente. Per questo motivo la grande cache L2 dovrebbe giocare un ruolo fondamentale per impedire un collo di bottiglia.

Uno sguardo alla latenze permette di vedere come la gerarchia di memoria di Maxwell mantenga occupata la GPU in modo più costante.

Oltre alle parti del GM107 dedicate a operazioni grafiche e di calcolo, Nvidia ha migliorato anche il blocco a funzione fissa NVEnc. Si tratta della logica responsabile della codifica coinvolta dalla tecnologia ShadowPlay, permettendovi di riprendere i video di gameplay con un impatto prestazionale minimo. Inoltre accelera alcune applicazioni di transcodifica per permettervi di convertire dei film nel formato corretto per il vostro dispositivo mobile. Mentre Kepler era in grado di codificare contenuti H.264 quattro volte più rapidamente del tempo reale, Maxwell dovrebbe portare il dato a sei/otto volte. Le prestazioni di decodifica H.264 della nuova GPU dovrebbero essere dalle otto alle dieci volte più veloci che in passato.

	GeForce GTX 650	GeForce GTX 650 Ti	GeForce GTX 750 Ti	GeForce GTX 660
GPU	GK107	GK106	GM107	GK106
Architettura	Kepler	Kepler	Maxwell	Kepler
SM	2	4	5	5
GPC	1	2	1	3
Shader Core	384	768	640	960
Unità texture	32	64	40	80
Unità ROPs	16	16	16	24
Processo	28 nm	28 nm	28 nm	28 nm
Freq. Core/Boost	1058 MHz	925 MHz	1020 /1085 MHz	980 / 1033 MHz
Freq. memoria	1250 MHz	1350 MHz	1350 MHz	1502 MHz
Bus memoria	128-bit	128-bit	128-bit	192-bit
Bandwidth	80 GB/s	86.4 GB/s	86.4 GB/s	144.2 GB/s
RAM (GDDR5)	1 o 2 GB	1 o 2 GB	1 o 2 GB	2 GB
Connettori	1 x 6-pin	1 x 6-pin	No	1 x 6-pin
TDP massimo	64 W	110 W	60 W	140 W
Prezzo	110 euro (2 GB)	130 euro (2 GB)	140 euro (2 GB)	160 euro (2 GB)

La GPU GM107 è formata da 1,87 miliardi di transistor all'interno di un die da 148 mm². Il chip GK106 è invece una soluzione da 2,54 miliardi di transistor in un die da 221 mm². Prima di addentrarci nei risultati prestazionali, dobbiamo ipotizzare che l'enfasi sull'efficienza sia stata sufficiente per ridurre il numero di transistor, creando un die più piccolo, ridurre il numero di CUDA core e unità texture e comunque migliorare le prestazioni complessive. Almeno, questo è ciò che cercheremo di scoprire…

In alternativa, potete mettere il GM107 contro il GK107, costituito da 1,3 miliardi in 118 mm². In tale caso il chip Maxwell è più complesso, grande, decisamente più veloce e tuttavia ancora in grado di consumare meno energia.