GPU Nvidia GM107, com'è fatta
Questa è la prima volta che Nvidia introduce un'architettura partendo da una scheda di fascia media. Con Fermi, l'azienda era partita dal chip GF100. Nel caso di Kepler, Nvidia aveva optato per il GK104, un chip che inizialmente nemmeno la stessa Nvidia credeva così potente. Con GM107 il messaggio che l'azienda vuole dare è ben diverso e lo fa affidandosi alla massima espressione della GPU, composta da cinque SMM in singolo Graphics Processing Cluster con il proprio Raster Engine.
Come le architetture precedenti, le partizioni ROPs e la cache L2 erano allineate. In modo simile al GK106 della GTX 650 Ti, il GM107 offre due partizioni con otto unità ciascuna, offrendo fino a 16 pixel per clock (integer a 32 bit). Le due GPU sono diverse per quanto riguarda la capacità della cache L2. Nel GK106 avete a che fare con "pezzi" da 128 KB, per un massimo di 256 KB in un'implementazione con due partizioni ROP. Il GM107 ha 1 MB per pezzo, portando a 2 MB la memoria disponibile per servire richieste di load, store e texture. Secondo Nvidia questa differenza si traduce in una riduzione del carico sul sistema di memoria esterno, oltre che in un grande risparmio energetico.
Nvidia GM107
Impattare poco sul bandwidth di memoria è una buona mossa, dato che il GM107 ha un paio di controller a 64 bit a cui sono collegati 1 o 2 GB di memoria GDDR5 a 1350 MHz. Il throughput di picco è lo stesso di una GeForce GTX 650 Ti: 86,4 GB/s. La memoria è alimentata da meno CUDA Core, ma questi sono gestiti in modo più efficiente. Per questo motivo la grande cache L2 dovrebbe giocare un ruolo fondamentale per impedire un collo di bottiglia.
Uno sguardo alla latenze permette di vedere come la gerarchia di memoria di Maxwell mantenga occupata la GPU in modo più costante.
Oltre alle parti del GM107 dedicate a operazioni grafiche e di calcolo, Nvidia ha migliorato anche il blocco a funzione fissa NVEnc. Si tratta della logica responsabile della codifica coinvolta dalla tecnologia ShadowPlay, permettendovi di riprendere i video di gameplay con un impatto prestazionale minimo. Inoltre accelera alcune applicazioni di transcodifica per permettervi di convertire dei film nel formato corretto per il vostro dispositivo mobile. Mentre Kepler era in grado di codificare contenuti H.264 quattro volte più rapidamente del tempo reale, Maxwell dovrebbe portare il dato a sei/otto volte. Le prestazioni di decodifica H.264 della nuova GPU dovrebbero essere dalle otto alle dieci volte più veloci che in passato.
GeForce GTX 650 | GeForce GTX 650 Ti | GeForce GTX 750 Ti | GeForce GTX 660 | |
---|---|---|---|---|
GPU | GK107 | GK106 | GM107 | GK106 |
Architettura | Kepler | Kepler | Maxwell | Kepler |
SM | 2 | 4 | 5 | 5 |
GPC | 1 | 2 | 1 | 3 |
Shader Core | 384 | 768 | 640 | 960 |
Unità texture | 32 | 64 | 40 | 80 |
Unità ROPs | 16 | 16 | 16 | 24 |
Processo | 28 nm | 28 nm | 28 nm | 28 nm |
Freq. Core/Boost | 1058 MHz | 925 MHz | 1020 /1085 MHz | 980 / 1033 MHz |
Freq. memoria | 1250 MHz | 1350 MHz | 1350 MHz | 1502 MHz |
Bus memoria | 128-bit | 128-bit | 128-bit | 192-bit |
Bandwidth | 80 GB/s | 86.4 GB/s | 86.4 GB/s | 144.2 GB/s |
RAM (GDDR5) | 1 o 2 GB | 1 o 2 GB | 1 o 2 GB | 2 GB |
Connettori | 1 x 6-pin | 1 x 6-pin | No | 1 x 6-pin |
TDP massimo | 64 W | 110 W | 60 W | 140 W |
Prezzo | 110 euro (2 GB) | 130 euro (2 GB) | 140 euro (2 GB) | 160 euro (2 GB) |
La GPU GM107 è formata da 1,87 miliardi di transistor all'interno di un die da 148 mm². Il chip GK106 è invece una soluzione da 2,54 miliardi di transistor in un die da 221 mm². Prima di addentrarci nei risultati prestazionali, dobbiamo ipotizzare che l'enfasi sull'efficienza sia stata sufficiente per ridurre il numero di transistor, creando un die più piccolo, ridurre il numero di CUDA core e unità texture e comunque migliorare le prestazioni complessive. Almeno, questo è ciò che cercheremo di scoprire…
In alternativa, potete mettere il GM107 contro il GK107, costituito da 1,3 miliardi in 118 mm². In tale caso il chip Maxwell è più complesso, grande, decisamente più veloce e tuttavia ancora in grado di consumare meno energia.