Date il benvenuto a una nuova GPU Nvidia Pascal
A 2 mesi dal debutto l'architettura Pascal si sta facendo largo nell'offerta grafica di Nvidia, coprendo più fasce di mercato. Dopo la GTX 1080, capace di offrire oltre il 30% in più delle prestazioni di una GTX 980 Ti a un prezzo inferiore, è arrivata la GTX 1070, anch'essa capace di battere la GTX 980 Ti pur costando alcune centinaia di euro in meno.
Adesso è il momento della terza scheda video Pascal, la GTX 1060. Annunciata all'inizio di questo mese, dovrebbe essere disponibile a un prezzo suggerito a partire da 234 euro più IVA, ossia circa 285 euro. La Founders Edition sarà venduta a 319 euro, ma non sarà disponibile in Italia, almeno non ufficialmente. Ribadiamo subito che questi sono i prezzi suggeriti da Nvidia, per i prezzi reali dovremo guardare i prodotti negli shop.
La GTX 1060 è basata su una nuova GPU chiamata GP106, un GP104 in formato ridotto. Secondo Nvidia la GTX 1060, pur con un TDP di 120 watt, è capace di offrire prestazioni simili alla GTX 980. Due anni fa per ottenere quel livello di prestazioni bisognava spendere almeno 550 euro.
Ecco GP106
Nvidia ha realizzato la GTX 1080 usando un GP104 completo con quattro Graphics Processing Clusters abilitati. Questo significa avere a disposizione un totale di 2560 CUDA core e 160 unità texture. La GTX 1070 si basa sulla stessa GPU ma con tre GPC attivi, per un totale di 1920 CUDA core e 120 unità texture.
La GTX 1060 scala in modo simile usando i medesimi blocchi base dell'architettura. Dalla recensione della GTX 1080: "Ogni GPC offre cinque Thread/Texture Processing Clusters e un raster engine. Entrando ulteriormente nel dettaglio, un TPC combina uno Streaming Multiprocessor e un PolyMorph engine. L'SM combina 128 CUDA core a singola precisione, un file di registro da 256 KB, 96 KB di memoria condivisa, 48 KB di cache L1/texture e otto unità texture. Allo stesso tempo la quarta generazione del PolyMorph engine include un nuovo blocco logico che è posto alla fine della pipeline geometrica e prima dell'unità raster per gestire il Simultaneous Multi-Projection".GPU | GeForce GTX 1060 (GP106) | GeForce GTX 980 (GM204) |
---|---|---|
SM | 10 | 16 |
CUDA Core | 1280 | 2048 |
Freq. base | 1506 MHz | 1126 MHz |
Freq. GPU Boost | 1708 MHz | 1216 MHz |
GFLOPs (Base Clock) | 3855 | 4612 |
Unità Texture | 80 | 128 |
Texel Fill Rate | 120.5 GT/s | 144.1 GT/s |
Data Rate memoria | 8 Gb/s | 7 Gb/s |
Bandwidth | 192 GB/s | 224 GB/s |
ROPs | 48 | 64 |
Cache L2 | 1.5MB | 2MB |
TDP | 120W | 165W |
Transistor | 4,4 miliardi | 5,2 miliardi |
Dimensione die | 200 mm² | 398 mm² |
Processo produttivo | 16 nm | 28 nm |
GP106 ha due GPC, quindi è formato da un totale di 1280 CUDA core e 80 unità texture. Il chip beneficia delle stesse ottimizzazioni ai timing che hanno permesso a Nvidia di aumentare la frequenza su GP104, ed è così impostato a una frequenza base di 1506 MHz e una di GPU Boost tipico di 1708 MHz.
Anche il back-end del processore è stato ridimensionato. Sei controller di memoria a 32 bit forniscono un data path aggregato a 192 bit. Come il più grande GP104, ogni controller è associato a 8 ROPs e 256 KB di cache L2, per un totale di 48 ROPs e 1,5 MB di cache. Nvidia ha dotato la scheda di 6 GB di memoria GDDR5 a 8 GT/s, per un throughput di picco fino a 192 GB/s. Anche se questo valore è inferiore ai 224 GB/s della GTX 980, ricordate che Pascal gode di nuove tecniche lossless per usare al minimo il sottosistema di memoria, aumentando in questo modo il bandwidth usabile. Il seguente pezzo è adattato dalla recensione della GTX 1080: "La compressione delta color di GP106 punta a offrire un risparmio di 2:1 e questa modalità è presumibilmente migliorata per essere usabile con maggiore frequenza. C'è anche una nuova modalità 4:1 che copre i casi in cui le differenze per pixel sono davvero piccole e comprimibili in persino meno spazio. Infine Pascal ha una nuova modalità 8:1 che combina una compressione costante 4:1 a blocchi 2x2 con compressione 2:1 delle differenze tra i blocchi".
Ovviamente anche GP106 è prodotto con lo stesso processo 16FF+ di TSMC adottato per GP104. Mentre la GPU più grande è composta da 7,2 miliardi di transistor su un die da 314 mm2, Nvidia è riuscita a inserire 4,4 miliardi di transistor FinFET nei 200 mm2 di GP106. Il processore meno complesso, accoppiato alla minor memoria su un progetto più semplice, porta ad avere un TDP di 120 watt.
Niente SLI

Nvidia ha preso atto che non ci sono molti giocatori che accoppiano GPU mainstream e ha deciso di non disperdere risorse, focalizzandosi sull'ottimizzazione dello SLI sulle schede Pascal più veloci. Oltre a questa spiegazione però, c'è da dire che lo sviluppo di giochi sta prendendo una direzione differente con effetti di post processing orientati al calcolo che non sono amici dell'alternate-frame rendering. E con le DirectX 12, gli sviluppatori hanno maggiore controllo. Ciò significa che gran parte del lavoro che Nvidia fa con i driver verrà aggirato.
Abbiamo un gioco nella nostra suite che supporta più GPU tramite le DirectX 12: Ashes of the Singularity. Dopo aver aggiunto una seconda GTX 1060 abbiamo osservato il seguente miglioramento:

GeForce GTX 1060 Founders Edition
La GTX 1060 ha un design che ricorda quello della GTX 1070 e della GTX 1080, anche se in una versione meno costosa.
La scheda ha una lunghezza di 25,4 centimetri, un'altezza di 10,7 centimetri e una profondità di 3,8 centimetri.La GeForce GTX 1060 pesa 845 grammi, quindi non è particolarmente leggera: l'uso del metallo richiede compromessi.La copertura della scheda è un mix di alluminio e plastica, ed è piuttosto basilare, tanto che si può rimuovere in un unico pezzo. Sulla parte superiore è presente il logo "GeForce GTX", illuminato con la scheda in funzione. Il connettore PCIe a 6 pin è posizionato in modo strano, ma ne parleremo più tardi.
La parte posteriore della GeForce GTX 1060 è un po' diversa dai design precedenti. Le schede video con circuiti stampati corti hanno di solito una presa d'aria dove la soluzione di raffreddamento si spinge oltre il PCB, al fine di alimentare la ventola radiale. La GTX 1060 ha invece una copertura. Per contenere i costi la scheda non ha nemmeno il backplate.Nella parte posteriore troviamo tre DisplayPort certificate 1.2, ma pronte per le specifiche 1.3 e 1.4. Ci sono anche una HDMI 2.0 e un connettore dual-DVI.
Sistema di raffreddamento, scheda e alimentazione
Rimuovendo la copertura ci troviamo davanti alla soluzione di raffreddamento. Nella parte superiore emerge immediatamente la strana posizione del connettore PCIe. È situato sulla parte della soluzione di raffreddamento che sporge oltre la scheda. Questa scelta ha imposto a Nvidia la presenza di cavi per la connessione ai circuiti.
Questo progetto non è elegante e impedisce ai partner di Nvidia di realizzare schede video molto più corte usando il progetto di riferimento. La scheda è lunga solo 17,5 cm ma non ha alcun spazio per il connettore PCIe.Il corpo del sistema di raffreddamento può essere rimosso tramite quattro viti. Troviamo un grande dissipatore in rame e, al di sotto, una cornice metallica. Il progetto chiuso delle alette di raffreddamento è una reminiscenza della GTX 1070 e dovrebbe dissipare in modo più che adeguato il calore prodotto della GPU della GTX 1060.



Sfortunatamente il controller PWM non è ancora accompagnato da documentazione adeguata. È realizzato da uPI Semiconductor Corp e ha un model number uP9509, il che significa che molto probabilmente è un derivato dell'uP9511P, il controller PWM che accompagna la GPU GP104. È completamente sufficiente per le tre fasi dedicate alla GPU e per la fase destinata ai moduli di memoria.


