Date il benvenuto a una nuova GPU Nvidia Pascal
A 2 mesi dal debutto l'architettura Pascal si sta facendo largo nell'offerta grafica di Nvidia, coprendo più fasce di mercato. Dopo la GTX 1080, capace di offrire oltre il 30% in più delle prestazioni di una GTX 980 Ti a un prezzo inferiore, è arrivata la GTX 1070, anch'essa capace di battere la GTX 980 Ti pur costando alcune centinaia di euro in meno.
Adesso è il momento della terza scheda video Pascal, la GTX 1060. Annunciata all'inizio di questo mese, dovrebbe essere disponibile a un prezzo suggerito a partire da 234 euro più IVA, ossia circa 285 euro. La Founders Edition sarà venduta a 319 euro, ma non sarà disponibile in Italia, almeno non ufficialmente. Ribadiamo subito che questi sono i prezzi suggeriti da Nvidia, per i prezzi reali dovremo guardare i prodotti negli shop.
La GTX 1060 è basata su una nuova GPU chiamata GP106, un GP104 in formato ridotto. Secondo Nvidia la GTX 1060, pur con un TDP di 120 watt, è capace di offrire prestazioni simili alla GTX 980. Due anni fa per ottenere quel livello di prestazioni bisognava spendere almeno 550 euro.
Ecco GP106
Nvidia ha realizzato la GTX 1080 usando un GP104 completo con quattro Graphics Processing Clusters abilitati. Questo significa avere a disposizione un totale di 2560 CUDA core e 160 unità texture. La GTX 1070 si basa sulla stessa GPU ma con tre GPC attivi, per un totale di 1920 CUDA core e 120 unità texture.
GPU | GeForce GTX 1060 (GP106) | GeForce GTX 980 (GM204) |
---|---|---|
SM | 10 | 16 |
CUDA Core | 1280 | 2048 |
Freq. base | 1506 MHz | 1126 MHz |
Freq. GPU Boost | 1708 MHz | 1216 MHz |
GFLOPs (Base Clock) | 3855 | 4612 |
Unità Texture | 80 | 128 |
Texel Fill Rate | 120.5 GT/s | 144.1 GT/s |
Data Rate memoria | 8 Gb/s | 7 Gb/s |
Bandwidth | 192 GB/s | 224 GB/s |
ROPs | 48 | 64 |
Cache L2 | 1.5MB | 2MB |
TDP | 120W | 165W |
Transistor | 4,4 miliardi | 5,2 miliardi |
Dimensione die | 200 mm² | 398 mm² |
Processo produttivo | 16 nm | 28 nm |
GP106 ha due GPC, quindi è formato da un totale di 1280 CUDA core e 80 unità texture. Il chip beneficia delle stesse ottimizzazioni ai timing che hanno permesso a Nvidia di aumentare la frequenza su GP104, ed è così impostato a una frequenza base di 1506 MHz e una di GPU Boost tipico di 1708 MHz.
Anche il back-end del processore è stato ridimensionato. Sei controller di memoria a 32 bit forniscono un data path aggregato a 192 bit. Come il più grande GP104, ogni controller è associato a 8 ROPs e 256 KB di cache L2, per un totale di 48 ROPs e 1,5 MB di cache. Nvidia ha dotato la scheda di 6 GB di memoria GDDR5 a 8 GT/s, per un throughput di picco fino a 192 GB/s. Anche se questo valore è inferiore ai 224 GB/s della GTX 980, ricordate che Pascal gode di nuove tecniche lossless per usare al minimo il sottosistema di memoria, aumentando in questo modo il bandwidth usabile. Il seguente pezzo è adattato dalla recensione della GTX 1080: "La compressione delta color di GP106 punta a offrire un risparmio di 2:1 e questa modalità è presumibilmente migliorata per essere usabile con maggiore frequenza. C'è anche una nuova modalità 4:1 che copre i casi in cui le differenze per pixel sono davvero piccole e comprimibili in persino meno spazio. Infine Pascal ha una nuova modalità 8:1 che combina una compressione costante 4:1 a blocchi 2x2 con compressione 2:1 delle differenze tra i blocchi".
Ovviamente anche GP106 è prodotto con lo stesso processo 16FF+ di TSMC adottato per GP104. Mentre la GPU più grande è composta da 7,2 miliardi di transistor su un die da 314 mm2, Nvidia è riuscita a inserire 4,4 miliardi di transistor FinFET nei 200 mm2 di GP106. Il processore meno complesso, accoppiato alla minor memoria su un progetto più semplice, porta ad avere un TDP di 120 watt.
Niente SLI
Notate la mancanza del connettore SLI? Nvidia consiglia la GTX 1070 e la GTX 1080 ai giocatori che vogliono più prestazioni rispetto a quelle che offre la GTX 1060 e così ha deciso di non supportare lo SLI su questa schedaNvidia ha preso atto che non ci sono molti giocatori che accoppiano GPU mainstream e ha deciso di non disperdere risorse, focalizzandosi sull'ottimizzazione dello SLI sulle schede Pascal più veloci. Oltre a questa spiegazione però, c'è da dire che lo sviluppo di giochi sta prendendo una direzione differente con effetti di post processing orientati al calcolo che non sono amici dell'alternate-frame rendering. E con le DirectX 12, gli sviluppatori hanno maggiore controllo. Ciò significa che gran parte del lavoro che Nvidia fa con i driver verrà aggirato.
Abbiamo un gioco nella nostra suite che supporta più GPU tramite le DirectX 12: Ashes of the Singularity. Dopo aver aggiunto una seconda GTX 1060 abbiamo osservato il seguente miglioramento:
GeForce GTX 1060 Founders Edition
La GTX 1060 ha un design che ricorda quello della GTX 1070 e della GTX 1080, anche se in una versione meno costosa.
La copertura della scheda è un mix di alluminio e plastica, ed è piuttosto basilare, tanto che si può rimuovere in un unico pezzo. Sulla parte superiore è presente il logo "GeForce GTX", illuminato con la scheda in funzione. Il connettore PCIe a 6 pin è posizionato in modo strano, ma ne parleremo più tardi.
Sistema di raffreddamento, scheda e alimentazione
Rimuovendo la copertura ci troviamo davanti alla soluzione di raffreddamento. Nella parte superiore emerge immediatamente la strana posizione del connettore PCIe. È situato sulla parte della soluzione di raffreddamento che sporge oltre la scheda. Questa scelta ha imposto a Nvidia la presenza di cavi per la connessione ai circuiti.
Il corpo del sistema di raffreddamento può essere rimosso tramite quattro viti. Troviamo un grande dissipatore in rame e, al di sotto, una cornice metallica. Il progetto chiuso delle alette di raffreddamento è una reminiscenza della GTX 1070 e dovrebbe dissipare in modo più che adeguato il calore prodotto della GPU della GTX 1060.
La cornice di raffreddamento e ritenzione ha il doppio scopo di mantenere tutto al proprio posto e raffreddare bene i convertitori di tensione e i moduli di memoria.Sfortunatamente il controller PWM non è ancora accompagnato da documentazione adeguata. È realizzato da uPI Semiconductor Corp e ha un model number uP9509, il che significa che molto probabilmente è un derivato dell'uP9511P, il controller PWM che accompagna la GPU GP104. È completamente sufficiente per le tre fasi dedicate alla GPU e per la fase destinata ai moduli di memoria.
La fase dei moduli di memoria e una delle fasi della GPU assorbono energia dallo slot PCIe della motherboard. Le due fasi rimanenti della GPU raccolgono energia dal connettore PCIe. Nella prossima pagina vedremo cosa significa per la distribuzione del carico tra i canali.Il regolatore di tensione è basato su un Dual N-Channel MOSFET, l'E6930, per fase sia per il lato alto che quello basso, il che significa che gate driver separati non sono necessari. Ciò spiega gli spazi vuoti presenti. Le tre fasi della GPU sono totalmente sufficienti. La perdita di energia a livello dei convertitori di energia è relativamente bassa. La distribuzione delle fasi ha più senso di quella vista sulla Radeon RX 480 di AMD.Salvo il connettore PCIe la GTX 1060 Founders Edition è ben progettata. In base alla bassa quantità di calore disperso l'uso di una ventola assiale non è una scelta sbagliata.