Nvidia porta sul mercato la GeForce GTX 1660, sorella minore della GTX 1660 Ti disponibile da fine febbraio. La nuova nata arriva sul mercato a un prezzo consigliato di 219 dollari, che in Italia diventano 192 euro più IVA, circa 234 euro.
Al centro della scheda troviamo di nuovo la GPU TU116 (Turing), ma in versione più limitata: da 1536 si passa a 1408 CUDA core. Le frequenze di riferimento scelte da Nvidia sono pari a 1530 / 1785 MHz, ma i produttori hanno carta bianca per presentare soluzioni personalizzate, con dissipatori proprietari e overclock di fabbrica.
Dato che non esiste una Founders Edition di questa GTX 1660, a noi è arrivato il modello di Gigabyte, la Gaming OC 6G, di cui vi parleremo in dettaglio nella prossima pagina. Accanto alla GPU troviamo 6 GB di memoria GDDR5 a 8 Gbps che, insieme al bus a 192 bit, producono un bandwidth di 192 GB/s. Questa scheda segna quindi il ritorno di Nvidia alle GDDR5 dopo un filotto di soluzioni equipaggiate con chip GDDR6.
Il TDP della scheda indicato da Nvidia è di 120 watt, ragion per cui le schede sono dotate di un connettore di alimentazione a 8 pin. Trattandosi di una soluzione della serie GeForce GTX 16xx, anche in questo caso il chip è privo di unità RT core e Tensor core, il che significa che la GTX 1660 non può gestire tecniche come il ray tracing e il DLSS, limitandosi invece alla classica rasterizzazione a cui ci hanno abituato i videogiochi negli ultimi decenni.
La GPU di questa scheda conserva comunque le altre peculiarità dell'architettura Turing, che abbiamo approfondito nell'articolo dedicato a Turing. La nuova architettura di Nvidia ha diverse altre novità, come un rinnovato Streaming Multiprocessor (SM). Nvidia afferma di aver migliorato la velocità di shading per CUDA core del 50% rispetto a Pascal. I progressi sono legati a due cambiamenti fondamentali all'architettura.
Il primo è la presenza di un nuovo datapath integer che può eseguire istruzioni simultaneamente ai calcoli in virgola mobile. Più precisamente ci sono dei core dedicati che processano i calcoli FP32 e integer in contemporanea e permettono di svolgere calcoli FP16 a velocità doppia rispetto alle operazioni FP32.
Questo cosa significa? Secondo Nvidia, i giochi moderni stanno sempre di più mischiando le operazioni in virgola mobile con le istruzioni integer. Per ogni 100 istruzioni in Shadow of the Tomb Raider, ad esempio, mediamente 62 sono in virgola mobile e 38 sono integer. Con Pascal e le GPU precedenti non è possibile svolgere simultaneamente i diversi tipi di calcolo, con una conseguente perdita di velocità ed efficienza.
GeForce GTX 1660 | GeForce GTX 1660 Ti | |
Architettura | Turing | Turing |
GPU | TU116-300 | TU116-400 |
CUDA core | 1408 | 1536 |
Tensor core | - | - |
RT core | - | - |
Texture Unit | 88 | 96 |
Freq. base | 1530 MHz | 1500 MHz |
Freq. GPU boost | 1785 MHz | 1770 MHz |
Memoria | 6GB GDDR5 8 Gbps | 6GB GDDR6 12 Gbps |
Bus | 192-bit | 192-bit |
Bandwidth | 192,1 GB/s | 288,1 GB/s |
ROPs | 48 | 48 |
Cache L2 | 1,5 MB | 1,5 MB |
La GPU è inoltre partizionata in quattro blocchi, ognuno con uno warp scheduler e un'unità dispatch, una nuova cache L0 instruction e un file di registro di 64 KB, 16 core FP32, 16 core INT32 e core dedicati alla gestione delle operazioni FP16. "I giochi moderni usano sempre di più FP16 per creare effetti che non richiedono un alto livello di precisione, come la simulazione dell'acqua in Far Cry 5”. A differenza della GTX 1660, nelle GeForce RTX i calcoli FP16 sono gestiti dai Tensor core.
La seconda grande novità è che il percorso di memoria dell'SM è stato riprogettato per unificare la memoria condivisa, il caching delle texture e il load caching della memoria in una unità. Questo si traduce in un raddoppio del bandwidth e della capacità disponibile per la cache L1 con i comuni carichi di lavoro.
La cache L1 di Turing è configurabile, con una dimensione massima di 64 KB, combinata con 32 KB per SM di memoria allocata condivisa, o può essere ridotta a 32 KB, lasciando 64 KB di allocazione per la memoria condivisa. “Combinare la cache dati L1 con la memoria condivisa riduce la latenza e garantisce un bandwidth superiore rispetto all'implementazione delle GPU Pascal”, assicura l'azienda. Secondo Nvidia, CoD: BO4 è uno dei titoli che più beneficia della nuova architettura di caching delle GPU Turing, con prestazioni fino al 50% maggiori rispetto a una GTX 1060 6GB.
Un'altra novità degna di nota di Turing è la nuova tecnologia di shading chiamata Variabile Rate Shading (VRS). I due algoritmi che si avvantaggiano di VRS sono Content Adaptive Shading e Motion Adaptive Shading. Con entrambi la GPU può regolare il tasso di shading su differenti regioni della scena o persino per quanto riguarda oggetti specifici, quindi le aree che non devono essere renderizzate al massimo dettaglio possono essere sottoposte a shading con meno campioni per migliorare le prestazioni.
Il Motion Adaptive Shading interviene sul tasso di shading in base alla quantità di movimento presente in una regione particolare della scena. Ad esempio, durante un gioco di corse la macchina viene renderizzata al massimo dettaglio, mentre la strada, le strisce e i cartelli possono essere renderizzati con meno dettagli - ma nulla che l'occhio possa percepire - perché superati a grande velocità.
Con il Content Adaptive Shading, il tasso di shading è legato alla coerenza spaziale e temporale dei colori tra i frame. Nel caso in cui i cambiamenti di colore siano minimi da un fotogramma all'altro – ad esempio il cielo in una scena o un muro - il tasso di shading può essere abbassato tra immagini successive per migliorare le prestazioni. Anche in questo caso Nvidia assicura che l'occhio non nota la differenza. Tra i giochi che applicano questa tecnologia c'è Wolfenstein II: The New Colossus.
Come le altre GPU Turing, anche la GTX 1660 ha un encoder NVENC migliorato che aggiunge il supporto alla codifica H.265 (HEVC) 8K a 30 fps. Il nuovo encoder NVENC garantisce fino al 25% di risparmio nel bitrate per HEVC e fino al 15% in H.264. Il nuovo decoder NVDEC è stato aggiornato per supportare la decodifica HEVC 4:4:4 con flussi video a 8/10/12 bit ed è compatibile anche con VP9 a 10/12 bit HDR come le GPU Pascal GP102, GP107 e GP108 e Volta GV100.
Secondo Nvidia, Turing migliora la qualità della codifica rispetto alle precedenti GPU Pascal e rispetto agli encoder software. L'encoder video di Turing supera la qualità dell'encoder software x264 usando l'impostazione fast, con un uso decisamente inferiore della CPU. Nvidia sottolinea inoltre come lo streaming 4K sia troppo pesante per farne la codifica sulla CPU, per questo l'azienda ha lavorato con OBS per offrire una versione migliorata del software capace di usare i miglioramenti di Turing per i video. Di conseguenza i giocatori possono streammare e trasmettere simultaneamente dallo stesso sistema, senza avere un PC dedicato all'encoding video.