La GeForce GTX 1660 Ti è una soluzione che di primo acchito potrebbe creare un po' di confusione nella mente dei consumatori meno informati. Il nome fa pensare a un miglioramento della GTX 1060 6GB, e in effetti lo è, ma sotto il cofano non c'è l'architettura Pascal, bensì quella Turing che abbiamo avuto modo di conoscere in questi mesi con le schede GeForce RTX 2000, o serie 20 come talvolta viene identificata da Nvidia.
A questo punto viene da chiedersi: dato che l'architettura è la stessa delle schede RTX, perché questa scheda si chiama GTX 1660 Ti? Perché è "una Turing differente" da quelle che abbiamo avuto modo di conoscere fino a oggi. Già perché accanto ai CUDA core non ci sono le unità RT core per il ray tracing e i Tensor core per l'intelligenza artificiale. E allora cosa rimane di Turing? Tutto il resto, e non è poco.
Come abbiamo avuto modo di spiegare nell'articolo dedicato a Turing, la nuova architettura di Nvidia ha diverse altre novità, come un rinnovato Streaming Multiprocessor (SM). Nvidia afferma di aver migliorato la velocità di shading per CUDA core del 50% rispetto a Pascal. I progressi sono legati a due cambiamenti fondamentali all'architettura.
Il primo è la presenza di un nuovo datapath integer che può eseguire istruzioni simultaneamente ai calcoli in virgola mobile. Più precisamente ci sono dei core dedicati che processano i calcoli FP32 e integer in contemporanea e permettono di svolgere calcoli FP16 a velocità doppia rispetto alle operazioni FP32.
Questo cosa significa? Secondo Nvidia, i giochi moderni stanno sempre di più mischiando le operazioni in virgola mobile con le istruzioni integer. Per ogni 100 istruzioni in Shadow of the Tomb Raider, ad esempio, mediamente 62 sono in virgola mobile e 38 sono integer. Con Pascal e le GPU precedenti non è possibile svolgere simultaneamente i diversi tipi di calcolo, con una conseguente perdita di velocità ed efficienza.
La GPU è inoltre partizionata in quattro blocchi, ognuno con uno warp scheduler e un'unità dispatch, una nuova cache L0 instruction e un file di registro di 64 KB, 16 core FP32, 16 core INT32 e core dedicati alla gestione delle operazioni FP16. "I giochi moderni usano sempre di più FP16 per creare effetti che non richiedono un alto livello di precisione, come la simulazione dell'acqua in Far Cry 5". A differenza della nuova GTX 1660 Ti, nelle GeForce RTX i calcoli FP16 sono gestiti dai Tensor core.
La seconda grande novità è che il percorso di memoria dell'SM è stato riprogettato per unificare la memoria condivisa, il caching delle texture e il load caching della memoria in una unità. Questo si traduce in un raddoppio del bandwidth e della capacità disponibile per la cache L1 con i comuni carichi di lavoro.
La cache L1 di Turing è configurabile, con una dimensione massima di 64 KB, combinata con 32 KB per SM di memoria allocata condivisa, o può essere ridotta a 32 KB, lasciando 64 KB di allocazione per la memoria condivisa. "Combinare la cache dati L1 con la memoria condivisa riduce la latenza e garantisce un bandwidth superiore rispetto all'implementazione delle GPU Pascal", assicura l'azienda. Secondo Nvidia, CoD: BO4 è uno dei titoli che più beneficia della nuova architettura di caching delle GPU Turing, con prestazioni fino al 50% maggiori rispetto a una GTX 1060 6GB.
Un'altra novità degna di nota di Turing è la nuova tecnologia di shading chiamata Variabile Rate Shading (VRS). I due algoritmi che si avvantaggiano di VRS sono Content Adaptive Shading e Motion Adaptive Shading. Con entrambi la GPU può regolare il tasso di shading su differenti regioni della scena o persino per quanto riguarda oggetti specifici, quindi le aree che non devono essere renderizzate al massimo dettaglio possono essere sottoposte a shading con meno campioni per migliorare le prestazioni.
Il Motion Adaptive Shading interviene sul tasso di shading in base alla quantità di movimento presente in una regione particolare della scena. Ad esempio, durante un gioco di corse la macchina viene renderizzata al massimo dettaglio, mentre la strada, le strisce e i cartelli possono essere renderizzati con meno dettagli - ma nulla che l'occhio possa percepire - perché superati a grande velocità.
Con il Content Adaptive Shading, il tasso di shading è legato alla coerenza spaziale e temporale dei colori tra i frame. Nel caso in cui i cambiamenti di colore siano minimi da un fotogramma all'altro – ad esempio il cielo in una scena o un muro - il tasso di shading può essere abbassato tra immagini successive per migliorare le prestazioni. Anche in questo caso Nvidia assicura che l'occhio non nota la differenza. Tra i giochi che applicano questa tecnologia c'è Wolfenstein II: The New Colossus.
Come le altre GPU Turing, anche la GTX 1660 Ti ha un encoder NVENC migliorato che aggiunge il supporto alla codifica H.265 (HEVC) 8K a 30 fps. Il nuovo encoder NVENC garantisce fino al 25% di risparmio nel bitrate per HEVC e fino al 15% in H.264. Il nuovo decoder NVDEC è stato aggiornato per supportare la decodifica HEVC 4:4:4 con flussi video a 8/10/12 bit ed è compatibile anche con VP9 a 10/12 bit HDR come le GPU Pascal GP102, GP107 e GP108 e Volta GV100.
Secondo Nvidia, Turing migliora la qualità della codifica rispetto alle precedenti GPU Pascal e rispetto agli encoder software. L'encoder video di Turing supera la qualità dell'encoder software x264 usando l'impostazione fast, con un uso decisamente inferiore della CPU. Nvidia sottolinea inoltre come lo streaming 4K sia troppo pesante per farne la codifica sulla CPU, per questo l'azienda ha lavorato con OBS per offrire una versione migliorata del software capace di usare i miglioramenti di Turing per i video. Di conseguenza i giocatori possono streammare e trasmettere simultaneamente dallo stesso sistema, senza avere un PC dedicato all'encoding video.
Insomma, come avete visto le novità, anche senza RT e Tensor Core, non mancano. Dopo la panoramica sull'architettura, entriamo nel vivo delle caratteristiche della nuova GeForce GTX 1660 Ti.