Recensione Nvidia GeForce RTX 2080 Ti e RTX 2080

La GeForce RTX 2080 Ti è veloce e nessuno può dire il contrario, ma fin dall'annuncio un elemento di dibattito è apparso il prezzo di lancio. La Founders Edition che recensiamo in questo articolo è venduta a 1279 euro, mentre la precedente portabandiera GTX 1080 Ti arrivò sul mercato a 835 euro.

Stiamo parlando di una differenza di 444 euro o del 53,1% se preferite. Forse la cosa che delude di più è quindi che mediamente la RTX 2080 Ti è il 26% più veloce della soluzione di punta precedente nella nostra suite di 13 giochi testati in 4K.

Ma cosa pensereste se vi dicessimo che batte anche la Titan V? In Battlefield 1, la GeForce RTX 2080 Ti è il 20% più veloce. In Forza Motorsport 7, la 2080 Ti ha un vantaggio del 22%. In base alle specifiche tecniche delle due schede, non ci aspettavamo un risultato così netto. Anche se la Titan V con GPU GV100 e prezzo di 3200 euro è pensata per il deep learning e non per il gaming, quei risultati sicuramente aiutano a dare un contesto ai 1279 euro della RTX 2080 Ti.

geforce rtx 2080 ti 01 — Clicca per ingrandire

Ancora più importante per il crescente gruppo di appassionati con monitor 4K, la GeForce RTX 2080 Ti offre prestazioni giocabili a 3840x2160 senza sacrificare le impostazioni di dettaglio

. Sì, abbiamo disattivato modalità di anti-aliasing molto pesanti per goderci il 4K, ma i nostri test mostrano che è possibile giocare ad alta risoluzione e qualità a più di 60 FPS in ogni singolo gioco.

Era un traguardo atteso da anni. La GeForce GTX 980 Ti consentiva prestazioni giocabili in 4K ma riducendo i dettagli. La GTX 1080 si avvicinava all'obiettivo, ma non garantiva la fluidità giusta per prestazioni giocabili al massimo della qualità. La GTX 1080 Ti ci ha messo ancora più in crisi, arrivando veramente a un soffio dal fare centro. Eravamo propensi a dichiararla la scheda per il 4K al top dei dettagli, ma siamo contenti di non averlo fatto. È la GeForce RTX 2080 Ti la prima a permettere di giocare in 4K a dettagli Ultra.

TU102, nato per la fascia alta

In che modo la GeForce RTX 2080 Ti raggiunge queste prestazioni?

Se non avete ancora letto la nostra analisi completa dell'architettura Turing, vi rimandiamo a quell'articolo per tutti i dettagli.

Per farla breve, l'oggetto principale di questa recensione è basato sulla GPU TU102, un chip da 754 mm2 composto da 18,6 miliardi di transistor prodotti con processo a 12nm FinFET. Al suo interno ritroviamo un'elevata quantità di risorse che operano in modo più efficiente rispetto a quanto visto in passato.

Un processore TU102 completo è dotato di sei Graphics Processing Clusters (GPCs) composti da un Raster Engine e sei Texture Processing Clusters (TPCs). Ogni TPC integra un PolyMorph Engine (pipeline geometrica a funzione fissa) e due Streaming Multiprocessors (SMs). A livello degli SM abbiamo 64 CUDA core, otto Tensor core, un RT core, quattro unità texture, 16 unità load/store, uno spazio per il file di registro di 256 KB, quattro cache L0 instruction e 96 KB di memoria configurabili come cache L1 o memoria condivisa.

Sommando il tutto si ottengono: 72 SM, 4608 CUDA core, 576 Tensor core, 72 RT core, 288 unità texture e 36 PolyMorph engine. Queste risorse sono alimentate da 12 controller di memoria GDDR6 a 32 bit, ognuno collegato a otto cluster ROP e 512 KB di cache L2 per un bus di memoria complessivo di 384 bit, 96 ROPs e 6 MB di cache L2. Ogni SM contiene anche un paio di CUDA core FP64, il che porta le prestazioni a doppia precisione a un trentaduesimo delle prestazioni FP32 di TU102.

	GeForce RTX 2080 Ti FE	GeForce RTX 2080 FE	GeForce GTX 1080 Ti FE	GeForce GTX 1080 FE
Architettura (GPU)	Turing (TU102)	Turing (TU104)	Pascal (GP102)	Pascal (GP104)
CUDA Core	4352	2944	3584	2560
Potenza FP32 di picco	14.2 TFLOPS	10.6 TFLOPS	11.3 TFLOPS	8.9 TFLOPS
Tensor Core	544	368	-	-
RT Core	68	46	-	-
Texture Unit	272	184	224	160
Freq. base	1350 MHz	1515 MHz	1480 MHz	1607 MHz
Freq. GPU Boost	1635 MHz	1800 MHz	1582 MHz	1733 MHz
Memoria	11GB GDDR6	8GB GDDR6	11GB GDDR5X	8GB GDDR5X
Bus	352-bit	256-bit	352-bit	256-bit
Bandwidth memoria	616 GB/s	448 GB/s	484 GB/s	320 GB/s
ROPs	88	64	88	64
Cache L2	5.5MB	4MB	2.75MB	2MB
TDP	260W	225W	250W	180W
Numero transistor	18,6 miliardi	13,6 miliardi	12 miliardi	7,2 miliardi
Dimensione die	754 mm²	545 mm²	471 mm²	314 mm²
Supporto SLI	Sì (x8 NVLink, x2)	Sì (x8 NVLink, x2)	Sì (MIO)	Sì (MIO)

Specifiche tecniche TU102 a bordo della RTX 2080 Ti

Il TU102 a bordo della GeForce RTX 2080 Ti non è il processore nella veste completa. Che Nvidia volesse lasciare spazio a una futura Titan o che sia stata costretta a usare un chip meno potente a causa delle iniziali rese produttive, non lo sappiamo. Di fatto però la RTX 2080 Ti ha due TPC disabilitati, il che ci lascia con una scheda dotata di 4352 CUDA core, 544 Tensor core, 68 RT core, 544 unità texture e 34 PolyMorph engine.

A questo si aggiunge il fatto che Nvidia ha disabilitato uno dei controller di memoria a 32 bit di TU102, creando un bus aggregato a 352 bit che sposta i dati verso 88 ROPs e 5,5 MB di cache L2. Nvidia accompagna la GPU con moduli di memoria Micron MT61K256M32JE-14:A. Sul PCB della RTX 2080 Ti ne contiamo 11, il che lascia un posto vacante.

Cionondimeno il bandwidth di picco teorico è aumentato in modo netto rispetto alle schede di precedente generazione a causa della maggiore velocità della GDDR6: a 14 Gbps su un'interfaccia a 352 bit avrete ben 616 GB/s. Di contro la GDDR5X a 11 Gbps sulla GeForce GTX 1080 Ti produce un bandwidth di 484 GB/s.

geforce rtx 2080 ti 02 — Clicca per ingrandire

Per quanto riguarda la scheda in versione Founders Edition, abbiamo una frequenza base della GPU di 1350 MHz che sale fino a 1635 MHz in GPU Boost, fintanto che è assicurato un buon raffreddamento. E dato che Nvidia indica le prestazioni di picco avvalendosi della frequenza GPU Boost, la RTX 2080 Ti può garantire una potenza di 14,2 TFLOPs con calcoli a singola precisione.

geforce rtx 2080 ti 03 — Clicca per ingrandire

La frequenza è overcloccata rispetto alle specifiche di riferimento di Nvidia. Di conseguenza il modello Founders Edition ha un TDP leggermente più alto pari a 260 watt. Lo slot PCI Express, un connettore a 8 pin e uno a 6 pin dovrebbero essere teoricamente sufficienti ad alimentare la scheda, ma Nvidia ha scelto di dotarla di due connettori a 8 pin dando così alla sua GeForce RTX 2080 Ti Founders Edition margine per ulteriore overclock.

geforce rtx 2080 ti 04 — Clicca per ingrandire

Risalendo dai connettori PCIe verso l'alimentazione della GeForce RTX 2080 Ti contiamo tre fasi di alimentazione per la memoria GDDR6 e un corrispondente controller PWM. Secondo Nvidia le fasi totali sono 13, ma ne siamo davvero certi? Anche con sei raddoppiatori di fase mancherebbe una fase ad agire come bilanciatore del carico. I numeri non tornano.

geforce rtx 2080 ti 05 — Clicca per ingrandire

In realtà sembra che cinque fasi siano alimentate dai connettori a 8 pin e raddoppiate. Con due loop di controllo per fase, 5*2=10 circuiti di regolazione della tensione. Le rimanenti tre fasi alla sinistra della GPU sono alimentate dallo slot PCIe della scheda madre e non raddoppiate.

Questo porta al numero 13, garantendo un'intelligente schema di distribuzione del carico. Ovviamente implementare tutto questo richiede i giusti componenti...

geforce rtx 2080 ti 06 — Clicca per ingrandire

geforce rtx 2080 ti 07 — Clicca per ingrandire

TU104 e GeForce RTX 2080

Anche se il focus di questa recensione è tutto sulla RTX 2080 Ti in quanto portabandiera della nuova serie RTX 20, nei grafici trovate anche i risultati della RTX 2080 FE, una scheda che ha un prezzo di listino di 869 euro sul sito di Nvidia (la GTX 1080 debuttò al prezzo di 800 euro circa). Ricapitoliamone quindi le caratteristiche principali, partendo dalla GPU, TU104.

geforce rtx 2080 01 — Clicca per ingrandire

In modo simile al TU102, anche il TU104 è prodotto da TSMC con processo a 12 nanometri FinFET. Il suo minor numero di transistor, pari a 13,6 miliardi, porta ad avere un die più piccolo di 545 mm2. Già, piccolo ma per modo di dire. TU104 è comunque più grande di GP102 (471 mm2) e ha una dimensione simile al GK110 del 2013 a bordo della GeForce GTX Titan.

gpu tu104 turing diagramma — Clicca per ingrandire

TU104 è realizzato con gli stessi blocchi fondamentali del TU102; ne ha solo di meno. Gli Streaming Multiprocessors hanno ancora 64 CUDA core, otto Tensor core, un RT core, quattro unità texture, 16 unità load/store, 256 KB di spazio di registro e 96 KB di cache L1/memoria condivisa.

geforce rtx 2080 02 — Clicca per ingrandire

I TPC sono ancora formati da due SM e un PolyMorph geometry engine. Qui però troviamo quattro TPC per GPC e sei GPC in tutto il processore. Perciò un TU104 completamente abilitato ha 48 SM, 3072 CUDA core, 384 Tensor core, 48 RT core, 192 unità texture e 24 PolyMorph engine.

geforce rtx 2080 03 — Clicca per ingrandire

Un backend allo stesso modo limitato nelle risorse alimenta le risorse di calcolo tramite otto controller di memoria a 32 bit GDDR6 (256 bit totali) collegati a 64 ROPs e 4 MB di cache L2.

TU104 perde anche un collegamento NVLink, il che lo limita a un collegamento x8 e 50 GB/s di throughput bidirezionale.

Specifiche tecniche TU104 a bordo della RTX 2080

Un TU104 completo è limitato a 48 RT core rispetto ai 68 del TU102. Poiché però Nvidia ha spento un TPC di TU104 per creare la GeForce RTX 2080, si perdono un altro paio di RT core (insieme a 128 CUDA core, otto TMU, 16 Tensor core e così via).

geforce rtx 2080 04 — Clicca per ingrandire

geforce rtx 2080 05 — Clicca per ingrandire

La GeForce RTX 2080 conta quindi su 46 SM con 2944 CUDA core, 368 Tensor core, 46 RT core, 184 unità texture, 64 ROPs e 4 MB di cache L2. 8 GB di memoria GDDR6 a 14 Gbps su un bus a 256 bit spostano 448 GB/s di dati, aggiungendo oltre 100 GB/s di bandwidth rispetto alla GTX 1080.

La RTX 2080 Founders Edition ha una frequenza base di 1515 MHz e un clock in GPU Boost a 1800 MHz. Le prestazioni di calcolo di picco FP32 arrivano a 10,6 TFLOPs, un valore che pone la GeForce RTX 2080 Founders Edition dietro la GeForce GTX 1080 Ti (11,3 TFLOPS), ma ben davanti alla GeForce GTX 1080 (8,9 TFLOPS).

geforce rtx 2080 06 — Clicca per ingrandire

Il TDP della scheda è pari a 225 W, 45 W in più della GeForce GTX 1080. A ogni modo 225 watt sono abbastanza bassi da permettere a Nvidia di usare un connettore ausiliario a 6 pin e uno a 8 pin. Per quanto riguarda il PCB, c'è meno affollamento rispetto a quello della RTX 2080 Ti, ma dopotutto ospita meno componenti.

L'alimentazione per esempio prevede un progetto convenzionale con 8 fasi per la GPU e 2 per la memoria. In questo caso non sono necessari i trucchetti fatti con l'ammiraglia. Sei delle otto fasi della GPU (e le due per la memoria) sono alimentate tramite connettori ausiliari, mentre altre due sono legate allo slot PCIe.

Il controller PWM responsabile per le fasi di alimentazione della GPU è montato sul retro, mentre quello legato ai moduli di memoria Micron GDDR6 è rivolto verso l'alto, sotto un connettore PCIe. Le fasi legate alla memoria sono anch'esse nella parte superiore, accanto agli induttori ad elevata induttanza.