La GeForce RTX 2080 Ti è veloce e nessuno può dire il contrario, ma fin dall'annuncio un elemento di dibattito è apparso il prezzo di lancio. La Founders Edition che recensiamo in questo articolo è venduta a 1279 euro, mentre la precedente portabandiera GTX 1080 Ti arrivò sul mercato a 835 euro.
Stiamo parlando di una differenza di 444 euro o del 53,1% se preferite. Forse la cosa che delude di più è quindi che mediamente la RTX 2080 Ti è il 26% più veloce della soluzione di punta precedente nella nostra suite di 13 giochi testati in 4K.
Ma cosa pensereste se vi dicessimo che batte anche la Titan V? In Battlefield 1, la GeForce RTX 2080 Ti è il 20% più veloce. In Forza Motorsport 7, la 2080 Ti ha un vantaggio del 22%. In base alle specifiche tecniche delle due schede, non ci aspettavamo un risultato così netto. Anche se la Titan V con GPU GV100 e prezzo di 3200 euro è pensata per il deep learning e non per il gaming, quei risultati sicuramente aiutano a dare un contesto ai 1279 euro della RTX 2080 Ti.
Ancora più importante per il crescente gruppo di appassionati con monitor 4K, la GeForce RTX 2080 Ti offre prestazioni giocabili a 3840x2160 senza sacrificare le impostazioni di dettaglio . Sì, abbiamo disattivato modalità di anti-aliasing molto pesanti per goderci il 4K, ma i nostri test mostrano che è possibile giocare ad alta risoluzione e qualità a più di 60 FPS in ogni singolo gioco.Era un traguardo atteso da anni. La GeForce GTX 980 Ti consentiva prestazioni giocabili in 4K ma riducendo i dettagli. La GTX 1080 si avvicinava all'obiettivo, ma non garantiva la fluidità giusta per prestazioni giocabili al massimo della qualità. La GTX 1080 Ti ci ha messo ancora più in crisi, arrivando veramente a un soffio dal fare centro. Eravamo propensi a dichiararla la scheda per il 4K al top dei dettagli, ma siamo contenti di non averlo fatto. È la GeForce RTX 2080 Ti la prima a permettere di giocare in 4K a dettagli Ultra.
TU102, nato per la fascia alta
In che modo la GeForce RTX 2080 Ti raggiunge queste prestazioni?Per farla breve, l'oggetto principale di questa recensione è basato sulla GPU TU102, un chip da 754 mm2 composto da 18,6 miliardi di transistor prodotti con processo a 12nm FinFET. Al suo interno ritroviamo un'elevata quantità di risorse che operano in modo più efficiente rispetto a quanto visto in passato.
Un processore TU102 completo è dotato di sei Graphics Processing Clusters (GPCs) composti da un Raster Engine e sei Texture Processing Clusters (TPCs). Ogni TPC integra un PolyMorph Engine (pipeline geometrica a funzione fissa) e due Streaming Multiprocessors (SMs). A livello degli SM abbiamo 64 CUDA core, otto Tensor core, un RT core, quattro unità texture, 16 unità load/store, uno spazio per il file di registro di 256 KB, quattro cache L0 instruction e 96 KB di memoria configurabili come cache L1 o memoria condivisa.Sommando il tutto si ottengono: 72 SM, 4608 CUDA core, 576 Tensor core, 72 RT core, 288 unità texture e 36 PolyMorph engine. Queste risorse sono alimentate da 12 controller di memoria GDDR6 a 32 bit, ognuno collegato a otto cluster ROP e 512 KB di cache L2 per un bus di memoria complessivo di 384 bit, 96 ROPs e 6 MB di cache L2. Ogni SM contiene anche un paio di CUDA core FP64, il che porta le prestazioni a doppia precisione a un trentaduesimo delle prestazioni FP32 di TU102.
GeForce RTX 2080 Ti FE | GeForce RTX 2080 FE | GeForce GTX 1080 Ti FE | GeForce GTX 1080 FE | |
---|---|---|---|---|
Architettura (GPU) | Turing (TU102) | Turing (TU104) | Pascal (GP102) | Pascal (GP104) |
CUDA Core | 4352 | 2944 | 3584 | 2560 |
Potenza FP32 di picco | 14.2 TFLOPS | 10.6 TFLOPS | 11.3 TFLOPS | 8.9 TFLOPS |
Tensor Core | 544 | 368 | - | - |
RT Core | 68 | 46 | - | - |
Texture Unit | 272 | 184 | 224 | 160 |
Freq. base | 1350 MHz | 1515 MHz | 1480 MHz | 1607 MHz |
Freq. GPU Boost | 1635 MHz | 1800 MHz | 1582 MHz | 1733 MHz |
Memoria | 11GB GDDR6 | 8GB GDDR6 | 11GB GDDR5X | 8GB GDDR5X |
Bus | 352-bit | 256-bit | 352-bit | 256-bit |
Bandwidth memoria | 616 GB/s | 448 GB/s | 484 GB/s | 320 GB/s |
ROPs | 88 | 64 | 88 | 64 |
Cache L2 | 5.5MB | 4MB | 2.75MB | 2MB |
TDP | 260W | 225W | 250W | 180W |
Numero transistor | 18,6 miliardi | 13,6 miliardi | 12 miliardi | 7,2 miliardi |
Dimensione die | 754 mm² | 545 mm² | 471 mm² | 314 mm² |
Supporto SLI | Sì (x8 NVLink, x2) | Sì (x8 NVLink, x2) | Sì (MIO) | Sì (MIO) |
Specifiche tecniche TU102 a bordo della RTX 2080 Ti
Il TU102 a bordo della GeForce RTX 2080 Ti non è il processore nella veste completa. Che Nvidia volesse lasciare spazio a una futura Titan o che sia stata costretta a usare un chip meno potente a causa delle iniziali rese produttive, non lo sappiamo. Di fatto però la RTX 2080 Ti ha due TPC disabilitati, il che ci lascia con una scheda dotata di 4352 CUDA core, 544 Tensor core, 68 RT core, 544 unità texture e 34 PolyMorph engine.A questo si aggiunge il fatto che Nvidia ha disabilitato uno dei controller di memoria a 32 bit di TU102, creando un bus aggregato a 352 bit che sposta i dati verso 88 ROPs e 5,5 MB di cache L2. Nvidia accompagna la GPU con moduli di memoria Micron MT61K256M32JE-14:A. Sul PCB della RTX 2080 Ti ne contiamo 11, il che lascia un posto vacante.
Cionondimeno il bandwidth di picco teorico è aumentato in modo netto rispetto alle schede di precedente generazione a causa della maggiore velocità della GDDR6: a 14 Gbps su un'interfaccia a 352 bit avrete ben 616 GB/s. Di contro la GDDR5X a 11 Gbps sulla GeForce GTX 1080 Ti produce un bandwidth di 484 GB/s.
Per quanto riguarda la scheda in versione Founders Edition, abbiamo una frequenza base della GPU di 1350 MHz che sale fino a 1635 MHz in GPU Boost, fintanto che è assicurato un buon raffreddamento. E dato che Nvidia indica le prestazioni di picco avvalendosi della frequenza GPU Boost, la RTX 2080 Ti può garantire una potenza di 14,2 TFLOPs con calcoli a singola precisione.La frequenza è overcloccata rispetto alle specifiche di riferimento di Nvidia. Di conseguenza il modello Founders Edition ha un TDP leggermente più alto pari a 260 watt. Lo slot PCI Express, un connettore a 8 pin e uno a 6 pin dovrebbero essere teoricamente sufficienti ad alimentare la scheda, ma Nvidia ha scelto di dotarla di due connettori a 8 pin dando così alla sua GeForce RTX 2080 Ti Founders Edition margine per ulteriore overclock.Risalendo dai connettori PCIe verso l'alimentazione della GeForce RTX 2080 Ti contiamo tre fasi di alimentazione per la memoria GDDR6 e un corrispondente controller PWM. Secondo Nvidia le fasi totali sono 13, ma ne siamo davvero certi? Anche con sei raddoppiatori di fase mancherebbe una fase ad agire come bilanciatore del carico. I numeri non tornano.In realtà sembra che cinque fasi siano alimentate dai connettori a 8 pin e raddoppiate. Con due loop di controllo per fase, 5*2=10 circuiti di regolazione della tensione. Le rimanenti tre fasi alla sinistra della GPU sono alimentate dallo slot PCIe della scheda madre e non raddoppiate.Questo porta al numero 13, garantendo un'intelligente schema di distribuzione del carico. Ovviamente implementare tutto questo richiede i giusti componenti...
TU104 e GeForce RTX 2080
Anche se il focus di questa recensione è tutto sulla RTX 2080 Ti in quanto portabandiera della nuova serie RTX 20, nei grafici trovate anche i risultati della RTX 2080 FE, una scheda che ha un prezzo di listino di 869 euro sul sito di Nvidia (la GTX 1080 debuttò al prezzo di 800 euro circa). Ricapitoliamone quindi le caratteristiche principali, partendo dalla GPU, TU104.In modo simile al TU102, anche il TU104 è prodotto da TSMC con processo a 12 nanometri FinFET. Il suo minor numero di transistor, pari a 13,6 miliardi, porta ad avere un die più piccolo di 545 mm2. Già, piccolo ma per modo di dire. TU104 è comunque più grande di GP102 (471 mm2) e ha una dimensione simile al GK110 del 2013 a bordo della GeForce GTX Titan.TU104 è realizzato con gli stessi blocchi fondamentali del TU102; ne ha solo di meno. Gli Streaming Multiprocessors hanno ancora 64 CUDA core, otto Tensor core, un RT core, quattro unità texture, 16 unità load/store, 256 KB di spazio di registro e 96 KB di cache L1/memoria condivisa.I TPC sono ancora formati da due SM e un PolyMorph geometry engine. Qui però troviamo quattro TPC per GPC e sei GPC in tutto il processore. Perciò un TU104 completamente abilitato ha 48 SM, 3072 CUDA core, 384 Tensor core, 48 RT core, 192 unità texture e 24 PolyMorph engine.Un backend allo stesso modo limitato nelle risorse alimenta le risorse di calcolo tramite otto controller di memoria a 32 bit GDDR6 (256 bit totali) collegati a 64 ROPs e 4 MB di cache L2.TU104 perde anche un collegamento NVLink, il che lo limita a un collegamento x8 e 50 GB/s di throughput bidirezionale.
Specifiche tecniche TU104 a bordo della RTX 2080
Un TU104 completo è limitato a 48 RT core rispetto ai 68 del TU102. Poiché però Nvidia ha spento un TPC di TU104 per creare la GeForce RTX 2080, si perdono un altro paio di RT core (insieme a 128 CUDA core, otto TMU, 16 Tensor core e così via).
La GeForce RTX 2080 conta quindi su 46 SM con 2944 CUDA core, 368 Tensor core, 46 RT core, 184 unità texture, 64 ROPs e 4 MB di cache L2. 8 GB di memoria GDDR6 a 14 Gbps su un bus a 256 bit spostano 448 GB/s di dati, aggiungendo oltre 100 GB/s di bandwidth rispetto alla GTX 1080.
La RTX 2080 Founders Edition ha una frequenza base di 1515 MHz e un clock in GPU Boost a 1800 MHz. Le prestazioni di calcolo di picco FP32 arrivano a 10,6 TFLOPs, un valore che pone la GeForce RTX 2080 Founders Edition dietro la GeForce GTX 1080 Ti (11,3 TFLOPS), ma ben davanti alla GeForce GTX 1080 (8,9 TFLOPS).Il TDP della scheda è pari a 225 W, 45 W in più della GeForce GTX 1080. A ogni modo 225 watt sono abbastanza bassi da permettere a Nvidia di usare un connettore ausiliario a 6 pin e uno a 8 pin. Per quanto riguarda il PCB, c'è meno affollamento rispetto a quello della RTX 2080 Ti, ma dopotutto ospita meno componenti.L'alimentazione per esempio prevede un progetto convenzionale con 8 fasi per la GPU e 2 per la memoria. In questo caso non sono necessari i trucchetti fatti con l'ammiraglia. Sei delle otto fasi della GPU (e le due per la memoria) sono alimentate tramite connettori ausiliari, mentre altre due sono legate allo slot PCIe.
Il controller PWM responsabile per le fasi di alimentazione della GPU è montato sul retro, mentre quello legato ai moduli di memoria Micron GDDR6 è rivolto verso l'alto, sotto un connettore PCIe. Le fasi legate alla memoria sono anch'esse nella parte superiore, accanto agli induttori ad elevata induttanza.