TU104 e GeForce RTX 2080

Com'è fatta la GPU Nvidia TU104 Turing

In modo simile al TU102 anche il TU104 è prodotto da TSMC con processo a 12 nanometri FinFET. Il suo minor numero di transistor, pari a 13,6 miliardi, porta ad avere un die più piccolo di 545 mm2. Già, piccolo ma per modo di dire. TU104 è comunque più grande di GP102 (471 mm2) e ha una dimensione simile al GK110 del 2013 a bordo della GeForce GTX Titan.

gpu tu104 turing diagramma — Clicca per ingrandire

TU104 è realizzato con gli stessi blocchi fondamentali del TU102; ne ha solo di meno. Gli Streaming Multiprocessors hanno ancora 64 CUDA core, otto Tensor core, un RT core, quattro unità texture, 16 unità load/store, 256 KB di spazio di registro e 96 KB di cache L1/memoria condivisa. I TPC sono ancora formati da due SM e un PolyMorph geometry engine. Qui però troviamo quattro TPC per GPC e sei GPC in tutto il processore. Perciò un TU104 completamente abilitato ha 48 SM, 3072 CUDA core, 384 Tensor core, 48 RT core, 192 unità texture e 24 PolyMorph engine.

Un backend allo stesso modo limitato nelle risorse alimenta le risorse di calcolo tramite otto controller di memoria a 32 bit GDDR6 (256 bit totali) collegati a 64 ROPs e 4 MB di cache L2.

TU104 perde anche un collegamento NVLink, il che lo limita a un collegamento x8 e 50 GB/s di throughput bidirezionale.

Specifiche tecniche TU104 a bordo della RTX 2080

Dopo aver visto la RTX 2080 Ti offrire prestazioni rispettabili in Battlefield V in Full HD con ray tracing attivo non possiamo che domandarci se la RTX 2080 abbia sufficiente potenza per mantenere frame rate giocabili con il ray tracing attivo.

Un TU104 completo è limitato a 48 RT core rispetto ai 68 del TU102. Poiché però Nvidia ha spento un TPC di TU104 per creare la GeForce RTX 2080, si perdono un altro paio di RT core (insieme a 128 CUDA core, otto TMU, 16 Tensor core e così via).

	GeForce RTX 2080 FE	GeForce GTX 1080 FE
Architettura (GPU)	Turing (TU104)	Pascal (GP104)
CUDA core	2944	2560
Potenza FP32 di picco	10.6 TFLOPS	8.9 TFLOPS
Tensor Core	368	-
RT Core	46	-
Unità texture	184	160
Freq. base GPU	1515 MHz	1607 MHz
Freq. GPU Boost	1800 MHz	1733 MHz
Memoria	8GB GDDR6	8GB GDDR5X
Bus	256-bit	256-bit
Bandwidth memoria	448 GB/s	320 GB/s
ROPs	64	64
Cache L2	4MB	2MB
TDP	225W	180W
Numero transistor	13,6 miliardi	7,2 miliardi
Dimensione die	545 mm²	314 mm²
Supporto SLI	Sì (x8 NVLink)	Sì (MIO)

La GeForce RTX 2080 conta quindi su 46 SM con 2944 CUDA core, 368 Tensor core, 46 RT core, 184 unità texture, 64 ROPs e 4 MB di cache L2. 8 GB di memoria GDDR6 a 14 Gbps su un bus a 256 bit spostano 448 GB/s di dati, aggiungendo oltre 100 GB/s di bandwidth rispetto alla GTX 1080.

Le RTX 2080 di riferimento e la Founders Edition hanno una frequenza base di 1515 MHz. Il modello overcloccato di Nvidia ha un GPU Boost a 1800 MHz, mentre la specifica di riferimento è 1710 MHz. Le prestazioni di calcolo di picco FP32 arrivano a 10,6 TFLOPs, un valore che pone la GeForce RTX 2080 Founders Edition dietro la GeForce GTX 1080 Ti (11,3 TFLOPS), ma ben davanti alla GeForce GTX 1080 (8,9 TFLOPS).

Come già visto per la RTX 2080 Ti, anche nel caso della RTX 2080 il modello Founders Edition, più veloce, richiede più energia. Il suo TDP di 225 W è 10 W più alto della GeForce RTX 2080 di riferimento e 45 W sopra alla GeForce GTX 1080.