GeForce GTX 680, specifiche tecniche

Test - Recensione della GeForce GTX 680 di Nvidia con GPU GK104 Kepler a 28 nanometri.

Avatar di Andrea Ferrario

a cura di Andrea Ferrario

Editor in Chief

GeForce GTX 680, specifiche tecniche

La GPU GK104 è posizionata al centro della scheda; è composta da 3,54 miliardi di transistor, impacchettati in un die da 294 mm2. Ancora una volta l'azienda si posiziona tra i due modelli concorrenti, la GPU Tahiti da 365 mm2 composta da 4,31 miliardi di transistor e la Pictairn, grande 212 mm2 e composta da 2,8 miliardi di transistor.

Molti clienti di TSMC si stanno lamentano della bassa ressa produttiva, e immaginiamo che per il GK104 (prodotto a 28) ci sia lo stesso problema. Detto questo, l'azienda ci ha assicurato che le schede saranno disponibili alla presentazione, con una seconda ondata di schede in arrivo per l'inizio di aprile. Diamo ora un'occhiata alle specifiche della GPU a confronto con la GeForce GTX 580 e la Radeon HD 7970 di AMD:

  GeForce GTX 680 Radeon HD 7950 Radeon HD 7970 GeForce GTX 580
Shader 1536 1792 2048 512
Texture Unit 128 112 128 64
Full Color ROPs 32 32 32 48
Frequenza GPU 1006 MHz 800 MHz 925 MHz 772 MHz
Texture Fillrate 128.8 Gtex/s 89.6 Gtex/s 118.4 Gtex/s 49.4 Gtex/s
Frequenza memoria 1502 MHz 1250 MHz 1375 MHz 1002 MHz
Bus 256-bit 384-bit 384-bit 384-bit
Bandwidth memoria 192.3 GB/s 240 GB/s 264 GB/s 192.4 GB/s
RAM grafica 2 GB GDDR5 3 GB GDDR5 3 GB GDDR5 1.5 GB GDDR5
Die Size 294 mm2 365 mm2 365 mm2 520 mm2
Transistor (Billion) 3.54 4.31 4.31 3
Processo produttivo 28 nm 28 nm 28 nm 40 nm
Connettori alimentazione 2 x 6-pin 2 x 6-pin 1 x 8-pin, 1 x 6-pin 1 x 8-pin, 1 x 6-pin
TDP 195 W 200 W 250 W 244 W
Prezzo 499 euro 379 euro 499 euro 400 euro

La GPU GK104 è divisa in quattro Graphics Processing Cluster (GPC), ognuno dei quali contiene due Streaming Multiprocessor (SMX). Potremmo ripercorrere l'evoluzione fin dall'originale GF100, ma il modo più semplice per capire i miglioramenti è un confronto con il GF104, alla base della GeForce GTX 460.

Clicca per ingrandire

Il GK104 dispone di quattro warp scheduler (prima erano due), di otto dispatch unit (prima quattro), e di 16 texture unit (prima otto) per Shader Multiprocessor, assieme a un registro file due volte più grande. Anche i CUDA core sono aumentati, di quattro volte. Il GF104 include 48 shader per SM, mentre il GK104 arriva a 192 shader per SMX.

Per SM: GF104 GK104 Rapporto
CUDA Core

48 192 4x
Special Function Unit 8 32 4x
Load/Store

16 32 2x
Texture Unit 8 16 2x
Warp Scheduler

2 4 2x
Geometry Engine

1 1 1x

Perché quadruplicare il numero di CUDA core e duplicare le altre risorse? Gli shader di Kepler funzionano alla frequenza del processore (1:1). Le architetture precedenti (tutte fino al G80) impostavano gli shader alla frequenza doppia del core (2:1). Duplicare il throughput degli shader a una certa velocità richiede quattro volte il numero di core, funzionanti a metà velocità.

La domanda quindi diventa: perché Nvidia ha limitato la velocità di clock degli shader? Tutto è da ricercare nel delicato bilanciamento di prestazioni, potenza e spazio fisico sul die. Fermi permetteva a Nvidia di ottimizzare il chip in base all'area usata. Meno core occupano meno spazio, dopotutto, ma facendoli funzionare al doppio della velocità, l'energia richiesta è molto più alta. 

Kepler, d'altra parte, è finalizzato all'efficienza. Dimezzando il clock degli shader si limita il consumo energetico. Prestazioni confrontabili richiedono tuttavia un data path doppio. Il risultato è che Kepler baratta la dimensione del die per una riduzione di consumo della parte logica, e un risparmio più significativo derivante dalla diminuzione della velocità di clock.

Leggi altri articoli