GeForce GTX 680, specifiche tecniche

La GPU GK104 è posizionata al centro della scheda; è composta da 3,54 miliardi di transistor, impacchettati in un die da 294 mm2. Ancora una volta l'azienda si posiziona tra i due modelli concorrenti, la GPU Tahiti da 365 mm2 composta da 4,31 miliardi di transistor e la Pictairn, grande 212 mm2 e composta da 2,8 miliardi di transistor.

Molti clienti di TSMC si stanno lamentano della bassa ressa produttiva, e immaginiamo che per il GK104 (prodotto a 28) ci sia lo stesso problema. Detto questo, l'azienda ci ha assicurato che le schede saranno disponibili alla presentazione, con una seconda ondata di schede in arrivo per l'inizio di aprile. Diamo ora un'occhiata alle specifiche della GPU a confronto con la GeForce GTX 580 e la Radeon HD 7970 di AMD:

	GeForce GTX 680	Radeon HD 7950	Radeon HD 7970	GeForce GTX 580
Shader	1536	1792	2048	512
Texture Unit	128	112	128	64
Full Color ROPs	32	32	32	48
Frequenza GPU	1006 MHz	800 MHz	925 MHz	772 MHz
Texture Fillrate	128.8 Gtex/s	89.6 Gtex/s	118.4 Gtex/s	49.4 Gtex/s
Frequenza memoria	1502 MHz	1250 MHz	1375 MHz	1002 MHz
Bus	256-bit	384-bit	384-bit	384-bit
Bandwidth memoria	192.3 GB/s	240 GB/s	264 GB/s	192.4 GB/s
RAM grafica	2 GB GDDR5	3 GB GDDR5	3 GB GDDR5	1.5 GB GDDR5
Die Size	294 mm2	365 mm2	365 mm2	520 mm2
Transistor (Billion)	3.54	4.31	4.31	3
Processo produttivo	28 nm	28 nm	28 nm	40 nm
Connettori alimentazione	2 x 6-pin	2 x 6-pin	1 x 8-pin, 1 x 6-pin	1 x 8-pin, 1 x 6-pin
TDP	195 W	200 W	250 W	244 W
Prezzo	499 euro	379 euro	499 euro	400 euro

La GPU GK104 è divisa in quattro Graphics Processing Cluster (GPC), ognuno dei quali contiene due Streaming Multiprocessor (SMX). Potremmo ripercorrere l'evoluzione fin dall'originale GF100, ma il modo più semplice per capire i miglioramenti è un confronto con il GF104, alla base della GeForce GTX 460.

Clicca per ingrandire

Il GK104 dispone di quattro warp scheduler (prima erano due), di otto dispatch unit (prima quattro), e di 16 texture unit (prima otto) per Shader Multiprocessor, assieme a un registro file due volte più grande. Anche i CUDA core sono aumentati, di quattro volte. Il GF104 include 48 shader per SM, mentre il GK104 arriva a 192 shader per SMX.

Per SM:	GF104	GK104	Rapporto
CUDA Core	48	192	4x
Special Function Unit	8	32	4x
Load/Store	16	32	2x
Texture Unit	8	16	2x
Warp Scheduler	2	4	2x
Geometry Engine	1	1	1x

Perché quadruplicare il numero di CUDA core e duplicare le altre risorse? Gli shader di Kepler funzionano alla frequenza del processore (1:1). Le architetture precedenti (tutte fino al G80) impostavano gli shader alla frequenza doppia del core (2:1). Duplicare il throughput degli shader a una certa velocitÃ richiede quattro volte il numero di core, funzionanti a metÃ velocitÃ .

La domanda quindi diventa: perché Nvidia ha limitato la velocitÃ di clock degli shader? Tutto è da ricercare nel delicato bilanciamento di prestazioni, potenza e spazio fisico sul die. Fermi permetteva a Nvidia di ottimizzare il chip in base all'area usata. Meno core occupano meno spazio, dopotutto, ma facendoli funzionare al doppio della velocitÃ , l'energia richiesta è molto più alta.

Kepler, d'altra parte, è finalizzato all'efficienza. Dimezzando il clock degli shader si limita il consumo energetico. Prestazioni confrontabili richiedono tuttavia un data path doppio. Il risultato è che Kepler baratta la dimensione del die per una riduzione di consumo della parte logica, e un risparmio più significativo derivante dalla diminuzione della velocitÃ di clock.