GeForce GTX 680, specifiche tecniche
La GPU GK104 è posizionata al centro della scheda; è composta da 3,54 miliardi di transistor, impacchettati in un die da 294 mm2. Ancora una volta l'azienda si posiziona tra i due modelli concorrenti, la GPU Tahiti da 365 mm2 composta da 4,31 miliardi di transistor e la Pictairn, grande 212 mm2 e composta da 2,8 miliardi di transistor.
Molti clienti di TSMC si stanno lamentano della bassa ressa produttiva, e immaginiamo che per il GK104 (prodotto a 28) ci sia lo stesso problema. Detto questo, l'azienda ci ha assicurato che le schede saranno disponibili alla presentazione, con una seconda ondata di schede in arrivo per l'inizio di aprile. Diamo ora un'occhiata alle specifiche della GPU a confronto con la GeForce GTX 580 e la Radeon HD 7970 di AMD:
GeForce GTX 680 | Radeon HD 7950 | Radeon HD 7970 | GeForce GTX 580 | |
---|---|---|---|---|
Shader | 1536 | 1792 | 2048 | 512 |
Texture Unit | 128 | 112 | 128 | 64 |
Full Color ROPs | 32 | 32 | 32 | 48 |
Frequenza GPU | 1006 MHz | 800 MHz | 925 MHz | 772 MHz |
Texture Fillrate | 128.8 Gtex/s | 89.6 Gtex/s | 118.4 Gtex/s | 49.4 Gtex/s |
Frequenza memoria | 1502 MHz | 1250 MHz | 1375 MHz | 1002 MHz |
Bus | 256-bit | 384-bit | 384-bit | 384-bit |
Bandwidth memoria | 192.3 GB/s | 240 GB/s | 264 GB/s | 192.4 GB/s |
RAM grafica | 2 GB GDDR5 | 3 GB GDDR5 | 3 GB GDDR5 | 1.5 GB GDDR5 |
Die Size | 294 mm2 | 365 mm2 | 365 mm2 | 520 mm2 |
Transistor (Billion) | 3.54 | 4.31 | 4.31 | 3 |
Processo produttivo | 28 nm | 28 nm | 28 nm | 40 nm |
Connettori alimentazione | 2 x 6-pin | 2 x 6-pin | 1 x 8-pin, 1 x 6-pin | 1 x 8-pin, 1 x 6-pin |
TDP | 195 W | 200 W | 250 W | 244 W |
Prezzo | 499 euro | 379 euro | 499 euro | 400 euro |
La GPU GK104 è divisa in quattro Graphics Processing Cluster (GPC), ognuno dei quali contiene due Streaming Multiprocessor (SMX). Potremmo ripercorrere l'evoluzione fin dall'originale GF100, ma il modo più semplice per capire i miglioramenti è un confronto con il GF104, alla base della GeForce GTX 460.
Clicca per ingrandire
Il GK104 dispone di quattro warp scheduler (prima erano due), di otto dispatch unit (prima quattro), e di 16 texture unit (prima otto) per Shader Multiprocessor, assieme a un registro file due volte più grande. Anche i CUDA core sono aumentati, di quattro volte. Il GF104 include 48 shader per SM, mentre il GK104 arriva a 192 shader per SMX.
Per SM: | GF104 | GK104 | Rapporto |
---|---|---|---|
CUDA Core
| 48 | 192 | 4x |
Special Function Unit | 8 | 32 | 4x |
Load/Store
| 16 | 32 | 2x |
Texture Unit | 8 | 16 | 2x |
Warp Scheduler
| 2 | 4 | 2x |
Geometry Engine
| 1 | 1 | 1x |
Perché quadruplicare il numero di CUDA core e duplicare le altre risorse? Gli shader di Kepler funzionano alla frequenza del processore (1:1). Le architetture precedenti (tutte fino al G80) impostavano gli shader alla frequenza doppia del core (2:1). Duplicare il throughput degli shader a una certa velocità richiede quattro volte il numero di core, funzionanti a metà velocità .
La domanda quindi diventa: perché Nvidia ha limitato la velocità di clock degli shader? Tutto è da ricercare nel delicato bilanciamento di prestazioni, potenza e spazio fisico sul die. Fermi permetteva a Nvidia di ottimizzare il chip in base all'area usata. Meno core occupano meno spazio, dopotutto, ma facendoli funzionare al doppio della velocità , l'energia richiesta è molto più alta.
Kepler, d'altra parte, è finalizzato all'efficienza. Dimezzando il clock degli shader si limita il consumo energetico. Prestazioni confrontabili richiedono tuttavia un data path doppio. Il risultato è che Kepler baratta la dimensione del die per una riduzione di consumo della parte logica, e un risparmio più significativo derivante dalla diminuzione della velocità di clock.