GeForce GTX 680 alle prese con la tessellation
L'area del die e il consumo energetico sono stati limitati eliminando alcune strutture hardware adibite allo scheduling, e affidando questo lavoro al software. Così si libera spazio per altri elementi in grado di portare maggiori benefici alle prestazioni.
Nvidia afferma che i cambiamenti apportati all'architettura SMX permettono, in teoria, di duplicare le prestazioni per watt, in raffronto al predecessore di Kepler - lo vedremo a breve. Moltiplicando i dati per un totale di 8 SMX, ecco cosa otteniamo: 1536 CUDA core, 128 texture unit e otto geometry engine. Ma dove sono finiti gli otto PolyMorph engine del GF104?
Nvidia dice che il PolyMorph engine è stato riprogettato per offrire il doppio delle prestazioni per clock rispetto alla logica a funzione fissa presente in Fermi. Vediamo nel mondo reale cosa significa con HAWX 2:
In termini assoluti, la GeForce GTX 680 può battere la Radeon HD 7970 e la HD 7950, con o senza tessellation. La nuova scheda di Nvidia tocca il 31% di prestazioni in più quando si attiva la tesselation; la GPU Tahiti segna un +16%.
Per supportare il throughput teoricamente più alto delle unità che gestiscono la geometria, Nvidia ha duplicato il numero dei raster engine rispetto al GF104, portandoli a un rapporto 1:1 con le partizioni ROP.
Per quanto riguarda la memoria, la GeForce GTX 460 includeva 1 GB di memoria GDDR5 a 900 MHz, che equivale a un throughput di 115,2 GB/sec. La GeForce GTX 580, con la sua memoria GDDR5 a 1002 MHz e bus a 384 bit, genera un througput di 192.4 GB/sec. La GeForce GTX 680 è dotata di 2GB di GDDR5 a 1502 MHz, e perciò si ottiene una banda passante molto simile: 192.26 GB/sec.