Introduzione
Sono passati due anni da quando Nvidia presentò le prime schede grafiche della serie RTX, cioè la RTX 2080 e RTX 2080 Ti. Non sono stati due anni facili per Nvidia, a cui dobbiamo riconoscere la tenacia dell’aver creduto in un progetto che oggi sta dando i suoi frutti: nel 2018 il Ray Tracing era qualcosa di sconosciuto ai più, e nonostante Nvidia non abbia inventato nulla di nuovo, è stata in grado di spingere l’adozione di una tecnica di rendering praticamente inutilizzata fino a quel momento nell’industria videoludica. Ricordiamo che il Ray Tracing è una tecnica già usata ampiamente nel mondo della grafica, ma quello che ha fatto Nvidia è renderla utilizzabile in tempo reale.
Nonostante ciò, dobbiamo ammetterlo, il Ray Tracing ha fatto molta fatica ad attecchire nell’industria. Abbiamo passato mesi ad avere solo una manciata di videogiochi compatibili, e le prestazioni di questi giochi, una volta attivato il Ray Tracing, erano tutt’altro che buone. Ma l’abbinata con il DLSS, in grado di migliorare le prestazioni grafiche mantenendo pressoché inalterata la qualità (o addirittura migliorandola in alcuni casi), hanno permesso a Nvidia di rendere la sua offerta di schede grafiche RTX sempre più alettante, mese dopo mese.
Se non sapete cos’è il Ray Tracing, potete approfondire l’argomento a questo link: Cos'è il Ray Tracing, il nuovo mantra delle GPU Gaming
Il Ray Tracing è qui, ed è qui per rimanere, su questo non c’è dubbio. Ad oggi Nvidia è la scelta migliore in questo campo, e possiamo già dire che, dati alla mano, il PC Gaming rimarrà imbattuto in questo contesto. Certamente dobbiamo ancora attendere la risposta di AMD, ma per ora questa è la situazione.
Per anticipare una possibile critica, vi diciamo fin da subito che il Ray Tracing, nonché il DLSS, sono ancora qualcosa di nicchia se consideriamo unicamente i numeri. Ad oggi è possibile accedere a una ventina di videogiochi, all’incirca, che permettono l’abilitazione del Ray Tracing, e una parte di questi permette solo l’abilitazione del DLSS. Tuttavia sono stati annunciati diversi aggiornamenti e molti nuovi giochi AAA offriranno il Ray Tracing fin dal primo giorno, tra cui Cyberpunk 2077.
Se non sapete cos’è il DLSS, potete approfondire l’argomento a questo link: Cos'è il DLSS 2.0
La possibilità delle nuove console di gestire il Ray Tracing spingerà tutti gli sviluppatori a utilizzare questa tecnica nei futuri titoli, nonché l’aggiornamento di titoli già disponibili, come abbiamo visto ad esempio con Minecraft o Fortnite. Insomma, è vero che al momento si tratta ancora di una manciata di titoli rispetto alla totalità dell’offerta videoludica, ma è anche vero che facciamo molta fatica a immaginare un futuro dove i titoli AAA (e non solo), non offrano la compatibilità al Ray Tracing e il DLSS.
Lo ripetiamo, il Ray Tracing è qui, ed è qui per rimanere.
La serie RTX 3000
Con la serie RTX 3000, Nvidia ha stupito, quantomeno per un motivo: il prezzo. Siamo stati abituati a considerare la serie RTX come qualcosa di “premium”, per cui era necessario pagare un prezzo molto alto. Un prezzo totalmente ingiustificato in una situazione dove i videogiochi che offrivano il Ray Tracing erano una manciata, o dove le prestazioni erano molto altalenanti.
Oggi Nvidia gode di un supporto dagli sviluppatori più esteso, come abbiamo detto, e avrebbe potuto vendere le nuove RTX 3000 agli stessi prezzi salati di due anni fa, offrendo ugualmente schede con un valore percepito migliore rispetto a quanto è stato per la serie 2000. Ma per nostra fortuna, Nvidia ha rivisto anche i prezzi, aumentando a dismisura il valore dell’attuale offerta RTX.
Non fraintendeteci, non costano poco, ma costano decisamente meno rispetto a quanto prevedibile. Probabilmente se avete acquistato una RTX 2080 Ti negli ultimi mesi a 1300 euro, ora sarete veramente arrabbiati nello scoprire che la nuova RTX 3080, a quasi la metà del prezzo, offre prestazioni migliori. E non possiamo certo non essere solidali con voi. Al contrario saranno molto felici coloro che hanno risparmiato fino ad ora, e potranno acquistare una RTX 3080 allo stesso prezzo di una 2080, ma godere del doppio delle prestazioni. Questi sono i dati comunicati da Nvidia, e fra poco scopriremo se i dati prestazionali reali combaciano con quelli indicati dall'azienda, o se quest’ultima è stata un po’ troppo generosa con la sua comunicazione.
In questo articolo ci occupiamo unicamente della RTX 3080, poiché la RTX 3070 e la RTX 3090 non sono ancora disponibili.
Le novità tecnologiche
La serie RTX 3000 porta con se i molti miglioramenti introdotti nell’architettura Ampere, dagli Streaming Multiprocessor potenziati, ai Tensor Core di terza generazione, gli RT Core di seconda generazione e l’abbinamento alla memoria GDDR6X.
La nuova GPU è prodotta con il processo produttivo a 8nm di Samsung, e conta 28 miliardi di transistor. Uno dei cambiamenti introdotti negli SM di Ampere è la loro capacità di gestire operazioni FP32 (il doppio rispetto a Turing), che assieme a un nuovo datapath per operazioni FP32 e INT32, risultano in una capacità di eseguire 128 FP32 operazioni per clock (combinando le quattro partizioni). Le operazioni Ray Tracing beneficiano molto di questo miglioramento e ciò porta a un incremento esponenziale delle prestazioni in questo ambito; addirittura i carichi Ray Tracing più pesanti sono quelli che mostreranno i migliori benefici.
Tutti e tre le tipologie di processori implementati in Ampere sono stati migliorati, come accennato. Dagli Shader programmabili (unità di rendering base), che ora offrono una capacità di calcolo quasi tripla rispetto a Turing (30 Teraflops contro gli 11 di Turing), agli RT Core di seconda generazione che generano capacità di calcolo di 58 Teraflops (contro i 34 Tflops di Turing), ai Tensor Core di nuova generazione che sono in grado di ottimizzare il carico di lavoro portando la potenza di calcolo dagli 89 TeraFlops a ben 238 Teraflops.
Tra i dati dichiarati da Nvidia probabilmente quello relativo al DLSS è il più impressionante, nonostante questa tecnologia non abbia ricevuto la stessa attenzione dedicata al Ray Tracing. Forse è per via della difficoltà tecnica stessa del suo funzionamento, tuttavia crediamo che il DLSS sia una delle soluzione più innovative degli ultimi anni. Vi invitiamo a leggere il nostro approfondimento sul DLSS, poiché è la chiave per ottenere prestazioni elevate ad alte risoluzioni.
Nvidia ha mostrato nell’immagine qui sotto come i “tre processori” possono assieme migliorare le prestazioni, calcolando il tempo di rendering dei singoli frame. La stessa scena (un frame) calcolata con le unità shader classiche impiegherebbe 51ms (valore che corrisponde a circa 19,6 FPS). Lo stesso frame, calcolato utilizzando anche gli RT Core viene renderizzato in 20ms (50 FPS). Se si aggiunge all’equazione l’applicazione del DLSS, tramite i Tensor Core, tale valore scende a 12ms, cioè 83 FPS. Stiamo parlando di un valore quattro volte superiore a quanto un calcolo shader classico è in grado di fare. Ovviamente stiamo parlando di una scena in Ray Tracing.
Con l'arrivo delle nuove RTX 3000 Nvidia ha anche introdotto un nuovo connettore di alimentazione a 12 pin, più piccolo degli attuali 8 pin. Non si tratta di un nuovo standard e non dovrete cambiare alimentatore, state tranquilli: nella confezione del modello Founders Edition Nvidia include un adattatore che permette di utilizzare due classici 8 pin. Alcuni produttori di alimentatori forniranno gratuitamente dei cavi 12 pin, ma il nuovo connettore non è obbligatorio, quindi alcuni modelli custom potrebbero utilizzare ancora i connettori classici. Se decideranno di adottare il nuovo standard, i produttori includeranno un adattatore nella confezione, quindi - lo ripetiamo - non avrete problemi.
Memoria GDDR6X
Le nuove RTX 3000 sono dotate di memoria GDDR6X, collegate a un bus di comunicazione di 320 bit, che permette di raggiungere una velocità di trasferimento dati di 19Gbps (il 40% in più rispetto a Turing).
La memoria è sviluppata da Micron, e utilizza quello che è chiamato PAM4 (Pulse Amplitude Modulation), che rappresenta un grande miglioramento rispetto al PAM2 (NRZ). Quest’ultimo basa il funzionamento su una tecnica di modulazione a due livelli di voltaggio (0 e 1 in linguaggio binario), mentre il PAM4 utilizza quattro livelli di voltaggio rappresentando le combinazioni di due bit logici (11, 10, 01 e 00). La conseguenza più chiara è la duplicazione della densità dei dati trasmessi, portando la GDDR6X a trasmettere, nell’unità di clock, il doppio dei dati rispetto alle GDDR6.
Il vantaggio nei termini pratici si può ottenere principalmente nei carichi di lavoro molto affamati di dati, come l’inferenza con intelligenza artificiale (deep learning), il rendering video 8K e, appunto, le operazioni di Ray Tracing.
RTX IO
RTX IO è una nuova API che permette di sgravare la CPU dai carichi di lavoro per la decompressione dei dati richiesta dai videogiochi moderni. Gli sviluppatori tendono a comprimere i dati dei giochi, per una questione pratica di dimensioni e risorse dei sistemi moderni, ma ciò implica il fatto che il lavoro di decompressione mette sotto elevato carico il processore. Normalmente i dati vengono prelevati dall’hard disk e caricati nella memoria del sistema (RAM), per poi essere gestiti dalla CPU e successivamente “recuperati” dalla scheda grafica e memorizzati nella memoria grafica.
RTX IO permette di sgravare la CPU e la memoria di sistema dal lavoro, lasciando che sia la GPU a effettuare tutti i lavori di decompressione e caricamento diretto nella memoria grafica. Questa API permetterà di sfruttare i nuovi SSD PCIe di quarta generazione, che sono in grado di offrire velocità di trasferimento dati che arrivano fino a 7 GB al secondo.
Al momento questa tecnologia non può ancora essere sfruttata, in quanto necessita dell'API Microsoft DirectStorage (una componente di DirectX), non ancora disponibile. Vedremo quindi i primi benefici di RTX IO in futuro, non appena l'API sarà disponibile e gli sviluppatori inizieranno a implementare la funzione all'interno dei videogiochi. Non possiamo quindi al momento dare alcuna valutazione dell’efficienza di questa soluzione e come impatterà sui giochi, ma possiamo immaginare che i principali benefici riguarderanno i tempi di caricamento o i giochi open-world dove il caricamento del mondo continuo richiede la gestione di una grande quantità di dati.
Nvidia Reflex
Nvidia è da tempo che comunica l’importanza di generare un’elevata quantità di frame nei giochi competitivi, e come è possibile trarne vantaggio. Tuttavia una quantità elevata di FPS non è l’unico ingrediente per essere vincenti, secondo Nvidia, poiché anche la reattività del PC, o in altri termini la latenza del sistema, può fare la differenza e migliorare le prestazioni di mira di un giocatore.
Nvidia Reflex si pone quindi l’obiettivo di ridurre la latenza del sistema, combinando ottimizzazioni a livello di GPU e videogiochi. L’SDK Reflex permette di controllare i tempi in cui la CPU invia il lavoro di rendering alla GPU, evitando di creare un’inutile coda di lavoro, in un certo modo sincronizzando le attività della CPU e della GPU. L’approccio è simile alla modalità Ultra Low Latency attivabile dai driver, ma in questo caso dovrebbe essere più efficiente poiché il controllo avviene a livello di motore grafico.
Inoltre il clock della GPU viene controllato e aumentato quando necessario per inviare il frame al monitor leggermente prima, risparmiando qualche millisecondo e quindi diminuendo la latenza. Anche in questo caso si parla di un’ottimizzazione della funzione “Prefer Maximum Perfomance” attivabile oggi dai driver.
I futuri monitor G-Sync a 360Hz integreranno dei circuiti (Nvidia Reflex Latency Analyzer) che permetteranno di collegare il mouse direttamente al monitor per visualizzare i parametri di latenza. Una volta fatto ciò sarà possibile intervenire su dei parametri di configurazione del gioco fino a ottenere i valori di latenza minimi possibili, aumentando di conseguenza le chance di maggiore precisione.
Nel grafico qui sopra potete vedere i miglioramenti che secondo Nvidia si possono ottenere in alcuni giochi competitivi. Non appena saranno disponibili monitor compatibili approfondiremo con test specifici.
Nvidia Broadcast
Facciamo solo un accenno a Nvidia Broadcast, una serie di strumenti che va oltre le prestazioni grafiche, a cui è possibile accedere tramite le GPU RTX della serie 3000. Grazie all’encoder Nvidia è possibile abilitare un effetto green screen in tempo reale senza l’utilizzo di uno sfondo verde; algoritmi di IA riconoscono la persona inquadrata dalla webcam e rimuovono dinamicamente lo sfondo, sostituendolo con un’altra immagine.
È possibile sfruttare la scheda grafica per rimuovere i rumori di fondo durante una videochiamata, mentre con la funzione “auto frame” è possibile tenere inquadrato il soggetto mentre si muove. Approfondiremo l’argomento in un articolo dedicato.