All'evento Next Horizon di AMD non si è parlato solamente della seconda generazione di CPU EPYC, ma anche di Radeon Instinct, le GPU che l'azienda statunitense propone per il mondo dei datacenter e più in particolare per compiti di machine learning e intelligenza artificiale. David Wang, nuovo boss della divisione RTG dopo la fuoriuscita di Raja Koduri, si è concentrato sulla nuova GPU Vega a 7 nanometri, la prima al mondo realizzata con questo processo produttivo.
La nuova Radeon Instinct MI60, disponibile da questo trimestre, è dotata proprio di questa nuova incarnazione di Vega, che conta su 13,2 miliardi di transistor in un'area di 331 mm2 per garantire prestazioni di più di 1,25 volte maggiori all'attuale Radeon Instinct MI25 a parità di consumo - oppure un consumo il 50% inferiore alla stessa frequenza di lavoro.
La MI60 è, secondo AMD, la scheda PCI Express con le prestazioni FP64 e FP32 più veloci al mondo: si parla di 7,4 TFLOPs per i calcoli FP64 nel settore HPC e 14,7 TFLOPS in quelli FP32 per compiti di allenamento di intelligenze artificiali. Nel caso dell'inferenza AMD indicata prestazioni pari a 118 TOPS (INT4).
La GPU è accompagnata da 32 GB di memoria HBM2 con ECC, in grado di garantire un bandwidth di 1 TB/s. È anche la prima scheda a supportare il PCI Express 4.0, per un bandwidth bidirezionale di 64 GB/s tra CPU e GPU. Sono inoltre presenti dei collegamenti Infinity Fabric che consentono di collegare più GPU assicurando un bandwidth di 100 GB/s per collegamento.
[tomsgallery id=515769]
Questo permette prestazioni decisamente superiori alla precedente MI25 e uno scaling migliorato con più GPU. Secondo AMD la nuova nata è in grado di sopravanzare la Tesla V100 di Nvidia in formato PCI Express o comunque offrire prestazioni di livello simile in molteplici scenari. Insieme alla Instinct MI60, AMD ha introdotto anche una versione minore chiamata MI50, di cui potete vedere le specifiche nella seguente tabella:
Instinct MI60 | Instinct MI50 | |
---|---|---|
Compute Unit | 64 | 60 |
Stream Processor | 4096 | 3840 |
Prestazioni di picco half precision (FP16) | 29.5 TFLOPs | 26.8 TFLOPs |
Prestazioni di picco singola precisione (FP32) | 14.7 TFLOPs | 13.4 TFLOPs |
Prestazioni di picco doppia precisione (FP64) | 7.4 TFLOPs | 6.7 TFLOPs |
Prestazioni di picco INT8 | 58.9 TFLOPs | 53.6 TFLOPs |
Capacità di memoria | 32GB | 16GB |
Tipo memoria (GPU) | HBM2 | HBM2 |
Bandwidth di memoria | 1024GB/s | 1024GB/s |
Oltre al nuovo hardware, Wang ha parlato anche di ROCm 2.0, nuova versione della piattaforma open source per il calcolo accelerato che include nuove librerie matematiche, un supporto ai framework più ampio e operazioni di deep learning ottimizzate.
Per quanto riguarda il futuro, dopo MI60 sarà la volta di MI-NEXT (è un semplice nome in codice), un progetto che garantirà maggiori prestazioni, connettività e compatibilità software. Al momento però non sono stati divulgati dettagli più precisi.