Questo supercomputer batte tutti nell'IA, eppure non è il primo in classifica

Aurora affronta problemi di stabilità dovuti a guasti hardware, malfunzionamenti del sistema di raffreddamento ed errori operativi.

Avatar di Marco Silvestri

a cura di Marco Silvestri

Editor

Sebbene fosse il più quotato a superare il Frontier di AMD nella prestigiosa lista dei 500 supercomputer più potenti al mondo, Aurora di Intel si è piazzato al secondo posto. Tuttavia, il supercomputer Intel è riuscito a conquistare la vetta nella classifica di benchmark HPL-MxP dedicata all'IA, registrando 10.6 AI Exaflops di performance e divenendo così il supercomputer più veloce al mondo nell'intelligenza artificiale.

Nonostante queste prestazioni, Aurora non è ancora pienamente operativo a causa di alcuni problemi hardware, come guasti ai sistemi di raffreddamento, errori operazionali e instabilità della rete. La situazione lascia perplessi, considerando i nove anni trascorsi dall'annuncio iniziale del progetto, la revisione lanciata cinque anni fa e l'installazione degli ultimi componenti avvenuta appena undici mesi fa.

Anche se il sistema ospita 21.248 CPU e 63.744 GPU distribuite su 10.624 lame di calcolo, il laboratorio nazionale di Argonne (ANL) non è stato in grado di presentare una prova completa di Linpack per la classifica Top500, posizionandosi così al secondo posto con 1.012 Exaflops e l'87% delle unità in funzione.

Il problema principale rimane che, nonostante le potenti specifiche, Aurora raggiunge solo il 51% della sua prestazione di picco in sostenibilità (Rmax), a differenza di Frontier che raggiunge il 70%. Tuttavia, vi è speranza che le prestazioni di Aurora possano migliorare con il completamento e l'ottimizzazione del sistema.

Nel frattempo, l'ANL rimane cauto sulle aspettative di Aurora, sperando in un successo che possa superare definitivamente Frontier.

Oltre al posizionamento nel benchmark, Aurora si distingue anche nella classifica HPCG, situandosi al terzo posto con solo il 38,5% del sistema attivo, evidenziando così le sue capacità anche in applicazioni di carico di lavoro reali, diverse da quelle tradizionalmente scientifiche.

Nonostante le impressionanti prestazioni in diversi settori, Aurora rimane fuori dalla classifica Green500 per l'efficienza energetica, con un consumo energetico di picco che supera del doppio quello di Frontier. La competizione non è tuttavia destinata a fermarsi, con l'annuncio di sistemi potenziati da Nvidia che promettono prestazioni eccezionali in termini di IA e efficienza energetica nel prossimo futuro.

Con la conclusione dell'installazione del supercomputer El Capitan, prevista per la fine del 2024 e con prestazioni di picco valutate a due exaflops, la competizione nel settore dei supercomputer si annuncia sempre più accesa. Fonti del laboratorio nazionale di Argonne e Intel sono al lavoro per risolvere i problemi tecnici di Aurora, anche se al momento non c'è una data precisa per il completamento. Gli sforzi congiunti mirano a ottimizzare questa risorsa computazionale d'avanguardia, in attesa che possa esprimere pienamente il suo potenziale.

Leggi altri articoli