In occasione del COMPUTEX 2024 iniziato oggi, AMD ha presentato importanti novità per la sua lineup di prodotti e una fitta roadmap di rilasci con cadenza annuale per potenziare il proprio portfolio di soluzioni dedicate all'intelligenza artificiale.
A cominciare dal nuovo acceleratore Instinct MI325X, la compagnia ha in programma di migliorare la propria offerta per l'IA di anno in anno e offrire livelli di performance sempre più elevati.
"Questo è un momento incredibilmente entusiasmante per AMD, in quanto la rapida e crescente adozione dell'intelligenza artificiale sta facendo aumentare la domanda delle nostre piattaforme di elaborazione ad alte prestazioni" ha dichiarato Lisa Su, presidente e CEO di AMD. "Al Computex siamo stati orgogliosi di essere affiancati da Microsoft, HP, Lenovo, Asus e altri partner strategici per lanciare i nostri processori Ryzen di nuova generazione per desktop e notebook, per mostrare in anteprima le prestazioni da leader dei nostri processori EPYC di nuova generazione e per annunciare una nuova cadenza annuale per gli acceleratori AMD Instinct AI".
Le novità di AMD per esperienze più "intelligenti" sui PC
Durante il keynote di apertura, la compagnia ha rivelato i nuovi processori di 5° generazione EPYC (nome in codice "Turin"), i quali sfrutteranno il core Zen 5 per migliorare le performance e l'efficienza della famiglia EPYC. I processori, disponibili a partire dalla seconda metà dell'anno, sono pensati per supportare i carichi di lavoro dei supercomputer e dei PC.
AMD ha inoltre presentano l'architettura NPU XDNA a 2 core che offre 50 TOPs (trilioni di operazioni per secondo) e un'efficienza energetica per carichi di lavoro di IA generativa maggiore di due volte rispetto alla generazione precedente.
L'architettura è la prima e unica sul mercato a supportare i dati Block FP16 e assicura maggiore accuratezza con tipi di dato a precisione inferiore rispetto alle NPU della concorrenza, senza sacrificare le performance.
Durante la conferenza HP ha rivelato i nuovi PC Copilot+, compreso Pavilion Aero, che sfruttano AMD per aumentare le performance di IA. Anche Lenovo ha presentato le sue nuove proposte di laptop che utilizzeranno i processori Ryzen AI 300 per abilitare il nuovo software basato su IA della compagnia.
AMD ha inoltre annunciato la nuova serie di processori desktop Ryzen 9000 basati sull'architettura Zen 5 pensati per offrire performance elevate per il gaming e la creazione di contenuti.
In seguito la compagnia ha presentato la workstation per schede grafiche Radeon PRO 27900 Dual Slot ottimizzata per garantire performance di IA scalabili per piattaforme che supportano più GPU.
Tra gli annunci c'è anche quello dei SoC Versal AI Edge Series Gen 2 che sfruttano la logica programmabile FPGA per il pre-processing in tempo reale. I SoC sono disponibili in early access per 30 partner selezionati. Tra le compagnie che stanno già sfruttando la potenza dei Versal AI Edge Gen 2 ci sono Illumina, Subaru, Canon e Hitachi Energy.
L'ecosistema software per l'IA di AMD continua a maturare
Durante il keynote, AMD ha sottolineato che lo stack open ROCm 6 continua a maturare per supportare i nuovi carichi di lavoro dell'IA e le prossime serie di acceleratori.
Stando ai dati condivisi dalla compagnia, con un server che usa otto Instinct MI300X ed esegue LLama-3 da 70 miliardi di parametri su ROCm6, i consumatori possono ottenere performance di inferenza e generazione di token maggiori di 1,3 volte rispetto alla concorrenza (NVIDIA Hopper H100).
Con un solo acceleratore MI300X su ROCm6 i clienti possono invece ottenere performance fino a 1,2 volte maggior rispetto alla competizione (NVIDIA Hopper H100) usando Mistral con 7 miliardi di parametri.
AMD ha anche sottolineato che Hugging Face sta testando 700.000 dei suoi modelli più popolari per garantirne le massime performance sugli acceleratori MI300X.
Una roadmap pluriennale per l'IA
L'idea di AMD è di dominare il mercato dell'IA portando miglioramenti di performance e memoria con cadenza annuale.
La prima tappa della roadmap è il nuovo Instinct MI235, disponibile nel quarto trimestre dell'anno, il quale offrirà 288GB di memoria HBM3E e 6 TB per secondo di ampiezza di banda. AMD afferma che l'acceleratore garantirà fino al doppio della memoria rispetto ai prodotti della competizione (NVidia Hopper H200 e NVidia Blackwell HGX B100), 1,3 volte più ampiezza di banda e 1,3 volte performance di computazioni migliori.
In seguito sarà la volta della serie MI350 basata sull'architettura CDNA 4, in grado di aumentare le performance di inferenza di ben 35 volte se comparata alla serie MI300. Gli acceleratori verranno sviluppati usando la tecnologia produttiva 3nm e supporteranno i tipi di dato per l'IA FP4 e FP6. La serie dovrebbe diventare disponibile nel 2025.
Infine, nel 2026 arriverà anche la serie MI400 basata su un'architettura CDNA del tutto nuova e pensata per migliorare ulteriormente le performance e l'efficienza dell'inferenza e del training su larga scala.
"Gli acceleratori AMD Instinct MI300X continuano ad essere adottati da numerosi partner e clienti, tra cui Microsoft Azure, Meta, Dell Technologies, HPE, Lenovo e altri, come risultato diretto delle eccezionali prestazioni e della proposta di valore dell'acceleratore AMD Instinct MI300X" ha dichiarato Brad McCredie, corporate vice president, Data Center Accelerated Compute, AMD. "Con la nostra cadenza annuale aggiornata di prodotti, siamo inarrestabili nel nostro ritmo di innovazione, fornendo le capacità e le prestazioni di leadership che il settore dell'IA e i nostri clienti si aspettano per guidare la prossima evoluzione della formazione e dell'inferenza dell'IA nei data center".