Intel Lunar Lake è ufficiale, nuove architetture per l'IA e un'efficienza mai vista su x86

Nuove architetture per core e grafica, NPU potenziata e tantissime novità volte all'efficienza: Lunar Lake migliora ogni aspetti della passata generazione.

Avatar di Marco Pedrani

a cura di Marco Pedrani

Caporedattore centrale

Intel ha annunciato i nuovi processori Lunar Lake, che arriveranno sul mercato nel terzo trimestre 2024 e muoveranno la prossima generazione di PC portatili sottili e leggeri.

I punti chiave riguardano l’efficienza, con un consumo fino al 40% più basso rispetto alla passata generazioni, le prestazioni, che in single thread raggiungono i valori di Meteor Lake impiegando metà della potenza, la grafica integrata, fino a 1,5 volte migliore rispetto alla precedente e ovviamente l’intelligenza artificiale, con una potenza complessiva di 120 TOPS suddivisa tra GPU, NPU e CPU. A questo proposito, Lunar Lake risponde alle specifiche dei PC Copilot+, quindi è praticamente certo che la prossima generazione di laptop Intel supporterà le funzionalità IA avanzate di Microsoft.

Ovviamente ci sono tantissime altre novità, dalle nuove architetture per P-Core, E-Core e per la grafica integrata, fino ad arrivare a innovazioni nella gestione dell'alimentazione, nella connettività e nella sicurezza.

Un assaggio delle specifiche tecniche

Intel si è concentrata soprattutto sulle novità tecnologiche, senza condividere le specifiche tecniche della futura lineup Lunar Lake; tuttavia, sappiamo che i prossimi processori avranno un design 8 core / 8 thread, come già svelato dalle indiscrezioni passate, con 4 E-Core e 4 P-Core senza HyperThreading. Non ci saranno configurazioni con un numero più alto di core, almeno stando a quanto comunicato finora.

La memoria sarà sul package, così da risparmiare spazio (fino a 250 mm2 sulla board) e migliorare l’efficienza, con un consumo fino al 40% inferiore. Ci saranno fino a 32GB di RAM LPDDR5x-8533 dual channel, con velocità fino a 8,5 GT/s per chip e interfaccia 128 bit. La grafica integrata invece sarà equipaggiata con 8 Xe Core di nuova generazione.

Il chip viene creato con il packaging avanzato Foveros 3D e sfrutta sia i processi Intel che quelli di TSMC: in particolare, la base su cui sono poggiate le varie Tile usa il processo P1227.1 di Intel, mentre la Compute Tile e la Platform Controller Tile sono prodotte da TSMC, rispettivamente con i nodi N3B e N6. Le Tile sono collegate dalla nuova Scalable Fabric di seconda generazione, ancora più veloce.

Non sono stati condivisi particolari dettagli nemmeno in merito alle prestazioni, quindi non aspettatevi grafici di confronto con numeri reali. Intel ha affermato che è ancora presto e l’obiettivo di questo evento è, come già detto, un altro; i test arriveranno nei prossimi mesi, quando saremo più vicini al lancio sul mercato, previsto per il terzo trimestre 2024.

Lion Cove e Skymont sono il cuore dei nuovi Core

La novità più evidente dei nuovi P-Core, basati sull’architettura Lion Cove, è l’assenza dell’HyperThreading. Si tratta di una tecnologia capace di incrementare le prestazioni, ma aggiunge complessità, aumenta la superficie occupata, la potenza assorbita e il costo; rimuoverla comporta dei vantaggi (ad esempio nel gaming), ma bisogna compensare le prestazioni che si vanno a perdere.

L’architettura Lion Cove punta proprio a compensare questa differenza di performance, con novità come un Prediction Block 8 volte più grande, cache e coda uOp più capienti, Out of Order Engine che gestisce in maniera separata INT e Vector, sistema di fetch e decodifica più ampi e un controllo più granulare della frequenza, che passa da 100MHz a 16,67MHz.

  • Immagine 7 di 7
  • Immagine 5 di 7
  • Immagine 6 di 7
  • Immagine 3 di 7
  • Immagine 4 di 7
  • Immagine 1 di 7
  • Immagine 2 di 7

Le prestazioni rispetto a Meteor Lake aumentano fino al 18/20% a parità di frequenza, con un aumento medio dell’IPC del 14%. Nel confronto multi-thread con HyperThreading attivo, Lunar Lake offre un miglioramento del 5% nel rapporto prestazioni per potenza assorbita e del 15% in quello prestazioni per potenza assorbita per superficie occupata.

Cambiano parecchio anche gli E-Core, ora basati su architettura Skymont. In Meteor Lake, Intel ha sfruttato i due LP E-Core principalmente per gestire attività in background, ma in Lunar Lake i core ad alta efficienza sono fondamentali per raggiungere gli obiettivi di efficienza prefissati; per questo, Intel ha deciso di ampliare il cluster inserendo E-Core ed eliminando la differenziazione tra LP E-Core ed E-Core “classici”.

  • Immagine 9 di 10
  • Immagine 10 di 10
  • Immagine 7 di 10
  • Immagine 8 di 10
  • Immagine 5 di 10
  • Immagine 6 di 10
  • Immagine 3 di 10
  • Immagine 4 di 10
  • Immagine 1 di 10
  • Immagine 2 di 10

L’architettura Skymont introduce molte novità, a partire da un Out of Order Engine più ampio, un aumento delle porte Dispatch e Load per ridurre la latenza, capacità di fetch e decodifica migliorate, più larghezza di banda per ciclo (da 64B a 128B), più cache L2 e un nanocode, che permette di avere parallelismo anche all’interno del microcode.

Il risultato? I nuovi E-Core Skymont offrono fino al 68% di prestazioni single thread Floating Point in più rispetto agli LP E-Core di Meteor Lake (+38% prestazioni Integer) per quanto riguarda l’IPC; in multi thread, il nuovo cluster di E-Core offre la stessa potenza degli LP E-Core di Meteor Lake a un terzo della potenza, è 2,9 volte più veloce a parità di potenza e fino a quattro volte più veloce alla potenza di picco.

Il nuovo Thread Director punta alla massima efficienza

Nell’ottica di ridurre i consumi e gestire meglio l’alimentazione, Intel ha modificato pesantemente anche Thread Director, che ora opera per ottimizzare la distribuzione del carico di lavoro e l'efficienza energetica.

Thread Director lavora per fare in modo che tutto sia eseguito da un solo E-Core, almeno fino a quando il carico di lavoro lo permette; sposta il carico su più E-Core ed eventualmente sui P-Core solo quando strettamente necessario (o quando chiesto specificamente da un’applicazione), sfruttando un algoritmo di Machine Learning.  

  • Immagine 5 di 6
  • Immagine 6 di 6
  • Immagine 3 di 6
  • Immagine 4 di 6
  • Immagine 1 di 6
  • Immagine 2 di 6

Intel ha introdotto in Thread Director anche delle “zone di contenimento”, che permettono al carico di lavoro di essere eseguito su una specifica tipologia di core: un carico venga eseguito sempre sugli E-Core, oppure sui P-Core, o ancora può lasciarlo “zoneless”, affidando la decisione a Thread Director. Questa specifica novità permette, ad esempio, di risparmiare il 35% di energia in Microsoft Teams limitandolo all’esecuzione su E-Core.

Intel ha introdotto anche un nuovo sistema di gestione dell’alimentazione, che usa quattro PMIC e offre una telemetria migliorata tramite IMON, garantendo in questo modo un controllo più accurato e una maggior efficienza. Il nuovo approccio di Intel permette di tenere i P-Core a riposo la maggior parte del tempo, attivandoli solo per carichi specifici, come lo scaling sul singolo core, riducendo di molto i consumi complessivi.

Abbastanza potenza per qualsiasi carico IA

Come anticipato Lunar Lake offre 120 TOPS IA complessivi, suddivisi tra GPU, CPU e NPU. Ma perché questa divisione? Ognuno di questi elementi è in grado di gestire carichi IA, e ognuno è adatto a compiti diversi: la GPU offre 67 TOPS ed è perfetta per carichi burst come la generazione di immagini e video, la NPU arriva a 48 TOPS ed è progettata per carichi sostenuti, mentre la CPU ha una potenza di soli 5 TOPS, ma è perfetta per tutto ciò che ha bisogno di una bassissima latenza.

Altro elemento fondamentale del perché Intel non ha concentrato tutta la potenza IA in un unico componente è legato agli sviluppatori: secondo quanto dichiarato, il 40% vuole eseguire l’IA nei propri programmi sulla GPU, dal momento che è abituato a lavorare su quell’architettura, il 30% sfrutta la NPU e il restante 30% si affida alla CPU.

  • Immagine 6 di 6
  • Immagine 4 di 6
  • Immagine 5 di 6
  • Immagine 2 di 6
  • Immagine 3 di 6
  • Immagine 1 di 6

Per gestire al meglio l’IA e fornire la potenza necessaria, la nuova grafica è equipaggiata con le Xe Matrix Extensions, che supportano operazioni INT2, INT4, INT8, FP16 e BF16 e migliorano notevolmente le capacità di inferenza.

La NPU offre 12 Enhanced Shave DSP che gestiscono le operazioni di embedding e vettorizzazione, sgravando così i 6 Neural Compute Engine e migliorando di molto le prestazioni. Intel ha poi raddoppiato la larghezza di banda per migliorare le prestazioni degli LLM, sia per quanto riguarda il “time to first word” (uno dei parametri principali per valutare le prestazioni) che per le parole successive, quando il modello gira quasi del tutto in memoria.

  • Immagine 5 di 6
  • Immagine 6 di 6
  • Immagine 3 di 6
  • Immagine 4 di 6
  • Immagine 1 di 6
  • Immagine 2 di 6

Il MAC Array della nuova NPU è in grado di gestire moltiplicazioni e convoluzioni di matrici, supporta 2048 MAC per ciclo per engine, gestisce i datatype INT8 e FP16 ed è 1,5 volte più efficiente, assicurando così migliori prestazioni per watt.

Rispetto alla NPU 3 di Meteor Lake, la NPU 4 di Lunar Lake mette a disposizione il doppio delle prestazioni a parità di potenza, mentre le prestazioni di picco sono quattro volte più alte rispetto alla passata generazione. Durante l’evento è stata mostrata una demo di Stable Diffusion come benchmark: Lunar Lake ha completato l’attività in 5,8 secondi, mentre Meteor Lake ha impiegato 22,11 secondi.

L'architettura grafica Xe2 è realtà

Anche l'architettura grafica Xe di Intel ha subito un’importante revisione con la nuova generazione Xe2, integrata nei processori Lunar Lake. La nuova architettura grafica ha risorse di calcolo migliorate, cache più grandi e capacità avanzate di ray tracing, con un incremento delle prestazioni fino a 1,5 volte rispetto alla generazione precedente.

Oltre a XMX per la gestione dell’IA, a bordo di Xe2 troviamo un nuovo Vector Engine che si occupa di gesitre la grafica raster. Ogni Xe Core di seconda generazione è dotato di 8 Vector Engine 512-bit, 8 XMX Engine 2048-bit e 192KB di cache L1 condivisa.

  • Immagine 9 di 10
  • Immagine 10 di 10
  • Immagine 7 di 10
  • Immagine 8 di 10
  • Immagine 5 di 10
  • Immagine 6 di 10
  • Immagine 3 di 10
  • Immagine 4 di 10
  • Immagine 1 di 10
  • Immagine 2 di 10

In Lunar Lake, la grafica Xe2 offre più prestazioni a parità di potenza sia rispetto a Meteor Lake-U che a Meteor Lake-H, allo stesso modo garantisca consumi inferiori a parità di performance.

La nuova architettura porta con sé anche un nuovo Media Engine, che supporta codifica e decodifica HDR 8k60 e il nuovo codec VVC, che riduce la dimensione dei file video (-10% rispetto ad AV1) senza compromettere la qualità. Ci sono poi lo streaming a risoluzione adattiva e lo Screen Content Coding, che permette di mostrare meglio elementi come il testo, solitamente non perfettamente renderizzati.

Novità molto interessanti anche per il Display Engine, ottimizzato per ridurre il più possibile i consumi e che ora supporta HDMI 2.1, la nuova DisplayPort 2.1 e lo standard eDP 1.5, usato per il pannello di praticamente tutti i computer portatili moderni.

  • Immagine 6 di 7
  • Immagine 7 di 7
  • Immagine 4 di 7
  • Immagine 5 di 7
  • Immagine 1 di 7
  • Immagine 2 di 7
  • Immagine 3 di 7

eDP 1.5 integra le novità più interessanti, dal “content matched refresh rate”, che ad esempio abbassa la frequenza d’aggiornamento del display da 60Hz a 48Hz per far apparire più fluidi i film a 24 FPS, a tecnologie che riducono al minimo i consumi, massimizzando l’efficienza.

Tra queste troviamo Panel Self Refresh, che evita di recuperare e trasmettere frame ripetuti, un buffer e un sistema di aggiornamento selettivo per ridurre al minimo l’uso dei core e l’assorbimento energetico, ad esempio aggiornando il pannello solo quando necessario nel caso in cui sia presente un’immagine statica.

Ci sono Wi-Fi 7 e Thunderbolt 4

Lunar Lake supporta gli standard di connettività wireless più recenti, vale a dire Wi-Fi 7 e Bluetooth 5.4, ma non si fa mancare nulla nemmeno in termini di connessioni cablate: la nuova piattaforma supporta fino a tre porte Thunderbolt 4, con l’azienda che ha assicurato che tutti i laptop Lunar Lake ne avranno un minimo di 2.

Non sappiamo se questa specifica si estenderà a tutte le piattaforme Lunar Lake, come ad esempio futuri PC handheld, ma è probabile che lo scopriremo nei prossimi mesi; di certo, avere due Thunderbolt 4 su un dispositivo del genere apre a scenari molto interessanti.

  • Immagine 1 di 3
  • Immagine 2 di 3
  • Immagine 3 di 3

Ci sono novità anche per Intel Unison, per un'esperienza multi dispositivo ancora migliore: è possibile controllare un tablet con tastiera e mouse del computer e usarlo come secondo schermo, condividere file, rispondere alle chiamate direttamente dal laptop, accedere facilmente all'hotspot dello smartphone quando non si è connessi a una rete Wi-Fi e condividere file anche con dispositivi non-Unison grazie a Swift Connect.

Novità anche per la sicurezza

Da non trascurare ovviamente la sicurezza, che in Lunar Lake è gestita da tre engine differenti: Partner Security Engine (basato su Microsoft Pluton), Silicon Security Engine e Converged Security e Manageability Engine assicurano la massima sicurezza possibile.

Viene da chiedersi se avere tre motori differenti non sia ridondante: Intel afferma che potrebbero capitare dei casi in cui si sovrappongono, ma in linea di massima i tre engine lavorano all’unisono per assicurare una capacità avanzata di rilevamento delle minacce, oltre che per difendere il PC da ransomware e altre minacce informatiche in maniera efficacie e tempestiva.

Inutile dire che anche in questo campo viene sfruttata l’intelligenza artificiale, in particolare per rilevare e mitigare minacce in tempo reale, assicurando così una difesa robusta anche contro attacchi molto sofisticati.

Non resta che aspettare

I processori Lunar Lake di Intel segnano un passo in avanti davvero importante, con novità sotto tutti i punti di vista: CPU, NPU e GPU sono state rivoluzionate, per offrire agli utenti una piattaforma mobile di altissimo livello. Bisognerà aspettare ancora qualche mese prima di poterli toccare con mano (il debutto è previsto per Q3), quando la sfida con i competitor entrerà davvero nel vivo.

Leggi altri articoli