L'aumento delle temperature nelle connessioni PCIe deriva essenzialmente dalla velocità di trasferimento incrementata, che richiede una maggiore integrità del segnale. Questo implica un aumento della potenza e dei clock che porta a un conseguente aumento del calore generato.
La funzione principale del driver che sta sviluppando Intel è proprio di mitigare i problemi termici riducendo la velocità dei collegamenti PCIe per mantenere le temperature sotto controllo. Attualmente, il focus dell'azienda è sulla gestione della velocità del collegamento, ma è prevista un'estensione delle funzionalità per gestire anche la larghezza dei collegamenti PCIe (numero di link PCIe attivi).
L'introduzione dei moduli PCIe 6.0 potrebbe presentare sfide importanti, in particolare per i server GPU che utilizzano centinaia di collegamenti PCIe simultaneamente. Intel sottolinea che "questa serie aggiunge il controllo della larghezza di banda PCIe (bwctrl) e il driver di raffreddamento PCIe associato al lato del nucleo termico per limitare la velocità del collegamento PCIe per motivi termici".
Per comprendere meglio in cosa consiste questo sistema di controllo è utile leggere la descrizione fornita da Intel:
Il controller della larghezza di banda PCIe è un driver di servizio per le porte del bus PCI express. Viene creato un dispositivo di raffreddamento per ogni porta che il driver di servizio trova se supporta velocità diverse. Questa serie aggiunge solo il supporto per il controllo della velocità del collegamento PCIe. Anche il controllo dell'ampiezza del collegamento PCIe potrebbe essere utile, ma AFAIK non esiste un meccanismo per questo fino a PCIe 6.0 (L0p), quindi la limitazione dell'ampiezza del collegamento non è stata aggiunta da questa serie.
Nonostante il progetto non sia ancora completo, gli ultimi aggiornamenti del driver mostrano progressi promettenti verso l'integrazione nel kernel principale. Resta da vedere se questa tecnologia influenzerà a avrà delle ripercussioni nell'addestramento delle IA e nei server HPC, ma di certo fornirà a Intel, ai produttori di server e agli amministratori dei data center un ulteriore strumento per gestire il consumo energetico e la dissipazione del calore nei server.