Fastweb annuncia il suo supercomputer Nvidia per lo sviluppo del primo LLM italiano

Fastweb inaugurerà il suo supercomputer basato su hardware Nvidia e destinato a creare il primo LLM completamente italiano.

Avatar di Marco Silvestri

a cura di Marco Silvestri

Editor

Nel mese di luglio, Fastweb inaugurerà il suo supercomputer Nvidia installato in un datacenter della Lombardia allo scopo di sviluppare il primo modello linguistico di grandi dimensioni (LLM) nativamente italiano. Il supercomputer, acquistato da Nvidia a dicembre 2023, sarà utilizzato anche come servizio IA per aziende e organizzazioni attraverso il cloud AWS di Amazon.

Durante il Festival dell’Economia di Trento, Walter Renna, amministratore delegato di Fastweb, ha fornito aggiornamenti sul progetto, evidenziando l'importanza e l'innovazione legate a questa iniziativa.

Un supercomputer potente per un modello linguistico unico

Il supercomputer di Fastweb è composto da 31 unità Nvidia DGX H100 equipaggiate con 248 GPU Nvidia H100 Tensor Core e sarà operativo da luglio. Questo potente sistema sarà impiegato per addestrare un LLM utilizzando un dataset di 11 milioni di libri interamente in italiano. Il modello linguistico che ne risulterà sarà poi messo a disposizione di terzi tramite i servizi IA di Amazon Web Services (AWS). Fastweb ha già utilizzato la piattaforma Amazon SageMaker per il fine-tuning del modello Mistral 7B, ottenendo miglioramenti significativi sui benchmark in lingua italiana.

Gli attuali modelli di intelligenza artificiale, come GPT, Llama e Claude, hanno una bassa percentuale di dati di pre addestramento in italiano. Ad esempio, Llama 2 contiene solo lo 0,11% di dati in italiano, mentre Llama 3 ha solo un 5% di dati non in inglese.

L'AD di Fastweb, Walter Renna, ha dichiarato che:

"Gli attuali modelli di Intelligenza Artificiale si affidano principalmente a dati in lingua inglese, ma una maggiore comprensione delle sfumature della lingua italiana può essere ottenuta dall’addestramento su set di dati in italiano accuratamente selezionati e di alta qualità" 

Un dataset massiccio e di qualità

Renna ha poi illustrato i dettagli del dataset di 1.500 miliardi di token già raccolti, tutti in italiano e frutto di accordi con vari enti. Tra questi, Bignami Edizioni, le Gazzette ufficiali, il Common Crawl, e i dati della Fastweb Digital Academy. Questo ampio dataset, equivalente a circa 11 milioni di libri, è stato selezionato con attenzione per garantire alta qualità e rispetto del copyright.

Il supercomputer verrà ospitato in un datacenter Fastweb in Lombardia e, come anticipato in precedenza, non servirà non solo per lo sviluppo dell’LLM, ma anche per offrire servizi di Infrastructure as a Service (IaaS) ad aziende, università e Pubbliche Amministrazioni. Questi servizi saranno fondamentali per sviluppare applicazioni IA e Gen IA attraverso il cloud AWS.

Prospettive future e impatto sul mercato

Secondo Renna, il mercato dell’intelligenza artificiale in Italia, che nel 2023 valeva mezzo miliardo, raggiungerà i 2 miliardi di euro nei prossimi cinque anni. La strategia AI di Fastweb si integra con il suo ecosistema di soluzioni, che comprende cloud, cybersecurity e connettività performante, tutti elementi cruciali per il funzionamento dell’IA.

Al Festival dell’Economia, Renna ha ribadito che la fase operativa del progetto inizierà a luglio, con lo sviluppo e la commercializzazione di soluzioni di intelligenza artificiale destinate a aziende e Pubbliche Amministrazioni. Questa iniziativa mira a supportare il settore delle telecomunicazioni, che sta affrontando una crisi nelle attività tradizionali. Il mercato delle telecomunicazioni in Italia vale circa 18 miliardi di euro, ma sopra di esso ci sono 80 miliardi di servizi aggiuntivi, come cloud, IT e intrattenimento. La crescita in questi settori rappresenta una grande opportunità per Fastweb.

Leggi altri articoli