L'IA accelera il recupero dati dal DNA di 3200 volte

L'intelligenza artificiale da una scossa all'archiviazione dati nel DNA, ma i supporti standard rimangono ancora migliori.

Avatar di Marco Pedrani

a cura di Marco Pedrani

Caporedattore centrale

L'intelligenza artificiale rivoluziona l'archiviazione dei dati su DNA, rendendo il recupero delle informazioni migliaia di volte più veloce. Un team di ricercatori del Technion - Israel Institute of Technology ha sviluppato DNAformer, un sistema che accelera di 3.200 volte il processo di lettura dei dati memorizzati su molecole di DNA rispetto ai metodi precedenti. La tecnologia emergente sfrutta la straordinaria densità e durabilità del DNA come supporto di archiviazione, con una capacità circa 100 milioni di volte superiore rispetto ai sistemi tradizionali e una longevità che supera di gran lunga quella dei supporti digitali convenzionali come SSD e dischi rigidi.

A differenza dei supporti di memorizzazione attuali, che si deteriorano nel giro di pochi anni o decenni, il DNA può conservare informazioni per generazioni. Questa caratteristica lo rende un candidato ideale per l'archiviazione a lungo termine di volumi crescenti di dati digitali. La sfida principale, tuttavia, risiede nella complessità del processo di recupero delle informazioni, tradizionalmente molto lento e soggetto a errori.

Il processo di archiviazione avviene attraverso la sintesi di molecole di DNA personalizzate. La lettura richiede poi il sequenziamento, che introduce inevitabilmente vari tipi di errori come delezioni o sostituzioni, restituendo copie di dati non ordinate e talvolta corrotte. È qui che interviene DNAformer, utilizzando algoritmi sofisticati in grado di identificare i pattern corretti anche a partire da input difettosi.

University of Southampton
Immagine id 35045

DNAformer si basa su un modello transformer addestrato con dataset sintetici prodotti da un simulatore sviluppato presso il Technion. Durante i test su un campione di 3,1MB, lo strumento ha gestito con successo vari tipi di contenuti: un'immagine a colori, una breve registrazione audio di Neil Armstrong sulla Luna, un testo sui vantaggi dell'archiviazione su DNA e dati generati casualmente per simulare file criptati o compressi.

Il modello include codici di correzione personalizzati e un livello di sicurezza per rilevare sequenze particolarmente disturbate. Utilizza strumenti specializzati per ripulire questi errori prima di tradurre le sequenze in forma digitale. Oltre all'impressionante miglioramento della velocità, DNAformer ha mostrato un'accuratezza fino al 40% superiore rispetto ai precedenti metodi di recupero rapido.

Nonostante i notevoli progressi, la tecnologia rimane ancora troppo lenta per applicazioni commerciali immediate. Tuttavia, i ricercatori sono fiduciosi di essere sulla strada giusta. Il team prevede di adattare DNAformer per esigenze specifiche e ritiene che il sistema possa essere scalato per applicazioni industriali e di ricerca.

La flessibilità del sistema è un altro punto di forza: DNAformer è progettato per evolversi parallelamente ai futuri progressi nelle tecniche di scrittura e lettura del DNA, contribuendo a soddisfare la crescente domanda di soluzioni di archiviazione sostenibili e ad alta capacità. Questa innovazione rappresenta una svolta significativa nella gestione dei dati di archiviazione DNA del mondo reale, specialmente quando si tratta di sequenze incomplete o rumorose che mettono in difficoltà i metodi di correzione tradizionali.

👋 Partecipa alla discussione! Scopri le ultime novità che abbiamo riservato per te!

0 Commenti

⚠️ Stai commentando come Ospite. Vuoi accedere?


Questa funzionalità è attualmente in beta, se trovi qualche errore segnalacelo.