November 24, 2024

PAPERS

A volte la vita ti colpirà alla testa con un mattone

L’archiviazione del DNA promette un aumento della capacità di archiviazione di 10 milioni di volte

Suggerisci a un responsabile delle informazioni che potrebbero presto archiviare 10 milioni di volte più dati come la capacità di un singolo disco rigido e, per lo meno, è probabile che siano scettici.

Ma tali progressi potrebbero essere possibili, e nei prossimi anni. Il motivo è Conservazione del DNA DNA. Invece di utilizzare dischi rigidi, nastro magnetico o memoria flash, l’archiviazione del DNA conserva i dati utilizzando il codice della vita stesso.

Con la scienza odierna, un sistema di archiviazione del DNA può contenere 10 zettabyte di dati in un dispositivo delle dimensioni di una scatola da scarpe, secondo John Monroe, vicepresidente e analista del ricercatore di settore Gartner. “Questi bellissimi codici a quattro lettere potrebbero essere il modo ideale per archiviare i dati digitali”, afferma. “È enorme in termini di capacità: è più promettente di qualsiasi altro formato di archiviazione di archiviazione”.

I ricercatori stimano che i dati archiviati nel DNA potrebbero durare tra 700.000 e un milione di anni, ben oltre la durata di qualsiasi tecnologia di archiviazione attuale. Monroe vede la memoria del DNA sostituire il nastro o le unità ottiche per vicino o archiviazione offline.

Il DNA stesso è estremamente robusto, in grado di resistere al caldo e al freddo. E una volta che l’informazione è stata codificata e sintetizzata nel DNA – la fase di “scrittura” – non ha bisogno di energia per mantenerla in quello stato. Il sequenziamento e la decodifica del DNA, la fase di “lettura”, riconverte il codice del nucleotide di quattro lettere del DNA in una forma che può essere elaborata da un computer.

Ma nonostante questa promessa, l’idea è ancora lontana dall’essere una tecnologia pratica. Il settore IT deve ancora trovare dispositivi di archiviazione del DNA funzionanti e su scala di produzione. “Le persone stanno ancora lottando con l’aspetto”, ammette Monroe.

Crede che l’attrezzatura avrà le dimensioni di un elettrodomestico da cucina; altri prevedono che potrebbe essere delle dimensioni di uno scuolabus. Microsoft ha già sviluppato una macchina per la codifica e il recupero del DNA di dimensioni più pratiche, con l’Università di Washington. Tuttavia, è ancora un prototipo e non qualcosa che un dipartimento IT potrebbe semplicemente inserire in un rack IT 19U esistente.

Romanzo chimico

Tuttavia, l’attuale codifica e sequenziamento del DNA è ancora in gran parte un processo chimico. Questo è il motivo per cui il prototipo di Microsoft e dell’Università di Washington sembra più vicino a qualcosa che potresti trovare in un laboratorio di scienze scolastico che in un datacenter. E il processo è attualmente costoso.

Il sequenziamento di 1 MB di dati costa circa $ 3.500 (£ 2.500). E sebbene i costi stiano diminuendo, questo è molto più del costo di scrivere lo stesso volume di dati su flash o disco. Gartner ritiene che la tecnologia non diventerà mainstream fino a quando il costo non scenderà a circa $ 0,01 per gigabyte.

Le tecnologie alternative includono la sintesi enzimatica del DNA (EDS), che è stata sviluppata dal Istituto Wyss, parte dell’Università di Harvard. I ricercatori ritengono che questo ridurrà il costo della sintesi del DNA di molti ordini di grandezza. Il team di Wyss sta sviluppando un dispositivo elettronico in grado di sintetizzare i dati nel DNA. Ritengono che questo aumenterà il processo consentendo di parallelizzare il processo di sintesi.

I ricercatori, tuttavia, sono fiduciosi che i costi e le barriere pratiche verranno superati, se non altro perché poche, se non nessuna, tecnologie offrono il potenziale per archiviare le enormi quantità di dati che possono essere archiviate nel DNA.

Non sorprende che i governi e le agenzie di intelligence siano alla base di gran parte dell’interesse per la conservazione del DNA. Negli Stati Uniti, il Attività di Progetti di Ricerca Avanzata di Intelligence (IARPA), parte dell’Ufficio del Direttore della National Intelligence, gestisce MIST, il programma Molecular Information Storage, che ha il compito di scrivere un terabyte e leggere 10 terabyte di dati entro 24 ore al costo di 1.000 dollari.

Altri ricercatori, al Los Alamos National Laboratory, sono stati finanziati dall’IARPA per lavorare su sistemi per tradurre le informazioni sul DNA in codice leggibile da computer. Il loro sistema, ADS Codex, gestisce la codifica e la decodifica in binario, indipendentemente dal metodo utilizzato per la stessa sintesi del DNA.

Inoltre, ADS Codex fornisce una correzione avanzata degli errori. Gli errori di scrittura sono maggiori nell’archiviazione del DNA che nell’archiviazione digitale convenzionale, un problema aggravato dal fatto che il DNA ha quattro stati di lettere, piuttosto che zero e uno del binario. ADS Codex verifica i dati e rimuove gli errori. Il codice è disponibile su GitHub.

Anche l’Europa ha contribuito al campo. Il progetto DNA DS con sede nell’UE, coordinato da ricercatori sloveni, sta cercando di memorizzare 450 petabyte di dati in una singola molecola. Potenzialmente, un intero datacenter potrebbe stare in una singola fiala di liquido. I ricercatori hanno anche esaminato un altro vantaggio della conservazione del DNA. Sebbene la scrittura dei dati sul DNA rimanga lenta, anche una fiala piena può essere replicata in poche ore, quasi senza costi e utilizzando poca energia.

Alleanza tecnologica

Ora che i ricercatori accademici hanno dimostrato che l’immagazzinamento del DNA è possibile, l’attenzione si sta spostando sugli aspetti pratici.

Nel 2020, un gruppo di pesi massimi del settore informatico, tra cui Microsoft e Western Digital, ha formato la DNA Data Storage Alliance insieme alle aziende biotecnologiche Twist Bioscience e Illumina e a ricercatori accademici.

L’obiettivo è creare un ecosistema praticabile attorno all’archiviazione del DNA, con Microsoft e altri che sottolineano che il campo si sta spostando dalla ricerca accademica e scientifica verso applicazioni pratiche di archiviazione dei dati per l’IT. L’applicazione più interessante, almeno all’inizio, sono i dati di conservazione a freddo che vengono scritti una volta e letti raramente.

Altre applicazioni includono i media. L’anno scorso Twist ha codificato – in modo abbastanza appropriato – un episodio della serie Netflix Biohacker al DNA. Essere in grado di registrare in modo efficace quantità illimitate di dati, archiviarli a tempo indeterminato e replicarli rapidamente, potrebbe adattarsi al cinema e ad altri settori creativi.

Altre potenziali applicazioni includono l’archiviazione di dati medici e l’archiviazione legale e di conformità.

Ciò, tuttavia, pone alcuni altri problemi, e questi riguardano tanto gli standard quanto la tecnologia. “Per dati come WORM – scrivi una volta, leggi molti – o WORN – scrivi una volta, non leggi mai – è importante che i dati siano immutabili”, avverte Monroe di Gartner. “Devi sapere che quello che scrivi, diciamo l’immagine di un cervello oggi, sarà esattamente lo stesso tra 10 anni”.

Se i ricercatori possono garantire che sia così, la doppia elica della vita potrebbe ancora emergere come il modo migliore per archiviare i nostri dati in un lontano futuro.