DNA Come Unità Flash: Perché Scrivere Dati Digitali Nel Genoma - Visualizzazione Alternativa

Sommario:

DNA Come Unità Flash: Perché Scrivere Dati Digitali Nel Genoma - Visualizzazione Alternativa
DNA Come Unità Flash: Perché Scrivere Dati Digitali Nel Genoma - Visualizzazione Alternativa

Video: DNA Come Unità Flash: Perché Scrivere Dati Digitali Nel Genoma - Visualizzazione Alternativa

Video: DNA Come Unità Flash: Perché Scrivere Dati Digitali Nel Genoma - Visualizzazione Alternativa
Video: ARCHIVIAZIONE DEI DATI INFORMATICI SUL DNA 2024, Potrebbe
Anonim

La crescita del volume delle informazioni digitali spinge gli scienziati a cercare modi più compatti per registrarle e archiviarle. E cosa potrebbe esserci di più compatto del DNA? RIA Novosti, insieme a un esperto, ha scoperto come codificare parole con nucleotidi e quanti dati contiene una molecola.

Codici-motivi

Il DNA è una sequenza di nucleotidi. Ce ne sono solo quattro: adenina, guanina, timina, citosina. Per codificare le informazioni, a ciascuna di esse viene assegnato un codice numerico. Ad esempio, timina - 0, guanina - 1, adenina - 2, citosina - 3. La codifica inizia con il fatto che tutte le lettere, i numeri e le immagini vengono convertiti in un codice binario, cioè una sequenza di zeri e uno, e sono già convertiti in una sequenza di nucleotidi, cioè un codice quaternario.

Prima di codificare i dati in DNA, è necessario tradurli in un codice digitale / Illustrazione di RIA Novosti. Alina Polyanina
Prima di codificare i dati in DNA, è necessario tradurli in un codice digitale / Illustrazione di RIA Novosti. Alina Polyanina

Prima di codificare i dati in DNA, è necessario tradurli in un codice digitale / Illustrazione di RIA Novosti. Alina Polyanina.

Solo tre nucleotidi possono essere utilizzati per costruire un codice (codice ternario) e il quarto è per suddividere le sequenze in parti. C'è un'opzione con la costruzione di basi sotto forma di un codice binario, quando due di loro corrispondono a zero e due corrispondono a uno.

Diverse tecniche sono utilizzate per la lettura. Uno dei più comuni è che una catena di una molecola di DNA viene copiata utilizzando basi, ognuna delle quali ha un'etichetta colorata. Quindi un rilevatore molto sensibile legge i dati e il computer utilizza i colori per ricostruire la sequenza nucleotidica.

“La molecola di DNA è molto capiente. Anche nei batteri, di solito contiene circa un milione di basi e negli esseri umani fino a tre miliardi. Cioè, ogni cellula umana trasporta un volume di informazioni paragonabile alla capacità di un'unità flash. E abbiamo trilioni di tali cellule. È possibile registrare un'enorme quantità di dati nel DNA, ma scrivere e leggere da un tale supporto è ancora troppo lento e costoso , afferma Alexander Panchin, Ph. D., ricercatore senior presso l'Institute for Information Transmission Problems intitolato A. A. Kharkevich, Accademia delle scienze russa.

Video promozionale:

La densità di registrazione aumenta

Nel giugno 1999, la rivista Nature ha pubblicato un articolo di scienziati americani che hanno sviluppato una tecnica per inviare messaggi segreti usando il DNA. Hanno sintetizzato una molecola incorporando una sequenza nucleotidica formata utilizzando un codice quaternario. Il DNA segreto nella miscela è stato inviato a un altro laboratorio. I suoi dipendenti, utilizzando speciali chiavi chimiche, hanno trovato la molecola desiderata e ne hanno estratto le informazioni.

“In generale, ci sono due approcci alla registrazione dei dati sul DNA. Il primo è quando sintetizzi DNA completamente nuovo usando un sintetizzatore chimico. Al comando del computer, i nucleotidi vengono aggiunti alla soluzione in un certo ordine e la catena di base richiesta "cresce" gradualmente. Nel secondo caso, i dati sono codificati nel DNA già esistente di un organismo”, spiega Panchin.

Nel maggio 2010, il gruppo di Craig Venter, che per primo ha mappato il genoma umano, ha pubblicato un documento sulla creazione di un batterio artificiale. Hanno preso come base una cellula batterica purificata dal genoma e vi hanno collocato la sequenza di basi formata. Il risultato è un nuovo batterio, abbastanza attivo e vivo, che differisce dal solito solo per il fatto che il suo DNA è stato creato a mano. Inoltre, il team ha dimostrato un senso di bellezza scrivendo i propri nomi e citazioni da classici utilizzando un codice quaternario nel DNA batterico.

Nel 2012, un gruppo guidato dal biologo molecolare George Church ha adottato un approccio più fondamentale e ha codificato con il DNA un libro di 52.000 parole Regenesis: How Synthetic Biology Will Reinvent Nature and Ourselves, diverse immagini e un programma Java. Hanno usato codice binario. La quantità totale di dati era di 658 kilobyte. La densità delle informazioni è risultata essere di quasi 1018 byte per grammo di molecole. Per fare un confronto, un disco rigido da 1012 byte pesa circa cento grammi. Il principale svantaggio di questo metodo è l'instabilità delle informazioni registrate.

“La molecola di DNA tende a mutare, il che riduce l'affidabilità della memorizzazione dei dati. Soprattutto se il vettore del DNA è una cellula vivente capace di divisione: quando il DNA viene duplicato, gli errori si insinuano particolarmente spesso. L'affidabilità della memorizzazione dei dati aumenterà se si dispone di migliaia di copie dello stesso messaggio. O semplicemente conserva il DNA, diciamo, nel congelatore. A basse temperature, la capacità di una molecola di mutare è notevolmente ridotta , spiega l'esperto.

Inoltre, a volte le informazioni vengono perse durante la lettura. Gli errori possono essere di natura chimica, quando una base errata è attaccata a un elemento, o puramente calcolati, cioè a seconda del computer.

Costoso, affidabile

Nel marzo 2017, Science ha pubblicato un articolo di scienziati americani che sono riusciti a scrivere 2 * 1017 byte per grammo di DNA. I biologi sottolineano di non aver perso un singolo byte. In poche parole, ciò che abbiamo registrato è ciò che abbiamo ottenuto all'uscita.

Per un utente ordinario, un "flash drive genetico" non è ancora disponibile, perché è molto costoso memorizzare informazioni su di esso e la velocità di lettura / scrittura è bassa. Gli scienziati stimano che leggere un solo megabyte richieda circa tremila dollari e diverse ore di tempo.

Gli indubbi vantaggi della registrazione delle informazioni sul DNA includono l'enorme densità di archiviazione dei dati, nonché la stabilità del vettore, anche se solo a basse temperature.

Raccomandato: