Naukowcy z EBI zapisali w dwuniciowej helisie DNA antologię 154 sonetów Williama Szekspira, a także 26‑sekundowy zapis audio ze słynnej mowy Martina Luthera Kinga, zdjęcie Instytutu oraz plik, który zawiera informację o sposobie konwersji danych w formę molekularną. W sumie zakodowano 5,2 mln bitów. Nick Goldman podkreśla, że taki sposób przechowywania danych jest zdecydowanie bardziej trwały i zarazem bardziej zwarty niż w przypadku obecnie wykorzystywanych nośników. Wagę i znaczenie osiągnięcia docenia także George Church, genetyk z Harvard Medical School w Bostonie, który w ubiegłym roku zakodował w DNA roboczą wersję swojej książki. Zespół Churcha stosował jednak prostszy zapis – przyporządkowywał wartość zero w przypadku adeniny (A) lub cytozyny (C) i wartość jeden dla guaniny (G) lub tyminy (T). Powodowało to jednak pojawianie się długich ciągów tej samej litery, co stanowiło utrudnienie dla sekwenatorów i skutkowało błędami.
Zespół Goldmana poszedł o krok dalej i wykorzystał bardziej skomplikowana technikę kodowania, w której każdy bajt danych (czyli osiem zer i jedynek) jest reprezentowany przez 5 znaków spośród zasad A, C, G raz T. W ten sposób nie wykorzystuje się pełnego potencjału zapisu. Powstaje wówczas tak zwana nadmiarowość kodowa, dzięki której eliminowane mogą być ewentualne błędy. Molekułę DNA zsyntezowało Agilent Technologies w Kalifornii, po czym produkt syntezy odesłano naukowcom – odczytu dokonano ze 100% poprawnością.
W DNA można by zapisać potencjalnie wszystkie dane, jakimi dysponuje dziś ludzkość. Obrazowym przykładem są dane zgromadzone w podgenewskim laboratorium CERN w ilości 90 petabajtów – całość mogłaby zostać zapisana w 41 gramach kwasu deoksyrybonukleinowego. Zachowanie odpowiednich warunków temperatury, światła i wilgoci umożliwiłoby bezpieczne przechowywanie danych przez bardzo długi czas, bez konieczności aktualizowania zapisu i formatu danych wraz z postępem technologicznym. Goldman zwraca uwagę, że zapis dorobku naszej cywilizacji na przykład w przypadku katastrofy globalnej mógłby przetrwać i zostać odczytany przez przyszłe generacje.
W upowszechnieniu techniki barierą okazuje się koszt zapisu i odczytu informacji z DNA. Zespół z EBI ocenia, że zakodowanie 1 megabajta danych kosztuje dziś 12,5 tys. USD, zaś odczyt każdorazowo około 200 USD. Jednakże szacuje się, że koszt ten maleć będzie wykładniczo i nawet według pesymistycznych założeń już za 10 lat będzie co najmniej 100-krotnie niższy. Wówczas zabezpieczenie danych w DNA na okres 50 lat będzie już korzystne ekonomicznie.
Ewa Sankowska
źródło:
www.nature.com
KOMENTARZE