Biotechnologia.pl
łączymy wszystkie strony biobiznesu
Międzynarodowe bazy danych DNA i RNA są "gigantycznym" punktem zwrotnym
30.08.2005
Trzej partnerzy programu międzynarodowej współpracy w zakresie baz danych sekwencji nukleotydów (International Nucleotide Sequence Database Collaboration - INSDC) ogłosili, że ich publiczne repozytoria informacji o sekwencjach DNA i RNA zawierają obecnie ponad 55 milionów sekwencji odpowiadającym 100 "giga-zasadom", czyli 100 miliardom zasad - molekularnych składników DNA kodujących informacje genetyczne.

Osiągnięcie jest wspólnym dziełem partnerów INSDC - EMBL-Bank (zlokalizowanego w Europejskim Instytucie Bioinformatyki (EBI) działającym przy Europejskim Laboratorium Biologii Molekularnej (EMBL) w Hinxton w Wielkiej Brytanii), GenBank z USA oraz Japońskiego Banku Danych DNA - uzyskanym dzięki polityce wymiany danych. Te trzy organizacje wymieniają dane na temat sekwencji nukleotydów za pośrednictwem systemu globalnej wymiany informacji biologicznych, w celu jak najszybszego zapewnienia środowisku naukowemu swobodnego dostępu do wszystkich sekwencji. Cztery zasady - adenina (A), tymina (T), guanina (G) i cytozyna (C) - połączone w pary układają się w długi łańcuch, tworząc znajomą podwójnie spiralną postać kwasu dezoksyrybonukleinowego (DNA). Połączenia między parami zasad - A z T i C z G poprzez wiązania wodorowe - mogą zostać zerwane w celu "rozplątania" dwóch nici podwójnej spirali. Genetyczne informacje są kodowane w DNA poprzez kolejność występowania zasad w sekwencji. Sekwencje można w konwencjonalny sposób opisać wymieniając po kolei pojedyncze zasady (lub nukleotydy) na jednej z dwóch nitek (np. CCAAATATGGATT), i taki właśnie rodzaj informacji, wraz z adnotacjami określającymi gatunek pochodzenia i funkcje, przechowywany jest w bazach danych INSDC. - Jest to istotny etap w historii rozwoju baz danych sekwencji nukleotydów - powiedział Graham Cameron, wicedyrektor Europejskiego Instytutu Bioinformatyki EMBL. - Począwszy od pierwszego wpisu w Bibliotece Danych EMBL, udostępnionego w 1982 r., aż do dzisiejszych 55 milionów sekwencji pochodzących z co najmniej 200 tysięcy różnych organizmów, zasoby te wyprzedzały potrzeby biologów molekularnych i wychodziły im naprzeciw - często przy poważnym braku zasobów. Formalnie INSC powstał w lutym 1987 r. i korzenie wszystkich trzech baz sięgają lat osiemdziesiątych: EMBL-Bank, obecnie zlokalizowany w EBI w Wielkiej Brytanii, został uruchomiony jako Biblioteka Danych EMBL w Heidelbergu w Niemczech, amerykański GenBank został założony wkrótce potem przy Krajowym Laboratorium Los Alamos, przed przeniesieniem go do Krajowego Ośrodka Informacji Biotechnologicznych w Bethesdzie w USA, zaś Japoński Bank Danych DNA został utworzony przy Krajowym Instytucie Genetyki w Mishima w 1986 r. David Lipman, dyrektor Krajowego Ośrodka Informacji Biotechnologicznych, wyjaśnił dalej: - Dzisiejsze bazy danych nukleotydów pozwalają badaczom na wspólne korzystanie ze skompletowanych genomów, genetycznego składu całych ekosystemów oraz opatentowanych sekwencji. Początkowo dane były rozpowszechniane na taśmie magnetycznej i wprowadzane ręcznie lub za pomocą dyskietki. Te sposoby zostały wyparte przez potokowe przetwarzanie danych pochodzących z projektów zajmujących się sekwencjonowaniem genomów i Europejskiego Urzędu Patentowego, zapewniając jak najszybsze udostępnienie wszystkich sekwencji w publicznej domenie. Naukowcy mogą również przekazywać dane bezpośrednio do którejkolwiek z organizacji i, dzięki zharmonizowanym modelom danych w trzech bazach, sekwencje są automatycznie wymieniane podczas nocnego przetwarzania w celu udostępnienia danych we wszystkich trzech lokalizacjach. Dane dotyczące sekwencji były najpierw wprowadzane ręcznie z czasopism naukowych, ale przez lata proces ten także ewaluował i bezpośrednie zasilanie baz danych sekwencjami nukleotydów stało się elementem procesu publikacji. Zasada ta została rozszerzona na inne obszary, w tym proteomikę i modele procesów biologicznych. - INSDC stworzyła fundamenty wymiany wielu rodzajów informacji biologicznych - powiedział Takashi Gojobori, dyrektor Ośrodka Informacji Biologicznej i Japońskiego Banku Danych DNA. - Ponieważ wkroczyliśmy w erę biologii systemów i naukowcy zaczynają wymieniać złożone informacje, takie jak wyniki eksperymentów polegających na pomiarach aktywności tysięcy genów, lub modele obliczeniowe całych procesów, istotne jest docenienie osiągnięć związanych z tymi trzema bazami danych, które zapoczątkowały otwartą wymianę informacji biologicznych. Więcej informacji na temat projektu międzynarodowej współpracy w zakresie baz danych sekwencji nukleotydów INSDC znajduje się na stronie: www.insdc.org.

Źródło: CORDIS

KOMENTARZE
Newsletter