Uaktualniona została sama definicja podstawowej jednostki dziedziczenia genu jako zespołu połączonych fragmentów genomu, kodujących funkcjonalnie nakładające się produkty ekspresji. Prace badawcze prowadzone w skali całego genomu człowieka pozwoliły oszacować, że zawiera on 19-20 tys. sekwencji kodujących białka oraz regiony kodujące czynniki regulatorowe (m.in. cząsteczki RNA różnego typu: lncRNA, miRNA, eRNA). Obecnie wielkim wyzwaniem dla badań genetycznych jest określenie poziomu indywidualnych różnic w sekwencji dna oraz ich interpretacja pod kątem znaczenia dla cech organizmu. Na bazie zdobytej wiedzy możliwe będzie wdrożenie w klinice założeń medycyny precyzyjnej, czyli podejścia, w którym proces leczenia jest dostosowany do potrzeb pacjenta.
Wyzwania sekwencjonowania następnej generacji
Podstawowym narzędziem medycyny precyzyjnej stają się nowe metody sekwencjonowania dna. Sekwencjonowanie następnej generacji (ngs) pozwala dzisiaj uzyskać pełną sekwencję genomu człowieka w ciągu zaledwie kilku dni, za stosunkowo niską cenę 1000 dolarów (przy średnim pokryciu >30x). Jednym z zastosowań klinicznych technologii ngs jest diagnostyka rzadkich chorób genetycznych i zespołów rodzinnych. Badania wskazują na 30-40% skuteczność metody sekwencjonowania eksomu-genomu do identyfikacji mutacji przyczynowych, co jest wynikiem zadowalającym w porównaniu do skuteczności i kosztów analizy sekwencji pojedynczych genów. Maksymalne wykorzystanie możliwości, jakie daje pełna sekwencja genomu człowieka, wymaga dalszych prac w dwóch obszarach. Pierwszy z nich to podniesienie technicznych parametrów analizy ngs (w tym długości odczytów oraz wysokości pokrycia, np. przy pomocy technologii 10X Genomics lub Nanopore). Drugim obszarem jest rozwój metod bioinformatycznych i narzędzi programistycznych do wykrywania, filtrowania i annotowania wariantów genetycznych.
Narzędzia bioinformatyczne dla diagnostyki molekularnej
Dzienna przepustowość najnowszych systemów ngs (HiseqX Ten, firmy Illumina) wynosi blisko 1 bilion zasad, co skutkuje gigantyczną ilością nagromadzonych danych genetycznych i utrudnia powiązanie poszczególnych wariantów z obrazem klinicznym pacjenta. Konieczna jest optymalizacja ścieżki postępowania przy analizie i interpretacji genomu oraz zwiększenie mocy przerobowych. Pomocne są techniki automatycznego dobierania zestawu genów na podstawie objawów pacjenta oraz dedykowane narzędzia rozpoznawania innego typu wariantów genetycznych. Najnowsze specjalistyczne metody pozwalają poszerzyć badanie, m.in. o wykrywanie wariantów ilości kopii (cnv, ang. copy number variants) oraz krótkich tandemowych powtórzeń (str, ang. short tandem repeats). Rozbudowa narzędzi bioinformatycznych umożliwi odkodowanie dużej ilości informacji oraz maksymalne wykorzystanie dostępnych baz wiedzy z zakresu genetyki medycznej (takich jak omim czy ClinVar). Bardzo ważny jest rozwój nowych algorytmów oraz oprogramowania dedykowanego dla konkretnych potrzeb genetyki klinicznej, takich jak: diagnostyka chorób rzadkich, dobór terapii przeciwnowotworowej czy ocena ryzyka chorób cywilizacyjnych.
Platforma analiz genomowych dla medycyny precyzyjnej
intelliseq powstał, aby poszerzać możliwości odczytywania sekwencji ludzkiego genomu. Ta innowacyjna firma biotechnologiczna wspiera badania naukowe oraz proces diagnostyki genetycznej poprzez wdrażanie pionierskich rozwiązań informatycznych. Oferujemy kompleksowe usługi analizy i biologicznej interpretacji wyników wysokoprzepustowego sekwencjonowania dna. Przygotowujemy również indywidualne rozwiązania serwerowe oraz oprogramowanie dedykowane do konkretnych zastosowań. Ważnym punktem rozwoju jest udział w projektach badawczych, np. projekt „GeneTraps – systemy analizy wyników sekwencjonowania genomu dedykowany dla medycyny precyzyjnej” (poir.01.01.01-00-0213/15) finansowany przez NCBiR, w którym tworzymy platformę analiz genomowych, współpracując z ośrodkami naukowymi i jednostkami medycznymi.
Klaudia Szklarczyk, dr Marcin Piechota, dr Michał Korotyński,
intelliseq
KOMENTARZE