Biotechnologia.pl
łączymy wszystkie strony biobiznesu
Czy narzędzia bioinformatyczne mogą przewidzieć regulację genów w komórce?
Czy narzędzia bioinformatyczne mogą przewidzieć regulację genów w komórce?

Regulacja ekspresji genów jest ważnym czynnikiem wpływającym na zróżnicowanie i ostatecznie – funkcję komórek. Przewidywanie dynamiki zmian transkrypcji ma ogromny potencjał w zrozumieniu patogenezy chorób, zwłaszcza nowotworów. 

U przedstawicieli jednego gatunku komórki charakteryzują się identyczną sekwencją genomu. Natomiast decydujący elementem jest regulacja genów, która warunkuje powstawanie różnych typów komórek poprzez aktywację ekspresji odpowiednich genów w określonym czasie. Szacuje się, że ok. 10-20% ludzkiego genomu stanowią sekwencje regulatorowe. Należą do nich: promotory, sekwencje wzmacniające (z ang. enhancer) oraz wyciszające (z ang. silencer).

Stopień upakowania chromatyny jest ważnym zagadnieniem w kontekście transkrypcji. Niski poziom kondensacji świadczy o większej dostępności chromatyny podczas transkrypcji, natomiast uzyskanie skondensowanej struktury uniemożliwia dołączenie się składników maszynierii genetycznej do fragmentów DNA w celu rozpoczęcia syntezy RNA. Dodatkowo do naturalnych procesów wpływających na poziom upakowania chromatyny należą np. acetylacja histonów oraz metylacja DNA. Stąd niezwykle cenne informacje o dynamice ekspresji genów można uzyskać, wykonując sekwencjonowanie ATAC-seq (z ang. Assay for Transposase-Accessible Chromatin followed by sequencing). Polega ono na analizie regionów chromatyny o wysokim poziomie dostępności, co m.in. pomaga zidentyfikować sekwencje regulatorowe oraz miejsca wiązania czynników transkrypcyjnych. Analiza pozwala na sporządzenie map dostępności chromatyny w badanym genomie.

Za pomocą metod bioinformatycznych stworzono modele sztucznej inteligencji, zdolne do wyznaczania sekwencji funkcjonalnych i przewidywania wpływu mutacji na podstawie danych z sekwencjonowania. Pierwszym takim przykładem była architektura uczenia głębokiego Enformer, która powstała w 2021 r., opublikowana na łamach „Nature Methods” przez zespół naukowców z centrów badawczych firm Google DeepMind oraz Calico Life Sciences. Rozwój technologii informatycznych zwiększył dotychczasowe możliwości algorytmów, zwłaszcza sieci neuronowych. W tym roku na łamach „Cell Genomics” opisano nowy model sztucznej inteligencji EpiBERT, który jest wzorowany na dużym modelu językowym BERT. Metoda została opracowana przez zespoły badawcze z Dana-Farber Cancer Institute, Broad Institute, Columbia University i Google. Wysokoprzepustowy model przetwarza dane wejściowe na podstawie sekwencji genomowej o długości 3 mld par zasad, wraz z mapami dostępności chromatyny ATAC-seq. Celem procesu głębokiego uczenia się sieci neuronowej było rozpoznawanie sekwencji DNA na luźnie skondensowanej chromatynie w obrębie genomu różnych typów komórek. W rezultacie tak przeprowadzonej analizy zidentyfikowano elementy regulacyjne oraz ich wpływ na ekspresję genów, co dokładnie odwzorowuje, które geny były aktywne w odpowiednim typie komórek. Tę zdolność modelu sztucznej inteligencji EpiBERT można wykorzystać do przewidywania funkcjonalnych zmian komórek, np. w wyniku zaburzeń transkrypcji poprzez działanie różnych czynników.

Czy zatem można stwierdzić, że narzędzia bioinformatyczne mogą wyjaśnić proces patogenezy? Na pewno wykonują wysokojakościowe globalne analizy, ale mają swoje ograniczenia. Przede wszystkim otrzymane wyniki zależą od danych wejściowych, co czasem nie uwzględnia charakterystycznych motywów rozwoju rzadkich typów komórek. Innym wyzwaniem jest uwzględnienie epigenetycznych modyfikacji chromatyny oraz białkowych składników, które wpływają na transkrypcję. Ten model może być potencjalnie doskonalony w kierunku zwiększenia rozdzielczości (aktualnie 128 pz) w celu otrzymania bardziej precyzyjnych wyników. Warto zaznaczyć, że deregulacja transkrypcji oraz mechanizmów epigenetycznych jest charakterystyczna m.in. dla procesu powstawania nowotworu. Identyfikacja elementów regulacyjnych i określenie ich wpływu na ekspresję genów może stać się ważnym czynnikiem diagnostycznym w rozpoznawaniu chorób. Wysoka przepustowość oraz wiarygodność przewidywania funkcjonalnych zaburzeń komórek są kluczowymi zaletami wprowadzenia metod sztucznej inteligencji do branży medycznej.

Źródła

1. Javed N. et al. A multi-modal transformer for cell type-agnostic regulatory predictions. Cell Genomics 5, 100762, February 12, 2025.

2. Avsec Z. et al. Effective gene expression prediction from sequence by integrating long-range interactions. Nature Methods, vol. 18, 1196-1203, 2021.

Fot. https://unsplash.com/photos/a-computer-circuit-board-with-a-brain-on-it-_0iV9LmPDn0

KOMENTARZE
news

<Luty 2025>

pnwtśrczptsbnd
28
Rutynowe testowanie wag
2025-01-28 do 2025-01-28
1
2
4
6
7
8
9
10
11
Czyszczenie Wagi Laboratoryjnej
2025-02-11 do 2025-02-11
12
13
14
15
16
22
23
24
1
Aesthetic Cosmetology of the Future
2025-03-01 do 2025-03-01
2
Newsletter