Projekt 4DN od lat rozwija i integruje komplementarne metody eksperymentalne oraz obliczeniowe do badania architektury genomu w przestrzeni i czasie. Cel programu to zrozumienie, jak DNA (genom) jest zorganizowane w jądrze komórkowym w 3D, jak ta organizacja zmienia się w czasie (czwarty wymiar) i jak przekłada się to na funkcję genomu. – Chcemy zrozumieć mechanizmy molekularne odpowiedzialne za strukturę i dynamikę chromatyny w komórkach ludzkich. Najważniejsze wyzwania, na które odpowiadają 4DN i nasza publikacja, to: porównanie i integracja komplementarnych metod mapowania 3D genomu, powiązanie jego struktury z funkcją (transkrypcja, replikacja DNA, regulacja enhancer-promotor) i pozycją względem elementów jądra (laminy, jąderka, speckles), uchwycenie zmienności między pojedynczymi komórkami w dynamicznej i heterogenicznej organizacji genomu oraz wykorzystanie tych map do przewidywania wpływu wariantów genetycznych w kontekście medycznym – wymienia prof. dr hab. Dariusz Plewczyński z Wydziału Matematyki i Nauk Informacyjnych PW.
W opublikowanej pracy autorzy połączyli wiele typów danych genomiki 3D/4D i obrazowania, aby opisać organizację genomu w dwóch referencyjnych ludzkich typach komórek – embrionalnych komórkach macierzystych H1 oraz unieśmiertelnionych fibroblastach HFFc6. – Wytworzyliśmy i zintegrowaliśmy różnorodne zbiory danych genomowych i z obrazowania biologicznego, z których każdy wnosił unikatowe obserwacje, co umożliwiło nam zestawienie obszernych katalogów obejmujących ponad 140 tys. pętli chromatynowych na typ komórki, wygenerowanie szczegółowych klasyfikacji i adnotacji typów domen genomowych oraz ich pozycji w przestrzeni jądrowej, a także uzyskanie trójwymiarowych modeli 3D pojedynczych komórek przedstawiających środowisko jądrowe wszystkich genów, w tym ich dalekozasięgowe interakcje z odległymi elementami regulatorowymi – wyjaśnia prof. Dariusz Plewczyński. Publikacja zawiera także szeroki benchmarking metod pomiaru architektury genomu (praktyczne wskazówki doboru technik) oraz demonstrację narzędzi obliczeniowych, w tym modeli predykcyjnych pozwalających przewidywać fałdowanie genomu na podstawie sekwencji DNA i oceniać potencjalny wpływ wariantów genetycznych na strukturę i funkcję genomu.
Efekty projektu będą szczególnie przydatne w biotechnologii, biomedycynie, farmacji, projektowaniu nowatorskich leków i terapii, a także rozwoju nowych podejść diagnostycznych. Przede wszystkim pośrednio przyspieszą badania nad zdrowiem i chorobami – Amerykański Narodowy Instytut Zdrowia (NIH) podkreśla, że zmiany organizacji DNA w jądrze mogą mieć związek m.in. z chorobami (np. nowotworami) i odpowiedzią na czynniki infekcyjne, a lepsze zrozumienie organizacji jądra jest istotne dla zdrowia. Najbardziej bezpośrednimi „odbiorcami” efektów prac polskich naukowców są zespoły badawcze w sektorze biologii molekularnej i genomiki, które potrzebują referencyjnych map i standardów porównawczych, a także branża bioinformatyki i data science w naukach o życiu, ze względu na publicznie udostępnione dane, narzędzia i protokoły, które budują ekosystem open science. W dłuższej perspektywie, zależnie od dalszych badań i translacji, będzie to również sektor medycyny precyzyjnej, gdzie interpretacja wariantów, zwłaszcza niekodujących, wymaga zrozumienia, które elementy regulatorowe oddziałują z jakimi genami w 3D. – Nasza publikacja pokazuje też kierunek budowy modeli, które pozwalają wnioskować o potencjalnym wpływie wariantów sekwencji na zwijanie się genomu, co w dłuższej perspektywie przekłada się na lepszą interpretację genomiki w medycynie. Dodatkowa „korzyść obywatelska” to publiczny dostęp do danych i standaryzowanych zasobów, co zwiększa tempo postępu naukowego – nie trzeba powtarzać tych samych kosztownych eksperymentów w wielu miejscach – tłumaczy prof. Plewczyński.
Zadania naukowców: analiza, integracja, modelowanie
Wkład zespołu z PW i CeNT UW koncentrował się na analizach obliczeniowych, integracji danych i modelowaniu 3D: porównywaniu metod (benchmarkingu), integracyjnym wnioskowaniu o lokalizacji domen genomowych względem struktur jądrowych oraz współtworzeniu analiz i modeli 3D genomu. Prace prof. Dariusza Plewczyńskiego, dr. Mateusza Chilińskiego i dr. Kaustava Sengupty wspierały m.in. porównywanie metod mapowania genomu 3D/4D oraz rozwój podejść integracyjnych, które pozwoliły przejść od wielu odrębnych pomiarów do spójnego, wieloskalowego obrazu organizacji genomu. Wszystkie dane i zasoby udostępniono publicznie w portalu 4DN, co ma ułatwić ich ponowne wykorzystanie w badaniach podstawowych i aplikacyjnych – m.in. w analizie mechanizmów regulacji genów oraz interpretacji wariantów związanych z chorobami. Największy nakład pracy (zwłaszcza po stronie zespołów obliczeniowych, w tym SFGLab) generowały integracja heterogenicznych danych (różne technologie, rozdzielczości, zakresy oddziaływań, artefakty, normalizacja) oraz zapewnienie porównywalności – stąd tak duży nacisk na benchmarking, modelowanie integracyjne i 3D, a także utrzymanie jakości i reprodukowalności (pipeline’y, metadane, udostępnianie danych). Jest to druga faza projektu 4DNucleome ufundowanego przez National Institutes of Health USA. Pierwsza faza rozpoczęła się w 2015 r. i była silnie ukierunkowana na rozwój/benchmarking metod oraz podejść obliczeniowych i modelowania. Druga faza NIH Common Fund 4DN rozpoczęła się w 2020 r. i kładzie większy nacisk na zdrowie/chorobę oraz dalszy rozwój narzędzi integracji i wizualizacji danych.
Politechnika Warszawska

KOMENTARZE