Biotechnologia.pl
łączymy wszystkie strony biobiznesu
"Bioinformatyka stała się dziedziną niezbędną" – rozmawiamy z bioinformatykami projektu BASTION
"Odkryto nowy gen odpowiedzialny za nowotworzenie – to duża szansa na opracowanie skutecznych terapii antynowotworowych"; "Kolejny wielki krok diagnostyki medycznej – sekwencjonowanie nowej generacji pozwoliło zdiagnozować pacjenta w 10 minut". Dynamiczny rozwój nauk o życiu spowodował, że o tego typu, wzbudzających podziw doniesieniach, możemy słyszeć coraz częściej. Niejednokrotnie jednak, nie zastanawiamy się nad poprzedzającym ogłoszenie spektakularnych wyników, ogromem pracy włożonej w analizę wszelkich danych eksperymentalnych, która pozwoliła na wyciągnięcie konkretnych wniosków. Analizę, bez której międzynarodowa konferencja prasowa, czy rozkładówka w renomowanym czasopiśmie naukowym byłyby nieosiągalne. Obecnie dane z eksperymentów biologicznych i biomedycznych przyjmują najczęściej postać bajtów. Miliardów, czy wręcz bilionów bajtów. A efektywną analizą ogromu tych danych zajmują się bioinformatycy. — Obecnie, posiadamy technologie, które dostarczają tak szerokie spektrum informacji, że bioinformatyka stała się po prostu dziedziną niezbędną — mówi dr Radosław Zagożdżon, lider zespołu bioinformatyków działającego w ramach projektu BASTION na Warszawskim Uniwersytecie Medycznym.

 

O istotności roli bioinformatyka w dzisiejszej branży life science a także o planach rozwoju klastera bioinformatycznego na WUM rozmawiamy z dr. Radosławem Zagożdżonem oraz dr. Pawłem Gajem.

 

Czy dziś naukowcy poradzili by sobie bez bioinformatyki?

 

Dr Radosław Zagożdżon: W obecnej chwili na pewno nie. Mniej więcej od 10 lat jesteśmy wręcz zalewani przez ogrom danych generowanych przez różne doświadczenia biologiczne, biomedyczne, a także pochodzące z badań klinicznych. Obecnie, posiadamy technologie, które dostarczają tak szerokie spektrum informacji, że bioinformatyka stała się po prostu dziedziną niezbędną.

 

Zatem ogrom danych generowanych przez naukowców działających w ramach projektu BASTION wymógł zawiązanie się grupy bioinformatycznej?

 

Dr Paweł Gaj: Rzeczywiście można tak powiedzieć. Wśród naukowców działających w ramach projektu BASTION oprócz osób poświęcających się badaniom w laboratorium można znaleźć również bioinformatyków, którzy większość czasu spędzają pracując przy użyciu komputerów. Z mojego doświadczenia wynika, że te dwie grupy dopełniają się. Bioinformatycy nie mogą pracować bez biologów praktyków, z drugiejnatomiast strony biolodzy praktycy potrzebują nas bioinformatyków, ponieważ bazując na danych eksperymentalnych, których nam dostarczają, możemy być im pomocni w stawianiu nowych hipotez badawczych. Stworzone w ten sposób hipotezy mogą być następnie weryfikowane w laboratorium.

 

RZ: Zgodnie z tym trendem, jesteśmy grupą interdyscyplinarną. W skład naszego zespołu wchodzi bioinformatyk, lekarz z doświadczeniem w dziedzinach biologii molekularnej oraz biomarkerów nowotworowych, analityk bioinformatyczny, specjalista od sprzętu komputerowego, a ponadto bezpośrednio w laboratorium pracują 3 osoby, które prowadzą doświadczenia wykorzystywane i opracowywane przez nasz zespół.

 

Jakiego typu dane analizowane są przez zespół bionformatyków?

 

PG: Rozwój biomedycyny jest w bezpośredni sposób uzależniony od szeroko pojętego rozwoju technologii analitycznych, którymi dysponują naukowcy. Rozwój ten przekłada się na powstawanie coraz większych ilości danych eksperymentalnych, będących pochodną całokształtu zjawisk zachodzących w badanym materiale biologicznym. Przede wszystkim mam tutaj na myśli analizy całogenomowe, którymi między innymi zajmujemy się w naszym zespole. Obecnie pracujemy nad metodami różnicowania agresywnych i nieagresywnych form chłoniaków. Uczestniczymy ponadto w analizach, które mają wykazać jakie różnice na poziomie ekspresji genów występują między pacjentami, którzy dobrze odpowiadają na leczenie określonymi lekami przeciwnowotworowymi oraz takimi, którzy są na te same leki oporni. Zaczynamy zazwyczaj od analizy danych całogenomowych. Mając ogólny wgląd w to jaki jest stan analizowanych komórek lub tkanek staramy się wnioskować i następnie wyznaczać nowe kierunki badań.

 

O jakiej ilości danych do zanalizowania mówimy w tej chwili?

 

PG: W przypadku stosunkowo niewielkiego eksperymentu, wykorzystującego technologie sekwencjonowania nowej generacji(NGS)do badania różnic w ekspresji genów w skali powiedzmy ok. 10 próbek, jest to mniej więcej 900 GB danych.

 

To potrzeba chyba też ogromnych dysków twardych, które są w stanie pomieścić te dane?

 

PG: To prawda. Dlatego w skład naszego zespołu bioinformatycznego wchodzi również specjalista zajmujący się stroną sprzętową. Poza wspomnianą przestrzenią dyskową bardzo istotna jest również moc obliczeniowa, potrzebna aby tego rodzaju dane przeanalizować. Co ciekawe, podsumowanie, pojedynczego 900 GB eksperymentu, opisywane jest ostatecznie plikami tekstowymi, które mają zaledwie kilkaset kilobajtów. Droga od ogromu danych do wyciągnięcia ostatecznych konkluzji z eksperymentu jest jednak skomplikowana i obliczeniowo dość wymagająca.

 

RZ: To jest właśnie rola bioinformatyka – żeby z niesamowitej ilości danych potrafić stworzyć coś, co przeciętny człowiek albo badacz jest w stanie przyswoić patrząc na jeden obrazek albo na jeden wykres. Liczba danych jakie są dostępne w tej chwili w sieci albo jakie są generowane np. przez zespół prof. Rafała Płoskiego, z którym współpracujemy w dziedzinie badań genomowych,  nie nadaje się do analizy ludzkim umysłem. Wszystko musi być przefiltrowane przez komputer, żeby było dostępne dla nas.

 

Niedawno prof. Płoski zdradził, iż całogenomowa analiza pozwoliła po 10 minutach na postawienie diagnozy pacjentowi, którego nie można było zdiagnozować od 10 lat.

 

RZ: To prawda, ale warto zauważyć, że samej diagnozy dokonali ludzie, a nie komputer, bazując oczywiście na opracowanych odpowiednio danych. Jakiś czas temu uczestniczyliśmy w wykładach prowadzonych przez doświadczonych bioinformatyków ze Stanów Zjednoczonych. Jeden z nich również prezentował badania całogenomowe.  Zwrócił on uwagę na to, że w jego instytucie badawczym nad opracowaniem wyników analizy całogenomowej pracuje grupa 50 ludzi. Każdy z nich zapoznaje się początkowo z hipotezami bioinformatyków, a następnie, wszyscy dodatkowo próbują sami zanalizować te wyniki i dopiero wtedy uzyskują jakieś konkluzje.

 

Czy korzystacie z jakiś gotowych rozwiązań, sprzętów, oprogramowań?

 

PG: W świecie bioinformatyki rzadziej korzysta się z oprogramowania, które jest dostępne dla końcowego odbiorcy w postaci gotowego interfejsu graficznego. Częściej natomiast uczestniczy się w realizacji koncepcji analitycznych, które samemu należy opracować i oprogramować. Pewnych analiz nie da się wykonać przy pomocy gotowego oprogramowania. Bioinformatyk powinien umieć pisać algorytmy, które potrafią przeanalizować zadany problem biologiczny. My do tego celu najczęściej wykorzystujemy otwarte środowisko statystyczne R-project oraz dedykowane mu biblioteki Bioconductor.

 

RZ: Oczywiście na początku możemy użyć gotowego oprogramowania, dostępnego w Internecie, ale dogłębnej analizy dokonujemy już za pomocą naszych programów.

 

PG: Jeszcze do niedawna takie narzędzia nie były dostępne w Internecie w postaci interfejsu graficznego, który łączyłby biologa z maszyną, która po pierwsze przechowuje dane biomedyczne (zazwyczaj w postaci baz danych), a po drugie pozwala na podstawową interpretację informacji zawartych w tych danych. Obecnie szybki rozwój oprogramowania sieciowego, następuje również dzięki pracy biologów i w odpowiedzi na ich potrzeby.

 

RZ: Pisanie skryptów w naszym wykonaniu dotyczy obecnie danych pochodzących z nauk takich jak genomika, czy transkryptomika. Próbujemy również równolegle uruchomić coś co nazywane jest ogólnie patologią cyfrową. Chcielibyśmy rozpocząć współpracę z patologami. Obecnie kupujemy skaner o wysokiej rozdzielczości, który będzie podłączony do naszego klastera komputerowego. Dzięki temu będziemy mogli zapewnić bardzo szybką analizę obrazu otrzymywanego przez patologów oraz składowanie takich obrazów. Chcemy stworzyć metody półautomatycznej analizy preparatów histologicznych właśnie w celu uzyskiwania informacji z obrazu histologicznego.

 

Takie typowo aplikacyjne podejście do tego obszaru wiedzy.

 

RZ: Na tej podstawie prowadzimy i chcemy prowadzić dalsze badania dotyczące biomarkerów nowotworowych. Barwienia, które wykonujemy dotyczą konkretnych białek w konkretnym nowotworze. Analiza obrazu przez patologa jest póki co bardzo czasochłonna i wymaga bardzo długiego szkolenia. Jest też niezbędna dla celów diagnostycznych, ale dzięki skanerowi i analizie obrazu pragniemy uprościć nieco ten proces dla celów badawczych. Mamy już nawiązaną współpracę w tym obszarze z Instytutem Onkologii, ale szukamy również innych zespołów, które by były chętne do takiej współpracy.

 

Czy czasem podczas pisania jakiegoś skryptu pojawiają się myśli typu „Przecież to by była fajna aplikacja. Może uda się ją sprzedać”?

 

PG: Dokładnie na tego typu ścieżce rozumowania bazuje grant, o który obecnie mam zamiar aplikować. Wszystko zaczęło się od dosyć podstawowych pytań, z czasem przeradzając się w konkretny pomysł, który w przyszłości ma szansę zaowocować poprawą leczenia. Pomysł ten stał się motywem wiodącym wspomnianego projektu grantowego. Aplikacyjność jest tutaj dalekosiężna.

Skupiamy się oczywiście również na tym aby identyfikować elementy molekularne, istotne dla rozwoju nowotworów.

 

RZ: Prowadzimy obecnie rozmowy z biurem patentowym.

 

Czy można zdradzić jakieś szczegóły?

 

RZ: To jest dość wielowątkowa sprawa, ale na razie musimy zachować powściągliwość, jeżeli chodzi o zdradzanie szczegółów tego pomysłu.

 

Jaka jest główna idea klastera bioinformatycznego, który ma powstać i rodzi się na Warszawskim Uniwersytecie Medycznym?

 

PG: Budowany klaster jest odpowiedzią na nowe technologie badawcze takie jak np. sekwencjonowanie nowej generacji NGS, które jak już wspominaliśmy generują ogromną ilość danych eksperymentalnych. Klaster ten będzie miał za zadanie służyć swoją mocą obliczeniową zarówno nam bioinformatykom, jak i biologom pracującym nad interpretacją danych biologicznych, uzyskiwanych w trakcie prowadzonych badań wielkoskalowych. Z technicznego punktu widzenia klaster ten będzie służył nie tylko składowaniu danych eksperymentalnych, lecz również obliczeniom, które będziemy na bazie tych danych prowadzić. Co ważne, nie tylko nasz zespół będzie korzystał z dobrodziejstw tego sprzętu. Dzięki istotnej modernizacji infrastruktury sieciowej WUM będzie on mógł służyć również badaczom z innych zespołów.

 

RZ:  Z założenia użytkownikami klastera bioinformatycznego zostaną wszyscy członkowie z projektu BASTION, ale jesteśmy otwarci absolutnie na wszystkie inne grupy badawcze, które by chciały z nami współpracować.

 

Na Warszawskim Uniwersytecie Medycznym?

 

RZ: Także poza nim. Jesteśmy otwarci na to, aby z naszego klastera bioinformatycznego korzystały także inne grupy badawcze.

 

Klaster umożliwi taką analizę danych in-house?

 

PG: Zdecydowanie tak. Taki jest właśnie cel tego przedsięwzięcia.

 

A czy celem analizy nie taniej byłoby by użyć np. chińskich prób komercyjnych?

 

RZ: Z tego co wiem, współpracowaliśmy z takim grupami, ale problemem jest komunikacja interpersonalna. Można im zlecić konkretnie zadanie, które wykonają dosyć wiarygodnie, wyniki wrócą i będziemy zadowoleni. Jednakże komunikacja interpersonalna w trakcie wykonywania takiej analizy może nawet znacznie zmienić zadania stawiane przed taką grupą. My jesteśmy ludźmi z wykształceniem biologicznym z podstawami medycznymi (lub odwrotnie), także z możliwościami bioinformatycznymi. O wiele łatwiej jest z nami wchodzić w interakcje w czasie rzeczywistym niż z grupami odległymi bardzo geograficznie.

 

Dodatkowo bardzo ciężko jest modulować na odległość zadania badawcze w momencie, kiedy taka analiza zostanie już zlecona. W naszym wypadku na bieżąco analizujemy, na bieżąco informujemy badaczy o wynikach wstępnych analiz i jesteśmy w stanie wchodzić w interakcje. Mamy wówczas szansę reagować natychmiast na zmieniające się potrzeby zleceniodawców. To samo robimy właśnie wewnątrz naszej grupy, gdy Paweł pisze skrypty analizujące nasze dane i rozmawiamy na temat tego, co z tych skryptów wychodzi. Dokonujemy drobnych zmian i na koniec możemy wyjść w zupełnie innym kierunku niż początkowo zakładaliśmy. Ten stopień współpracy w czasie rzeczywistym jest właściwie nie do uzyskania z udziałem grup odległych geograficznie.

 

A na jakim etapie jest w takim razie powstawanie tego klastera?

 

RZ: Na razie został ogłoszony kilkuetapowy przetarg. Powstanie  samego klastera jest tak naprawdę tylko jednym z etapów. Cała inicjatywa wymaga stworzenia nowej infrastruktury sieciowej. Nastąpią zmiany w strukturze całego WUM-u. Chcemy mieć łącze światłowodowe pomiędzy wszystkimi elementami, tak więc to duże wieloetapowe zadanie.

 

Czy zainstalowany zostanie jakiś super komputer?

 

PG: W planie jest instalacja pond 100 wątkowej jednostki obliczeniowej.

 

Brzmi imponująco

 

RZ: Jest to duża rzecz. Pierwsza tej rangi inicjatywa na WUMie. Miejmy nadzieję, że przyniesie zysk dla całego Uniwersytetu.

 

Kiedy to możemy się spodziewać jakiegoś pierwszego efektu?

 

RZ: Wszystkie przetargi związane z klasterem muszą zostać rozstrzygnięte do marca. Potem przyjdzie etap instalacji sprzętu i światłowodów, który na pewno zajmie chwilę. Przypuszczam, że pół roku to jest realny czas, w jakim wystartujemy.

 

W takim razie trzymam kciuki za grant, za patent i za pomyślne zawiązanie się klastera. Dziękuję za rozmowę.

 

Rozmawiał red. Tomasz Sznerch

 

***

Dr n. med. Radosław Zagożdżon, absolwent I Wydziału Lekarskiego Warszawskiej Akademii Medycznej w 1996 roku. Doktorat w dziedzinie nauk medycznych obronił w 1998 roku w Centrum Biostruktury AM. W latach 1997‒2000 pracował jako asystent w Klinice Immunoterapii, Transplantologii i Chorób Wewnętrznych Instytutu Transplantologii AM. W roku 1999 uzyskał pierwszy stopień specjalizacji z chorób wewnętrznych. W latach 1999‒2000 pracował jako adiunkt w Zakładzie Immunologii Centrum Biostruktury AM. W latach 2000‒2005 pełnił funkcję Postdoctoral Fellow, a w latach 2005‒2008 Instructor w Beth Israel Deaconess Medical Center, szpitalu klinicznym Harvard School of Medicine w Bostonie, USA. W latach 2008‒2012 pracował jako Postdoctoral Fellow/Occassional Lecturer w University College Dublin w Irlandii. Obecnie pełni funkcję kierownika grupy bioinformatycznej w Zakładzie Immunologii Warszawskiego Uniwersytetu Medycznego w ramach projektu BASTION.

Doktor Zagożdżon jest autorem lub współautorem kilkudziesięciu publikacji naukowych, zarówno oryginalnych, jak i poglądowych, oraz rozdziałów w książkach. Badania prowadzone przez dr Zagożdżona były w przeszłości wspierane przez prestiżowe stypendia Fundacji na rzecz Nauki Polskiej, Departamentu Obrony USA czy też w ramach Akcji Marie-Curie w 7. Programie Ramowym Unii Europejskiej. Radosław Zagożdżon uzyskał również nagrodę Prezesa Rady Ministrów za swoją pracę doktorską.

 

Dr n. med. Paweł Gaj, w roku 2005 ukończył kierunek Biotechnologia Szkoły Głównej Gospodarstwa Wiejskiego. W toku studiów interesował się cytogenetyczną identyfikacją transgenicznych fragmentów DNA w roślinach modyfikowanych genetycznie. Ostatni rok studiów odbył w Hiroshima University w ramach stypendium przyznanego przez rząd Japonii. W latach 2005-2009 jako pracownik naukowy Kliniki Gastroenterologii i Hepatologii CMKP, rozwijał metody analizy w badaniach dotyczących identyfikacji genetycznych markerów ryzyka występowania chorób zapalnych przewodu pokarmowego. Badania z zakresu genetyki populacji dr Gaj kontynuował skupiając się na ogólnogenomowej analizie asocjacji markerów genetycznych (GWAS) w chorobach nowotworowych (rak jelita grubego, rak prostaty) oraz chorobach neurodegeneracyjnych takich jak choroba Alzheimera. Poza badaniami z zakresu genetyki populacji zainteresowania dr Pawła Gaja skupiają się również wokół wykorzystania technologii sekwencjonowania nowej generacji NGS do identyfikacji wariantów genetycznych odpowiedzialnych za rzadko występujące choroby dziedziczne. Dr Gaj jest autorem kilkunastu oryginalnych prac naukowych, z których w sześciu jest pierwszym autorem.

Od kwietnia 2013 dr Gaj pracuje Zakładzie Immunologii WUM, w grupie bioinformatycznej kierowanej przez dr Radosława Zagożdżona.

 

pomoc w przygotowaniu transkryptu Milena Materac

KOMENTARZE
Newsletter