Czym są właściwie czynniki transkrypcyjne (TF)? Można je porównać do inteligentnych pocisków wycelowanych w kierunku jądra komórkowego i wiążących się do znajdujących się w jego obrębie specyficznych sekwencji DNA. W ten sposób czynniki te są w stanie w różnorodny sposób wpływać na określony gen, włączając go bądź wyłączając i to w zależności od potrzeb żywej komórki. To one, stanowiąc obiekt manipulacji, umożliwiają poprawę takich cech, jak plenność czy odporność na niskie temperatury, szkodniki uprawowe i suszę. Globalna ekspresja genów jest regulowana przez kombinatoryczny efekt wielu czynników transkrypcyjnych związanych z regionami regulacyjnymi. Taka interakcja TF-promotor to podstawowe połączenie molekularne stanowiące element wysoce skomplikowanej genetycznej sieci regulatorowej (GRN).
Przystępując do konstrukcji biblioteki, próbowano odpowiedzieć na pytanie, w jaki sposób rośliny adaptują się do cykli światła i ciemności. Skoncentrowano więc badania nad wytwarzaniem białka Circadian Clock Associated 1 (CCA1) i Late Elongated Hypocotyl (LHY), czyli czynników transkrypcyjnych regulujących geny zegara okołodobowego Arabidopsis. Początkowo zastosowano tradycyjną strategię odczytywania funkcji genu, polegającą na mutacji genu i sprawdzenia, czy modyfikacja taka odpowiedzialna jest za występowanie danego fenotypu. Gdy metoda ta nie sprawdziła się, zdecydowano się na skorzystanie z podejścia odwrotnej genetyki. Zamiast mutowania w celu odnalezienia genu, badacze postanowili sklonować wszystkie czynniki transkrypcyjne, a potem odkryć, które z nich wiążą się do genu CCA1 i zarazem regulują jego ekspresję. Chcąc zbadać oddziaływanie między DNA a białkiem, posłużono się drożdżowym systemem jednohybrydowym (Y1H). Metoda ta okazała się trafna, ponieważ umożliwia szczegółowe zbadanie dużych sieci regulacyjnych i transkrypcyjnych, takich jak przykładowy zegar okołodobowy.
Kilka ORFeomów czynników transkrypcyjnych A. thaliana wygenerowano już wcześniej, jednak w tym przypadku założono nastawienie całościowe, czyli budowę kompleksowej, homogennej kolekcji klonów o zatwierdzonej sekwencji. Obejmuje ona 93 z 97 przewidywanych rodzin TF u Arabidopsis, nie zawiera jedynie 4 klonów pojedynczych oraz innych rodzin słabo reprezentowanych. Sklonowanie tych czynników okazało się szczególnie trudne i prawdopodobnie wymagałoby użycia alternatywnych strategii lub innych systemów ekspresyjnych od tych opartych na rekombinacji. Historia realizacji projektu mówi, że część genów nie została wykryta przez PCR, co wskazuje na to, że prawdopodobnie brakowało ich w puli cDNA użytej jako matrycy. Za niepowodzeniem tej próby mogły stać również pseudogeny albo sekwencje niedające się namnożyć zastosowanym zestawem starterów. Inna praktyczna trudność wiązała się z przeprowadzeniem ogromnej ilości żmudnych eksperymentów, co rozwiązano poprzez automatyzację procedury. Ostatecznie udało się utworzyć źródło o wysokiej przepustowości do generacji wielu genomowych narzędzi do badania funkcjonowania cis-regulomu.
Podsumowując, należy podkreślić, że pierwsza tak obszerna biblioteka tego rodzaju nie ogranicza się tylko i wyłącznie do dostarczania informacji na temat sieci transkrypcyjnych leżących u podstaw funkcjonowania zegara okołodobowego. To również solidna baza do rozwoju innych konceptów, o czym świadczy zapoczątkowanie 70 takich przedsięwzięć w Stanach Zjednoczonych i Europie. Realizacja tego wielkiego projektu trwała ponad 8 lat i pochłonęła łącznie około 5 mln dolarów. Skonstruowano kolekcję liczącą około 2000 klonów roślinnych czynników transkrypcyjnych. Bibliotekę taką przechowuje się na płytkach mikrotitracyjnych (zawierających wiele studzienek służących za mini-probówki), a obecnie planowana jest jej globalna dystrybucja. Ma to wesprzeć rozwój niedofinansowanych badań nad roślinami.
KOMENTARZE