Biotechnologia.pl
łączymy wszystkie strony biobiznesu
Badaczki znane i nieznane. Margaret Dayhoff – na tropie białek tworzących życie
Badaczki znane i nieznane. Margaret Dayhoff – na tropie białek tworzących życie

W 1984 r. National Biomedical Research Foundation uruchomiła bezpłatną internetową bazę danych zawierającą ponad 283 tys. sekwencji białek. Obecnie Protein Information Resource umożliwia naukowcom z całego świata pobranie nieznanego białka, porównanie go z tysiącami znanych białek w bazie danych i określenie, w jaki sposób jest ono podobne i różne. Na podstawie tych danych mogą szybko i dokładnie wydedukować historię ewolucji białka i jego związek z różnymi formami życia. 

 

Skromne początki tej ogromnej bazy danych online zaczynają się na długo przed Internetem. Wszystko zaczęło się od „Atlas of Protein Sequence and Structure”, wydanej w 1965 r. książki zawierającej 65 znanych wówczas sekwencji białek, opracowanej przez Margaret Dayhoff. Aby stworzyć swój Atlas, Dayhoff zastosowała najnowocześniejsze technologie komputerowe w celu znalezienia rozwiązań dla pytań biologicznych, pomagając zapoczątkować narodziny nowej dziedziny, którą obecnie nazywamy bioinformatyką. Dayhoff, pierwotnie chemiczka, wykorzystała nowe i rozwijające się technologie ery obliczeniowej po II wojnie światowej, aby stworzyć pionierskie narzędzia, które chemicy, biolodzy i astronomowie mogą wykorzystać w interdyscyplinarnych badaniach nad pochodzeniem życia na Ziemi.

Margaret Oakley (potem) Dayhoff urodziła się 11 marca 1925 r. w Filadelfii jako córka Ruth Clark, nauczycielki matematyki w szkole średniej i Kennetha Oakleya, właściciela małej firmy. Była ich jedynym dzieckiem. W wieku dziesięciu lat rodzina przeniosła się do Nowego Jorku. Tam Margaret, w 1942 r., została maturzystką w Bayside High School. Następnie uczęszczała do Washington Square College na Uniwersytecie Nowojorskim w ramach stypendium, uzyskując magna cum laude z matematyki zaledwie trzy lata później, w 1945 r. Po uzyskaniu dyplomu rozpoczęła studia doktoranckie z chemii kwantowej na Uniwersytecie Columbia pod kierunkiem wybitnego chemika i badacza operacji z czasów II wojny światowej – George'a Kimballa. Jej przyjęcie było rzadkością w tamtych czasach. Po II wojnie światowej więcej mężczyzn zaczęło zajmować się naukami ścisłymi, a chemia stała się jeszcze bardziej przez nich zdominowana w porównaniu do poprzedniej dekady. Jeśli chodzi o kobiety, to tylko 5% doktoratów z chemii przypadło kobietom, w porównaniu z 8% sprzed dziesięciu lat.

W czasach, gdy młoda badaczka pracowała na Uniwersytecie, Columbia była zagłębiem technologii obliczeniowej. Szczyciła się jednymi z pierwszych laboratoriów obliczeniowych w USA, a w 1945 r. stała się domem dla IBM Watson Scientific Laboratory kierowanego przez astronoma W. J. Eckerta. Laboratorium Watson po raz pierwszy służyło jako centrum obliczeniowe dla aliantów w ostatnich miesiącach II wojny światowej. Po wojnie stało się miejscem, w którym opracowano jedne z pierwszych superkomputerów, w tym kalkulator Selective Sequence Electronic Calculator (SSEC), którego Eckert używał później do obliczania orbit księżycowych dla misji Apollo. Mając tę technologię na wyciągnięcie ręki, Margaret połączyła swoje zainteresowanie chemią z informatyką za pomocą maszyn na karty perforowane (dziurkowane) – w istocie wczesnych komputerów cyfrowych. Maszyny te pozwoliły jej zautomatyzować obliczenia, przechowując algorytm na jednym zestawie kart, a dane na drugim. Korzystając z maszyny, była w stanie przetwarzać obliczenia znacznie szybciej i dokładniej niż ręcznie. Szczególnym przedmiotem zainteresowania doktorantki były policykliczne związki organiczne, czyli cząsteczki składające się z trzech lub więcej atomów połączonych w ścisły pierścień. Wykorzystywała ona maszyny z kartami perforowanymi do wykonywania dużej liczby obliczeń na energiach rezonansowych cząsteczek (różnica między energią potencjalną cząsteczki w określonym stanie a stanem średnim) w celu określenia prawdopodobieństwa wiązania molekularnego i odległości wiązań. Margaret ukończyła studia doktoranckie z chemii kwantowej w zaledwie trzy lata, w 1948 r. Badania, które podjęła jako doktorantka, zostały opublikowane wraz z Kimballem jako współautorem w 1949 r. w „Journal of Chemical Physics” pod prostym tytułem: „Punched Card Calculation of Resonance Energies”.

Również w 1948 r. poślubiła Edwarda Dayhoffa, studenta fizyki eksperymentalnej, znanego z pionierskich prac nad subtelną strukturą atomu wodoru, którego poznała w Columbii. W 1952 r. para przeniosła się do Waszyngtonu, gdzie Edward objął stanowisko w National Bureau of Standards, a Dayhoff urodziła pierwszą z dwóch córek, Ruth. Dayhoff wkrótce zrezygnowała z badań, aby opiekować się Ruth i jej młodszą córką Judith. W latach 1957-1959 Dayhoff była pracownikiem naukowym na Uniwersytecie Maryland, gdzie współpracowała z Ellisem Lippincottem nad modelem wiązań chemicznych.

Kiedy powróciła do badań i zaczęła ubiegać się o granty na sfinansowanie swojej pracy w 1962 r., spotkała się z szokiem. Narodowe Instytuty Zdrowia odrzuciły wniosek o dotację, w którym Dayhoff została wymieniona jako główny badacz, z wyjaśnieniem, że „od jakiegoś czasu nie ma naprawdę bliskiego kontaktu ... z tą skomplikowaną i szybko rozwijającą się dziedziną”, jak pisał historyk Bruno Strasser w swojej książce Collecting Experiments: Making Big Data Biology. Ten rodzaj wspinaczki dla kobiet, które wzięły wolne na wychowanie dzieci, to tylko jeden ze sposobów, w jaki instytucje naukowe utrudniały awans kobiet. Pomimo braku wsparcia ze strony NIH, Dayhoff miała wkroczyć w najbardziej znaczącą dekadę swojej kariery. W 1960 r. przyjęła zaproszenie od Roberta Ledleya, pioniera biofizyki, którego poznała przez swojego męża, aby dołączyć do niego w National Biomedical Research Foundation w Silver Spring w stanie Maryland. Ledley wiedział, że umiejętności komputerowe Dayhoff będą miały kluczowe znaczenie dla celu Fundacji, jakim było połączenie dziedzin informatyki, biologii i medycyny. Dayhoff była jego zastępcą przez 21 lat.

Po przybyciu do Maryland Dayhoff mogła swobodnie korzystać z zupełnie nowego komputera mainframe IBM 7090 należącego do Uniwersytetu Georgetown. System IBM został zaprojektowany do obsługi złożonych aplikacji, z sześciokrotnie większą prędkością obliczeniową niż poprzednie modele. Szybkość ta została osiągnięta dzięki zastąpieniu wolniejszej, masywniejszej technologii lamp próżniowych bardziej wydajnymi tranzystorami (komponentami, które wytwarzają 1 i 0 w komputerach). Korzystając z komputera mainframe, Dayhoff i Ledley zaczęli wyszukiwać i porównywać sekwencje peptydów za pomocą programów FORTRAN, które sami napisali, próbując złożyć częściowe sekwencje w kompletne białko. Zaangażowanie Dayhoffa i Ledleya w zastosowanie analizy komputerowej w biologii i chemii było niezwykłe. „Kultura analizy statystycznej, nie mówiąc już o obliczeniach cyfrowych, była całkowicie obca dla większości [biochemików – przyp. red.]. Niektórzy nawet szczycili się tym, że nie byli 'teoretykami', czyli jak rozumieli analizę danych za pomocą modeli matematycznych” – wyjaśniał Strasser, opowiadając o swojej książce.

Jedną z dyscyplin naukowych, w której komputerowa wiedza Margaret była bardziej doceniana, była jednak astronomia. Zainteresowanie obliczeniami komputerowymi było po części zasługą W.J. Eckharta, który w 1940 r. wykorzystał maszyny IBM do przewidywania orbit planet, a w latach 60. XX w. amerykańskie zainteresowanie eksploracją kosmosu było w pełnym rozkwicie, co oznaczało finansowanie NASA. Na Uniwersytecie Maryland Dayhoff poznała spektroskopistę Ellisa Lippincotta, który w 1961 r. zaprosił ją do sześcioletniej współpracy z Carlem Saganem na Harvardzie. Cała trójka opracowała termodynamiczne modele składu chemicznego materii, a Dayhoff stworzyła program komputerowy, który mógł obliczać równowagę stężeń gazów w atmosferach planetarnych. Dzięki programowi Dayhoff, ona, Lippincott i Sagan mogli wybrać pierwiastek do analizy, co pozwoliło im zbadać wiele różnych składów atmosfer. Ostatecznie opracowali modele atmosferyczne dla Wenus, Jowisza, Marsa, a nawet pierwotnej atmosfery Ziemi.

Badając niebo, Dayhoff zadawała pytanie, które badacze zgłębiali co najmniej od lat 50. XX w.: jaka jest funkcja białek? Sekwencjonowanie białek było sposobem na uzyskanie odpowiedzi, ale sekwencjonowanie pojedynczych białek było bardzo nieefektywne. Dayhoff i Ledley przyjęli inne podejście. Zamiast analizować pojedyncze wyizolowane białka, porównali białka pochodzące z różnych gatunków roślin i zwierząt. „Porównując sekwencje tego samego białka u różnych gatunków, można było zaobserwować, które części sekwencji były zawsze identyczne u wszystkich gatunków, co wskazywało, że ta część sekwencji była kluczowa dla dobrego funkcjonowania białka” – opisywał Strasser. Dayhoff drążyła temat, przyglądając się wspólnej historii białek. Przeanalizowała nie tylko części, które były takie same u różnych gatunków, ale także ich odmiany. „Potraktowali te różnice jako miarę odległości ewolucyjnych między gatunkami, co pozwoliło im zrekonstruować drzewa filogenetyczn – tłumaczył Strasser.

Dayhoff, zawsze gotowa wykorzystać moc nowych technologii, opracowała skomputeryzowane metody określania sekwencji białek. Przeprowadziła ich komputerową analizę u wielu różnych gatunków – od grzyba Candida, po wieloryba. Następnie wykorzystała różnice między nimi, aby określić ich relacje przodków. W 1966 r., z pomocą Richarda Ecka, Dayhoff stworzyła pierwszą rekonstrukcję drzewa filogenetycznego. W artykule „Computer Analysis of Protein Evolution” opublikowanym w „Scientific American” w 1969 r. Dayhoff zaprezentowała publicznie jedno z tych drzew wraz ze swoimi badaniami wykorzystującymi komputery do sekwencjonowania białek. „Każda ustalona sekwencja białka, każdy naświetlony mechanizm ewolucyjny, każda ujawniona główna innowacja w historii filogenetycznej poprawi nasze zrozumienie historii życia” – napisała. Starała się pokazać społeczności nauk przyrodniczych potencjał modeli komputerowych. Jej kolejnym celem było zebranie wszystkich znanych białek w jednym miejscu, w którym naukowcy mogliby znaleźć sekwencje i porównać je z innymi. W przeciwieństwie do dzisiejszych czasów, gdy łatwo jest wywołać źródła w elektronicznej bazie danych za pomocą słowa kluczowego, Dayhoff musiała przeszukiwać fizyczne czasopisma, aby znaleźć białka, których szukała. W wielu przypadkach oznaczało to sprawdzanie pracy innych badaczy pod kątem błędów. Nawet z pomocą komputera praca polegająca na zbieraniu i katalogowaniu sekwencji wymagała ogromnej ilości czasu i wnikliwego naukowego oka.

Nie wszyscy widzieli wartość w tym, co robiła. Dla innych badaczy praca Dayhoff przypominała raczej kolekcjonowanie i katalogowanie z XIX-wiecznej historii naturalnej niż eksperymentalną pracę XX-wiecznego naukowca. „Zbieranie, porównywanie i klasyfikowanie rzeczy natury wydawało się staromodne dla wielu biologów eksperymentalnych w drugiej połowie XX w. Przyczyniła się do powstania dziedziny, która nie istniała, a zatem nie miała profesjonalnego uznania” –argumentował Strasser, określając Margaret jako outsiderkę.

W 1965 r. Dayhoff opublikowała swoją kolekcję 65 znanych białek w „Atlas of Protein Sequence and Structure” w postaci drukowanej wersji swojej bazy danych. Ostatecznie dane zostały przeniesione na taśmę magnetyczną, a teraz są dostępne online, gdzie naukowcy nadal wykorzystują je do znajdowania tysięcy kolejnych białek. Inne biomedyczne bazy danych dołączyły do walki, w tym Protein Data Bank – wspólna kolekcja białek i kwasów nukleinowych uruchomiona w 1971 r. oraz GenBank – baza danych sekwencji genetycznych uruchomiona w 1982 r. I tak, dzięki swojej „kolekcjonerskiej” pracy, Margaret rozpoczęła rewolucję naukową. „Dziś każda publikacja z zakresu biologii eksperymentalnej zawiera kombinację nowych danych eksperymentalnych i wniosków wyciągniętych z porównań z innymi danymi udostępnionymi w publicznej bazie danych – to podejście, które Dayhoff zapoczątkowała pół wieku temu” – konkludował Strasser.

Wraz z rozwojem bioinformatyki zadania związane z gromadzeniem i obliczeniami w dużej mierze spadły na kobiety. Wszystkimi współpracownikami Dayhoff przy Atlasie były kobiety, z wyjątkiem Ledley'a. Podobnie jak „kobiety-komputery” z NASA w latach 60. XX w. i szyfrantki z czasów II wojny światowej, kobiety te zostały wkrótce zepchnięte na margines praktyki naukowej. Odnosząc się do „dziewcząt ENIAC”, które zaprogramowały pierwszy cyfrowy komputer ogólnego przeznaczenia, historyk informatyki Jennifer Light pisała, że „to właśnie w ramach takich klasyfikacji zawodowych o niskim statusie kobiety były zaangażowane w bezprecedensową pracę”.

W swoim szkicu biograficznym o Dayhoff Lois T. Hunt, która pracowała z nią nad Atlasem, napisała, że badaczka wierzyła, że jej analiza pierwotnej atmosfery Ziemi może ukazać „związki niezbędne do powstania życia”. To, być może nawet bardziej niż informatyka, jest tym, co łączy różne części badań naukowych Dayhoff. Od maleńkiego białka, po rozległą atmosferę poszukiwała tajemnic pojawienia się życia na tej planecie. Choć nie odkryła ich wszystkich, dała współczesnej nauce narzędzia i metody do kontynuowania poszukiwań.

Źródła

1. https://www.whatisbiotechnology.org/index.php/people/summary/Dayhoff

2. Barker, W. C., and M. O. Dayhoff. 1977. Evolution of lipoproteins deduced from protein sequence data. Comp. Biochem. Physiol. 57B, 309v315.

3. Dayhoff, M. O.1969. Computer analysis of protein evolution. Sci. Am. 221, 86-95.

4. Dayhoff, M. O.1983. Evolutionary connections of biological kingdoms based on protein and nucleic acid sequence evidence. Precambrian Res. 20, 299-318.

5. Sagan, C. E., E. R. Lippincott, M. O. Dayhoff and R. V. Eck. 1967. Organic molecules and the coloration of Jupiter. Nature 213, 273-274.

6. Young, C. L., W. C. Barker, C. M. Tomaselli and M. O. Dayhoff. 1979. Atlas of Protein Sequence and Structure, Ed. M. O. Dayhoff, Vol. 5, Suppl. 3, pp. 73-93.

7. Lois T. Hunt. Margaret O. Dayhoff 1925-1983. DNA and Cell Biology. 2 (2), s. 97-98, 1983. Mary Ann Liebert, Inc.

8. https://onlinelibrary.wiley.com/doi/pdf/10.1107/S1600576721012140

Fot. By Ruth Dayhoff - original publication, unknown immediate source: https://www.whatisbiotechnology.org/index.php/people/summary/Dayhoff, fair use, https://en.wikipedia.org/w/index.php?curid=65030209

KOMENTARZE
Newsletter