Opublikowanie wyników sekwencjonowania ludzkiego genomu w 2001 roku wyznaczyło początek nowoczesnej biologii, gdzie wszelkie badania opierają się na znanej sekwencji określonych biomolekuł. Spośród ok. 3 miliardów par zasad tworzących ludzki genom, niewiele ponad 1% stanowi składnik genów kodujących funkcjonalne białka. Pozostały DNA nie został w pełni zidentyfikowany. Wiadomo jednak, że są to sekwencje regulacyjne, odpowiadające za włączanie i wyłączanie określonych genów. Badacze z Cornell University stworzyli nową technikę w dziedzinie biologii obliczeniowej, która pozwala na łatwiejszą identyfikację niekodujących fragmentów genomu.
– To, co sprawia, że nasze podejście jest wyjątkowe, to proste połączenie biochemii DNA z ostatnimi naciskami ewolucyjnymi (...) Nasza metoda pozwala innym naukowcom nie tylko na użycie wyników, ale też na łatwe ich zrozumienie – podkreśla Brad Gulko, doktorant Cornell University i pierwszy autor publikacji pt. A method for calculating probabilities of fitness sonsequence for point mutation across the human genome", która 19 stycznia 2015 roku ukazała się w „Nature Genetics”. Jednym z autorów badań jest również profesor Adam Siepel, światowej klasy specjalista w dziedzinie biologii obliczeniowej i informatyki.