Chmura obliczeniowa to wirtualna sieć zdalnych serwerów internetowych wykorzystywanych do przechowywania, zarządzania i przetwarzania informacji. Do celów tego projektu przysposobiono platformę obsługującą chmurę obliczeniową firmy DNAnexus. Włączając do współpracy firmę Amazon Web Services, największego na świecie dostawcę oprogramowania dla tego typu platform, naukowcom z HGSC udało się zsekwencjonować DNA ponad 14 tysięcy ludzi, a konkretnie 3 751 kompletnych genomów i 10 771 kompletnych eksonów (DNA eksonowe zawiera tylko sekwencje kodujące białka). Wykorzystano w tym celu techniki sekwencjonowania nowej generacji. Wyniki badań zostały oficjalnie zaprezentowane 25 października na corocznym zjeździe Amercian Society of Human Genetics.
HGSC stworzyło półautomatyczny, modułowy zestaw narzędzi do analizy danych z sekwencjonowania nowej generacji o nazwie Mercury. Nadaje się on do przetwarzania danych zarówno pod kątem czysto badawczym, jak i wykorzystania w kontekście klinicznym, w związku z czym był on integralną częścią projektu. Mercury identyfikuje mutacje w otrzymanych sekwencjach, przez co umożliwia ocenę ich znaczenia w powstawaniu poważnych chorób.
W całym projekcie brało udział ponad 300 naukowców z pięciu instytucji badawczych ulokowanych w różnych zakątkach świata. Analiza danych oparta na chmurze obliczeniowej umożliwiła tak dużej grupie osób dostęp do danych znajdujących się na serwerze, który jednocześnie zadbał o to, aby nie naruszyć prywatności danych pacjentów.
Cały projekt badawczy wymagał około 2 400 000 godzin obliczeń wykonywanych przez procesory komputerowe. Wygenerowano w ten sposób 440 terabajty wyników, oraz prawie petabajt wszystkich danych (1 terabajt = bilion bajtów; 1 petabajt = biliard bajtów). Tę imponującą ilość rezultatów obliczeń otrzymano w czasie zaledwie czterech tygodni. W trakcie trwania projektu HGSC prowadził największy na świecie klaster dedykowany analizie genomowej. Dla porównania, w ramach The 1000 genome project zsekwencjonowano 2 535 eksomów i wytworzono 25 terabajtów danych.
Uczestnicy projektu przyznają, że z ich punktu widzenia, ważne jest stworzenie funkcjonalnej przestrzeni, w której naukowcy ze wszystkich zakamarków Ziemi będą mogli się spotkać i pochylić nad tymi samymi danymi.
Teraz 300 naukowców biorących udział w projekcie wykorzysta zebrane dane do analizy podstaw chorób serca i procesów starzenia.
KOMENTARZE