Biotechnologia.pl
łączymy wszystkie strony biobiznesu

Farmacja, Biotechnologia, Kosmetologia

Analiza i wizualizacja danych biologicznych w środowisku R
Data rozpoczęcia:
2017-05-19
Data zakończenia:
2017-05-21
Miejsce
Wydział Biologii UAM w Poznaniu

Kurs odbędzie się w dniach 19-21 maja 2017 r. na Wydziale Biologii Uniwersytetu im. Adama Mickiewicza w Poznaniu (ul. Umultowska 89).

 

Zachęcamy do rejestrowania się. Koszt uczestnictwa wynosi 1000 zł.
Kurs poprowadzi dr hab. Tomasz Górecki z Wydziału Matematyki i Informatyki Uniwersytetu im. Adama Mickiewicza w Poznaniu.
Od uczestników kursu nie jest wymagana umiejętność programowania.

 

Jakie zagadnienia zostaną omówione i przećwiczone?

  • Wprowadzenie do środowiska R i omówienie danych biologicznych.
  • Podstawy wizualizacji danych: wykresy rozrzutu, wykresy pudełkowe oraz skrzypcowe, histogram.
  • Statystyki opisowe: średnie (arytmetyczna, geometryczna i harmoniczna), mediana, dominanta, wariancja, odchylenie standardowe, błąd standardowy.
  • Testy statystyczne - wprowadzenie.
  • Testy zgodności: dokładny, test chi2 oraz test G.
  • Porównywanie średnich w dwóch populacjach - test t dla prób niezależnych i zależnych. Test Wilcoxona.
  • Założenia w testach parametrycznych: normalność, homoskedastyczność wariancji - przekształcenia zmiennych (metoda Boxa-Coxa).
  • Jedno i dwuczynnikowa analiza wariancji. Test Kruskala-Wallisa oraz test Friedmana. Porównania wielokrotne (post-hoc).
  • Testy niezależności. Wykres mozaikowy, balonowy oraz wykres skojarzeń.
  • Współczynnik korelacji Pearsona i Spearmana. Zastosowanie wykresu rozrzutu oraz wykresu słonecznikowego do analizy korelacji.
  • Regresja prosta. Regresja wielokrotna.
  • Regresja nieliniowa.
  • Regresja logistyczna.
  • Analiza składowych głównych (PCA) oraz regresja składowych głównych (PCR).

 

Dla kogo przeznaczony jest ten kurs?
Kurs jest przeznaczony dla biologów, którzy chcą poprawnie analizować i wizualizować swoje dane. Z tego względu kurs skupia się na wyborze i dopasowaniu właściwych metod do danych, a nie na aspektach matematycznych metod statystycznych. Szczególny nacisk położony jest na interpretację uzyskanych wyników. Oczywiście w ramach kursu nie jest możliwe omówienie wszystkich metod statystycznych stosowanych przez biologów, kurs skupia się na tych najpopularniejszych. Wszystkie zagadnienia są bogato ilustrowane przykładami w R.

 

Jakie będą efekty?
Po zakończeniu kursu kursant powinien potrafić wybrać właściwą metodę statystyczną i zastosować ją do danych biologicznych z wykorzystaniem środowiska R. Powinien również umieć zinterpretować uzyskane wyniki. Ponadto powinien rozpoznać sytuacje, które nie były omawiane w ramach kursu i potrafić zadać odpowiednie pytania podczas konsultacji statystycznych.

 

Czy sobie poradzisz? Na pewno!
Przewidujemy wprowadzenie, aby każdy uczestnik, nawet zupełnie początkujący, mógł sobie bez problemu poradzić z zaplanowanymi zadaniami. Podstwowa znajomość środowiska R jest mile widziana, ale nie jest niezbędna.

Newsletter