- Bioinformatyka i biologia systemów, stacjonarne, pierwszego stopnia
- Informatyka, stacjonarne, pierwszego stopnia
- Matematyka, stacjonarne, pierwszego stopnia
- Bioinformatyka i biologia systemów, stacjonarne drugiego stopnia
- Informatyka, stacjonarne, drugiego stopnia
- Matematyka, stacjonarne, drugiego stopnia
Wprowadzenie do analizy statystycznej w środowisku R 4016-WASSR-OG
Celem zajęć jest zapoznanie uczestników ze środowiskiem R, na co składa się: umiejętność obsługi, rozumienie sposobu organizacji danych, samodzielne wyszukiwanie rozwiązania problemu, analiza danych i ich prezentacja, znajomość możliwości i ograniczeń programu.
Zrealizowane zostaną nastepujące tematy:
1. Czym jest R: idea, przeszłość i teraźniejszość. Instalacja i konfiguracja R (Mac/Windows) oraz RStudio. Przygotowanie środowiska pracy: interfejs, sesja, przestrzeń roboczej, pakiety i ich instalacja, wczytywanie i zapisywanie danych (2h)
2. Struktura środowiska R: typ, klasa, metoda; postacie danych: skalar, wektor, macierz, ramka danych, lista. Indeksowanie. Podstawowe operacje matematyczne. Podstawowe funkcje statystyczne. (2h)
3. Przygotowanie danych do analizy: funkcje kontrolne, zastosowanie funkcji apply, czyszczenie danych. (2h)
4. Funkcje użytkownika (4h)
5. Graficzna prezentacja danych: omówienie pakietów base, lattice, ggplot2. (4h)
6. Modele liniowe z efektami stałymi, losowymi i mieszanymi (w tym hierarchiczne modele liniowe). Uogólnione modele liniowe. (4h)
7. Podstawy wielowymiarowej analizy statycznej w R. (2h)
8. Regresja logistyczna, regresja Poissona, modele Rascha (4h).
9. Graficzna prezentacja danych przestrzennych (2h).
10. Dobre praktyki; ułatwianie sobie pracy, kwestia replikowalności analiz; prawa autorskie i cytowanie. Współpraca R z innymi programami. Zasady pisania raportów empirycznych (4h)
Zakłada się, że na każdą godzinę zajęć przypadnie około 1,5 godziny pracy własnej studenta w domu. Wykonanie prac potrzebny do zaliczenia powinno zająć 15h, co daje łącznie 90 godzin pracy.
Rodzaj przedmiotu
Efekty kształcenia
Po ukończeniu kursu student:
- rozumie zasadę rozwoju oprogramowania open source i kwestii poszanowania praw autorskich
- potrafi poprawnie przygotować program do pracy, tzn. zainstalować, ściągnąć potrzebne pakiety, zapisać obszar roboczy itp.
- przeprowadza podstawowe obliczenia w R (dodawanie wektorów, wyciąganie średniej, wprowadzenie danych z pliku .csv itp.)
- rozpoznaje, jakie pakiety są potrzebne do danej analizy, a także samodzielnie odnajduje rozwiązanie napotkanych problemów korzystając z pomocy internetu i społeczności statystyków
- przeprowadza podstawowe analizy statystyczne za pomocą R
- sporządza poprawne i estetyczne wykresy (rozrzutu, liniowe, trójwymiarowe itp.)
- potrafi napisać prostą funkcję w R
Kryteria oceniania
- obecność (dopuszczalne 2 nieobecności, w przypadku większej liczby możliwość ich odrobienia za pomocą prac dodatkowych).
- prace domowe wykonane podczas zajęć (4) (po 12,5% oceny)
- projekt wykonany na koniec zajeć: przeprowadzenie pełnej analizy danych z własnych badań (lub danych zastanych: GUS - bank danych lokalnych, Archiwum Danych Społecznych itp.), należy sporządzić raport z analizy, zawierający opis hipotezy, wyniki analiz i ich graficzną prezentację wykonaną w R; należy też dostarczyć odpowiedni skrypt z R, który umożliwi zreplikowanie analiz przez prowadzącego (50%)
Łącznie: 100%
=< 50% <- 2
51 - 60 <- 3
61 - 70 <- 3,5
71 - 80 <- 4
81 - 90 <-4,5
91- 100 <-5
Literatura
Literatura pomocnicza:
Przemysław Biecek. Analiza danych z programem R. Modele liniowe z efektami stałymi, losowymi i mieszanym. PWN 2011.
Przemysław Biecek. Przewodnik po pakiecie R. Wrocław 2008
Eugeniusz Gatnar, Marek Walesiak: Statystyczna analiza danych z wykorzystaniem programu R. PWN, 2009.
Tomasz Górecki. Podstawy statystyki z przykładami w R. Wyd. BTC, 2011.
Winston Chang: R Graphics Cookbook
Skrypty dostępne w internecie:
Łukasz Komsta: http://cran.r-project.org/doc/contrib/Komsta-Wprowadzenie.pdf
Mikołaj Rybiński: http://www.mimuw.edu.pl/~trybik/edu/0809/rps/r-skrypt.pdf
Materiały ze strony: http://www.r-project.org/
Więcej informacji
Więcej informacji o poziomie przedmiotu, roku studiów (i/lub semestrze) w którym się odbywa, o rodzaju i liczbie godzin zajęć - szukaj w planach studiów odpowiednich programów. Ten przedmiot jest związany z programami:
- Bioinformatyka i biologia systemów, stacjonarne, pierwszego stopnia
- Informatyka, stacjonarne, pierwszego stopnia
- Matematyka, stacjonarne, pierwszego stopnia
- Bioinformatyka i biologia systemów, stacjonarne drugiego stopnia
- Informatyka, stacjonarne, drugiego stopnia
- Matematyka, stacjonarne, drugiego stopnia
Dodatkowe informacje (np. o kalendarzu rejestracji, prowadzących zajęcia, lokalizacji i terminach zajęć) mogą być dostępne w serwisie USOSweb: