Statistics and Exploratory Data Analysis 2400-DS1ST
Lista zagadnień omawianych podczas laboratorium obejmuje:
Statystyki opisowe:
1. Pojęcie zmiennej losowej, rozkład zmiennej losowej, funkcja gęstości, dystrybuanta
2. Miary położenia rozkładu: średnia, moda (dominanta), mediana, trimean, mid-mean, średnia obcięta, średnia winsorowska, kwartyle, decyle, percentyle
3. Miary rozproszenia rozkładu: rozstęp, wariancja, odchylenie standardowe, rozstęp międzykwartylowy, średnie odchylenie bezwzględne
4. Wyższe momenty rozkładu: współczynnik asymetrii, kurtoza
5. Obserwacje odstające: podejście IQR, Z-score, zmodyfikowany Z-score
6. Estymacja parametrów rozkładu zmiennej losowej (rozkład normalny, rozkład Gamma, rozkład Beta, rozkład log-normalny, rozkład Pareto, etc.)
Analiza graficzna:
1. Histogram
2. Estymacja funkcji gęstości (Kernel density)
3. Wykres punktowy
4. Wykres pudełkowy
5. Wykres QQ, wykres PP
6. Wykres przebiegu i inne
Wnioskowanie statystyczne
1. Testy jednostronne (test t, test z, test dwumianowy, test Chi-kwadrat)
2. Testy dla dwóch prób niezależnych (test t, test Wilcoxona, test Chi-kwadrat, test Fischera)
3. Testy dla więcej niż dwóch prób niezależnych (ANOVA, Kruskal-Wallis, test Chi-kwadrat)
4. Testy dla dwóch prób zależnych (test t dla prób zależnych, test Wilcoxona dla prób zależnych, test McNemara/test symetrii)
5. Testy dla więcej niż dwóch prób zależnych (ANOVA dla prób zależnych/model efektów mieszanych, test Q-Cochran’a/test Friedmana)
Miary zależności
1. Współczynniki korelacji Pearson’a, Spearman’a i Kendalla
2. Współczynnik V-Cramera
Moc testów i wielkość próby
1. Podstawowe testy
2. Procedury testowania wielu hipotez.
Rodzaj przedmiotu
Koordynatorzy przedmiotu
Efekty kształcenia
Studenci nauczą się w jaki sposób obliczyć i interpretować statystyki opisowe oraz wykresy zmiennych losowych, a także przeprowadzić wstępną analizę danych wraz z testowaniem oraz weryfikacją hipotez dotyczących rozkładu zmiennych. Efektem końcowym kursu jest umiejętność przeprowadzenia analizy statystycznej wraz z interpretacją otrzymanych wyników.
K_W01, K_U01, K_U02, K_U03, K_U04, K_U05, KS_01
Kryteria oceniania
Warunkiem zaliczenia przedmiotu jest:
• Obecność na zajęciach
• Zaliczenie egzaminu pisemnego w formie „open-book”
Literatura
Peng R. D., Exploratory data analysis with R, 2016.
Magnificio S. S., Summary and analysis of extension education program evaluation in R, 2016.
Wagenmakers E.-J. & Gronau Q. F., A compendium of clean graphs in R, online access.
Delignette-Muller M. & Dutang C., Fitdistrplus: an R Package for fitting distributions. Journal of Statistical Software, 64(4) 2015
Blomberg S. P., Power analysis using R, 2014.
Delorme P., De Micheaux, P. L., Liquet B., and Riou, J. Type-II generalized family-wise error rate formulas with application to sample size determination. Statist. Med. 2016.
Więcej informacji
Dodatkowe informacje (np. o kalendarzu rejestracji, prowadzących zajęcia, lokalizacji i terminach zajęć) mogą być dostępne w serwisie USOSweb: