Uczenie statystyczne 1000-317bSML
Szczegółowy program
Statystyka eksploracyjna (2-3 zajęcia)
Basic summary statistic (wartość średnia, mediana, wariancja próbki, etc.)
Wizualizacja danych (histogram, wykres pudełkowy, estymator jądrowy gęstości)
Analiza głównych składowych
Klasteryzacja, klasteryzacja hierarchiczna, k-średnie, k-medoidy
Teoria statystyki (4-5 zajęć)
Podstawowe definicje (modele statystyczne, statystyki, wiarygodność, etc.)
Teoria szacowania (estymatory największej wiarygodności, efektywność, błąd średniokwadratowy, kompromis między obciążeniem a wariancją, przedziały ufności)
Testowanie hipotez statystycznych (błędy typu I i II, moc testu, poziom istotności, wartość p)
Problemy związane z wartością p (efekt rozmiaru, testowanie wielu hipotez)
Wnioskowanie bayesowskie (rozkład a priori, rozkład a posteriori, ryzyko bayesowskie i estymator bayesowski, przedziały wiarygodności)
Odległość między miarami prawdopodobieństwa (dywergencja Kullbacka-Leiblera, miara maksymalnej różnicy, etc.)
Proste modele regresyjne i klasyfikacyjne (3-4 zajęć)
Regresja liniowa
Klasyfikacja. Regresja logistyczna, LDA, QDA
Walidacja krzyżowa i bootstrap
Wybór modelu i regularyzacja, regresja grzbietowa, metoda Lasso, algorytm forward-backward
Modele zaawansowane (3 zajęcia)
Modele drzewiaste, bagging, lasy losowe, boosting
Maszyna wektorów nośnych
Modele nieliniowe: funkcje sklejane, uogólnione modele addytywne
Rodzaj przedmiotu
Koordynatorzy przedmiotu
Efekty kształcenia
Wiedza: student zna i rozumie
* w pogłębionym stopniu - podstawową wiedzę z działów matematyki niezbędnych do studiowania uczenia maszynowego (rachunek prawdopodobieństwa, statystyka, analiza wielowymiarowa, i algebra liniowa) [K_W05];
* w uporządkowany i podbudowany teoretycznie sposób wiedzę w zakresie podstawowych narzędzi statystycznych stosowanych w modelowaniu i analizie danych [K_W07].
Umiejętności: student potrafi
* konstruować rozumowania matematyczne [K_U06];
* wyrażać problemy w języku matematyki [K_U07];
* stosować techniki nowoczesnej statystycznej analizy danych [K_U10].
Kompetencje społeczne: student jest gotów do
* krytycznej oceny posiadanej wiedzy i odbieranych treści [K_K01];
* uznawania znaczenia wiedzy w rozwiązywaniu problemów poznawczych i praktycznych oraz zasięgania opinii ekspertów w przypadku trudności z samodzielnym rozwiązaniem problemu [K_K02];
* myślenia i działania w sposób przedsiębiorczy [K_K03].
Kryteria oceniania
Wpływ na ocenę końcową: test końcowy (60%), dwa zadania programistyczne na ocenę (40%), aktywność w trakcie labów (10%).
Literatura
1. Trevor Hastie, Robert Tibshirani, Jerome H., The Elements of Statistical Learning: Data Mining, Inference, and Prediction, Springer, Berlin
2. Andrew Ng, Machine Learning Yearning, https://github.com/ajaymache/machine-learning-yearning
Więcej informacji
Dodatkowe informacje (np. o kalendarzu rejestracji, prowadzących zajęcia, lokalizacji i terminach zajęć) mogą być dostępne w serwisie USOSweb: