Uczenie statystyczne (wspólnie z 1000-317bSML) 1000-2M21US
Szczegółowy program
Statystyka eksploracyjna (2-3 zajęcia)
Basic summary statistic (wartość średnia, mediana, wariancja próbki, etc.)
Wizualizacja danych (histogram, wykres pudełkowy, estymator jądrowy gęstości)
Analiza głównych składowych
Klasteryzacja, klasteryzacja hierarchiczna, k-średnie, k-medoidy
Teoria statystyki (4-5 zajęć)
Podstawowe definicje (modele statystyczne, statystyki, wiarygodność, etc.)
Teoria szacowania (estymatory największej wiarygodności, efektywność, błąd średniokwadratowy, kompromis między obciążeniem a wariancją, przedziały ufności)
Testowanie hipotez statystycznych (błędy typu I i II, moc testu, poziom istotności, wartość p)
Problemy związane z wartością p (efekt rozmiaru, testowanie wielu hipotez)
Wnioskowanie bayesowskie (rozkład a priori, rozkład a posteriori, ryzyko bayesowskie i estymator bayesowski, przedziały wiarygodności)
Odległość między miarami prawdopodobieństwa (dywergencja Kullbacka-Leiblera, miara maksymalnej różnicy, etc.)
Proste modele regresyjne i klasyfikacyjne (3-4 zajęć)
Regresja liniowa
Klasyfikacja. Regresja logistyczna, LDA, QDA
Walidacja krzyżowa i bootstrap
Wybór modelu i regularyzacja, regresja grzbietowa, metoda Lasso, algorytm forward-backward
Modele zaawansowane (3 zajęcia)
Modele drzewiaste, bagging, lasy losowe, boosting
Maszyna wektorów nośnych
Modele nieliniowe: funkcje sklejane, uogólnione modele addytywne
Rodzaj przedmiotu
Efekty kształcenia
Wiedza: student zna i rozumie
* w pogłębionym stopniu - podstawową wiedzę z działów matematyki niezbędnych do studiowania uczenia maszynowego (rachunek prawdopodobieństwa, statystyka, analiza wielowymiarowa, i algebra liniowa)];
* w uporządkowany i podbudowany teoretycznie sposób wiedzę w zakresie podstawowych narzędzi statystycznych stosowanych w modelowaniu i analizie danych.
Umiejętności: student potrafi
* konstruować rozumowania matematyczne;
* wyrażać problemy w języku matematyki;
* stosować techniki nowoczesnej statystycznej analizy danych.
Kompetencje społeczne: student jest gotów do
* krytycznej oceny posiadanej wiedzy i odbieranych treści;
* uznawania znaczenia wiedzy w rozwiązywaniu problemów poznawczych i praktycznych oraz zasięgania opinii ekspertów w przypadku trudności z samodzielnym rozwiązaniem problemu;
* myślenia i działania w sposób przedsiębiorczy.
Kryteria oceniania
Test końcowy oraz zadanie programistyczne na ocenę
Literatura
1. Trevor Hastie, Robert Tibshirani, Jerome H., The Elements of Statistical Learning: Data Mining, Inference, and Prediction, Springer, Berlin
2. Andrew Ng, Machine Learning Yearning, https://www.deeplearning.ai/machine-learning-yearning/
Więcej informacji
Więcej informacji o poziomie przedmiotu, roku studiów (i/lub semestrze) w którym się odbywa, o rodzaju i liczbie godzin zajęć - szukaj w planach studiów odpowiednich programów. Ten przedmiot jest związany z programami:
Dodatkowe informacje (np. o kalendarzu rejestracji, prowadzących zajęcia, lokalizacji i terminach zajęć) mogą być dostępne w serwisie USOSweb: