Wprowadzenie do Machine Learning 1600-SZD-SPEC-WML-EF
Celem kursu jest przekazanie uczestnikom wiedzy teoretycznej związanej z budowaniem i ewaluacją modeli predykcyjnych oraz intuicyjnym objaśnieniem różnych algorytmów uczenia maszynowego. Studenci dowiedzą się, jak wybierać, implementować, oceniać i porównywać modele predykcyjne dla zadań regresji i klasyfikacji oraz jak stosować narzędzia uczenia maszynowego w R na rzeczywistych danych. Dlatego wymagana jest przynajmniej podstawowa znajomość R. NIE będziemy omawiać wszystkich szczegółów technicznych metod uczenia maszynowego, takich jak algorytmy optymalizacyjne i właściwości teoretyczne. Większość osób nie potrzebuje głębokiego zrozumienia tych aspektów, aby stać się świadomymi użytkownikami algorytmów ML. Celem jest skupienie się na intuicjach, mocnych i słabych stronach różnych algorytmów oraz przedstawienie metod, które są najczęściej wykorzystywane w zastosowaniach praktycznych. Opiszemy podstawowe założenia i intuicję wraz z kompromisami stojącymi za każdym z podejść, zakładając, że student zna podstawowe pojęcia matematyczne (np. testy statystyczne, zapis macierzowy). Kurs zaplanowany jest w formie warsztatu. Każdy temat rozpoczniemy wprowadzeniem teoretycznym (prezentacją), a następnie zilustrujemy praktycznymi przykładami wykonanymi w R (RStudio) na rzeczywistych zbiorach danych. Szczegółowy wykaz tematów: (1) Czym jest uczenie maszynowe? Podstawowa terminologia, (2) Benchmarki parametryczne – regresja liniowa i regresja logistyczna, (3) Metryki oceny modelu, problem nadmiernego dopasowania, (4) Walidacja modelu – dlaczego i jak?, (5) Metody regularyzacji: regresja grzbietowa, LASSO i sieć elastyczna, (6) Metoda k-najbliżych sąsiadów, (7) Drzewa decyzyjne i regresyjne, (8) Rozszerzenia drzew: lasy losowe i algorytmy wzmacniane, (9) Bilansowanie próby, (10) Podstawy wytłumaczalnej sztucznej inteligencji (XAI).
Rodzaj przedmiotu
Koordynatorzy przedmiotu
Efekty kształcenia
Wiedza | Zna i rozumie:
WG_01 w stopniu umożliwiającym rewizję istniejących paradygmatów - światowy dorobek, obejmujący podstawy teoretyczne oraz zagadnienia ogólne i wybrane zagadnienia szczegółowe – właściwe dla danej dyscypliny w ramach nauk społecznych
WG_02 - główne tendencje rozwojowe dyscyplin w ramach nauk społecznych, w których odbywa się kształcenie
WG_03 - metodologię badań naukowych w obrębie dyscyplin naukowych z dziedziny nauk społecznych
WK_01 - fundamentalne dylematy współczesnej cywilizacji z perspektywy nauk społecznych
Umiejętności | Potrafi:
UK_05 - posługiwać się językiem obcym na poziomie B2 Europejskiego Systemu Opisu Kształcenia Językowego z wykorzystaniem fachowej terminologii właściwej danej dyscyplinie w ramach nauk społecznych w stopniu umożliwiającym uczestnictwo w międzynarodowym środowisku naukowym i zawodowym
Kompetencje społeczne | Jest gotów do:
KO_01 - wypełniania zobowiązań społecznych badaczy i twórców
KO_02 wypełniania zobowiązań społecznych i podejmowania działań na rzecz interesu publicznego, zwłaszcza w zakresie inicjowania działań na rzecz interesu publicznego
KO_03 - myślenia i działania w sposób przedsiębiorczy
Kryteria oceniania
Opis wymagań związanych z uczestnictwem w zajęciach, w tym dopuszczalnej liczby nieobecności podlegających usprawiedliwieniu: Zrozumienie podstawowych pojęć matematycznych i statystycznych (np. zapis macierzowy, prawdopodobieństwo, testy statystyczne, istotność, wartość p), wcześniejsza przynajmniej podstawowa znajomość języka programowania R i interfejsu RStudio. Dozwolona jedna usprawiedliwiona nieobecność.
Zasady zaliczania zajęć i przedmiotu (w tym zaliczania poprawkowego): Obecność na zajęciach oraz przygotowanie samodzielnego projektu analitycznego na zbiorze danych wybranym przez studenta w uzgodnieniu z prowadzącym. Zbiór danych powinien być dostatecznie duży (liczba kolumn * liczba obserwacji powyżej 100 tysięcy) i składać się z co najmniej 20 zmiennych różnych typów (numeryczne, jakościowe).
Metody weryfikacji efektów uczenia się: Aktywne uczestnictwo w zajęciach oraz ocena przygotowanych projektów zaliczeniowych.
Kryteria oceniania: Poprawność przeprowadzonej analizy danych, zastosowanie właściwych algorytmów uczenia maszynowego, właściwy dobór hiperparametrów modeli, ocena skuteczności modeli na losowo wybranej próbie uczącej i testowej, omówienie i interpretacja wyników, poprawność językowa i formalna przedstawionego raportu z badania.
Praktyki zawodowe
-
Literatura
Gareth James, Daniela Witten, Trevor Hastie and Robert Tibshirani (2021/2023), “Introduction to statistical learning. With Applications in R/Python”, Springer-Verlag, freely available online https://www.statlearning.com/ Hastie Trevor, Robert Tibshirani and Jerome Friedman (2009), “Elements of statistical learning” , Springer-Verlag, freely available online: https://hastie.su.domains/ElemStatLearn/
Więcej informacji
Dodatkowe informacje (np. o kalendarzu rejestracji, prowadzących zajęcia, lokalizacji i terminach zajęć) mogą być dostępne w serwisie USOSweb: