Statystyka i uczenie maszynowe 1100-4SUM(D)
1) Podstawy języka Python. Operacje na wielowymiarowych tablicach. Sporządzanie różnego rodzaju wykresów.
2) Rozwiązywanie równań nieliniowych. Minimalizacja w wielu wymiarach. Minimalizacja z więzami. Rozwiązywanie układów równań liniowych. Diagonalizacja macierzy. Rozkład według wartości osobliwych.
3) Losowanie próbek z różnych rozkładów prawdopodobieństwa. Histogramowanie. Estymacja parametrów rozkładu na podstawie próby. Korelacje i macierz kowariancji. Analiza składowych głównych.
4) Statystyczna weryfikacja hipotez. Hipotezy parametryczne i nieparametryczne. Testy istotności, zgodności i jakości dopasowania. Poziom istotności i poziom ufności. Statystyki chi-kwadrat, Studenta i Fishera.
5) Całkowanie Monte-Carlo w jednym i wielu wymiarach. Całkowanie po skomplikowanych obszarach. Techniki redukcji wariancji. Symulacje Monte-Carlo.
6) Regresja liniowa i nieliniowa. Metoda najmniejszych kwadratów. Równania normalne. Estymacja kowariancji. Propagacja błędu i korytarz błędu.
7) Kolokwium.
8) Regresja logistyczna. Metoda największej wiarygodności. Klasyfikacja binarna i wieloraka.
9) Naiwny klasyfikator Bayesa. Gaussowska analiza dyskryminacyjna.
10) Maszyny wektorów nośnych. Liniowo separowalne zbiory danych.
11) Nieliniowo separowalne zbiory danych. Iloczyn skalarny i funkcja jądrowa.
12) Poprawa jakości klasyfikacji. Algorytm Adaptive Boost. Klasyfikatory słabe i mocne.
13) Liniowe i nieliniowe sieci neuronowe. Perceptron Rosenblatta. Wielowarstwowe sieci perceptronów. Metoda wstecznej propagacji błędu. Techniki uczenia.
14) Uczenie nienadzorowane. Analiza skupień. Algorytm k-średnich. Gaussowski model mieszany. Uczenie z rywalizacją. Sieci Kohonena.
15) Kolokwium.
Rodzaj przedmiotu
Założenia (opisowo)
Efekty kształcenia
1) Swobodne posługiwanie się językiem Python oraz jego pakietami poświęconymi rachunkowi macierzowemu, metodom numerycznym, statystyce, uczeniu maszynowemu i wizualizacji danych.
2) Rozwiązywanie prostych zadań numerycznych przy pomocy gotowych bibliotek.
3) Samodzielna implementacja symulacji Monte-Carlo i testów statystycznych oraz statystyczna analiza danych i weryfikacja hipotez przy pomocy gotowych bibliotek.
4) Samodzielna implementacja algorytmów uczenia maszynowego oraz rozwiązywanie typowych zadań regresji i klasyfikacji danych przy pomocy gotowych bibliotek.
Kryteria oceniania
Za zajęcia można otrzymać 100 punktów według następującej tabeli:
Obecności: 30
Pierwsze kolokwium: 35
Drugie kolokwium: 35
Ocena jest wystawiana według następującej tabeli:
0-50: 2.0
51-60: 3.0
61-70: 3.5
71-80: 4.0
81-90: 4.5
91-100: 5.0
Więcej informacji
Dodatkowe informacje (np. o kalendarzu rejestracji, prowadzących zajęcia, lokalizacji i terminach zajęć) mogą być dostępne w serwisie USOSweb: