Praktyczny Machine Learning w Pythonie 2400-ZEWW758
•Wprowadzenie do machine learningu
◦Data science, Data Mining, Deep Learning, Big Data i Machine learning.
◦Znaczenie machine learningu dla biznesu
◦Machine learning jako funkcja.
•Supervised learning
◦Problem regresji i klasyfikacji. Funkcja celu.
◦Bias - variance dillema.
◦Regresja liniowa i logistyczna (przypomnienie)
◦Drzewa decyzyjne.
◦Proste drzewa decyzyjne.
◦Random Forest.
◦Boosting.
◦Sieci neuronowe.
•Unsupervised learning
◦Klastrowanie
◦Nie tylko K-Means: porównanie licznych algorytmów klastrowania.
◦Klątwa wymiarowości.
◦Redukcja wymiarów:
▪Principal component analysis (PCA)
▪Self-organizing map (SOM)
▪t-distributed stochastic neighbor embedding (t-SNE)
•Reinforcement Learning
Rodzaj przedmiotu
Koordynatorzy przedmiotu
Efekty kształcenia
WIEDZA
Zna w sposób pogłębiony metody modelowania predykcyjnego. Zna i rozumie metody oparte o drzewa decyzyjne oraz sieci neuronowe. Zna źródła pozyskiwania dużych zbiorów danych.
Zna sposoby wykorzystania języka programowania Python na potrzeby analizy danych
Zna możliwości aplikacyjne przedstawionych metod statystycznych i na ich podstawie może tworzyć analizy na potrzeby analiz rynkowych w pracy lub na potrzeby własnej firmy.
UMIEJĘTNOŚCI
Potrafi dobrać odpowiednią metodę modelowania do postawionego problemu. Na podstawie uzyskanych wyników potrafi formułować własne opinie i aplikować wiedzę teoretyczną do opisu i analizy zjawisk ekonomicznych.
Potrafi wyszukać dane, zastosować modelowanie predykcyjne, udokumentować proces analityczny oraz sporządzić opis przeprowadzonych czynności.
KOMPETENCJE SPOŁECZNE
Praktyka wykorzystania języka programowania Python pozwala na zwiększenie umiejętności samodzielnego uczenia i zwiększa kompetencje w programowaniu obiektowym.
Przeprowadzone na zajęciach ćwiczenia i praktyki modelowania pozwalają studentowi być krytycznym względem wyników uzyskiwanych w pracach naukowych.
Kryteria oceniania
Zaliczenie odbywać się będzie na podstawie testu końcowego (test jednokrotnego wyboru) oraz pracy zaliczeniowej/projektu, którego celem jest wykorzystanie umiejętności zdobytych w trakcie semestru w analizie praktycznego problemu.
Test końcowy 40%
Projekt (realizowany poza zajęciami) 60%
Dodatkową możliwością zaliczenia przedmiotu jest udział i osiągnięcie dobrego wyniku w konkursie analizy danych (np. kaggle). Szczegóły podaną zostaną na pierwszych zajęciach.
Literatura
Harrington, Peter. Machine learning in action. Vol. 5. Greenwich, CT: Manning, 2012
Więcej informacji
Dodatkowe informacje (np. o kalendarzu rejestracji, prowadzących zajęcia, lokalizacji i terminach zajęć) mogą być dostępne w serwisie USOSweb: