Machine learning 2700-M-ZBD-D2ML
Zakres tematyczny:
1. Python:
- definiowanie zmiennych;
- podstawowe typy danych;
- pętle;
- instrukcje warunkowe;
- definiowanie funkcji, klas;
- iteratory, generatory;
- operacje na plikach (w tym konteksty with)
2. Biblioteki do analizy danych w języku python: jupyter, pandas, scikit-learn .
3. Asocjacje - analiza koszyka zakupów + wykrywanie wzorców częstych (fp-tree, prefixspan).
4. Systemy rekomendacyjne, PageRank.
5. TextMining w Pythonie.
6. Podejście probablistyczne na przykładach - co to jest model probablistyczny.
7. Dimensionality Reduction/Representation learning.
8. Podstawy ekstrakcji informacji z danych tekstowych z użyciem Open Sourcowych bibliotek Pythona
9. Analiza dużych zbiorów tekstowych przy pomocy systemu subMIND.AI.
10. Podejście probablistyczne na przykładach - co to jest model probablistyczny.
11. Dimensionality Reduction/Representation learning.
12. Konstruowanie sieci neuronowych.
- wykorzystanie sieci neuronowych do klasyfikacji języków
- uwagi przygotowawcze
- projekt kodowania i testowania
- dane
- pisanie testu podstawowego dla języka
- przejście do klasy network
- dostrajanie sieci neuronowej
- precyzja i czułość w sieciach neuronowych
- podsumowanie przykładu.
Rodzaj przedmiotu
Koordynatorzy przedmiotu
Efekty kształcenia
Po ukończeniu przedmiotu student:
Wiedza
- student ma wiedzę na temat metod i algorytmów uczenia maszynowego;
- student rozumie potrzebę poszerzania swojej wiedzy i praktycznych umiejętności w zakresie metod uczenia maszynowego; potrafi w sposób samodzielny i kreatywny wybrać odpowiednie rozwiązanie dla określonego problemu badawczego.
Umiejętności
- student potrafi korzystać z pakietów programu Python dedykowanych algorytmom uczenia maszynowego;
- potrafi przygotować dokumentację zaimplementowanego rozwiązania ze szczegółowym omówieniem wyników, wyciągnąć wnioski oraz wyczerpująco je uzasadnić.
Kryteria oceniania
Metody dydaktyczne:
Laboratorium: rozwiązywanie problemów badawczych za pomocą algorytmów uczenia maszynowego przy wykorzystaniu specjalistycznych bibliotek programu Python. Dyskusja. Praca w zespole.
Kryteria oceniania:
Ocena z laboratorium wystawiana będzie na podstawie wyników z projektów (80%) oraz aktywności i obecności na zajęciach (20%).
Literatura
Literatura obowiązkowa
1. M. Gągolewski, M. Bartoszuk, A. Cena, Przetwarzanie i analiza danych w języku Python, PWN, 2016
2. W. Richert, L.P. Coelho, Building Machine Learning Systems with Python, Packt Publishing, 2013
3. M. Szeliga, Data science i uczenie maszynowe, Wydawnictwo naukowe PWN, Warszawa, 2017.
4. T. Morzy, Eksploracja danych – metody i algorytmy, Wydawnictwo naukowe PWN, Warszawa, 2013.
5. Christopher M. Bishop, Pattern Recognition and Machine Learning, Springer, 2007
Literatura uzupełniająca
6. J. Koronacki, J. Ćwik: Statystyczne systemy uczące się. Wydanie drugie, EXIT, Warszawa, 2007
7. W. McKinney, Python for Data Analysis. Data Wrangling with Pandas, NumPy, and IPython, O'Reilly Media, 2012
8.D.T. Larose, Metody i modele eksploracji danych, Wydawnictwo naukowe PWN, Warszawa, 2012.
Więcej informacji
Dodatkowe informacje (np. o kalendarzu rejestracji, prowadzących zajęcia, lokalizacji i terminach zajęć) mogą być dostępne w serwisie USOSweb: