Data mining 1000-2M03DM
1. Wstęp: Przedstawienie problemów "eksploracji danych" (ang. data mining - DM) oraz "odkrywania wiedzy" (ang. Knowledge Discovery from Databases - KDD). Podstawowe pojęcia i zastosowania DM i KDD w praktyce.
2. Efektywne metody szukania reguł asocjacyjnych: algorytmy Apriori, AprioriTid, FP growth, ...
3. Problem klasyfikacji: Metody kNN, Naive Bayes, sieci Bayesowskie. Metody oceniania klasyfikatorów.
4. Miara entropii, Drzewo decyzyjne, Drzewo decyzyjne dla dużych zbiorów danych.
5. Metody grupowania danych, analiza skupień (klastrowanie). Metody grupowania w dużych zbiorach danych.
6. Teoria uczenia się.
7. Wzorce, klasyfikacja zbiorem reguł w dużych zbiorach danych.
8. Metody obróbki i przygotowywania danych.
9. Ukryty model Markowa i jego zastosowania w data mining.
10. Wzorce czasowe i sekwencyjne.
11. OLAP i Data mining.
12. Web mining i text mining.
Kierunek podstawowy MISMaP
matematyka
Rodzaj przedmiotu
Tryb prowadzenia
Założenia (lista przedmiotów)
Założenia (opisowo)
Koordynatorzy przedmiotu
Efekty kształcenia
Wiedza i umiejętności:
1. Zna podstawowe klasy problemów związanych z eksploracją i odkrywaniem wiedzy z danych.
2. Zna i potrafi wykorzystać w praktyce metody analizy koszykowej, rozumie działanie i potrafi stosować algorytmy wyszukiwania częstych zbiorów.
3. Zna i potrafi stosować podstawowe algorytmy ML.
4. Potrafi ewaluować skuteczność modeli ML w problemach klasyfikacji, regresji oraz grupowania.
5. Zna podstawowe techniki przetwarzania tekstów na potrzeby konstruowania modeli ML i potrafi je zastosować w praktyce.
6. Potrafi konstruować proste systemy rekomendacyjne i rozumie ich działanie.
7. Zna podstawowe metody konstruowania modeli predykcyjnych dla szeregów czasowych. Potrafi je zastosować dla rzeczywistych zbiorów danych oraz ocenić ich faktyczną skuteczność.
8. Zna najważniejsze aktualne trendy w dziedzinie uczenia maszynowego i odkrywania wiedzy z danych.
Kompetencje społeczne:
1. Potrafi przygotować raport z eksploracyjnej analizy danych przedstawiający najważniejsze informacje przy wykorzystaniu technik wizualizacji danych.
2. Potrafi zaprezentować wyniki przeprowadzonych analiz.
Kryteria oceniania
Ocena końcowa jest ustalana podstawie sumy punktów z laboratorium i egzaminu.
Dodatkowo, studenci szkoły doktorskiej mogą zaliczać przedmiot przez przygotowanie specjalnego projektu związanego z startem w międzynarodowym konkursie eksploracji danych.
Literatura
1. "Data Mining: Concepts and Techniques". J. Han and M. Kamber. Morgan Kaufmann Publishers. 2001
2. "Data Mining: Practical Machine Learning Tools and Techniques with Java Implementations". I. Witten and E. Frank. Morgan Kaufmann Publishers. 2000.
3. "Advances in Knowledge Discovery and Data Mining". Eds.: Fayyad, Piatetsky-Shapiro, Smyth, and Uthurusamy. The MIT Press, 1995.
4. Jure Leskovec, Anand Rajaraman, and Jeffrey David Ullman. 2014. Mining of Massive Datasets (2nd. ed.). Cambridge University Press, USA.
Więcej informacji
Więcej informacji o poziomie przedmiotu, roku studiów (i/lub semestrze) w którym się odbywa, o rodzaju i liczbie godzin zajęć - szukaj w planach studiów odpowiednich programów. Ten przedmiot jest związany z programami:
- Informatyka, stacjonarne, pierwszego stopnia
- Informatyka, stacjonarne, drugiego stopnia
- Matematyka, stacjonarne, drugiego stopnia
Dodatkowe informacje (np. o kalendarzu rejestracji, prowadzących zajęcia, lokalizacji i terminach zajęć) mogą być dostępne w serwisie USOSweb: