Przygotowanie danych do analiz 2400-SP-DS-PDA
Celem kursu jest zapoznanie słuchaczy z metodami przygotowania danych do analiz. Jakość analiz statystycznych zależy od jakości danych, na których są przeprowadzane – trudno spodziewać się wiarygodnych wyników analiz, gdy wykorzystane dane są „śmieciowe”. Właściwie przygotowane dane to co najmniej połowa sukcesu ich analizy. W pierwszej kolejności słuchacze poznają metody sprawdzania jakości danych oraz ich czyszczenia z wykorzystaniem tzw. wyrażeń regularnych, nauczą się sprawdzać czy dane zapisane w tabeli odpowiadają przyjętemu wzorcowi (np. właściwy kod pocztowy, data, adres, nr PESEL, itp.). Kolejnym ważnym zagadnieniem, które zostanie poruszone na zajęciach, będą braki danych, które eliminują cały rekord z analiz statystycznych. Słuchacze poznają najczęstsze metody imputacji braków danych – zastępowania ich w sensowny sposób wartościami niebrakującymi.
Rodzaj przedmiotu
Koordynatorzy przedmiotu
Tryb prowadzenia
W cyklu 2024: mieszany: w sali i zdalnie | W cyklu 2023: w sali |
Kryteria oceniania
Test zaliczeniowy - do zaliczenia wymagana jest 50% poprawnych odpowiedzi na 10 pytań.
Literatura
Materiały przygotowywane przez wykładowcę i udostępniane uczestnikowi na platformie Google Drive.
Więcej informacji
Dodatkowe informacje (np. o kalendarzu rejestracji, prowadzących zajęcia, lokalizacji i terminach zajęć) mogą być dostępne w serwisie USOSweb: