Introduction to Data Management 2600-MSdz2IDMen
• Wprowadzenie do języka R i struktur danych R, wykonywanie poleceń R, zrozumienie obiektów i struktur danych R, korzystanie z funkcji R, badanie i manipulowanie danymi przy użyciu języka Base R.
• Badanie typu i struktury obiektów R, izolowanie elementów przy użyciu operatorów podzbiorów języka Base R i funkcji subset (), badanie i manipulowanie danymi przy użyciu tidyverse.
• Wybieranie, filtrowanie i sortowanie danych przy użyciu funkcji tidyverse, łączenie funkcji za pomocą potoków (%>%), tworzenie nowych zmiennych warunkowo przy użyciu if_else(), recode() i case_when()
• Obliczanie statystyk zbiorczych z wielu wierszy danych, grupowanie wierszy danych przy użyciu group_by(), tworzenie statystyk zbiorczych przy użyciu summarize()
• Praca z ciągami znaków i obiektami daty/daty i czasu, zrozumienie podstaw ciągów znaków, manipulowanie ciągami znaków za pomocą funkcji stringr, praca z datami i czasem za pomocą pakietu lubridate.
• Zrozumienie klasy i atrybutów obiektów R, badanie klasy i atrybutów obiektów R, praca ze zmiennymi czynnikowymi, zmiennymi etykietowymi i wartościami ramki danych za pomocą pakietu labelled.
• Narzędzia i wytyczne dotyczące eksploracyjnej analizy danych (EDA) Poznaj popularne podejścia do eksploracji i analizy danych, zrozum wzorce pomijania w danych ankietowych
• Zrozum strukturę uporządkowanych danych i przekształcanie danych, zdefiniuj uporządkowane dane i sposób przekształcania nieuporządkowanych danych w uporządkowaną formę, przekształcaj dane z szerokich na długie za pomocą pivot_longer(), przekształcaj dane z długich na szerokie za pomocą pivot_wider(), obsługuj brakujące wartości podczas przekształcania
• Łączenie danych z wielu zestawów danych za pomocą połączeń, scalanie zestawów danych za pomocą mutujących połączeń, sprawdzanie jakości scalania za pomocą filtrujących połączeń, dołączanie zestawów danych poprzez układanie w stosy wierszy
Rodzaj przedmiotu
Tryb prowadzenia
Koordynatorzy przedmiotu
Efekty kształcenia
Wiedza
K_W05 – Studenci będą mieli wiedzę na temat podstawowych pojęć programowania obiektowego.
K_W06 – Studenci będą mieli rozległą wiedzę na temat manipulacji danymi i badania wzorców w zbiorach danych.
K_W07 – Studenci poznają wytyczne i praktyczne strategie zapewniania jakości danych podczas czyszczenia danych i tworzenia zmiennych analitycznych.
________________________________________
Umiejętności
K_U01 – Studenci będą potrafili sortować zbiory danych w sposób pozwalający uzyskać wgląd w ich strukturę.
K_U02 – Studenci będą potrafili tworzyć statystyki podsumowujące dla poszczególnych zmiennych w celu diagnozowania błędów w danych.
K_U03 – Studenci będą potrafili łączyć wiele zbiorów danych i manipulować strukturą organizacyjną zbiorów danych.
K_U07 – Studenci będą potrafili posługiwać się językiem obcym na poziomie B2+ w ramach Europejskiego Systemu Opisu Kształcenia Językowego (CEFR) oraz stosować specjalistyczną terminologię w zakresie nauki o zarządzaniu i jakości.
________________________________________
Kompetencje społeczne
K_K01 – Studenci będą potrafili podejmować decyzje oparte na dowodach.
K_K02 – Studenci będą potrafili rozwiązywać problemy w oparciu o pracę zespołową.
Kryteria oceniania
Projekt grupowy i prezentacja (50%)
Praca domowa (30%)
Aktywność podczas zajęć (20%)
Literatura
R for Data Science by Garrett Grolemund and Hadley Wickham
https://r4ds.hadley.nz/
• R Graphics Cookbook, 2nd edition, Winston Chang
https://r-graphics.org/
Required Software
R, statistical programming language
https://cloud.r-project.org/
RStudio, integrated development environment for R
https://posit.co/download/rstudio-desktop/
Więcej informacji
Dodatkowe informacje (np. o kalendarzu rejestracji, prowadzących zajęcia, lokalizacji i terminach zajęć) mogą być dostępne w serwisie USOSweb: