Analiza danych ilościowych z wykorzystaniem R 3500-SCC-ADR
Programowanie w języku R jest używane do analizy i obróbki danych, grafiki, obliczeń i analizy statystycznej. R jest ogólnodostępnym środowiskiem, które cieszy się rosnącą popularnością i znalazło wiele zastosowań. Znajomość R jest poważnym atutem na rynku pracy i jest wręcz wymagana na wielu stanowiskach związanych z obróbką danych, wizualizacją wyników, inżynierią uczenia maszynowego, analizą tzw. Big data itp.
Celem zajęć jest zaznajomienie z podstawami języka R i sposobem wykorzystania go do przetwarzania i analizy typowych danych ilościowych opisujących wyniki badań społecznych. Kurs obejmuje swoim zakresem wczytywanie i eksport danych tabelarycznych zapisanych w różnych formatach, podstawowe przekształcenia danych, agregację, tworzenie rozkładów oraz zestawień statystyk opisowych. Uczestnicy zapoznają się w trakcie zajęć z podstawowymi strukturami danych (ramka danych, wektory, czynniki), ich cechami, sposobami wykorzystania i przekształcania. Obszernie omówione zostanie wykorzystanie pakietów z grupy tzw. tidyverse do tworzenia efektywnych i łatwych do zrozumienia ciągów operacji czyszczenia i przekształcania danych oraz do tworzenia rozkładów statystycznych i zestawień wartości parametrów statystycznych. Ważnym elementem kursu jest też rozwój umiejętności wizualizacji danych przy pomocy wykresów oraz wykorzystania opcji tworzenia przejrzystych raportów z poziomu R. Uczestnicy zostaną też zaznajomieni z podstawowymi strukturami programistycznymi języka R, umożliwiającymi wykorzystanie go do tworzenia bardziej złożonych rozwiązań informatycznych. Zajęcia będą prowadzone z użyciem oprogramowania RStudio
Rodzaj przedmiotu
Tryb prowadzenia
Koordynatorzy przedmiotu
W cyklu 2023L: | W cyklu 2024L: |
Efekty kształcenia
K_W02: posiada pogłębioną wiedzę na temat wybranych metod i technik badań cyfrowych, ich ograniczeń, specyfiki i obszarów zastosowania;
K_W05: rozumie funkcjonujące w świecie cyfrowym mechanizmy i źródła danych, jakie można wykorzystywać albo wygenerować;
K_U02: potrafi analizować dane ilościowe i jakościowe o charakterze cyfrowym;
K_U03: ma podstawowe umiejętności informatyczne pozwalające na poruszanie się w świecie cyfrowym i ułatwiające komunikację międzydziedzinową;
K_U04: ma zaawansowane umiejętności komunikacyjne obejmujące komunikację międzydziedzinową (nauki społeczne/IT);
K_U07: potrafi wyszukiwać, gromadzić i przygotować do analizy za pomocą wybranych narzędzi dane dotyczące określonych zjawisk społecznych;
K_U11: samodzielnie wyszukuje informacje o narzędziach służących analizie danych cyfrowych i dokształca się w zakresie korzystania z nich;
K_U12: potrafi posługiwać się danym programem komputerowym do analizy danych cyfrowych korzystając z jego zaawansowanych funkcji;
K_K03: potrafi krytycznie selekcjonować dane cyfrowe umożliwiające opracowanie wybranego problemu badawczego;
K_K05: jest gotów do pracy zespołowej i współpracy również międzydziedzinowej w ramach wykonywanych zadań;
K_K06: potrafi dokonać krytycznej oceny własnej pracy (badawczej, wykonanych analiz);
Kryteria oceniania
prace domowe, kolokwium
Literatura
Literatura ogólna:
Biecek, P. (2017). Przewodnik po pakiecie R. Wyd. 4. Warszawa: Oficyna Wydawnicza Gis.
Biecek, P. (2015). Przetwarzanie danych w programie R oraz Wizualizacja i modelowanie – materiały do kursu Pogromcy danych do pobrania ze strony autora: http://biecek.pl/R/#Pogromcy
Wickham, H. (2014). Tidy data. Journal of Statistical Software 59(10). http://www.jstatsoft.org/v59/i10
Wickham, H. (2010). A layered grammar of graphics. Journal of Computational and Graphical Statistics 19(1): 3-28.
Więcej informacji
Dodatkowe informacje (np. o kalendarzu rejestracji, prowadzących zajęcia, lokalizacji i terminach zajęć) mogą być dostępne w serwisie USOSweb: