Zastosowania R w naukach społecznych 3500-FAKM-ZASTR-scc
Programowanie w języku R jest używane do analizy i obróbki danych, grafiki, obliczeń i analizy statystycznej. R jest ogólnodostępnym środowiskiem, które cieszy się rosnącą popularnością i znalazło wiele zastosowań. Znajomość R jest poważnym atutem na rynku pracy i jest wręcz wymagana na wielu stanowiskach związanych z obróbką danych, wizualizacją wyników, inżynierią uczenia maszynowego, analizą tzw. Big Data itp.
Celem zajęć jest wprowadzenie do najczęściej używanych technik analizy danych ilościowych i nauka ich przeprowadzania z użyciem języka R. Uczestnicy kursu powinni znać podstawowe pojęcia statystyczne takie jak rozkład, parametr rozkładu czy poziom pomiaru. Znajomość podstaw R będzie dodatkowym atutem. Uczestnicy bez znajomości podstaw R będą mieli możliwość uzupełnienia wiedzy online.
Od strony statystycznej omawiane będą zarówno metody opisu statystycznego jak i problemy wnioskowania statystycznego. Kurs obejmuje swoim zakresem analizę zależności miedzy zmiennymi, mierniki korelacji, regresję liniową dwu i wielozmiennową, analizę ANOVA i regresję logistyczną. Wyjaśniona zostanie logika wnioskowania statystycznego i wprowadzone zostaną najważniejsze testy parametryczne i nieparametryczne. Uczestnicy kursu nauczą się interpretować wartości statystyk z próby i poziomy istotności. W zależności od dostępnego czasu i chęci uczestników program kursu może być rozszerzony np. o analizę czynnikową, podstawy analizy ścieżkowej, drzewa decyzyjne lub algorytmy analizy skupień.
Wszystkie analizy będą wykonywane w R. Krótko omówione zostaną kwestie podstawowe takie jak wczytywanie i eksport danych w różnych formatach, podstawowe struktury danych, przekształcenia danych, czy logika i radzenie sobie z brakami danych. Nacisk zostanie położony na naukę samodzielnego wyszukiwania informacji o dostępnych opcjach i funkcjach. Uczestnicy zostaną zaznajomieni z podstawowymi strukturami programistycznymi języka R, umożliwiającymi wykorzystanie go do tworzenia bardziej złożonych rozwiązań. Omówione zostanie tworzenie własnych funkcji. Zajęcia będą prowadzone z użyciem oprogramowania RStudio.
Rodzaj przedmiotu
Tryb prowadzenia
Założenia (opisowo)
Koordynatorzy przedmiotu
Efekty kształcenia
W_01 Zna podstawowe techniki analizy ilościowej i logikę wnioskowania statystycznego
U_01 Potrafi posługiwać się językiem R do analizy i wizualizacji danych
U_02 Umie stosować modele regresyjne i testy statystyczne w badaniach społecznych
U_03 Samodzielnie interpretuje wyniki analiz i formułuje wnioski badawcze
K_01 Odpowiedzialnie wykorzystuje narzędzia analityczne i rozwija kompetencje cyfrowe
Kryteria oceniania
Zadania wykonywane w czasie zajęć i jako prace domowe, kolokwium końcowe
Dopuszczalna liczba nieobecności podlegających usprawiedliwieniu: 2
Zasady zaliczania poprawkowego: takie same jak w pierwszym terminie
do godzin przeznaczonych na zajęcia w sali (30h) należy doliczyć czas konieczny do przygotowania się do zajęć (czytanie lektur, przygotowywanie zadań) – 5h tygodniowo oraz czas konieczny do przygotowania się do finalnego zaliczenia (napisania raportu/przygotowania prezentacji) – 15h
Literatura
Lissowski G., Haman J, Jasiński M, Podstawy statystyki dla socjologów, Wyd. Naukowe Scholar, Warszawa 2008 (lub późniejsze)
Wickham H., Cetinkaya-Rundel M., Grolemund G., R for Data Science: Import, Tidy, Transform, Visualize, and Model Data, O’Reilly, 2023 (wersja online lub papierowa)
Field, A., Discovering Statistics Using R and RStudio, Sage Publications Ltd, 2026
Więcej informacji
Dodatkowe informacje (np. o kalendarzu rejestracji, prowadzących zajęcia, lokalizacji i terminach zajęć) mogą być dostępne w serwisie USOSweb: