ADI: Badania wyborcze w R 3500-ADI-BWR
Analiza danych wyborczych to zajęcia o charakterze warsztatowym, przeznaczone dla studentów studiów magisterskich na kierunku socjologia. Celem kursu jest rozwinięcie umiejętności stosowania zaawansowanych technik analizy i interpretacji danych ilościowych na przykładzie danych rejestrowych i sondażowych opisujących zachowania wyborcze. W trakcie zajęć studenci pracują na rzeczywistych zbiorach danych pochodzących z krajowych i międzynarodowych źródeł, takich jak na przykład PKW, GUS, CSES, V-Dem czy Manifesto Project. Uczestnicy ćwiczą umiejętność pozyskiwania, czyszczenia, kodowania oraz analizy danych, ucząc się świadomego doboru metody analizy do stawianego pytania badawczego. Głównym narzędziem pracy analitycznej jest język programowania R, wprowadzany od podstaw, natomiast język Python wykorzystywany jest w zadaniach wymagających analizy tekstu i sentymentu, w tym przetwarzania danych z mediów społecznościowych z zastosowaniem modeli językowych takich jak HerBERT. Warunkiem uczestnictwa w kursie jest znajomość podstaw statystyki na poziomie licencjackim, obejmująca rozumienie pojęć takich jak średnia, odchylenie standardowe, korelacja czy test istotności. Wstępna znajomość języków programowania lub oprogramowania do analizy danych jest mile widziana, lecz nie stanowi warunku koniecznego.
Kurs kształtuje wiedzę z zakresu metodologii ilościowych badań wyborczych, w tym znajomość założeń i ograniczeń stosowanych modeli statystycznych oraz terminologii socjologii polityki. Studenci rozwijają umiejętność krytycznej oceny źródeł danych wyborczych,
identyfikowania rozbieżności między nimi oraz uzasadniania podejmowanych decyzji analitycznych. Istotnym elementem zajęć jest nauka przejrzystej prezentacji wyników w formie dostosowanej do odbiorcy, z uwzględnieniem świadomego unikania typowych błędów wizualizacji danych wyborczych. Zajęcia kładą również nacisk na pracę zespołową, korzystając przy tym z narzędzi do zespołowej pracy nad kodem, takich jak Google Colab. Ważnym komponentem dydaktycznym jest wzajemna ocena prac w ramach peer review, rozwijająca umiejętność konstruktywnego recenzowania analiz. Kurs przygotowuje studentów do samodzielnego projektowania i realizacji pełnego cyklu analizy danych wyborczych – od sformułowania pytania badawczego, przez dobór danych i metod, aż po prezentację i krytyczną ewaluację wyników. Kurs wymaga biegłego czytania anglojęzycznej literatury naukowej i dokumentacji technicznej na poziomie co najmniej B2+.
Koordynatorzy przedmiotu
Rodzaj przedmiotu
Tryb prowadzenia
Efekty kształcenia
K_W01 zna i rozumie w pogłębionym stopniu metodologię badań i terminologię w zakresie dyscypliny nauki socjologiczne
K_U02 potrafi krytycznie selekcjonować i interpretować informacje niezbędne do przeprowadzenia twórczych analiz socjologicznych, korzystając z różnych źródeł (w języku rodzimym i obcym na poziomie B2+) oraz posługując się nowoczesnymi technikami informacyjno-komunikacyjnymi
K_U04 potrafi prezentować wyniki swojej pracy badawczej różnego typu odbiorcom, również z wykorzystaniem nowych technologii
K_U07 potrafi skutecznie współpracować z członkami zespołu zadaniowego przyjmując w zespole różne role, w tym osoby kierującej pracami zespołu
K_S02 jest gotów do inspirowania, inicjowania i udziału w procesie tworzenia i ewaluacji badań socjologicznych, w tym projektowania, prezentowania i realizacji własnych rozwiązań
Kryteria oceniania
Przygotowanie projektu badawczego + prezentacja na ostatnich zajęciach
Dopuszczalna liczba nieobecności podlegających usprawiedliwieniu: 2
Zasady zaliczania poprawkowego: Przygotowanie projektu badawczego + prezentacja w dodatkowym terminie ustalonym przez prowadzącego
Literatura
Literatura
Analiza danych wyborczych – wprowadzenie:
Herron, E., Pekkanen, R., Shugart, M. (red.) (2018). The Oxford Handbook of Electoral Systems. Oxford University Press
Książki do analizy danych:
Wickham, H., Grolemund, G. (2023). R for Data Science (2nd ed.). O'Reilly. Dostępne online: r4ds.had.co.nz
McKinney, W. (2022). Python for Data Analysis: Data Wrangling with pandas, NumPy, and Jupyter (3rd ed.). O'Reilly. Dostępne online: wesmckinney.com/book
Modelowanie danych:
Wooldridge, J. (2010). Econometric Analysis of Cross Section and Panel Data (2nd ed.). MIT Press
The Effect - Nick Huntington-Klein, dostępne online: https://theeffectbook.net/index.html
Wizualizacja danych:
Wilke, C. (2019). Fundamentals of Data Visualization. O'Reilly. Dostępne online: clauswilke.com/dataviz
Healy, K. (2018). Data Visualization: A Practical Introduction. Princeton University Press. Dostępne online: https://socviz.co/
Analiza danych za pomocą NLP:
Tunstall, L., von Werra, L., Wolf, T. (2022). Natural Language Processing with Transformers: Building Language Applications with Hugging Face. O'Reilly. Dostępne online: https://transformersbook.com/
Na poszczególne zajęcia wymagane mogą być artykuły lub ich fragmenty, które prowadzący będzie udostępniał z wyprzedzeniem umożliwiającym zapoznanie się studentów z ich treścią.