ADI: Analiza danych z rejestrów publicznych 3500-ADI-ADRP
Sektor badań rozwijający się najbardziej dynamicznie, to badania bazujące na informacjach z wielkich zbiorów danych – na zasobach rejestrów administracyjnych. Coraz więcej badań – zarówno naukowych jak i prowadzonych na zlecenie administracji publicznej czy też w obszarze biznesu sięga do rejestrów publicznych jako źródła precyzyjnych analiz obejmujących całe populacje. Podczas proponowanych zajęć podzielimy się z uczestnikami i uczestniczkami naszymi doświadczeniami w tym zakresie i nauczymy podstaw pracy badawczej z użyciem danych administracyjnych. Zajęcia są zatem adresowane do osób zainteresowanych poznaniem i przetestowaniem potencjału gwałtownie rozwijającego się sektora badań populacyjnych opartych na danych administracyjnych.
Podczas zajęć studenci będą mieli możliwość zapoznania się z wynikami najnowszych badań bazujących na rejestrach. Badania tego typu, w okresie gwałtownego przyspieszenia procesów cyfryzacji, należą do najbardziej innowacyjnych badań społecznych na świecie. Na ten rozwój wpłynęło szereg ważnych cech takich badań, np. niskie koszty, możliwość prowadzenia badań na całych, nawet bardzo licznych, populacjach, czy nieobecność zjawiska odmów odpowiedzi trapiącego badania sondażowe. Polska należy od kilku lat do krajów, w których rozwój ten jest najintensywniejszy.
Jednym ze źródeł tego rozwoju są unikatowe badania prowadzone na podstawie danych pochodzących z opartego na danych rejestrowych ZUS i POLon Ogólnopolskiego Systemu Monitorowania Ekonomicznych Losów Absolwentów Szkół Wyższych (system ELA), którego koncepcja została opracowana przez zespół ekspercki Wydziału Socjologii UW i Pracowni Ewaluacji Jakości Kształcenia UW, zaś obecnie rozwijany jest w Ośrodku Przetwarzania Informacji - Państwowym Instytucie Badawczym. Będzie to podstawowe źródło danych analizowanych w ramach zajęć. Drugim źródłem danych będzie system Map Potrzeb Zdrowotnych oparty na rejestrach ZUS i zasobach podlegających Ministerstwu Zdrowia. Uczestnicy zajęć poznają ponadto jeden z lepiej zapowiadających się europejskich systemów badawczych – „Zintegrowaną Platformę Analityczną” (ZPA) – rozwijany przez UW i SGH wraz z m.in. Ministerstwem Cyfryzacji.
Zajęcia będą miały charakter warsztatów poprzedzonych wprowadzeniem metodologicznym, które pozwoli na poznanie specyfiki analiz prowadzonych na danych pochodzących z rejestrów publicznych i przypomnienie podstawowych zasad statystycznej analizy danych.
W części warsztatowej studentki i studenci będą pracowali w dwuosobowych zespołach badawczych. Efektem ich pracy będzie przygotowanie krótkiego raportu badawczego opartego na danych rejestrowych. Raporty będą podstawą zaliczenia przedmiotu. Będą miały postać krótkich artykułów naukowych (wymogi formalne i stylistyczne pracy naukowej zostaną omówione podczas zajęć). Podczas zajęć zespoły badawcze będą prezentowały kolejne fragmenty swoich opracowań. Na bieżąco, w ramach pracy grupy, będą korygowane błędy i ustalane kierunki rozwoju raportów. W efekcie na koniec semestru każda grupa badawcza będzie miała skompletowane i omówione wszystkie elementy tworzonego raportu badawczego. Okres sesji będzie poświęcony jedynie na ostateczne prace redakcyjne. Terminem oddania prac zaliczeniowych będzie koniec sesji.
Obszary, których będą mogły dotyczyć prace zaliczeniowe:
- socjologia edukacji,
- socjologia ekonomiczna,
- społeczne aspekty nauk o zdrowiu.
Poniżej przedstawiamy przykładowe problemy poruszane podczas zajęć, z których część będzie mogła być podjęta w pracach zaliczeniowych:
- koszty rodzicielstwa,
- nierówność płci,
- analiza dynamiki zawodowych karier studentów, absolwentów, doktorantów, doktorów i osób porzucających studia,
- interakcja decyzji edukacyjnych i pozycji na rynku pracy,
- ścieżki edukacyjne w szkolnictwie wyższym,
- zagadnienia epidemiologiczne,
- zarządzanie w ochronie zdrowia,
- migracje geograficzne absolwentów i osób porzucających studia.
Podczas zajęć będzie można korzystać zarówno z pakietu statystycznego SPSS, jak i środowiska R (w razie zainteresowania część zajęć może być przeznaczona na skrótowe wprowadzenie do R).
W ramach kursu przewidujemy zaproszenie analityków-praktyków doświadczonych w analizie danych z rejestrów publicznych we współpracy z biznesem i administracja publiczną.
W przypadku szczególnie wyróżniających się prac zaliczeniowych chętnie podejmiemy współpracę przy przygotowaniu prac magisterskich na ich podstawie, zaś najlepsi studenci i studentki będą mogli liczyć na praktyki zawodowe przy rozwijaniu Ogólnopolskiego Systemu Monitorowania Ekonomicznych Losów Absolwentów Szkół Wyższych.
Rodzaj przedmiotu
Tryb prowadzenia
Koordynatorzy przedmiotu
Efekty kształcenia
W_01 Orientuje się w możliwościach i ograniczeniach danych z rejestrów publicznych
U_01 Potrafi przygotować i oczyścić dane rejestrowe do dalszej analizy
U_02 Umie stosować metody analizy statystycznej do danych administracyjnych
U_03 Analizuje wyniki badań z użyciem danych rejestrowych, interpretując je w kontekście socjologicznym
K_01 Przestrzega zasad etyki i ochrony danych przy pracy z rejestrami publicznymi
Kryteria oceniania
Krótki raport badawczy przygotowany w zespołach dwuosobowych omawiany podczas kolejnych zajęć.
Dopuszczalna liczba nieobecności podlegających usprawiedliwieniu: 2
Zasady zaliczania poprawkowego: takie same jak w I terminie
Korzystanie z narzędzi generatywnej sztucznej inteligencji, takich jak ChatGPT, jest dozwolone w przypadku wybranych zadań kursowych/zaliczeniowych. Domyślnie korzystanie z takich narzędzi jest zabronione, chyba że wyraźnie zaznaczono inaczej. Każde użycie musi zostać odpowiednio opisane i/lub zacytowane. Studenci/tki ponoszą odpowiedzialność za wszystkie treści wygenerowane z użyciem narzędzi AI.
Literatura
Jasiński, M., Bożykowski, M., Zając, T., Styczeń, M., Izdebski, A. (2015). Dokładniej, rzetelniej, taniej. Badania oparte na rejestrach publicznych jako szansa dla badań społecznych w Polsce. Studia Socjologiczne, 1(216), 45–72.
Nota metodologiczna Ogólnopolskiego systemu monitorowania ekonomicznych losów absolwentów (ELA: http://ela.nauka.gov.pl)
Wallgren, A., Wallgren, B. (2007). Register-based Statistics. Administrative Data for Statistical Purposes. Chichester: John Wiley & Sons (wybrane fragmenty).
Zając, T., Jasiński, M., Bożykowski, M. (2017). Does It Pay To Be A STEM Graduate? Evidence from the Polish Graduate Tracking System. Center for Studies in Higher Education, 1–9.
Zając, T., Jasiński, M., Bożykowski, M. (2018). Early Careers of Tertiary Graduates in Poland: Employability, Earnings, and Differences between Public and Private Higher Education. Polish Sociological Review, 2, 187–208. https://doi.org/10.26412/psr202.03
Bożykowski, M., Chłoń-Domińczak, A., Jasiński, M., Zając, T. (2019). Dane publiczne – nowy impuls do rozwoju Polski. Policy Paper 8/2019. Warszawa: Polski Instytut Ekonomiczny, ISBN 978-83-66306-33-2, https://pie.net.pl/wp-content/uploads/2019/09/Policy8-08-08-WEB1.pdf
Zając, T. Z., Żółtak, T., Bożykowski, M., & Jasiński, M. (2023). All that glitters is not gold—Mixed early labour market outcomes of STEM graduates in Poland. European Journal of Education, 58, 477–497. https://doi.org/10.1111/ejed.12564
Zając, T., Magda, I., Bożykowski, M., Chłoń-Domińczak, A., & Jasiński, M. (2024). Gender pay gaps across STEM fields of study. Studies in Higher Education, 1–14. https://doi.org/10.1080/03075079.2024.2330667
Więcej informacji
Dodatkowe informacje (np. o kalendarzu rejestracji, prowadzących zajęcia, lokalizacji i terminach zajęć) mogą być dostępne w serwisie USOSweb: