Użyteczność danych sieciowych 2700-M-LM-Z3UDSI
Program zajęć przedmiotu „Użyteczność danych sieciowych”, obejmuje następujące obszary tematyczne:
1. Wprowadzenie do danych sieciowych
a. Dane sieciowe: definicja i znaczenie
b. Aspekty prawne i etyczne: licencje, otwartość danych, prywatność, RODO
c. Źródła danych w Internecie: media społecznościowe, otwarte bazy danych, API, strony WWW
d. Pozyskiwanie wartości ze zbiorów danych: praktyczne wykorzystanie danych w projektach
2. Podstawy pracy z danymi
a. Podstawowe pakiety do pracy z danymi
b. Struktury danych w R: ramki danych, listy
c. Import i eksport danych z publicznych repozytoriów
3. Metody pozyskiwania danych
a. Web scraping
b. Podstawy korzystania z API
c. Automatyzacja pobierania danych i dobre praktyki
4. Czyszczenie i przygotowanie danych
a. Podstawowe operacje na danych w R
b. Usuwanie błędów, duplikatów i braków
c. Normalizacja i standaryzacja danych
5. Analiza danych sieciowych w R
a. Wprowadzenie do metod analizy danych
b. Podstawowe techniki analizy danych tekstowych i liczbowych
c. Wykorzystanie pakietów analitycznych w ujęciu praktycznym
6. Wizualizacja danych
a. Metody raportowania danych
b. Metody skutecznej prezentacji wyników
c. Tworzenie prostych wykresów
d. Tworzenie interaktywnych wykresów
Rodzaj przedmiotu
Koordynatorzy przedmiotu
W cyklu 2025Z: | W cyklu 2024Z: |
Efekty kształcenia
Po ukończeniu przedmiotu student:
• będzie posiadał wiedzę na temat podstawowych źródeł danych dostępnych w Internecie, takich jak media społecznościowe, otwarte bazy danych, API oraz strony WWW, oraz rozumiał zasady ich pozyskiwania;
• będzie posiadał wiedzę na temat podstawowych technik automatycznego pobierania danych (web scraping) oraz korzystania z publicznych API w celu pozyskiwania danych;
• będzie znał podstawowe metody czyszczenia, strukturyzowania i przygotowania danych w R, a także zasady ich analizy i wizualizacji;
• pozna podstawowe aspekty prawne i etyczne związane z pozyskiwaniem i wykorzystywaniem danych, w tym licencje, zasady otwartości danych i wymogi ochrony prywatności.
Umiejętności
• student będzie potrafił samodzielnie pozyskiwać dane z Internetu za pomocą web scrapingu oraz prostych API;
• będzie umiał importować, czyścić i przygotowywać dane w R, eliminując błędy, duplikaty i brakujące wartości;
• będzie potrafił stosować podstawowe techniki analizy danych liczbowych i tekstowych w R;
• będzie posiadał umiejętność wizualizacji danych i tworzenia prostych raportów w R.
Inne kompetencje
• student posiada kompetencje i praktyczne umiejętności z zakresu pracy projektowej z danymi sieciowymi;
• jest świadomy prawnych i etycznych aspektów związanych z pozyskiwaniem i wykorzystywaniem danych.
Kryteria oceniania
Ocena końcowa stanowi średnią ważoną:
90% - zadania zlecone przez prowadzącego
10% - obecność
Literatura
1. Zych, M., 2021, Web scraping w analityce danych i w badaniach mixed-method research, Uniwersytet Jagielloński, https://ruj.uj.edu.pl/entities/publication/ffee3bb8-da76-494b-90cd-7d23f3fa83d9.
2. Devstock Academy, 2024, REST API: Co to jest i jak działa? Przykłady zastosowań, https://devstockacademy.pl/blog/narzedzia-i-automatyzacja/rest-api-co-to-jest-i-jak-dziala-przyklady-zastosowan/.
3. Biblioteka Uniwersytecka w Warszawie, Licencje Creative Commons, https://www.buw.uw.edu.pl/dla-nauki/otwarta-nauka/licencje-creative-commons/.
4. Ministerstwo Cyfryzacji, Departament Otwartych Danych i Rozwoju Kompetencji; Fundacja ePaństwo, 2018, Otwieranie danych — Podręcznik dobrych praktyk, https://dane.gov.pl/media/ckeditor/2018/11/22/otwieranie-danych-podrecznik-dobrych-praktyk.pdf.
5. Wilk, J., Wykład 6 - Tidyverse i dplyr, https://rpubs.com/ja_wilk099/wyklad5i6.
6. Suchwałko, A., Suchwałko, A., & Zagdański, A., 2012, Wprowadzenie do R (v.1.1), https://cran.r-project.org/doc/contrib/wprowadzenie_do_R.pdf.
7. Biecek, P., Przewodnik po pakiecie R v. 4.0. (wersja online), https://pbiecek.github.io/Przewodnik/.
8. Wierzbicki, P., Tomczyk, B, 2018, Jaki wpływ będzie miało RODO na analizy Big Data?, https://itwiz.pl/jaki-wplyw-bedzie-mialo-rodo-na-analizy-big-data/.
Więcej informacji
Dodatkowe informacje (np. o kalendarzu rejestracji, prowadzących zajęcia, lokalizacji i terminach zajęć) mogą być dostępne w serwisie USOSweb: