Użyteczność danych sieciowych 2700-M-LM-Z3UDSI
Programu zajęć przedmiotu "Użyteczność Danych Sieciowych", obejmuje następujące obszary tematyczne:
1. Wprowadzenie do danych sieciowych i ich znaczenie
a. Definicja danych sieciowych i ich rola w nowoczesnym społeczeństwie
b. Źródła danych w Internecie: media społecznościowe, otwarte bazy danych, API, web scraping
c. Wstęp do Big Data: charakterystyka dużych zbiorów danych i ich analiza
d. Wyzwania i korzyści związane z wykorzystaniem danych sieciowych
2. Metody dostępu do danych sieciowych
a. Web scraping: techniki pobierania danych ze stron internetowych
b. API: dostęp do danych poprzez interfejsy programowania aplikacji
c. Narzędzia do pobierania danych, narzędzia do interakcji z API
d. Legalność pozyskiwania danych: licencje i warunki użytkowania
3. Przetwarzanie i czyszczenie danych
a. Proces czyszczenia danych: eliminacja błędów, duplikatów, uzupełnianie braków
b. Normalizacja i standaryzacja danych: formatowanie i strukturyzacja
c. Narzędzia do czyszczenia danych
d. Wprowadzenie do przetwarzania tekstu
4. Analiza danych sieciowych
a. Wprowadzenie do analizy danych
b. Techniki analizy danych tekstowych
c. Narzędzia do analizy danych
d. Praktyczne zastosowania
5. Wizualizacja danych
a. Wprowadzenie do wizualizacji danych: rodzaje wykresów i ich zastosowanie
b. Narzędzia do wizualizacji danych
c. Tworzenie interaktywnych wykresów i dashboardów.
d. Zasady skutecznej prezentacji danych: wybór odpowiednich narzędzi i formy wizualizacji
6. Aspekty prawne i otwartość danych
a. Licencje na dane: rodzaje licencji i ich implikacje (CC, ODbL, itp.)
b. Otwarte dane: pojęcie i znaczenie otwartych zasobów danych
c. Zasady etyczne korzystania z danych sieciowych: ochrona prywatności, RODO
d. Znaczenie otwartych danych: wykorzystanie otwartych baz danych.
Rodzaj przedmiotu
Koordynatorzy przedmiotu
W cyklu 2024Z: | W cyklu 2023Z: |
Efekty kształcenia
Po ukończeniu przedmiotu student:
- będzie posiadał wiedzę na temat źródeł danych dostępnych w Internecie, takich jak media społecznościowe, bazy danych czy serwisy API, oraz rozumiał zasady pozyskiwania tych danych;
- będzie posiadał wiedzę na temat technik automatycznego pobierania danych ze stron internetowych oraz sposobów korzystania z API w celu pozyskiwania danych z zewnętrznych serwisów;
- będzie znał techniki czyszczenia, strukturyzowania i normalizowania danych, a także podstawy eksploracyjnej analizy danych w kontekście dużych zbiorów danych;
- pozna podstawowe aspekty prawne związane z wykorzystaniem danych, w tym licencje, zasady otwartych danych i wymogi ochrony prywatności (np. RODO).
-
Umiejętności
Po ukończeniu przedmiotu student:
- będzie potrafił samodzielnie korzystać z web scrapingu oraz korzystać z API w celu pobierania danych z różnych źródeł internetowych;
- będzie umiał przeprowadzać proces czyszczenia i standaryzacji surowych danych, eliminując błędy, duplikaty oraz brakujące wartości przy użyciu odpowiednich narzędzi;
- będzie posiadał umiejętność eksploracyjnej analizy danych, w tym analizowania danych tekstowych oraz wizualizowania danych w celu wyciągania kluczowych informacji.
Inne kompetencje
Po ukończeniu przedmiotu student:
- posiada kompetencje i praktyczne umiejętności z zakresu pracy z danymi sieciowymi.
Kryteria oceniania
Ocena końcowa stanowi średnią ważoną: 40% - zadania zlecone przez prowadzącego w czasie zajęć, 40% - egzamin końcowy, 10% - aktywność na zajęciach, 10% - obecność.
Literatura
1. data.europa Academy. https://data.europa.eu/pl/academy
2. Szkoła danych – kurs pracy z danymi. http://szkoladanych.pl/
3. Otwarte Dane – Baza wiedzy. https://dane.gov.pl/pl/knowledgebase
4. Samulska J., 2021, Otwarte Dane. Techniki racjonalnego klasyfikowania i udostępniania, Instytut Rozwoju Miast i Regionów, Warszawa-Kraków. https://urbanlab.net/wp-content/uploads/2021/07/OTWARTE-DANE_ebook_druk.pdf
5. Szpringer, W. (2022). Datafikacja Gospodarka oparta na danych konkurencja a regulacja. Poltext. ISBN 978-83-817-5409-5.
6. Biecek, P. (2017). Przewodnik po pakiecie R 4.0 (wyd. 4). OFICYNA WYDAWNICZA GiS. ISBN 978-83-62780-44-0. https://pbiecek.github.io/Przewodnik/
7. Biecek, P. (2022). Wykresy od kuchni. SmarterPoland.pl. https://betaandbit.github.io/Wykresy/
8. Gruenpeter, N. (2022). Jak korzystać z zasobów w repozytoriach danych. Wersja 2.0. Uniwersytet Warszawski - ICM. https://pon.edu.pl/images/dspace/Jak_korzystac_z_zasobow.pdf
9. Gaczyńska, K., Siewicz, K., & Rycko, N. (2022). Prawne aspekty otwierania danych badawczych - poradnik. Wersja 2.0. Uniwersytet Warszawski - ICM. https://pon.edu.pl/images/dspace/Prawne_aspekty_otwierania_danych.pdf
10. Bernaczyk, M. (Ed.). (2021). Otwarte dane i ich ponowne wykorzystywanie w prawie polskim : wybrane zagadnienia. E-Wydawnictwo. Prawnicza i Ekonomiczna Biblioteka Cyfrowa. Wydział Prawa, Administracji i Ekonomii Uniwersytetu Wrocławskiego. https://www.bibliotekacyfrowa.pl/publication/144508
Więcej informacji
Dodatkowe informacje (np. o kalendarzu rejestracji, prowadzących zajęcia, lokalizacji i terminach zajęć) mogą być dostępne w serwisie USOSweb: