- Bioinformatyka i biologia systemów, stacjonarne, pierwszego stopnia
- Informatyka, stacjonarne, pierwszego stopnia
- Matematyka, stacjonarne, pierwszego stopnia
- Bioinformatyka i biologia systemów, stacjonarne drugiego stopnia
- Informatyka, stacjonarne, drugiego stopnia
- Matematyka, stacjonarne, drugiego stopnia
Wizualizacja i raportowanie danych w programie R 2400-ZEWW727-OG
Program R-CRAN jest obecnie jednym z najpopularniejszych programów do statystycznej i ekonometrycznej analizy danych. Jego siłą jest darmowość (licencja pozwala na wykorzystywanie programu bezpłatnie także w zastosowaniach komercyjnych), wszechstronność (stale tworzone są nowe pakiety zawierające procedury statystyczne wykorzystywane w m. in. analizach ekonometrycznych, psychometrycznych, socjologicznych, geologicznych pogodowych czy biomedycznych) oraz olbrzymia społeczność użytkowników współtworząca nowe pakiety i wspierająca się nawzajem za pośrednictwem internetowych forów. R jest również najlepszym obecnie programem do wizualizacji danych.
Kurs jest przeznaczony dla osób, które chcą opanować zaawansowane metody analizy i wizualizacji danych i/lub opanować w stopniu zaawansowanym program R. Biegłe posługiwanie się tym programem wymaga poznanie specjalistycznego języka poleceń, który jest językiem programistycznym (wszystkie polecenia wydaje się wyłącznie za pomocą odpowiednich komend). Dlatego ok. 50% czasu zajęciowego zostanie przeznaczone na szczegółowe omawianie języka używanego w R.
Szczegółowa tematyka kursu:
• Podstawy obsługi R – omówienie edytora R-Studio, instalowanie pakietów, import danych, podstawowe komendy, typy obiektów, specyfika pracy w R.
• Eksploracyjna analiza danych – praca na tabelach danych, pakiety: dplyr, tidyr, plyr, data.table
• Podstawy wizualizacji w R – pakiet base i graphics
• Tworzenie diagramów w R – pakiet diagram
• Wizualizacja danych 2D cz. 1– pakiet ggplot2 i jego rozszerzenia
• Wizualizacja danych 2D cz. 2 – przegląd wykresów
• Wizualizacja danych 2D cz. 3– tabele danych, złożone wykresy i infografiki
• Wizualizacja danych 3D cz. 1– pakiety lattice oraz scatterplot3d
• Wizualizacja danych 3D cz. 2 – przegląd wykresów
• Sztuka tworzenia efektywnych i ciekawych wykresów
• Interaktywne wykresy – pakiety RCharts, htmlwidgets, ggvis
• Wizualizacja wyników analiz statystycznych cz. 1 – rysowanie przedziałów ufności, wizualizacja wyników regresji liniowej, korelogramy
• Wizualizacja wyników analiz statystycznych cz. 2– PCA, klasteryzacja, klasyfikacja, text mining (analiza sieci)
• Podstawy programowania w R – instrukcje warunkowe, pętle, rodzina funkcji apply(), praca na obiektach w R, tworzenie własnych funkcji, tworzenie animacji w R
• Automatyzacja pracy – parametryzacja kodu i powtarzalność analiz
• Tworzenie automatycznych raportów i prezentacji za pomocą Rmarkdown
Rodzaj przedmiotu
Efekty kształcenia
WIEDZA
1) Student po zakończeniu kursu zna Uczestnik zna sposób wykorzystania programu R wraz z przykładowymi pakietami w przygotowaniu, obróbce i przeprowadzeniu wybranych analiz w szczególności z zakresu zjawisk ekonomiczno-finansowych oraz społecznych
2) Będzie posiadał uporządkowaną wiedzę na temat sztuki wizualizacji danych
3) Uczestnik zna możliwości aplikacyjne przedstawionych metod analitycznych i wizualizacji danych - na ich podstawie może tworzyć własne analizy w trakcie swojego dalszego rozwoju naukowego i zawodowego
UMIEJĘTNOŚCI
1) Student potrafi pozyskać program R wraz z odpowiednimi pakietami i przygotować go do pracy
2) Uczestnik ma wprawę w pracy z danymi statystycznymi za pomocą pakietu R, potrafi wyczytać dane do programu, określić jakość danych, dokonać podstawowych manipulacji na danych, agregować dane warunkowo
3) Student na podstawie wszelkiego rodzaju danych umie przygotować złożony wykres ilustrujący zjawiska ekonomiczno-społeczne
KOMPETENCJE SPOŁECZNE
1) Uczestnik rozumie, że biegłe posługiwanie się programem R wymaga ciągłego poznawania tego pakietu i doskonalenia warsztatu
2) Student ma świadomość, że program R wraz z pakietami dodatkowymi jest nieustannie rozwijany i oferuje z czasem nowe możliwości
3) Uczestnik zdaje sobie sprawę, że program R jest uniwersalnym narzędziem i może być wykorzystywany w obliczeniach w różnych dziedzinach wiedzy oraz, że kurs daje podstawy do samodzielnego poszukiwania takich dostosowań.
Studenci, którzy ukończą kurs z ocenami co najmniej dobrymi, będą znali program na poziomie biegłym, co będzie stanowić cenną pozycję w CV i jasny sygnał dla pracodawców o wysokich umiejętnościach analitycznych.
KW01, KW02, KW03, KU01, KU02, KU03, KK01, KK02, KK03
Kryteria oceniania
Na końcową ocenę składają się:
• punkty za rozwiązane zadania wykonywane w ramach pracy własnej na zajęciach i pracy domowej (30 punktów),
• punkty za przygotowanie projektu semestralnego (70 punktów),
• dodatkowe punkty za aktywność.
Oceny:
Punkty Ocena
[0-60] ndst
(60-70] Dst
(70-80] dst +
(80-90] Db
(90-100] db +
(100-110] Bdb
>110 bdb !
Literatura
materiały własne
Literatura obowiązkowa:
- Biecek P., 2008, Przewodnik po pakiecie R, Oficyna Wydawnicza GIS, Wrocław
- Kopczewska K., Kopczewski T., Wójcik P., (red), 2009, Metody ilościowe w R. Aplikacje ekonomiczne i finansowe, CeDeWu, Warszawa
- red. Walesiak M., Gantnar E., 2009, Statystyczna analiza danych z wykorzystaniem programu R, Wydawnictwo Naukowe PWN, Warszawa
Literatura uzupełniająca:
- Biecek, Przemysław (2014). Odkrywać! Ujawniać! Objaśniać! Uniwersytet
- Warszawski.
- Few, Stephen (2012). Show Me the Numbers: Designing Tables and Graph so Enlighten Analytics Press.
- Kopczewska K., 2006, Ekonometria i statystyka przestrzenna w R CRAN, CeDeWu, Warszawa
- Robbins, Naomi (2005). Creating more effective graphs Wiley-Interscience.
- Tufte, Edward R and Graves-Morris (1983). The visual display of quantitative information Graphics press Cheshire, CT (Vol. 2, No. 9).
Więcej informacji
Więcej informacji o poziomie przedmiotu, roku studiów (i/lub semestrze) w którym się odbywa, o rodzaju i liczbie godzin zajęć - szukaj w planach studiów odpowiednich programów. Ten przedmiot jest związany z programami:
- Bioinformatyka i biologia systemów, stacjonarne, pierwszego stopnia
- Informatyka, stacjonarne, pierwszego stopnia
- Matematyka, stacjonarne, pierwszego stopnia
- Bioinformatyka i biologia systemów, stacjonarne drugiego stopnia
- Informatyka, stacjonarne, drugiego stopnia
- Matematyka, stacjonarne, drugiego stopnia
Dodatkowe informacje (np. o kalendarzu rejestracji, prowadzących zajęcia, lokalizacji i terminach zajęć) mogą być dostępne w serwisie USOSweb: