Podstawy programowania i analiza danych w języku R 2600-ABdz1PPADR
Kurs zapozna uczestników ze środowiskiem pracy w R, instalację zewnętrznych pakietów oraz podstawami użycia skryptów przygotowanych w tym języku. Omówione zostaną popularne funkcje, narzędzia analizy danych oraz ich prezentacja. Słuchacze opanują techniki posługiwania się zbiorami danych. Ponadto poznają polecenia przydatne do tworzenia nowych zbiorów wartości, określenia obiektów I zmiennych. Zaprezentowane zostaną podstawy programowania obiektowego, struktur danych i funkcji. Uczestniczy kursu zdobędą umiejętności niezbędne do projektowania i implementacji programów używając pełen potencjał języka R przydatnego w analityce biznesowej. W ramach zajęć, oprócz zajęć w sali studenci będą wykonywali projekt w zakresie analityki biznesowej. Kurs kończy się sprawdzianem pisemny. W szczególności tematy poznane przez studenta podczas trwania przedmiot to:
• instalacja oprogramowania i bibliotek, korzystanie z interfejsu, zasady działania oraz tworzenie i zapisywanie skryptów;
• podstawowe funkcje i obiekty, podstawy składni i komentowania skryptów;
• wczytywanie i zapisywanie danych w najczęstszych formatach oraz przygotowanie ich do analiz;
• praca z prawdziwymi zbiorami danych i podstawowe zasady czyszczenia danych,
• pętle oraz warunki;
• podstawy pisania funkcji;
• wizualizacja z wykorzystaniem podstawnych bibliotek graficznych;
• statystyki opisowe;
• analiza korelacji, test t Studenta;
• regresja prosta i regresja wieloraka: wykonywanie analiz i sprawdzanie założeń;
• analiza wariancji i testy post-hoc;
• analiza skupień: hierarchiczna, k-średnich oraz nowoczesne podejścia;
• podstawy gramatyki grafiki i zasady tworzenia wizualizacji w ggplot2.
• Przygotowanie i prezentowanie podstawowych analiz ilościowych z zakresu analityki biznesowej.
Nakład pracy studenta to: 30 godzin pracy w sali podczas zajęć. 15 godzin na dokończenie zadań praktycznych w domu. 30 godzin na przygotowanie projektu końcowego. 15 godzin na przygotowanie do sprawdzianu pisemnego.
Rodzaj przedmiotu
Koordynatorzy przedmiotu
Efekty kształcenia
K_U03 przystosowywać istniejące metody i narzędzia lub proponować na ich podstawie nowe, stosując zaawansowane techniki informacyjno-komunikacyjne oraz właściwy dobór źródeł do rozpoznawania, diagnozowania i rozwiązywania problemów związanych z analizą danych w środowisku wewnętrznym i zewnętrznym organizacji.
K_U04 formułować i testować hipotezy związane z prostymi problemami badawczymi.
K_U05 proponować rozwiązania zadań osadzonych w nieprzewidywalnych warunkach.
K_U06 komunikatywnie prezentować zróżnicowanym grupom odbiorców wyniki analiz z zakresu zarządzania
posługując się specjalistyczną terminologią oraz prowadzić debatę, także w języku angielskim
K_U09 podnosić zdobyte kwalifikacje i wspierać innych w tym zakresie oraz posiada zdolność do samokształcenia
Kryteria oceniania
Wykonanie zadań praktycznych 20%, Projekt 30%, Sprawdzian pisemny 50% oceny końcowej.
Wymagane jest 60% punktów z całego przedmiotu i 50% z sprawdzianu pisemnego do zaliczenia przedmiotu.
Praktyki zawodowe
Praktyki zawodowe nie są wymagane dla realizacji przedmiotu
Literatura
Literatura udostępniana na platformie internetowej podczas zajęć
Wickham, H., & Grolemund, G. (2017). R for data science. Sebastopol: O'Reilly.
Wickham, H. (2016). ggplot2: elegant graphics for data analysis. Cham: Springer international publishing.
Więcej informacji
Dodatkowe informacje (np. o kalendarzu rejestracji, prowadzących zajęcia, lokalizacji i terminach zajęć) mogą być dostępne w serwisie USOSweb: