Podstawy programowania komputerów 2700-L-LM-D6POPK-ZTM
Zajęcia mają za zadanie zapoznanie studentów ze sposobem pracy na dużych zbiorach danych. Przedstawione zostaną metody i algorytmy wyszukiwania informacji z ustrukturalizowanych i nieustrukturalizowanych zbiorów danych. Analiza danych zostanie przedstawiona przy zastosowaniu języka „R”.
1. Elementy i sposoby eksploatacji baz danych.
2. Obszary zastosowania analizy tekstów.
3. Omówienie wymagań związanych z analizą danych oraz podstawowych zagadnień analizy BigData.
4. Przedstawienie różnych podejść do analizy danych.
5. Wprowadzenie do analizy semantycznej tekstów, analiza sentymentów, klasyfikacja tekstów ze względu na tematykę.
6. Charakterystyka przetwarzania zbiorów danych – BigData z uwzględnieniem struktur danych oraz operacji na zbiorach.
7. Metody analizy tekstów oraz sposoby praktycznego zastosowania: importowanie, czyszczenie, przekształcanie, zbudowanie modelu, wizualizacja.
8. Techniki programistyczne: operowanie na danych tabelarycznych, importowanie danych, przetwarzanie danych tekstowych, operacje na datach, wykorzystanie potoków danych, iteracje oraz pętle, budowanie modelu analizy danych, wizualizacja.
Rodzaj przedmiotu
Koordynatorzy przedmiotu
Efekty kształcenia
Po ukończeniu przedmiotu student:
Wiedza
Zna podstawowe typy danych języka programowania oraz operacje na nich: zmienne liczbowe, zmienne daty, zmienne tekstowe, wektory, listy, tablice.
Umie policzyć podstawowe parametry modelu: statystyki danych, parametry modelu liniowego danych.
Zna zasady analizy i modelowania danych: zna podstawowe typy analizy danych, zna możliwe zastosowania analizy baz tekstowych, wie na czym polega analiza sentymentów, zna sposoby analizy danych, a w szczególności wyszukiwanie, rafinację i analizę danych tekstowych, zna dostępne oprogramowanie do analizy danych.
Umiejętności
Po ukończeniu zajęć student umie:
Zdefiniować zadania analizy danych.
Wykonać analizę danych, zaczynając od importu danych, poprzez oczyszczenie i przekształcenie a skończywszy na zbudowaniu modelu oraz wizualizacji.
Interpretować wyniki analizy oraz wizualizacje wyników.
Stosować podstawy języka analizy danych „R”.
Kryteria oceniania
Zajęcia praktyczne przy komputerze z wykorzystaniem profesjonalnego oprogramowania analizy danych – Język R.
Kryteria oceniania:
Ocena ciągła (bieżące przygotowanie do zajęć i aktywność) 20%
Projekt 80%
Praktyki zawodowe
Brak
Literatura
1. Hardley Wicham, Garrett Grolemund, Język R, Wydawnictwo Helion, 2018.
2. Julia Silge & David Robinson, Text Mining with R, Wydawnictwo O’Reilly Media, 2017.
3. Jareo P. Lander, R dla każdego, Zaawansowane analizy i grafika statystyczna, APN Promise, Warszawa 2018.
4. Gogołek, Informatyka dla humanistów, Wydawnictwo Trzy Kropki, Warszawa 2012.
5. Marek Gągolewski, Programowanie w języku R, Wydawnictwo Naukowe PWN, 2014.
Więcej informacji
Dodatkowe informacje (np. o kalendarzu rejestracji, prowadzących zajęcia, lokalizacji i terminach zajęć) mogą być dostępne w serwisie USOSweb: