Data processing and analysis in Python language 2400-ZEWW796
1. Wprowadzenie do programowania obiektowego. Instalacja środowiska, zapoznanie z Ipython Notebook. (1.5 h)
2. Struktury danych (string, lista, krotka, słownik, zbiór, data-frame) (1.5 h)
3. Kontrola przepływu (if-then-else, pętle) (1.5 h)
4. Operacje na danych: zastosowanie metod do obiektów (1.5 h)
5. Podstawy NumPy – operacje na macierzach (1.5 h)
6. Funkcje (1.5 h)
7. Przygotowanie i podstawowe przetwarzanie danych: importowanie zbiorów danych, ‘czyszczenie’, zapisywanie danych (3 h)
8. Przetwarzanie ‘wyczyszczonych’ zbiorów danych z wykorzystaniem biblioteki Pandas (4.5 h)
9. Wizualizacja danych (1.5 h)
10. Zastosowanie metod analizy danych (w zależności od potrzeb uczestników i pozostałego czasu) (3h)
11. Rozpoznawanie błędów i odnajdywanie sposobów ich naprawienia/rozwiązania (sukcesywnie w trakcie kursu)
Rodzaj przedmiotu
Efekty kształcenia
Student rozumie czym jest programowanie obiektowe.
Student potrafi przygotować środowisko potrzebne do korzystania z języka Python.
Student zna podstawy programowania w języku Python.
Student potrafi rozpoznawać błędy i odnaleźć sposób ich rozwiązania.
Student potrafi zaimportować dane i określić ich jakość.
Student rozumie problemy związane z koniecznością „czyszczenia” danych o niskiej jakości i potrafi te problemy rozwiązać.
Student potrafi przetwarzać dane, w zależności od jego potrzeb i postaci do jakiej potrzebuje je przetransformować na potrzeby dalszej analizy.
Student zna podstawowe metody do analizy i wizualizacji danych.
Student nabiera świadomości w jak dużym stopniu programowanie usprawnia pracę z danymi.
Kryteria oceniania
1. Kolokwium sprawdzające wiedzę nabytą w pierwszej części zajęć (50%).
2. Przygotowanie własnego projektu na podstawie przerobionego materiału (50%). Główne kryterium oceniania to poziom wykorzystania narzędzi i metod poznanych w trakcie zajęć. Możliwość wykorzystania narzędzi do publikowania stworzonego projektu (github, nbviewer), pozwalających na udowodnienie nabytych umiejętności w CV. Koncepcja projektu, w miarę potrzeb, w konsultacji z prowadzącym. Możliwe wskazówki od prowadzącego na temat koncepcji, na podstawie zainteresowań studenta.
Literatura
W. McKinney, 2012, Python for Data Analysis, O’Reilly Media [tytuł PL: Python w analizie danych]
J. Grus, 2015, Data Science from Scratch, O’Reilly Media [tytuł PL: Data Science od podstaw]
Więcej informacji
Dodatkowe informacje (np. o kalendarzu rejestracji, prowadzących zajęcia, lokalizacji i terminach zajęć) mogą być dostępne w serwisie USOSweb: