Dane, strumienie, rozpraszanie 1000-2D23DSR
Tematyka seminarium obejmuje teorię i praktykę przetwarzania danych i reprezentacji wiedzy. Interesują nas wyzwania związane z przetwarzaniem danych, zapytań i metadanych (schematów, więzów, zależności, ontologii) - od projektowania i analizy abstrakcyjnych formalizmów aż po architekturę systemów i rozpraszanie obliczeń na dużych danych. Rozważamy różne rodzaje danych: nie tylko dane relacyjne, ale również semistrukturalne (XML, JSON), grafowe (RDF, LPG), obiektowe, tekstowe, temporalne, strumieniowe, aż po systemy informacji geograficznej (GIS).
Podejmujemy zarówno zagadnienia teoretyczne, wykorzystujące warsztat algorytmiki, kombinatoryki, logiki (np. teorii modeli skończonych) i teorii automatów, jak i praktyczne, opierające się na narzędziach inżynierii oprogramowania i wiedzy o systemach. Prace magisterskie powstające w ramach seminarium mogą badać rozstrzygalność i złożoność abstrakcyjnych problemów decyzyjnych, projektować algorytmy i heurystyki, implementować i testować istniejące rozwiązania teoretyczne, czy też analizować, porównywać i rozszerzać istniejące systemy.
Spotykamy się również i dyskutujemy z badaczami z innych dziedzin, którzy czasami dostarczają nam pomysłów na tematy prac magisterskich. Współpracowaliśmy już lub nadal współpracujemy z astronomami, chemikami, geografami. Jesteśmy nadal otwarci na inne obszary zastosowań.
Referaty seminaryjne są zwykle wygłaszane na podstawie wybranych prac z głównych międzynarodowych konferencji poświęconych bazom danych i reprezentacji wiedzy, takich jak VLDB, PODS, SIGMOD i KR.
Przykładowe zagadnienia:
* Data models, semantics, query languages
* Data provenance
* Databases for emerging hardware
* Distributed and parallel databases
* Graph data management, RDF, social networks, Semantic Web
* Knowledge discovery, clustering, data mining
* Machine learning for data management and vice versa
* Model theory, logics, algebras, computational complexity
* Ontology-based data access, data integration and exchange, metadata management
* Ontology formalisms and models, description logics
* Privacy, security, ethics
* Query processing and optimization
* Scientific databases
* Semi-structured data
* Small data, end-user programming
* Storage, indexing, and physical database design
* Streams, sensor networks, complex event processing
* Transaction processing
* Uncertainty, incompleteness, and inconsistency in data management
Rodzaj przedmiotu
Koordynatorzy przedmiotu
Efekty kształcenia
Studenci przygotowują i wygłaszają referaty seminaryjne (K_U11) w oparciu o najnowszą anglojęzyczną literaturę dotyczącą szeroko pojętych baz danych (K_U14, K_K08), z konferencji i czasopism ACM i IEEE (K_K07).
Od studenta referującego oczekujemy nie tylko zrelacjonowania artykułu, ale także wyrażenia własnej opinii o nim (K_K06), a od słuchaczy udziału w dyskusji, gdy referują inne osoby (K_K02).
Referaty drugiego rodzaju są związane z tworzeniem pracy magisterskiej (K_U13), w tym te pierwsze, niedługo po ustaleniu tematu, gdy trzeba zaprezentować samodzielnie przygotowany plan pracy i zdobycia wiedzy niezbędnej do zrealizowania tematu (K_K01, K_U15,K_K03).
Kryteria oceniania
Studenci pierwszego roku zaliczają seminarium na podstawie dwóch referatów i zarejestrowania tematu pracy magisterskiej.
Studenci drugiego roku zaliczają na podstawie dwóch referatów i złożenia pracy magisterskiej.
Literatura
Sprawozdania z konferencji VLDB, PODS, SIGMOD, KR.
Więcej informacji
Dodatkowe informacje (np. o kalendarzu rejestracji, prowadzących zajęcia, lokalizacji i terminach zajęć) mogą być dostępne w serwisie USOSweb: