Przetwarzanie języka naturalnego i sztuczna inteligencja 2100-CB-M-D3PJSI
Program kursu:
Podstawowe informacje o przechowywaniu tekstu w postaci cyfrowej.
Zestaw znaków ASCII oraz kodowanie znaków spoza tego zestawu.
Kodowania UTF, ze szczególnym uwzględnieniem UTF8.
Zagadnienia związane z językami o rozbudowanej fleksji (np. polski), przyrostki, przedrostki, rdzenie, oboczności, lematyzacja.
Podstawy wyrażeń regularnych
Rafinacja tekstów pod kątem dalszej analizy.
TF-IDF i prawo Zipfa
Podstawy AI - osadzanie tekstów w przestrzeni wektorowej
Modele językowe.
Detekcja tematów jako zastosowanie metod poszukiwania klastrów i redukcji wymiarów.
Analiza wydźwięku emocjonalnego jako przykład zastosowania modeli językowych.
Tryb prowadzenia
Założenia (opisowo)
Koordynatorzy przedmiotu
Kierunek podstawowy MISMaP
Rodzaj przedmiotu
Wymagania (lista przedmiotów)
Efekty kształcenia
Detekcja tematów i słów kluczowych oraz analiza wydźwięku emocjonalnego tekstów jako metoda wykrywania nieprzyjaznych informacji i zagrożeń w infosferze (K_W05)
Zastosowanie modeli językowych oraz metod AI do analizy tekstów pod kątem fałszywej, nieprzyjaznej informacji lub tematów wskazujących możliwe zagrożenia (K_W10)
Analiza tekstów z wybranych źródeł przy wykorzystaniu narzędzi informatycznych jako metoda wczesnego wykrywania zagrożeń - na etapie ich planowania (K_U03)
Przedstawianie wczesnego wykrywania zagrożeń na podstawie źródeł tekstowych oraz uświadamianie znaczenia infosfery jako przestrzeni, w której można odnaleźć potencjalne źródła zagrożeń oraz szeroko rozumiane wektory ataku informacyjnego (K_K01).
Kryteria oceniania
Wykonanie indywidualnego projektu zaliczeniowego na podstawie wybranych źródeł informacji.
Praktyki zawodowe
nie dotyczy
Literatura
Sowmya Vajjala, Bodhisattwa Majumder, Anuj Gupta, Harshit Surana:
Przetwarzanie języka naturalnego w praktyce. Przewodnik po budowie rzeczywistych systemów NLP, Helion
Aleksander Molak: Wnioskowanie i związki przyczynowe w Pythonie. Nowoczesne uczenie maszynowe z wykorzystaniem bibliotek DoWhy, EconML, PyTorch i nie tylko, Helion
https://huggingface.co
https://spacy.io
Więcej informacji
Dodatkowe informacje (np. o kalendarzu rejestracji, prowadzących zajęcia, lokalizacji i terminach zajęć) mogą być dostępne w serwisie USOSweb: