Modelowanie tematów i analiza sentymentu 2400-SP-DS-TOP2
Kurs ma na celu zaznajomienie słuchaczy z algorytmami umożliwiającymi modelowanie tematów (czyli automatyczne grupowanie tekstów ze względu na występujące w nich motywy tematyczne) i analizę sentymentu (czyli identyfikację, ekstrakcję i kwantyfikację informacji afektywnych występujących w
danych tekstowych).
W trakcie kursu omówione zostaną krótko dwa najważniejsze algorytmy modelowania tematów - klasyczny Latent Dirichlet Allocation pozwalający na estymację prawdopodobieństw przynależności dokumentów do poszczególnych motywów tematycznych, oraz oparty o duże modele językowe BERTopic. Ponadto, przedstawione zostaną algorytmy analizy sentymentu - od metod najprostszych, tj. słownikowych, aż po wykorzystujące nadzorowane uczenie maszynowe i duże modele językowe.
Koordynatorzy przedmiotu
Rodzaj przedmiotu
Kryteria oceniania
Test zaliczeniowy - do zaliczenia wymagana jest 50% poprawnych odpowiedzi na 10 pytań.
Literatura
Materiały przygotowywane przez wykładowcę i udostępniane uczestnikowi na platformie Google Drive.