Text Mining 1600-SZD-SPEC-TM-EF
Text Mining stanowi interdyscyplinarne podejście do ilościowej analizy danych tekstowych. Text Mining może stanowić wartościowe narzędzie do analizy dużych zbiorów, takich jak np. portale internetowe, prasa, artykuły naukowe, media społecznościowe, archiwa, stenogramy czy dokumenty rządowe. Poprzez zastosowanie różnorodnych technik, takich jak tokenizacja, lematyzacja, analiza sentymentu czy klasyfikacja tematyczna, zautomatyzowana analiza tekstu pozwala na zgłębianie treści w celu identyfikacji potencjalnie istotnych wzorców, tendencji, oraz eksploracji informacji. Dzięki temu możliwe jest przetwarzanie, kategoryzacja oraz wizualizacja danych tekstowych, co umożliwia lepsze zrozumienie zachodzących procesów ekonomicznych, społecznych, czy też politycznych. Pierwsza część kursu poświęcona jest podstawowym metodom w ramach Text Miningu (przygotowanie danych, kategoryzacja tekstu, klasteryzacja, modelowanie tematów, analiza sentymentu, wizualizacja), natomiast druga – zaawansowanym (word embeddings, sieci neuronowe, duże modele językowe).
Rodzaj przedmiotu
Koordynatorzy przedmiotu
Efekty kształcenia
Wiedza | Zna i rozumie:
WG_01 w stopniu umożliwiającym rewizję istniejących paradygmatów - światowy dorobek, obejmujący podstawy teoretyczne oraz zagadnienia ogólne i wybrane zagadnienia szczegółowe – właściwe dla danej dyscypliny w ramach nauk społecznych
WG_02 - główne tendencje rozwojowe dyscyplin w ramach nauk społecznych, w których odbywa się kształcenie
WG_03 - metodologię badań naukowych w obrębie dyscyplin naukowych z dziedziny nauk społecznych
WK_01 - fundamentalne dylematy współczesnej cywilizacji z perspektywy nauk społecznych
Umiejętności | Potrafi:
UK_05 - posługiwać się językiem obcym na poziomie B2 Europejskiego Systemu Opisu Kształcenia Językowego z wykorzystaniem fachowej terminologii właściwej danej dyscyplinie w ramach nauk społecznych w stopniu umożliwiającym uczestnictwo w międzynarodowym środowisku naukowym i zawodowym
Kompetencje społeczne | Jest gotów do:
KO_01 - wypełniania zobowiązań społecznych badaczy i twórców
KO_02 wypełniania zobowiązań społecznych i podejmowania działań na rzecz interesu publicznego, zwłaszcza w zakresie inicjowania działań na rzecz interesu publicznego
KO_03 - myślenia i działania w sposób przedsiębiorczy
Oraz inne: ‒ Student ma wiedzę na temat text miningu; ‒ Student zna metodologię wykorzystywaną w text miningu; ‒ Student potrafi wykorzystać wiedzę z text miningu do prowadzenia własnych badań
Kryteria oceniania
Media oraz źródła on-line prezentowane na zajęciach
Opis wymagań związanych z uczestnictwem w zajęciach, w tym dopuszczalnej liczby nieobecności podlegających usprawiedliwieniu: Dopuszczalne są 2 nieobecności
Zasady zaliczania zajęć i przedmiotu (w tym zaliczania poprawkowego): Przygotowanie projektu zaliczeniowego
Metody weryfikacji efektów uczenia się: Ocena przygotowanego projektu zaliczeniowego
Kryteria oceniania: Za projekt można uzyskać maksymalnie 100 pkt. Warunkiem uzyskania pozytywnej oceny końcowej z przedmiotu jest otrzymanie przynajmniej 50 pkt.
Praktyki zawodowe
-
Literatura
Ch. Aggarwal (2022). Machine Learning for Text. Springer; Ch. Aggarwal, Ch.X. Zhai (2012). Mining Text Data. Springer; J. Silge, D. Robinson (2020). Text Mining with R. O’Reilly Media; B. Bengfort, R. Bilbro, T. Ojeda (2018). Applied Text Analysis with Python. O’Reilly
Więcej informacji
Dodatkowe informacje (np. o kalendarzu rejestracji, prowadzących zajęcia, lokalizacji i terminach zajęć) mogą być dostępne w serwisie USOSweb: