Natural Language Processing 4010-NLP
Tematyka zajęć:
1. NLP history, regular expressions, wyk. 2 godz., lab. 2 godz.
2. Elementary deep learning, wyk. 8 godz., lab. 10 godz.
3. NLP Libraries (NLTK, TextBlob, spaCy). Basic techniqes (tokenization, stopwords removal), wyk. 2 godz., lab. 2 godz.
4. Word similarity metrics, wyk. 2 godz., lab. 2 godz.
5. Text classification, wyk. 2 godz., lab. 2 godz.
6. Topic modelling, Latent Dirichlet Allocation (LDA), wyk. 2 godz., lab. 2 godz.
7. Topic modelling, other algorithms, wyk. 2 godz., lab. 2 godz.
8. Embeddings, wyk. 2 godz., lab. 2 godz.
9. Text generation, Markov chains, recurrent neural networks, other methods, wyk. 2 godz., lab. 2 godz.
10. Large language models, wyk. 2 godz., lab. 4 godz.
11. Conversational agents, wyk. 4 godz.
Założenia (opisowo)
Koordynatorzy przedmiotu
Rodzaj przedmiotu
Tryb prowadzenia
Efekty kształcenia
Wiedza:
W1 - Posiada wiedzę umożliwiającą statystyczną analizę tekstu oraz o praktycznych zastosowaniach tej wiedzy w dostępnych narzędziach informatycznych [K_W01, K_W04, K_W05]
W2 - Posiada wiedzę o technikach analizy języka naturalnego [K_W02, K_W05]
W3 - Posiada wiedzę o sposobach pozyskiwania danych językowych [K_W10]
Umiejętności:
U1 - Potrafi pozyskiwać informacje dotyczące z przedmiotu z literatury, baz danych oraz innych właściwie dobranych źródeł w języku polskim i angielskim; potrafi integrować uzyskane informacje, dokonywać ich interpretacji i krytycznej oceny, a także wyciągać wnioski oraz formułować i wyczerpująco uzasadniać opinie [K_U01]
U2 - Potrafi tworzyć opracowania o charakterze naukowym i popularnym raportujące uzyskane wyniki z zakresu NLP [K_U02, K_U03, K_U04, K_U06]
U3 - Potrafi samodzielnie zdobywać wiedzę z zakresu NLP i stosować ją w praktyce [K_U07]
U4 - Potrafi stosować narzędzia informatyczne - jak OLAT czy portal Intel Academy - do komunikacji z innymi i pozyskiwania wiedzy [K_U09]
U5 - Potrafi ocenic przydatność i możliwość wykorzystania nowych rozwiązań programistycznych w zakresie NLP [K_U012]
U6 - Potrafi dokonać analizy problemu obliczeniowego z zakresu NLP i określić przydatne do jego rozwiązania metody obliczeniowe [K_U17]
U7 - Potrafi wykorzystać biblioteki stosowane w aplikacjach NLP (jak NLTK, spaCy) [K_U19]
U8 - Potrafi wykorzystać istniejące rozwiązania NLP do implementacji bardziej złożonych systemów przetwarzających język naturalny [K_U20]
Kompetencje społeczne:
K1 - Absolwent jest gotów myśleć twórczo w celu analizy dostępnych danych - zwłaszcza o dużym wolumenie - i tworzenia nowych wykorzystujących je rozwiązań [K_K03, K_K04]
K2 - Jest nastawiony na jak najlepsze wykonanie zadania; dba o szczegół; jest systematyczny, zwłaszcza w zakresie samokształcenia; jest gotów samodzielnie identyfikować i analizować źródła wiedzy [K_K05, K_K07, K_K09]
Kryteria oceniania
The final grade for the course is based on the project’s assessment (weight - 60%) and the exam (weight - 40%).
Project Information:
The project involves preparing a classifier model based on a dataset provided during the course. The student is required to submit the source code and the evaluation results of the model in written form.
The following elements of the solution are taken into account:
1. Exploratory data analysis,
2. Selection and justification of the data representation method,
3. Analysis of the applicability of the chosen machine learning model, including a choice of hyperparameters,
4. The achieved result in terms of the f1 score,
5. Late submission of the assignment (up to one week past the deadline set at the beginning of the course) will be reflected in the final grade.
The exam will be conducted in the form of a test.
NOTE
1. A medical certificate does not exempt the student from knowing the material. It only entitles them to an individualized form of assessment.
2. Students that have received approval for an individual study plan are required to contact the course coordinator to determine how to achieve all the learning outcomes assigned to the course. If it is not possible to achieve the aforementioned outcomes, the coordinator may refuse to grant credit for the course.
3. Classes attendance is mandatory. In cases of justified absences, the student must promptly contact the course coordinator.
Literatura
1. Zasoby Intel Academy, https://www.intel.com/content/www/us/en/developer/learn/course-natural-language-processing.html (dostęp: 22.08.2024)
2. L. Gazit, M. Ghaffari, Mastering NLP from Foundations to LLMs: Apply advanced rule-based techniques to LLMs and solve real-world business problems using Python, wyd. Packt 2024
3. A. Géron, Hands-On Machine Learning with Scikit-Lear, Keras & TensorFlow, 2nd ed., wyd O’Reilly 2019
Więcej informacji
Dodatkowe informacje (np. o kalendarzu rejestracji, prowadzących zajęcia, lokalizacji i terminach zajęć) mogą być dostępne w serwisie USOSweb: