- Bioinformatyka i biologia systemów, stacjonarne, pierwszego stopnia
- Informatyka, stacjonarne, pierwszego stopnia
- Matematyka, stacjonarne, pierwszego stopnia
- Bioinformatyka i biologia systemów, stacjonarne drugiego stopnia
- Informatyka, stacjonarne, drugiego stopnia
- Matematyka, stacjonarne, drugiego stopnia
Lingwistyka korpusowa 3223-LK-OG
Program kursu obejmuje wiadomości teoretyczne dotyczące budowy korpusów językowych, technik gromadzenia danych językowych oraz możliwości ich praktycznego wykorzystania:
1. Pojęcie korpusu językowego. Korpus językowy a zbiór tekstów. Badania teoretyczne a materiałowe: rola danych językowych w naukach społecznych, marketingu, mediach oraz językoznawstwie.
2. Typologia korpusów: korpusy jedno i wielojęzyczne, równoległe i porównywalne. Pojęcie reprezentatywności i adekwatności korpusów.
3. Podstawowe informacje na temat indeksacji korpusów językowych; umiejętności interpretacji podanych danych.
4. Podstawowe korpusy języka polskiego. Korpus NKJP wraz z narzędziami towarzyszącymi.
5. Dostępne narzędzia analizy korpusów tekstowych (AntConc, Jasnopis i in.).
6. Narzędzia analizy parametrycznej tekstu, zastosowania praktyczne pomiaru modalności tekstu.
7. Możliwe zastosowania korpusów w praktyce:
a) badanie języków specjalistycznych
b) korpus jako narzędzie wspomagające tłumacza
c) dydaktyka języków obcych
d) słowniki i modele słowników na różnych nośnikach danych
8. Korpusy tekstowe i teksty równoległe w pracy z programami wspomagającymi proces tłumaczenia (narzędzia CAT).
Celem zajęć jest zapoznanie z podstawowymi narzędziami informatycznymi pozwalającymi dowiedzieć się więcej o potrzebnym nam tekście, zanalizować statystycznie i stylometrycznie jego treść i wykorzystać miarodajne dane dla własnych celów (badawczych). Student po kursie powinien posługiwać się podstawowymi programami z zakresu lingwistyki cyfrowej oraz wyszukiwać potrzebne dane przy pomocy poznanych narzędzi. Kurs prowadzony z użyciem prezentacji i wizualizacji działania poszczególnych programów, w miarę dostępnych możliwości sprzętowych. Ponadto, kurs zakłada zdobycie umiejętności wyprowadzania indywidualnych wniosków z prowadzonych analiz lingwistycznych oraz ich wizualizacji. Nabyta wiedza ma posłużyć do stworzenia przez studenta (grupę studentów) określonego formalnie na zajęciach projektu korpusu tekstowego, stanowiącego podstawę zaliczenia (projekt lub nabyte umiejętności można zastosować dla uatrakcyjnienia badań z innych przedmiotów lub wzmocnienia treści pracy dyplomowej). Alternatywnie można zaliczyć przedmiot prezentując wiedzę przedmiotową na teście zaliczeniowym z treści zajęć i literatury.
Nakład pracy studenta (3 ECTS):
30 godzin obecność na zajęciach w sali (1)
30 godzin przygotowanie korpusu tekstowego lub opracowań alternatywnych (1)
15 godzin praca własna z oprogramowaniem (0,5)
15 godzin lektura i przygotowanie do zajęć, przygotowanie do egzaminu/omówienia projektu (0,5)
W cyklu 2023Z:
Zgodnie z opisem nadrzędnym. |
W cyklu 2024L:
Zgodnie z opisem nadrzędnym. |
Rodzaj przedmiotu
Tryb prowadzenia
Założenia (opisowo)
Koordynatorzy przedmiotu
Efekty kształcenia
Student w zakresie poniższych kryteriów podwyższa kwalifikacje:
zna terminologię stosowaną w językoznawstwie i dziedzinach pokrewnych na poziomie rozszerzonym, orientuje się w najważniejszych kierunkach i metodach badań lingwistycznych; rozumie terminologię gramatyczną; posiada wiedzę na temat wybranych uwarunkowań pragmatycznych danych systemów językowych;
ma pogłębioną wiedzę na temat metodologii i prowadzenia badań językoznawczych lub literackich; zna styl naukowy i leksykę naukową; ma wiedzę na temat baz danych dla lingwistyki, posiada podstawową wiedzę na temat interpretacji danych pozyskanych z analiz;
zna popularne programy komputerowe wspomagające pracę tłumacza (CAT) oraz wybrane programy do analizy frekwencyjnej i stylometrycznej; zna możliwości wykorzystania tłumaczenia maszynowego;
Umiejętności:
wykorzystuje programy komputerowe przydatne w pracy tłumacza, potrafi właściwie formatować tekst w języku polskim, oraz w przynajmniej jednym w języku obcym; sprawnie posługuje się arkuszami kalkulacyjnymi i wykresami; potrafi korzystać z ogólnie dostępnych naukowych baz danych (w tym baz terminologicznych i korpusowych); sprawnie wyszukuje informacje, korzysta z wiedzy eksperckiej, ze słowników encyklopedycznych, językowych, terminologicznych ogólno-naukowych, ogólno-technicznych, interdyscyplinarnych i branżowych, korpusów językowych, baz danych, tekstów paralelnych;
potrafi wskazać luki w badaniach naukowych i kierunki ich kontynuowania; formułuje problemy badawcze, dobiera adekwatne metody, konstruuje narzędzia badawcze, opracowuje, prezentuje i interpretuje wyniki badań, wyciąga wnioski;
Kompetencje społeczne:
potrafi uzupełniać i doskonalić nabytą wiedzę o przynajmniej jednym języku specjalności oraz o własnym języku; jest świadomy konieczności ciągłego poszukiwania nowych źródeł słownikowych i tekstowych, a także śledzenia współcześnie powstających teorii naukowych; szybko reaguje na zmieniającą się rzeczywistość;
wyciąga wnioski z informacji zwrotnych, umie zarządzać czasem; utrzymuje kontakt ze środowiskiem tłumaczy, pracuje w środowisku wielokulturowym; zna środowisko pracy tłumacza;
potrafi pracować w grupie, współpracować z innymi, przyjmując odpowiednie role (funkcje); kierować małym zespołem (3-4 osoby w grupach ćwiczeniowych);
Kryteria oceniania
Metody oceny pracy studenta
- ocena aktywności i bieżące przygotowanie do zajęć;
- projekt (tematyczny korpus tekstowy lub alternatywa);
- końcowe zaliczenie pisemne (test lub analiza stylometryczna korpusu).
Kryteria oceniania (komponenty oceny końcowej):
- ocena ciągła z zajęć: 10%
- projekt (tematyczny korpus tekstowy): 40%
- zaliczenie końcowe: 50%
Egzamin (zaliczenie końcowe):
W przypadku testu mieszanego (wielokrotnego i/lub jednokrotnego wyboru) wiążąca jest liczba uzyskanych punktów.
W przypadku przygotowywania projektu analizy wybranych korpusów tekstowych wiążąca jest liczba uzyskanych punktów za poszczególne części opracowania.
Zasady punktacji dla oceny bieżącej i egzaminu/zaliczenia:
55%-69% = 3
70%-74% = 3+
75%-84% = 4
85%-89% = 4+
90%-100% = 5
Zasady współpracy prowadzącego ze studentami:
1. Nieobecności – dopuszczalne 3 nieusprawiedliwione nieobecności w semestrze (jest to zgodne z regulaminem).
2. Do końcowego zaliczenia można podejść po zaliczeniu projektu (zadania) oraz otrzymania pozytywnej oceny ciągłej zajęć.
3. Student ma prawo do dwukrotnej poprawy każdego sprawdzianu pisemnego. Nieprzystąpienie do sprawdzianu w pierwszym terminie bez usprawiedliwienia powoduje utratę tego terminu.
Literatura
Literatura podstawowa:
- Gruszczyńska E., Leńko-Szymanska A. (red.), Polskojęzyczne korpusy równoległe / Polish-language Parallel Corpora, WLS UW, Warszawa, 2016.
- Karpiński Ł., Systemy leksykalno-komunikacyjne, Campidoglio, Warszawa, 2017.
- Karpiński Ł., 2017, Maszynowa charakterystyka tekstów specjalistycznych na potrzeby terminologicznych baz danych, [w:] "Komunikacja Specjalistyczna", t. 14/2017, s. 139-163.
- "Prace filologiczne", tom. LXIII, WP UW, Warszawa 2012 (tom zawierający zbiór prac dot. lingwistyki korpusowej)
Literatura uzupełniająca:
- Biber C., Corpus Linguistics. Investigating language structure and use, Cambridge Univesrity Press 1998.
- Celiński P., 2013a, Postmedia. Cyfrowy kod i bazy danych, Wydawnictwo UMCS, Lublin.
- Hebal-Jezierska M., Podstawowe zasady korzystania z korpusów przy badaniu języka, [w:] "Prace Etnograficzne", 2018, Tom 46, Numer 1, s. 30-49
- Kamińska-Szmaj I., 1989, Słownictwo tekstów popularnonaukowych w ujęciu statystycznym, [w:] „Rozprawy Komisji Językowej”, t. XVI, Wrocławskie Towarzystwo Naukowe, Wyd. PAN, Wrocław, s. 69-87.
- Karpiński Ł., Zarys leksykografii terminologicznej, KJS UW, Warszawa, 2008
- Karpiński Ł., 2009a, Wybrane założenia komputerowej analizy tekstów i gromadzenia danych, [w] „Języki Specjalistyczne 9 – Kulturowy i leksykograficzny obraz języków specjalistycznych”, (red. eidem), KJS UW, Warszawa
- Karpiński Ł., 2012a, Analiza parametryczna tekstu a translacja maszynowa – wybrane zagadnienia, [w] „The Linguistic Journal of Applied Linguistics”, (red.), Lingwistyczna Szkoła Wyższa w Warszawie, Warszawa.
- Karpiński Ł., Michałowski P., 2012, Wybrane metody analizy terminologii specjalistycznej (na przykładzie technolektu geografii), [w:] „Edukacja dla Przyszłości”, t. IX, 2012, Wydawnictwo Wyższej Szkoły Finansów i Zarządzania w Białymstoku, Białystok, s. 19-46.
- Lewandowska-Tomaszczyk B., Gramatyka angielska na autentycznych materiałach językowych, Łódź, WSSM 2004.
- Lewandowska-Tomaszczyk B., Podstawy językoznawstwa korpusowego, Wyd. Uniwersytetu Łódzkiego, Łódź 2005.
- Ludskanow A., 1973, Tłumaczy człowiek i maszyna cyfrowa, WNT, Warszawa
- McEnery T., Wilson A., Corpus Linguistics: an Introduction, Edinburgh : Edinburgh University Press, 2001
- Pawłowski A., 2001, Metody kwantytatywne w sekwencyjnej analizie tekstu, Uniwersytet Warszawski Katedra Lingwistyki Formalnej, Warszawa.
- Przepiórkowski A., Bańko M., Górski R., Lewandowska-Tomaszczyk B., Narodowy Korpus Języka Polskiego, PWN, Warszawa 2012
- Sambor J., 1969, Badania statystyczne nad słownictwem. Na materiale „Pana Tadeusza”, Wrocław-Warszawa.
- Świdziński M., 2006, Lingwistyka korpusowa w Polsce – źródła, stan, perspektywy, [w:] „LingVaria”, nr 1, Wydział Polonistyki UJ, Kraków.
- Tognini-Bonelli E., Corpus Linguistics at Work, John Benjamins, Amsterdam/Philadelphia 2001
Materiały autorskie prowadzącego, zbiory analiz, wizualizacje danych stylometrycznych.
W cyklu 2023Z:
Zgodnie z opisem nadrzędnym. |
W cyklu 2024L:
Zgodnie z opisem nadrzędnym. |
Uwagi
W cyklu 2023Z:
W przypadku braku możliwości prowadzenia zajęć w formie stacjonarnej zajęcia będą odbywać się przy użyciu narzędzi komunikacji na odległość, najprawdopodobniej Google Meet oraz innych zalecanych przez UW. |
W cyklu 2024L:
W przypadku braku możliwości prowadzenia zajęć w formie stacjonarnej zajęcia będą odbywać się przy użyciu narzędzi komunikacji na odległość, najprawdopodobniej Google Meet oraz innych zalecanych przez UW. |
Więcej informacji
Więcej informacji o poziomie przedmiotu, roku studiów (i/lub semestrze) w którym się odbywa, o rodzaju i liczbie godzin zajęć - szukaj w planach studiów odpowiednich programów. Ten przedmiot jest związany z programami:
- Bioinformatyka i biologia systemów, stacjonarne, pierwszego stopnia
- Informatyka, stacjonarne, pierwszego stopnia
- Matematyka, stacjonarne, pierwszego stopnia
- Bioinformatyka i biologia systemów, stacjonarne drugiego stopnia
- Informatyka, stacjonarne, drugiego stopnia
- Matematyka, stacjonarne, drugiego stopnia
Dodatkowe informacje (np. o kalendarzu rejestracji, prowadzących zajęcia, lokalizacji i terminach zajęć) mogą być dostępne w serwisie USOSweb: