Lingwistyka korpusowa 3200-M1-2LK
Program kursu obejmuje wiadomości teoretyczne dotyczące budowy korpusów językowych, technik gromadzenia danych językowych oraz możliwości ich praktycznego wykorzystania:
1. Pojęcie korpusu językowego. Korpus językowy a zbiór tekstów. Badania teoretyczne a materiałowe: rola danych językowych w językoznawstwie
2. Typologia korpusów: korpusy jedno i wielojęzyczne, równoległe i porównywalne. Pojęcie reprezentatywności i adekwatności korpusów.
3. Podstawowe informacje na temat indeksacji korpusów językowych; umiejętności interpretacji danych i wykorzystania zdobytych informacji morfologiczno-składniowych
4. Podstawowe korpusy języka polskiego. Korpus NKJP wraz z narzędziami towarzyszącymi.
5. Podstawowe korpusy języków nauczanych obszarów językowych.
6. Dostępne narzędzia analizy korpusów tekstowych (AntConc, Jasnopis i in.).
7. Narzędzia analizy parametrycznej tekstu, zastosowania praktyczne pomiaru modalności tekstu.
8. Możliwe zastosowania korpusów w praktyce językoznawczej:
a) badanie języków specjalistycznych
b) korpus jako narzędzie wspomagające tłumacza
c) dydaktyka języków obcych
d) słowniki i modele słowników na różnych nośnikach danych
9. Korpusy tekstowe i teksty równoległe w pracy z programami wspomagającymi proces tłumaczenia (narzędzia CAT).
Celem zajęć jest zapoznanie z podstawowymi narzędziami informatycznymi wspierającymi proces gromadzenia, weryfikowania i stosowania odpowiednich dla języka ogólnego lub specjalistycznego struktur leksykalnych, stylistycznych i syntagmatycznych. Student po kursie powinien posługiwać się podstawowymi programami z zakresu lingwistyki cyfrowej oraz wyszukiwać potrzebne dane lingwistyczne przy pomocy poznanych narzędzi.
Kurs prowadzony z użyciem prezentacji i wizualizacji działania poszczególnych programów, w miarę dostępnych możliwości sprzętowych.
Ponadto, kurs kładzie nacisk na samodzielne wyszukiwanie oprogramowania oraz wyprowadzania indywidualnych wniosków z prowadzonych analiz lingwistycznych oraz ich wizualizacji.
Nabyta wiedza ma posłużyć do stworzenia przez studenta (grupę studentów) określonego formalnie na zajęciach projektu korpusu tekstowego, stanowiącego podstawę zaliczenia przedmiotu oraz zwiększenie kompetencji studentów w zakresie tworzenia samodzielnych prac leksykograficzno-korpusowych (w tym przeprowadzenia analiz na potrzeby pracy dyplomowej).
Nakład pracy studenta (3 ECTS):
30 godzin obecność na zajęciach w sali (1)
30 godzin przygotowanie korpusu tekstowego (1)
15 godzin praca własna z oprogramowaniem (0,5)
15 godzin lektura i przygotowanie do zajęć, przygotowanie do egzaminu (0,5)
Rodzaj przedmiotu
Tryb prowadzenia
Założenia (opisowo)
Koordynatorzy przedmiotu
Efekty kształcenia
Student w zakresie poniższych kryteriów podwyższa kwalifikacje:
Wiedza:
zna terminologię stosowaną w językoznawstwie i dziedzinach pokrewnych na poziomie rozszerzonym, orientuje się w najważniejszych kierunkach i metodach badań lingwistycznych; rozumie terminologię gramatyczną; posiada wiedzę na temat wybranych uwarunkowań pragmatycznych danych systemów językowych;
ma pogłębioną wiedzę na temat metodologii i prowadzenia badań językoznawczych lub literackich; zna styl naukowy i leksykę naukową; ma wiedzę na temat baz danych dla lingwistyki, posiada podstawową wiedzę na temat interpretacji danych pozyskanych z analiz;
zna popularne programy komputerowe wspomagające pracę tłumacza (CAT) oraz wybrane programy do analizy frekwencyjnej i stylometrycznej; zna możliwości wykorzystania tłumaczenia maszynowego;
Umiejętności:
wykorzystuje programy komputerowe przydatne w pracy tłumacza, potrafi właściwie formatować tekst w języku polskim, oraz w przynajmniej jednym w języku obcym; sprawnie posługuje się arkuszami kalkulacyjnymi i wykresami; potrafi korzystać z ogólnie dostępnych naukowych baz danych (w tym baz terminologicznych i korpusowych); sprawnie wyszukuje informacje, korzysta z wiedzy eksperckiej, ze słowników encyklopedycznych, językowych, terminologicznych ogólno-naukowych, ogólno-technicznych, interdyscyplinarnych i branżowych, korpusów językowych, baz danych, tekstów paralelnych;
potrafi wskazać luki w badaniach naukowych i kierunki ich kontynuowania; formułuje problemy badawcze, dobiera adekwatne metody, konstruuje narzędzia badawcze, opracowuje, prezentuje i interpretuje wyniki badań, wyciąga wnioski;
Kompetencje społeczne:
potrafi uzupełniać i doskonalić nabytą wiedzę o przynajmniej jednym języku specjalności oraz o własnym języku; jest świadomy konieczności ciągłego poszukiwania nowych źródeł słownikowych i tekstowych, a także śledzenia współcześnie powstających teorii naukowych; szybko reaguje na zmieniającą się rzeczywistość;
wyciąga wnioski z informacji zwrotnych, umie zarządzać czasem; utrzymuje kontakt ze środowiskiem tłumaczy, pracuje w środowisku wielokulturowym; zna środowisko pracy tłumacza;
potrafi pracować w grupie, współpracować z innymi, przyjmując odpowiednie role (funkcje); kierować małym zespołem (3-4 osoby w grupach ćwiczeniowych);
Kryteria oceniania
Metody oceny pracy studenta
- ocena aktywności i bieżące przygotowanie do zajęć;
- projekt (tematyczny korpus tekstowy);
- końcowe zaliczenie pisemne (test lub analiza stylometryczna korpusu).
Kryteria oceniania (komponenty oceny końcowej):
- ocena ciągła z zajęć: 10%
- projekt (tematyczny korpus tekstowy): 40%
- zaliczenie końcowe: 50%
Egzamin (zaliczenie końcowe):
W przypadku testu wielokrotnego/jednokrotnego wyboru wiążąca jest liczba uzyskanych punktów.
W przypadku analizy stylometrycznej korpusu wiążąca jest liczba uzyskanych punktów za poszczególne parametry stylometryczne.
Zasady punktacji dla oceny bieżącej i egzaminu/zaliczenia:
55%-69% = 3
70%-74% = 3+
75%-84% = 4
85%-89% = 4+
90%-100% = 5
Zasady współpracy prowadzącego ze studentami:
1. Nieobecności – dopuszczalne 3 nieusprawiedliwione nieobecności w semestrze (jest to zgodne z regulaminem).
2. Do końcowego zaliczenia można podejść po zaliczeniu projektu oraz otrzymania pozytywnej oceny ciągłej zajęć.
3. Student ma prawo do dwukrotnej poprawy każdego sprawdzianu pisemnego. Nieprzystąpienie do sprawdzianu w pierwszym terminie bez usprawiedliwienia powoduje utratę tego terminu.
Praktyki zawodowe
---
Literatura
Literatura podstawowa:
- Gruszczyńska E., Leńko-Szymanska A. (red.), Polskojęzyczne korpusy równoległe / Polish-language Parallel Corpora, WLS UW, Warszawa, 2016.
- Karpiński Ł., Systemy leksykalno-komunikacyjne, Campidoglio, Warszawa, 2017.
- "Prace filologiczne", tom. LXIII, WP UW, Warszawa 2012 (tom zawierający zbiór prac dot. lingwistyki korpusowej)
Literatura uzupełniająca:
- Biber C., Corpus Linguistics. Investigating language structure and use, Cambridge Univesrity Press 1998.
- Celiński P., 2013a, Postmedia. Cyfrowy kod i bazy danych, Wydawnictwo UMCS, Lublin.
- Hebal-Jezierska M., Podstawowe zasady korzystania z korpusów przy badaniu języka, [w:] "Prace Etnograficzne", 2018, Tom 46, Numer 1, s. 30-49
- Kamińska-Szmaj I., 1989, Słownictwo tekstów popularnonaukowych w ujęciu statystycznym, [w:] „Rozprawy Komisji Językowej”, t. XVI, Wrocławskie Towarzystwo Naukowe, Wyd. PAN, Wrocław, s. 69-87.
- Karpiński Ł., Zarys leksykografii terminologicznej, KJS UW, Warszawa, 2008
- Karpiński Ł., 2009a, Wybrane założenia komputerowej analizy tekstów i gromadzenia danych, [w] „Języki Specjalistyczne 9 – Kulturowy i leksykograficzny obraz języków specjalistycznych”, (red. eidem), KJS UW, Warszawa
- Karpiński Ł., 2012a, Analiza parametryczna tekstu a translacja maszynowa – wybrane zagadnienia, [w] „The Linguistic Journal of Applied Linguistics”, (red.), Lingwistyczna Szkoła Wyższa w Warszawie, Warszawa.
- Karpiński Ł., 2017, Maszynowa charakterystyka tekstów specjalistycznych na potrzeby
terminologicznych baz danych, [w:] "Komunikacja Specjalistyczna", t. 14/2017, s. 139-
163.
- Karpiński Ł., Michałowski P., 2012, Wybrane metody analizy terminologii specjalistycznej (na przykładzie technolektu geografii), [w:] „Edukacja dla Przyszłości”, t. IX, 2012, Wydawnictwo Wyższej Szkoły Finansów i Zarządzania w Białymstoku, Białystok, s. 19-46.
- Lewandowska-Tomaszczyk B., Gramatyka angielska na autentycznych materiałach językowych, Łódź, WSSM 2004.
- Lewandowska-Tomaszczyk B., Podstawy językoznawstwa korpusowego, Wyd. Uniwersytetu Łódzkiego, Łódź 2005.
- Ludskanow A., 1973, Tłumaczy człowiek i maszyna cyfrowa, WNT, Warszawa
- McEnery T., Wilson A., Corpus Linguistics: an Introduction, Edinburgh : Edinburgh University Press, 2001
- Pawłowski A., 2001, Metody kwantytatywne w sekwencyjnej analizie tekstu, Uniwersytet Warszawski Katedra Lingwistyki Formalnej, Warszawa.
- Przepiórkowski A., Bańko M., Górski R., Lewandowska-Tomaszczyk B., Narodowy Korpus Języka Polskiego, PWN, Warszawa 2012
- Sambor J., 1969, Badania statystyczne nad słownictwem. Na materiale „Pana Tadeusza”, Wrocław-Warszawa.
- Świdziński M., 2006, Lingwistyka korpusowa w Polsce – źródła, stan, perspektywy, [w:] „LingVaria”, nr 1, Wydział Polonistyki UJ, Kraków.
- Tognini-Bonelli E., Corpus Linguistics at Work, John Benjamins, Amsterdam/Philadelphia 2001
Materiały autorskie prowadzącego, zbiory analiz, wizualizacje danych stylometrycznych.
Więcej informacji
Dodatkowe informacje (np. o kalendarzu rejestracji, prowadzących zajęcia, lokalizacji i terminach zajęć) mogą być dostępne w serwisie USOSweb: