Badania korpusowe 3500-JIS-1-BK
Program kursu obejmuje wiadomości teoretyczne dotyczące budowy korpusów językowych, technik gromadzenia danych językowych oraz możliwości ich praktycznego wykorzystania:
1. Pojęcie korpusu językowego. Korpus językowy a zbiór tekstów. Badania teoretyczne a materiałowe: rola danych językowych w naukach społecznych, marketingu, mediach oraz językoznawstwie.
2. Typologia korpusów: korpusy jedno i wielojęzyczne, równoległe i porównywalne. Pojęcie reprezentatywności i adekwatności korpusów.
3. Podstawowe informacje na temat indeksacji korpusów językowych; umiejętności interpretacji podanych danych.
4. Podstawowe korpusy języka polskiego. Korpus NKJP wraz z narzędziami towarzyszącymi.
5. Dostępne narzędzia analizy korpusów tekstowych (AntConc, Jasnopis i in.).
6. Narzędzia analizy parametrycznej tekstu, zastosowania praktyczne pomiaru modalności tekstu.
7. Możliwe zastosowania korpusów w praktyce:
a) badanie języków specjalistycznych
b) korpus jako narzędzie wspomagające tłumacza
c) dydaktyka języków obcych
d) słowniki i modele słowników na różnych nośnikach danych
8. Korpusy tekstowe i teksty równoległe w pracy z programami wspomagającymi proces tłumaczenia (narzędzia CAT), programami do edycji napisów itp.
Celem zajęć jest zapoznanie z podstawowymi narzędziami informatycznymi wspierającymi proces gromadzenia, weryfikowania i stosowania odpowiednich dla języka ogólnego lub specjalistycznego struktur leksykalnych, stylistycznych i syntagmatycznych. Student po kursie powinien posługiwać się podstawowymi programami z zakresu lingwistyki cyfrowej oraz wyszukiwać potrzebne dane lingwistyczne przy pomocy poznanych narzędzi.
Kurs prowadzony z użyciem prezentacji i wizualizacji działania poszczególnych programów, w miarę dostępnych możliwości sprzętowych.
Ponadto, kurs kładzie nacisk na samodzielne wyszukiwanie oprogramowania oraz wyprowadzania indywidualnych wniosków z prowadzonych analiz lingwistycznych oraz ich wizualizacji.
Nabyta wiedza ma posłużyć do stworzenia przez studenta (grupę studentów) określonego formalnie na zajęciach z korpusu tekstowego, stanowiącego podstawę zaliczenia przedmiotu oraz zwiększenie kompetencji studentów w zakresie tworzenia samodzielnych prac leksykograficzno-korpusowych (w tym przeprowadzenia analiz na potrzeby pracy dyplomowej).
W programie uwzględnione będą umiejętności projektowania i budowania korpusów na potrzeby badań z uwzględnieniem ich reprezentatywności, zrównoważenia i porównywalności. Ćwiczona będzie również praca badawcza z korpusami z wykorzystaniem narzędzi i programów do analizy korpusowej, w tym formułowania pytań badawczych, analizy i interpretacji danych ilościowych oraz triangulacji metodologicznej w celu interpretacji i krytycznej oceny zjawisk społecznych.
Rodzaj przedmiotu
Tryb prowadzenia
Założenia (opisowo)
Koordynatorzy przedmiotu
Efekty kształcenia
Wiedza:
zna terminologię stosowaną w językoznawstwie i dziedzinach pokrewnych na poziomie rozszerzonym, orientuje się w najważniejszych kierunkach i metodach badań lingwistycznych; rozumie terminologię gramatyczną; posiada wiedzę na temat wybranych uwarunkowań pragmatycznych danych systemów językowych;
ma pogłębioną wiedzę na temat metodologii i prowadzenia badań językoznawczych lub literackich; zna styl naukowy i leksykę naukową; ma wiedzę na temat baz danych dla lingwistyki, posiada podstawową wiedzę na temat interpretacji danych pozyskanych z analiz;
zna popularne programy komputerowe wspomagające pracę tłumacza (CAT) oraz wybrane programy do analizy frekwencyjnej i stylometrycznej; zna możliwości wykorzystania tłumaczenia maszynowego;
Umiejętności:
wykorzystuje programy komputerowe przydatne w pracy tłumacza, potrafi właściwie formatować tekst w języku polskim, oraz w przynajmniej jednym w języku obcym; sprawnie posługuje się arkuszami kalkulacyjnymi i wykresami; potrafi korzystać z ogólnie dostępnych naukowych baz danych (w tym baz terminologicznych i korpusowych); sprawnie wyszukuje informacje, korzysta z wiedzy eksperckiej, ze słowników encyklopedycznych, językowych, terminologicznych ogólno-naukowych, ogólno-technicznych, interdyscyplinarnych i branżowych, korpusów językowych, baz danych, tekstów paralelnych;
potrafi wskazać luki w badaniach naukowych i kierunki ich kontynuowania; formułuje problemy badawcze, dobiera adekwatne metody, konstruuje narzędzia badawcze, opracowuje, prezentuje i interpretuje wyniki badań, wyciąga wnioski;
Kompetencje społeczne:
potrafi uzupełniać i doskonalić nabytą wiedzę o przynajmniej jednym języku specjalności oraz o własnym języku; jest świadomy konieczności ciągłego poszukiwania nowych źródeł słownikowych i tekstowych, a także śledzenia współcześnie powstających teorii naukowych; szybko reaguje na zmieniającą się rzeczywistość;
wyciąga wnioski z informacji zwrotnych, umie zarządzać czasem; utrzymuje kontakt ze środowiskiem tłumaczy, pracuje w środowisku wielokulturowym; zna środowisko pracy tłumacza;
potrafi pracować w grupie, współpracować z innymi, przyjmując odpowiednie role (funkcje); kierować małym zespołem (3-4 osoby w grupach ćwiczeniowych);
Kryteria oceniania
Metody oceny pracy studenta
- ocena aktywności i bieżące przygotowanie do zajęć;
- projekt (dedykowany korpus tekstowy);
- końcowe zaliczenie pisemne (ocena pracy końcowej opartej o analizę stylometryczną opracowywanego projektu/korpusu). W szczególnych przypadkach możliwy test zaliczeniowy.
Kryteria oceniania (komponenty oceny końcowej):
- ocena ciągła z zajęć: 20%
- projekt (tematyczny korpus tekstowy): 40%
- zaliczenie końcowe: 40%
Egzamin (zaliczenie końcowe):
W przypadku analizy projektu/korpusu wiążąca jest liczba uzyskanych punktów za poszczególne elementy pracy.
W przypadku testu (zadania otwarte i zamknięte) wiążąca jest liczba uzyskanych punktów.
Zasady punktacji dla oceny bieżącej i egzaminu/zaliczenia:
55%-69% = 3
70%-74% = 3+
75%-84% = 4
85%-89% = 4+
90%-100% = 5
Zasady współpracy prowadzącego ze studentami:
1. Nieobecności – dopuszczalne 3 nieusprawiedliwione nieobecności w semestrze (jest to zgodne z regulaminem).
2. Do końcowego zaliczenia można podejść po zaliczeniu pozostałych komponentów oceny.
3. Student ma prawo do dwukrotnej poprawy każdego sprawdzianu pisemnego. Nieprzystąpienie do sprawdzianu w pierwszym terminie bez usprawiedliwienia powoduje utratę tego terminu.
Literatura
Literatura podstawowa:
- Gruszczyńska E., Leńko-Szymanska A. (red.), Polskojęzyczne korpusy równoległe / Polish-language Parallel Corpora, WLS UW, Warszawa, 2016.
- Karpiński Ł., Systemy leksykalno-komunikacyjne, Campidoglio, Warszawa, 2017.
- "Prace filologiczne", tom. LXIII, WP UW, Warszawa 2012 (tom zawierający zbiór prac dot. lingwistyki korpusowej)
Literatura uzupełniająca:
- Biber C., Corpus Linguistics. Investigating language structure and use, Cambridge Univesrity Press 1998.
- Celiński P., 2013a, Postmedia. Cyfrowy kod i bazy danych, Wydawnictwo UMCS, Lublin.
- Kamińska-Szmaj I., 1989, Słownictwo tekstów popularnonaukowych w ujęciu statystycznym, [w:] „Rozprawy Komisji Językowej”, t. XVI, Wrocławskie Towarzystwo Naukowe, Wyd. PAN, Wrocław, s. 69-87.
- Karpiński Ł., Zarys leksykografii terminologicznej, KJS UW, Warszawa, 2008
- Karpiński Ł., 2009a, Wybrane założenia komputerowej analizy tekstów i gromadzenia danych, [w] „Języki Specjalistyczne 9 – Kulturowy i leksykograficzny obraz języków specjalistycznych”, (red. eidem), KJS UW, Warszawa
- Karpiński Ł., 2012a, Analiza parametryczna tekstu a translacja maszynowa – wybrane zagadnienia, [w] „The Linguistic Journal of Applied Linguistics”, (red.), Lingwistyczna Szkoła Wyższa w Warszawie, Warszawa.
- Karpiński Ł., Michałowski P., 2012, Wybrane metody analizy terminologii specjalistycznej (na przykładzie technolektu geografii), [w:] „Edukacja dla Przyszłości”, t. IX, 2012, Wydawnictwo Wyższej Szkoły Finansów i Zarządzania w Białymstoku, Białystok, s. 19-46.
- Lewandowska-Tomaszczyk B., Gramatyka angielska na autentycznych materiałach językowych, Łódź, WSSM 2004.
- Lewandowska-Tomaszczyk B., Podstawy językoznawstwa korpusowego, Wyd. Uniwersytetu Łódzkiego, Łódź 2005.
- Ludskanow A., 1973, Tłumaczy człowiek i maszyna cyfrowa, WNT, Warszawa
- McEnery T., Wilson A., Corpus Linguistics: an Introduction, Edinburgh : Edinburgh University Press, 2001
- Pawłowski A., 2001, Metody kwantytatywne w sekwencyjnej analizie tekstu, Uniwersytet Warszawski Katedra Lingwistyki Formalnej, Warszawa.
- Przepiórkowski A., Bańko M., Górski R., Lewandowska-Tomaszczyk B., Narodowy Korpus Języka Polskiego, PWN, Warszawa 2012
- Sambor J., 1969, Badania statystyczne nad słownictwem. Na materiale „Pana Tadeusza”, Wrocław-Warszawa.
- Świdziński M., 2006, Lingwistyka korpusowa w Polsce – źródła, stan, perspektywy, [w:] „LingVaria”, nr 1, Wydział Polonistyki UJ, Kraków.
- Tognini-Bonelli E., Corpus Linguistics at Work, John Benjamins, Amsterdam/Philadelphia 2001
Materiały autorskie prowadzącego, zbiory analiz, wizualizacje danych stylometrycznych.
Więcej informacji
Dodatkowe informacje (np. o kalendarzu rejestracji, prowadzących zajęcia, lokalizacji i terminach zajęć) mogą być dostępne w serwisie USOSweb: