Lingwistyka korpusowa 3200-M1-2LK
Program kursu obejmuje wiadomości teoretyczne dotyczące budowy korpusów językowych oraz praktyczne tworzenie korpusów tekstowych, ich analizę oraz możliwości ich praktycznego wykorzystania:
1. Pojęcie korpusu językowego. Korpus językowy a zbiór tekstów. Badania teoretyczne a materiałowe: rola danych językowych w językoznawstwie
2. Typologia korpusów: korpusy jedno i wielojęzyczne, równoległe i porównywalne. Pojęcie reprezentatywności i adekwatności korpusów.
3. Podstawowe informacje na temat indeksacji korpusów językowych; umiejętności interpretacji danych i wykorzystania zdobytych informacji morfologiczno-składniowych
4. Podstawowe korpusy języka polskiego. Korpus NKJP i WKJP wraz z narzędziami towarzyszącymi.
5. Podstawowe korpusy języków nauczanych obszarów językowych.
6. Dostępne narzędzia analizy korpusów tekstowych (AntConc, Jasnopis, Korpusomat i in.).
7. Narzędzia analizy parametrycznej tekstu, zastosowania praktyczne pomiaru modalności tekstu (Pantext).
8. Możliwe zastosowania korpusów w praktyce językoznawczej:
a) badanie języków specjalistycznych
b) korpus jako narzędzie wspomagające tłumacza
c) dydaktyka języków obcych
d) słowniki i modele słowników na różnych nośnikach danych
9. Korpusy tekstowe i teksty równoległe w pracy z programami wspomagającymi proces tłumaczenia (możliwa integracja wyników z Term Base narzędzi CAT).
Celem zajęć jest zapoznanie z podstawowymi narzędziami informatycznymi wspierającymi proces gromadzenia, weryfikowania i stosowania odpowiednich dla języka ogólnego lub specjalistycznego struktur leksykalnych, stylistycznych i syntagmatycznych. Student po kursie powinien posługiwać się podstawowymi programami z zakresu lingwistyki cyfrowej oraz wyszukiwać potrzebne dane lingwistyczne przy pomocy poznanych narzędzi.
Kurs prowadzony z użyciem prezentacji i wizualizacji działania poszczególnych programów, w miarę dostępnych możliwości sprzętowych.
Ponadto, kurs kładzie nacisk na samodzielne wyszukiwanie oprogramowania oraz wyprowadzania indywidualnych wniosków z prowadzonych analiz lingwistycznych oraz ich wizualizacji.
Nabyta wiedza ma posłużyć do stworzenia przez studenta (grupę studentów) określonego formalnie na zajęciach projektu korpusu tekstowego, stanowiącego podstawę zaliczenia przedmiotu oraz zwiększenie kompetencji studentów w zakresie tworzenia samodzielnych prac leksykograficzno-korpusowych (w tym przeprowadzenia analiz na potrzeby pracy dyplomowej).
Nakład pracy studenta (3 ECTS):
30 godzin obecność na zajęciach w sali (1)
30 godzin przygotowanie korpusów tekstowych i danych analitycznych (1)
15 godzin praca własna z oprogramowaniem (0,5)
15 godzin lektura i przygotowanie projektu (0,5)
|
W cyklu 2025L:
Program kursu obejmuje wiadomości teoretyczne dotyczące budowy korpusów językowych oraz praktyczne tworzenie korpusów tekstowych, ich analizę oraz możliwości ich praktycznego wykorzystania. W projekcie końcowym przewidziano zastosowanie danych wygenerowanych przy pomocy chatów (sztucznej inteligencji) na potrzeby analizy porównawczej. Celem zajęć jest zapoznanie z podstawowymi narzędziami informatycznymi wspierającymi proces gromadzenia, weryfikowania i stosowania odpowiednich dla języka ogólnego lub specjalistycznego struktur leksykalnych, stylistycznych i syntagmatycznych. Student po kursie powinien posługiwać się podstawowymi programami z zakresu lingwistyki cyfrowej oraz wyszukiwać potrzebne dane lingwistyczne przy pomocy poznanych narzędzi. Kurs prowadzony z użyciem prezentacji i wizualizacji działania poszczególnych programów, w miarę dostępnych możliwości sprzętowych. Nabyta wiedza ma posłużyć do stworzenia przez studenta (grupę studentów) określonego formalnie na zajęciach projektu korpusu tekstowego, stanowiącego podstawę zaliczenia przedmiotu oraz zwiększenie kompetencji studentów w zakresie tworzenia samodzielnych prac leksykograficzno-korpusowych (w tym przeprowadzenia analiz na potrzeby pracy dyplomowej). |
W cyklu 2026L:
Program kursu obejmuje wiadomości teoretyczne dotyczące budowy korpusów językowych oraz praktyczne tworzenie korpusów tekstowych, ich analizę oraz możliwości ich praktycznego wykorzystania. W projekcie końcowym przewidziano zastosowanie danych wygenerowanych przy pomocy chatów (sztucznej inteligencji) na potrzeby analizy porównawczej. Celem zajęć jest zapoznanie z podstawowymi narzędziami informatycznymi wspierającymi proces gromadzenia, weryfikowania i stosowania odpowiednich dla języka ogólnego lub specjalistycznego struktur leksykalnych, stylistycznych i syntagmatycznych. Student po kursie powinien posługiwać się podstawowymi programami z zakresu lingwistyki cyfrowej oraz wyszukiwać potrzebne dane lingwistyczne przy pomocy poznanych narzędzi. Kurs prowadzony z użyciem prezentacji i wizualizacji działania poszczególnych programów, w miarę dostępnych możliwości sprzętowych. Nabyta wiedza ma posłużyć do stworzenia przez studenta (grupę studentów) określonego formalnie na zajęciach projektu korpusu tekstowego, stanowiącego podstawę zaliczenia przedmiotu oraz zwiększenie kompetencji studentów w zakresie tworzenia samodzielnych prac leksykograficzno-korpusowych (w tym przeprowadzenia analiz na potrzeby pracy dyplomowej). |
Rodzaj przedmiotu
Tryb prowadzenia
Założenia (opisowo)
Koordynatorzy przedmiotu
Efekty kształcenia
Student w zakresie poniższych kryteriów podwyższa kwalifikacje:
Wiedza:
zna terminologię stosowaną w językoznawstwie i dziedzinach pokrewnych na poziomie rozszerzonym, orientuje się w najważniejszych kierunkach i metodach badań lingwistycznych; rozumie terminologię gramatyczną; posiada wiedzę na temat wybranych uwarunkowań pragmatycznych danych systemów językowych;
ma pogłębioną wiedzę na temat metodologii i prowadzenia badań językoznawczych lub literackich; zna styl naukowy i leksykę naukową; ma wiedzę na temat baz danych dla lingwistyki, posiada podstawową wiedzę na temat interpretacji danych pozyskanych z analiz;
zna popularne programy komputerowe wspomagające pracę tłumacza (CAT) oraz wybrane programy do analizy frekwencyjnej i stylometrycznej; zna możliwości wykorzystania tłumaczenia maszynowego;
Umiejętności:
wykorzystuje programy komputerowe przydatne w pracy tłumacza, potrafi właściwie formatować tekst w języku polskim, oraz w przynajmniej jednym w języku obcym; sprawnie posługuje się arkuszami kalkulacyjnymi i wykresami; potrafi korzystać z ogólnie dostępnych naukowych baz danych (w tym baz terminologicznych i korpusowych); sprawnie wyszukuje informacje, korzysta z wiedzy eksperckiej, ze słowników encyklopedycznych, językowych, terminologicznych ogólno-naukowych, ogólno-technicznych, interdyscyplinarnych i branżowych, korpusów językowych, baz danych, tekstów paralelnych;
potrafi wskazać luki w badaniach naukowych i kierunki ich kontynuowania; formułuje problemy badawcze, dobiera adekwatne metody, konstruuje narzędzia badawcze, opracowuje, prezentuje i interpretuje wyniki badań, wyciąga wnioski;
Kompetencje społeczne:
potrafi uzupełniać i doskonalić nabytą wiedzę o przynajmniej jednym języku specjalności oraz o własnym języku; jest świadomy konieczności ciągłego poszukiwania nowych źródeł słownikowych i tekstowych, a także śledzenia współcześnie powstających teorii naukowych; szybko reaguje na zmieniającą się rzeczywistość;
wyciąga wnioski z informacji zwrotnych, umie zarządzać czasem; utrzymuje kontakt ze środowiskiem tłumaczy, pracuje w środowisku wielokulturowym; zna środowisko pracy tłumacza;
potrafi pracować w grupie, współpracować z innymi, przyjmując odpowiednie role (funkcje); kierować małym zespołem (3-4 osoby w grupach ćwiczeniowych);
Kryteria oceniania
Metody oceny pracy studenta
- ocena aktywności i bieżące przygotowanie do zajęć;
- minimum 2 projekty korpusowe w trakcie kursu (tematyczny korpus tekstowy i analiza porównawcza 2 korpusów);
- końcowe zaliczenie pisemne (projekt tematyczny - analiza stylometryczna korpusu).
Kryteria oceniania (komponenty oceny końcowej):
- ocena ciągła z zajęć: 10%
- projekty w trakcie kursu (tematyczny korpus tekstowy i analiza porównawcza 2 korpusów): 40%
- zaliczenie końcowe: 50%
Zaliczenie końcowe (ew. egzamin):
Przygotowany projekt końcowy oceniany jest wg punktacji proporcjonalnej do szacowanego nakładu pracy (100%), w rozbiciu na poszczególne części projektu:
- przygotowanie reprezentatywnych korpusów tekstowych: 20%
- charakterystyka stylometryczna zebranego materiału do analizy: 20%
- analiza postawionych tez badawczych i ich uzasadnienie: 40%
- wnioski końcowe, ocena pracy z oprogramowaniem, uwagi techniczne: 20%
Projekt końcowy stanowi 50% oceny końcowej.
Zaliczenia/projekty w trakcie kursu: 40% oceny końcowej
Aktywność, bieżące przygotowanie do zajęć: 10% oceny końcowej
Zasady punktacji dla wyliczanych ocen:
55%-69% = 3
70%-74% = 3+
75%-84% = 4
85%-89% = 4+
90%-100% = 5
Zasady współpracy prowadzącego ze studentami:
1. Nieobecności – dopuszczalne 3 nieusprawiedliwione nieobecności w semestrze (jest to zgodne z regulaminem).
2. Do końcowego zaliczenia można podejść po zaliczeniu projektów wykonywanych w trakcie kursu oraz otrzymania pozytywnej oceny za pracę na zajęciach/aktywność.
3. Student ma prawo do dwukrotnej poprawy każdego ocenianego zadania. Nieprzystąpienie do sprawdzianu w pierwszym terminie lub niewykonanie zadania w pierwszym terminie bez usprawiedliwienia powoduje utratę tego terminu.
Praktyki zawodowe
---
Literatura
Literatura podstawowa:
- Gruszczyńska E., Leńko-Szymanska A. (red.), Polskojęzyczne korpusy równoległe / Polish-language Parallel Corpora, WLS UW, Warszawa, 2016.
- Karpiński Ł., Systemy leksykalno-komunikacyjne, Campidoglio, Warszawa, 2017.
- Karpiński Ł., Maszynowa charakterystyka tekstów specjalistycznych na potrzeby terminologicznych baz danych, [w:] "Komunikacja Specjalistyczna", t. 14/2017, s. 139-163.
- Karpiński Ł., Analiza danych stylometrycznych i modalnościowych oraz pomiar elokwencji na przykładzie korpusów tekstowych dotyczących publicystyki na temat kluczowych momentów operacji specjalnej w Ukrainie, [w:] "Language and Literary Studies of Warsaw, t. 12-13/2022-2023, s. 123-152.
- Hebal-Jezierska, Grabowski Ł., O różnych korpusowych metodach badawczych - próba krytycznej refleksji, [w:] "Komunikacja Specjalistyczna", t. 10/2016, s. 65-84.
- "Prace filologiczne", tom. LXIII, WP UW, Warszawa 2012 (tom zawierający zbiór prac dot. lingwistyki korpusowej)
Literatura uzupełniająca:
- Biber C., Corpus Linguistics. Investigating language structure and use, Cambridge Univesrity Press 1998.
- Celiński P., 2013a, Postmedia. Cyfrowy kod i bazy danych, Wydawnictwo UMCS, Lublin.
- Hebal-Jezierska M., Podstawowe zasady korzystania z korpusów przy badaniu języka, [w:] "Prace Etnograficzne", 2018, Tom 46, Numer 1, s. 30-49
- Kamińska-Szmaj I., 1989, Słownictwo tekstów popularnonaukowych w ujęciu statystycznym, [w:] „Rozprawy Komisji Językowej”, t. XVI, Wrocławskie Towarzystwo Naukowe, Wyd. PAN, Wrocław, s. 69-87.
- Karpiński Ł., Zarys leksykografii terminologicznej, KJS UW, Warszawa, 2008
- Karpiński Ł., 2009a, Wybrane założenia komputerowej analizy tekstów i gromadzenia danych, [w] „Języki Specjalistyczne 9 – Kulturowy i leksykograficzny obraz języków specjalistycznych”, (red. eidem), KJS UW, Warszawa
- Karpiński Ł., 2012a, Analiza parametryczna tekstu a translacja maszynowa – wybrane zagadnienia, [w] „The Linguistic Journal of Applied Linguistics”, (red.), Lingwistyczna Szkoła Wyższa w Warszawie, Warszawa.
- Karpiński Ł., Michałowski P., 2012, Wybrane metody analizy terminologii specjalistycznej (na przykładzie technolektu geografii), [w:] „Edukacja dla Przyszłości”, t. IX, 2012, Wydawnictwo Wyższej Szkoły Finansów i Zarządzania w Białymstoku, Białystok, s. 19-46.
- Lewandowska-Tomaszczyk B., Podstawy językoznawstwa korpusowego, Wyd. Uniwersytetu Łódzkiego, Łódź 2005.
- Ludskanow A., 1973, Tłumaczy człowiek i maszyna cyfrowa, WNT, Warszawa
- McEnery T., Wilson A., Corpus Linguistics: an Introduction, Edinburgh : Edinburgh University Press, 2001
- Pawłowski A., 2001, Metody kwantytatywne w sekwencyjnej analizie tekstu, Uniwersytet Warszawski Katedra Lingwistyki Formalnej, Warszawa.
- Przepiórkowski A., Bańko M., Górski R., Lewandowska-Tomaszczyk B., Narodowy Korpus Języka Polskiego, PWN, Warszawa 2012
- Sambor J., 1969, Badania statystyczne nad słownictwem. Na materiale „Pana Tadeusza”, Wrocław-Warszawa.
- Świdziński M., 2006, Lingwistyka korpusowa w Polsce – źródła, stan, perspektywy, [w:] „LingVaria”, nr 1, Wydział Polonistyki UJ, Kraków.
- Tognini-Bonelli E., Corpus Linguistics at Work, John Benjamins, Amsterdam/Philadelphia 2001
Materiały autorskie prowadzącego, zbiory analiz, wizualizacje danych stylometrycznych.
|
W cyklu 2025L:
jak w opisie głównym |
W cyklu 2026L:
jak w opisie głównym |
Uwagi
|
W cyklu 2025L:
--- |
W cyklu 2026L:
--- |
Więcej informacji
Dodatkowe informacje (np. o kalendarzu rejestracji, prowadzących zajęcia, lokalizacji i terminach zajęć) mogą być dostępne w serwisie USOSweb: