Korpusy i wyszukiwarki językoznawcze w badaniach gramatycznych, semantycznych i socjolingwistycznych 3003-B131GO1
I.
W pierwszej części poznamy podstawowe korpusy polskie (w tym Narodowy Korpus Języka Polskiego), słowiańskie (czeski, rosyjski, słowacki, słoweńskie, chorwacki) oraz innych wielkich języków (angielski, niemiecki, francuski), a także bazy leksykalne WordNet i polską Słowosieć oraz FrameNet i polskie Ramki. Następnie pokażemy przykłady zastosowań korpusów i Słowosieci do opisu reguł gramatycznych i leksyki polszczyzny, a także skojarzeń słów w językowym obrazie świata.
II.
Po kursie w pierwszym semestrze seminarium studenci powinni być przygotowani do samodzielnego wyboru tematu pracy.
III. Spis kolejnych tematów
1. Korpusy w badaniach językoznawczych. Konkordancja, kolokacja, dane frekwencyjne – 2 spotkania
2. Korpusy języka polskiego: Narodowy Korpus Języka Polskiego
3. Inne zasoby tekstów polskich i wyszukiwarki: Literatura Polska w Internecie, korpus IPIPAN, korpus PELCRA, korpus WNPWN – 2 spotkania
4. Konstrukcja korpusu, reprezentatywność, programy wyszukujące. Składnia wyszukiwania w NKJP.
5. British, National Corpus, DWDS-Korpus, Corpuseye, Word Sketch Engine – 2 spotkania
6. Korpusy słowiańskie: Česky Narodní Korpus, Nacional’nyj korpus russkogo języka, korpusy słowackie, chorwackie, słoweńskie
7. Korpusy równolegle.
9. Konkordancja i kolokacja jako źródło opisu słownikowego na przykładzie opisu przymiotników synonimicznych: oczywisty, ewidentny, stały, permanentny, bać się, obawiać się.
10. Analizy składniowe i fleksyjne z zastosowaniem korpusu na przykładzie konstrukcji quasiperfektowej mieć z imiesłowem.
11. Korpus w słowotwórstwie. Wyszukiwanie sufiksów, nowe słowa
IV. W II semestrze każdy student przygotuje referat na podstawie własnych badań korpusowych i zaprezentuje konkordancje, kolokacje oraz badania frekwencyjne.
Rodzaj przedmiotu
Tryb prowadzenia
Założenia (opisowo)
Efekty kształcenia
Po ukończeniu zajęć student:
- samodzielnie wyszukuje potrzebną literaturę,
- sprawnie posługuje się Narodowym Korpusem Języka Polskiego,
- formułuje zadania wyszukiwawcze z wykorzystaniem składni operatorów formalnych NKJP oraz w wyszukiwarce kolokacji,
- posługuje się co najmniej dwoma innymi korpusami języków europejskich i formułuje pytania porównawcze,
- wyciąga wnioski z danych frekwencyjnych, konkordancji i kolokacji.
Efekt najważniejszy: student jest zaawansowany w pisaniu pracy magisterskiej.
Kryteria oceniania
Podstawowym kryterium oceny skuteczności zajęć jest postęp w pisaniu pracy magisterskiej. Kryteria oceny udziału w seminarium to ocena referatów prezentujących poszczególne etapy pracy magisterskiej oraz raportów z kwerend korpusowych. Na ocenę ma wpływ także umiejętność posługiwania się korpusami na zajęciach.
Literatura
Bańko M. 2003: Fleksja polska, Warszawa.
Górski L.R. 2009: Representativness of the written part of a Polish general reference corpus. Primary notes. In: B. Lewandowska-Tomaszczyk (ed.): Corpus Linguistics, Computer Tools, and Applications – State of the Art. Frankfurt a. Main: Peter Lang, 119-123.
Górski R.L., Łaziński M. 2010: Wzór stylu i wzór na styl. Zróżnicowanie stylistyczne tekstów Narodowego Korpusu Języka Polskiego, w: (red. M. Milewska-Stawiany, E. Rogowska-Cybulska) Polskie języki. O językach zawodowych i środowiskowych. Materiały VII Forum Kultury Słowa, Gdańsk 2010, s. 41-55
Językowy obraz świata, (red. J. Anusiewicz, A. Dąbrowska), Język a kultura, t. 13, Wrocław 2000
Przepiórkowski A. 2003: Korpus języka polskiego PAN / The IPIPAN Corpus. Warszawa.*
Przepiórkowski A., Górski R. G., Lewandowska-Tomaszczyk B, Łaziński M 2010: Narodowy Korpus Języka Polskiego. Biuletyn Polskiego Towarzystwa Językoznawczego, LXV, s. 47-55
Przepiórkowski A., Górski R. G., Łaziński M, Pęzik P. 2010: Recent Developments in the National Corpus of Polish w: LREC 2010 proceedings, http://www.lrec-conf.org/proceedings/lrec2010/index.html
Sinclair, J. 1991. Corpus, Collocation, Concordance. Oxford.
Słownik frekwencyjny polszczyzny współczesnej, Hrsg. I. Kurcz et al., Warszawa 1990 (SFPW)
Stubbs, M. 1996. Text and Corpus Analysis. Oxford-Cambridge (MA).
Współczesny język polski (red. J. Bartmiński), Lublin 2001
Więcej informacji
Dodatkowe informacje (np. o kalendarzu rejestracji, prowadzących zajęcia, lokalizacji i terminach zajęć) mogą być dostępne w serwisie USOSweb: