Lingwistyka XXI wieku: korpusowe studia nad słownictwem i gramatyką 3003-A864JK1
I. Celem seminarium jest przygotowanie przyszłego absolwenta do pracy z wielkimi korpusami tekstowymi dostępnymi w postaci elektronicznej. Współczesny językoznawca znajduje zatrudnienie w redakcjach słowników, które budowane są dzisiaj zupełnie inaczej niż jeszcze dwadzieścia lat temu. Drugim segmentem rynku pracy dla lingwisty jest szeroko rozumiane przetwarzanie tekstu - Natural Language Processing (NLP). Osobną nitkę w programie seminarium stanowi problematyka Polskiego Języka Migowego oraz korpusów tekstów migowych.
Słuchacze będą włączeni do rzeczywistych prac badawczych. Oto kilka przykładowych problemów, które mogą się stać tematami prac magisterskich:
(1) Przyimki złożone w polszczyźnie i ich automatyczne rozpoznawanie.
(2) Dystrybucja i własności składniowe form stopnia wyższego i najwyższego.
(3) Polskie zaimki względne i pytajne.
(4) Wymagania składniowe polskich gerundiów.
(5) Automatyczne rozpoznawanie okoliczników miejsca w zdaniu polskim.
(6) Imitacyjność jako zasada referencji w PJM.
(7) Korpus tekstów PJM i jego reprezetacja w systemie SignWriting.
Inne tematy są negocjowalne.
II. Student otrzyma podstawowy zasób pojęć współczesnej lingwistyki korpusowej i komputerowej. Pozna warsztat pracy leksykografa XXI wieku. Zapozna się w narzędziami informatycznymi pracy z wielkimi korpusami tekstów. Nauczy się korzystania z korpusów do poszukiwań słownikowych, ale także jako źródła danych do opisu gramatycznego polszczyzny. Zostanie również wprowadzony w świat języków wizualno-przestrzennych.
III. Tematy:
(1) Wstęp do lingwistyki korpusowej.
(2) Formalne rozumienie języka. Gramatyki formalne. Przetwarzanie tekstu jako przedmiot lingwistyki informatycznej.
(3) Automatyczna analiza tekstu języka naturalnego. Analizatory morfologiczne i parsery. Narzędzia NLP dla polszczyzny.
(4) Otwarte problemy gramatyczno-słownikowe polszczyzny. Jednostki słownikowe złożone. Zróżnicowanie własności gramatycznych wewnątrz paradygmatów: gerundia, imiesłowy, formy stopnia. Cechy składniowe zaimków. Rozpoznawanie członów niewymaganych.
(5) Leksykografia XXI wielu. Warsztat współczesnego leksykografa. Słowniki ogólne jednojęzyczne - analiza zawartości. Techniki korzystania ze słowników. Tworzenie słowników.
(6) Języki wizualno-przestrzenne i ich opis lingwistyczny. Podstawy gramatyczne PJM. Słowniki języków migowych. Korpusy tekstów wizualno-przestrzennych.
IV. Student będzie referować literaturę przedmiotu. Równolegle planuje się rozwiązywanie różnych szczegółowych problemów z wykorzystaniem poznanych metod analiz lingwistycznych. Wyniki będą przedstawiane przez słuchacza w postaci prezentacji. Ocena dotyczy również aktywności na zajęciach.
Rodzaj przedmiotu
Literatura
Bańko M., Z pogranicza leksykografii i językoznawstwa, Warszawa 2001.
Korpus Języka Polskiego Wydawnictwa Naukowego PWN: http://korpus.pwn.pl/
Korpus IPI PAN. http://korpus.pl/
Podstawy językoznawstwa korpusowego. Red. B. Lewandowska-Tomaszczyk, Łódź 2005.
Rudolf, M., Metody automatycznej analizy korpusu tekstów polskich, Warszawa 2004.
Saloni Z., Świdziński M., Składnia współczesnego języka polskiego, wyd. 5., Warszawa 2001.
Studia nad kompetencją językową i komunikacją niesłyszących. Red. naukowa: M. Świdziński i T. Gałkowski. Warszawa 2003. Stron 278.
Świdziński, M., Elementy gramatyki opisowej języka polskiego, Warszawa 1997 [dostępne w internecie].
Świdziński, M., Gramatyka formalna języka polskiego, Warszawa 1992.
Świdziński, M., Języki migowe. [W:] Podstawy neurologopedii. Red. T. Gałkowski, E. Szeląg, G. Jastrzębowska. Opole 2005. 679-692.
Świdziński, M., Lingwistyka korpusowa w Polsce - źródła, stan, perspektywy. [W:] LingVaria, nr 1. Kraków 2006. 23-32.
Świdziński, M., Rudolf, M.: Narzędzia informatyczne obsługi wielkich korpusów tekstów: wyszukiwarka Holmes, Biuletyn Polskiego Towarzystwa Językoznawczego, t. LXIII (2006) [dostępne w internecie].
Woliński, M., http://nlp.ipipan.waw.pl/~wolinski/morfeusz/morfeusz.html
Woliński, M., Komputerowa weryfikacja gramatyki Świdzińskiego. Niepublikowana rozprawa doktorska. IPI PAN, Warszawa 2004.
Więcej informacji
Dodatkowe informacje (np. o kalendarzu rejestracji, prowadzących zajęcia, lokalizacji i terminach zajęć) mogą być dostępne w serwisie USOSweb: