Vyučující
|
-
Pořízka Petr, PhDr. Ph.D.
|
Obsah předmětu
|
1. Základní pojmy, literatura a software, typy korpusů 2. Metodologie: sběr dat, velikost korpusů, reprezentativnost a vyváženost dat 3. České korpusy psaného a mluveného jazyka; ostatní projekty: elektronické slovníky, literární databáze 4. Korpusové nástroje a metody vyhodnocování (KWIC, konkordance, kolokace; regulární a booleovské výrazy, kolokační statistické indexy; frekvenční distribuce) 5. Lingvistická anotace: lemmatizace, morfologické a syntaktické značkování (hlavní modely) 6. Komplexní a strukturované vyhledávání dat - dotazovací jazyk CQL (regulární a booleovské výrazy) 7. Práce s lingvistickými daty v různých korpusových aplikacích Důležitou součástí práce v semináři bude vyhledávání dat a vytváření jednoduchých i složitěji strukturovaných vyhledávacích formalismů v korpusových manažerech.
|
Studijní aktivity a metody výuky
|
Přednášení, Dialogická (diskuze, rozhovor, brainstorming), Metody práce s textem (učebnicí, knihou), Metody písemných akcí (např. u souborných zkoušek, klauzur), Demonstrace
|
Výstupy z učení
|
Cílem kurzu je seznámit účastníky se základy korpusové lingvistiky a připravit je na práci s korpusy, které se v posledních letech staly jednou ze základních pomůcek pro vědecké studium jazyka. Úvod do korpusové lingvistiky je rozdělen do tří bloků: v prvním se účastníci seznámí se základními pojmy, v druhém se naučí zacházet s českými jazykovými korpusy. Třetí blok, jehož obsah se bude řídit aktuálními zájmy účastníků, by měl studentům pomoci při sestavování a vytěžování vlastních malých korpusů.
Cílem kurzu je seznámit studenty se základy korpusové lingvistiky a připravit je na práci s korpusy, které se v posledních letech staly jednou ze základních pomůcek pro vědecké studium jazyka. V teoretickém exkurzu jsou představeny vybrané korpusy psaného i mluveného jazyka, základní korpusová terminologie, softwarové aplikace a anotace korpusů. V praktické části kurzu si studenti osvojí techniky vyhledávání jazykových dat v různých korpusových aplikacích a jazykových korpusech.
|
Předpoklady
|
nespecifikováno
|
Hodnoticí metody a kritéria
|
Písemná zkouška, Rozbor produktů pracovní činnosti studenta (technické práce), Seminární práce
(1) Pravidelná účast a aktivní práce v semináři (včetně plnění zadaných úkolů) (2) Úspěšně realizovaný seminární projekt
|
Doporučená literatura
|
-
Baker, P. - Hardie, A. - McEnery, T. A Glossary of Corpus Linguistics. Edinburgh 2006.
-
Benko, V. a kol. (2019). Webové korpusy Aranea. Bratislava.
-
Čermák - Klímová - Petkevič. Studie z korpusové lingvistiky. Praha 2000..
-
Čermák, F. - Blatná, R. (eds.). Jak využívat Český národní korpus. Praha 2005.
-
Čermák, F. - Blatná, R. Korpusová lingvistika: Stav a modelové přístupy. Praha 2006..
-
Čermák, F. (2017). Korpus a korpusová lingvistika. Praha.
-
Kol. (2014). Manuál práce s ČNK (wikidokumentace).
-
Osolsobě, K. (2014). Česká morfologie a korpusy. Praha.
-
Pořízka, P. (2014). Tvorba korpusů a vytěžování jazykových dat (metody, modely, nástroje). Olomouc.
|