Předmět: Korpusová lingvistika

» Seznam fakult » FIF » KBH
Název předmětu Korpusová lingvistika
Kód předmětu KBH/KOR
Organizační forma výuky Seminář
Úroveň předmětu Bakalářský
Rok studia nespecifikován
Semestr Zimní a letní
Počet ECTS kreditů 4
Vyučovací jazyk Čeština
Statut předmětu nespecifikováno
Způsob výuky Kontaktní
Studijní praxe Nejedná se o pracovní stáž
Doporučené volitelné součásti programu Není
Vyučující
  • Pořízka Petr, PhDr. Ph.D.
Obsah předmětu
1. Základní pojmy, literatura a software, typy korpusů 2. Metodologie: sběr dat, velikost korpusů, reprezentativnost a vyváženost dat 3. České korpusy psaného a mluveného jazyka; ostatní projekty: elektronické slovníky, literární databáze 4. Korpusové nástroje a metody vyhodnocování (KWIC, konkordance, kolokace; regulární a booleovské výrazy, kolokační statistické indexy; frekvenční distribuce) 5. Lingvistická anotace: lemmatizace, morfologické a syntaktické značkování (hlavní modely) 6. Komplexní a strukturované vyhledávání dat - dotazovací jazyk CQL (regulární a booleovské výrazy) 7. Práce s lingvistickými daty v různých korpusových aplikacích Důležitou součástí práce v semináři bude vyhledávání dat a vytváření jednoduchých i složitěji strukturovaných vyhledávacích formalismů v korpusových manažerech.

Studijní aktivity a metody výuky
Přednášení, Dialogická (diskuze, rozhovor, brainstorming), Metody práce s textem (učebnicí, knihou), Metody písemných akcí (např. u souborných zkoušek, klauzur), Demonstrace
Výstupy z učení
Cílem kurzu je seznámit účastníky se základy korpusové lingvistiky a připravit je na práci s korpusy, které se v posledních letech staly jednou ze základních pomůcek pro vědecké studium jazyka. Úvod do korpusové lingvistiky je rozdělen do tří bloků: v prvním se účastníci seznámí se základními pojmy, v druhém se naučí zacházet s českými jazykovými korpusy. Třetí blok, jehož obsah se bude řídit aktuálními zájmy účastníků, by měl studentům pomoci při sestavování a vytěžování vlastních malých korpusů.
Cílem kurzu je seznámit studenty se základy korpusové lingvistiky a připravit je na práci s korpusy, které se v posledních letech staly jednou ze základních pomůcek pro vědecké studium jazyka. V teoretickém exkurzu jsou představeny vybrané korpusy psaného i mluveného jazyka, základní korpusová terminologie, softwarové aplikace a anotace korpusů. V praktické části kurzu si studenti osvojí techniky vyhledávání jazykových dat v různých korpusových aplikacích a jazykových korpusech.
Předpoklady
nespecifikováno

Hodnoticí metody a kritéria
Písemná zkouška, Rozbor produktů pracovní činnosti studenta (technické práce), Seminární práce

(1) Pravidelná účast a aktivní práce v semináři (včetně plnění zadaných úkolů) (2) Úspěšně realizovaný seminární projekt
Doporučená literatura
  • Baker, P. - Hardie, A. - McEnery, T. A Glossary of Corpus Linguistics. Edinburgh 2006.
  • Benko, V. a kol. (2019). Webové korpusy Aranea. Bratislava.
  • Čermák - Klímová - Petkevič. Studie z korpusové lingvistiky. Praha 2000..
  • Čermák, F. - Blatná, R. (eds.). Jak využívat Český národní korpus. Praha 2005.
  • Čermák, F. - Blatná, R. Korpusová lingvistika: Stav a modelové přístupy. Praha 2006..
  • Čermák, F. (2017). Korpus a korpusová lingvistika. Praha.
  • Kol. (2014). Manuál práce s ČNK (wikidokumentace).
  • Osolsobě, K. (2014). Česká morfologie a korpusy. Praha.
  • Pořízka, P. (2014). Tvorba korpusů a vytěžování jazykových dat (metody, modely, nástroje). Olomouc.


Studijní plány, ve kterých se předmět nachází
Fakulta Studijní plán (Verze) Kategorie studijního oboru/specializace Doporučený ročník Doporučený semestr