Vyučující
|
-
Změlík Richard, doc. Mgr. Ph.D.
|
Obsah předmětu
|
Témata: 1. Uvedení do problematiky, seznámení se s úkolem OCR 2. Historie slovníkářské činnosti v Čechách 3. Česká lexikografie ve 20. století 4. Typologie autorských slovníků (zahraniční autorské slovníky) 5. České autorské slovníky (české autorské slovníky) 6. Kvantitativní lingvistika v českém prostředí, základní postupy, pojmy a zákony, způsoby využívání statistického měření v lingvistice a v literární vědě 7. Český národní korpus: definice, problematika reprezentativnosti, spisovnosti, koncept tzv. minimální intervence 8. Korpus českého verše, stylometrie (Petr Plecháč) 9. Postup při budování autorského korpusu: lemmatizace, tokenizace, desambiguace, anotace, tematická koncentrace 10. Statistické modely a jejich literárněvědná interpretace: příklady vytěžování korpusu Jana Čepa (měření TK-textu) a dalších autorských korpusů 11. Statistické modely a jejich literárněvědná interpretace: příklady vytěžování korpusu Jana Čepa (statistická analýza barev) a dalších autorských korpusů 12. Kontrola OCR textů romanet Jakuba Arbesa 13. Kontrola OCR textů romanet Jakuba Arbesa
|
Studijní aktivity a metody výuky
|
Monologická (výklad, přednáška, instruktáž), Dialogická (diskuze, rozhovor, brainstorming), Metody práce s textem (učebnicí, knihou)
|
Výstupy z učení
|
Seminář bude zaměřen na problematiku autorských korpusů a jejich využití v literární vědě. Již v 80. letech 20. století konstatoval Pavel Vašák užitečnost autorských slovníků pro literární vědu, stejně jako rozsáhlejších lexikonů dobových poetik (romantismus, realismus, poetika ruchovců, lumírovců apod.). Smyslem takovýchto projektů je především poskytnout literární historii, popřípadě teorii rozsáhlejší textový matriál, který by bylo možno kvantitativně analyzovat a na tomto základě vytvářet statistické modely, jež budou interpretovatelné v literárněvědném kontextu. Na semináři se studenti seznámí nejen s historií autorské lexikografie, ale především se sami aktivně zapojí do tvorby autorského korpusu Jakuba Arbesa (romaneta), který bude ve výsledku zveřejněn v Českém národním korpusu a zpřístupněn pro kvantitativní analýzu žánru. Součástí kurzu bude i práce s již existujícmi autorskými korpusy. Důraz bude kladen především na literárněvědnou interpretaci statistických modelů.
|
Předpoklady
|
nespecifikováno
|
Hodnoticí metody a kritéria
|
Analýza výkonů studenta
Aktivní účast na seminářích, odevzdání zadané práce.
|
Doporučená literatura
|
-
ČERMÁK, František - BARTOŇ, Tomáš. (2007). Slovník Karla Čapka. Praha.
-
ČERMÁK, František - BLATNÁ, Renata. (2005). Jak využívat Český národní korpus. Praha.
-
ČERMÁK, František - BLATNÁ, Renata. (2006). Korpusová lingvistika: stav a modelové přístupy. Praha.
-
ČERMÁK, František - BLATNÁ, Renata. (1995). Manuál lexikografie. Jinočany.
-
ČERMÁK, František - CVRČEK, Václav - SCHMIEDTOVÁ, Věra. (2010). Slovník komunistické totality. Praha.
-
ČERMÁK, František - CVRČEK, Václav. (2009). Slovník Bohumila Hrabala. Praha.
-
ČERMÁK, František - KŘEN, Michal. (2010). Frekvenční slovník češtiny. Praha.
-
ČERMÁK, František - ŠULC, Michal. (2006). Kolokace. Praha.
-
ČERMÁK, František. (2007). Frazeologie a idiomatika česká a obecná.
-
ČERMÁK, František. "Jazykový korpus: Prostředek a zdroj poznání." In Slovo a slovesnost, roč. 56, č. 2, s. 119-140..
-
ČERMÁK, František. (2005). Korpus, informace a lingvistika." In Přednášky z XLVIII. běhu Letní školy slovanských studií. Praha: Univerzita Karlova, Filozofická fakulta, s. 15-24. Dostupné z WWW: http://korpus.cz/doc/korp-info-lingv.rtf.
-
ČERMÁK, František. (2004). "Korpusová lingvistika: stručný historický přehled." In Český národní korpus. Dostupné z WWW: <http://korpus.cz/doc/2002_cnk.rtf>..
-
ČERMÁK, František. (2010). Lexikon a sémantika. Praha.
|