Předmět: Budování korpusové databáze

» Seznam fakult » FIF » KBH
Název předmětu Budování korpusové databáze
Kód předmětu KBH/VS32B
Organizační forma výuky Seminář
Úroveň předmětu Bakalářský
Rok studia nespecifikován
Semestr Zimní a letní
Počet ECTS kreditů 3
Vyučovací jazyk Čeština
Statut předmětu Povinně-volitelný
Způsob výuky Kontaktní
Studijní praxe Nejedná se o pracovní stáž
Doporučené volitelné součásti programu Není
Vyučující
  • Pořízka Petr, PhDr. Ph.D.
Obsah předmětu
Aktuálně v ZS2023: Práce studentů v semináři bude zahrnovat zpracování pořízených nahrávek cizinců učících se česky (editace segmentů: slov) a lingvistickou anotaci těchto segmentů prostřednictvím nástroje Anophone (Holaj - Pořízka, 2021). Aktuálně v LS2024: Práce studentů v semináři bude zahrnovat zejména zpracování zdrojových textů pro projekty DraCor. Aktuálně v ZS2024: Práce studentů v semináři bude zahrnovat zejména zpracování zdrojových textů pro projekty DraCor a korpusu české esejistiky.

Studijní aktivity a metody výuky
nespecifikováno
Výstupy z učení
Výhradně prakticky zaměřený a pracovní seminář vycházející z aktuálních potřeb odborných aktivit Katedry bohemistiky. Půjde zejm. o praktickou práci se shromážděným jazykovým materiálem: konkrétní úkoly, jejich charakter, rozsah apod., to vše bude upřesněno na úvodním semináři (účast na prvním semináři je proto důležitá). Veškeré potřebné materiály, dokumenty a nástroje budou doporučeny či poskytnuty dle potřeby během realizace semináře. V současné době jsou odborné aktivity směřovány k budování tří projektů: (1) evropské databáze dramatických textů DraCor (https://dracor.org/); (2) lingvistické databáze Anophone (https://anophone.evetech.cz/) - e-learningové databáze pro rozpoznávání řeči zaměřené na vývoj adaptabilní mobilní aplikace k výuce češtiny pro cizince (L2 learning) a (3) Korpusu české esejistiky přelomu 19. a 20. století.

Předpoklady
nespecifikováno

Hodnoticí metody a kritéria
nespecifikováno
- pravidelná docházka - praktická práce studenta v semináři - seminární projekt: zpracování (editace a anotace) jazykových dat dle aktuálního programu semiáře
Doporučená literatura
  • Holaj, R. - Pořízka, P. (2021). L2 Czech annotation for automatic feedback on pronunciation.
  • Holaj, R. (2021). Aplikace Anophone pro anotaci výslovnosti.
  • Pořízka, P. A Corpus of Czech Essays from the Turn of the 1900s. 2021.
  • Pořízka, P. CapekDraCor: A New Contribution to the European Programable Drama Corpora. 2023.


Studijní plány, ve kterých se předmět nachází
Fakulta Studijní plán (Verze) Kategorie studijního oboru/specializace Doporučený ročník Doporučený semestr
Fakulta: Filozofická fakulta Studijní plán (Verze): Česká filologie minor (2019) Kategorie: Filologické vědy - Doporučený ročník:-, Doporučený semestr: -
Fakulta: Filozofická fakulta Studijní plán (Verze): Česká filologie maior (2025) Kategorie: Filologické vědy - Doporučený ročník:-, Doporučený semestr: -
Fakulta: Filozofická fakulta Studijní plán (Verze): Česká filologie se zaměřením na editorskou práci ve sdělovacích prostředcích (2019) Kategorie: Filologické vědy - Doporučený ročník:-, Doporučený semestr: -
Fakulta: Filozofická fakulta Studijní plán (Verze): Česká filologie maior (2019) Kategorie: Filologické vědy - Doporučený ročník:-, Doporučený semestr: -
Fakulta: Filozofická fakulta Studijní plán (Verze): Česká filologie se zaměřením na editorskou práci ve sdělovacích prostředcích (2025) Kategorie: Filologické vědy - Doporučený ročník:-, Doporučený semestr: -
Fakulta: Filozofická fakulta Studijní plán (Verze): Česká filologie (2025) Kategorie: Filologické vědy - Doporučený ročník:-, Doporučený semestr: -
Fakulta: Filozofická fakulta Studijní plán (Verze): Česká filologie (2015) Kategorie: Filologické vědy - Doporučený ročník:-, Doporučený semestr: -
Fakulta: Filozofická fakulta Studijní plán (Verze): Česká filologie (2019) Kategorie: Filologické vědy - Doporučený ročník:-, Doporučený semestr: -