Předmět: Úvod do Digital Humanities 1 - Úvod do kvatitativních metod

» Seznam fakult » FIF » KOL
Název předmětu Úvod do Digital Humanities 1 - Úvod do kvatitativních metod
Kód předmětu KOL/91AU1
Organizační forma výuky Seminář
Úroveň předmětu Doktorský
Rok studia nespecifikován
Semestr Zimní a letní
Počet ECTS kreditů 10
Vyučovací jazyk Čeština
Statut předmětu Povinný
Způsob výuky Kontaktní
Studijní praxe Nejedná se o pracovní stáž
Doporučené volitelné součásti programu Není
Vyučující
  • Matlach Vladimír, Mgr. Ph.D.
Obsah předmětu
Podrobnější výklad o několika nejvýznamnějších přístupech moderní formální lingvistiky, a to chomskyanského GB a minimalismu, lexikální funkční gramatiky J. Bresnanové, teorie optimalismu, kategoriální gramatiky a různých přístupech gramatiky závislostní. V celém výkladu bude brán výrazný zřetel na strukturální lingvistiku Pražské školy a její výsledky.

Studijní aktivity a metody výuky
Přednášení
Výstupy z učení
Předmět má za cíl posluchače seznámit s jedním z nejdůležitějších zdrojů digitálních dat o lidech, tj. s psanými texty a obrazem. Ať už se jedná o digitalizované historické knihy, dopisy, rukopisy nebo o aktuální beletrii a zprávy ze sociálních sítí, vyžaduje práce s takovými daty specifické znalosti práce s přirozeným jazykem. V tomto předmětu budou poskytnuty praktické znalosti, jak a kde texty získat, jak je zpracovat, tak, aby v nich bylo možné vyhledávat komplexními dotazy a získávat z nich tak náhled na kulturu, jazyk, vztahy mezi zmíněnými lidmi, městy a dalšími entitami. Dále předmět poskytne nástroje, jak tyto úlohy provádět a jak z nich získat smysluplná data včetně problematiky jejich interpretace. Předmět je zaměřen na zisk praktických znalostí, porozumění problematice zpracování multimediálních dat a pojetí konceptů práce s nimi. Na tento předmět následně navážou další, které nabyté znalosti využijí ke komplexním studiím. 1) Problematika zpracování a sběru textových a multimediálních dat - Základy zpracování textu pro pozdější zpracování - Tokenizace, lemmatizace, tagging, dostupné nástroje, úskalí a praxe - Digitalizace literatury a OCR, získávání dat z webových stránek, otevřené zdroje - Právní problematika sběru dat - Biasy a různá zkreslení vnímání získaných dat - Lidský faktor, sugestivita 2) Práce s texty -- korpusy, databáze, weby - Regulární výrazy a jejich využití - Jazykové korpusy, vyhledávání v nich a interpretace - Tvorba vlastních korpusů, sběr dat - Vytěžování pro jazykovědné, kulturní, sociologické, psychologické, historické aplikace 3) Základní způsoby vytěžování textu a médií - Modelování témat - Detekce jmenných entit, sentimentu - Modelování vztahů entit na základě gramatik - Používané nástroje od programovacích jazyků po ty automatické - Způsoby zpracování obrazu a fotografií, tagging, detekce objektů 4) Případové studie - analýza a zpracování - Reflexe odborného textu

Předpoklady
Předmět je určen pouze pro studenty doktorského studia.

Hodnoticí metody a kritéria
Ústní zkouška

Literatura, účast na přednášce, rešerše. Výuka se bude konat 14. 6. 2013.
Doporučená literatura
  • Hajičová, Panevová, Sgall. (2003). Úvod do teoretické a počítačové lingvistiky. Praha.
  • Sells, P. (1985). Lectures on Contemporary Syntactic Theories. Stanford.
  • Stockwell, R. M. (1977). Fundations of Syntactic Theory. New Persey.


Studijní plány, ve kterých se předmět nachází
Fakulta Studijní plán (Verze) Kategorie studijního oboru/specializace Doporučený ročník Doporučený semestr
Fakulta: Filozofická fakulta Studijní plán (Verze): Lingvistika a Digital Humanities (2020) Kategorie: Filologické vědy - Doporučený ročník:-, Doporučený semestr: -
Fakulta: Filozofická fakulta Studijní plán (Verze): Lingvistika a Digital Humanities (2020) Kategorie: Filologické vědy - Doporučený ročník:-, Doporučený semestr: -