Název předmětu | Úvod do Digital Humanities 1 - Úvod do kvatitativních metod |
---|---|
Kód předmětu | KOL/91AU1 |
Organizační forma výuky | Seminář |
Úroveň předmětu | Doktorský |
Rok studia | nespecifikován |
Semestr | Zimní a letní |
Počet ECTS kreditů | 10 |
Vyučovací jazyk | Čeština |
Statut předmětu | Povinný |
Způsob výuky | Kontaktní |
Studijní praxe | Nejedná se o pracovní stáž |
Doporučené volitelné součásti programu | Není |
Vyučující |
---|
|
Obsah předmětu |
Podrobnější výklad o několika nejvýznamnějších přístupech moderní formální lingvistiky, a to chomskyanského GB a minimalismu, lexikální funkční gramatiky J. Bresnanové, teorie optimalismu, kategoriální gramatiky a různých přístupech gramatiky závislostní. V celém výkladu bude brán výrazný zřetel na strukturální lingvistiku Pražské školy a její výsledky.
|
Studijní aktivity a metody výuky |
Přednášení |
Výstupy z učení |
Předmět má za cíl posluchače seznámit s jedním z nejdůležitějších zdrojů digitálních dat o lidech, tj. s psanými texty a obrazem. Ať už se jedná o digitalizované historické knihy, dopisy, rukopisy nebo o aktuální beletrii a zprávy ze sociálních sítí, vyžaduje práce s takovými daty specifické znalosti práce s přirozeným jazykem. V tomto předmětu budou poskytnuty praktické znalosti, jak a kde texty získat, jak je zpracovat, tak, aby v nich bylo možné vyhledávat komplexními dotazy a získávat z nich tak náhled na kulturu, jazyk, vztahy mezi zmíněnými lidmi, městy a dalšími entitami. Dále předmět poskytne nástroje, jak tyto úlohy provádět a jak z nich získat smysluplná data včetně problematiky jejich interpretace. Předmět je zaměřen na zisk praktických znalostí, porozumění problematice zpracování multimediálních dat a pojetí konceptů práce s nimi. Na tento předmět následně navážou další, které nabyté znalosti využijí ke komplexním studiím. 1) Problematika zpracování a sběru textových a multimediálních dat - Základy zpracování textu pro pozdější zpracování - Tokenizace, lemmatizace, tagging, dostupné nástroje, úskalí a praxe - Digitalizace literatury a OCR, získávání dat z webových stránek, otevřené zdroje - Právní problematika sběru dat - Biasy a různá zkreslení vnímání získaných dat - Lidský faktor, sugestivita 2) Práce s texty -- korpusy, databáze, weby - Regulární výrazy a jejich využití - Jazykové korpusy, vyhledávání v nich a interpretace - Tvorba vlastních korpusů, sběr dat - Vytěžování pro jazykovědné, kulturní, sociologické, psychologické, historické aplikace 3) Základní způsoby vytěžování textu a médií - Modelování témat - Detekce jmenných entit, sentimentu - Modelování vztahů entit na základě gramatik - Používané nástroje od programovacích jazyků po ty automatické - Způsoby zpracování obrazu a fotografií, tagging, detekce objektů 4) Případové studie - analýza a zpracování - Reflexe odborného textu
|
Předpoklady |
Předmět je určen pouze pro studenty doktorského studia.
|
Hodnoticí metody a kritéria |
Ústní zkouška
Literatura, účast na přednášce, rešerše. Výuka se bude konat 14. 6. 2013. |
Doporučená literatura |
|
Studijní plány, ve kterých se předmět nachází |
Fakulta | Studijní plán (Verze) | Kategorie studijního oboru/specializace | Doporučený semestr | |
---|---|---|---|---|
Fakulta: Filozofická fakulta | Studijní plán (Verze): Lingvistika a Digital Humanities (2020) | Kategorie: Filologické vědy | - | Doporučený ročník:-, Doporučený semestr: - |
Fakulta: Filozofická fakulta | Studijní plán (Verze): Lingvistika a Digital Humanities (2020) | Kategorie: Filologické vědy | - | Doporučený ročník:-, Doporučený semestr: - |