Předmět: Data-mining digitalizovaného textu 1 - Úvod do strojového učení

» Seznam fakult » FIF » KOL
Název předmětu Data-mining digitalizovaného textu 1 - Úvod do strojového učení
Kód předmětu KOL/91PD1
Organizační forma výuky Seminář
Úroveň předmětu Doktorský
Rok studia nespecifikován
Semestr Zimní a letní
Počet ECTS kreditů 15
Vyučovací jazyk Čeština
Statut předmětu Povinně-volitelný
Způsob výuky Kontaktní
Studijní praxe Nejedná se o pracovní stáž
Doporučené volitelné součásti programu Není
Vyučující
  • Matlach Vladimír, Mgr. Ph.D.
Obsah předmětu
Podrobnější výklad o několika nejvýznamnějších přístupech moderní formální lingvistiky, a to chomskyanského GB a minimalismu, lexikální funkční gramatiky J. Bresnanové, teorie optimalismu, kategoriální gramatiky a různých přístupech gramatiky závislostní. V celém výkladu bude brán výrazný zřetel na strukturální lingvistiku Pražské školy a její výsledky.

Studijní aktivity a metody výuky
Přednášení
Výstupy z učení
Kurz zakládá prakticky na všech předchozích předmětech a je zaměřen především na praktické dovednosti strojového učení užitečné v praxi digital humanities. Veškeré úlohy jsou řešeny v programovacím jazyce Python. V tomto úvodním kurzu do strojového učení je brán zřetel především na základy a teorii strojového učení a následně praxi demonstrované na zpracování dat z lékařství, sociologie, biologie, textů ad. Strojové učení - Unsupervised a supervised metody, jejich využití a aplikace v digital humanities a praxi - Teorie strojově učících se metod, gradienty, objective funkce, hlavní myšlenky jednotlivých algoritmů - Pragmatika trénování modelů, tvorba datasetů a evaluace výsledků, výsledná dokumentace Obecné aplikace - Úlohy strojového učení vycházející z digitálních dat z lékařství, sociologie a dalších disciplín. - Představení existujících aktuálních výzev pro strojové učení Zpracování přirozeného jazyka - Aplikace znalostí modelování přirozeného jazyka ve strojovém učení - Užití knihoven pro zpracování přirozeného jazyka - Automatická klasifikace autorství, žánru, stylů, jazyka, sentimentu a další úlohy - Návrh řešení aktuálních problémů v NLP, implementace teoretických poznatků

Předpoklady
Předmět je určen pouze pro studenty doktorského studia.

Hodnoticí metody a kritéria
Ústní zkouška

(1) Vypracování a splnění zadaných úloh. (2) Přečtení zadaných materiálů.
Doporučená literatura
  • Hajičová, Panevová, Sgall. (2003). Úvod do teoretické a počítačové lingvistiky. Praha.
  • Sells, P. (1985). Lectures on Contemporary Syntactic Theories. Stanford.
  • Stockwell, R. M. (1977). Fundations of Syntactic Theory. New Persey.


Studijní plány, ve kterých se předmět nachází
Fakulta Studijní plán (Verze) Kategorie studijního oboru/specializace Doporučený ročník Doporučený semestr
Fakulta: Filozofická fakulta Studijní plán (Verze): Lingvistika a Digital Humanities (2020) Kategorie: Filologické vědy - Doporučený ročník:-, Doporučený semestr: -
Fakulta: Filozofická fakulta Studijní plán (Verze): Lingvistika a Digital Humanities (2020) Kategorie: Filologické vědy - Doporučený ročník:-, Doporučený semestr: -