Předmět: Matematické modelování textu 2

» Seznam fakult » FIF » KOL
Název předmětu Matematické modelování textu 2
Kód předmětu KOL/VMMT2
Organizační forma výuky Seminář
Úroveň předmětu Bakalářský
Rok studia nespecifikován
Semestr Zimní a letní
Počet ECTS kreditů 4
Vyučovací jazyk Čeština
Statut předmětu Povinně-volitelný
Způsob výuky Kontaktní
Studijní praxe Nejedná se o pracovní stáž
Doporučené volitelné součásti programu Není
Vyučující
  • Matlach Vladimír, Mgr. Ph.D.
Obsah předmětu
1) Strojové učení obecně - význam, využití, model, parametry, cíle, optimalizace. 2) Optimalizační techniky: - optimalizace hrubou silou, grid-search, random-search, - genetické a další algoritmy, - gradient descent, varianty a implementace, - design nákladových funkcí, derivovatelnost, formalismy. 3) Modely SVM, LDA, k-NN, Naive Bayes, Decision Trees, Gradient Boosting: - základy teorie, implementace a využití v jazyce Python. 4) Vlastnosti vhodné pro strojové učení: - kvantitativní proměnné, inženýrská příprava vlastností, - selekce, extrakce, redukce, prokletí demenzionality, aplikace SVD, - modely a vektorizace textů: Bag-of-Words, sémantika, LSA, - škálování, normalizace, standardizace. 5) Pragmatika trénování: - vyhodnocování úspěšnosti modelů, - jevy overfit, underfit a jejich detekce, - trénovací, validační a testovací sady & problém trénovacíh/testovacíh dat. 6) Řešení praktických úloh: - vytvoření vlastního klasifikátoru sentimentu komentářů, detektoru spamu, ... 7) Vytvoření a sepsání reportu

Studijní aktivity a metody výuky
Monologická (výklad, přednáška, instruktáž), Dialogická (diskuze, rozhovor, brainstorming), Metody práce s textem (učebnicí, knihou)
Výstupy z učení
Cílem kurzu je představit způsoby aplikace poznatků matematického modelování textu formou strojového učení pomocí programovacích jazyků R/Python. Posluchač bude seznámen s teorií i praxí strojového učení na řadě konkrétních a praktických aplikací čítajících tvorbu vlastního spamového filtru, detekci sentimentu recenzí, detekci jazyka, latentní sémantické analýzy ad.
Získané výstupy jednotlivých experimentů budou porovnány s dalšími metodami kvantitativní lingvistiky a budou dále podrobeny statistickému zhodnocení průkaznosti Výstupy budou také porovnávány s výsledky již ve světě provedených výzkumů a studenti budou vedeni k vyvozování závěrů v souladu s platnými lingvistickými zákony Kurz navazuje na předmět Matematické modelování textu 1
Předpoklady
Znalosti matematiky alespoň na úrovni maturitní zkoušky Je doporučeno absolvování kurzů Základy matematiky pro lingvisty 1 a 2 a Matematické modelování textu 1

Hodnoticí metody a kritéria
Analýza výkonů studenta, Systematické pozorování studenta, Seminární práce

(1) Vypracování a splnění zadaných úloh. (2) Přečtení zadaných materiálů.
Doporučená literatura
  • Andres, J., Benešová, M., Kubáček, L., Vrbková, J. (2011). Methodological note on the fractal analysis of texts. Journal of Quantitative Linguistics 18, 4, 337-367.
  • Hřebíček, L. (2002). Vyprávění o lingvistických experimentech s textem. Praha: Academia.
  • Popescu, I. (2009). Word Frequency Studies.
  • Wimmer, G. a kol. (2003). Úvod do analýzy textov. Bratislava.


Studijní plány, ve kterých se předmět nachází
Fakulta Studijní plán (Verze) Kategorie studijního oboru/specializace Doporučený ročník Doporučený semestr
Fakulta: Filozofická fakulta Studijní plán (Verze): Obecná lingvistika a teorie komunikace maior pro Lingvistiku a Digital Humanities (2021) Kategorie: Filologické vědy - Doporučený ročník:-, Doporučený semestr: -
Fakulta: Filozofická fakulta Studijní plán (Verze): Lingvistika a Digital Humanities (2020) Kategorie: Filologické vědy 2 Doporučený ročník:2, Doporučený semestr: Letní
Fakulta: Filozofická fakulta Studijní plán (Verze): Obecná lingvistika a teorie komunikace maior (2019) Kategorie: Filologické vědy - Doporučený ročník:-, Doporučený semestr: -
Fakulta: Filozofická fakulta Studijní plán (Verze): Lingvistika a Digital Humanities maior pro Obecnou lingvistiku a teorii komunikace (2020) Kategorie: Filologické vědy 2 Doporučený ročník:2, Doporučený semestr: Letní
Fakulta: Filozofická fakulta Studijní plán (Verze): Obecná lingvistika maior (2019) Kategorie: Filologické vědy - Doporučený ročník:-, Doporučený semestr: Letní
Fakulta: Filozofická fakulta Studijní plán (Verze): Obecná lingvistika minor (2022) Kategorie: Filologické vědy - Doporučený ročník:-, Doporučený semestr: Letní
Fakulta: Filozofická fakulta Studijní plán (Verze): Obecná lingvistika (2021) Kategorie: Filologické vědy - Doporučený ročník:-, Doporučený semestr: Letní
Fakulta: Filozofická fakulta Studijní plán (Verze): Lingvistika a Digital Humanities minor pro Obecnou lingvistiku a teorii komunikace (2020) Kategorie: Filologické vědy 2 Doporučený ročník:2, Doporučený semestr: Letní
Fakulta: Filozofická fakulta Studijní plán (Verze): Obecná lingvistika a teorie komunikace (2014) Kategorie: Filologické vědy - Doporučený ročník:-, Doporučený semestr: -
Fakulta: Filozofická fakulta Studijní plán (Verze): Lingvistika a Digital Humanities maior (2020) Kategorie: Filologické vědy 2 Doporučený ročník:2, Doporučený semestr: Letní
Fakulta: Filozofická fakulta Studijní plán (Verze): Obecná lingvistika a teorie komunikace minor pro Lingvistiku a Digital Humanities (2021) Kategorie: Filologické vědy - Doporučený ročník:-, Doporučený semestr: -
Fakulta: Filozofická fakulta Studijní plán (Verze): Obecná lingvistika a teorie komunikace minor (2019) Kategorie: Filologické vědy - Doporučený ročník:-, Doporučený semestr: -
Fakulta: Filozofická fakulta Studijní plán (Verze): Lingvistika a Digital Humanities minor (2020) Kategorie: Filologické vědy 2 Doporučený ročník:2, Doporučený semestr: Letní