Název předmětu | Matematické modelování textu 2 |
---|---|
Kód předmětu | KOL/VMMT2 |
Organizační forma výuky | Seminář |
Úroveň předmětu | Bakalářský |
Rok studia | nespecifikován |
Semestr | Zimní a letní |
Počet ECTS kreditů | 4 |
Vyučovací jazyk | Čeština |
Statut předmětu | Povinně-volitelný |
Způsob výuky | Kontaktní |
Studijní praxe | Nejedná se o pracovní stáž |
Doporučené volitelné součásti programu | Není |
Vyučující |
---|
|
Obsah předmětu |
1) Strojové učení obecně - význam, využití, model, parametry, cíle, optimalizace. 2) Optimalizační techniky: - optimalizace hrubou silou, grid-search, random-search, - genetické a další algoritmy, - gradient descent, varianty a implementace, - design nákladových funkcí, derivovatelnost, formalismy. 3) Modely SVM, LDA, k-NN, Naive Bayes, Decision Trees, Gradient Boosting: - základy teorie, implementace a využití v jazyce Python. 4) Vlastnosti vhodné pro strojové učení: - kvantitativní proměnné, inženýrská příprava vlastností, - selekce, extrakce, redukce, prokletí demenzionality, aplikace SVD, - modely a vektorizace textů: Bag-of-Words, sémantika, LSA, - škálování, normalizace, standardizace. 5) Pragmatika trénování: - vyhodnocování úspěšnosti modelů, - jevy overfit, underfit a jejich detekce, - trénovací, validační a testovací sady & problém trénovacíh/testovacíh dat. 6) Řešení praktických úloh: - vytvoření vlastního klasifikátoru sentimentu komentářů, detektoru spamu, ... 7) Vytvoření a sepsání reportu
|
Studijní aktivity a metody výuky |
Monologická (výklad, přednáška, instruktáž), Dialogická (diskuze, rozhovor, brainstorming), Metody práce s textem (učebnicí, knihou) |
Výstupy z učení |
Cílem kurzu je představit způsoby aplikace poznatků matematického modelování textu formou strojového učení pomocí programovacích jazyků R/Python. Posluchač bude seznámen s teorií i praxí strojového učení na řadě konkrétních a praktických aplikací čítajících tvorbu vlastního spamového filtru, detekci sentimentu recenzí, detekci jazyka, latentní sémantické analýzy ad.
Získané výstupy jednotlivých experimentů budou porovnány s dalšími metodami kvantitativní lingvistiky a budou dále podrobeny statistickému zhodnocení průkaznosti Výstupy budou také porovnávány s výsledky již ve světě provedených výzkumů a studenti budou vedeni k vyvozování závěrů v souladu s platnými lingvistickými zákony Kurz navazuje na předmět Matematické modelování textu 1 |
Předpoklady |
Znalosti matematiky alespoň na úrovni maturitní zkoušky Je doporučeno absolvování kurzů Základy matematiky pro lingvisty 1 a 2 a Matematické modelování textu 1
|
Hodnoticí metody a kritéria |
Analýza výkonů studenta, Systematické pozorování studenta, Seminární práce
(1) Vypracování a splnění zadaných úloh. (2) Přečtení zadaných materiálů. |
Doporučená literatura |
|
Studijní plány, ve kterých se předmět nachází |
Fakulta | Studijní plán (Verze) | Kategorie studijního oboru/specializace | Doporučený semestr | |
---|---|---|---|---|
Fakulta: Filozofická fakulta | Studijní plán (Verze): Obecná lingvistika a teorie komunikace maior pro Lingvistiku a Digital Humanities (2021) | Kategorie: Filologické vědy | - | Doporučený ročník:-, Doporučený semestr: - |
Fakulta: Filozofická fakulta | Studijní plán (Verze): Lingvistika a Digital Humanities (2020) | Kategorie: Filologické vědy | 2 | Doporučený ročník:2, Doporučený semestr: Letní |
Fakulta: Filozofická fakulta | Studijní plán (Verze): Obecná lingvistika a teorie komunikace maior (2019) | Kategorie: Filologické vědy | - | Doporučený ročník:-, Doporučený semestr: - |
Fakulta: Filozofická fakulta | Studijní plán (Verze): Lingvistika a Digital Humanities maior pro Obecnou lingvistiku a teorii komunikace (2020) | Kategorie: Filologické vědy | 2 | Doporučený ročník:2, Doporučený semestr: Letní |
Fakulta: Filozofická fakulta | Studijní plán (Verze): Obecná lingvistika maior (2019) | Kategorie: Filologické vědy | - | Doporučený ročník:-, Doporučený semestr: Letní |
Fakulta: Filozofická fakulta | Studijní plán (Verze): Obecná lingvistika minor (2022) | Kategorie: Filologické vědy | - | Doporučený ročník:-, Doporučený semestr: Letní |
Fakulta: Filozofická fakulta | Studijní plán (Verze): Obecná lingvistika (2021) | Kategorie: Filologické vědy | - | Doporučený ročník:-, Doporučený semestr: Letní |
Fakulta: Filozofická fakulta | Studijní plán (Verze): Lingvistika a Digital Humanities minor pro Obecnou lingvistiku a teorii komunikace (2020) | Kategorie: Filologické vědy | 2 | Doporučený ročník:2, Doporučený semestr: Letní |
Fakulta: Filozofická fakulta | Studijní plán (Verze): Obecná lingvistika a teorie komunikace (2014) | Kategorie: Filologické vědy | - | Doporučený ročník:-, Doporučený semestr: - |
Fakulta: Filozofická fakulta | Studijní plán (Verze): Lingvistika a Digital Humanities maior (2020) | Kategorie: Filologické vědy | 2 | Doporučený ročník:2, Doporučený semestr: Letní |
Fakulta: Filozofická fakulta | Studijní plán (Verze): Obecná lingvistika a teorie komunikace minor pro Lingvistiku a Digital Humanities (2021) | Kategorie: Filologické vědy | - | Doporučený ročník:-, Doporučený semestr: - |
Fakulta: Filozofická fakulta | Studijní plán (Verze): Obecná lingvistika a teorie komunikace minor (2019) | Kategorie: Filologické vědy | - | Doporučený ročník:-, Doporučený semestr: - |
Fakulta: Filozofická fakulta | Studijní plán (Verze): Lingvistika a Digital Humanities minor (2020) | Kategorie: Filologické vědy | 2 | Doporučený ročník:2, Doporučený semestr: Letní |