| Název předmětu | Matematické modelování textu 2 |
|---|---|
| Kód předmětu | KOL/VMMT2 |
| Organizační forma výuky | Seminář |
| Úroveň předmětu | Bakalářský |
| Rok studia | nespecifikován |
| Semestr | Zimní a letní |
| Počet ECTS kreditů | 4 |
| Vyučovací jazyk | Čeština |
| Statut předmětu | Povinně-volitelný |
| Způsob výuky | Kontaktní |
| Studijní praxe | Nejedná se o pracovní stáž |
| Doporučené volitelné součásti programu | Není |
| Vyučující |
|---|
|
| Obsah předmětu |
|
1) Strojové učení obecně - význam, využití, model, parametry, cíle, optimalizace. 2) Optimalizační techniky: - optimalizace hrubou silou, grid-search, random-search, - genetické a další algoritmy, - gradient descent, varianty a implementace, - design nákladových funkcí, derivovatelnost, formalismy. 3) Modely SVM, LDA, k-NN, Naive Bayes, Decision Trees, Gradient Boosting: - základy teorie, implementace a využití v jazyce Python. 4) Vlastnosti vhodné pro strojové učení: - kvantitativní proměnné, inženýrská příprava vlastností, - selekce, extrakce, redukce, prokletí demenzionality, aplikace SVD, - modely a vektorizace textů: Bag-of-Words, sémantika, LSA, - škálování, normalizace, standardizace. 5) Pragmatika trénování: - vyhodnocování úspěšnosti modelů, - jevy overfit, underfit a jejich detekce, - trénovací, validační a testovací sady & problém trénovacíh/testovacíh dat. 6) Řešení praktických úloh: - vytvoření vlastního klasifikátoru sentimentu komentářů, detektoru spamu, ... 7) Vytvoření a sepsání reportu
|
| Studijní aktivity a metody výuky |
| Monologická (výklad, přednáška, instruktáž), Dialogická (diskuze, rozhovor, brainstorming), Metody práce s textem (učebnicí, knihou) |
| Výstupy z učení |
|
Cílem kurzu je představit způsoby aplikace poznatků matematického modelování textu formou strojového učení pomocí programovacích jazyků R/Python. Posluchač bude seznámen s teorií i praxí strojového učení na řadě konkrétních a praktických aplikací čítajících tvorbu vlastního spamového filtru, detekci sentimentu recenzí, detekci jazyka, latentní sémantické analýzy ad.
Získané výstupy jednotlivých experimentů budou porovnány s dalšími metodami kvantitativní lingvistiky a budou dále podrobeny statistickému zhodnocení průkaznosti Výstupy budou také porovnávány s výsledky již ve světě provedených výzkumů a studenti budou vedeni k vyvozování závěrů v souladu s platnými lingvistickými zákony Kurz navazuje na předmět Matematické modelování textu 1 |
| Předpoklady |
|
Znalosti matematiky alespoň na úrovni maturitní zkoušky Je doporučeno absolvování kurzů Základy matematiky pro lingvisty 1 a 2 a Matematické modelování textu 1
|
| Hodnoticí metody a kritéria |
|
Analýza výkonů studenta, Systematické pozorování studenta, Seminární práce
(1) Vypracování a splnění zadaných úloh. (2) Přečtení zadaných materiálů. |
| Doporučená literatura |
|
| Studijní plány, ve kterých se předmět nachází |
| Fakulta | Studijní plán (Verze) | Kategorie studijního oboru/specializace | Doporučený semestr | |
|---|---|---|---|---|
| Fakulta: Filozofická fakulta | Studijní plán (Verze): Obecná lingvistika (2021) | Kategorie: Filologické vědy | - | Doporučený ročník:-, Doporučený semestr: Letní |
| Fakulta: Filozofická fakulta | Studijní plán (Verze): Lingvistika a Digital Humanities maior pro Obecnou lingvistiku a teorii komunikace (2020) | Kategorie: Filologické vědy | 2 | Doporučený ročník:2, Doporučený semestr: Letní |
| Fakulta: Filozofická fakulta | Studijní plán (Verze): Obecná lingvistika minor (2022) | Kategorie: Filologické vědy | - | Doporučený ročník:-, Doporučený semestr: Letní |
| Fakulta: Filozofická fakulta | Studijní plán (Verze): Obecná lingvistika a teorie komunikace minor pro Lingvistiku a Digital Humanities (2021) | Kategorie: Filologické vědy | - | Doporučený ročník:-, Doporučený semestr: - |
| Fakulta: Filozofická fakulta | Studijní plán (Verze): Obecná lingvistika a teorie komunikace maior pro Lingvistiku a Digital Humanities (2021) | Kategorie: Filologické vědy | - | Doporučený ročník:-, Doporučený semestr: - |
| Fakulta: Filozofická fakulta | Studijní plán (Verze): Obecná lingvistika maior (2019) | Kategorie: Filologické vědy | - | Doporučený ročník:-, Doporučený semestr: Letní |
| Fakulta: Filozofická fakulta | Studijní plán (Verze): Lingvistika a Digital Humanities minor pro Obecnou lingvistiku a teorii komunikace (2020) | Kategorie: Filologické vědy | 2 | Doporučený ročník:2, Doporučený semestr: Letní |
| Fakulta: Filozofická fakulta | Studijní plán (Verze): Lingvistika a Digital Humanities (2020) | Kategorie: Filologické vědy | 2 | Doporučený ročník:2, Doporučený semestr: Letní |
| Fakulta: Filozofická fakulta | Studijní plán (Verze): Obecná lingvistika a teorie komunikace maior (2019) | Kategorie: Filologické vědy | - | Doporučený ročník:-, Doporučený semestr: - |
| Fakulta: Filozofická fakulta | Studijní plán (Verze): Obecná lingvistika a teorie komunikace minor (2019) | Kategorie: Filologické vědy | - | Doporučený ročník:-, Doporučený semestr: - |
| Fakulta: Filozofická fakulta | Studijní plán (Verze): Lingvistika a Digital Humanities maior (2020) | Kategorie: Filologické vědy | 2 | Doporučený ročník:2, Doporučený semestr: Letní |
| Fakulta: Filozofická fakulta | Studijní plán (Verze): Lingvistika a Digital Humanities minor (2020) | Kategorie: Filologické vědy | 2 | Doporučený ročník:2, Doporučený semestr: Letní |