|
Vyučující
|
-
Matlach Vladimír, Mgr. Ph.D.
|
|
Obsah předmětu
|
(1) Úvod: Digital Humanities, data, big data a data-mining Zdroje dat od Twitteru, Facebooku, Instagramu, přes volební účast ulic, digitální záznamy porad, elektronické knihy, popisy kultur a jak z nich něco dostat. (2) Základní data-mining vztahů Vytěžení informací ze vztahů mezi lidmi, produkty a prakticky čímkoliv, které se (ne)uvádějí. Základy teorie grafů, praktické nástroje a aplikace. (3) Úvod do jazyka R pro data-mining a jeho alternativy Základy práce s jazykem R od načtení dat po jejich zpracování. (4) Pokročilý data-mining vztahů Hledání vztahů na základě podobných vlastností objektů, jejich kategorizace, interpretace. Od vícerozměrné analýzy (MDS, PCA, SVD), ke shlukování a k neuronovým sítím. (5) Analýza a zpracování textu Specifika vytěžování dat z textu od modelu bag-of-words k čistě kvantitativním popisům. (6) Automatické rozhodování a těžba Základy strojového učení z dat a praktické aplikace.
|
|
Studijní aktivity a metody výuky
|
Přednášení, Dialogická (diskuze, rozhovor, brainstorming), Demonstrace
- Účast na výuce
- 8 hodin za semestr
|
|
Výstupy z učení
|
Digital-humanities jsou spojeny především se vznikem velkého množství dat a potenciálem digitálně zaznamenávat rozmanité lidské interakce. Ať už jde o digitalizované archivy, sociální sítě nebo tabulky vlastností kultur, jsou právě taková data dále analyzován různými přístupy přinášející z těchto dat nová poznání. Tento kurz má za cíl prezentovat řadu metod na data a způsobů, jak z nich dále získat znalosti. Problémy jsou prezentovány na řadě praktických úloh, včetně úvodu do jazyka R běžně používaném v datové analytice. (Notebooky s sebou.)
|
|
Předpoklady
|
nespecifikováno
|
|
Hodnoticí metody a kritéria
|
Analýza výkonů studenta, Seminární práce
(1) 100 % docházka (2) Vypracování seminární práce
|
|
Doporučená literatura
|
-
Aggarwal, Ch. C. (2015). Data Mining: The Textbook. Switzerland: Springer International Publishing AG.
-
Bartholomew, D.J., Steele, F., Moustaki, I., Galbraith, J. (2008). Analysis of multivariate social science data (2nd edition). Chapman and Hall, London.
-
Bramer, M. (2007). Principles of Data Mining. London: Springer-Verlag New York.
-
Cichosz, P. (2015). Data Mining Algorithms: Explained Using R. Hoboken, NJ, United States: John Wiley & Sons.
-
Čech, R., Popescu, I. I., Altmann, G. (2014). Metody kvantitativní analýzy (nejen) básnických textů. Olomouc.
-
Demel, Jiří. (2002). Grafy a jejich aplikace. Academia.
-
Everitt, B. S., Landau, S., Leese, M., Stahl, S. (2011). Cluster Analysis. Oxford: Wiley-Blackwell.
-
Husson, Franc. (2011). Exploratory Multivariate Analysis by Example Using R.
-
Lantz, Brett. (2013). Machine Learning with R. Birmingham: Packt Publishing.
-
Manning, Ch. D., Raghavan, P., Schütze, H. (2008). An Introduction to Information Retrieval. New York: Cambridge University Press.
-
Popescu, I. (2009). Word Frequency Studies.
-
Rogers, S., Girolami, M. (2016). A First Course in Machine Learning. United States: Chapman & Hall/CRC.
-
Spencer, Neil Hardy. (2014). Essentials of Multivariate Data Analysis.
|