Předmět: Data mining

« Zpět
Název předmětu Data mining
Kód předmětu KGI/DATAM
Organizační forma výuky Přednáška + Cvičení
Úroveň předmětu Magisterský
Rok studia nespecifikován
Semestr Zimní
Počet ECTS kreditů 6
Vyučovací jazyk Čeština
Statut předmětu Povinný
Způsob výuky Kontaktní
Studijní praxe Nejedná se o pracovní stáž
Doporučené volitelné součásti programu Není
Vyučující
  • Dobešová Zdena, doc. Ing. Ph.D.
  • Pavlačka Daniel, Mgr.
Obsah předmětu
1. Vymezení problémů analýzy mnohorozměrných dat 2. Vstupní data, typy dat, hrubá filtrace, chybějící údaje, dichotomizace, kategorizace, 3. Analýza hlavních komponent, korespondenční analýza 4. Zjišťování podobností a nepodobností objektů - koeficienty asociace a metriky 5. Klasifikační metody, shlukování hierarchické a nehierarchické, složitost algoritmů 6. Klasifikační rozhodovací stromy 7. Asociační pravidla, frekventované sady, prostorová asociační pravidla 8. Bioinspirované algoritmy, neuronové sítě, SOM 9. Vizuální programování v GIS 10. Časové řad - dekompozice řad 11. Časové řady - predikce

Studijní aktivity a metody výuky
Monologická (výklad, přednáška, instruktáž)
  • Účast na výuce - 78 hodin za semestr
  • Domácí příprava na výuku - 78 hodin za semestr
Výstupy z učení
Předmět poskytuje základní informace v oblastech přípravy dat, dolování dat, získavání znalostí z dat, analýzy dat a interpretace výsledků. Prezentované teoretické znalosti a postupy budou východiskem pro samostatné experimenty studentů se získáváním znalostí z databází.
Aplikovat znalosti pro řešení komplexního analytického problému, zpracování problému podle zvoleného nebo zadaného tématu.
Předpoklady
Základní znalosti statistických metod a práce s daty.

Hodnoticí metody a kritéria
Ústní zkouška, Seminární práce, Písemný test

Teoretická a praktická znalost probíraných témat.
Doporučená literatura
  • ČSÚ. (2020). Česko v číslech. Praha.
  • Dobesova, Z. (2019). Discovering association rules of information dissemination about Geoinformatics university study. Springer.
  • Dobesova Z. (2020). PD-28 Visual Programming for GIS Applications, Geographic Information Science & Technology Body of Knowledge BoK. Ithaca, New York.
  • Dobesova, Z., Pinos J. (2019). Using decision trees to predict the likelihood of high school students enrolling for university studies. , Advances in Intelligent Systems and Computing.
  • Hančlová, J., Tvrdý, L. (2003). Úvod do analýzy časových řad. Ekonomická fakulta VŠB-TU Ostrava.
  • Křivý I. (2012). Analýza časových řad. Ostrava.
  • Litschmannová M. (2010). Úvod do analýzy časových řad. VŠB -TU Ostrava.
  • Marek, L. (2015). Prostorové a vícerozměrné statistické analýzy epidemiologických dat. Univerzita Palackého, Olomouc, doktorská práce.
  • Petr P. (2014). Data Mining (1. a 2. část). Univerzita Pardubice.
  • Sankey T. (2017). Statistical Descriptions of Spatial Patterns, In: Shekhar S., Xiong H., Zhou X. (eds) Encyclopedia of GIS. Springer.
  • Šarmanová, J. (2012). Metody analýzy data. Ostrava.
  • Witten IH, Frank F, Hall AH. (2011). Data Mining: Practical Machine Learning Tools and Techniques. Morgan Kaufmann.


Studijní plány, ve kterých se předmět nachází
Fakulta Studijní plán (Verze) Kategorie studijního oboru/specializace Doporučený ročník Doporučený semestr
Fakulta: Přírodovědecká fakulta Studijní plán (Verze): Geoinformatika a kartografie (2020) Kategorie: Geografické obory 1 Doporučený ročník:1, Doporučený semestr: Zimní