Vyučující
|
-
Stoklasa Jan, Mgr. et Mgr. Ph.D.
|
Obsah předmětu
|
a) úvod do zpracovávání dat, základy vytěžování dat - data miningu b) instalace programu RapidMiner Studio c) základy ovládání programu RapidMiner Studio d) import dat (xls, xlsx, csv...) e) grafika tvorba 2D a 3D grafů f) základní statistické charakteristiky datového souboru g) předzpracování vstupních dat chybějící data, odlehlé hodnoty, normalizace dat h) rozdělení vstupních dat na trénovací a testovací data i) regresní analýza lineární regrese, časové řady j) klasifikace rozhodovací stromy, naivní Bayesův klasifikátor, metoda podpůrných vektorů, neuronové sítě k) shluková analýza - metoda nejbližšího souseda l) křížová validace, ROC m) export dat (xls, xlsx, csv...)
|
Studijní aktivity a metody výuky
|
Přednášení, Dialogická (diskuze, rozhovor, brainstorming), Demonstrace
- Domácí příprava na výuku
- 30 hodin za semestr
- Účast na výuce
- 25 hodin za semestr
- Semestrální práce
- 20 hodin za semestr
|
Výstupy z učení
|
Data mining, neboli vytěžování dat, začíná být v současné praxi čím dál tím potřebnější. V praxi na něj můžeme narazit například v marketingu, v obchodu, při řízení komplexních systémů, v medicíně, v oblasti kontroly kvality nebo třeba u velkých internetových služeb, které se díky němu snaží co nejvíce vyhovět svým zákazníkům. Pro tyto potřeby se v data miningu využívají poznatky z různých vědních oborů jako je matematická statistika, strojové učení, neuronové sítě, apod. Cílem tohoto předmětu je seznámit studenta se základními principy data miningu a zpracování ekonomických dat pomocí programu RapidMiner Studio. Student se naučí nejen jak vstupní data předpřipravit a následně na ně aplikovat různé matematické metody, ale také jak výsledky těchto metod validovat, vyhodnotit a dále prezentovat.
Student se v průběhu kurzu naučí základní principy zpracování a vytěžování ekonomických dat data miningu. Bude schopen vstupní data upravit a dále zpracovat a vyhodnotit pomocí základních regresních metod, klasifikačních metod a metod pro shlukovou analýzu. Výsledky bude dále schopen prezentovat ve formě grafických výstupů a vyvodit z nich relevantní závěry pro ekonomickou praxi.
|
Předpoklady
|
Vlastní notebook. Může být zapůjčen katedrou.
|
Hodnoticí metody a kritéria
|
Analýza výkonů studenta, Systematické pozorování studenta, Seminární práce
Docházka maximálně 2 absence. Aktivní zapojení na semináři. Vypracování seminární práce zpracování ekonomických dat s využitím v předmětu vyučovaného softwaru a prezentace seminární práce.
|
Doporučená literatura
|
-
RapidMiner resources ? getting started central.
-
RapidMiner Studio Manual.
-
M. A. North. (2012). Data Mining for the Masses..
-
M. Hofmann, R. Klinkenberg. (2016). RapidMiner: Data Mining Use Cases and Business Analytics Application..
-
P. BERKA. (2003). Dobývání znalostí z databází.
-
R. O. Duda, P. E. Hart, D. G. Stork. (2001). Pattern classification, 2ND ed.
|