Předmět: Statistická analýza dat (STATISTICA)

« Zpět
Název předmětu Statistická analýza dat (STATISTICA)
Kód předmětu KSA/SAD
Organizační forma výuky Přednáška + Cvičení
Úroveň předmětu Bakalářský
Rok studia 2
Semestr Zimní a letní
Počet ECTS kreditů 6
Vyučovací jazyk Čeština
Statut předmětu Povinný
Způsob výuky Kontaktní
Studijní praxe Nejedná se o pracovní stáž
Doporučené volitelné součásti programu Není
Vyučující
  • Fiedor David, doc. Mgr. Ph.D.
Obsah předmětu
1. Úvod do práce s počítačem při analýze dat, základy ovládání programu STATISTICA Seznámení s možnostmi využití výpočetní techniky při empirických sociologických výzkumech. Přiblížení vývoje hardwarového i softwarového vybavení, které užívají sociální vědy, s důrazem na oblast kvantitativního sociologického výzkumu. Co je datový soubor? Vznik datových souborů a jejich uchovávání. Vytváření a používání datových souborů v programu STATISTICA. Popis prostředí programu a jeho ovládání. Prohlížení a ukládání výsledků práce. 2. Jednorozměrná analýza Co je jednorozměrná analýza a k čemu slouží? Vytváření tabulek četností a jejich interpretace. Popisná statistika: střední hodnoty, míry variability, minimum, maximum, rozsah, percentily. Grafické zobrazení rozložení u jedné proměnné (histogram, výsečové grafy atp.) 3. Kardinální proměnné; průměry u podsouborů Práce s kardinálními proměnnými: problémy s tabulkami četností, intervaly, kvartily, extrémní hodnoty atd. Zkoumání rozložení dat pomocí listových a krabicových grafů (popisné statistiky, grafy). Výpočet průměrů u podsouborů případů vymezených "nezávislými" proměnnými (rozklad). 4. Bivariační analýza - kontingenční tabulka a chí kvadrát Vztah dvou proměnných - symetrie vztahu, charakter souvisejících proměnných. Kontingenční tabulka - základní prostředek bivariační analýzy. Absolutní a relativní četnosti, četnosti pozorované a očekávané, reziduály; marginální četnosti. Zadávání výpočtu kontingenčních tabulek, obsah políček (buněk) tabulky. Volba relativních četností podle symetricity vztahu. Čtení z tabulek. Model nezávislosti proměnných a měření vzdálenosti od tohoto modelu - chí kvadrát. Podmínky korektnosti chí-kvadrátu - omezenost jeho použití. Grafické zobrazení druhého třídění - kategorizované grafy a 3D grafy. 5. Transformace proměnných, výběry případů Transformace proměnných pomocí "kolapsování" hodnot, reorientace škály, vytváření intervalů. Vytváření nových proměnných (kopií proměnných, součtových indexů, podílů atp.), jejich popisy. Výběry případů: s určitými charakteristikami, náhodný výběr ze vzorku. 6. Bivariační analýza - měření síly a významnosti asociací dvou proměnných Významnost (signifikance) a síla vztahu (koeficienty). Vliv charakteru proměnných a jejich vztahu na volbu koeficientů. Rozsah hodnot koeficientů (normování) a jejich interpretace. Koeficienty pro nominální úroveň měření založené na chí-kvadrátu (Fí, Cramerovo V, Kontingenční koeficient) a na proporcionální redukci chyby (Lambda). Koeficienty pro ordinální úroveň měření (Spearmanův koeficient pořadové korelace, Somersovo d, Goodman-Kruskalovo Gamma, Kendallovo Tau). Měření souvislostí mezi různými dvojicemi proměnných. Srovnání analýzy pomocí koeficientů s analýzou kontingenční tabulky. 7. Korelace a regresní analýza Korelační koeficienty, korelační matice. Síla a významnost korelací. Parciální korelace. Jednoduchá lineární regrese, regresní rovnice a její parametry, koeficient determinace, předpokládané hodnoty vyčtené z regresní rovnice. Vícerozměrná lineární regrese. Grafické přiblížení korelací a regresních vztahů (bodové, bublinové grafy atp.) 8. Porovnávání průměrů a analýza rozptylu Porovnávání průměrů pomocí t-testu, porovnání více průměrů pomocí analýzy variancí (jedna proměnná dělí případy do několika skupin). Interval spolehlivosti (konfidenční interval), hladina významnosti u testovacích kritérií (F, t). Způsob zadání testů o průměrech a jednoduché jednovýchodné analýzy rozptylu - příkazy t-test, ANOVA. Interpretace výsledků analýzy. Závěr o významnosti, resp. zobecnitelnosti rozdílů. 9. Kontrola pro další faktor Tabulky vyšších třídění. Možná zkreslení ve vztahu dvou proměnných a odhalení vlivu třetí proměnné. Parciální korelace.

Studijní aktivity a metody výuky
Přednášení, Demonstrace, Nácvik pohybových a pracovních dovedností
  • Účast na výuce - 24 hodin za semestr
  • Příprava na zkoušku - 15 hodin za semestr
  • Domácí příprava na výuku - 12 hodin za semestr
  • Příprava na zápočet - 9 hodin za semestr
Výstupy z učení
Kurs Statistická analýza dat seznamuje studenty formou přednášek a cvičení se základy práce s hromadnými daty za použití programového systému STATISTICA. Program je určen pro zpracování kvantitativních empirických dat, umožňuje vytváření vlastních datových souborů i přenos a práci s jinými datovými soubory. Základní postupy, se kterými se studenti seznámí, zahrnují práci s daty, maticí dat, datovým souborem, třídění prvního a vyšších stupňů, vytváření kontingenčních tabulek a používání koeficientů pro měření síly souvislostí dvou proměnných, korelační a regresní analýzu.
Cílem předmětu je získání základních dovedností v analýze dat s využitím programového systému STATISTICA. To znamená schopnost vytvořit vlastní datový soubor nebo pracovat s jinými daty. Studenti jsou schopni upravovat data (např. vytvářet indexy), aplikovat základní statistické procedury (jedno a vícerozměrné klasifikace, vytváření kontingenčních tabulek a používání koeficientů pro měření síly vztahů mezi dvěma proměnnými, korelační a regresní analýzu) a interpretovat získaná zjištění.
Předpoklady
Absolvování základního kurzu statistiky.

Hodnoticí metody a kritéria
Ústní zkouška, Písemná zkouška

úspěšné absolvování dvou testů (zápočet) a obhájení výsledků své práce při zkoušce
Doporučená literatura
  • On-line katalogy knihoven.
  • (2005). Statistica: základní příručka. Praha: StatSoft CR.
  • BLACK, Thomas R. (1999). Doing Quantitative Research in the Social Sciences: An Integrated Approach to Research Design, Measurement and Statistics.. London, Thousand Oaks: Sage Publications.
  • BRYMAN, Alan. . (2008). Social Research Methods.. Oxford: Oxford University Press.
  • Disman, M. 1993. Jak se vyrábí sociologická znalost. Praha: Karolinum..
  • Hanousek, J., Charamza, P. Moderní metody zpracování dat - Matematická statistika pro každého. Praha, Grada 1992..
  • Loučková, I. Analýza dat II s metodou LINDA ve společenskovědním výzkumu. Olomouc,UP 1996..
  • Loučková, I.:. Analýza dat. (Jednorozměrná rozložení číselného typu.) Olomouc 1992..
  • Loučková, I. 1991. Základní statistické přístupy v sociologickém výzkumu. Olomouc: UP..
  • Mareš, P., L. Rabušic, P. Soukup. (2015). Analýza sociálněvědních dat (nejen) v SPSS. Brno: Masarykova univerzita.
  • Meloun, M., Militký, J. Statistické zpracování experimentálních dat. Praha, Ars magna 1998..
  • Rabušic, L., Mareš, P. 1996. "Je česká společnost anomická." Sociologický časopis 32: 177-187..
  • Ryšavý, D. Pět P - První pomocník pro práci s počítačovým programem STATISTICA. (nepublikovaný manuskript) Olomouc, UP 2008..
  • Ryšavý, D. 2003. "Sociální distance vůči Romům. Případ vysokoškolských studentů." Sociologický časopis 39(1): 55-77..
  • Seger, J., Hindls, R., Hronová, S. Statistika v hospodářství. Praha, Manager/podnikatel 1998..
  • Swoboda, H. 1977. Moderní statistika. Praha: Svoboda..


Studijní plány, ve kterých se předmět nachází
Fakulta Studijní plán (Verze) Kategorie studijního oboru/specializace Doporučený ročník Doporučený semestr
Fakulta: Filozofická fakulta Studijní plán (Verze): Sociologie (2016) Kategorie: Sociální vědy 2 Doporučený ročník:2, Doporučený semestr: -