Cilji in kompetence
Cilj tega predmeta je, da se študent osvoji metode aplikativne statistike in njihove uporabe v podatkovni znanosti.
Vsebina
• Uvod v zelene podatke (oblikovanje raziskovalne študije, hipoteze, raziskovalna vprašanja, vrste spremenljivk, EDA, statistično sklepanje)
• Verjetnosti in porazdelitve (definiranje verjetnosti, pogojna verjetnost, normalna porazdelitev, binomska porazdelitev)
• Osnove za statistično sklepanje (spremenljivost, izrek centralne tendence, intervali zaupanja, testiranje hipotez, statistična napaka, zaupanje)
• Analiza numeričnih spremenljivk (t-test, moč, primerjava treh ali več spremenljivk (ANOVA), večkratne meritve (MANOVA))
• Analiza kategoričnih spremenljivk (primerjava dveh spremenljivk, primerjava treh ali več spremenljivk (hi – kvadrat in sorodni testi)
• Uvod v linearno regresijo (razmerje med dvema številčnima spremenljivkama, linearna regresija z enim samim prediktorjem, Osamelci v linearni regresiji, statistično sklepanje na podlagi linearne regresije)
• Linearna regresija z več spremenljivkami (regresija z več napovedmi, sklepanje, izbira modela in validacija)
• Bayesov in Frekvenčni pristop (Bayesova verjetnost, vpliv predhodnih prepričanj, zaporedna statistika)
Metode poučevanja in učenja
• predavanja,
• računalniške vaje.
Predvideni študijski rezultati - znanje in razumevanje
Znanje in razumevanje:
• razumeti uporabo statističnih metod v podatkovni znanosti,
• izbrati primerno statistično metodo in orodje in ju uporabiti za analizo tako podatkov kot za ocenitev uporabnosti rezultatov s stališča podatkovne znanosti.
Prenosljive/ključne spretnosti in drugi atributi:
• Spretnosti komuniciranja: učinkovito predstaviti rezultate statističnih analiz in njihove interpretacije ciljnim skupinam,
• Uporaba programskih orodij: uporaba statistične programske opreme in jezikov,
• Reševanje problemov v podatkovni znanosti: oblikovati raziskovalni pristop, postaviti hipoteze in raziskovalna vprašanja ter hipotezo preveriti in na raziskovalno vprašanje odgovoriti.
Temeljni literatura in viri
• Peter Bruce, Andrew Bruce, Practical Statistics for Data Scientists: 50 Essential Concepts. O'Reilly Media, May 2017
• Bradley Efron and Trevor Hastie, Computer Age Statistical Inference: Algorithms, Evidence, and Data Science, Institute of Mathematical Statistics Monographs, Jul 2016
• Douglas A. Wolfe and Grant Schneide, Intuitive Introductory Statistics, Springer, Oct 2017
• Tina Štemberger, Univariatne in bivariatne statistične metode v edukaciji, Univerza na Primorskem, 2016
Pogoji za vključitev v delo oz. za opravljanje študijskih obveznosti
Ni pogojev.
Podrobnosti o izvedbi in ocenjevanju Pisni izpit se lahko nadomesti s kolokviji v enakem deležu 50 %.