Cilji in kompetence
Cilj predmeta je seznaniti študente s problematiko obdelave velepodatkov in pristopi za analizo in vizualizacijo velepodatkov.
Vsebina
· Uvod: definicije, zgodovina, praktični primeri, izzivi
· Osnovne podatkovne strukture za predstavitev velepodatkov (polja, seznami, sekljalne preglednice, predstavitev grafov s seznamom povezav in matriko sosednosti).
· Algoritmi analize velepodatkov (gručenje, odkrivanje skupnosti, analiza poglavitnih komponent, kompleksne mreže, klasifikacija, regresija)
· Prostorska in časovna zahtevnost obdelave velepodatkov
· Algoritmi in iskalne podatkovne strukture za pohitritev obdelave večjih količin podatkov (binarna iskalna drevesa, štiriška drevesa, osmiška drevesa, drevesa KD, vzorčenje)
· Porazdeljena obdelava velikih količin podatkov: model programiranja MapReduce
· Upodabljanje velepodatkov: samodejna postavitev vozlišč na grafih, toplotne karte, radialni, števni, violinski, ostankovni, regresijski, interaktivni grafikoni
Metode poučevanja in učenja
· Predavanja
· Računalniške vaje
· Samostojno delo
Predvideni študijski rezultati - znanje in razumevanje
Znanje in razumevanje:
Po zaključku tega predmeta bo študent sposoben
· Razumeti pomen velepodatkov
· Razumeti problematiko obdelave velepodatkov
· Uporabiti ustrezne algoritme in orodja za obdelavo velepodatkov
· Analizirati večje količine podatkov
Prenosljive/ključne spretnosti in drugi atributi:
· Spretnosti komuniciranja: ustno izražanje na računalniških vajah, pisanje poročila o opravljenih vajah, pisno izražanje pri pisnem izpitu.
· Uporaba informacijske tehnologije: uporaba ustreznih algoritmov in programskih orodij za analizo in obdelavo večjih količin podatkov.
· Spretnosti računanja: reševanje računskih problemov.
· Reševanje problemov: izbira ustreznih orodij in algoritmov za analizo in obdelavo in večjih količin podatkov, ocenjevanje primernosti uporabljenih orodij in algoritmov iz vidika časovne in prostorske zahtevnosti.
Temeljni literatura in viri
· B. Baesens: Analytics in a big data world: The essential guide to data science and its applications, John Wiley & Sons, New Jersey, USA, 2014.
· A. Bahga and V. Madisetti: Big Data Science & Analytics: A Hands-On Approach, Bahga & Madisetti,Georgia, India, 2016.
· N. Marz and J. Warren: Big Data: Principles and best practices of scalable realtime data systems, Manning Publications Co., New York, USA, 2015.
Pogoji za vključitev v delo oz. za opravljanje študijskih obveznosti
Ni pogojev.