Vsebina
· Uvod: definicije, zgodovina, praktični primeri, izzivi
· Osnovne podatkovne strukture za predstavitev velepodatkov (polja, seznami, sekljalne preglednice, predstavitev grafov s seznamom povezav in matriko sosednosti).
· Algoritmi analize velepodatkov (gručenje, odkrivanje skupnosti, analiza poglavitnih komponent, kompleksne mreže, klasifikacija, regresija)
· Prostorska in časovna zahtevnost obdelave velepodatkov
· Algoritmi in iskalne podatkovne strukture za pohitritev obdelave večjih količin podatkov (binarna iskalna drevesa, štiriška drevesa, osmiška drevesa, drevesa KD, vzorčenje)
· Porazdeljena obdelava velikih količin podatkov: model programiranja MapReduce
· Upodabljanje velepodatkov: samodejna postavitev vozlišč na grafih, toplotne karte, radialni, števni, violinski, ostankovni, regresijski, interaktivni grafikoni
Predvideni študijski rezultati - znanje in razumevanje
Znanje in razumevanje:
Po zaključku tega predmeta bo študent sposoben
· Razumeti pomen velepodatkov
· Razumeti problematiko obdelave velepodatkov
· Uporabiti ustrezne algoritme in orodja za obdelavo velepodatkov
· Analizirati večje količine podatkov
Prenosljive/ključne spretnosti in drugi atributi:
· Spretnosti komuniciranja: ustno izražanje na računalniških vajah, pisanje poročila o opravljenih vajah, pisno izražanje pri pisnem izpitu.
· Uporaba informacijske tehnologije: uporaba ustreznih algoritmov in programskih orodij za analizo in obdelavo večjih količin podatkov.
· Spretnosti računanja: reševanje računskih problemov.
· Reševanje problemov: izbira ustreznih orodij in algoritmov za analizo in obdelavo in večjih količin podatkov, ocenjevanje primernosti uporabljenih orodij in algoritmov iz vidika časovne in prostorske zahtevnosti.
Temeljni literatura in viri
• Holmes, D. E. (2019). Veliko podatkovje: zelo kratek uvod (Vol. 34, p. 143). Krtina.
• Marin, I., Shukla, A., & Vk, S. (2019). Big Data Analysis with Python. https://plus.cobiss.net/cobiss/si/sl/bib/4100000007987661
• Kane, F. (2017). Frank Kane’s Taming Big Data with Apache Spark and Python. Packt Publishing Ltd.
https://plus.cobiss.net/cobiss/si/sl/bib/4100000000880988#full