Analiza velikih skupova podataka
Opis predmeta
Uvod u analizu velikih skupova podataka. Pronalaženje sličnih entiteta. Analiza tokova podataka. Analiza poveznica u podacima predstavljenim grafovima. Pronalaženje čestih skupova. Pronalaženje grupa u velikim skupovima podataka. Sustavi za preporuke. Analiza grafova društvenih mreža. Modeli oglašavanja na webu. Reduciranje dimenzionalnosti. Strojno učenje sa svojstvom razmjernog rasta.
Ishodi učenja
- prepoznati i razumjeti zašto neki problem pripada u kategoriju velikih podataka
- primijeniti programskih model MapReduce prilikom susretanja s određenim tipovima problema
- dizajnirati i vrednovati sustav za pronalaženje sličnih entiteta u velikim skupu podataka
- dizajnirati i vrednovati sustav za pronalaženje čestih skupova u velikom skupu podataka
- dizajnirati i vrednovati sustav za rangiranje čvorova vrlo velikom skupu podataka predočenom grafom
- dizajnirati i vrednovati sustav za preporučivanje
- primijeniti odgovarajuće algoritme s ciljem pronalaženja grupa u velikom skupu padataka
- primijeniti odgovarajuće algoritme za obradu tokova podataka
Oblici nastave
Predavanja
Predavanja popraćena PowerPoint projekcijom s prikazom teorijskih načela.
Auditorne vježbeObjašnjavanje popratnih primjera i rješavanje zadataka za vrijeme predavanja.
LaboratorijProgramsko ostvarenje odabranih metoda analize velikih skupova podataka. Studenti samostalno programski ostvaruju laboratorijski zadatak i putem web-aplikacije predaju rješenja na automatizirano ocjenjivanje.
Tjedni plan nastave
- (en) Locality-sensitive hashing (LSH), minhash and simhash algorithms
- (en) Locality-sensitive hashing (LSH), minhash and simhash algorithms
- (en) Graph mining
- (en) Web search (PageRank and HITS)
- Dubinska analiza podataka pomoću programskog modela Map-Reduce , (en) Feature selection (filter methods, subset selection, wrapper method)
- (en) Data stream mining
- (en) Data stream mining
- Međuispit
- (en) Time series and sequences mining
- (en) Collaborative filtering and recommender engines
- (en) Clustering algorithms for large datasets (BFR, CURE)
- (en) Sampling, filtering and estimating data stream moments
- (en) Large-scale algorithms for mining frequent item sets (Apriori, PCY, SON)
- (en) Detecting communities in large graphs (Girvan-Newman, Affiliation-Graph Model)
- Završni ispit
Studijski programi
Sveučilišni diplomski
Izborni predmeti (2. semestar)[FER3-HR] Automatika i robotika - profil
Izborni predmeti
(2. semestar)
[FER3-HR] Elektroenergetika - profil
Izborni predmeti
(2. semestar)
Izborni predmeti
(2. semestar)
[FER3-HR] Elektronika - profil
Izborni predmeti
(2. semestar)
Izborni predmeti
(2. semestar)
Izborni predmeti
(2. semestar)
Izborni predmeti
(2. semestar)
Jezgreni predmeti profila
(2. semestar)
[FER3-HR] Računalno inženjerstvo - profil
Izborni predmeti
(2. semestar)
Izborni predmeti
(2. semestar)
[FER3-HR] Računarska znanost - profil
Jezgreni predmeti profila
(2. semestar)
[FER3-HR] Znanost o mrežama - profil
Izborni predmeti
(2. semestar)
[FER3-HR] Znanost o podacima - profil
Izborni predmeti
(2. semestar)
Izborni predmeti profila
(2. semestar)
[FER2-HR] Programsko inženjerstvo i informacijski sustavi - profil
Predmeti specijalizacije profila
(2. semestar)
[FER2-HR] Računarska znanost - profil
Predmeti specijalizacije profila
(2. semestar)
[FER2-HR] Telekomunikacije i informatika - profil
Predmeti specijalizacije profila
(2. semestar)
Literatura
(.), Jure Leskovec, Anand Rajaraman, Jeffrey David Ullman (2014.), Mining of Massive Datasets, Cambridge University Press,
(.), Michael Manoochehri (2013.), Data Just Right, Addison-Wesley,
(.), Jiawei Han, Jian Pei, Micheline Kamber (2011.), Data Mining: Concepts and Techniques, Elsevier,
Predavanja
Laboratorijske vježbe

Dr. sc.
Lucija Šikić

Marin Vlaić
mag. ing.

Ivan Mikulić
mag. ing.
Za studente
Izvedba
ID 222459
Ljetni semestar
5 ECTS
R1 Engleski jezik
R1 E-učenje
45 Predavanja
0 Seminar
0 Auditorne vježbe
5 Laboratorijske vježbe
0 Konstrukcijske vježbe
Ocjenjivanje
izvrstan
vrlo dobar
dobar
dovoljan