Analiza velikih skupova podataka
Prikazani su podaci za akademsku godinu: 2024./2025.
Laboratorijske vježbe
Opis predmeta
Uvod u analizu velikih skupova podataka. Pronalaženje sličnih entiteta. Analiza tokova podataka. Analiza poveznica u podacima predstavljenim grafovima. Pronalaženje čestih skupova. Pronalaženje grupa u velikim skupovima podataka. Sustavi za preporuke. Analiza grafova društvenih mreža. Modeli oglašavanja na webu. Reduciranje dimenzionalnosti. Strojno učenje sa svojstvom razmjernog rasta.
Preduvjeti
programiranje, algoritmi i strukture podataka, osnove teorije vjerojatnosti, osnove linearne algebre
Studijski programi
Sveučilišni diplomski
Izborni predmeti (2. semestar)[FER3-HR] Automatika i robotika - profil
Izborni predmeti
(2. semestar)
[FER3-HR] Elektroenergetika - profil
Izborni predmeti
(2. semestar)
Izborni predmeti
(2. semestar)
[FER3-HR] Elektronika - profil
Izborni predmeti
(2. semestar)
Izborni predmeti
(2. semestar)
Izborni predmeti
(2. semestar)
Izborni predmeti
(2. semestar)
Jezgreni predmeti profila
(2. semestar)
[FER3-HR] Računalno inženjerstvo - profil
Izborni predmeti
(2. semestar)
Izborni predmeti
(2. semestar)
[FER3-HR] Računarska znanost - profil
Jezgreni predmeti profila
(2. semestar)
[FER3-HR] Znanost o mrežama - profil
Izborni predmeti
(2. semestar)
[FER3-HR] Znanost o podacima - profil
Izborni predmeti
(2. semestar)
Izborni predmeti profila
(2. semestar)
[FER2-HR] Programsko inženjerstvo i informacijski sustavi - profil
Predmeti specijalizacije profila
(2. semestar)
[FER2-HR] Računarska znanost - profil
Predmeti specijalizacije profila
(2. semestar)
[FER2-HR] Telekomunikacije i informatika - profil
Predmeti specijalizacije profila
(2. semestar)
Ishodi učenja
- prepoznati i razumjeti zašto neki problem pripada u kategoriju velikih podataka
- primijeniti programskih model MapReduce prilikom susretanja s određenim tipovima problema
- dizajnirati i vrednovati sustav za pronalaženje sličnih entiteta u velikim skupu podataka
- dizajnirati i vrednovati sustav za pronalaženje čestih skupova u velikom skupu podataka
- dizajnirati i vrednovati sustav za rangiranje čvorova vrlo velikom skupu podataka predočenom grafom
- dizajnirati i vrednovati sustav za preporučivanje
- primijeniti odgovarajuće algoritme s ciljem pronalaženja grupa u velikom skupu padataka
- primijeniti odgovarajuće algoritme za obradu tokova podataka
Oblici nastave
Predavanja
Predavanja popraćena PowerPoint projekcijom s prikazom teorijskih načela.
Auditorne vježbeObjašnjavanje popratnih primjera i rješavanje zadataka za vrijeme predavanja.
LaboratorijProgramsko ostvarenje odabranih metoda analize velikih skupova podataka. Studenti samostalno programski ostvaruju laboratorijski zadatak i putem web-aplikacije predaju rješenja na automatizirano ocjenjivanje.
Način ocjenjivanja
Kontinuirana nastava | Ispitni rok | |||||
---|---|---|---|---|---|---|
Vrsta provjere | Prag | Udio u ocjeni | Prag | Udio u ocjeni | ||
Laboratorijske vježbe | 50 % | 30 % | 50 % | 0 % | ||
Sudjelovanje u nastavi | 0 % | 10 % | 0 % | 0 % | ||
Međuispit: Pismeni | 50 % | 30 % | 0 % | |||
Završni ispit: Pismeni | 50 % | 30 % | ||||
Ispit: Pismeni | 50 % | 100 % | ||||
Ispit: Usmeni | 100 % |
Tjedni plan nastave
- (en) Locality-sensitive hashing (LSH), minhash and simhash algorithms
- (en) Locality-sensitive hashing (LSH), minhash and simhash algorithms
- (en) Graph mining
- (en) Web search (PageRank and HITS)
- Dubinska analiza podataka pomoću programskog modela Map-Reduce , (en) Feature selection (filter methods, subset selection, wrapper method)
- (en) Data stream mining
- (en) Data stream mining
- Međuispit
- (en) Time series and sequences mining
- (en) Collaborative filtering and recommender engines
- (en) Clustering algorithms for large datasets (BFR, CURE)
- (en) Sampling, filtering and estimating data stream moments
- (en) Large-scale algorithms for mining frequent item sets (Apriori, PCY, SON)
- (en) Detecting communities in large graphs (Girvan-Newman, Affiliation-Graph Model)
- Završni ispit
Literatura
(.), Jure Leskovec, Anand Rajaraman, Jeffrey David Ullman (2014.), Mining of Massive Datasets, Cambridge University Press,
(.), Michael Manoochehri (2013.), Data Just Right, Addison-Wesley,
(.), Jiawei Han, Jian Pei, Micheline Kamber (2011.), Data Mining: Concepts and Techniques, Elsevier,
Izvedba
ID 222459
Ljetni semestar
5 ECTS
R1 Engleski jezik
R1 E-učenje
45 Predavanja
0 Seminar
0 Auditorne vježbe
5 Laboratorijske vježbe
0 Konstrukcijske vježbe
0 Vježbe tjelesnog odgoja
Ocjenjivanje
88 izvrstan
75 vrlo dobar
63 dobar
50 dovoljan