Analiza velikih skupova podataka

Prikazani su podaci za akademsku godinu: 2025./2026.

Laboratorijske vježbe

Opis kolegija

Uvod u analizu velikih skupova podataka. Pronalaženje sličnih entiteta. Analiza tokova podataka. Analiza poveznica u podacima predstavljenim grafovima. Pronalaženje čestih skupova. Pronalaženje grupa u velikim skupovima podataka. Sustavi za preporuke. Analiza grafova društvenih mreža. Modeli oglašavanja na webu. Reduciranje dimenzionalnosti. Strojno učenje sa svojstvom razmjernog rasta.

Preduvjeti

programiranje, algoritmi i strukture podataka, osnove teorije vjerojatnosti, osnove linearne algebre

Studijski programi

Sveučilišni diplomski
Izborni kolegiji (2. semestar)
Izborni kolegiji (2. semestar)
Izborni kolegiji (2. semestar)
Izborni kolegiji (2. semestar)
Izborni kolegiji (2. semestar)
Izborni kolegiji (2. semestar)
Izborni kolegiji (2. semestar)
Izborni kolegiji (2. semestar)
Jezgreni kolegiji profila (2. semestar)
Izborni kolegiji (2. semestar)
Jezgreni kolegiji profila (2. semestar)
Izborni kolegiji (2. semestar)
Izborni kolegiji (2. semestar)
Izborni kolegiji profila (2. semestar)
[FER2-HR] Računarska znanost - profil
Predmeti specijalizacije profila (2. semestar)

Ishodi učenja

  1. prepoznati i razumjeti zašto neki problem pripada u kategoriju velikih podataka
  2. primijeniti programskih model MapReduce prilikom susretanja s određenim tipovima problema
  3. dizajnirati i vrednovati sustav za pronalaženje sličnih entiteta u velikim skupu podataka
  4. dizajnirati i vrednovati sustav za pronalaženje čestih skupova u velikom skupu podataka
  5. dizajnirati i vrednovati sustav za rangiranje čvorova vrlo velikom skupu podataka predočenom grafom
  6. dizajnirati i vrednovati sustav za preporučivanje
  7. primijeniti odgovarajuće algoritme s ciljem pronalaženja grupa u velikom skupu padataka
  8. primijeniti odgovarajuće algoritme za obradu tokova podataka

Oblici nastave

Predavanja

Predavanja popraćena PowerPoint projekcijom s prikazom teorijskih načela.

Auditorne vježbe

Objašnjavanje popratnih primjera i rješavanje zadataka za vrijeme predavanja.

Seminari

Programsko ostvarenje odabranih metoda analize velikih skupova podataka. Studenti samostalno programski ostvaruju laboratorijski zadatak i putem web-aplikacije predaju rješenja na automatizirano ocjenjivanje.

Način ocjenjivanja

Kontinuirana nastava Ispitni rok
Vrsta provjere Prag Udio u ocjeni Prag Udio u ocjeni
Laboratorijske vježbe 50 % 30 % 50 % 0 %
Sudjelovanje u nastavi 0 % 10 % 0 % 0 %
Međuispit: Pismeni 50 % 30 % 0 %
Završni ispit: Pismeni 50 % 30 %
Ispit: Pismeni 50 % 100 %
Ispit: Usmeni 100 %

Tjedni plan nastave

  1. (en) Locality-sensitive hashing (LSH), minhash and simhash algorithms
  2. (en) Locality-sensitive hashing (LSH), minhash and simhash algorithms
  3. (en) Graph mining
  4. (en) Web search (PageRank and HITS)
  5. Dubinska analiza podataka pomoću programskog modela Map-Reduce , (en) Feature selection (filter methods, subset selection, wrapper method)
  6. (en) Data stream mining
  7. (en) Data stream mining
  8. Međuispit
  9. (en) Time series and sequences mining
  10. (en) Collaborative filtering and recommender engines
  11. (en) Clustering algorithms for large datasets (BFR, CURE)
  12. (en) Sampling, filtering and estimating data stream moments
  13. (en) Large-scale algorithms for mining frequent item sets (Apriori, PCY, SON)
  14. (en) Detecting communities in large graphs (Girvan-Newman, Affiliation-Graph Model)
  15. Završni ispit

Literatura

(.), Jure Leskovec, Anand Rajaraman, Jeffrey David Ullman (2014.), Mining of Massive Datasets, Cambridge University Press,
(.), Michael Manoochehri (2013.), Data Just Right, Addison-Wesley,
(.), Jiawei Han, Jian Pei, Micheline Kamber (2011.), Data Mining: Concepts and Techniques, Elsevier,

Izvedba

ID 284075
  Ljetni semestar
5 ECTS
R1 E-učenje
45 Predavanja
0 Seminar
0 Auditorne vježbe
15 Laboratorijske vježbe
0 Konstrukcijske vježbe
0 Vježbe tjelesnog odgoja

Ocjenjivanje

88 izvrstan
75 vrlo dobar
63 dobar
50 dovoljan