Raspodijeljena obrada velike količine podataka
Prikazani su podaci za akademsku godinu: 2022./2023.
Opis predmeta
Primarni cilj kolegija je osposobiti studente za samostalnu provedbu raspodijeljene obrade velike količine podataka korištenjem suvremenih tehnologija otvorenog koda kao što su Apache Hadoop, Apache Lucene, Apache Mahout i Apache Spark.
U prvom dijelu, kolegij je fokusiran na programski model map-reduce i njegove različite oblikovne obrasce te različite načine raspodijeljene pohrane velike količine podataka. Nakon toga se na kolegiju primjenjuju prethodno naučeni koncepti na sustave za preporučivanje, obradu tokova podataka u stvarnom vremenu, učinkovito pretraživanje velikih tekstualnih kolekcija te analizu poveznica i društvenih mreža.
Studijski programi
Sveučilišni diplomski
[FER2-HR] Programsko inženjerstvo i informacijski sustavi - profil
Predmeti specijalizacije profila
(2. semestar)
[FER2-HR] Računarska znanost - profil
Predmeti specijalizacije profila
(2. semestar)
Ishodi učenja
- identificirati obilježja velikih podataka
- usporediti raspodijeljene algoritme za obradu velike količine podataka
- razviti jednostavne algoritme za raspodijeljenu obradu velike količine podataka
- primijeniti tehnologije otvorenog koda za raspodijeljenu obradu i pohranu velike količine podataka
- razviti raspodijeljeni sustav za preporučivanje
- razviti sustav za raspodijeljenu obradu toka podataka
- analizirati velike mreže
Oblici nastave
Predavanja
Na predavanjima će se obrađivati teorijski aspekti raspodijeljene pohrane i obrade velike količine podataka, uz diskusiju kroz različite primjere i podatkovne skupove.
Provjere znanjaOdržava se međuispit u 8. tjednu nastave i završni ispit u 15 tjednu nastave.
Laboratorijske vježbeNa laboratorijskim vježbama će se rješavati kratki praktični zadaci u programskom jeziku Java s primjenom tehnologija otvorenog koda (Apache Hadoop, Apache Lucene, Apache Mahout, Apache Spark) i diskutirati će se o njihovim rješenjima.
Način ocjenjivanja
Kontinuirana nastava | Ispitni rok | |||||
---|---|---|---|---|---|---|
Vrsta provjere | Prag | Udio u ocjeni | Prag | Udio u ocjeni | ||
Laboratorijske vježbe | 0 % | 40 % | 0 % | 40 % | ||
Domaće zadaće | 0 % | 10 % | 0 % | 10 % | ||
Prisutnost | 0 % | 10 % | 0 % | 10 % | ||
Međuispit: Pismeni | 0 % | 20 % | 0 % | |||
Završni ispit: Pismeni | 0 % | 20 % | ||||
Ispit: Pismeni | 50 % | 40 % |
Tjedni plan nastave
- Uvod u raspodijeljenu obradu velike količine podataka.
- Raspodijeljena pohrana velike količine podataka. Raspodijeljeni datotečni sustavi.
- Programski model Map-reduce.
- Osnovni oblikovni obrasci u programskom modelu map-reduce.
- Napredni oblikovni obrasci u programskom modelu map-reduce.
- Raspodijeljena pohrana velike količine strukturiranih podataka.
- Sustavi za preporučivanje objekata u raspodijeljenom okruženju.
- 1. međuispit
- 1. međuispit
- Obrada tokova podataka u stvarnom vremenu.
- Obrada tokova podataka u stvarnom vremenu. (2)
- Učinkovito pretraživanje velikih tekstualnih kolekcija.
- Učinkovito pretraživanje velikih tekstualnih kolekcija. (2)
- Analiza poveznica i velikih mreža.
- Raspodijeljena analiza društvenih mreža.
Za upis predmeta treba položiti predmete
Literatura
Za studente
Izvedba
ID 147660
Ljetni semestar
4 ECTS
R0 Engleski jezik
R1 E-učenje
Ocjenjivanje
85 izvrstan
75 vrlo dobar
65 dobar
55 dovoljan