Raspodijeljena obrada velike količine podataka
Opis predmeta
Primarni cilj kolegija je osposobiti studente za samostalnu provedbu raspodijeljene obrade velike količine podataka korištenjem suvremenih tehnologija otvorenog koda kao što su Apache Hadoop, Apache Lucene, Apache Mahout i Apache Spark.
U prvom dijelu, kolegij je fokusiran na programski model map-reduce i njegove različite oblikovne obrasce te različite načine raspodijeljene pohrane velike količine podataka. Nakon toga se na kolegiju primjenjuju prethodno naučeni koncepti na sustave za preporučivanje, obradu tokova podataka u stvarnom vremenu, učinkovito pretraživanje velikih tekstualnih kolekcija te analizu poveznica i društvenih mreža.
Ishodi učenja
- identificirati obilježja velikih podataka
- usporediti raspodijeljene algoritme za obradu velike količine podataka
- razviti jednostavne algoritme za raspodijeljenu obradu velike količine podataka
- primijeniti tehnologije otvorenog koda za raspodijeljenu obradu i pohranu velike količine podataka
- razviti raspodijeljeni sustav za preporučivanje
- razviti sustav za raspodijeljenu obradu toka podataka
- analizirati velike mreže
Oblici nastave
Predavanja
Na predavanjima će se obrađivati teorijski aspekti raspodijeljene pohrane i obrade velike količine podataka, uz diskusiju kroz različite primjere i podatkovne skupove.
Provjere znanjaOdržava se međuispit u 8. tjednu nastave i završni ispit u 15 tjednu nastave.
Laboratorijske vježbeNa laboratorijskim vježbama će se rješavati kratki praktični zadaci u programskom jeziku Java s primjenom tehnologija otvorenog koda (Apache Hadoop, Apache Lucene, Apache Mahout, Apache Spark) i diskutirati će se o njihovim rješenjima.
Način ocjenjivanja
Kontinuirana nastava | Ispitni rok | |||||
---|---|---|---|---|---|---|
Vrsta provjere | Prag | Udio u ocjeni | Prag | Udio u ocjeni | ||
Laboratorijske vježbe | 0 % | 40 % | 0 % | 40 % | ||
Domaće zadaće | 0 % | 10 % | 0 % | 10 % | ||
Prisutnost | 0 % | 10 % | 0 % | 10 % | ||
Međuispit: Pismeni | 0 % | 20 % | 0 % | |||
Završni ispit: Pismeni | 0 % | 20 % | ||||
Ispit: Pismeni | 50 % | 40 % |
Tjedni plan nastave
- Uvod u raspodijeljenu obradu velike količine podataka.
- Raspodijeljena pohrana velike količine podataka. Raspodijeljeni datotečni sustavi.
- Programski model Map-reduce.
- Osnovni oblikovni obrasci u programskom modelu map-reduce.
- Napredni oblikovni obrasci u programskom modelu map-reduce.
- Raspodijeljena pohrana velike količine strukturiranih podataka.
- Sustavi za preporučivanje objekata u raspodijeljenom okruženju.
- 1. međuispit
- 1. međuispit
- Obrada tokova podataka u stvarnom vremenu.
- Obrada tokova podataka u stvarnom vremenu. (2)
- Učinkovito pretraživanje velikih tekstualnih kolekcija.
- Učinkovito pretraživanje velikih tekstualnih kolekcija. (2)
- Analiza poveznica i velikih mreža.
- Raspodijeljena analiza društvenih mreža.
Studijski programi
Sveučilišni diplomski
[FER2-HR] Programsko inženjerstvo i informacijski sustavi - profil
Predmeti specijalizacije profila
(2. semestar)
[FER2-HR] Računarska znanost - profil
Predmeti specijalizacije profila
(2. semestar)
Za upis predmeta treba položiti predmete
Literatura
Za studente
Izvedba
ID 147660
Ljetni semestar
4 ECTS
R0 Engleski jezik
R1 E-učenje
Ocjenjivanje
85 izvrstan
75 vrlo dobar
65 dobar
55 dovoljan