Upravljanje velikim prostornim i prostorno-vremenskim podatcima

Opis predmeta

Uvod. Sustavi i programski okviri za upravljanje velikim podatcima i tokovima podataka. Lambda i Kappa arhitekture za velike podatke. Osnovna načela i odlike velikih prostornih i prostorno-vremenskih podataka. Modeliranje prostornih i prostorno-vremenskih tipova podataka. Specifikacija relevantnih operacija na prostornim i prostorno-vremenskim tipovima podataka. Indeksiranje. Globalni i lokalni indeksi. Statični i dinamički indeksi. Geo-raspršeni indeksi. Prostorno-vremenski tokovi podataka. SQL-utemeljena analiza prostorno-vremenskih tokova podataka u okviru integriranih platformi za velike podatke. Implementacija tipova podataka i operacija u objektno-funkcijskim programskim jezicima i platformama s raspodijeljenim protokom podataka. Implementacija uporabom aplikacijskih programskih sučelja integriranih platformi za raspodijeljenu obradu statičnih podataka i tokova podataka. Razvoj korisnički definiranih funkcija. Specifikacija prostornih i prostorno-vremenskih upita u SQL-sličnim upitnim jezicima. Dubinska analiza velikih prostorno-vremenskih podataka.

Ishodi učenja

  1. Identificirati temeljna obilježja prostornih i prostorno-vremenskih velikih podataka
  2. Identificirati temeljna obilježja prostorno-vremenskih tokova podataka
  3. Dizajnirati i implementirati prostorne i prostorno-vremenske tipove podataka u objektno-funkcijskim programskim jezicima i platformama s raspodijeljenim protokom podataka
  4. Razviti jednostavne algoritme za upravljanje prostorno-vremenskim velikim podacima
  5. Razviti jednostavne algoritme za upravljanje prostorno-vremenskim tokovima podataka
  6. Razviti prostorne i prostorne-vremenske upite uporabom SQL-sličnim izrazima
  7. Razviti jednostavne algoritme za dubinsku analizu i otkrivanje prostorno-vremenskog znanja.
  8. Odabrati tehnologije za upravljanje velikim podacima u prostorno-vremenskoj aplikacijskoj domeni

Oblici nastave

Predavanja

Teorijska osnova s primjerima.

Ostali oblici skupnog ili samostalnog učenja

Studenti su podijeljeni u grupe (2 studenta). Svakoj je grupi dodijeljen skup podataka. Izradom projekta koristeći dodijeljeni skup podataka, studenti demonstriraju relevantna praktična znanja i primjenu savladanih teoretskih koncepata iz područja upravljanja velikim prostornim i prostorno-vremenskim podacima.

Način ocjenjivanja

Kontinuirana nastava Ispitni rok
Vrsta provjere Prag Udio u ocjeni Prag Udio u ocjeni
Sudjelovanje u nastavi 0 % 5 % 0 % 5 %
Seminar/Projekt 20 % 45 % 20 % 40 %
Prisutnost 5 % 10 % 0 % 5 %
Međuispit: Pismeni 0 % 20 % 0 %
Završni ispit: Pismeni 0 % 20 %
Ispit: Pismeni 0 % 50 %
Ispit: Usmeni 50 %

Tjedni plan nastave

  1. Uvod. Sustavi i programski okviri za upravljanje velikim podacima i tokovima podataka. Lambda i Kappa arhitekture za velike podatke.
  2. Osnovna načela i odlike velikih prostornih i prostorno-vremenskih podataka. Modeliranje prostornih i prostorno-vremenskih tipova podataka.
  3. Specifikacija relevantnih operacija na prostornim i prostorno-vremenskim tipovima podataka.
  4. Implementacija tipova podataka i operacija u objektno-funkcijskim programskim jezicima i platformama s raspodijeljenim protokom podataka.
  5. Razvoj korisnički definiranih funkcija. Specifikacija prostornih i prostorno-vremenskih upita u SQL-sličnim upitnim jezicima.
  6. Prostorni i prostorno-vremenski upiti u SQL-sličnim izrazima integriranih platformi za velike podatke.
  7. Indeksiranje. Globalni i lokalni indeksi. Statični i dinamički indeksi. Geo-raspršeno indeksiranje.
  8. Međuispit
  9. Međuispit
  10. Prostorno-vremenski tokovi podataka.
  11. Upravljanje i obrada prostorno-vremenskih tokova podataka uporabom objektno-funkcijskih programskih jezika na platformama s raspodijeljenim protokom podataka.
  12. SQL-utemeljena analiza prostorno-vremenskih tokova podataka u okviru integriranih platformi za velike podatke.
  13. Dubinska analiza velikih prostorno-vremenskih podataka u okviru integriranih platformi za velike podatke.
  14. Dubinska analiza prostorno-vremenskih tokova podataka u okviru integriranih platformi za velike podatke.
  15. Završni ispit

Studijski programi

Sveučilišni diplomski
[FER2-HR] Programsko inženjerstvo i informacijski sustavi - profil
Predmeti specijalizacije profila (1. semestar) (3. semestar)

Literatura

Zdravko Galic (2016.), Spatio-Temporal Data Streams, Springer
Nikos Pelekis, Yannis Theodoridis (2014.), Mobility Data Management and Exploration, Springer
Nathan Marz, James Warren (2015.), Big Data: Principles and Best Practices of Scalable Realtime Data Systems, Manning Publications Company
Fabian Hueske, Vasiliki Kalavri (2018.), Stream Processing with Apache Flink: Fundamentals, Implementation, and Operation of Streaming Applications, O'Reilly Media
Edward Capriolo, Dean Wampler, Jason Rutherglen (2012.), Programming Hive, "O'Reilly Media, Inc."
Sandy Ryza, Uri Laserson, Sean Owen, Josh Wills (2015.), Advanced Analytics with Spark, "O'Reilly Media, Inc."

Predavanja

Za studente

Izvedba

ID 155248
  Zimski semestar
4 ECTS
R2 Engleski jezik
R1 E-učenje

Ocjenjivanje

90 izvrstan
75 vrlo dobar
65 dobar
55 dovoljan