Popis predmeta

Opis predmeta

Ovaj predmet upoznaje studente s pet ključnih aspekata istraživanja temeljenog na podatcima: (i) prilagođavanje formata podataka, čišćenja podataka i uzorkovanje u cilju dobivanja odgovarajućeg skupa podataka, (ii) upravljanje podacima radi brzog i pouzdanog pristupa velikoj količini podataka, (iii) eksploratorna analiza podataka u cilju generiranja hipoteze i intuicije, (iv) predviđanje temeljeno na statističkim metodama kao što su regresija i klasifikacija, (v) komuniciranje rezultata kroz vizualizaciju, opis i sažetu interpretaciju rezultata.

Ishodi učenja

  1. Koristiti Python i druge alate za prikupljanje, čišćenje i procesiranje podataka
  2. Koristiti tehnike upravljanja podataka za spremanje podataka lokalno i u oblak
  3. Koristiti statističke metode i vizualizaciju za brzo istraživanje podataka
  4. Primijeniti statistiku i računalnu analizu za predviđanje temeljeno na podacima
  5. Opisati rezultate analize podataka koristeći deskriptivnu statistiku i vizualizacije
  6. Koristiti grozd računala i infrastrukturu u oblaku za obavljanje podatkovno-intenzivnih računanja

Oblici nastave

Predavanja

Predavanja i primjeri u jupyter notebooku

Laboratorij

pomoć oko projekata

Način ocjenjivanja

Kontinuirana nastava Ispitni rok
Vrsta provjere Prag Udio u ocjeni Prag Udio u ocjeni
Seminar/Projekt 25 % 40 % 25 % 40 %
Završni ispit: Pismeni 50 % 60 %
Napomena / komentar

završni ispit, analiza podataka na računalu

Tjedni plan nastave

  1. Administracija predmeta. Pregled područja znanosti o podacima. Potporne tehnologije za znanost o podacima.
  2. Rukovanje podacima: prikupljanje podataka, modeli podataka, česti problemi skupova podataka, preoblikovanje podataka, čišćenje podataka. Laboratorij: rukovanje podacima u Pythonu.
  3. Vizualizacija podataka: različiti grafički prikazi skupa podataka, najbolja praksa primjene vizualizacije, vizualizacija za posebne namjene, alati za vizualizaciju. Laboratorij: vizualizacija podataka u Pythonu.
  4. Testiranje hipoteze. Interval pouzdanosti. Odnos dvije varijable.
  5. Primjena linearne regresije u deskriptivnoj analizi podataka. Transformacije podataka. Pretpostavke linearne regresije.
  6. Prikupljanje podataka promatranjem.
  7. Primijenjeno nadzirano strojno učenje (klasifikacija i predviđanje).
  8. --
  9. Primijenjeno strojno učenje (prikupljanje podataka, obilježavanje, diskretizacija, značajke, normalizacija, model selection, mjere, procjena modela).
  10. Primijenjeno nenadzirano strojno učenje (grupiranje).
  11. Rad s tekstom.
  12. Rad s tekstom.
  13. Rad s grafovima i mrežama.
  14. Prezentacije projekata.
  15. Završni ispit.

Studijski programi

Sveučilišni preddiplomski
Elektrotehnika i informacijska tehnologija (studij)
Izborni predmeti (5. semestar)
Računarstvo (studij)
Izborni predmeti (5. semestar)
Sveučilišni diplomski
Audiotehnologije i elektroakustika (profil)
Slobodni izborni predmeti (1. semestar) (3. semestar)
Automatika i robotika (profil)
Slobodni izborni predmeti (1. semestar) (3. semestar)
Elektroenergetika (profil)
Slobodni izborni predmeti (1. semestar) (3. semestar)
Elektroničko i računalno inženjerstvo (profil)
Izborni predmeti profila (1. semestar) (3. semestar)
Elektronika (profil)
Slobodni izborni predmeti (1. semestar) (3. semestar)
Elektrostrojarstvo i automatizacija (profil)
Slobodni izborni predmeti (1. semestar) (3. semestar)
Informacijsko i komunikacijsko inženjerstvo (profil)
Izborni predmeti profila (1. semestar) (3. semestar)
Komunikacijske i svemirske tehnologije (profil)
Slobodni izborni predmeti (1. semestar) (3. semestar)
Programsko inženjerstvo i informacijski sustavi (profil)
Izborni predmet profila (1. semestar) (3. semestar)
Računalno inženjerstvo (profil)
Izborni predmet profila (1. semestar)
Računalno modeliranje u inženjerstvu (profil)
Slobodni izborni predmeti (1. semestar) (3. semestar)
Računarska znanost (profil)
Slobodni izborni predmeti (3. semestar) Slobodni zborni predmeti (1. semestar)
Znanost o mrežama (profil)
Slobodni izborni predmeti (1. semestar) (3. semestar)
Znanost o podacima (profil)
Jezgreni predmeti profila (1. semestar)

Literatura

Jacob T. Vanderplas, Jake VanderPlas (2016.), Python Data Science Handbook, O'Reilly Media
Matt Harrison, Theodore Petrou (2020.), Pandas 1.x Cookbook, Packt Publishing Ltd
Alice Zheng, Amanda Casari (2018.), Feature Engineering for Machine Learning, "O'Reilly Media, Inc."

Za studente

Izvedba

ID 183455
  Zimski semestar
5 ECTS
R3 Engleski jezik
R1 E-učenje
45 Predavanja
12 Laboratorijske vježbe

Ocjenjivanje

88 izvrstan
75 vrlo dobar
63 dobar
50 dovoljan

Ishodi učenja

  1. Koristiti Python i druge alate za prikupljanje, čišćenje i procesiranje podataka
  2. Koristiti tehnike upravljanja podataka za spremanje podataka lokalno i u oblak
  3. Koristiti statističke metode i vizualizaciju za brzo istraživanje podataka
  4. Primijeniti statistiku i računalnu analizu za predviđanje temeljeno na podacima
  5. Opisati rezultate analize podataka koristeći deskriptivnu statistiku i vizualizacije
  6. Koristiti grozd računala i infrastrukturu u oblaku za obavljanje podatkovno-intenzivnih računanja

Oblici nastave

Predavanja

Predavanja i primjeri u jupyter notebooku

Laboratorij

pomoć oko projekata

Način ocjenjivanja

Kontinuirana nastava Ispitni rok
Vrsta provjere Prag Udio u ocjeni Prag Udio u ocjeni
Seminar/Projekt 25 % 40 % 25 % 40 %
Završni ispit: Pismeni 50 % 60 %
Napomena / komentar

završni ispit, analiza podataka na računalu

Tjedni plan nastave

  1. Administracija predmeta. Pregled područja znanosti o podacima. Potporne tehnologije za znanost o podacima.
  2. Rukovanje podacima: prikupljanje podataka, modeli podataka, česti problemi skupova podataka, preoblikovanje podataka, čišćenje podataka. Laboratorij: rukovanje podacima u Pythonu.
  3. Vizualizacija podataka: različiti grafički prikazi skupa podataka, najbolja praksa primjene vizualizacije, vizualizacija za posebne namjene, alati za vizualizaciju. Laboratorij: vizualizacija podataka u Pythonu.
  4. Testiranje hipoteze. Interval pouzdanosti. Odnos dvije varijable.
  5. Primjena linearne regresije u deskriptivnoj analizi podataka. Transformacije podataka. Pretpostavke linearne regresije.
  6. Prikupljanje podataka promatranjem.
  7. Primijenjeno nadzirano strojno učenje (klasifikacija i predviđanje).
  8. --
  9. Primijenjeno strojno učenje (prikupljanje podataka, obilježavanje, diskretizacija, značajke, normalizacija, model selection, mjere, procjena modela).
  10. Primijenjeno nenadzirano strojno učenje (grupiranje).
  11. Rad s tekstom.
  12. Rad s tekstom.
  13. Rad s grafovima i mrežama.
  14. Prezentacije projekata.
  15. Završni ispit.

Studijski programi

Sveučilišni preddiplomski
Elektrotehnika i informacijska tehnologija (studij)
Izborni predmeti (5. semestar)
Računarstvo (studij)
Izborni predmeti (5. semestar)
Sveučilišni diplomski
Audiotehnologije i elektroakustika (profil)
Slobodni izborni predmeti (1. semestar) (3. semestar)
Automatika i robotika (profil)
Slobodni izborni predmeti (1. semestar) (3. semestar)
Elektroenergetika (profil)
Slobodni izborni predmeti (1. semestar) (3. semestar)
Elektroničko i računalno inženjerstvo (profil)
Izborni predmeti profila (1. semestar) (3. semestar)
Elektronika (profil)
Slobodni izborni predmeti (1. semestar) (3. semestar)
Elektrostrojarstvo i automatizacija (profil)
Slobodni izborni predmeti (1. semestar) (3. semestar)
Informacijsko i komunikacijsko inženjerstvo (profil)
Izborni predmeti profila (1. semestar) (3. semestar)
Komunikacijske i svemirske tehnologije (profil)
Slobodni izborni predmeti (1. semestar) (3. semestar)
Programsko inženjerstvo i informacijski sustavi (profil)
Izborni predmet profila (1. semestar) (3. semestar)
Računalno inženjerstvo (profil)
Izborni predmet profila (1. semestar)
Računalno modeliranje u inženjerstvu (profil)
Slobodni izborni predmeti (1. semestar) (3. semestar)
Računarska znanost (profil)
Slobodni izborni predmeti (3. semestar) Slobodni zborni predmeti (1. semestar)
Znanost o mrežama (profil)
Slobodni izborni predmeti (1. semestar) (3. semestar)
Znanost o podacima (profil)
Jezgreni predmeti profila (1. semestar)

Literatura

Jacob T. Vanderplas, Jake VanderPlas (2016.), Python Data Science Handbook, O'Reilly Media
Matt Harrison, Theodore Petrou (2020.), Pandas 1.x Cookbook, Packt Publishing Ltd
Alice Zheng, Amanda Casari (2018.), Feature Engineering for Machine Learning, "O'Reilly Media, Inc."

Za studente

Izvedba

ID 183455
  Zimski semestar
5 ECTS
R3 Engleski jezik
R1 E-učenje
45 Predavanja
12 Laboratorijske vježbe

Ocjenjivanje

88 izvrstan
75 vrlo dobar
63 dobar
50 dovoljan