Uvod u znanost o podacima

Ishodi učenja

  1. Koristiti Python i druge alate za prikupljanje, čišćenje i procesiranje podataka
  2. Koristiti tehnike upravljanja podataka za spremanje podataka lokalno i u oblak
  3. Koristiti statističke metode i vizualizaciju za brzo istraživanje podataka
  4. Primijeniti statistiku i računalnu analizu za predviđanje temeljeno na podacima
  5. Opisati rezultate analize podataka koristeći deskriptivnu statistiku i vizualizacije
  6. Koristiti grozd računala i infrastrukturu u oblaku za obavljanje podatkovno-intenzivnih računanja

Oblici nastave

Predavanja

Laboratorij

Tjedni plan nastave

  1. Prikupljanje podataka
  2. Preoblikovanje podataka, Čišćenje podataka
  3. Pregled istraživačke analize podataka (umjesto: Istraživanje analitičkih podataka)
  4. Analiza glavnih komponenata
  5. Regresija najmanjih kvadrata. procjena najveće izlgednosti za regresiju
  6. Logistička regresija
  7. Primijenjeno strojno učenje (prediktivna analiza; klasifikacija i predviđanje)
  8. Međuispit
  9. Primijenjeno strojno učenje (prediktivna analiza; klasifikacija i predviđanje)
  10. Primijenjeno strojno učenje (prediktivna analiza; klasifikacija i predviđanje)
  11. Bagging i boosting
  12. Klasifikacija metoda ponovnog uzorkovanja: randomizacija (egzaktna i aproksimativna). Jackknife. Bootstrap. Kros-validacija
  13. Dubinska analiza podataka pomoću programskog modela Map-Reduce 
  14. Bayesijansko zaključivanje naspram frekvencijskog zaključivanja, Bayesovsko zaključivanje (procjena, predviđanje, usporedba modela)
  15. Završni ispit

Studijski programi

Sveučilišni preddiplomski
Elektrotehnika i informacijska tehnologija (studij)
Izborni predmeti (5. semestar)
Računarstvo (studij)
Izborni predmeti (5. semestar)

Literatura

(.), Jake VanderPlas, Python Data Science Handbook, O'Reilly Media, 2016.,

Izvedba

ID 183455
  Zimski semestar
5 ECTS
R3 Engleski jezik
R1 E-učenje
39 Predavanja
0 Auditorne vježbe
12 Laboratorijske vježbe
0 Konstrukcijske vježbe