Uvod u znanost o podacima
Prikazani su podaci za akademsku godinu: 2025./2026.
Predavanja
Auditorne vježbe
Liljana Puškar
univ. mag. ing. comp.
Laboratorijske vježbe
Liljana Puškar
univ. mag. ing. comp.
Opis kolegija
Ovaj predmet upoznaje studente s pet ključnih aspekata istraživanja temeljenog na podatcima dobivenih opažanjem: (i) prilagođavanje formata podataka, čišćenja podataka i uzorkovanje u cilju dobivanja odgovarajućeg skupa podataka, (ii) upravljanje podacima radi brzog i pouzdanog pristupa podacima, (iii) eksploratorna analiza podataka u cilju generiranja hipoteze i intuicije, (iv) predviđanje temeljeno na statističkim metodama kao što su regresija i klasifikacija, (v) komuniciranje rezultata kroz vizualizaciju, opis i sažetu interpretaciju rezultata.
Preduvjeti
-
Studijski programi
Sveučilišni diplomski
Izborni kolegiji (1. semestar) (3. semestar)[FER3-HR] Automatika i robotika - profil
Izborni kolegiji
(1. semestar)
(3. semestar)
[FER3-HR] Biomedicinsko inženjerstvo - studij
(3. semestar)
[FER3-HR] Elektroenergetika - profil
Izborni kolegiji
(1. semestar)
(3. semestar)
Izborni kolegiji
(1. semestar)
(3. semestar)
Izborni kolegiji profila
(1. semestar)
(3. semestar)
[FER3-HR] Elektronika - profil
Izborni kolegiji
(1. semestar)
(3. semestar)
Izborni kolegiji
(1. semestar)
(3. semestar)
Izborni kolegiji
(1. semestar)
(3. semestar)
Izborni kolegiji profila
(1. semestar)
(3. semestar)
Izborni kolegiji
(1. semestar)
(3. semestar)
Izborni kolegiji
(1. semestar)
(3. semestar)
Izborni kolegiji profila
(1. semestar)
(3. semestar)
[FER3-HR] Računalno inženjerstvo - profil
Izborni kolegiji
(1. semestar)
Izborni kolegiji profila
(1. semestar)
[FER3-HR] Računarska znanost - profil
Izborni kolegiji
(1. semestar)
(3. semestar)
[FER3-HR] Znanost o mrežama - profil
Izborni kolegiji
(1. semestar)
(3. semestar)
[FER3-HR] Znanost o podacima - profil
(1. semestar)
Ishodi učenja
- Koristiti Python i druge alate za prikupljanje, čišćenje i procesiranje podataka
- Koristiti tehnike upravljanja podataka za spremanje podataka lokalno i u oblak
- Koristiti statističke metode i vizualizaciju za brzo istraživanje podataka
- Primijeniti statistiku i računalnu analizu za predviđanje temeljeno na podacima
- Opisati rezultate analize podataka koristeći deskriptivnu statistiku i vizualizacije
- Koristiti grozd računala i infrastrukturu u oblaku za obavljanje podatkovno-intenzivnih računanja
Oblici nastave
Predavanja
Predavanja - teorija
Auditorne vježbePrimjeri u jupyter notebooku
LaboratorijProjektno organiziran - studenti rade na projektu iz znanosti o podacima
Način ocjenjivanja
| Kontinuirana nastava | Ispitni rok | |||||
|---|---|---|---|---|---|---|
| Vrsta provjere | Prag | Udio u ocjeni | Prag | Udio u ocjeni | ||
| Seminar/Projekt | 25 % | 40 % | 25 % | 40 % | ||
| Završni ispit: Pismeni | 50 % | 60 % | ||||
Napomena / komentar
završni ispit, analiza podataka na računalu
Tjedni plan nastave
- Administracija predmeta. Pregled područja znanosti o podacima. Potporne tehnologije za znanost o podacima. Auditorne vježbe: uvod u Pandas.
- Rukovanje podacima dobivenih opažanjem: prikupljanje podataka, modeli podataka, česti problemi skupova podataka, preoblikovanje podataka, čišćenje podataka. Auditorne vježbe: rukovanje podacima i inženjerstvo značajki u Pythonu. Projekt: proučavanje predloženih međudisciplinarnih znanstvenih članaka.
- Vizualizacija podataka: različiti grafički prikazi skupa podataka, najbolja praksa primjene vizualizacije, vizualizacija za posebne namjene, alati za vizualizaciju. Auditorne vježbe: vizualizacija podataka u Pythonu. Projekt: proučavanje znanstvenih članaka, odabir članka za replikaciju rezultata.
- Prvi pogled na podatke: deskriptivna i inferencijalna statistika. Auditorne vježbe: deskriptivna statistika u Pythonu. Projekt: konzultacije s asistentom oko odabranog znanstvenog članka.
- Označavanje podataka i metrike. Auditorne vježbe: označavanje podataka i metrike. Projekt: rad na replikaciji rezultata.
- Prikupljanje podataka istraživanjem: vrste istraživanja i metode prikupljanja podataka. Projekt: rad na replikaciji rezultata.
- Primjena linearne regresije u deskriptivnoj analizi podataka. Transformacije podataka. Pretpostavke linearne regresije. Auditorne vježbe: uvod u regresijsku analizu. Projekt: rad na replikaciji rezultata.
- --
- Primijenjeno nadzirano strojno učenje: klasifikacija i predviđanje. Auditorne vježbe: primijenjeno nadzirano strojno učenje u Pythonu. Projekt: završetak rada na replikaciji rezultata.
- Primijenjeno nenadzirano strojno učenje: grupiranje. Auditorne vježbe: primijenjeno nenadzirano strojno učenje u Pythonu. Projekt: formiranje tima za poboljšanje rezultata znanstvenog članka, konzultacije s asistentom.
- Uvod u duboko učenje (neuronske mreže, funkcija gubitka, invarijanca i ekvivarijanca, konvolucijske mreže, povratne mreže). Auditorne vježbe: duboko učenje u Pythonu. Projekt: timski rad na poboljšanju rezultata.
- Rad s tekstom (tekstni podaci, vektori značajki, vreća riječi, tokenizacija, stop riječi, n-grami, TF/IDF, pozornost). Auditorne vježbe: rad s tekstnim podacima u Pythonu. Projekt: timski rad na poboljšanju rezultata.
- Rad s grafovima i mrežama (čvorovi i veze, usmjereni i neusmjereni grafovi, mjere centralnosti, konvolucijske mreže na grafovima). Auditorne vježbe: rad s grafovima u Pythonu. Projekt: timski rad na poboljšanju rezultata.
- Prezentacije projekata
- Završni ispit.
Literatura
Izvedba
ID 240719
Zimski semestar
5 ECTS
R1 E-učenje
45 Predavanja
0 Seminar
15 Auditorne vježbe
15 Laboratorijske vježbe
0 Konstrukcijske vježbe
0 Vježbe tjelesnog odgoja
Ocjenjivanje
88 izvrstan
75 vrlo dobar
63 dobar
50 dovoljan
Pristupačnost