Data Mining

Opis predmeta

Dubinska analiza podataka – definicija i područja primjene. Vrste podataka. Izvori podataka i njihovo prikupljanje. Predobrada podataka – rukovanje podacima, filtriranje podataka, transformacije podataka. Nebalansirani skupovi podataka. Algoritmi strojnog učenja za obradu podataka: postupci odabira značajki, klasifikacijski postupci, postupci grupiranja, asocijativna pravila. Modeli s jasnim tumačenjem zasnovani na induktivnim pravilima. Učenje i vrednovanja modela. Analiza vremenskih nizova podataka. Duboko učenje u dubinskoj analizi podataka. Specifičnosti dubinske analize podataka u različitim područjima primjene. Korištenje slobodno dostupnih alata za dubinsku analizu podataka. Projekt iz dubinske analize podataka.

Ishodi učenja

  1. identificirati sve potencijalne nedostatke analiziranog skupa podataka
  2. ocijeniti prikladnost korištenog niza metoda strojnog učenja u različitim područjima primjene
  3. kombinirati postupke odabira značajki na zadanom problemu
  4. analizirati zadani skup podataka koristeći prikladni niz metoda strojnog učenja u barem jednom postojećem programskom alatu
  5. razviti vlastitu programsku potporu za analizu određenog skupa podataka
  6. klasificirati tehnike strojnog učenja prema tipu problema koji rješavaju
  7. analizirati vremenske nizove podataka iz različitih domena tehnikama prediktivne analitike
  8. kreirati objašnjive modele strojnog učenja kako bi se olakšalo donošenje odluke u određenoj domeni

Oblici nastave

Predavanja

Uživo ili online

Samostalni zadaci

Projekt iz dubinske analize podataka

Način ocjenjivanja

Kontinuirana nastava Ispitni rok
Vrsta provjere Prag Udio u ocjeni Prag Udio u ocjeni
Seminar/Projekt 40 % 60 % 40 % 60 %
Završni ispit: Pismeni 40 % 40 %
Ispit: Pismeni 40 % 40 %

Tjedni plan nastave

  1. Admininstracija predmeta. Uvod u dubinsku analizu podataka. Opis područja. Modeli procesa dubinske analize podataka. Literatura.
  2. Priprema podataka za dubinsku analizu podataka: proces pripreme podataka, problemi u podacima i njihova rješenja. Primjeri. Projekt.
  3. Transformacije podataka, redukcija dimenzionalnosti i ekstrakcija značajki. Projekt.
  4. Odabir značajki: filterske metode, metode omotača, ugrađene metode, hibridne metode. Primjeri. Projekt.
  5. Nebalansiranost podataka, pomak koncepta u podacima. Algoritmi za rješavanje ovih problema. Projekt.
  6. Ansambli klasifikatora i regresora. Algoritmi ansambala. Postupci tumačenja modela ansambala. Projekt.
  7. Strojno učenje s jasnim tumačenjem. Indukcija pravila. Algoritmi za indukciju pravila. Projekt.
  8. -
  9. Pronalaženje čestih obrazaca i asocijativna pravila. Pronalaženje visoko korisnih obrazaca. Algoritmi. Projekt.
  10. Dubinska analiza vremenskih nizova: uvod i terminologija. Komponente analize vremenskih nizova. Modeliranje vremenskog niza ekstrakcijom značajki. Projekt.
  11. Dubinska analiza vremenskih nizova: algoritmi za klasifikaciju i predikciju. Projekt.
  12. Duboko učenje u dubinskoj analizi podataka: uvodne teme. Projekt.
  13. Duboko učenje u dubinskoj analizi podataka: napredne teme i primjenska područja - računalni vid, obrada teksta, biomedicina, financije. Predaja projekta.
  14. Prezentacije projekta
  15. Završni ispit

Studijski programi

Sveučilišni diplomski
[FER3-EN] Data Science - profil
Recommended elective courses (2. semestar)

Literatura

(.), Witten IH, Frank E, Hall MA, Pal CJ. Data Mining: Practical Machine Learning Tools and Techniques. 4th ed. Morgan Kaufmann, 2016.,
(.), Fuernkranz J, Gamberger D, Lavrač N. Foundations of Rule Learning. Heidelberg : Springer, 2012,
(.), James G, Witten D, Hastie T, Tibshirani R. An Introduction to Statistical Learning: with Applications in R. Springer, 2014.,
(.), Raschka S, Mirjalili V. Python Machine Learning. 2nd ed. Packt Publishing, Birmingham UK, 2017.,
(.), Ryza S, Laserson U, Owen S, Wills J. Advanced Analytics with Spark: Patterns for Learning from Data at Scale. 2nd ed. O'Reilly Media, Sebastopol CA, USA, 2017.,
(.), Mitchell, R. Web Scraping with Python: Collecting more data from the Modern Web. 2nd ed. O'Reilly Media, Sebastopol CA, USA, 2018.,

Za studente

Izvedba

ID 223066
  Ljetni semestar
5 ECTS
R1 Engleski jezik
R1 E-učenje
45 Predavanja
0 Seminar
0 Auditorne vježbe
18 Laboratorijske vježbe
0 Konstrukcijske vježbe

Ocjenjivanje

88 izvrstan
75 vrlo dobar
63 dobar
50 dovoljan