Strojno učenje

Opis predmeta

Strojno učenje grana je umjetne inteligencije koja se bave oblikovanjem algoritama koji svoju učinkovitost poboljšavaju na temelju empirijskih podataka. Strojno učenje jedno je od danas najaktivnijih i najuzbudljivijih područja računarske znanosti, ponajviše zbog brojnih mogućnosti primjene koje se protežu od raspoznavanja uzoraka i dubinske analize podataka do robotike, računalnog vida, bioinformatike i računalne lingvistike. Ovaj se kolegij bavi teorijom i načelima strojnog učenja te daje pregled njegovih primjena. Kolegij obuhvaća dva osnovna pristupa strojnom učenju: nadzirano učenje (klasifikacija i regresija) i nenadzirano učenje (grupiranje i smanjenje dimenzionalnosti).

Opće kompetencije

Upoznatost s metodama nadziranog i nenadziranog strojnog učenja te zadatcima klasifikacije i regresije. Razumijevanje generativnih, diskriminativnih, parametarskih i neparametarskih modela. Razumijevanje teorijskih osnova ovih modela, ugrađenih pretpostavki, njihovih prednosti i nedostataka. Sposobnost oblikovanja i implementacije sustava za klasifikaciju, regresiju ili grupiranje te provođenja vrednovanja takvog sustava.

Ishodi učenja

  1. definirati osnovne pojmove strojnog učenja
  2. razlikovati između generativnih i diskriminativnih, parametarskih i neparametarskih te probabilističkih i neprobabilističkih modela
  3. objasniti teorijske pretpostavke, prednosti i nedostatke temeljnih algoritama strojnog učenja
  4. primijeniti postupak odabira modela i statističkog vrednovanja uspješnosti naučenog modela
  5. primijeniti razne algoritme klasifikacije, uključivo generativne, diskriminativne i neparametarske
  6. primijeniti algoritme grupiranja podataka i postupke provjere grupiranja
  7. dizajnirati i implementirati postupak za klasifikaciju/grupiranje podataka te provesti njegovu evaluaciju
  8. procijeniti prikladnost nekog algoritma strojnog učenja za zadani zadatak

Oblici nastave

Predavanja

Predavanja se odvijaju kroz 13 tjedana s po dva termina od dva školska sata tjedno.

Provjere znanja

Međuspit i završni ispit.

Auditorne vježbe

Auditorne vježbe odvijaju se kroz 13 tjedna po potrebi.

Konzultacije

Tjedne konzultacije.

Programske vježbe

Programski zadatci koje studenti rješavaju samostalno te demonstriraju nastavniku odnosno asistentu.

Ostalo

Tjedne domaće zadaće. Zadaće se ne pregledavaju i ne ocjenjuju; rješenja se demonstriraju i raspravljaju na auditornim vježbama.

Način ocjenjivanja

Kontinuirana nastava Ispitni rok
Vrsta provjere Prag Udio u ocjeni Prag Udio u ocjeni
Laboratorijske vježbe 30 % 30 % 0 % 30 %
Sudjelovanje u nastavi 0 % 5 % 0 % 0 %
Međuispit: Pismeni 0 % 35 % 0 %
Završni ispit: Pismeni 0 % 35 %
Ispit: Pismeni 0 % 35 %
Ispit: Usmeni 35 %
Napomena / komentar

Sudjelovanje u nastavi boduje se s 5% dodatnih bodova (bonus iznad 100%). Ispit na ispitnom roku provodi se u pismenom i usmenom obliku koji zajedno nose 70% bodova. Studenti na pismenom ispitu moraju zadovoljiti prag od 50% da bi mogli pristupiti usmenom ispitu.

Tjedni plan nastave

  1. Uvod u strojno učenje i motivacija. Pristupi strojnom učenju. Programski alati. Nadzirano učenje.
  2. VC-dimenzija. Induktivna pristranost. Generalizacija, pretreniranost i podtreniranost. Odabir modela.
  3. Procjena gustoće vjerojatnosti. Funkcija izglednosti. Procjenitelji. Procjenitelj najveće izglednost. Procjenitelj MAP.
  4. Probabilistički generativni modeli. Naivan Bayesov klasifikator. Polunaivan Bayesov klasifikator. Zaglađivanje.
  5. Regresija. Postupak najmanjih kvadrata. Poopćeni linearan model regresije. Regularizirana regresija.
  6. Linearni diskriminativni modeli. Geometrija linearnog modela. Perceptron. Višeklasna klasifikacija.
  7. Logistička regresija. Regularizacija. Model MaxEnt.
  8. Međuispit.
  9. Stroj potpornih vektora. Jezgrene funkcije. SVM regresija.
  10. Neparametarski postupci. Algoritam k-najbližih susjeda. Stabla odluke. Neparametarska regresija. Ansambli klasifikatora.
  11. Vrednovanje klasifikatora. Mjere vrednovanja. Unakrsna provjera. Statističko testiranje.
  12. Odabir značajki. Grupiranje podataka. Algoritam k-srednjih vrijednosti.
  13. Gausova mješavina. Algoritam maksimizacije očekivanja. Grupiranje temeljeno na gustoći. Hijerarhijsko grupiranje. Provjera grupiranja.
  14. Dodatna tema / pozvano predavanje. Sažetak.
  15. Završni ispit.

Studijski programi

Sveučilišni diplomski
Obradba informacija (profil)
preporučeni izborni predmeti (3. semestar)
Programsko inženjerstvo i informacijski sustavi (profil)
preporučeni izborni predmeti (3. semestar) Teorijski predmeti profila (1. semestar)
Računarska znanost (profil)
Teorijski predmeti profila (1. semestar)

Literatura

Ethem Alpaydin (2009.), Introduction to Machine Learning, The MIT Press
Christopher M. Bishop (2007.), Pattern Recognition and Machine Learning, Springer
Kevin P. Murphy (2012.), Machine Learning: A Probabilistic Perspective, The MIT Press
Jan Šnajder, Bojana Dalbelo Bašić (2012.), Strojno učenje -- skripta,
Trevor Hastie, Robert Tibshirani, Jerome Friedman (2009.), The Elements of Statistical Learning: Data Mining, Inference, and Prediction, Springer
(.), Info Theory, Inference, and Learning Algorithms;MacKay;2003;Cambridge University Press,

Auditorne vježbe

Izvedba

ID 103973
  Zimski semestar
5 ECTS
R2 Engleski jezik
R1 E-učenje
45 Predavanja
15 Auditorne vježbe
0 Laboratorijske vježbe

Ocjenjivanje

89 izvrstan
76 vrlo dobar
63 dobar
50 dovoljan