Osnove statističkog programiranja

Opis predmeta

Predmet kreće od osnova statističkog programiranja preko opisa standardnih programskih elemenata - tipovi podataka, paketi i podatkovne strukture, dizajn vlastitih funkcija i objekata. Nakon toga opisuje se način uvoženja podataka iz različith izvora te njihove pripreme za analizu - transformacija i uređivanje podataka, upravljanje nedostajućim vrijednostima, izvođenje novih varijabli iz postojećih, upravljanje datumskim/vremenskim i tekstualnim tipom podataka. Uče se osnove statističke i eksploratorne analize podatkovnih skupova. Obrađuje se pojam grafičke gramatike te načini dizajna profesionalnih vizualizacija. Usvajaju se znanja o upravljanju različitim tipovima distribucija i provođenja simulacija. Osposobljava se za provođenje odabranih metoda strojnog učenja. Svladava se programski pristup dubinskoj analizi podataka - uzorkovanje, razdvajanje na trening i test skupove, stvaranje i evaluacija prediktivnih i deskriptivnih modela.

Ishodi učenja

  1. analizirati manje i veće podatkovne skupove na smislen i organizirani način
  2. prepoznati prirodu podataka i pristup njihovoj obradi
  3. koristiti interaktivni programski pristup analize podataka
  4. modificirati sirove podatke u oblik pogodan za analizu
  5. pripremiti složenije programske funkcije i skripte
  6. pripremiti profesionalne vizualizacije podatkovnih skupova
  7. primijeniti metode strojnog učenja u programskom okruženju
  8. primijeniti metodologiju izrade izvještaja

Oblici nastave

Predavanja

Predavanja u učionici uz pripremljene digitalne radne bilježnice

Laboratorij

Rješavanje digitalnih radnih bilježnica, rješavanje programskih zadataka

Način ocjenjivanja

Kontinuirana nastava Ispitni rok
Vrsta provjere Prag Udio u ocjeni Prag Udio u ocjeni
Laboratorijske vježbe 10 % 20 % 10 % 0 %
Domaće zadaće 5 % 10 % 5 % 5 %
Sudjelovanje u nastavi 0 % 10 % 0 % 0 %
Seminar/Projekt 5 % 20 % 5 % 20 %
Međuispit: Pismeni 5 % 15 % 0 %
Završni ispit: Pismeni 10 % 25 %
Ispit: Pismeni 50 % 75 %

Tjedni plan nastave

  1. Osnovna sintaksa i semantika jezika više razine, Varijable i jednostavni tipovi podataka (npr. brojevi. znakovi. logičke vrijednosti), Izrazi i dodjeljivanja. Pojam nedostajuće vrijednosti.
  2. Složene podatkovne strukture - vektori, matrice i liste. Princip vektorizacije i recikliranja. Indeksni operator. Lokacijsko, logičko i imensko referenciranje elemenata složenih struktura.
  3. Podatkovni okviri kao glavna struktura za pohranu podatkovnih skupova. Interna reprezentacija podatkovnih okvira. Kategorijske varijable.
  4. Naredbe za kontrolu toka programa - uvjetno izvođenje i petlje.
  5. Ugrađene funkcije. Pojam staze pretrage, leksičkog opsega i okoline. Korisnički definirane funkcije. Funkcijsko programiranje. Deklarativne alternative programskim petljama.
  6. Objektno orijentirano programiranje u kontekstu okoline za statističko programiranje i analizu podataka.
  7. Operator cjevovoda i ulančani kod. Pojam urednih podataka. Priprema podataka za analizu u kontekstu grubih preoblikovanja i transformacije u uredni oblik.
  8. Međuispit
  9. Datumi i vremenske oznake. Pojam vremenskih podataka i poimanja vremena u kontekstu podatkovne analize. Znakovni nizovi i obrada nizova. Regularni izrazi i analiza teksta.
  10. Naredbe za upravljanje podacima i eksploratornu analizu. Proceduralni ekvivalenti naredbi jezika za dohvat relacijskih podataka. Skupovske operacije. Upravljanje nedostajućim vrijednostima.
  11. Osnovni elementi grafičke gramatike. Vizualizacija podataka. Pojam estetike i geometrije u kontekstu vizualizacije.
  12. Programske metode za deskriptivnu i inferencijalnu statistiku. Simulacije.
  13. Odabrane metode strojnog učenja - linearna regresija, kNN klasifikacija.
  14. Uvod u prediktivno modeliranje. Skupovi za treniranje i testiranje modela. Metode krosvalidacije. Deklarativni pristup izradi i evaluaciji prediktivnih modela.
  15. Završni ispit

Studijski programi

Sveučilišni diplomski
Audiotehnologije i elektroakustika (profil)
Slobodni izborni predmeti (1. semestar)
Automatika i robotika (profil)
Slobodni izborni predmeti (1. semestar)
Elektroenergetika (profil)
Slobodni izborni predmeti (1. semestar)
Elektroničko i računalno inženjerstvo (profil)
Slobodni izborni predmeti (1. semestar)
Elektronika (profil)
Slobodni izborni predmeti (1. semestar)
Elektrostrojarstvo i automatizacija (profil)
Slobodni izborni predmeti (1. semestar)
Informacijsko i komunikacijsko inženjerstvo (profil)
Slobodni izborni predmeti (1. semestar)
Komunikacijske i svemirske tehnologije (profil)
Slobodni izborni predmeti (1. semestar)
Programsko inženjerstvo i informacijski sustavi (profil)
Izborni predmet profila (1. semestar)
Računalno inženjerstvo (profil)
Slobodni izborni predmeti (1. semestar)
Računalno modeliranje u inženjerstvu (profil)
Slobodni izborni predmeti (1. semestar)
Računarska znanost (profil)
Slobodni zborni predmeti (1. semestar)
Znanost o mrežama (profil)
Izborni predmeti profila (1. semestar)
Znanost o podacima (profil)
Slobodni izborni predmeti (1. semestar)

Literatura

(.), Programirajmo u R-u,
(.), R for Data Science,
(.), Openintro Statistics,
(.), Introduction to Statistical Learning,
(.), Advanced R,

Predavanja

Za studente

Izvedba

ID 222597
  Zimski semestar
5 ECTS
R3 Engleski jezik
R2 E-učenje
45 Predavanja
15 Laboratorijske vježbe

Ocjenjivanje

87 izvrstan
75 vrlo dobar
62 dobar
50 dovoljan