Osnove statističkog programiranja

Opis predmeta

Predmet kreće od osnova statističkog programiranja preko opisa standardnih programskih elemenata - tipovi podataka, paketi i podatkovne strukture, dizajn vlastitih funkcija i objekata. Nakon toga opisuje se način uvoženja podataka iz različith izvora te njihove pripreme za analizu - transformacija i uređivanje podataka, upravljanje nedostajućim vrijednostima, izvođenje novih varijabli iz postojećih, upravljanje datumskim/vremenskim i tekstualnim tipom podataka. Uče se osnove statističke i eksploratorne analize podatkovnih skupova. Obrađuje se pojam grafičke gramatike te načini dizajna profesionalnih vizualizacija. Usvajaju se znanja o upravljanju različitim tipovima distribucija i provođenja simulacija. Osposobljava se za provođenje odabranih metoda strojnog učenja. Svladava se programski pristup dubinskoj analizi podataka - uzorkovanje, razdvajanje na trening i test skupove, stvaranje i evaluacija prediktivnih i deskriptivnih modela.

Ishodi učenja

  1. analizirati manje i veće podatkovne skupove na smislen i organizirani način
  2. prepoznati prirodu podataka i pristup njihovoj obradi
  3. koristiti interaktivni programski pristup analize podataka
  4. modificirati sirove podatke u oblik pogodan za analizu
  5. pripremiti složenije programske funkcije i skripte
  6. pripremiti profesionalne vizualizacije podatkovnih skupova
  7. primijeniti metode strojnog učenja u programskom okruženju
  8. primijeniti metodologiju izrade izvještaja

Oblici nastave

Predavanja

Predavanja u učionici uz pripremljene digitalne radne bilježnice

Laboratorij

Rješavanje digitalnih radnih bilježnica, rješavanje programskih zadataka

Način ocjenjivanja

Kontinuirana nastava Ispitni rok
Vrsta provjere Prag Udio u ocjeni Prag Udio u ocjeni
Laboratorijske vježbe 10 % 20 % 10 % 0 %
Domaće zadaće 5 % 10 % 5 % 5 %
Sudjelovanje u nastavi 0 % 10 % 0 % 0 %
Seminar/Projekt 5 % 20 % 5 % 20 %
Međuispit: Pismeni 5 % 15 % 0 %
Završni ispit: Pismeni 10 % 25 %
Ispit: Pismeni 50 % 75 %

Tjedni plan nastave

  1. Osnovna sintaksa i semantika jezika više razine, Varijable i jednostavni tipovi podataka (npr. brojevi. znakovi. logičke vrijednosti), Izrazi i dodjeljivanja. Pojam nedostajuće vrijednosti.
  2. Složene podatkovne strukture - vektori, matrice i liste. Princip vektorizacije i recikliranja. Indeksni operator. Lokacijsko, logičko i imensko referenciranje elemenata složenih struktura.
  3. Podatkovni okviri kao glavna struktura za pohranu podatkovnih skupova. Interna reprezentacija podatkovnih okvira. Kategorijske varijable.
  4. Naredbe za kontrolu toka programa - uvjetno izvođenje i petlje.
  5. Ugrađene funkcije. Pojam staze pretrage, leksičkog opsega i okoline. Korisnički definirane funkcije. Funkcijsko programiranje. Deklarativne alternative programskim petljama.
  6. Objektno orijentirano programiranje u kontekstu okoline za statističko programiranje i analizu podataka.
  7. Operator cjevovoda i ulančani kod. Pojam urednih podataka. Priprema podataka za analizu u kontekstu grubih preoblikovanja i transformacije u uredni oblik.
  8. Međuispit
  9. Datumi i vremenske oznake. Pojam vremenskih podataka i poimanja vremena u kontekstu podatkovne analize. Znakovni nizovi i obrada nizova. Regularni izrazi i analiza teksta.
  10. Naredbe za upravljanje podacima i eksploratornu analizu. Proceduralni ekvivalenti naredbi jezika za dohvat relacijskih podataka. Skupovske operacije. Upravljanje nedostajućim vrijednostima.
  11. Osnovni elementi grafičke gramatike. Vizualizacija podataka. Pojam estetike i geometrije u kontekstu vizualizacije.
  12. Programske metode za deskriptivnu i inferencijalnu statistiku. Simulacije.
  13. Odabrane metode strojnog učenja - linearna regresija, kNN klasifikacija.
  14. Uvod u prediktivno modeliranje. Skupovi za treniranje i testiranje modela. Metode krosvalidacije. Deklarativni pristup izradi i evaluaciji prediktivnih modela.
  15. Završni ispit

Studijski programi

Sveučilišni diplomski
Izborni predmeti (1. semestar) (3. semestar)
Izborni predmeti (1. semestar) (3. semestar)
Izborni predmeti (1. semestar) (3. semestar)
Izborni predmeti (1. semestar) (3. semestar)
Izborni predmeti (1. semestar) (3. semestar)
Izborni predmeti (1. semestar) (3. semestar)
Izborni predmeti (1. semestar) (3. semestar)
Izborni predmeti (1. semestar) (3. semestar)
Izborni predmeti (1. semestar) (3. semestar)
Izborni predmet profila (1. semestar) (3. semestar)
Izborni predmeti (1. semestar) (3. semestar)
Izborni predmeti (1. semestar) (3. semestar)
Izborni predmeti (1. semestar) (3. semestar)
Izborni predmeti (1. semestar) (3. semestar)
Izborni predmeti profila (1. semestar) (3. semestar)
Izborni predmeti (1. semestar) (3. semestar)
Izborni predmeti profila (3. semestar)

Literatura

(.), Programirajmo u R-u,
(.), R for Data Science,
(.), Openintro Statistics,
(.), Introduction to Statistical Learning,
(.), Advanced R,

Predavanja

Za studente

Izvedba

ID 222597
  Zimski semestar
5 ECTS
R3 Engleski jezik
R2 E-učenje
45 Predavanja
0 Seminar
0 Auditorne vježbe
15 Laboratorijske vježbe
0 Konstrukcijske vježbe

Ocjenjivanje

87 izvrstan
75 vrlo dobar
62 dobar
50 dovoljan