Osnove statističkog programiranja

Prikazani su podaci za akademsku godinu: 2023./2024.

Predavanja

Opis predmeta

Predmet kreće od osnova statističkog programiranja preko opisa standardnih programskih elemenata - tipovi podataka, paketi i podatkovne strukture, dizajn vlastitih funkcija i objekata. Nakon toga opisuje se način uvoženja podataka iz različith izvora te njihove pripreme za analizu - transformacija i uređivanje podataka, upravljanje nedostajućim vrijednostima, izvođenje novih varijabli iz postojećih, upravljanje datumskim/vremenskim i tekstualnim tipom podataka. Uče se osnove statističke i eksploratorne analize podatkovnih skupova. Obrađuje se pojam grafičke gramatike te načini dizajna profesionalnih vizualizacija. Usvajaju se znanja o upravljanju različitim tipovima distribucija i provođenja simulacija. Osposobljava se za provođenje odabranih metoda strojnog učenja. Svladava se programski pristup dubinskoj analizi podataka - uzorkovanje, razdvajanje na trening i test skupove, stvaranje i evaluacija prediktivnih i deskriptivnih modela.

Studijski programi

Sveučilišni preddiplomski
Izborni predmeti (5. semestar)
Izborni predmeti (5. semestar)

Ishodi učenja

  1. analizirati manje i veće podatkovne skupove na smislen i organizirani način
  2. prepoznati prirodu podataka i pristup njihovoj obradi
  3. koristiti interaktivni programski pristup analize podataka
  4. modificirati sirove podatke u oblik pogodan za analizu
  5. pripremiti složenije programske funkcije i skripte
  6. pripremiti profesionalne vizualizacije podatkovnih skupova
  7. primijeniti metode strojnog učenja u programskom okruženju
  8. primijeniti metodologiju izrade izvještaja

Oblici nastave

Predavanja

Predavanja u učionici uz pripremljene digitalne radne bilježnice

Laboratorij

Rješavanje digitalnih radnih bilježnica, rješavanje programskih zadataka

Način ocjenjivanja

Kontinuirana nastava Ispitni rok
Vrsta provjere Prag Udio u ocjeni Prag Udio u ocjeni
Laboratorijske vježbe 50 % 20 % 50 % 0 %
Domaće zadaće 50 % 10 % 50 % 10 %
Sudjelovanje u nastavi 0 % 10 % 0 % 0 %
Seminar/Projekt 25 % 20 % 25 % 20 %
Međuispit: Pismeni 5 % 15 % 0 %
Završni ispit: Pismeni 10 % 25 %
Ispit: Pismeni 50 % 70 %

Tjedni plan nastave

  1. Osnovna sintaksa i semantika jezika više razine, Varijable i jednostavni tipovi podataka (npr. brojevi. znakovi. logičke vrijednosti), Izrazi i dodjeljivanja. Pojam nedostajuće vrijednosti.
  2. Složene podatkovne strukture - vektori, matrice i liste. Princip vektorizacije i recikliranja. Indeksni operator. Lokacijsko, logičko i imensko referenciranje elemenata složenih struktura.
  3. Podatkovni okviri kao glavna struktura za pohranu podatkovnih skupova. Interna reprezentacija podatkovnih okvira. Kategorijske varijable.
  4. Naredbe za kontrolu toka programa - uvjetno izvođenje i petlje.
  5. Ugrađene funkcije. Pojam staze pretrage, leksičkog opsega i okoline. Korisnički definirane funkcije. Funkcijsko programiranje. Deklarativne alternative programskim petljama.
  6. Objektno orijentirano programiranje u kontekstu okoline za statističko programiranje i analizu podataka.
  7. Operator cjevovoda i ulančani kod. Pojam urednih podataka. Priprema podataka za analizu u kontekstu grubih preoblikovanja i transformacije u uredni oblik.
  8. Međuispit
  9. Datumi i vremenske oznake. Pojam vremenskih podataka i poimanja vremena u kontekstu podatkovne analize. Znakovni nizovi i obrada nizova. Regularni izrazi i analiza teksta.
  10. Naredbe za upravljanje podacima i eksploratornu analizu. Proceduralni ekvivalenti naredbi jezika za dohvat relacijskih podataka. Skupovske operacije. Upravljanje nedostajućim vrijednostima.
  11. Osnovni elementi grafičke gramatike. Vizualizacija podataka. Pojam estetike i geometrije u kontekstu vizualizacije.
  12. Programske metode za deskriptivnu i inferencijalnu statistiku. Simulacije.
  13. Odabrane metode strojnog učenja - linearna regresija, kNN klasifikacija.
  14. Uvod u prediktivno modeliranje. Skupovi za treniranje i testiranje modela. Metode krosvalidacije. Deklarativni pristup izradi i evaluaciji prediktivnih modela.
  15. Završni ispit

Literatura

(.), Programirajmo u R-u,
(.), R for Data Science,
(.), Openintro Statistics,
(.), Introduction to Statistical Learning,
(.), Advanced R,

Za studente

Izvedba

ID 222597
  Zimski semestar
5 ECTS
R3 Engleski jezik
R2 E-učenje
45 Predavanja
0 Seminar
0 Auditorne vježbe
15 Laboratorijske vježbe
0 Konstrukcijske vježbe

Ocjenjivanje

87 izvrstan
75 vrlo dobar
62 dobar
50 dovoljan