Osnove statističkog programiranja
Prikazani su podaci za akademsku godinu: 2024./2025.
Predavanja
Opis predmeta
Predmet kreće od osnova statističkog programiranja preko opisa standardnih programskih elemenata - tipovi podataka, paketi i podatkovne strukture, dizajn vlastitih funkcija i objekata. Nakon toga opisuje se način uvoženja podataka iz različith izvora te njihove pripreme za analizu - transformacija i uređivanje podataka, upravljanje nedostajućim vrijednostima, izvođenje novih varijabli iz postojećih, upravljanje datumskim/vremenskim i tekstualnim tipom podataka. Uče se osnove statističke i eksploratorne analize podatkovnih skupova. Obrađuje se pojam grafičke gramatike te načini dizajna profesionalnih vizualizacija. Usvajaju se znanja o upravljanju različitim tipovima distribucija i provođenja simulacija. Osposobljava se za provođenje odabranih metoda strojnog učenja. Svladava se programski pristup dubinskoj analizi podataka - uzorkovanje, razdvajanje na trening i test skupove, stvaranje i evaluacija prediktivnih i deskriptivnih modela.
Studijski programi
Sveučilišni preddiplomski
Izborni predmeti (5. semestar)[FER3-HR] Računarstvo - studij
Izborni predmeti
(5. semestar)
Ishodi učenja
- analizirati manje i veće podatkovne skupove na smislen i organizirani način
- prepoznati prirodu podataka i pristup njihovoj obradi
- koristiti interaktivni programski pristup analize podataka
- modificirati sirove podatke u oblik pogodan za analizu
- pripremiti složenije programske funkcije i skripte
- pripremiti profesionalne vizualizacije podatkovnih skupova
- primijeniti metode strojnog učenja u programskom okruženju
- primijeniti metodologiju izrade izvještaja
Oblici nastave
Predavanja
Predavanja u učionici uz pripremljene digitalne radne bilježnice
LaboratorijRješavanje digitalnih radnih bilježnica, rješavanje programskih zadataka
Način ocjenjivanja
Kontinuirana nastava | Ispitni rok | |||||
---|---|---|---|---|---|---|
Vrsta provjere | Prag | Udio u ocjeni | Prag | Udio u ocjeni | ||
Laboratorijske vježbe | 50 % | 20 % | 50 % | 0 % | ||
Domaće zadaće | 50 % | 10 % | 50 % | 10 % | ||
Sudjelovanje u nastavi | 0 % | 10 % | 0 % | 0 % | ||
Seminar/Projekt | 25 % | 20 % | 25 % | 20 % | ||
Međuispit: Pismeni | 5 % | 15 % | 0 % | |||
Završni ispit: Pismeni | 10 % | 25 % | ||||
Ispit: Pismeni | 50 % | 70 % |
Tjedni plan nastave
- Osnovna sintaksa i semantika jezika više razine, Varijable i jednostavni tipovi podataka (npr. brojevi. znakovi. logičke vrijednosti), Izrazi i dodjeljivanja. Pojam nedostajuće vrijednosti.
- Složene podatkovne strukture - vektori, matrice i liste. Princip vektorizacije i recikliranja. Indeksni operator. Lokacijsko, logičko i imensko referenciranje elemenata složenih struktura.
- Podatkovni okviri kao glavna struktura za pohranu podatkovnih skupova. Interna reprezentacija podatkovnih okvira. Kategorijske varijable.
- Naredbe za kontrolu toka programa - uvjetno izvođenje i petlje.
- Ugrađene funkcije. Pojam staze pretrage, leksičkog opsega i okoline. Korisnički definirane funkcije. Funkcijsko programiranje. Deklarativne alternative programskim petljama.
- Objektno orijentirano programiranje u kontekstu okoline za statističko programiranje i analizu podataka.
- Operator cjevovoda i ulančani kod. Pojam urednih podataka. Priprema podataka za analizu u kontekstu grubih preoblikovanja i transformacije u uredni oblik.
- Međuispit
- Datumi i vremenske oznake. Pojam vremenskih podataka i poimanja vremena u kontekstu podatkovne analize. Znakovni nizovi i obrada nizova. Regularni izrazi i analiza teksta.
- Naredbe za upravljanje podacima i eksploratornu analizu. Proceduralni ekvivalenti naredbi jezika za dohvat relacijskih podataka. Skupovske operacije. Upravljanje nedostajućim vrijednostima.
- Osnovni elementi grafičke gramatike. Vizualizacija podataka. Pojam estetike i geometrije u kontekstu vizualizacije.
- Programske metode za deskriptivnu i inferencijalnu statistiku. Simulacije.
- Odabrane metode strojnog učenja - linearna regresija, kNN klasifikacija.
- Uvod u prediktivno modeliranje. Skupovi za treniranje i testiranje modela. Metode krosvalidacije. Deklarativni pristup izradi i evaluaciji prediktivnih modela.
- Završni ispit
Literatura
(.), Programirajmo u R-u,
(.), R for Data Science,
(.), Openintro Statistics,
(.), Introduction to Statistical Learning,
(.), Advanced R,
Izvedba
ID 222597
Zimski semestar
5 ECTS
R3 Engleski jezik
R2 E-učenje
45 Predavanja
0 Seminar
0 Auditorne vježbe
15 Laboratorijske vježbe
0 Konstrukcijske vježbe
0 Vježbe tjelesnog odgoja
Ocjenjivanje
87 izvrstan
75 vrlo dobar
62 dobar
50 dovoljan