Statistička analiza podataka

Opis predmeta

Statistika igra važnu ulogu u svim ljudskim djelatnostima, a sposobnosti primjene statističkog zaključivanja te interpretacije rezultata neizostavne su u inženjerskoj i znanstvenoj praksi. Ovaj predmet daje cjelovit uvod u postupke i praksu statističke analize podataka na računalu. Predmet pokriva i povezuje četiri integralna aspekta statističke analize: podatke, statističke metode, matematičke temelje i interpretaciju rezultata. U prvome dijelu daje se pregled statističkih postupaka, načina opisa podataka te postupaka za vizualizaciju i eksplorativnu analizu podataka. Drugi je dio posvećen osnovama statističkoga zaključivanja te pokriva pitanja odabira, primjene i prikladnosti parametarskih statističkih testova za numeričke i kategoričke podatke. U trećemu se dijelu obrađuju nešto naprednije teme, kao što su neparametarska statistika, analiza varijance te regresijska i korelacijska analiza. Svi koncepti popraćeni su primjerima i zadatcima za vježbu na stvarnim podatcima u programskim jezicima R i Python.

Ishodi učenja

  1. Definirati osnovne pojmove u statističkoj analizi podataka
  2. Objasniti matematičke temelje osnovnih statističkih postupaka
  3. Primijeniti postupak pripreme podataka i postupak vizualizacije podataka
  4. Primijeniti statistički test na stvarnim podatcima
  5. Analizirati odnose između statističkih varijabli primjenom postupaka regresijske i korelacijske analize
  6. Ocijeniti i opravdati adekvatnost statističkog postupka zaključivanja za zadane podatke
  7. Objasniti rezultate statističke analize podataka i procijeniti njihov praktični značaj

Oblici nastave

Predavanja

3 sata tjedno

Provjere znanja

medjuispit, zavrsni ispit

Laboratorijske vježbe

1 sat tjedno, koncentrirano u 4 sjednice po tri sata

Konzultacije

Podrška studentima pri izradi projekta.

Način ocjenjivanja

Kontinuirana nastava Ispitni rok
Vrsta provjere Prag Udio u ocjeni Prag Udio u ocjeni
Seminar/Projekt 50 % 40 % 0 % 40 %
Međuispit: Pismeni 50 % 30 % 0 %
Završni ispit: Pismeni 50 % 30 %
Ispit: Pismeni 50 % 60 %
Napomena / komentar

Prag na međuispitnom i završnom ispitu iznosi 50% na ukupan zbroj bodova iz ta dva ispita.

Tjedni plan nastave

  1. Uvod i motivacija (uloga statistike u znanosti i praksi; klasifikacija statističkih metoda; pregled literature i računalnih alata)
  2. Podatci (mjerne skale; opis numeričkih i kategorijskih podataka; stršeće vrijednosti; transformacija podataka)
  3. Metode vizualizacije i eksploracije podataka (grafikon raspršenosti, histogrami, kvantil-kvantil plot)
  4. Uvod u statističko zaključivanje (populacija, uzorak i uzorkovanje; izrada opservacijskih i eksperimentalnih studija)
  5. Načela statističkog zaključivanja (hipoteze; testovi; p-vrijednost; značajnost)
  6. Statističko zaključivanje za numeričke podatke (usporedba srednjih vrijednosti; upareni podatci; testiranje varijanci)
  7. Statističko zaključivanje za kategorijske podatke (testiranje proporcija; kontingencijske tablice; hikvadrat test)
  8. Odabir postupka testiranja (veličina uzorka; uvjeti i ograničenja testa)
  9. Uvod u neparametarsku statistiku (pregled postupaka; test predznaka; MannWhitney-Wilcoxonov test; Wilcoxonov test predznaka; prednosti i nedostatci)
  10. Postupci ponovnog uzorkovanja (permutacijski testovi; načela bootstrap metoda)
  11. Uvod u analizu varijance (jednofaktorska ANOVA; ANOVA tablica i F-test; DurbinWatsonov test; Barlettov test; Bonferronijeva korekcija)
  12. Regresijska i korelacijska analiza (statističko zaključivanje regresijom; analiza reziduala; intervali pouzdanosti)
  13. Regresijska i korelacijska analiza (višestruka regresija; nelinearna regresija; logistička regresija)
  14. Alternativni pristup analizi podataka (bayesovska naspram frekventističke statistike; primjer bayesovskog modeliranja i zaključivanja)
  15. Sažetak i preporuke za daljnje učenje

Studijski programi

Sveučilišni preddiplomski
Elektroničko i računalno inženjerstvo (modul)
Izborni predmeti (6. semestar)
Obradba informacija (modul)
Izborni predmeti (6. semestar)
Programsko inženjerstvo i informacijski sustavi (modul)
Izborni predmeti (6. semestar)
Računarska znanost (modul)
Izborni predmeti (6. semestar)
Telekomunikacije i informatika (modul)
Izborni predmeti (6. semestar)

Za upis predmeta treba položiti predmete

Literatura

Željko Pauše (1992.), Uvod u matematičku statistiku, Školska knjiga
David M. Diez, Crhisopher D. Barr, Mine CerinkayaRundel (2015.), OpenIntro Statistics, OpenIntro
Mirta Benšić, Nenad Šuvak (2013.), Primijenjena statistika, Sveučilište J. J. Strossma yera
L. Fahrmeir, T. Kneib, S. Lang, B. Marx (2013.), Regression: Models, Methods and Applications, Springer
G. James, Daniela Witten,Tre vor Hastie, Robert Tibshirani (2013.), An Introduction to Statistical Learning with Applications in R, Springer
Allen B. Downey (2014.), Think Stats, "O'Reilly Media, Inc."

Predavanja

Auditorne vježbe

Izvedba

ID 155246
  Ljetni semestar
4 ECTS
R0 Engleski jezik
R1 E-učenje
45 Predavanja
15 Auditorne vježbe
0 Laboratorijske vježbe
0 Konstrukcijske vježbe

Ocjenjivanje

89 izvrstan
76 vrlo dobar
63 dobar
50 dovoljan