Statistička analiza podataka

Ishodi učenja

  1. Definirati osnovne pojmove u statističkoj analizi podataka
  2. Objasniti matematičke temelje osnovnih statističkih postupaka
  3. Primijeniti postupak pripreme podataka i postupak vizualizacije podataka
  4. Primijeniti statistički test na stvarnim podatcima
  5. Analizirati odnose između statističkih varijabli primjenom postupaka regresijske i korelacijske analize
  6. Ocijeniti i opravdati adekvatnost statističkog postupka zaključivanja za zadane podatke
  7. Objasniti rezultate statističke analize podataka i procijeniti njihov praktični značaj

Oblici nastave

Predavanja

Samostalni zadaci

Laboratorij

Tjedni plan nastave

  1. Prikazivanje statističkih podataka. Populacija i uzorak. Metode uzorkovanja. Parametri populacije.
  2. Cilj multivarijatne statističke analize. Podaci, objekti, varijable i skale (Stevensova klasifikacija). Klasificiranje multivarijantnih tehnika. Sažimanje, opisivanje i grafički prikaz multivarijatnih podataka.
  3. Sredina. medijan. mod razdiobe. Disperzija. varijanca. kvantili radiobe. međukvartilni raspon. Statistička interferencija. Koeficijent korelacije. Linearna korelacija.
  4. Testiranje hipoteza. Pogreške prve i druge vrste. Testiranje hipoteza o parametrima. Uzoračke distribucije. Testiranje hipoteze o vrijednosti očekivanja populacije. testiranje hipoteze o jednakosti očekivanja dviju populacija. t-test.
  5. Testiranje hipoteze o vrijednosti disperzije populacije. testiranje hipoteze o jednakosti disperzija dviju populacija. hi-kvadrat test. F-test.
  6. Razlika sredina. Disperzija dviju normalnih populacija. Usporedba proporcija dviju populacija. Testiranje hipoteze o proporciji i o jednakosti dviju proporcija. U-test.
  7. Interpretacija rezultata testova. veličina uzorka. interpretacija p-vrijednosti. Primjeri primjena: statistička kontrola kvalitete i kontrolni dijagrami.
  8. Međuispit.
  9. Prednosti. nedostatci i korištenje neparametarskih statističkih procedura. Neparametarski testovi za jedan uzorak. Neparametarski testovi za dva nezavisna i dva vezana uzorka. Neparametarski testovi za tri i više nezavisnih i vezanih uzoraka.
  10. Manipuliranje podacima prije multivarijantne analize (izgubljeni podaci, outlier detekcija, transformacija podataka, standardizacija, normalnost, linearnost, homoscesivnost, homoegenost). Podaci koji su prikladni za multivarijatnu analizu: podaci, korelacija, varijantna kovarijanca, suma kvadrata i unakrsnih proizvoda matrica, ostatak, udaljenosti (statistička i Mehalanobis). Geometrija uzorka i slučajno uzorkovanje.
  11. Analiza varijance (ANOVA / MANOVA) i dizajn eksperimenta.
  12. Linearna regresija. Višeznačna linearna regresija.
  13. Primijenjena korelacijska i regresijska analiza, interpretacija i odnos prema analizi varijance (ANOVA).
  14. Bayesijansko zaključivanje naspram frekvencijskog zaključivanja.
  15. Završni ispit.

Studijski programi

Sveučilišni preddiplomski
Elektrotehnika i informacijska tehnologija (studij)
Izborni predmeti (5. semestar)
Računarstvo (studij)
Izborni predmeti (5. semestar)

Literatura

(.), Željko Pauše: Uvod u matematičku statistiku, Školska knjiga, 1992,
(.), Mirta Benšić, Nenad Šuvak: Primijenjena statistika, Sveučilište J. J. Štrosmajera, 2013,
(.), 1) David M. Diez, Crhisopher D. Barr, Mine CerinkayaRundel: OpenIntro Statistics, OpenIntro, 2015.,
(.), 2) L. Fahrmeir, T. Kneib, S. Lang, B. Marx: Regression: Models, Methods and Applications, Springer, 2013.,
(.), 3) G. James, Daniela Witten,Tre vor Hastie, Robert Tibshirani: An Introduction to Statistical Learning with Applications in R, Springer, 2013.,

Izvedba

ID 183454
  Zimski semestar
5 ECTS
R3 Engleski jezik
R1 E-učenje
45 Predavanja
0 Auditorne vježbe
12 Laboratorijske vježbe
0 Konstrukcijske vježbe