Statistička analiza podataka

Ishodi učenja

  1. Definirati osnovne pojmove u statističkoj analizi podataka
  2. Objasniti matematičke temelje osnovnih statističkih postupaka
  3. Primijeniti postupak pripreme podataka i postupak vizualizacije podataka
  4. Primijeniti statistički test na stvarnim podatcima
  5. Analizirati odnose između statističkih varijabli primjenom postupaka regresijske i korelacijske analize
  6. Ocijeniti i opravdati adekvatnost statističkog postupka zaključivanja za zadane podatke
  7. Objasniti rezultate statističke analize podataka i procijeniti njihov praktični značaj

Oblici nastave

Predavanja

Samostalni zadaci

Laboratorij

Tjedni plan nastave

  1. Prikazivanje statističkih podataka. Populacija i uzorak. Metode uzorkovanja. Parametri populacije.
  2. Cilj multivarijatne statističke analize. Podaci, objekti, varijable i skale (Stevensova klasifikacija). Klasificiranje multivarijantnih tehnika. Sažimanje, opisivanje i grafički prikaz multivarijatnih podataka.
  3. Sredina. medijan. mod razdiobe. Disperzija. varijanca. kvantili radiobe. međukvartilni raspon. Statistička interferencija. Koeficijent korelacije. Linearna korelacija.
  4. Testiranje hipoteza. Pogreške prve i druge vrste. Testiranje hipoteza o parametrima. Uzoračke distribucije. Testiranje hipoteze o vrijednosti očekivanja populacije. testiranje hipoteze o jednakosti očekivanja dviju populacija. t-test.
  5. Testiranje hipoteze o vrijednosti disperzije populacije. testiranje hipoteze o jednakosti disperzija dviju populacija. hi-kvadrat test. F-test.
  6. Razlika sredina. Disperzija dviju normalnih populacija. Usporedba proporcija dviju populacija. Testiranje hipoteze o proporciji i o jednakosti dviju proporcija. U-test.
  7. Interpretacija rezultata testova. veličina uzorka. interpretacija p-vrijednosti. Primjeri primjena: statistička kontrola kvalitete i kontrolni dijagrami.
  8. Međuispit.
  9. Prednosti. nedostatci i korištenje neparametarskih statističkih procedura. Neparametarski testovi za jedan uzorak. Neparametarski testovi za dva nezavisna i dva vezana uzorka. Neparametarski testovi za tri i više nezavisnih i vezanih uzoraka.
  10. Manipuliranje podacima prije multivarijantne analize (izgubljeni podaci, outlier detekcija, transformacija podataka, standardizacija, normalnost, linearnost, homoscesivnost, homoegenost). Podaci koji su prikladni za multivarijatnu analizu: podaci, korelacija, varijantna kovarijanca, suma kvadrata i unakrsnih proizvoda matrica, ostatak, udaljenosti (statistička i Mehalanobis). Geometrija uzorka i slučajno uzorkovanje.
  11. Analiza varijance (ANOVA / MANOVA) i dizajn eksperimenta.
  12. Linearna regresija. Višeznačna linearna regresija.
  13. Primijenjena korelacijska i regresijska analiza, interpretacija i odnos prema analizi varijance (ANOVA).
  14. Bayesijansko zaključivanje naspram frekvencijskog zaključivanja.
  15. Završni ispit.

Studijski programi

Sveučilišni preddiplomski
Elektrotehnika i informacijska tehnologija (studij)
Izborni predmeti (5. semestar)
Računarstvo (studij)
Izborni predmeti (5. semestar)

Literatura

Ronald Walpole, Raymond Myers, Sharon Myers, Keying Ye (2012.), Probability and Statistics for Engineers and Scientists,
Željko Pauše (1993.), Uvod u matematičku statistiku,
David Diez, Christopher Barr, Mine Çetinkaya-Rundel (2015.), OpenIntro Statistics,
Mirta Benšić, Nenad Šuvak (2013.), Primijenjena statistika, Sveučilište J. J. Štrosmajera
Gareth James, Daniela Witten, Trevor Hastie, Robert Tibshirani (2013.), An Introduction to Statistical Learning, Springer Science & Business Media

Predavanja

Laboratorijske vježbe

Izvedba

ID 183454
  Zimski semestar
5 ECTS
R3 Engleski jezik
R1 E-učenje
45 Predavanja
0 Auditorne vježbe
12 Laboratorijske vježbe
0 Konstrukcijske vježbe

Ocjenjivanje

izvrstan
vrlo dobar
dobar
dovoljan