Osnove programskog jezika R

Opis predmeta

Cilj kolegija jest osposobiti studenta za korištenje programskog jezika R uz naglasak na rješavanje realnih problema i praktičnu primjenu. R je specifičan programski jezik prilagođen eksploratornoj, statističkoj i dubinskoj analizi podatkovnih skupova. Po svojoj prirodi nalazi se na razmeđi između klasičnih programskih jezika kao što su Python, Java ili C++ i statističkih alata kao što su SAS ili SPSS. Uz interaktivni pristup, ali i mogućnost pisanja složenijih programskih skripti, R se danas nametnuo kao jedan od vodećih analitičkih programskih jezika s kojim se uz pomoć pratećih paketa na vrlo učinkovit način mogu provesti složenije analize podatkovnih skupova te stvoriti izvještaji popraćeni kompleksnim vizualizacijama i izračunima. Svladavanje jezika R zahtjeva specifičnu kombinaciju programskih vještina, poznavanja osnova statistike, ali i izvjesnu kreativnost i spremnost na izazove.

Ishodi učenja

  1. analizirati manje i veće podatkovne skupove na smislen i organizirani način
  2. prepoznati prirodu podataka i pristup njihovoj obradi
  3. koristiti interaktivni programski pristup analize podataka
  4. modificirati sirove podatke u oblik pogodan za analizu
  5. pripremiti složenije programske skripte i pakete u programskom jeziku R
  6. primijeniti metode strojnog učenja u programskom okruženju
  7. primijeniti metodologiju izrade izvještaja

Oblici nastave

Predavanja

Predavanja uz pomoć kombinacije prezentacija i interaktivne demonstracije rada u programskom jeziku R uz opcionalno izvođenje primjera na vlastitim računalima

Laboratorijske vježbe

Pisanje programskih skripti u jeziku R, programskih analiza podatkovnih skupova, primjena metoda strojnog učenja u jeziku R, pisanje izvještaja.

Konzultacije

Konzultacije u dogovorenom terminu ili preko elektroničke pošte.

Programske vježbe

Analiza danih podatkovnih skupova i priprema izvještaja

E-učenje

Rješavanje elektroničkih radnih bilježnica u RMD formatu u alatu RStudio

Način ocjenjivanja

Kontinuirana nastava Ispitni rok
Vrsta provjere Prag Udio u ocjeni Prag Udio u ocjeni
Laboratorijske vježbe 10 % 20 % 0 % 0 %
Domaće zadaće 5 % 10 % 0 % 0 %
Sudjelovanje u nastavi 0 % 5 % 0 % 0 %
Seminar/Projekt 5 % 20 % 0 % 0 %
Prisutnost 0 % 5 % 0 % 0 %
Međuispit: Pismeni 5 % 15 % 0 %
Završni ispit: Pismeni 10 % 25 %

Tjedni plan nastave

  1. Uvod u programski jezik R; usporedba jezika R sa ostalim programskim jezicima; pregled osnovnih alata i razvojnih sučelja; upoznavanje sa konceptima izvođenja predmeta
  2. Osnovni tipovi podataka i operatori; kompleksne podatkovne strukture: vektori, matrice, podatkovni okviri i liste
  3. Uvod u faktore; mehanizmi kontrole toka; objektno orijentirani principi jezika R
  4. Rad sa paketima, ugrađenim funkcijama i okolinama
  5. Korisnički definirane funkcije; porodica funkcija apply
  6. Operator cjevovoda; principi urednih podataka; rad sa datumima i znakovnim nizovima
  7. Prilagodba i transformacija podataka; upoznavanje s paketom dplyr
  8. 1. međuispit
  9. 1. međuispit
  10. Eksploratorna analiza i vizualizacija podataka: grafička gramatika; uvod u paket ggplot2
  11. Eksploratorna analiza i vizualizacija podataka: napredne vizualizacijske metode; izrada izvještaja (tehnologija R Markdown)
  12. Statističko programiranje; rad sa razdiobama; simulacije
  13. Deskriptivna i inferencijalna statistika u jeziku R
  14. Odabrane metode strojnog učenja - praktični primjeri u jeziku R: regresija (jednostavna linearna regresija, multipla linearna regresija, odabir varijabli)
  15. Odabrane metode strojnog učenja - praktični primjeri u jeziku R: klasifikacija (logistička regresija, kNN klasifikacija)

Studijski programi

Sveučilišni preddiplomski
Obradba informacija (modul)
Vještine - 5. semestra (5. semestar)
Programsko inženjerstvo i informacijski sustavi (modul)
Vještine - 5. semestra (5. semestar)
Računalno inženjerstvo (modul)
Vještine - 5. semestra (5. semestar)
Računarska znanost (modul)
Vještine - 5. semestra (5. semestar)
Telekomunikacije i informatika (modul)
Vještine - 5. semestra (5. semestar)
Sveučilišni diplomski
Automatika (profil)
Vještine - dipl.studij - 1. semestar (1. semestar)
Bežične komunikacijske tehnologije (profil)
Vještine - dipl.studij - 1. semestar (1. semestar)
Elektroenergetika (profil)
Vještine - dipl.studij - 1. semestar (1. semestar)
Elektroničko i računalno inženjerstvo (profil)
Vještine - dipl.studij - 1. semestar (1. semestar)
Elektronika (profil)
Vještine - dipl.studij - 1. semestar (1. semestar)
Elektrotehnički sustavi i tehnologija (profil)
Vještine - dipl.studij - 1. semestar (1. semestar)
Obradba informacija (profil)
Vještine - dipl.studij - 1. semestar (1. semestar)
Programsko inženjerstvo i informacijski sustavi (profil)
Vještine - dipl.studij - 1. semestar (1. semestar)
Računalno inženjerstvo (profil)
Vještine - dipl.studij - 1. semestar (1. semestar)
Računarska znanost (profil)
Vještine - dipl.studij - 1. semestar (1. semestar)
Telekomunikacije i informatika (profil)
Vještine - dipl.studij - 1. semestar (1. semestar)

Literatura

Hadley Wickham, Garrett Grolemund (2016.), R for Data Science, "O'Reilly Media, Inc."
Jared Lander (2013.), R for Everyone, Addison-Wesley Professional
David Diez, Christopher Barr, Mine Çetinkaya-Rundel (2015.), OpenIntro Statistics,
Gareth James, Daniela Witten, Trevor Hastie, Robert Tibshirani (2013.), An Introduction to Statistical Learning: with Applications in R (Springer Texts in Statistics), Springer
Jiawei Han, Jian Pei, Micheline Kamber (2011.), Data Mining: Concepts and Techniques, Elsevier

Laboratorijske vježbe

Izvedba

ID 147661
  Zimski semestar
4 ECTS
R1 Engleski jezik
R2 E-učenje

Ocjenjivanje

87,5 izvrstan
75 vrlo dobar
62,5 dobar
50 dovoljan