Obrada prirodnog jezika
Prikazani su podaci za akademsku godinu: 2024./2025.
Opis predmeta
Teorijske osnove obrade prirodnog jezika. Podatkovne podloge: rječnici i korpusi, sustavi označavanja. Učenje iz korpusa: usvajanje novih riječi, rješavanje problema višeznačnosti, jezični modeli. Gramatike: skriveni Markovljevi modeli (HMM), gramatike neovisne o kontekstu (CFG) i druge. Primjena gramatičkih modela u označavanju korpusa i parsiranju. Jezično pretprocesiranje u sintezi govora. Jezično postprocesiranje u prepoznavanju govora. Metode i alati za strojno prevođenje. Utjecaj aplikacija obrade prirodnog jezika na društveni razvoj i promjenu jezika.
Preduvjeti
Osnove programiranja.
Studijski programi
Sveučilišni diplomski
Izborni predmeti (1. semestar) (3. semestar)[FER3-HR] Automatika i robotika - profil
Izborni predmeti
(3. semestar)
[FER3-HR] Elektroenergetika - profil
Izborni predmeti
(3. semestar)
Izborni predmeti
(3. semestar)
[FER3-HR] Elektronika - profil
Izborni predmeti
(3. semestar)
Izborni predmeti
(3. semestar)
Izborni predmeti
(3. semestar)
Izborni predmeti
(3. semestar)
Izborni predmeti
(3. semestar)
Izborni predmeti profila
(3. semestar)
[FER3-HR] Računalno inženjerstvo - profil
Izborni predmeti
(3. semestar)
Izborni predmeti
(3. semestar)
[FER3-HR] Računarska znanost - profil
Izborni predmeti
(3. semestar)
[FER3-HR] Znanost o mrežama - profil
Izborni predmeti
(3. semestar)
[FER3-HR] Znanost o podacima - profil
Izborni predmeti
(3. semestar)
[FER2-HR] Programsko inženjerstvo i informacijski sustavi - profil
preporučeni izborni predmeti
(3. semestar)
[FER2-HR] Računalno inženjerstvo - profil
preporučeni izborni predmeti
(3. semestar)
[FER2-HR] Računarska znanost - profil
preporučeni izborni predmeti
(3. semestar)
[FER2-HR] Telekomunikacije i informatika - profil
preporučeni izborni predmeti
(3. semestar)
Ishodi učenja
- identificirati računalne složenosti NLP problema
- ocijeniti slobodnosoftveske NLP alate
- baratati tekstovnim i govornim korpusima
- sudjelovati u projektima sinteze govora
- sudjelovati u projektima prepoznavanja govora
- sudjelovati u projektima strojnog prevođenja
Oblici nastave
Predavanja
Predavanja uživo
LaboratorijZnanstveno - istraživački projektni zadaci
Tjedni plan nastave
- Jezični modeli, korpusne metode, n-grami, kolokacije
- Računalna morfologija, računalna semantika (formalna semantika. označavanje semantičkih uloga)
- Označavanje vrsta riječi, skriveni Markovljevi modeli
- Determinističke i stohastičke gramatike, konstituentne i ovisnosne gramatike (CFG, PCFG)
- Algoritmi parsanja (CYK. Chart), leksikalizirano parsanje, ovisnosno parsanje
- Distribucijski semantički modeli i vektorizacija riječi, razumijevanje i primjena zakodiranog teksta
- Log-linearni modeli, procjena parametara log-linearnih modela
- Jezični modeli, zaglađivanje, vrednovanje
- Međuispit
- Neuronski jezični modeli, veliki jezični modeli, modeli otvorenog koda
- "Prompt" inženjering
- Fino podešavanje velikih jezičnih modela
- Agenti, lančani pozivi i memorija za proširenje upotrebe LLM-a. LLM-ovi sa semantičkim pretraživanjem. Generiranje prošireno dohvaćanjem (Retrieval Augmented Generation - RAG).
- Ocjenjivanje i otklanjanje pogrešaka generativnih AI modela, kvaliteta i sigurnost LLM aplikacija
- Završni ispit
Literatura
Izvedba
ID 222553
Zimski semestar
5 ECTS
R0 Engleski jezik
R1 E-učenje
30 Predavanja
0 Seminar
6 Auditorne vježbe
15 Laboratorijske vježbe
0 Konstrukcijske vježbe
0 Vježbe tjelesnog odgoja
Ocjenjivanje
90 izvrstan
80 vrlo dobar
70 dobar
50 dovoljan