Obrada prirodnog jezika
Prikazani su podaci za akademsku godinu: 2024./2025.
Opis predmeta
Teorijske osnove obrade prirodnog jezika. Podatkovne podloge: rječnici i korpusi, sustavi označavanja. Učenje iz korpusa: usvajanje novih riječi, rješavanje problema višeznačnosti, jezični modeli. Gramatike: skriveni Markovljevi modeli (HMM), gramatike neovisne o kontekstu (CFG) i druge. Primjena gramatičkih modela u označavanju korpusa i parsiranju. Jezično pretprocesiranje u sintezi govora. Jezično postprocesiranje u prepoznavanju govora. Metode i alati za strojno prevođenje. Utjecaj aplikacija obrade prirodnog jezika na društveni razvoj i promjenu jezika.
Studijski programi
Sveučilišni diplomski
Izborni predmeti (1. semestar) (3. semestar)[FER3-HR] Automatika i robotika - profil
Izborni predmeti
(3. semestar)
[FER3-HR] Elektroenergetika - profil
Izborni predmeti
(3. semestar)
Izborni predmeti
(3. semestar)
[FER3-HR] Elektronika - profil
Izborni predmeti
(3. semestar)
Izborni predmeti
(3. semestar)
Izborni predmeti
(3. semestar)
Izborni predmeti
(3. semestar)
Izborni predmeti
(3. semestar)
Izborni predmet profila
(3. semestar)
[FER3-HR] Računalno inženjerstvo - profil
Izborni predmeti
(3. semestar)
Izborni predmeti
(3. semestar)
[FER3-HR] Računarska znanost - profil
Izborni predmeti
(3. semestar)
[FER3-HR] Znanost o mrežama - profil
Izborni predmeti
(3. semestar)
[FER3-HR] Znanost o podacima - profil
Izborni predmeti
(3. semestar)
[FER2-HR] Programsko inženjerstvo i informacijski sustavi - profil
preporučeni izborni predmeti
(3. semestar)
[FER2-HR] Računalno inženjerstvo - profil
preporučeni izborni predmeti
(3. semestar)
[FER2-HR] Računarska znanost - profil
preporučeni izborni predmeti
(3. semestar)
[FER2-HR] Telekomunikacije i informatika - profil
preporučeni izborni predmet
(3. semestar)
Ishodi učenja
- identificirati računalne složenosti NLP problema
- evaluirati slobodnosoftveske NLP alate
- manipulirati tekstovnim i govornim korpusima
- sudjelovati u projektima sinteze govora
- sudjelovati u projektima prepoznavanja govora
- sudjelovati u projektima strojnog prevođenja
Oblici nastave
Predavanja
Predavanja uživo
LaboratorijZnanstveno - istraživački projektni zadaci
Tjedni plan nastave
- Jezični modeli, korpusne metode, n-grami, kolokacije
- Računalna morfologija, računalna semantika (formalna semantika. označavanje semantičkih uloga)
- Označavanje vrsta riječi, skriveni Markovljevi modeli
- Determinističke i stohastičke gramatike, konstituentne i ovisnosne gramatike (CFG, PCFG)
- Algoritmi parsanja (CYK. Chart), leksikalizirano parsanje, ovisnosno parsanje
- Distribucijski semantički modeli i vektorizacija riječi, razumijevanje i primjena zakodiranog teksta
- Log-linearni modeli, procjena parametara log-linearnih modela
- Jezični modeli, zaglađivanje, vrednovanje
- Međuispit
- Neuronski jezični modeli, veliki jezični modeli, modeli otvorenog koda
- "Prompt" inženjering
- Fino podešavanje velikih jezičnih modela
- Agenti, lančani pozivi i memorija za proširenje upotrebe LLM-a. LLM-ovi sa semantičkim pretraživanjem. Generiranje prošireno dohvaćanjem (Retrieval Augmented Generation - RAG).
- Ocjenjivanje i otklanjanje pogrešaka generativnih AI modela, kvaliteta i sigurnost LLM aplikacija
- Završni ispit
Literatura
(.), Daniel Jurafsky, James H. Martin (2019.), Speech and Language Processing (3nd edition), Prentice Hall,
(.), Christopher D. Manning, Hinrich Schütze (1999.), Foundations of Statistical Natural Language Processing, MIT Press,
(.), Ruslan Mitkov (ed.) (2005.), The Oxford Handbook of Computational Linguistics, Oxford University Press, USA,
(.), Steven Bird, Ewan Klein, Edward Loper (2009.), Natural Language Processing with Python, O'Reilly Media, Inc.,
Za studente
Izvedba
ID 222553
Zimski semestar
5 ECTS
R0 Engleski jezik
R1 E-učenje
30 Predavanja
0 Seminar
6 Auditorne vježbe
15 Laboratorijske vježbe
0 Konstrukcijske vježbe
0 Vježbe tjelesnog odgoja
Ocjenjivanje
90 izvrstan
80 vrlo dobar
70 dobar
50 dovoljan