Obrada prirodnog jezika
Prikazani su podaci za akademsku godinu: 2023./2024.
Opis predmeta
Teorijske osnove obrade prirodnog jezika. Podatkovne podloge: rječnici i korpusi, sustavi označavanja. Učenje iz korpusa: usvajanje novih riječi, rješavanje problema višeznačnosti, jezični modeli. Gramatike: skriveni Markovljevi modeli (HMM), gramatike neovisne o kontekstu (CFG) i druge. Primjena gramatičkih modela u označavanju korpusa i parsiranju. Jezično pretprocesiranje u sintezi govora. Jezično postprocesiranje u prepoznavanju govora. Metode i alati za strojno prevođenje. Utjecaj aplikacija obrade prirodnog jezika na društveni razvoj i promjenu jezika.
Studijski programi
Sveučilišni diplomski
Izborni predmeti (1. semestar) (3. semestar)[FER3-HR] Automatika i robotika - profil
Izborni predmeti
(3. semestar)
[FER3-HR] Elektroenergetika - profil
Izborni predmeti
(3. semestar)
Izborni predmeti
(3. semestar)
[FER3-HR] Elektronika - profil
Izborni predmeti
(3. semestar)
Izborni predmeti
(3. semestar)
Izborni predmeti
(3. semestar)
Izborni predmeti
(3. semestar)
Izborni predmeti
(3. semestar)
Izborni predmet profila
(3. semestar)
[FER3-HR] Računalno inženjerstvo - profil
Izborni predmeti
(3. semestar)
Izborni predmeti
(3. semestar)
[FER3-HR] Računarska znanost - profil
Izborni predmeti
(3. semestar)
[FER3-HR] Znanost o mrežama - profil
Izborni predmeti
(3. semestar)
[FER3-HR] Znanost o podacima - profil
Izborni predmeti
(3. semestar)
[FER2-HR] Programsko inženjerstvo i informacijski sustavi - profil
preporučeni izborni predmeti
(3. semestar)
[FER2-HR] Računalno inženjerstvo - profil
preporučeni izborni predmeti
(3. semestar)
[FER2-HR] Računarska znanost - profil
preporučeni izborni predmeti
(3. semestar)
[FER2-HR] Telekomunikacije i informatika - profil
preporučeni izborni predmet
(3. semestar)
Ishodi učenja
- identificirati računalne složenosti NLP problema
- evaluirati slobodnosoftveske NLP alate
- manipulirati tekstovnim i govornim korpusima
- sudjelovati u projektima sinteze govora
- sudjelovati u projektima prepoznavanja govora
- sudjelovati u projektima strojnog prevođenja
Oblici nastave
Predavanja
Predavanja uživo
LaboratorijZnanstveno - istraživački projektni zadaci
Način ocjenjivanja
Kontinuirana nastava | Ispitni rok | |||||
---|---|---|---|---|---|---|
Vrsta provjere | Prag | Udio u ocjeni | Prag | Udio u ocjeni | ||
Seminar/Projekt | 0 % | 40 % | 0 % | 40 % | ||
Međuispit: Pismeni | 0 % | 30 % | 0 % | |||
Završni ispit: Pismeni | 0 % | 30 % | ||||
Ispit: Pismeni | 50 % | 60 % |
Tjedni plan nastave
- Jezični modeli, korpusne metode, n-grami, kolokacije
- Računalna morfologija, računalna semantika (formalna semantika. označavanje semantičkih uloga)
- Označavanje vrsta riječi, skriveni Markovljevi modeli
- Determinističke i stohastičke gramatike, konstituentne i ovisnosne gramatike (CFG, PCFG)
- Algoritmi parsanja (CYK. Chart), leksikalizirano parsanje, ovisnosno parsanje
- Distribucijski semantički modeli i vektorizacija riječi
- Log-linearni modeli, procjena parametara log-linearnih modela
- Jezični modeli, zaglađivanje, vrednovanje
- Međuispit
- Analiza sentimenta i emocija u textu
- NLP temeljen na grafovima: sintaksa, semantika i aplikacije
- Neuronski jezični modeli
- (en) Transfer Learning with Contextual Embeddings and Pre-trained language models
- Strojno prevođenje
- Završni ispit
Literatura
Za studente
Izvedba
ID 222553
Zimski semestar
5 ECTS
R0 Engleski jezik
R1 E-učenje
30 Predavanja
0 Seminar
6 Auditorne vježbe
15 Laboratorijske vježbe
0 Konstrukcijske vježbe
Ocjenjivanje
90 izvrstan
80 vrlo dobar
70 dobar
50 dovoljan