Podržano učenje

Opis predmeta

Osnovni pojmovi u području podržanog učenja. Dinamičko programiranje i Bellmanove jednadžbe. Markovljevi procesi odlučivanja. Dilema istraživanja i iskorištavanja. Monte Carlo i bootstrap metode (TD-učenje). Planiranje i metode zasnovane na modelu okruženja (Dyna algoritam) i metode bez modela okruženja (Q-učenje). Aproksimacija funkcije vrijednosti i politika. Duboko podržano učenje. Primjene podržanog učenja.

Studijski programi

Poslijediplomski doktorski

Literatura

Richard S. Sutton, Andrew G. Barto (2018.), Reinforcement Learning, A Bradford Book
Csaba Szepesvari (2010.), Algorithms for Reinforcement Learning, Morgan & Claypool Publishers
Mohit Sewak (2019.), Deep Reinforcement Learning, Springer

Izvedba

ID 201486
  Ljetni semestar
6 ECTS
R1 Engleski jezik