Ikaskuntza sakona (deep learning) tekniken analisi teorikoa eta praktikoa matlab-en.
View/ Open
Date
2023-11-30Author
Gorospe Hernáez, Erik
Metadata
Show full item recordAbstract
Indartze ikaskuntza froga eta errore teknika bat da, sari-sistema batean oinarritua. Agenteak,
arazoari irtenbide optimo bat lortzeko helburuarekin, ingurunearekin elkarreragiten du.
Interakzio bakoitzean, agenteak sari bat jasotzen du, egindako ekintza zein ona izan den
adierazten duena. Horrela, ikaskuntza-prozesu baten ondoren, agentea gai da arazoaren
konponbide optimoa bere kabuz aurkitzeko.
Teknika horren barruan algoritmo asko garatu dira, eta egoera desberdinetarako balio dute.
Politikak, eragileak eta kritiko deterministak edo estokastikoak bereizi behar ditugu. Horrela,
algoritmo hauetako bat aukera daiteke: PPO, DDPG, SAC, TD3…
MatLab bezalako programei esker, algoritmo horiekin modu errazean lan egiteko gai gara, eta
hainbat esparrutan frogatzeko ahalmena dugu, hala nola gidatze automatikoan edo
probabilitate-banaketan