Ikaskuntza sakona (deep learning) tekniken analisi teorikoa eta praktikoa matlab-en.

Gorospe Hernáez, Erik

View/Open

GrAL_Gorospe.pdf (1.291Mb)

Date

2023-11-30

Author

Gorospe Hernáez, Erik

Metadata

Show full item record

Estadisticas en RECOLECTA
(LA Referencia)

URI

http://hdl.handle.net/10810/63288

Abstract

Indartze ikaskuntza froga eta errore teknika bat da, sari-sistema batean oinarritua. Agenteak, arazoari irtenbide optimo bat lortzeko helburuarekin, ingurunearekin elkarreragiten du. Interakzio bakoitzean, agenteak sari bat jasotzen du, egindako ekintza zein ona izan den adierazten duena. Horrela, ikaskuntza-prozesu baten ondoren, agentea gai da arazoaren konponbide optimoa bere kabuz aurkitzeko. Teknika horren barruan algoritmo asko garatu dira, eta egoera desberdinetarako balio dute. Politikak, eragileak eta kritiko deterministak edo estokastikoak bereizi behar ditugu. Horrela, algoritmo hauetako bat aukera daiteke: PPO, DDPG, SAC, TD3… MatLab bezalako programei esker, algoritmo horiekin modu errazean lan egiteko gai gara, eta hainbat esparrutan frogatzeko ahalmena dugu, hala nola gidatze automatikoan edo probabilitate-banaketan