PCTEnsembles: integración de la consolidación parcial en varios ensembles de la plataforma Weka
Date
2022-10-20Author
Gámiz Aisa, Jon
Metadata
Show full item recordAbstract
El objetivo principal de este proyecto es integrar los algoritmos PCTRSM (Partially Consolidated Tree Random Subspace Method) y PCTRF (Partially Consolidated Tree Random Forest) diseñados por el grupo de investigación ALDAPA en la plataforma de código abierto WEKA.
El PCTRSM y el PCTRF son ambos una variación del algoritmo PCTBagging, en los que se incluyen los ensembles Random Subspace Method (RSM) y Random Forest (RF), respectivamente, en lugar del conocido clasificador múltiple o ensemble Bagging. El PCTBagging, es un híbrido entre el CTC (Árboles consolidados - Consolidated Tree Construction) y el Bagging (Árboles no consolidados), dependiendo del porcentaje de consolidación, 100% ó 0%, respectivamente. Si los árboles son (parcialmente) consolidados tendrán una estructura común y ésta proporcionará la explicación de la clasificación realizada.
Los ensembles RSM y RF introducen un factor de aleatoriedad en la construcción de los árboles que los componen, reduciendo (de diferente forma) el conjunto de variables a usar. Este mecanismo de aleatoriedad se puede integrar en el proceso de consolidación de los árboles y construir en WEKA los algoritmos propuestos en este trabajo: PCTRSM y PCTRF.
Se han realizado pruebas con 33 bases de datos donde se compararán los resultados obtenidos con el algoritmo CTC, el PCTBagging, PCTRSM, PCTRF y otros clasificadores con los que pueden competir. Todas estas pruebas y la experimentación se llevará a cabo en WEKA.