Algoritmos de clusterización e identificación de clústeres de galaxias
Date
2020-12-15Author
García de Andoin Bolaño, Mikel
Metadata
Show full item recordAbstract
[EN] In a world overwhelmed with new data that is generated constantly we need efficient ways to obtain valuable information from it. In this aspect, clustering algorithms prove to be a useful tool to face this problem. This work reviews briefly some of the most important clustering algorithms that can be used on databases based on points. In this aspect, this work faces the problem of galaxy clustering, in which the available databases have of the order of 10^6 data points. This work discusses the best algorithm to face this problem. Implementing the DBSCAN algorithm, and using the SDSS DR16 galaxy database, I identify successfully at least 33% of the clusters previously identified in the SPIDERS cluster database. The implementation of DBSCAN made for this work uses variable clustering parameters, which could be used in other problems that can't be solved with constant parameters. [ES] En un mundo abrumado con nuevos datos que se generan constantemente necesitamos maneras eficientes de obtener información valiosa de ella. En este aspecto, los algoritmos de agrupación demuestran ser una herramienta útil para enfrentar este problema. Este trabajo revisa brevemente algunos de los algoritmos de agrupación más importantes que se pueden utilizar en bases de datos basadas en puntos. En este aspecto, este trabajo se enfrenta al problema del agrupamiento de galaxias, en el que las bases de datos disponibles tienen del orden de 10^6 puntos de datos. Este trabajo discute el mejor algoritmo para enfrentar este problema. Implementando el algoritmo DBSCAN y utilizando la base de datos SDSS DR16, identifico con éxito al menos el 33% de los clústeres previamente identificados en la base de datos de clúster SPIDERS. La implementación de DBSCAN para este trabajo utiliza parámetros de agrupación variables, que podrían usarse en otros problemas que no se pueden resolver con parámetros constantes.