Published September 23, 2022 | Version v1
Conference paper Open

Biblioteca Paralela de Selección de Características para Sistemas Clúster

  • 1. CITIC, Grupo de Arquitectura de Computadores, Universidade da Coruña

Description

La selección de características es un campo del aprendizaje automático centrado en la reducción de dimensionalidad de conjuntos de datos a través de la realización de un proceso computacionalmente costoso. En este trabajo presentamos Parallel-FST, una biblioteca paralela, públicamente disponible, para selección de características que contiene siete métodos que siguen una aproximación híbrida MPI/multihilo para reducir su tiempo de ejecución explotando los recursos de sistemas de computación de altas prestaciones. En las pruebas de rendimiento, llevadas a cabo en un clúster de 256 núcleos, Parallel-FST alcanzó aceleraciones de hasta 229x para conjuntos de datos representativos, además de ser capaz de analizar un conjunto de datos de 512 GB, lo que no era posible con la implementación secuencial debido a las limitaciones de memoria.

Notes

Esta investigación ha sido financiada por el Ministerio de Ciencia e Innovación (PID2019-104184RB-I00 / AEI / 10.13039/501100011033), por el Ministerio de Universidades (ayuda FPU20/00997), y por la Xunta de Galicia a través del Programa de Consolidación de Grupos de Referencia Competitiva (ref. ED431C 2021/30). También agradecemos el apoyo del Centro de Investigación de Galicia CITIC, financiado por la Xunta de Galicia y fondos FEDER de la UE (acreditación 2019-2022, ref. ED431G 2019/01).

Files

Biblioteca_Paralela_de_Seleccion_de_Caracteristicas_para_Sistemas_Cluster.pdf.pdf

Additional details

Related works

Is published in
Book: 978-84-1302-185-0 (ISBN)