Published June 30, 2023 | Version v1
Conference paper Open

Análisis de métodos de redistribución de datos para aplicaciones MPI maleables

  • 1. Universitat Jaume I
  • 2. Barcelona Supercomputing Center

Description

La maleabilidad de procesos puede definirse como la capacidad de un trabajo paralelo MPI distribuido para modificar el número de procesos sin detener su ejecución, reasignando los recursos computacionales inicialmente asignados al trabajo tantas veces como sea necesario.
En general, la maleabilidad se compone de cuatro etapas: reasignación de recursos, gestión de procesos, redistribución de datos y reanudación de la ejecución.
Entre ellas, la tercera etapa es la que más tiempo consume y domina el tiempo total de reconfiguración.
En este artículo se comparan diferentes implementaciones de esta etapa utilizando operaciones MPI punto a punto y colectivas, incluyendo sus versiones no bloqueantes, tanto para Ethernet 10G como para Infiniband EDR. 
Estas estrategias de redistribución de datos se combinan con diferentes métodos para expandir/reducir trabajos utilizando una aplicación que solo realiza la segunda y tercera etapa de la maleabilidad, lo que permite evaluar el coste de las diferentes metodologías de modo aislado.
Los resultados muestran que la versión punto a punto no bloqueante junto al método de creación de procesos Merge, es la alternativa que más reduce el tiempo de redistribución.

Files

JS2023_paper_49.pdf

Files (2.4 MB)

Name Size Download all
md5:42e8a2d23fc0de7f46f272a662881b39
2.4 MB Preview Download