摘要:En este artículo damos una vista general de los esfuerzos para mejorar las técnicas actuales de balanceo de cargas y eficiencia en el cómputo con el uso del método de elementos finitos (MEF o FEM por sus siglas en inglés) en máquinas paralelas de gran escala. Introducimos también un balanceo de cargas multinivel para mejorar las diferencias locales. El MEF es usado para aproximar numéricamente las soluciones a ecuaciones diferenciales parciales (EDP o PDE por sus siglas en inglés) o a ecuaciones integrales. El dominio de las EDP se hace discreto convirtiéndolo en una malla de información y usualmente se soluciona utilizando métodos iterativos. La distribución de la malla en los procesadores de una computadora paralela, también conocido como el problema de partición de la malla, es NP-completo. Muchos esfuerzos se enfocan en partición de grafos para paralelizar y distribuir la malla de información. La partición de la información es importante para ejecutar las aplicaciones eficientemente en sistemas distribuidos. Para abordar este problema, una variedad de librerías de propósito general y técnicas se han desarrollado proveyendo gran efectividad. Pero el problema del balanceo de cargas no está del todo solucionado. Las extensas simulaciones de hoy requieren nuevas técnicas para poder ser ejecutadas eficientemente en sistemas de miles de procesadores y para tomar en cuenta los recursos disponibles debido al extenso uso de arquitecturas heterogéneas en la actualidad. Las librerías y algoritmos actuales deben ser adaptados para ser capaces de manejar aplicaciones más complejas y diferentes arquitecturas de hardware. Nosotros presentamos las tendencias en este campo y discutimos nuevas ideas que consideran los requerimientos emergentes.
其他摘要:In this paper, we give an overview of efforts to improve current techniques of load-balancing and efficiency of finite element method (FEM) computations on large-scale parallel machines and introduce a multilevel load balancer to improve the local load imbalance. FEM is used to numerically approximate solutions of partial differential equations (PDEs) as well as integral equations. The PDEs domain is discretized into a mesh of information and usually solved using iterative methods. Distributing the mesh among theprocessors in a parallel computer, also known as the mesh-partitioning problem, was shown to be NP- complete. Many efforts are focused on graph- partitioning to parallelize and distribute the mesh of information. Data partitioning is important to efficiently execute applications in distributed systems. To address this problem, a variety of general-purpose libraries and techniques have been developed providing great effectiveness. But the load-balancing problem is not yet well solved. Today’s large simulations require new techniques to scale on clusters of thousands ofprocessors and to be resource aware due the increasinguse of heterogeneous computing architectures as found in many-core computer systems. Existing libraries and algorithms need to be enhanced to support more complex applications and hardware architectures. We present trends in this field and discuss new ideas and approaches that take into account the new emerging requirements.
关键词:Load balancing; FEM; HPC efficiency; Balanceo de cargas; método de elementos finitos; eficiencia en computación de altodesempeño