Abstract
Abstract. The problem of load balancing for unstructured heterogeneous numerical algorithms for simulation of physical processes is considered. A computational distribution method for hybrid supercomputers with multicore CPUs and massively parallel accelerators is described. The load balancing procedure includes determination of dual graph vertices and edges weights, devices’ performance test and two-level decomposition of the computational mesh based on domain decomposition method. First level decomposition involves the graph partitioning between supercomputer nodes. On the second level node subdomains are partitioned between the MPI- processes running on the nodes. The details of the proposed approach are considered on the example of an unstructured finite-volume algorithm for modeling the Navier-Stokes equations with polynomial reconstruction of variables and explicit time integration scheme. The parallel version of the algorithm is developed using the MPI, OpenMP and CUDA programming models. The parameters of performance, parallel efficiency and scalability of the heterogeneous program are given. The results mentioned are obtained during the simulation of a supersonic flow around a sphere on a mixed mesh consisting of tetrahedrons, triangular prisms, quadrangular pyramids and hexagons.
Highlights
The problem of load balancing for unstructured heterogeneous numerical algorithms for simulation of physical processes is considered
The load balancing procedure includes determination of dual graph vertices and edges weights, devices’ performance test and two-level decomposition of the computational mesh based on domain decomposition method
First level decomposition involves the graph partitioning between supercomputer nodes
Summary
Вычислительный эксперимент постепенно становится основным методом предварительной оценки характеристик проектируемых технических объектов и моделирования физических процессов. Качество результатов расчета задач вычислительной газовой динамики (CFD), помимо точности численного алгоритма, зависит от типа и пространственного шага сетки. Аппаратно заложенный в гетерогенной архитектуре многоуровневый параллелизм требует разработки специальных вычислительных алгоритмов, сочетающих модели параллельных вычислений с распределенной (уровень узлов кластера) и общей (уровень CPU-ядер одного узла) памятью, а также параллелизм SIMD (Single Instruction Multiple Data) на уровне сопроцессоров. Описание примеров алгоритмов моделирования задач газовой динамики для гетерогенных систем и их программных реализаций можно найти в работах [2,3,4,5]. Результат разбиения для вычислений в гетерогенном режиме должен дополнительно учитывать фактическое соотношение производительности программных реализаций CFD-алгоритма для разных устройств. В настоящей работе на примере параллельного алгоритма моделирования уравнений Навье-Стокса описан эффективный подход к решению проблемы балансировки загрузки для гетерогенных вычислений. Приводятся оценки производительности и параллельной эффективности расчета сверхзвукового обтекания сферы на смешанной сетке с четырьмя типами элементов
Talk to us
Join us for a 30 min session where you can share your feedback and ask us any queries you have
More From: Zhurnal Srednevolzhskogo Matematicheskogo Obshchestva
Disclaimer: All third-party content on this website/platform is and will remain the property of their respective owners and is provided on "as is" basis without any warranties, express or implied. Use of third-party content does not indicate any affiliation, sponsorship with or endorsement by them. Any references to third-party content is to identify the corresponding services and shall be considered fair use under The CopyrightLaw.