Abstract

Abstract. The problem of load balancing for unstructured heterogeneous numerical algorithms for simulation of physical processes is considered. A computational distribution method for hybrid supercomputers with multicore CPUs and massively parallel accelerators is described. The load balancing procedure includes determination of dual graph vertices and edges weights, devices’ performance test and two-level decomposition of the computational mesh based on domain decomposition method. First level decomposition involves the graph partitioning between supercomputer nodes. On the second level node subdomains are partitioned between the MPI- processes running on the nodes. The details of the proposed approach are considered on the example of an unstructured finite-volume algorithm for modeling the Navier-Stokes equations with polynomial reconstruction of variables and explicit time integration scheme. The parallel version of the algorithm is developed using the MPI, OpenMP and CUDA programming models. The parameters of performance, parallel efficiency and scalability of the heterogeneous program are given. The results mentioned are obtained during the simulation of a supersonic flow around a sphere on a mixed mesh consisting of tetrahedrons, triangular prisms, quadrangular pyramids and hexagons.

Highlights

  • The problem of load balancing for unstructured heterogeneous numerical algorithms for simulation of physical processes is considered

  • The load balancing procedure includes determination of dual graph vertices and edges weights, devices’ performance test and two-level decomposition of the computational mesh based on domain decomposition method

  • First level decomposition involves the graph partitioning between supercomputer nodes

Read more

Summary

Введение

Вычислительный эксперимент постепенно становится основным методом предварительной оценки характеристик проектируемых технических объектов и моделирования физических процессов. Качество результатов расчета задач вычислительной газовой динамики (CFD), помимо точности численного алгоритма, зависит от типа и пространственного шага сетки. Аппаратно заложенный в гетерогенной архитектуре многоуровневый параллелизм требует разработки специальных вычислительных алгоритмов, сочетающих модели параллельных вычислений с распределенной (уровень узлов кластера) и общей (уровень CPU-ядер одного узла) памятью, а также параллелизм SIMD (Single Instruction Multiple Data) на уровне сопроцессоров. Описание примеров алгоритмов моделирования задач газовой динамики для гетерогенных систем и их программных реализаций можно найти в работах [2,3,4,5]. Результат разбиения для вычислений в гетерогенном режиме должен дополнительно учитывать фактическое соотношение производительности программных реализаций CFD-алгоритма для разных устройств. В настоящей работе на примере параллельного алгоритма моделирования уравнений Навье-Стокса описан эффективный подход к решению проблемы балансировки загрузки для гетерогенных вычислений. Приводятся оценки производительности и параллельной эффективности расчета сверхзвукового обтекания сферы на смешанной сетке с четырьмя типами элементов

Параллельный алгоритм моделирования уравнений НавьеСтокса
Алгоритм балансировки загрузки
Результаты вычислительных экспериментов
Full Text
Published version (Free)

Talk to us

Join us for a 30 min session where you can share your feedback and ask us any queries you have

Schedule a call