Abstract

The paper considers the algorithms for solving large sparse SLAEs arising from grid approximations of boundary value problems. The SLAEs and algorithms are not limited in a sense of number of unknowns, computational nodes, processors and/or cores. This problem is reduced to a distributed variant of algebraic 3D-domain decomposition, in which no excessive load of the root process is present, i.e. all MPI-processes, each of which corresponds to its own subdomain, are almost equal. The computational process consists of two main stages. The first stage is the automatic decomposition, based on the analysis of the matrix portrait and the formation of large-block representation of the original SLAE. The second stage implements a Krylov subspace iterative process with FGMRes (flexible generalized minimal residual method) using either exact or approximate inverse of diagonal blocks as a preconditioner. The methods described are implemented as a part of Krylov, a library of algebraic solvers. The paper presents some features of current parallel implementation and estimates of resource usage. Efficiency of the developed algorithms is illustrated by solving several typical model problems with different parameters and in different configurations of multiprocessor computer systems.

Highlights

  • Особенности реализации распределенных алгоритмовВ высокопроизводительных версиях декомпозиции областей существуют два ключевых момента: формирование разреженных алгебраических систем для соответствующих подобластей и реализация параллельных по подобластям крыловских итерационных процессов якобиевого типа

  • Данная задача сводится к распределенному варианту алгебраической 3D-декомпозиции областей, в котором отсутствует чрезмерная расчетно-информационная нагрузка корневого процессора, т.е. все организуемые MPI-процессы, каждый из которых соответствует своей подобласти, являются практически равноправными

  • The SLAEs and algorithms are not limited in a sense of number of unknowns, computational nodes, processors and/or cores

Read more

Summary

Особенности реализации распределенных алгоритмов

В высокопроизводительных версиях декомпозиции областей существуют два ключевых момента: формирование разреженных алгебраических систем для соответствующих подобластей и реализация параллельных по подобластям крыловских итерационных процессов якобиевого типа

Метод построения квазисбалансированных сеточных подобластей
Особенности программной реализации
Примеры численных экспериментов
Full Text
Paper version not known

Talk to us

Join us for a 30 min session where you can share your feedback and ask us any queries you have

Schedule a call

Disclaimer: All third-party content on this website/platform is and will remain the property of their respective owners and is provided on "as is" basis without any warranties, express or implied. Use of third-party content does not indicate any affiliation, sponsorship with or endorsement by them. Any references to third-party content is to identify the corresponding services and shall be considered fair use under The CopyrightLaw.