Abstract

Article describes functional capabilities and software implementation peculiarities of parallel algorithms library Krylov, which is oriented on the solution of large systems of linear algebraic equations with sparse symmetric and unsymmetric matrices (positive definite and semi-definite) obtained from discrete approximations of multidimensional boundary value problems for partial differential equations on unstructured meshes. The library includes two-level iterative methods in Krylov subspaces; preconditioning of the latter is based on the balanced decomposition of the computational domain with variable sizes of subdomain overlapping and different boundary conditions on interfacing boundaries. Program implementations use typical compressed sparse matrix data formats. Results of numerical experiments are presented which demonstrate the efficiency of parallelization for typical ill-conditioned problems.

Highlights

  • Настоящая работа содержит описание функционального наполнения и технологических подходов библиотеки параллельных итерационных алгоритмов Krylov, ориентированной на решение больших систем линейных алгебраических уравнений (СЛАУ) с разреженными матрицами, возникающими при конечнообъемных или конечно-элементных (МКО или МКЭ [3, 4]) аппроксимациях многомерных краевых задач для систем дифференциальных уравнений на неструктурированных сетках, на многопроцессорных вычислительных системах (МВС с количеством ядер в десятки и сотни тысяч)

  • Article describes functional capabilities and software implementation peculiarities of parallel algorithms library Krylov, which is oriented on the solution of large systems of linear algebraic equations with sparse symmetric and unsymmetric matrices (positive definite and semi-definite) obtained from discrete approximations of multidimensional boundary value problems for partial differential equations on unstructured meshes

Read more

Summary

Функциональное наполнение библиотеки Krylov

Что СЛАУ (1) представляет собой систему сеточных уравнений, так что каждая компонента векторов u, f соответствует узлу сетки, общее число которых в расчетной сеточной области Ωh = Ωp равно N. Пусть матрица (1) задана в сжатом разреженном CSR-формате [8] с указанием числа строк Np в каждой из P подсистем (2), в соответствии с разбиением матрицы A на блочные строки Ap. Естественно, предполагается, что строки исходной матрицы пронумерованы p−1 p подряд от 1 до N , так, что номера строк каждого блока Ap меняются от 1 + Ni до Ni. На основе блочного представления СЛАУ (2) стандартным образом строится аддитивный метод Шварца, на алгебраическом языке представляющий блочный итерационный метод Якоби. В последнем случае фактически реализуются переменные (динамические) предобуславливатели Bn, при этом реально вместо (8) используется универсальный гибкий метод обобщенных минимальных невязок FGMRES [7], оптимизирующий невязку в подпространствах Крылова

Особенности параллельной реализации алгоритмов
Общая организация двухуровневых итераций
Реализация внутренних итераций в подобластях
Результаты численных экспериментов
Full Text
Published version (Free)

Talk to us

Join us for a 30 min session where you can share your feedback and ask us any queries you have

Schedule a call