Abstract

В статье представлено исследование вычислительной эффективности параллельной версии численного алгоритма для решения уравнения Риккати с производной дробного перменного порядка типа Герасимова-Капуто. Численный алгоритм представляет собой нелокальную неявную конечно-разностную схему, которая сводится к системе нелинейных алгебраических уравнений и решается с помощью модифицированного метода Ньютона. Нелокальность численной схемы создает высокую вычислительную нагрузку на вычислительные ресурсы, из-за чего возникает необходимость в реализации эффективных параллельных алгоритмов их решения. Исследуемый на эффективность численный алгоритм реализован на языке C из-за его универсальности при работе с памятью. Распаралеливание проводилось с помощью технологии OpenMP. Проводится серия вычислительных экспериментов на вычислительном сервере NVIDIA DGX STATION (Институт математики имени В.И. Романовского, г. Ташкент, Узбекистан) и ноутбуке HP Pavilion Gaming Laptop Z270X, где решалась задача Коши для дробного уравнения Риккати с непостоянными коэффициентами. На основе среднего времени вычисления вычисляются: ускорение, эффективность и стоимость алгоритма. Из анализа данных видно, что OpenMP параллельная программная реализация нелокальной неявной конечно-разностной схемы показывает ускорение работы от 9-12 раз в зависимости от количества задействованных ядер CPU. The article presents a study of the computational efficiency of a parallel version of a numerical algorithm for solving the Riccati equation with a fractional variable order derivative of the Gerasimov-Caputo type. The numerical algorithm is a nonlocal implicit finite-difference scheme, which reduces to a system of nonlinear algebraic equations and is solved using a modified Newton method. The nonlocality of the numerical scheme creates a high computational load on computing resources, which creates the need to implement efficient parallel algorithms for solving them. The numerical algorithm studied for efficiency is implemented in the C language due to its versatility when working with memory. Parallelization was carried out using OpenMP technology. A series of computational experiments are being carried out on the NVIDIA DGX STATION computing server (Institute of Mathematics named after V.I. Romanovsky, Tashkent, Uzbekistan) and the HP Pavilion Gaming Laptop Z270X, where the Cauchy problem for the fractional Riccati equation with non-constant coefficients was solved. Based on the average computation time, the speedup, efficiency and cost of the algorithm are calculated. From the data analysis it is clear that the OpenMP parallel software implementation of the non-local implicit finite-difference scheme shows an acceleration of 9-12 times, depending on the number of CPU cores involved.

Full Text
Published version (Free)

Talk to us

Join us for a 30 min session where you can share your feedback and ask us any queries you have

Schedule a call