Оптимизация отображения неоднородно взаимодействующих MPI процессов на вычислительную архитектуру

В.в Гетманский ,В С Чалышев ,Д В Крыжановский ,Евгений Иванович Лексиков

doi:10.14529/cmse150201

Abstract

The problem of mapping the parallel task to the nodes of computing cluster is considered. MPI software with non-uniform communication and heterogeneous interconnect of computing cluster require to appropriate parallel processes mapping for optimization of data exchange. The graph mapping algorithm is developed. It uses parallel program representation as a task graph and cluster topology representation as system graph. The proposed optimization technique is tested on synthetic benchmark and on real QBox software to study its efficiency on large number of computing cores. The positive results of optimization are achieved and the summary is presented in the paper. Speedup of 17–20% is obtained on scalable benchmarks using 300–4800 parallel processes.

Highlights

Проблема отображения параллельной программы на архитектуру вычислительной системы с целью уменьшения времени обмена данными рассмотрена в ряде работ отечественных [1, 2] и зарубежных [3,4,5] авторов
Конфигурация для тестирования состоит из двух узлов с установленными сопроцессорами Intel® Xeon PhiTM, содержащими по 60 ядер, доступных для вычислений
MPI software with non-uniform communication and heterogeneous interconnect of computing cluster require to appropriate parallel processes mapping for optimization of data exchange

Summary

Постановка задачи

Где — набор вершин графа (процессы), — набор связей (взаимодействие процессов), — частота обмена данными, — объем обмениваемых данных, — число связей. Обозначим граф системы как ( , ), = , , = 1, ... Где — множество вершин (соответствующих вычислительным ядрам центральных процессоров или сопроцессоров), — множество ребер (каналы передачи данных), —. В первом приближении в графе системы передача данных возможна между любой парой вершин, т.е. Все ребра графа задачи взвешены объемом обмениваемых данных между процессами, которым соответствуют вершины ребра. Граф системы взвешен коэффициентом задержки канала связи. Что сетевое взаимодействие заведомо медленнее взаимодействия через общую память, определено как. Целевая функция вычисляется как сумма произведений весов ребер:. Для решения задачи отображения необходимо построить граф задачи и граф системы, разработать алгоритм поиска отображения графа задачи на граф системы с целью минимизации суммы произведений весов ребер

Алгоритм отображения

Алгоритм полного перебора

Алгоритм с «жадной» стратегией

Итеративная процедура улучшения решения

Описание синтетического теста

Запуск тестов

Синтетический тест для двух узлов кластера с сопроцессорами

Синтетический тест для 10 узлов с InfiniBand интерконнектом

Full Text

Paper version not known

Open DOI Link

Talk to us

Join us for a 30 min session where you can share your feedback and ask us any queries you have

Schedule a call

R Discovery Prime

R Discovery Prime

Оптимизация отображения неоднородно взаимодействующих MPI процессов на вычислительную архитектуру

Abstract

Highlights

Summary

Talk to us

Similar Papers

More From: Bulletin of the South Ural State University. Series "Computational Mathematics and Software Engineering"

Lead the way for us

Journal: Bulletin of the South Ural State University. Series "Computational Mathematics and Software Engineering"	Publication Date: May 1, 2015
License type: cc-by

Similar Papers

Optimizing Processes Mapping for Tasks with Non-uniform Data Exchange Run on Cluster with Different Interconnects
Victor Getmanskiy ... Vladimir Chalyshev
-
Victor Getmanskiy, et. al.Victor Getmanskiy ... Vladimir Chalyshev
01 Jan 2015
01 Jan 2015

Dynamic task-based anycasting in mobile ad hoc networks
Prithwish Basu ... Thomas D.C Little
Mobile Networks and Applications | VOL. 8
Prithwish Basu, et. al.Prithwish Basu ... Thomas D.C Little
01 Jan 2003
Mobile Networks and Applications | VOL. 8

Iterative task division method or multiprocessor scheduling problem
K Tagawa ... T Heishi
-
K Tagawa, et. al.K Tagawa ... T Heishi
05 Sep 1994
05 Sep 1994

A new task-based approach for supporting distributed applications on mobile ad hoc networks
Prithwish Basu ... Wang Ke
ACM SIGCOMM Computer Communication Review | VOL. 32
Prithwish Basu, et. al.Prithwish Basu ... Wang Ke
01 Jan 2002
ACM SIGCOMM Computer Communication Review | VOL. 32

Editage

Paperpal

R Discovery

Mind the Graph

R Discovery Prime

R Discovery Prime

Оптимизация отображения неоднородно взаимодействующих MPI процессов на вычислительную архитектуру

Abstract

Highlights

Summary

Talk to us

Similar Papers

More From: Bulletin of the South Ural State University. Series "Computational Mathematics and Software Engineering"