Разработка и реализация облачной системы для решения высокопроизводительных задач

A.O Kudryavtsev,A.O Izbyshev,A.I Avetisyan,V.E Velikhov,V.P Ivannikov,Sh.F Kurmangaleev,V.K Koshelev,E.A Ryabinkin,I.A Dudina

doi:10.15514/ispras-2013-24-1

A.O Kudryavtsev, A.O Izbyshev + Show 7 more

Open Access

https://doi.org/10.15514/ispras-2013-24-1

Copy DOI

Abstract

There is pronounced interest to cloud computing in the scientific community. However, current cloud computing offerings are rarely suitable for highperformance computing, in large part due to an overhead level of underlying virtualization components. The purpose of this paper is to propose a design and implementation of a cloud system that possesses a small enough overhead level to allow it to be practically used for a wide range of scientific workloads. First, we describe requirements for the desired system and classify workloads to identify those that are practical to transfer to the cloud. Then, we review related work. Finally, we describe our cloud system, "Virtual Supercomputer", which is based on the OpenStack cloud infrastructure and KVM/QEMU hypervisor. Most components of the original infrastructure were modified to satisfy the requirements. In particular, we tuned KVM/QEMU and the host operating system, introduced the concept of virtual machine groups and implemented a topology-aware scheduler to reduce communication overhead between network nodes belonging to the same virtual machine group. Also, we implemented a proof-of-concept web service on top of our system that allows to use OpenFOAM toolbox in software-as-a-service manner. The main result of our work is that "Virtual Supercomputer" achieved the overhead level of less than 10% on industry standard benchmarks when using up to 1024 processor cores. We deem this overhead level as acceptable for practical use.

Highlights

Current cloud computing offerings are rarely suitable for highperformance computing, in large part due to an overhead level of underlying virtualization components
The purpose of this paper is to propose a design and implementation of a cloud system that possesses a small enough overhead level to allow it to be practically used for a wide range of scientific workloads
We describe our cloud system, "Virtual Supercomputer", which is based on the OpenStack cloud infrastructure and KVM/QEMU hypervisor

Summary

Введение

При решении различных вычислительных задач, как правило, возникают колебания в объеме задействованных ресурсов, которые связаны с множеством факторов, начиная от характера решаемых задач и заканчивая временем года. Существующие облачные платформы требуют доработки для обеспечения удобства пользователей – должна быть разработана экосистема, позволяющая ученому решать свои задачи без необходимости большого числа подготовительных шагов. При переносе в облако также возникают проблемы, связанные с безопасностью, поскольку возможности пользователя по конфигурированию всего стека ПО существенно возрастают по сравнению с традиционными вычислительными кластерами. В настоящее время, в связи с развитием технологий виртуализации и повышением производительности облачных ресурсов, возникают новые возможности применения концепции облачных вычислений. Целью данной работы является разработка облачной системы, предназначенной для организации высокопроизводительных вычислений. В работе приводится обзор архитектуры разработанной и реализованной облачной системы «виртуальный суперкомпьютер» (далее – ВСК), позволяющей эффективно (с минимальными накладными расходами) решать высокопроизводительные задачи. Основным вкладом данной работы является: 1) Описание основных проблем, возникающих при переносе высокопроизводительных вычислений в облако, и методов их решения. 2) Разработка и реализация облачной системы «виртуальный суперкомпьютер», предназначенной для решения высокопроизводительных задач в облаке.

Обзор литературы

Классификация HPC приложений и переносимость в облако

Перспективные подходы к переносу HPC в облако

Особенности архитектуры облачной системы ВСК

Система виртуализации

Обеспечение производительности ВМ

Контроллер облака

Findings

Особенности архитектуры сервиса OpenFOAM

Full Text

Published version (

Free)

Open DOI Link

Talk to us

Join us for a 30 min session where you can share your feedback and ask us any queries you have

Schedule a call

Journal: Proceedings of the Institute for System Programming of the RAS	Publication Date: Jan 1, 2013
Citations: 1	License type: cc-by

R Discovery Prime

R Discovery Prime

Разработка и реализация облачной системы для решения высокопроизводительных задач

Abstract

Highlights

Summary

Talk to us

Similar Papers

More From: Proceedings of the Institute for System Programming of the RAS

Lead the way for us

Similar Papers

Resource Management for Running HPC Applications in Container Clouds
Stephen Herbein ... Sean McDaniel
-
Stephen Herbein, et. al.Stephen Herbein ... Sean McDaniel
01 Jan 2015
01 Jan 2015

Benchmarking Joyent Smartdatacenter for Hadoop Mapreduce and Mpi Operations
Weiliang Luo ... Anthony Chronopoulos
-
Weiliang Luo, et. al.Weiliang Luo ... Anthony Chronopoulos
01 Oct 2013
01 Oct 2013

Energy Efficient Fault Tolerance for High Performance Computing (HPC) in the Cloud
Ifeanyi P Egwutuoha ... Shiping Chen
-
Ifeanyi P Egwutuoha, et. al.Ifeanyi P Egwutuoha ... Shiping Chen
01 Jun 2013
01 Jun 2013

High Performance Evolutionary Computation
...
-
, et. al. ...
27 Jun 2005
27 Jun 2005

Editage

Paperpal

R Discovery

Mind the Graph

R Discovery Prime

R Discovery Prime

Разработка и реализация облачной системы для решения высокопроизводительных задач

Abstract

Highlights

Summary

Talk to us

Similar Papers

More From: Proceedings of the Institute for System Programming of the RAS