Abstract

The study of measures of reliability of the hardware part of the office cluster was carried out on the example of the cluster SKIF-GEO-Office RB (further as “cluster”) developed within the framework of scientific and technical program "SKIF-NEDRA" (2015-2018, Program of the Union State of Russia and Belarus). The cluster components are located in a small rack on the basis of full Tower "Aerocool Expredator Black" type case.The basic architectural principles implemented in the cluster, the composition, structural and functional scheme of the cluster are given. The methodological support for calculating the reliability of the cluster, based on previous studies of the authors, and its structural scheme of reliability is justified. The choice of the main measures of reliability of the cluster core and the set of computing facilities is justified and formulas of calculation of these measures are given. The analysis of the consequences of failures of component parts of the cluster is carried out.A mathematical model of reliability (state graph) of the set of computing facilities of cluster is proposed, which allows to derive formulas for calculating the average value of the time-to-failure and time-to-interruption of cluster. The estimation of the reliability of the cluster as a whole, based on the calculation of measures of reliability on the reference data on the reliability of components as well as on the operation of supercomputers of the family SKIF. The measures of reliability of the cluster are calculated.

Highlights

  • The cluster components are located in a small rack on the basis of full Tower "Aerocool Expredator Black" type case

  • The basic architectural principles implemented in the cluster, the composition, structural and functional scheme of the cluster are given

  • Расчет показателей надежности кластера СКИФ-ГЕО-Офис РБ выполнен по методике оценки надежности кластерных вычислительных систем, предложенной канд. техн. наук, доцентом Л

Read more

Summary

Исследование надежности аппаратной части офисного кластера

Исследование показателей надежности аппаратной части офисного суперкомпьютера проводилось на примере кластера СКИФ-ГЕО-Офис РБ, разработанного в рамках научно-технической программы Союзного государства «СКИФ-НЕДРА» (2015–2018 гг.). Предлагается методическое обеспечение расчета надежности кластера с учетом предыдущих исследований авторов, обосновывается его структурная схема надежности. Даются формулы расчета основных показателей надежности ядра и совокупности вычислительных средств (СВС) кластера, анализируются последствия отказов его комплектующих. Предлагается математическая модель надежности (граф состояний) СВС кластера, позволяющая получать формулы для вычисления средней наработки на отказ и на сбой СВС. Оценивается надежность кластера в целом по справочным данным о надежности его комплектующих и по данным эксплуатации суперкомпьютеров семейства СКИФ, вычисляются показатели надежности кластера. Ключевые слова: офисный кластер, показатели надежности, расчет надежности, структурная схема надежности, семейство СКИФ, кластер СКИФ-ГЕО-Офис РБ. Исследование надежности аппаратной части офисного кластера / Т.

Коммутатор Gigabit Ethernet
Ядро кластера
Управляющий узел кластера
Порт коммутатора с кабелем
Среднюю наработку на отказ ВУ кластера получаем по формуле
Составная часть ССН
Список использованных источников

Talk to us

Join us for a 30 min session where you can share your feedback and ask us any queries you have

Schedule a call

Disclaimer: All third-party content on this website/platform is and will remain the property of their respective owners and is provided on "as is" basis without any warranties, express or implied. Use of third-party content does not indicate any affiliation, sponsorship with or endorsement by them. Any references to third-party content is to identify the corresponding services and shall be considered fair use under The CopyrightLaw.