Abstract

Desktop Grid is a powerful tool to perform high-throughput computing. Desktop Grid is a form of distributed high-throughput computing system, which uses idle time of non-dedicated geographically distributed computing nodes connected over low-speed network. It has significant differences from computing clusters and computational GRIDs, and needs special operation tackle. In this paper, we present a mechanism for dynamic forecasting of the completion time of a computational experiment in a Desktop Grid. We propose a statistical approach based on the linear regression model with the calculation of a confidence interval, taking into account the accumulation of statistical error and, if needed, changing the forecast. The developed approach is used to implement a forecasting algorithm and software module for a Desktop Grid. We present experimental results based on data from the RakeSearch volunteer computing project.

Highlights

  • In this paper, we present a mechanism for dynamic forecasting of the completion time of a computational experiment in a Desktop Grid

  • We propose a statistical approach based on the linear regression model with the calculation of a confidence interval, taking into account the accumulation of statistical error and, if needed, changing the forecast

  • We present experimental results based on data from the RakeSearch volunteer computing project

Read more

Summary

Введение

В различных областях науки и техники существуют проблемы, требующие больших вычислительных ресурсов для нахождения решения. Системы типа Desktop Grid хорошо подходят для выполнения научных высокопроизводительных расчетов [1]. Системы типа Desktop Grid являются популярными инструментами для решения вычислительно емких научных задач типа «bag of tasks». Вычислительный эксперимент представляет собой набор заданий, для которого анализ результатов может быть начат только после завершения всех задач вычислительного эксперимента. Динамическое построение прогноза времени завершения вычислительного эксперимента в Desktop Grid. Соответственно, возникает проблема оценки времени выполнения набора заданий; для исследователя важно знать, когда он может начать обработку результатов вычислительного эксперимента. Существует ряд особенностей, которые осложняют оценку времени выполнения набора заданий в Desktop Grid: высокая аппаратная и программная гетерогенность; низкая надежность вычислительных узлов; неопределенность времени обработки. Оценка времени выполнения является важной проблемой для вычислительных проектов, основанных на системах типа Desktop Grid. В данной статье мы представляем процедуру динамической оценки времени выполнения набора заданий. В данной работе мы предлагаем статистический подход, основанный на линейной регрессионной модели, расчете доверительного интервала и динамическом пересчете прогноза с учетом накопленной статистической ошибки

Обзор работ
Динамическое построение прогноза
Full Text
Published version (Free)

Talk to us

Join us for a 30 min session where you can share your feedback and ask us any queries you have

Schedule a call