Abstract

One of the most important applications of the intelligent operation and maintenance of a cloud database is its trend prediction of key performance indicators (KPI), such as disk use, memory use, etc. We propose a method named AutoPA4DB (Auto Prophet and ARIMA for Database) to predict the trend of the KPIs of the cloud database based on the Prophet model and the ARIMA model. Our AutoPA4DB method includes data preprocessing, model building, parameter tuning and optimization. We employ the weighted MAPE coverage to measure its accuracy and use 6 industrial datasets including 10 KPIs to compare the AutoPA4DB method with other three time-series trend prediction algorithms. The experimental results show that our AutoPA4DB method performs best in predicting monotonic variation data, e.g.disk use trend prediction. But it is unstable in predicting oscillatory variation data; for example, it is acceptable in memory use trend prediction but has poor accuracy in predicting the number of database connection trends.

Highlights

  • 在 Prophet 预测模型中, 当趋势增长函数使用 逻辑回归模型时, cap 参数可设定预测值 的 上 限。 本文针对不同影响因素的敏感性分析结果表明,cap 值对预测准确性影响较大,且与原始数据取值范围 密切相关。 为了使得该参数取值更加有效,在 Auto⁃ PA4DB 中,每个数据库性能指标从其对应原始数据 中自动获取 cap 范围。 Hyper 模式中,cap 值的有效 调参区间将设置为[0.8∗max,1.2∗max],其中 max 表示原始数据中最大值。 在 Auto 模式中,由于 cap

  • Journal of Software, 2012, 23( 5) : 1148⁃1166 ( in Chinese)

Read more

Summary

Introduction

摘 要:云数据库智能运维中的重要应用场景之一是对监控采集的大量性能时序数据进行趋势预测。 提出一种基于 Prophet 模型和 ARIMA 模型的综合调优智能趋势预测方法 AutoPA4DB( auto prophet and ARIMA for database)。 该方法根据数据库性能监控数据的特征,进行了原始监控数据的预处理、 预测模型自动调参和模型优化。 采用加权的时序预测准确性度量 WMC( weighted MAPE coverage), 基于多个企业级数据库实例(包含 10 种性能指标) 进行了实验验证。 实验对比了 5 种不同时序模型 的预测效果,结果表明在单调变化模式(如磁盘使用量) 的数据中,文中提出的 AutoPA4DB 方法时序 预测准确性最高;然而在震荡模式的数据中,预测效果不太稳定,例如内存使用率趋势预测效果较好, 但数据库连接数趋势预测效果不理想。 关 键 词:智能运维;时序数据;Prophet 模型;ARIMA 模型;数据库性能监控 中图分类号:TP311.13 文献标志码:A 文章编号:1000⁃2758(2020)05⁃1030⁃08 2018 年公开了其最新的时序预测框架 Prophet[7] , 该模型是一个可分解的时间序列预测模型,包含趋 人员及时调整云资源,使得资源配置最优,有效节约 运维成本。 本文针对数据库运维性能指标时序数据 提出了一种针对性更强的 AutoPA4DB 预测方 法。 该方法以 Prophet 算法和 ARIMA 算法为基础,针对 数据库监控指标的数据特点进行了综合优化。 本文 在 6 个企业级数据库实例数据集上和 6 个竞赛数据 库实例数据集上分别进行了实验验证, 结果表明 AutoPA4DB 模型在磁 盘 使 用 量、 内存使用率、 CPU 使用率等部分性能指标趋势性预测中的预测准确度 较高,且预测准确度高于优化前模型和其他对比模 型。 但在 TPS( 每秒处理的事物数) 及数据库连接 数等指标中,预测效果并不理想。

Results
Conclusion
Full Text
Published version (Free)

Talk to us

Join us for a 30 min session where you can share your feedback and ask us any queries you have

Schedule a call