Abstract

컴퓨터 시스템을 통해 수많은 서비스들이 제공됨에 따라 시스템의 신뢰성 및 가용성이 중요해졌다. 이에 시스템 장애를 예측하여 이를 사전에 방지하는 것이 주요 과제가 되었다. 기존 연구에서 복잡한 시스템의 가용성을 보장하기 위해, 가장 많은 피해 비용을 초래하는 시스템 구성 자원의 장애를 예측하고자 하였으며, 시스템 지식을 기반으로 최적의 데이터 가공 및 예측 알고리즘을 적용하여 높은 예측률의 모델을 얻고자 하였다. 하지만, 최적의 모델을 얻기 위해서는 반복적인 데이터 분석 및 가공, 예측 모델 최적화 및 비교가 필요하였고 해당 과정의 일부만이 경험적 지식에 의존하여 수동적으로 수행되었다. 본 논문에서는 최적화된 예측 모델을 얻기 위한 과정을 전략적으로 자동화하여 이러한 비용을 최소화하는 프레임워크를 구현하였다. 이를 위해 기존 연구에서 장애와 높은 연관성이 검증된 데이터를 수집하는 모니터링 시스템과 자동화된 기계 학습을 적용하여 특징 공학, 알고리즘 선택, 예측모델 최적화 과정을 자동화하고, 생성된 모델을 기반으로 실시간 장애 예측을 가능하게 하였다. 또한 여러 논문에서 파편화되어 있는 장애 개념, 예측 방법 및 적용을 체계화하고 프레임워크에 반영하였다.

Talk to us

Join us for a 30 min session where you can share your feedback and ask us any queries you have

Schedule a call

Disclaimer: All third-party content on this website/platform is and will remain the property of their respective owners and is provided on "as is" basis without any warranties, express or implied. Use of third-party content does not indicate any affiliation, sponsorship with or endorsement by them. Any references to third-party content is to identify the corresponding services and shall be considered fair use under The CopyrightLaw.