Abstract

이상치는 데이터 분석 결과를 왜곡하여 오역을 가져오기 때문에 데이터 분석 과정에서 이상치를 판별하고 처리하는 단계는 매우 중요하다. 이상치에 관한 문제 해결을 위해 다양한 방법론이 연구되고 있으며 그 중 영향함수는 이러한 이상치를 판별하는데 활용되는 함수이다. Hampel은 영향함수가 많은 통계량에서 이상치의 판별이 가능함을 보였다. 한편, 방대한 양의 데이터가 실시간으로 쌓이는 빅데이터의 분석 과정에서 안정적인 데이터의 선별은 상당히 중요한 과정이다. 본 연구에서는 관측값들이 갖는 t통계량에 대한 영향력을 측정하는 영향함수를 이용해 이상치를 판별하기 위해서 사용되는 기존의 영향함수의 역할을 역으로 활용해 본다. 즉, 영향함수를 유도하고 이상치의 판별에 주로 활용하였던 선행 연구들과는 달리 영향함수의 값을 최소로 하는 관측값을 찾아 t통계량에 대해 안정적인 관측값의 위치를 파악한다.

Full Text
Paper version not known

Talk to us

Join us for a 30 min session where you can share your feedback and ask us any queries you have

Schedule a call

Disclaimer: All third-party content on this website/platform is and will remain the property of their respective owners and is provided on "as is" basis without any warranties, express or implied. Use of third-party content does not indicate any affiliation, sponsorship with or endorsement by them. Any references to third-party content is to identify the corresponding services and shall be considered fair use under The CopyrightLaw.