Abstract

농림축산검역본부가 운영하는 동물보호관리시스템 홈페이지에 유기나 유실된 반려동물에 대한 공고들 중에서 2014년부터 2018년까지 반려견의 자료 32만여 건을 크롤링(crawling)하여 전처리하였다. 이 과정에서 분석에 사용할 속성변수들을 정의하였다. 유기나 유실되어 동물보호소에 보호되고 있는 반려견의 입양성공에 영향을 미치는 요인을 알아내고, 입양 확률을 예측하기 위해서 입양확률예측모형을 구축하였다. 전처리된 자료들은 먼저 k-프로토타입(k-prototype) 군집법을 이용하여 두 개의 군집으로 나누어 분석하였다. 두 군집에서 속성별 입양 비율을 분석하였다. 각 모형의 오즈비(odds ratio)와 오즈비의 95% 신뢰구간을 이용하여 속성변수의 수준(level)간의 입양성공에 대한 영향력을 비교하였다. 두 집단의 입양확률예측모형에 대한 정확도, 민감도, 특이도와 이들의 95% 신뢰구간을 구하였고, 모형의 ROC 곡선을 구하였다. 입양확률예측모형과 대체확률(threshold value)을 이용한 모의실험을 통하여 동물보호관리시스템 홈페이지이나 다른 반려견 입양관련 단체에서 입양을 활성화하는 방안을 제시하였다. 국외 반려견 관련 연구의 영향력 속성변수와 비교·논의하였다.Data of over 320 thousand abandoned dogs impounded in animal shelters of local governments during years of 2014 and 2018 are crawled from the homepage of animal protection management system run by Animal and Plant Quarantine Agency. Data are preprocessed and divided into two groups using k-prototype clustering method for modeling adoption probability prediction model. In order to find the optimal model stepwise logistic regression method of backward elimination is used based on AIC. Factors for adoption success are found using odds ratio. Odds ratios and their 95% confidence intervals are obtained and used for comparison of effects on adoption success of levels of each attribute. Accuracy, sensitivity, specificity, and ROC curves of the optimal models are obtained. And also their 95% bootstrap confidence intervals are calculated. The proper use of the threshold and predicted adoption probabilities is discussed. Some effective method for improving adoption probability is suggested through the simulation.

Full Text
Published version (Free)

Talk to us

Join us for a 30 min session where you can share your feedback and ask us any queries you have

Schedule a call