Abstract

오늘날 정보통신기술의 발달과 모바일 기기 이용의 확산에 의해 데이터가 폭증하게 됨으로써 빅 데이터의 환경이 도래하였다. 데이터 마이닝은 빅 데이터 시대에 주목받고 있는 기술 중의 하나이며, 이 중에서 연관성 규칙은 여러 가지 연관성 평가 기준에 의해 트랜잭션 내의 항목 간의 관련성을 결정하는 기법이다. 이 기법은 흥미도 측도를 평가 기준으로 하여 트랜잭션에 포함되어 있는 항목간의 관련성을 나타내기 때문에 인터넷 쇼핑몰, 보건 및 의료, 제조업, 그리고 교육 분야 등 현업에서 많이 활용되고 있다. 연관성 평가 기준의 기본적인 흥미도 측도에는 지지도, 신뢰도, 향상도 등 여러 가지 측도들이 연구되어왔다. 일반적으로 연관성 규칙 마이닝에서는 사용자에 의해 정해진 지지도의 최소값을 만족하는 항목집합을 생성한 후 신뢰도의 최저값을 만족하는 것을 연관성 규칙으로 생성한다. 본 논문에서는 규칙의 정보량을 수량화한 측도인 교차 엔트로피를 변형한 균형화된 교차 엔트로피를 연관성 평가 기준의 측도로 제안하여 예제를 통해 이 측도의 연관성 평가 기준으로서의 유용성을 고찰하고자 한다.Today, with the development of information and communication technology and the spread of mobile devices, the data has increased and big data environment has arrived. Data mining is one of the most remarkable technologies in the big data era. One of them is the association rule, which is used to determine whether items are related by various evaluation criteria. This technique is used in many fields such as internet shopping mall, health and medical care, manufacturing, and education because it shows the relation between the two items by using the interestingness measures as the evaluation criteria. The basic interestingness measures of association threshold include support, confidence, and lift. Generally, association rule mining generates a set of items satisfying the minimum value of support determined by the user, and then generates association rules that satisfy the minimum value of confidence. In this paper, we propose balanced entropy as a measure of association evaluation criterion by modifying cross entropy, which is a quantitative measureof the amount of information in a rule, and examine the usefulness of this measure as an association evaluation criterion through some examples.

Full Text
Paper version not known

Talk to us

Join us for a 30 min session where you can share your feedback and ask us any queries you have

Schedule a call

Disclaimer: All third-party content on this website/platform is and will remain the property of their respective owners and is provided on "as is" basis without any warranties, express or implied. Use of third-party content does not indicate any affiliation, sponsorship with or endorsement by them. Any references to third-party content is to identify the corresponding services and shall be considered fair use under The CopyrightLaw.