Abstract

오늘날 정보통신 및 모바일 기술의 발달로 인해 빅 데이터의 시대가 도래하였다. 데이터 마이닝은 빅 데이터 기술 중에 가장 주목받고 있으며, 특히 연관성 규칙은 흥미도 측도에 의해 데이터베이스 내의 항목들 간에 관련성 유무를 탐색하는 기법이다. 본 논문에서는 연관성 규칙의 생성을 위한 평가 기준으로 대칭적 균형화 교차 엔트로피를 변형하여 수정된 대칭적 균형화 J 측도를 제안하고 예제를 통해 기존의 J 측도 기반 측도들과 비교하였다. 그 결과, 동시 발생 빈도가 증가하거나 불일치 빈도가 증가하는 경우 모두 기존의 측도들인 J 측도, 균형화된 교차 엔트로피 측도, 대칭적 J 측도, 그리고 대칭적 균형화 교차 엔트로피 측도는 감소하다가 증가하는 경향을 나타내었다. 그러나 본 논문에서 제안하는 수정된 대칭적 균형화 J 측도는 동시 발생 빈도가 증가하는 경우에는 증가하고, 불일치 빈도가 증가하는 경우에는 감소하는 경향을 나타내고 있었다. 또한 기존의 J 기반의 측도들은 항상 양의 값만을 취한 반면에 수정된 대칭적 균형화 J 측도는 음의 값으로 나타나는 경우도 있고 양의 값으로 계산되는 경우도 있어서 연관성의 방향을 잘 표현하는 측도라는 사실을 확인하였다.Today, the development of ICT and mobile technologies has brought the age of big data. Data mining has received the most attention among big data technologies. In particular, the association rule is a technique for searching for relationships among items in a database by interestingness measures. In this paper, we proposed a modified symmetrically balanced J measure (MSBCE) by modifying the symmetrically balanced cross-entropy as an evaluation criterion for generating association rules and compared J based measures with examples. As a result, the existing measures, J measure, balanced cross entropy measure, symmetric J measure, and symmetrically balanced cross entropy measure tended to decrease and then increase when the co-occurrence frequency or the discrepancy frequency increased. However, MSBCE proposed in this paper tended to increase when the frequency of co-occurrences increased and decrease when the frequency of mismatch increased. In addition, while existing J based measures always take only positive values, MSBCE may appear as negative values or may be calculated as positive values. Thus, it can be seen as a measure of the direction of association.

Full Text
Paper version not known

Talk to us

Join us for a 30 min session where you can share your feedback and ask us any queries you have

Schedule a call