
Background . Development and study of characteristics for naive and tree-augmented classifiers in the form of Bayesian networks in the problem of credit risk estimation. Objective . To perform estimation of classification quality for the bank credit borrowers using Bayesian classifiers of two types. Methods . Development of necessary mathematical tools and performing computational experiments aiming towards constructing classifiers in the form of Bayesian networks using actual statistical data characterizing solvency of bank credit borrowers. Results . The following results were achieved: the methodology of constructing and application of the naive and tree-augmented Bayesian classifiers for solving the problem of solvency estimation for bank credit borrowers; an analysis of computational algorithmic complexity was performed; two classification models were constructed in the form of Bayesian networks using actual statistical data from banking system; a comparative analysis was performed for the models developed. Conclusions . It was established that the tree-augmented classifier exhibits higher computational complexity than the naive Bayesian one, but it showed higher classification results while solving the problem of bank clients classification into two groups: those who return the credits and those who don’t.


  • Знаменник P (X 1, X 2,..., X n) у цьому рівнянні є однаковим для всіх станів цільової змінної для всіх станів навчальної вибірки

  • Розроблено зручний для практичного застосування алгоритм побудови дерева, що складається з п’яти кроків, і продемонстровано його використання із залученням до аналізу фактичних даних

Наївний (naїve) та доповнений деревом (tree-augmented, або TAN) байєсівські класифікатори — це ймовірнісні графічні моделі, що використовуються для формалізованого опису великих масивів даних, які містять невизначеності серед своїх взаємозалежних наборів характеристик. Модель TAN — це покращений наївний класифікатор Байєса, який враховує ще один рівень взаємодії між параметрами досліджуваної системи, тобто кожна змінна може залежати від деякої іншої змінної. Одним зі світових лідерів прогнозної аналітики є компанія SAS, яка розробила спеціалізований інструмент SAS Enterprise Miner для розв'язання задач інтелектуального аналізу даних. За допомогою цієї компоненти можна будувати мережі Байєса різних типів, у т.ч. наївну та доповнену деревом

Постановка задачі
Наївний байєсівський класифікатор
Доповнений деревом байєсівський класифікатор
Обчислення складності байєсівських класифікаторів
Практична реалізація наївного і доповненого деревом класифікаторів
Назва змінної
Коефіцієнт GINI
Максимальна загальна кількість обчислень
Список літератури
