Abstract

Background . Development and study of characteristics for naive and tree-augmented classifiers in the form of Bayesian networks in the problem of credit risk estimation. Objective . To perform estimation of classification quality for the bank credit borrowers using Bayesian classifiers of two types. Methods . Development of necessary mathematical tools and performing computational experiments aiming towards constructing classifiers in the form of Bayesian networks using actual statistical data characterizing solvency of bank credit borrowers. Results . The following results were achieved: the methodology of constructing and application of the naive and tree-augmented Bayesian classifiers for solving the problem of solvency estimation for bank credit borrowers; an analysis of computational algorithmic complexity was performed; two classification models were constructed in the form of Bayesian networks using actual statistical data from banking system; a comparative analysis was performed for the models developed. Conclusions . It was established that the tree-augmented classifier exhibits higher computational complexity than the naive Bayesian one, but it showed higher classification results while solving the problem of bank clients classification into two groups: those who return the credits and those who don’t.

Highlights

  • Development and study of characteristics for naïve and tree-augmented classifiers in the form of Baysian networks in the problem of credit risk estimation

  • Знаменник P (X 1, X 2,..., X n) у цьому рівнянні є однаковим для всіх станів цільової змінної для всіх станів навчальної вибірки

  • Розроблено зручний для практичного застосування алгоритм побудови дерева, що складається з п’яти кроків, і продемонстровано його використання із залученням до аналізу фактичних даних

Read more

Summary

Background

Development and study of characteristics for naïve and tree-augmented classifiers in the form of Baysian networks in the problem of credit risk estimation. The following results were achieved: the methodology of constructing and application of the naïve and treeaugmented Bayesian classifiers for solving the problem of solvency estimation for bank credit borrowers; an analysis of computational algorithmic complexity was performed; two classification models were constructed in the form of Bayesian networks using actual statistical data from banking system; a comparative analysis was performed for the models developed. Наївний (naїve) та доповнений деревом (tree-augmented, або TAN) байєсівські класифікатори — це ймовірнісні графічні моделі, що використовуються для формалізованого опису великих масивів даних, які містять невизначеності серед своїх взаємозалежних наборів характеристик. Модель TAN — це покращений наївний класифікатор Байєса, який враховує ще один рівень взаємодії між параметрами досліджуваної системи, тобто кожна змінна може залежати від деякої іншої змінної. Одним зі світових лідерів прогнозної аналітики є компанія SAS, яка розробила спеціалізований інструмент SAS Enterprise Miner для розв’язання задач інтелектуального аналізу даних. За допомогою цієї компоненти можна будувати мережі Байєса різних типів, у т.ч. наївну та доповнену деревом

Постановка задачі
Наївний байєсівський класифікатор
Доповнений деревом байєсівський класифікатор
Обчислення складності байєсівських класифікаторів
Практична реалізація наївного і доповненого деревом класифікаторів
Назва змінної
Коефіцієнт GINI
Максимальна загальна кількість обчислень
Список літератури
ТОРІВ НА ОСНОВІ БАЙЄСІВСЬКИХ МЕРЕЖ
КЛАССИФИКАТОРОВ НА ОСНОВЕ БАЙЕСОВСКИХ СЕТЕЙ
Full Text
Published version (Free)

Talk to us

Join us for a 30 min session where you can share your feedback and ask us any queries you have

Schedule a call