MapReduce Implementation of a Multinomial and Mixed Naive Bayes Classifier

Sikha Bagui,Sharon John,Keerthi Devulapalli

doi:10.4018/ijiit.2020040101

MapReduce Implementation of a Multinomial and Mixed Naive Bayes Classifier

Sikha Bagui, Sharon John + Show 1 more

https://doi.org/10.4018/ijiit.2020040101

Copy DOI

Journal: International Journal of Intelligent Information Technologies	Publication Date: Apr 1, 2020
Citations: 5

Affiliation: University of West Florida

#Hadoop's MapReduce Environment #Continuous Values + Show 8 more

Abstract
Full-Text PDF
Similar Papers

Abstract

This study presents an efficient way to deal with discrete as well as continuous values in Big Data in a parallel Naïve Bayes implementation on Hadoop's MapReduce environment. Two approaches were taken: (i) discretizing continuous values using a binning method; and (ii) using a multinomial distribution for probability estimation of discrete values and a Gaussian distribution for probability estimation of continuous values. The models were analyzed and compared for performance with respect to run time and classification accuracy for varying data sizes, data block sizes, and map memory sizes.

Full Text