Abstract

A problem of non-parametric multivariate density estimation for machine learning and data augmentation is considered. A new mixed density estimation method based on calculating the convolution of independently obtained kernel density estimates for unknown distributions of informative features and a known (or independently estimated) density for non-informative interference occurring during measurements is proposed. Properties of the mixed density estimates obtained using this method are analyzed. The method is compared with a conventional Parzen-Rosenblatt window method applied directly to the training data. The equivalence of the mixed kernel density estimator and the data augmentation procedure based on the known (or estimated) statistical model of interference is theoretically and experimentally proven. The applicability of the mixed density estimators for training of machine learning algorithms for the classification of biological objects (elements of grain mixtures) based on spectral measurements in the visible and near-infrared regions is evaluated.

Highlights

  • A new mixed density estimation method based on calculating the convolution of independently obtained kernel density estimates for unknown distributions of informative features and a known density for non-informative interference occurring during measurements is proposed

  • The method is compared with a conventional ParzenRosenblatt window method applied directly to the training data

  • A.O. Optical methods of identifying the varieties of the components of grain mixtures based on using artificial neural networks for data analysis / A.O. Donskikh, D.A. Minakov, A.A. Sirota // Journal of Theoretical and Applied Information Technology – 2018

Read more

Summary

Смешанные ядерные оценки и их свойства

Пусть при построении распределения смеси pX (x / ) ПРВ pU (u / ) неизвестна, а ПРВ pV (v) известна или заранее независимо оценена любым из возможных способов и характеризует ПИ, воздействующие на исходные образы класса в соответствии с (1). При этом для построения плотности pU (u / ) задана обучающая выборка в виде совокупности реализаций UleN = {u(1), ..., u(N )}. Пусть для оценки (2) выполняются следующие свойства функции ядра Пусть также при задании параметра ядра как функции наблюдений h = h (N) и. Если p U (u / ) при N h(N) 0 является асимптотически несмещённой оценкой ПРВ p (u / ) для всех u, то смешанная оценка p (x / ) является асимптотически несмещённой оценкой p (x / ) [16]. По аналогии с (6) для стандартной оценки выполняется. Если p U (u / ) при N h (N) 0 сходится в среднеквадратичном к ПРВ p(u/ ) для всех u, то смешанная оценка p (x / ) аналогичным образом сходится к p (x / ) [16].

N 2h2n
Результаты моделирования к анализу свойств смешанных оценок
Исследование применимости смешанных ядерных оценок для аугментации данных
Full Text
Published version (Free)

Talk to us

Join us for a 30 min session where you can share your feedback and ask us any queries you have

Schedule a call