Multi-topic text document classification based on the neuro-fuzzy technologies

Олег Викторович Золотухин

doi:10.15587/2312-8372.2012.4828

Abstract

This article discusses a problem of an intelligent text processing. Architecture of the neuro-fuzzy system is presented for classification of text documents and on-line learning algorithm for fuzzy network adaptive vector quantization.

Highlights

ВведениеВ данной работе рассматриваются результаты научных исследований автора, относимые к облас тям искусственного и вычислительного интеллекта, а именно, задачи интеллектуальной обработки и анализа естественно-языковых текстов (ЕЯТ), и разработка нейро-фаззи технологий для решения задач классификации сложноструктурированных объектов, относящихся сразу к нескольким классам, каковыми являются политематические тексты.
On-line классификация такого рода текстовых документов не является тривиальной задачей, поскольку в небольшом фрагменте текста может содержаться весьма ценная информация, и отнесение к соответствующему классу нельзя игнорировать, а близко расположенные классы могут пересекаться и/или сливаться.
К такого рода документам могут относиться новостные потоки в сети Интернет, обзоры, дайджесты, формируемые новостными агентствами, научные публикации, посвященные нескольким областям исследований, причем как близким, так и далеким (например, медико-биологические, физико-химические, искусственный интеллект и информационные технологии, онтологические инжиниринг и автоматическая обработка текстов).

Summary

Введение

В данной работе рассматриваются результаты научных исследований автора, относимые к облас тям искусственного и вычислительного интеллекта, а именно, задачи интеллектуальной обработки и анализа естественно-языковых текстов (ЕЯТ), и разработка нейро-фаззи технологий для решения задач классификации сложноструктурированных объектов, относящихся сразу к нескольким классам, каковыми являются политематические тексты. On-line классификация такого рода текстовых документов не является тривиальной задачей, поскольку в небольшом фрагменте текста может содержаться весьма ценная информация, и отнесение к соответствующему классу нельзя игнорировать, а близко расположенные классы могут пересекаться и/или сливаться. К такого рода документам могут относиться новостные потоки в сети Интернет, обзоры, дайджесты, формируемые новостными агентствами, научные публикации, посвященные нескольким областям исследований, причем как близким, так и далеким (например, медико-биологические, физико-химические, искусственный интеллект и информационные технологии, онтологические инжиниринг и автоматическая обработка текстов). Чрезвычайно актуальным направлением исследований является разработка методов классификации политематических текстовых документов

Постановка проблемы

Основная часть

Talk to us

Join us for a 30 min session where you can share your feedback and ask us any queries you have

Schedule a call

R Discovery Prime

R Discovery Prime

Multi-topic text document classification based on the neuro-fuzzy technologies

Abstract

Highlights

Summary

Talk to us

Similar Papers

More From: Technology audit and production reserves

Lead the way for us

Journal: Technology audit and production reserves	Publication Date: Sep 18, 2012
License type: cc-by

Similar Papers

Adaptive Vector Quantization of SAR Raw Data
Zhenhong Guan ... Zeming Zhou
-
Zhenhong Guan, et. al.Zhenhong Guan ... Zeming Zhou
01 Jan 2009
01 Jan 2009

<title>Entropy-constrained learning vector quantization algorithms and their application in image compression</title>
Nicolaos B Karayiannis
-
Nicolaos B KarayiannisNicolaos B Karayiannis
01 Apr 1997
01 Apr 1997

Audio codec using adaptive sparse vector quantization with subband vector classification
Shuwu Wu ... John Mantegna
The Journal of the Acoustical Society of America | VOL. 108
Shuwu Wu, et. al.Shuwu Wu ... John Mantegna
01 Jan 1999
The Journal of the Acoustical Society of America | VOL. 108

An adaptive neural network VQ algorithm and its implementation on the DSP32C signal processor
F Mekuria ... T Fjallbrant
-
F Mekuria, et. al.F Mekuria ... T Fjallbrant
30 May 1994
30 May 1994

Editage

Paperpal

R Discovery

Mind the Graph

R Discovery Prime

R Discovery Prime

Multi-topic text document classification based on the neuro-fuzzy technologies

Abstract

Highlights

Summary

Talk to us

Similar Papers

More From: Technology audit and production reserves