Abstract
This article discusses a problem of an intelligent text processing. Architecture of the neuro-fuzzy system is presented for classification of text documents and on-line learning algorithm for fuzzy network adaptive vector quantization.
Highlights
ВведениеВ данной работе рассматриваются результаты научных исследований автора, относимые к облас тям искусственного и вычислительного интеллекта, а именно, задачи интеллектуальной обработки и анализа естественно-языковых текстов (ЕЯТ), и разработка нейро-фаззи технологий для решения задач классификации сложноструктурированных объектов, относящихся сразу к нескольким классам, каковыми являются политематические тексты.
On-line классификация такого рода текстовых документов не является тривиальной задачей, поскольку в небольшом фрагменте текста может содержаться весьма ценная информация, и отнесение к соответствующему классу нельзя игнорировать, а близко расположенные классы могут пересекаться и/или сливаться.
К такого рода документам могут относиться новостные потоки в сети Интернет, обзоры, дайджесты, формируемые новостными агентствами, научные публикации, посвященные нескольким областям исследований, причем как близким, так и далеким (например, медико-биологические, физико-химические, искусственный интеллект и информационные технологии, онтологические инжиниринг и автоматическая обработка текстов).
Summary
В данной работе рассматриваются результаты научных исследований автора, относимые к облас тям искусственного и вычислительного интеллекта, а именно, задачи интеллектуальной обработки и анализа естественно-языковых текстов (ЕЯТ), и разработка нейро-фаззи технологий для решения задач классификации сложноструктурированных объектов, относящихся сразу к нескольким классам, каковыми являются политематические тексты. On-line классификация такого рода текстовых документов не является тривиальной задачей, поскольку в небольшом фрагменте текста может содержаться весьма ценная информация, и отнесение к соответствующему классу нельзя игнорировать, а близко расположенные классы могут пересекаться и/или сливаться. К такого рода документам могут относиться новостные потоки в сети Интернет, обзоры, дайджесты, формируемые новостными агентствами, научные публикации, посвященные нескольким областям исследований, причем как близким, так и далеким (например, медико-биологические, физико-химические, искусственный интеллект и информационные технологии, онтологические инжиниринг и автоматическая обработка текстов). Чрезвычайно актуальным направлением исследований является разработка методов классификации политематических текстовых документов
Talk to us
Join us for a 30 min session where you can share your feedback and ask us any queries you have
Disclaimer: All third-party content on this website/platform is and will remain the property of their respective owners and is provided on "as is" basis without any warranties, express or implied. Use of third-party content does not indicate any affiliation, sponsorship with or endorsement by them. Any references to third-party content is to identify the corresponding services and shall be considered fair use under The CopyrightLaw.