Abstract

The given paper considers application of data mining technology in scientific research as one of intellectual analysis methods in the domain field of e-Government. The topicality of the issue is stipulated by the current absence of the researches of the kind in the Republic of Belarus. The paper illustrates how the programme package Rapid Miner and the language R have been applied in text mining. Concept indexing has been admitted as the most resultative form of analyzing domain field ontologies. Formal and linguistic approaches are found most effective in analyzing domain field ontologies. The paper identifies the problems of word redundancy and word polysemy. The prognosis for the further research investigation is in interconnectivity of specialized ontologies studying heterogeneous terms on the basis of artificial intelligence (AI).

Highlights

  • Актуальность темы обусловлена высокой динамичностью развития систем искусственного интеллекта и процессов в сфере представления знаний в области информационно-коммуникационных технологий (ИКТ); проблемой взаимосвязи терминов при создании тезаурусных отношений; разработкой терминологических систем, основанных на онтологиях и тезаурусах; удовлетворительным решением задач с их помощью с последующим представлением решений в системе электронного правительства (ЭП)

  • Цель работы заключается в проведении интеллектуального анализа текстовой информации в специализированных областях с созданием рабочего макета лингвистического обеспечения информационных систем для согласования данных русскоязычной и иноязычных терминологических систем предметных областей в системе ЭП

  • Прогнозные предположения о развитии объекта исследования – это стыковка различных онтологий на основе технологий искусственного интеллекта для изучения разрозненности русскоязычных и англоязычных терминов, которые, в итоге, при сравнении с такими же построениями должны быть идентичны

Read more

Summary

Introduction

Актуальность темы обусловлена высокой динамичностью развития систем искусственного интеллекта и процессов в сфере представления знаний в области ИКТ; проблемой взаимосвязи терминов при создании тезаурусных отношений; разработкой терминологических систем, основанных на онтологиях и тезаурусах; удовлетворительным решением задач с их помощью с последующим представлением решений в системе электронного правительства (ЭП). Цель работы заключается в проведении интеллектуального анализа текстовой информации в специализированных областях с созданием рабочего макета лингвистического обеспечения информационных систем для согласования данных русскоязычной и иноязычных терминологических систем предметных областей в системе ЭП. В задачи работы входит: изучение методики актуальной обработки текстовой информации; исследование возможности формирования и корректировки онтологических моделей на основе интеллектуальной обработки текстовой информации (text mining); проведение анализа использования программного обеспечения языка R и программного пакета Rapid Miner как оптимальных программных средств для создания информационной системы интеллектуальной обработки текстовой информации.

Results
Conclusion
Full Text
Published version (Free)

Talk to us

Join us for a 30 min session where you can share your feedback and ask us any queries you have

Schedule a call