Abstract

Natural Language Рrocessing (NLP), defined, as the general direction of artificial intelligence and mathematical linguistics, is an important tool for understanding and processing a gigantic amount of unstructured data.Representing theoretical and practical basis for solving a large number of problems, NLP is being actively studied by scientists around the world, since it is one of the most popular areas of data science and is used in many fields of human activity. The purpose of this bibliometric analysis is to identify the main research centers, research trends, the rating of leading Russian scientists in the field of NLP, as well as to show the picture of thematic fields’ distribution of publications. The results of the analysis will allow us to determine the dynamics of NLP field development in the domestic science and will provide scientists and specialists working in the field of NLP with up-to-date information on various aspects of the considered research area.Russian Science Citation Index (RSCI) – the main scientometric database in our country was used as the data source for scientific publications in the field of NLP search. The RSCI platform contains information on current research areas, allows you to assess the productivity of scientists, scientific communities, etc.The presented work will be interesting to researchers in the field of NLP, since it contains actual data on the development dynamics and structure of the documentary and information flow in the field of NLP in Russia, its distribution by branches of knowledge. Besides, the conducted bibliometric analysis of documents allows us to gain information about the authors most productively working in the studied area and their affiliations, as well as about the most cited articles – this is the review of the 30 most cited publications of Russian scientists and rating of TOP-10 scientific organizations of the Russian Federation by the number of publications reflecting the main problems and scientific achievements in the field of NLP.

Highlights

  • XXI в. характеризуется увеличением объема данных в геометрической прогрессии, представленных в большей степени языковыми данными

  • Используемых в исследовании: с 1980 (в этом году появилась первая статья по обработку естественного языка (ОЕЯ) в Российский индекс научного цитирования» (РИНЦ)) по 2019 г

  • В результате анализа 30 наиболее цитируемых публикаций российских авторов в области обработку естественного языка (ОЕЯ) выявлено, что наибольшее количество обращений имеют работы, посвященные достижениям в использовании миварных технологий ([22], (81) *; [23], (66) *); вопросам лингвистики, отражающим разные языковые аспекты ОЕЯ-исследований ([7], (50) *; [6], (39) *); инструментам извлечения структурированных данных из текста на естественных языков (ЕЯ) ([29], (49) *); моделям усовершенствованных тезаурусов ([24], (34) *; [25], (31) *)

Read more

Summary

Introduction

XXI в. характеризуется увеличением объема данных в геометрической прогрессии, представленных в большей степени языковыми данными. Обработка естественного языка (ОЕЯ), определяемая как общее направление искусственного интеллекта и математической лингвистики, является важным инструментом для понимания и обработки гигантского объема неструктурированных данных. Сегодня технологии ОЕЯ имеют широкий спектр применения во многих научных и прикладных дисциплинах для решения разных типов задач, становясь одной из основных технологий практического применения ИИ.

Results
Conclusion
Full Text
Published version (Free)

Talk to us

Join us for a 30 min session where you can share your feedback and ask us any queries you have

Schedule a call