Abstract

The verbal and structural features of the reader comment, a genre of Internet communication, were studied. The method of sentiment analysis (ParallelDots API) was used to reveal and measure the emotive component of the reader comments (N = 3000) in the English and Russian languages. The results obtained were verified by the manual linguistic text analysis. The experts were specialists in the field of philology of the English and Russian languages (N = 6), students of philology, as well as native speakers of the Russian language for whom English is a foreign language, i.e., their level of proficiency is C1 (N = 4). As a result of the comparison of the data collected through the automated and manual text processing, a number of factors that reduce the reliability of the results of automated sentiment analysis of the reader comments were singled out. Difficulties hindering the objective determination of the sentiment by the program were found in the reader comments in both analyzed languages. This is indicative of the structural similarities between the English and Russian reader comments at the lexical and syntactic levels. The feasibility of the mixed automated and manual text processing in order to obtain more detailed and objective data was demonstrated. The results of this work can be used for comparative studies of two or more languages performed by the method of sentiment analysis, as well as for drawing parallels between the lexical, grammatical, and cultural components of languages.

Highlights

  • As a result of the comparison of the data collected through the automated and manual text processing, a number of factors that reduce the reliability of the results of automated sentiment analysis of the reader comments were singled out

  • Difficulties hindering the objective determination of the sentiment by the program were found in the reader comments in both analyzed languages

  • This is indicative of the structural similarities between the English and Russian reader comments at the lexical and syntactic levels

Read more

Summary

ОРИГИНАЛЬНАЯ СТАТЬЯ

СЕНТИМЕНТ-АНАЛИЗ ЧИТАТЕЛЬСКОГО КОММЕНТАРИЯ: АВТОМАТИЗИРОВАННАЯ VS РУЧНАЯ ОБРАБОТКА ТЕКСТА. Статья посвящена изучению речевых и структурных особенностей читательского комментария как жанра интернет-коммуникации. Посредством автоматизированного анализа тональности текста (сентимент-анализа) с использованием прикладного программного интерфейса ParallelDots API была выявлена эмотивная составляющая англои русскоязычных читательских комментариев (N = 3000). Ключевые слова: тональность текста, сентимент-анализ, интерактивная газетная статья, читательский комментарий, эмотивность. Особенностью читательского комментария в структуре интерактивной газетной статьи является трансформация эмоции (психологическая категория) в эмотивность (языковая категория). Цель настоящей работы – определить тональность англоязычных и русскоязычных читательских комментариев двумя способами: машинным (автоматизированным, с применением метода сентимент-анализа) и ручным (экспертным) – и выявить недостатки автоматизированного сентимент-анализа. Наиболее значимым достижением является систематизация причин, затрудняющих работу программы для корректного определения тональной оценки, на основе сопоставления результатов автоматизированного и ручного способов сентимент-анализа текстов англоязычных и русскоязычных читательских комментариев

Обзор литературы по проблеме
Методы и материал исследования
Результаты исследования
Русскоязычные комментарии Совпадения Расхождения
Пр огр аммная
Русскоязычные комментарии
Findings
Обсуждение полученных результатов
Full Text
Paper version not known

Talk to us

Join us for a 30 min session where you can share your feedback and ask us any queries you have

Schedule a call

Disclaimer: All third-party content on this website/platform is and will remain the property of their respective owners and is provided on "as is" basis without any warranties, express or implied. Use of third-party content does not indicate any affiliation, sponsorship with or endorsement by them. Any references to third-party content is to identify the corresponding services and shall be considered fair use under The CopyrightLaw.