Abstract

Active development of Internet communication in recent years caused an increase in the number of forensic text examinations aimed at identifying and profiling (i.e. inferring gender, age, personality, etc. of the author from textual analysis) the author of written texts. Despite the availability of proven methodological recommendations for the production of such examinations, in this area there are many unresolved problems associated mainly with the emergence of new research objects. In addition, the existing expert practice does not fully utilize the achievements of corpus, computer, and quantitative linguistics. In this situation, there is a gap between the "qualitative" and "quantitative" methods of textual authorship analysis, which hinders further development of both theoretical research in the area of authorship attribution and profiling and an increase in the level of objectivity and reproducibility of forensic authorship analysis. The paper represents some typical tasks solved by a forensic expert; describes the characteristics of the objects of forensic authorship analysis, and determines the main difficulties forensic experts face in the course of this analysis. The possibilities of using existing computer methods to solve these tasks are analyzed. It is shown that not all the existing computer methods are useful for forensic authorship analysis. We also highlight the ways of development of forensic authorship analysis related to further theoretical research in the field of idiolect using corpus data and natural language processing techniques.

Highlights

  • Active development of Internet communication in recent years caused an increase in the number of forensic text examinations aimed at identifying

  • The paper represents some typical tasks solved by a forensic expert

  • determines the main difficulties forensic experts face in the course of this analysis

Read more

Summary

Результаты и обсуждение

Которые решает эксперт, можно разделить на две большие группы: 1) идентификационные задачи, связанные с определением автора текста путем проведения раздельного и сравнительного анализа признаков, проявившихся в спорном тексте и текстах – образцах письменной речи подозреваемого лица; 2) диагностические задачи, связанные с определением половозрастных, индивидуально-личностных характеристик, уровня коммуникативной компетенции, речевой культуры, сферы профессиональной деятельности автора текста (см. подробнее: [Назарова, Громова, 2016]). Кто из замкнутого круга лиц (небольшого, как правило 2–3 человека) является автором криминалистически значимого текста (в зарубежной литературе – closed-set problem)?. 2. Является ли данное лицо, сравнительные образцы текстов которого представлены эксперту, автором криминалистически значимого текста (verification problem)?. У подозреваемых изымаются образцы письменной речи для проведения идентификационной автороведческой экспертизы, при этом в большинстве случаев эксперт решает вопрос о том, является ли данное лицо, сравнительные образцы текстов которого представлены эксперту, автором криминалистически значимого текста, то есть круг подозреваемых сужается до одного человека. Сюда же входит проблема синтезированной письменной речи (боты), однако отметим, что в настоящее время уровень развития таких систем позволяет допустить возможность их использования для продуцирования лишь определенных текстов (например, диалогов в сфере обслуживания); 2) связанные со сравнительными образцами. Значимыми характеристиками текстов являются: жанровая сопоставимость, адресат текстов, их тематика, объем, временной период создания (согласно сложившейся экспертной практике, разница между сравниваемыми текстами не должна превышать 5 лет)

Пути решения задач САЭ методами computer science
СПИСОК ЛИТЕРАТУРЫ
Full Text
Published version (Free)

Talk to us

Join us for a 30 min session where you can share your feedback and ask us any queries you have

Schedule a call