Abstract

Розроблено метод комплексного аналізу диференціації фоностатистичних структур авторського стилю англійської мови, який ґрунтується на поєднанні трьох статистичних критеріїв: критерію Стьюдента, критерію Колмогорова-Смірнова і критерію хі-квадрат. Поєднання цих критеріїв дає змогу підвищити достовірність диференціації авторських стилів. Для розв'язання задачі диференціації авторських стилів побудовано статистичну модель, яка підвищує достовірність результатів авторської атрибуції тексту. Розроблена програмна система реалізує метод і модель з використанням мови програмування Java, що забезпечує платформонезалежність. Для тестування програми вибрано статті С. Логан і Д. Вебстер з газети "Вільна газета" ("Freedom Paper", papers by S. Logan and D. Webster). Істотні відмінності встановлено за групами носових, дорсальних і велярних фонем за критерієм Стьюдента, за всіма вісьмома групами фонем за критерієм Колмогорова-Смірнова, істотні відмінності встановлено за групами сонорних, щілинних, дорсальних, зімкнених, губних і носових фонем за критерієм хі-квадрат. Поєднання використаних критеріїв дало змогу встановити групу фонем з найбільшою авторорозрізняльною здатністю. Це група дорсальних фонем. За цією групою можна диференціювати тексти різних авторів, що дає змогу змінімізувати кількість груп фонем, за якими здійснюється авторська атрибуція тексту.

Highlights

  • 2005; Argamon et al, 2009; Koppel, 2009); на синтаксичному рівні, вітчизняними дослідниками – В

  • The method is based on a combination of the three statistical criteria

  • The statistical model of author-differentiating capability for the velar phoneme group minimizes the number of phoneme groups by which the styles are differentiated

Read more

Summary

Introduction

2005; Argamon et al, 2009; Koppel, 2009); на синтаксичному рівні, вітчизняними дослідниками – В. Однією з основних тенденцій розвитку сучасного суспільства є глобалізація з використанням засобів Інтернету. У випадках, коли автор тексту невідомий, потрібно встановити його авторство. Тому актуальною задачею сьогодення є авторська атрибуція тексту. Встановлення авторства тексту ґрунтується на диференціації текстів.

Results
Conclusion
Full Text
Published version (Free)

Talk to us

Join us for a 30 min session where you can share your feedback and ask us any queries you have

Schedule a call