Методы машинного обучения применительно к задаче выделения глагольных и атрибутивных коллокаций

Мария Владимировна Хохлова,Екатерина Владимировна Еникеева

doi:10.17586/2541-9781-2020-4-54-60

Мария Владимировна Хохлова, Екатерина Владимировна Еникеева

Open Access

https://doi.org/10.17586/2541-9781-2020-4-54-60

Copy DOI

Abstract

В статье представлены результаты применения алгоритмов машинного обучения к задаче автоматического выявления глагольных и атрибутивных коллокаций . Изучение сочетаемости показало, что дистрибуционные модели могут быть успешно использованы для моделирования отношений внутри словосочетаний. Словосочетание признается значимым, если его векторное представление близко к векторному представлению заглавного слова. Нами были использованы следующие методы оценки коллокаций на основе машинного обучения и векторных представлений текстов: базовый метод, метод аналогии и линейного преобразования. Автоматически выделенные словосочетания сравнивались с данными, приведенными в лексикографических источниках (в толковых словарях и словарях сочетаемости, всего было рассмотрено пять источников), которые образовали так называемый золотой стандарт. Результаты показали, что рассматриваемые методы успешно используются для извлечения словосочетаний, в том числе находят те, которые не отражены в словарях. Данные примеры могут претендовать на лексикографическоое описание, хотя и не приведены в источниках и нуждаются в дополнительной экспертной проверке. Поэтому необходимо дополнительно провести сравнение использованных алгоритмов с другими статистическими метриками и увеличить количество словосочетаний, которые привлечены в качестве золотого стандарта.

Full Text

Paper version not known

Open DOI Link

Talk to us

Join us for a 30 min session where you can share your feedback and ask us any queries you have

Schedule a call

R Discovery Prime

R Discovery Prime

Методы машинного обучения применительно к задаче выделения глагольных и атрибутивных коллокаций

Abstract

Talk to us

Similar Papers

More From: Компьютерная лингвистика и вычислительные онтологии

Lead the way for us

Journal: Компьютерная лингвистика и вычислительные онтологии	Publication Date: Dec 17, 2020
License type: CC BY-NC 4.0

Similar Papers

Embeddings in Natural Language Processing: Theory and Advances in Vector Representations of Meaning
Marcos Garcia
Computational Linguistics | VOL. 47
Marcos GarciaMarcos Garcia
03 Nov 2021
Computational Linguistics | VOL. 47

Лексика на позначення емоцій: проблеми і перспективи створення переліку слів
Olesia Dalebiha
Vìsnik Marìupolʹsʹkogo deržavnogo unìversitetu Serìâ Fìlologìâ | VOL. 14
Olesia DalebihaOlesia Dalebiha
01 Jan 2020
Vìsnik Marìupolʹsʹkogo deržavnogo unìversitetu Serìâ Fìlologìâ | VOL. 14

Exploring What Is Encoded in Distributional Word Vectors: A Neurobiologically Motivated Analysis
Akira Utsumi
Cognitive Science | VOL. 44
Akira UtsumiAkira Utsumi
26 May 2020
Cognitive Science | VOL. 44

The method of linear transformation in revealing EEG polyharmonic components in comparison to the Fourier analysis
Rossitza Draganova
Medical Engineering and Physics | VOL. 21
Rossitza DraganovaRossitza Draganova
01 Feb 1999
Medical Engineering and Physics | VOL. 21

Editage

Paperpal

R Discovery

Mind the Graph

R Discovery Prime

R Discovery Prime

Методы машинного обучения применительно к задаче выделения глагольных и атрибутивных коллокаций

Abstract

Talk to us

Similar Papers

More From: Компьютерная лингвистика и вычислительные онтологии