Validação de termos de domínio por meio de uma base lexical-semântica difusa

Afonso Xavier Canosa Rodrigues

doi:10.11606/issn.2317-9511.v30i30p71-86

Abstract

A extração ou reconhecimento de termos pesquisa um corpus para prover uma lista de termos específicos de domínio a fim de ser usada em trabalhos mais avançados tais como a construção de terminologias e ontologias. Tanto medidas estatísticas quanto técnicas do Processamento da Linguagem Natural (PLN) têm sido investigadas para melhorar o desempenho na precisão das listas recuperadas. Não obstante, para manter a abrangência alta, as listas contêm falsos positivos. Para validar os candidatos como verdadeiros positivos, os termos têm de ser avaliados quer manualmente, quer automaticamente, por contraste com recursos externos, nomeadamente glossários específicos. Apresentamos uma série de experiências que mostram como uma base de conhecimento lexical pode melhorar o desempenho destes glossários de modo significativo. Partimos de uma lista de 50 candidatos a termos de domínio com precisão de 52%. Por meio da uma base lexical difusa, em que as palavras são agrupadas com um valor de associação semântica, achamos valores de corte para atingir percentagens de 100% tanto na precisão quanto na abrangência sobre a lista de partida, mantendo o valor da medida-F > 80%, com melhor resultado em 90%. Concluímos que, considerando que é necessário mais trabalho na pesquisa de limites e diferentes cenários, uma base lexical difusa pode melhorar o estado da arte das abordagens convencionais da extração automática de termos.

Talk to us

Join us for a 30 min session where you can share your feedback and ask us any queries you have

Schedule a call

R Discovery Prime

R Discovery Prime

Validação de termos de domínio por meio de uma base lexical-semântica difusa

Abstract

Talk to us

Similar Papers

More From: Tradterm

Lead the way for us

Journal: Tradterm	Publication Date: Dec 20, 2017
License type: CC BY-NC-SA 4.0

Similar Papers

Automatic medical term extraction from Vietnamese clinical texts
Chau Vo ... Dai Bui
Terminology / International Journal of Theoretical and Applied Issues in Specialized Communication | VOL. 28
Chau Vo, et. al.Chau Vo ... Dai Bui
09 Jun 2022
Terminology / International Journal of Theoretical and Applied Issues in Specialized Communication | VOL. 28

Adapted TextRank for Term Extraction: A Generic Method of Improving Automatic Term Extraction Algorithms
Ziqi Zhang ... Diana Maynard
Procedia Computer Science | VOL. 137
Ziqi Zhang, et. al.Ziqi Zhang ... Diana Maynard
01 Jan 2018
Procedia Computer Science | VOL. 137

Study on automatic term extraction based on CRF model for information field
Meiying Jia ... Dequan Zheng
-
Meiying Jia, et. al. Meiying Jia ... Dequan Zheng
01 Jan 2008
01 Jan 2008

A survey of automatic term extraction for Brazilian Portuguese
Merley Da Silva Conrado ... Thiago Alexandre Salgueiro Pardo
Journal of the Brazilian Computer Society | VOL. 20
Merley Da Silva Conrado, et. al.Merley Da Silva Conrado ... Thiago Alexandre Salgueiro Pardo
30 May 2014
Journal of the Brazilian Computer Society | VOL. 20

Editage

Paperpal

R Discovery

Mind the Graph

R Discovery Prime

R Discovery Prime

Validação de termos de domínio por meio de uma base lexical-semântica difusa

Abstract

Talk to us

Similar Papers

More From: Tradterm