Processamento linguístico-computacional de pacotes lexicais: um estudo de corpus na área de Regulamentação Farmacêutica

Luciene Novais Mazza

doi:10.4013/cld.2015.133.13

Abstract

Este trabalho tem por objetivo demonstrar um aplicativo computacional desenvolvido para a extracao de pacotes lexicais de tres palavras e apresentar por meio deste as unidades lexicais recorrentes entre documentos de especialidade. O metodo quantitativo aplicado, em principio, explora um tipo de texto produzido pelas industrias do setor farmaceutico, o qual esta diretamente relacionado a assuntos regulatorios no âmbito das agencias internacionais de vigilância sanitaria. No entanto, os procedimentos de analise podem ser adotados para investigar outros aspectos linguisticos dentre a variedade de generos e tipos textuais, como tambem possibilita a identificacao de termos. O estudo tem como principal enfoque a frequencia de ocorrencia dos padroes lexicais em corpus autentico da lingua em uso por meio de ferramentas linguistico-computacionais, em particular nas pesquisas voltadas ao estudo da linguagem em contextos empresariais, e busca multiplicar os trabalhos de Douglas Biber com base na combinacao de palavras recorrentes em corpora especificos. O referencial teorico- -metodologico baseia-se na Linguistica de Corpus, que e capaz de dialogar, especificamente, com a Linguistica Computacional e oferecer meios para o desenvolvimento do aplicativo e ao processamento dos pacotes lexicais. O corpus coletado reune quinze exemplares do documento escrito na lingua inglesa, totalizando cerca de 110 mil palavras, cuja delimitacao contempla diferentes localidades do mundo, envolvendo varios autores. Os resultados desvelam a possibilidade de investigacao nas divisoes internas dos textos mediante o cruzamento entre documentos de uma mesma especialidade.Palavras-chave: pacotes lexicais, corpus de especialidade, ferramenta linguistico-computacional.

Full Text