Abstract

O uso dos sintagmas nominais como instrumentos de organização da informação vem se mostrando uma alternativa promissora às palavras isoladas na construção dos sistemas de recuperação de informação. Nesse contexto, a indexação automática por sintagmas nominais minimiza alguns problemas encontrados na indexação baseada em palavras isoladas, como, por exemplo, a sinonímia e a polissemia. No entanto, é notório que nem todos os sintagmas nominais que se encontram em um documento são representativos do conteúdo desse documento, o que demonstra a necessidade de se selecionar os sintagmas nominais mais relevantes. Assim, o objetivo deste estudo consiste em sintetizar e classificar critérios de seleção de sintagmas nominais utilizados em metodologias de indexação automática por sintagmas nominais para textos escritos em língua portuguesa. A metodologia da pesquisa tem natureza exploratória, de cunho bibliográfico, e tem como método procedimental a análise de conteúdo. As metodologias de seleção de sintagmas nominais baseiam-se em critérios como: frequência absoluta de ocorrência, frequência normalizada de ocorrência, frequência inversa nos documentos, não ocorrência em lista de sintagmas nominais pouco significativos, na estrutura gramatical e no nível dos sintagmas nominais. Quanto ao escopo dos critérios, predominam em número os baseados em características do sintagma nominal (estrutura gramatical, nível, conteúdo lexical) e quanto a adoção predominam os baseados no conteúdo do documento e no conteúdo do corpus. A principal contribuição deste estudo consiste do panorama dos critérios de seleção de sintagmas nominais relevantes para textos em português.

Highlights

  • Este estudo tem como propósito investigar métodos de indexação automática por sintagmas nominais quanto aos critérios utilizados para a seleção de sintagmas nominais relevantes como descritores documentais

  • O propósito da indexação é representar tematicamente os conteúdos dos documentos através de termos organizados em índices

  • Uma alternativa que vem se mostrando promissora é a utilização dos sintagmas nominais presentes nos textos como pontos de acesso à informação

Read more

Summary

INTRODUÇÃO

Encontros Bibli: revista eletrônica de biblioteconomia e ciência da informação, Florianópolis, v. 24, n. 55, p. 01-19, mai./ago.,2019. Este estudo tem como propósito investigar métodos de indexação automática por sintagmas nominais quanto aos critérios utilizados para a seleção de sintagmas nominais relevantes como descritores documentais. Uma alternativa que vem se mostrando promissora é a utilização dos sintagmas nominais presentes nos textos como pontos de acesso à informação. Tem-se como objetivo geral sintetizar e classificar os critérios de seleção de sintagmas nominais utilizados em pesquisas sobre indexação automática por sintagmas nominais de documentos em língua portuguesa. As seções que se seguem estão assim estruturadas: na seção 2, contextualiza-se a indexação automática, define-se o processo de indexação automática por sintagmas nominais, discutem-se os trabalhos que tratam do tema para textos em português e define-se a seleção de sintagmas nominais como uma etapa deste processo; na seção 3 é apresentada a metodologia da pesquisa; a seção 4 apresenta e discute os resultados da síntese e categorização dos critérios de seleção de sintagmas nominais; e a seção 5 contempla as considerações finais

INDEXAÇÃO AUTOMÁTICA
Indexação Automática por Sintagmas Nominais
Seleção de Sintagmas Nominais
MÉTODO
ANÁLISE DOS RESULTADOS
CONSIDERAÇÕES FINAIS
Full Text
Paper version not known

Talk to us

Join us for a 30 min session where you can share your feedback and ask us any queries you have

Schedule a call

Disclaimer: All third-party content on this website/platform is and will remain the property of their respective owners and is provided on "as is" basis without any warranties, express or implied. Use of third-party content does not indicate any affiliation, sponsorship with or endorsement by them. Any references to third-party content is to identify the corresponding services and shall be considered fair use under The CopyrightLaw.