Minería de texto en la clasificación de documentos digitales

Marcial Contreras Barrera

doi:10.5195/biblios.2016.309

Abstract

Objetivo: Desarrollar un clasificador automatizado para la clasificación de material bibliográfico por medio de la minería de texto. Metodología: La minería de texto es empleada para el desarrollo del clasificador, basado en un método de tipo supervisado conformado por dos etapas; de aprendizaje y reconocimiento, en la etapa de aprendizaje, el clasificador aprende patrones a través del análisis de registros bibliográficos, de la clasificación Z, del área de bibliotecología, ciencias de la información y recursos de información recuperados de la base de datos LIBRUNAM , en esta etapa se obtiene el clasificador capaz de reconocer diferentes subclases (LC). En la etapa de reconocimiento el clasificador se valida y evalúa a través de pruebas de clasificación, para este fin se toman aleatoriamente registros bibliográficos de la clasificación Z, clasificados por un catalogador y procesados por el clasificador automatizado, con el fin de obtener la precisión del clasificador automatizado. Resultados: La utilización de la minería de texto permitió el desarrollo del clasificador automatizado, a través del método de clasificación de documentos de tipo supervisado. La precisión del clasificador fue calculada realizando la comparación entre los temas asignados de manera manual y automatizada obteniendo un grado de precisión del 75.70%. Conclusiones: La aplicación de la minería de texto facilito la creación del clasificador automatizado, permitiendo obtener tecnología útil para la clasificación de material bibliográfico con la finalidad de mejorar y agilizar el proceso de organización de información.

Highlights

La metodología empleada para realizar la minería de texto puede ser general o específica, una metodología general como la propuesta por Verma, Ranjan & Mishra (2015) se define en dos fases; la fase de refinación del texto donde los documentos son transformados y representados en estructuras de datos; y la fase llamada destilación del conocimiento, donde se identifican patrones o conocimiento a partir de las estructuras de datos
Los datos obtenidos en esta etapa son representados en alguna estructura informática que facilita su análisis, las estructuras representan las relaciones entre las entidades de un mismo tipo de datos, palabras o conceptos clave, documento-términos, términosautores, etc
Industrial and Information Systems (IIS), 2010 2nd International Conference on (Volume:1 )

Summary

Introducción

Para Zhang y Gu (2011), el 90% de la información disponible se encuentra de forma no estructurada y semi estructurada, almacenada en computadoras o sistemas de almacenamiento, dificultando su búsqueda y consulta a través de los sistemas de recuperación de información, por lo que es necesario el uso de la tecnología para facilitar su análisis, con la finalidad de agilizar su organización en beneficio de los usuarios de información. Por lo que en este estudio se emplea la minería de texto en el procesamiento de documentos digitales para ser usada en la clasificación de documentos no estructurados partiendo de la siguiente hipótesis: La minería de texto facilita el procesamiento de documentos digitales por medio de los métodos de extracción de información y clasificación, permitiendo la organización de documentos. La minería de texto es empleada para el desarrollo del clasificador, basado en un método de tipo supervisado, conformado por dos etapas; de aprendizaje y reconocimiento, en la etapa de aprendizaje, el clasificador aprende patrones a través del análisis de registros bibliográficos, pertenecientes a la clasificación Z, del área de bibliotecología, ciencias de la información y recursos de información, recuperados de la base de datos LIBRUNAM. El trabajo se encuentra estructurado de la siguiente forma: introducción, minería de texto y clasificación de documentos, metodología de la minería de texto, aplicación de la minería de texto en la base de datos LIBRUNAM, resultados y conclusiones

Minería de texto y clasificación de documentos

Metodología de la minería de texto

Aplicaciones de minería de texto en bibliotecas

Aplicación de la minería de texto en la base de datos LIBRUNAM

Findings

Resultados

Full Text

Published Version (Free)

View/Download pdf

Talk to us

Join us for a 30 min session where you can share your feedback and ask us any queries you have

Schedule a call

Journal: Biblios Journal of Librarianship and Information Science	Publication Date: Nov 21, 2016
Citations: 3	License type: CC BY 4.0

R Discovery Prime

Minería de texto en la clasificación de documentos digitales

Abstract

Highlights

Summary

Published Version (Free)

Talk to us

Similar Papers

More From: Biblios Journal of Librarianship and Information Science

Lead the way for us

Similar Papers

Text Mining for Supply Chain Risk Management in the Apparel Industry
Sayed Mehdi Shah ... Michael Freitag
Applied Sciences | VOL. 11
Sayed Mehdi Shah, et. al.Sayed Mehdi Shah ... Michael Freitag
05 Mar 2021
Applied Sciences | VOL. 11

西文資訊科學期刊文獻之引用分析研究：以JASIS(T)為例

-

01 Jan 2009
01 Jan 2009

An improved Urdu stemming algorithm for text mining based on multi-step hybrid approach
Abdul Jabbar ... Qaisar Abbas
Journal of Experimental & Theoretical Artificial Intelligence | VOL. 30
Abdul Jabbar, et. al.Abdul Jabbar ... Qaisar Abbas
22 May 2018
Journal of Experimental & Theoretical Artificial Intelligence | VOL. 30

Introduction to Advanced Analytics Services for Managerial Decision Support Minitrack
Dursun Delen ... Haluk Demirkan
-
Dursun Delen, et. al.Dursun Delen ... Haluk Demirkan
01 Jan 2012
01 Jan 2012

Editage

Paperpal

R Discovery

Mind the Graph

R Discovery Prime

Minería de texto en la clasificación de documentos digitales

Abstract

Highlights

Summary

Published Version (Free)

Talk to us

Similar Papers

More From: Biblios Journal of Librarianship and Information Science