Abstract
Objetivo: Desarrollar un clasificador automatizado para la clasificación de material bibliográfico por medio de la minería de texto. Metodología: La minería de texto es empleada para el desarrollo del clasificador, basado en un método de tipo supervisado conformado por dos etapas; de aprendizaje y reconocimiento, en la etapa de aprendizaje, el clasificador aprende patrones a través del análisis de registros bibliográficos, de la clasificación Z, del área de bibliotecología, ciencias de la información y recursos de información recuperados de la base de datos LIBRUNAM , en esta etapa se obtiene el clasificador capaz de reconocer diferentes subclases (LC). En la etapa de reconocimiento el clasificador se valida y evalúa a través de pruebas de clasificación, para este fin se toman aleatoriamente registros bibliográficos de la clasificación Z, clasificados por un catalogador y procesados por el clasificador automatizado, con el fin de obtener la precisión del clasificador automatizado. Resultados: La utilización de la minería de texto permitió el desarrollo del clasificador automatizado, a través del método de clasificación de documentos de tipo supervisado. La precisión del clasificador fue calculada realizando la comparación entre los temas asignados de manera manual y automatizada obteniendo un grado de precisión del 75.70%. Conclusiones: La aplicación de la minería de texto facilito la creación del clasificador automatizado, permitiendo obtener tecnología útil para la clasificación de material bibliográfico con la finalidad de mejorar y agilizar el proceso de organización de información.
Highlights
La metodología empleada para realizar la minería de texto puede ser general o específica, una metodología general como la propuesta por Verma, Ranjan & Mishra (2015) se define en dos fases; la fase de refinación del texto donde los documentos son transformados y representados en estructuras de datos; y la fase llamada destilación del conocimiento, donde se identifican patrones o conocimiento a partir de las estructuras de datos
Los datos obtenidos en esta etapa son representados en alguna estructura informática que facilita su análisis, las estructuras representan las relaciones entre las entidades de un mismo tipo de datos, palabras o conceptos clave, documento-términos, términosautores, etc
Industrial and Information Systems (IIS), 2010 2nd International Conference on (Volume:1 )
Summary
Para Zhang y Gu (2011), el 90% de la información disponible se encuentra de forma no estructurada y semi estructurada, almacenada en computadoras o sistemas de almacenamiento, dificultando su búsqueda y consulta a través de los sistemas de recuperación de información, por lo que es necesario el uso de la tecnología para facilitar su análisis, con la finalidad de agilizar su organización en beneficio de los usuarios de información. Por lo que en este estudio se emplea la minería de texto en el procesamiento de documentos digitales para ser usada en la clasificación de documentos no estructurados partiendo de la siguiente hipótesis: La minería de texto facilita el procesamiento de documentos digitales por medio de los métodos de extracción de información y clasificación, permitiendo la organización de documentos. La minería de texto es empleada para el desarrollo del clasificador, basado en un método de tipo supervisado, conformado por dos etapas; de aprendizaje y reconocimiento, en la etapa de aprendizaje, el clasificador aprende patrones a través del análisis de registros bibliográficos, pertenecientes a la clasificación Z, del área de bibliotecología, ciencias de la información y recursos de información, recuperados de la base de datos LIBRUNAM. El trabajo se encuentra estructurado de la siguiente forma: introducción, minería de texto y clasificación de documentos, metodología de la minería de texto, aplicación de la minería de texto en la base de datos LIBRUNAM, resultados y conclusiones
Published Version (Free)
Talk to us
Join us for a 30 min session where you can share your feedback and ask us any queries you have
More From: Biblios Journal of Librarianship and Information Science
Disclaimer: All third-party content on this website/platform is and will remain the property of their respective owners and is provided on "as is" basis without any warranties, express or implied. Use of third-party content does not indicate any affiliation, sponsorship with or endorsement by them. Any references to third-party content is to identify the corresponding services and shall be considered fair use under The CopyrightLaw.