Abstract

Los diccionarios del siglo XIX representan una fuente invaluable para comprender la evolución del lenguaje y la cultura de la época. Sin embargo, la digitalización de estos textos puede resultar una tarea ardua debido a la complejidad de la tipografía y la presencia de errores tipográficos. El método aplicado en estos estudios anteriores ha estado basado en la lectura de cada fuente y en el análisis del contexto de publicación. Se ha obviado la utilización de las nuevas posibilidades abiertas por las Humanidades Digitales, así como la aplicación de los resultados obtenidos para responder a las necesidades de este campo de investigación. En este artículo se describe el proceso seguido para el estudio y la digitalización del Diccionario técnico de la música de Felipe Pedrell (1894) a través de la aplicación de herramientas informáticas y de gestión de la información digitalizada. Por un lado, se han explorado plataformas de inteligencia artificial, en concreto las herramientas de machine learning Transkribus y Nanonets, con el objetivo de entrenar modelos propios de reconocimiento de escritura y transcripción. Por otro lado, se han seguido metodologías clásicas de digitalización y reconocimiento de caracteres y se ha realizado un proceso de análisis, filtrado y tratamiento posterior a través de algoritmos que mejoran el proceso de transcripción. Finalmente, se ha desarrollado un servicio web de consulta de este diccionario que recoge los resultados de este trabajo y lo convierte en un recurso de calidad en el ámbito de la investigación musicológica y en la preservación de documentos históricos.

Talk to us

Join us for a 30 min session where you can share your feedback and ask us any queries you have

Schedule a call

Disclaimer: All third-party content on this website/platform is and will remain the property of their respective owners and is provided on "as is" basis without any warranties, express or implied. Use of third-party content does not indicate any affiliation, sponsorship with or endorsement by them. Any references to third-party content is to identify the corresponding services and shall be considered fair use under The CopyrightLaw.