Abstract

La investigación sobre el coronavirus ha generado una producción de documentos científicos extraordinaria. Su tratamiento y asimilación por parte de la comunidad científica ha necesitado de la ayuda de sistemas de recuperación de información diseñados específicamente. Algunas de las principales instituciones mundiales dedicadas a la lucha contra la pandemia han desarrollado el conjunto de datos CORD-19 que destaca sobre otros proyectos de similar naturaleza. Los documentos recopilados en esta fuente han sido procesados por distintas herramientas de recuperación de información, a veces prototipos o sistemas que ya estaban implementados. Se ha analizado la tipología y características principales de estos sistemas concluyendo que hay tres grandes categorías no excluyentes entre ellas: búsqueda terminológica, visualización de información y procesamiento de lenguaje natural. Destaca enormemente que la gran mayoría de ellos emplean preferentemente tecnologías de búsqueda semántica con el objeto de facilitar la adquisición de conocimiento s los investigadores y ayudarlas en su ingente tarea. La crisis provocada por la pandemia ha sido aprovechada por los buscadores semánticos para encontrar su sitio.

Highlights

  • Research on the coronavirus has generated an extraordinary production of scientific documents

  • También entraría en este grupo el amplio conjunto de utilidades desarrolladas por el Ontology Engineering Group de la Universidad Politécnica de Madrid que ha desarrollado, bajo el soporte del motor de búsqueda Apache SolR, un sistema de búsqueda con grafos y estadísticas sobre la colección de artículos indexada y un explorador mediante etiquetas creadas, además de permitir llevar a cabo anotaciones de los artículos contenidos en la base de datos

  • CORD-19 Search Vespa Covid Explorer Covidexplorer CovidSeer Fatcat COVID-19 Paper Search inteligencia artificial (IA) & COVID-19 LIA COVID-19 SciFact CaiRE-Covid CORD-19 Search Covid Dataset Search COVID-19 Concept Embeddings

Read more

Summary

INTRODUCCIÓN

El mundo está viviendo los efectos de una pandemia de origen indefinido y alcance aún por determinar. La descripción por medio de metadatos de la información científica y técnica, la normalización terminológica y conceptual a través de tesauros y lenguajes facetados propios de las Ciencias de la Salud, la minería de datos y el desarrollo de sistemas de información interoperables (a través de servicios REST y APIs, entre otros), ha provocado la generación ad hoc de una amplia variedad de fuentes de información específicas en torno al Coronavirus, no solo de artículos científicos sino también de casos clínicos, datos epidemiológicos, evidencias o patentes. Existe una gran sinergia entre CORD-19 y el buscador semántico académico Semantic Scholar (proyecto también desarrollado en el instituto AI2, lanzado en el año 2015 aunque su verdadero punto de inflexión fue su asociación en 2018 con el buscador Microsoft Academic) que incluso permite la descarga del conjunto de datos en su página principal y que le ha ayudado a convertirse en el referente informativo para los investigadores durante esta pandemia (por el contrario, Google Scholar, motor mucho más desarrollado, no ha llevado a cabo algo parecido). Y comprobar cómo se ha llevado a cabo esta tarea constituye el principal objeto de este trabajo, junto con la identificación y clasificación de los desarrollos más relevantes en el ámbito de la recuperación de información puestos en marcha para ayudar en la búsqueda de la ansiada vacuna y/o tratamientos contra la enfermedad

METODOLOGÍA
RESULTADOS
Buscadores convencionales
Visualización de la información
Posibilidades de los sistemas de búsqueda
CONCLUSIONES
REFERENCIAS
Full Text
Paper version not known

Talk to us

Join us for a 30 min session where you can share your feedback and ask us any queries you have

Schedule a call

Disclaimer: All third-party content on this website/platform is and will remain the property of their respective owners and is provided on "as is" basis without any warranties, express or implied. Use of third-party content does not indicate any affiliation, sponsorship with or endorsement by them. Any references to third-party content is to identify the corresponding services and shall be considered fair use under The CopyrightLaw.