Abstract

[ES] A lo largo de las ultimas dos decadas, los datos generados por las tecnologias de secuenciacion de nueva generacion han revolucionado nuestro entendimiento de la biologia humana. Es mas, nos han permitido desarrollar y mejorar nuestro conocimiento sobre como los cambios (variaciones) en el ADN pueden estar relacionados con el riesgo de sufrir determinadas enfermedades. Actualmente, hay una gran cantidad de datos genomicos disponibles de forma publica, que son consultados con frecuencia por la comunidad cientifica para extraer conclusiones significativas sobre las asociaciones entre los genes de riesgo y los mecanismos que producen las enfermedades. Sin embargo, el manejo de esta cantidad de datos que crece de forma exponencial se ha convertido en un reto. Los investigadores se ven obligados a sumergirse en un lago de datos muy complejos que estan dispersos en mas de mil repositorios heterogeneos, representados en multiples formatos y con diferentes niveles de calidad. Ademas, cuando se trata de resolver una tarea en concreto solo una pequena parte de la gran cantidad de datos disponibles es realmente significativa. Estos son los que nosotros denominamos datos inteligentes. El principal objetivo de esta tesis es proponer un enfoque sistematico para el manejo eficiente de datos genomicos inteligentes mediante el uso de tecnicas de modelado conceptual y evaluacion de calidad de los datos. Este enfoque esta dirigido a poblar un sistema de informacion con datos que sean lo suficientemente accesibles, informativos y utiles para la extraccion de conocimiento de valor.

Full Text
Paper version not known

Talk to us

Join us for a 30 min session where you can share your feedback and ask us any queries you have

Schedule a call

Disclaimer: All third-party content on this website/platform is and will remain the property of their respective owners and is provided on "as is" basis without any warranties, express or implied. Use of third-party content does not indicate any affiliation, sponsorship with or endorsement by them. Any references to third-party content is to identify the corresponding services and shall be considered fair use under The CopyrightLaw.