Abstract
Este artigo tem como objetivo apresentar o problema relativo ao armazenamento, à sistematização e à disponibilização de dados em saúde no Brasil e uma solução inovadora: a implementação de um data lake com dados do setor de saúde. O data lake foi construído a partir de três etapas: (1) planejamento e priorização das bases de dados a serem importadas para o repositório; (2) extração, carregamento e tratamento dessas bases, com o apoio das ferramentas Apache Airflow e Dremio; e (3) aplicação do uso. Os resultados evidenciam a capacidade de a plataforma armazenar um grande volume de dados (Big Data), bem como de propiciar uma navegação intuitiva, facilitando a compreensão e o manuseio dos dados por analistas em saúde. Constata-se, ainda, que gestores públicos e pesquisadores reconhecem as contribuições da ferramenta para suas decisões e a potencialidade desta para o desenvolvimento de outras soluções de inteligência para a análise de dados da área de saúde. A solução apresentada visa contribuir para a gestão e o planejamento de políticas de saúde, permitindo o acesso de modo rápido e amplo a diversos dados que suportam a tomada de decisões na área de saúde com mais agilidade e segurança.
Talk to us
Join us for a 30 min session where you can share your feedback and ask us any queries you have
Similar Papers
More From: InCID: Revista de Ciência da Informação e Documentação
Disclaimer: All third-party content on this website/platform is and will remain the property of their respective owners and is provided on "as is" basis without any warranties, express or implied. Use of third-party content does not indicate any affiliation, sponsorship with or endorsement by them. Any references to third-party content is to identify the corresponding services and shall be considered fair use under The CopyrightLaw.