Abstract
A checagem manual de conformidade de projetos é uma tarefa custosa e sujeita a erros. Os parâmetros contidos nos códigos regulatórios podem ser automaticamente extraídos usando o Processamento de Linguagem Natural (PLN), tornando a checagem mais eficiente e segura. Embora o PLN constitua uma área emergente, ainda há uma quantidade relativamente pequena de pesquisas aplicando à língua portuguesa. Este estudo investiga uma rotina utilizando técnicas de PLN para o pré-processamento – primeira etapa para extração de informação - de um código regulatório urbanístico brasileiro. Utilizou-se no experimento a linguagem de programação Python e a biblioteca Natural Language Tool Kit (NLTK). Obteve-se uma acurácia de 68% no desempenho do etiquetador, indicando a necessidade de aprimoramentos no pré-processamento para a língua portuguesa. A principal contribuição do artigo é permitir uma maior compreensão das dificuldades e prováveis causas dos erros das etiquetas na fase de pré-processamento.
Talk to us
Join us for a 30 min session where you can share your feedback and ask us any queries you have
Similar Papers
Disclaimer: All third-party content on this website/platform is and will remain the property of their respective owners and is provided on "as is" basis without any warranties, express or implied. Use of third-party content does not indicate any affiliation, sponsorship with or endorsement by them. Any references to third-party content is to identify the corresponding services and shall be considered fair use under The CopyrightLaw.