Abstract

The paper discusses content and results of the methodology elaborated for geocoding of postal addresses. The geocoding issue is considered on the example of study devoted to the exploration of the spatial distribution and dynamics tuberculosis and concomitant diseases infection cases. The study is carried out on a large city scale. The example of St. Petersburg city (Russia) is used. Proposed methodology is based upon the extending of the classical geocoding scheme that assumes direct linking of the address data presented as a part of initial dataset with the address data presented in the reference dataset (in the geospatial database). The extension consists in the use of a middle reference-standard register of postal addresses. An address database developed by official agencies is used as a reference-standard register. Initial data records are linked with the records of the reference-standard register by postal addresses, and the register records, in turn, are linked with the records of the reference dataset used for geocoding (with the addresses recorded in the attributes of the geospatial database objects). This approach allows to provide control of structure and content correctness for the address data used for geocoding, as well as to convert address data in to a unified form accepted officially at the state level and used in official documents and information systems. The methodology is implemented on the example of the postal address system used in the Russia. However, it can also be used when operating with the address system of any other states. In such a case, it is necessary to have an official register of postal addresses to implement the methodology. The register have to be presented in a structured form (preferably in the form of a database). The methodology can be used both for medical statistics data geocoding, and for geocoding of other domain data.

Highlights

  • Необходимо отметить, что термин «геокодирование» имеет несколько толкований

  • Прямое предполагает извлечение из некоторого массива исходных данных описания положения объекта с последующим формированием его геометрической модели в базе пространственных данных и присвоением ей в качестве атрибутов иных данных об объекте, которые могут быть извлечены из массива исходных данных

  • В ходе выполнения обработки данных были выявлены следующие виды ошибок: 1) Ошибки записи данных в медицинские карточки при регистрации случаев инфицирования – в большинстве случаев неуместное использование знака «/» в номерах домов, а также грамматические ошибки в наименованиях улиц и ошибки в указании типа объекта улично-дорожной сети (например, улица вместо проспекта); 2) Ошибки Федеральной информационной адресной системы3 (ФИАС)

Read more

Summary

Introduction

Необходимо отметить, что термин «геокодирование» имеет несколько толкований. В настоящей статье идёт речь о так называемом адресном геокодировании, широко применяемом при наполнении географических информационных систем данными [Борис и. В связи с этим, поиск совпадений описания адресов в массиве исходных данных и в атрибутах справочника, как правило, допускает нестрогое соответствие, что в свою очередь, ведёт к появлению ненулевой вероятности возникновения ошибок геокодирования. Рассматриваемое исследование не предполагало возможность использования коммерческих систем геокодирования, в связи с чем методика геокодирования была разработана на основе использования Nominatim, а для повышения надёжности геокодирования, контроля его корректности и унификации записи адресов были использованы данные Федеральной информационной адресной системы[3] (ФИАС).

Results
Conclusion
Full Text
Paper version not known

Talk to us

Join us for a 30 min session where you can share your feedback and ask us any queries you have

Schedule a call

Disclaimer: All third-party content on this website/platform is and will remain the property of their respective owners and is provided on "as is" basis without any warranties, express or implied. Use of third-party content does not indicate any affiliation, sponsorship with or endorsement by them. Any references to third-party content is to identify the corresponding services and shall be considered fair use under The CopyrightLaw.