Abstract

DBSCAN clustering method is applied to identify severe Traffic Accident (TA) hotpots on roads. The research examines severe TA, defined as those that led to human damage (injury or death), in the city of Newton, MA and in the entire state of Massachusetts, USA from 2013 to 2018. DBSCAN algorithm was also applied to network-constrained uniformly distributed over road network data to locate threshold in number of points per cluster so that all more populated clusters identified in real data can be treated as statistically significant. For DBSCAN algorithm two types of distance metrics, Euclidean and over Network, were compared. It is found that both distances are equivalent on scale of 10 meters, which justifies hybrid approach to clustering: using Network distance only to generate uniformly distributed points needed for Monte-Carlo simulations. All clustering can be performed using Euclidean distances which is much faster and more memory efficient. Subsequent years analysis demonstrates the extend that hotspots identified are stable and occur consecutively for several years and hence may possess predictive value.

Highlights

  • The research examines severe Traffic Accident (TA), defined as those that led to human damage, in the city of Newton, MA and in the entire state of Massachusetts, USA from 2013 to 2018

  • DBSCAN algorithm was applied to network-constrained uniformly distributed over road network data to locate threshold in number of points per cluster so that all more populated clusters identified in real data can be treated as statistically significant

  • It is found that both distances are equivalent on scale of 10 meters, which justifies hybrid approach to clustering: using Network distance only to generate uniformly distributed points needed for Monte-Carlo simulations

Read more

Summary

ВВЕДЕНИЕ

Цель данного исследования состоит в том, чтобы найти компактные участки повышенной опасности (УПО) на дорогах, то есть места со статистически достоверной повышенной плотностью серьезных дорожно-транспортных происшествий (ДТП), которые не меняют своего положения в течение нескольких последовательных лет. Существует несколько методов обнаружения УПО: ядерные оценки плотности KDE [2, 4], I-статистика Морана [5], статистика Getis-Ord Gi* [7], а также различные алгоритмы кластеризации. В соответствии с их природой нелегко использовать KDE, getis-ord GI* или статистику Морана для обнаружения опасных участков заданного размера. В случае кластеризации нам нужна матрица, которая хранит расстояния между всеми ДТП, вычисленные по дорожной сети. Наш план состоит в том, чтобы выполнить кластерный анализ по выбранным ДТП с использованием расстояний по сети, а затем использовать ту же сеть и то же, что и в реальных данных, количество равномерно распределенных точек для проведения статистических испытаний, по меньшей мере, несколько сот раз, чтобы получить статистику размеров кластеров.

ВХОДНЫЕ ДАННЫЕ
МЕТОДЫ ИССЛЕДОВАНИЯ
Гибридный подход к кластеризации
Масштаб 10 м
Гибридная кластеризация
СОДЕРЖАТЕЛЬНЫЙ ПРИМЕР
ВЫВОДЫ
Full Text
Paper version not known

Talk to us

Join us for a 30 min session where you can share your feedback and ask us any queries you have

Schedule a call