Abstract

Finding graph-edit distance (graph similarity) is an important task in many computer science areas, such as image analysis, machine learning, chemicalinformatics. Recently, with the development of process mining techniques, it became important to adapt and apply existing graph analysis methods to examine process models (annotated graphs) discovered from event data. In particular, finding graph-edit distance techniques can be used to reveal patterns (subprocesses), compare discovered process models. As it was shown experimentally and theoretically justified, exact methods for finding graph-edit distances between discovered process models (and graphs in general) are computationally expensive and can be applied to small models only. In this paper, we present and assess accuracy and performance characteristics of an inexact genetic algorithm applied to find distances between process models discovered from event logs. In particular, we find distances between BPMN (Business Process Model and Notation) models discovered from event logs by using different process discovery algorithms. We show that the genetic algorithm allows us to dramatically reduce the time of comparison and produces results which are close to the optimal solutions (minimal graph edit distances calculated by the exact search algorithm).

Highlights

  • В этом разделе вводится понятие плоских BPMN (Business Process Model and Notation) моделей, также даются определения графов бизнес-процессов и расстояний между ними

  • Data: G1 = (N1, E1, t1, l1) и G2 = (N2, E2, t2, l2) – графы бизнес-процессов; Result: редакционное отношение между G1 и G2; population ← generatreP opulation(G1, G2); while population.size()! = 1 do while !population.empty() do parent1 ← population.get(); parent2 ← population.get(); children ← crossingover(parent1, parent2); newpopulation.add(children); end newpopulation.sort(); \\сортировка по стоимости; newpopulation.resize(newpopulation.size()∗ selectionFactor); \\отбор; population ← newpopulation; end return population.get(); Алгоритм 2: Нахождение редакционного отношения между графами бизнеспроцессов с помощью генетического алгоритма

  • A., "Application of Genetic Algorithms for Finding Edit Distance between Process Models", Modeling and Analysis of Information Systems, 25:6 (2018), 711–725

Read more

Summary

Основные определения

В этом разделе вводится понятие плоских BPMN (Business Process Model and Notation) моделей, также даются определения графов бизнес-процессов и расстояний между ними. Несмотря на большое количество классов BPMN моделей, предложенных Object Management Group (OMG) в формальной спецификации [8], мы рассматриваем только плоские модели процессов, формализующие поток управления. Плоские BPMN модели, формализующие поток управления и полученные с помощью алгоритмов преобразования из сетей Петри, деревьев процессов и каузальных сетей, представлены следующим базовым набором элементов: действия, исключающие и параллельные маршрутизаторы, начальные и конечные события, потоки управления Пример BPMN модели, описывающей простую процедуру бронирования, приведен на Рис. Если для некоторого элемента i выполняется (i, ) ∈ R (( , i) ∈ R), то мы говорим, что элемент i удаляется (добавляется). Минимальное редакционное отношение между двумя графами бизнес-процессов – это редакционное отношение между этими графами, имеющее минимальную стоимость, такое, что оно не содержит пар с элементом δ (соответствия для всех элементов определены).

Точный алгоритм нахождения минимального редакционного расстояния
Базовый алгоритм и структура гена
Генерация начальной популяции
Генерация потомков

Talk to us

Join us for a 30 min session where you can share your feedback and ask us any queries you have

Schedule a call

Disclaimer: All third-party content on this website/platform is and will remain the property of their respective owners and is provided on "as is" basis without any warranties, express or implied. Use of third-party content does not indicate any affiliation, sponsorship with or endorsement by them. Any references to third-party content is to identify the corresponding services and shall be considered fair use under The CopyrightLaw.