Abstract

Process mining is a new emerging discipline related to process management, formal process modelling, and data mining. One of the main tasks of process mining is model synthesis (discovery) based on event logs. A wide range of algorithms for process model discovery, analysis, and enhancement is developed. The real-life event logs often contain noise of different types. In this paper, we describe the main causes of noise in the event logs and study the effect of noise on the performance of process discovery algorithms. The experimental results of application of the main process discovery algorithms to artificial event logs with noise are provided. Specially generated event logs with noise of different types were processed using the four basic discovery techniques. Although modern algorithms can cope with some types of noise, in most cases, their use does not lead to obtaining a satisfactory result. Thus, there is a need for more sophisticated algorithms to deal with noise of different types.

Highlights

  • Ключевые слова: Извлечение и анализ процессов, сети Петри, журналы событий, генерация журналов событий, ProM, Process mining

  • Для этого специальным образом сгенерированные журналы событий с шумом обрабатывались с использованием четырех основных методов извлечения процессов

  • In this paper we describe the main causes of noise in the event logs and study the effect of noise on the performance of process discovery algorithms

Read more

Summary

Сети потоков работ

В данной работе для представления процессов в информационной системе используются сети потоков работ – специальный класс сетей Петри [2]. Начальной разметкой для сети потоков работ является маркер в начальной позиции. Поэтому в данной работе рассматриваются именованные сети потоков работ, в которых каждый узел имеет имя. В общем случае, журнал событий – это набор некоторых текстовых записей, содержащий информацию о событиях и действиях процесса. При моделировании процесса именованной сетью потоков работ выполнение операции соответствует срабатыванию перехода с соответствующим именем в сети. Таблица 1 содержит фрагмент журнала событий, соответствующего модели на рисунке 1. Журнал событий – это мультимножество трасс, где каждая трасса содержит ровно одно исполнение процесса в виде последовательности событийных записей. Для хранения журналов событий существует открытый формат OpenXES [14]. В данной работе для хранения журналов событий также используется XES. В этом случае, однако, нельзя гарантировать работоспособность стандартных инструментов, предназначенных для обработки стандартизированных журналов событий

Соответствие моделей и журналов событий
Классификация шумов в журналах событий
Исследование журналов событий с шумами
Заключение
Full Text
Published version (Free)

Talk to us

Join us for a 30 min session where you can share your feedback and ask us any queries you have

Schedule a call