计算机系统应用  2024, Vol. 33 Issue (1): 37-48   PDF    
过程模拟研究进展
骆敏1, 高俊涛1, 晏婷2     
1. 东北石油大学 计算机与信息技术学院, 大庆 163318;
2. 中国农业大学 资源与环境学院, 北京 100193
摘要:随着计算机技术的不断发展, 过程模拟在各行各业中的应用越来越广泛. 过程模拟使用模拟模型来模仿业务流程行为, 它可以用于预测和优化系统的性能, 评估决策的影响并向管理者提供决策依据, 也可以用于减少实验成本和时间. 目前, 如何高效地去构建一个可以信任的仿真模型得到了广泛关注. 本文通过追踪、归纳和分析关于构建业务过程模拟模型方法的相关研究文献, 对基于过程模型、系统动力学和深度学习的3种仿真建模方法的流程、优缺点和研究进展进行了阐述, 并探讨了过程模拟面临的挑战和未来的发展方向, 以期为业务过程模拟未来的研究方向提供参考.
关键词: 过程模拟    过程挖掘    仿真模型    
Advances in Process Simulation Research
LUO Min1, GAO Jun-Tao1, YAN Ting2     
1. School of Computer & Information Technology, Northeast Petroleum University, Daqing 163318, China;
2. College of Resources and Environmental Sciences, China Agricultural University, Beijing 100193, China
Abstract: With the continuous evolution of computer technology, process simulation is becoming increasingly widely employed in various industries and utilizes simulation models to mimic business process behavior. Additionally, it can be adopted to predict and optimize system performance, assess the impact of decisions, provide a decision-making basis for managers, and reduce the experimental cost and time. Currently, how to efficiently develop a simulation model that can be trusted has caught widespread attention. This study traces, summarizes, and analyzes the relevant references on methods for building business process simulation models. Meanwhile, the processes, advantages, disadvantages, and progress of process model-based, system dynamics-based, and deep learning-based simulation modeling approaches are presented. Finally, the challenges and future directions of process simulation are discussed to provide references for future research in this field.
Key words: process simulation     process mining     simulation model    

过程挖掘(process mining)是一种介于数据挖掘和过程建模之间的学科, 其主要目标是发现过程、执行一致性检查和改进过程[1]. 然而, 传统的过程挖掘技术侧重于分析历史数据并识别与预期过程行为的偏差, 其无法提供有关未来过程行为或过程变化影响的见解. 为了解决过程挖掘的限制, 可以将过程挖掘与过程模拟技术相结合, 以提供前瞻性的见解. 随着企业界在实际应用中对于决策推荐的需求的增多, 过程模拟在最近的研究中获得了广泛的关注和研究.

过程模拟是一种被广泛使用的业务流程分析技术, 旨在从事件日志中提取不同的过程细节来模拟现实世界[2], 可以使管理者从不同的抽象水平视角去了解业务流程的运行效果. 由于过程模拟可以预测不同情景下的过程变化, 并确定潜在的过程瓶颈[3]和需要改进的领域, 或者使决策者能够在实施之前验证拟议过程修改的效果[4], 其为决策者提供做出明智决策的基础, 从而辅助决策者应对复杂的世界. 在最近研究中, 过程模拟被用于一致性检查[5]、事件日志生成[6,7]、面向目的的事件日志生成[8]、假设分析[9]和预测性流程监控[1012]等方面, 涉及医疗、工业、供应链等实际领域. 例如, 过程模拟可以用于预测加入额外资源对过程性能的影响, 从而确定使用多少资源能缩短流程的运行时间[13,14].

过程挖掘和过程模拟两者相辅相成. 过程挖掘算法为过程模拟提供了构建基于真实过程模型的仿真模型所需的必要参数, 如使用过程挖掘算法来提取流程模型结构、资源池、活动处理时间以及决策门的决策逻辑, 而过程模拟可以在实施不同的流程重新设计方案之前测试不同的方案, 回答“what-if”假设的问题, 从而使过程模型成为一个有价值的决策工具.

在现有的文献中, 过程模拟模型的建立方法主要分为3种.

(1)基于过程模型的仿真模型.

(2)基于系统动力学的仿真模型.

(3)基于深度学习的仿真模型.

第1种主要是从事件日志种发现过程模型, 并从事件日志种提取仿真参数嵌入到过程模型中, 构建仿真并丰富仿真模型, 提升仿真模型的准确性. 第2种则是从事件日志种提取性能参数, 从而构建系统动力学领域的因果图或存量流量图来进行模拟. 第3种则是从事件日志中最直接学习仿真模型.

近年来有关过程模拟的综述较少[1517], 并且聚焦于不同的方向. Martin等人[15]侧重于如何去构建一个仿真模型, 以及仿真模型中所需的参数; Keith等人[16]侧重于说明过程模拟存在的挑战和问题; Rosenthal等人[17]则归纳了1990–2018年做业务过程模拟(BPS)的相关文献, 从数据、发现模型、使用的模拟工具等方面进行总结归纳. 本文则主要对关于过程模拟提出的方法进行了分类说明, 总结了这些不同方法最新的研究成果和方法论述, 同时, 分析了其目前面临的挑战、现在的发展趋势以及未来发展方向等.

1 仿真与设计

前人大多探索如何去建立过程模拟模型并评估模型的准确性, 但是找到一种标准的方法来做到这一点让仍然是个挑战难点, 本研究对当前关于建立过程模拟模型的3种主要方法以及模型的应用进行了总结. 如表1所示, 近年的最新研究中对于系统动力学的模拟和基于深度学习的模拟相对较少, 但是也可看到过程模拟与其他技术结合的趋势正在上升.

表 1 文献总结表

1.1 基于过程模型的仿真

基于过程模型的仿真的方法如图1, 首先从事件日志中发现过程模型(如Petri网[18]或者BPMN (business process model and notation)[8]等模型), 并将从事件日志中提取的仿真参数(如资源, 分支概率, 活动等待时间等)嵌入到过程模型中构建仿真模型. 随后, 使用随机方式重播模拟模型, 将生成模拟日志与真实事件日志进行对比, 评估模拟模型的准确性(如计算相似性[9]). 由于最开始的模型由人工构建, 会受到专家知识的限制, 所以后来学者致力于采用各种数据驱动方法自动学习模型参数与结构, 并提出自动化构建仿真模型, 以规避专业知识的限制.

以前的研究[17]大多使用Petri网、工作流、事件图[14]或者BPMN模型的模拟, 且借助工具(ProM[42], CPN工具[43], ADONIS[27])来改善业务流程的方法. 然而, 大多数研究并未实现仿真模型的自动化构建, 而是依赖特定的仿真软件工具. 由于Petri网难以准确描述包含大量随机因素、资源约束与控制流转要素的复杂业务流程, 而BPMN模型比较容易理解, 所以在最近研究中, 大多在BPMN模型或者结合深度学习进行设计仿真模型, 以及开发代码扩展包来进行设计模拟流程[22].

图 1 过程模型模拟方法图

Martin等人[15]确定了BPMN模拟模型的4个组成部分, 既实体、活动、资源和网关, 同时阐释了模型中应该包含的属性, 如资源、处理活动的时间、转移时间和概率等重要属性. 后来, Pereira等人[44]提出通过构建一系列可重用的仿真组件来简化流程仿真模型的构建. 组件包括时间组件、资源组件、随机事件组件等, 并给出了一定的设计理念, 并开发了部分仿真组件. 这为流程仿真提供了新的思路, 可以最大限度重用现有模块以简化模型开发. 同时, Pereira等人[45]对使用过程挖掘技术来支持这些建模任务中的每一项进行了文献综述, 表述了如何为每个BPS建模任务选择流程挖掘技术的问题.

自动化构建仿真模型是过程模型发展的一个重要方向, 自动化构建仿真模型具有效率高、减少错误、标准一致、降低模型构建的难度与门槛等优点, 同时解决构建仿真模型时过度依赖工具实现的缺陷.

2018年, Mesabbah等人[28]则提出了一个通用的自动化端到端的仿真框架ASMB, 该框架使用系统事件日志生成无偏的仿真模型, 并使用业务流程事件日志演示了该框架的有效性, 既通过资源重新分配减少了等待时间, 同时自动化的提取患者路径、处理时间、资源和患者到达系统的速率, 使用通用离散事件仿真(DES)引擎生成功能仿真模型的输入. 但是这系统无法应用于复杂的流程. 后来, Mesabbah等人对模型进行了扩展来应对复杂的流程[26], 在医疗保健系统中引入了机器学习实时数据驱动的系统性能预测方法, 利用患者数据的实时流来预测系统的性能. 这种预测方法对于单个和多个医疗保健单位的管理都具有重要意义. 但是其假设与系统进程关联的资源在整个模拟持续时间内是固定, 实际上, 公立医院急诊科(ED)的资源和人员数量可能因轮班次数不同而有所不同.

2020年Camargo等人在[9,21]中提出完全自动化地构建基于BPMN的业务流程仿真(BPS)模型, 然后通过跟踪对齐、重放和曲线拟合技术的组合来增强该模型的模拟参数, 并采用了贝叶斯超参数优化技术来微调所得到的模拟模型的精度. 其次, 提出了一种测量BPS模型的精度和优化自动发现的BPS模型的精度的方法, 但是对事件日志要求有完整的时间戳.

由于大多的仿真都依赖于外部的模拟器, 所以Pourbafrani等人[19]提出了一个Python扩展包, 用于在过程挖掘中对Petri网进行仿真. 此方法可以设置标记数量、到达率、服务时间分布等参数, 执行Petri网仿真, 得到执行日志. 此方法没有考虑其他的属性的模拟(如资源视角、时间视角), 较难保证生成的日志与真实流程高度一致, 产生的事件日志真实性有限. 该作者还开发了使用进程树进行模拟的工具SIMPT[29]. Pufahl等人[22]则提出了一个基于Java语言的可扩展的BPMN过程模拟器, 除了考虑时间视角外, 还提供了批处理模拟, 为BPMN建模与仿真应用提供了一个初始框架.

由于基于过程模型的模拟是属于细粒度的模拟, 资源属性在其中占着重要角色, 以往的研究中着重于发现过程模型和拟合时间属性, 如等待时间、活动处理时间等, 没有考虑到资源限制的问题, 相反很多假设无限量的资源可以被用于执行每个活动[20]或者资源数量、时间等属性是固定的[28], 这种假设不适合预测长期的绩效指标.

后来研究者提出了针对资源限制的模拟研究. 如Gawin等人[27]提出的模拟模型中考虑了加入案例间到达时间、资源使用的成本和资源时间表参数. 但资源处理仅是单任务处理, 后来有学者提出了资源同时执行多个活动的多任务处理.

Estrada-Torres等人[23,24]提出了一种通过发现流程执行日志中的多任务行为来提高业务流程仿真模型准确性的方法, 通过精确模拟流程, 管理者可以发现瓶颈、优化资源分配并提高整体流程性能. 文献[23]则提出了通过发现流程执行日志中的多任务行为来提高业务流程仿真模型准确性的方法. 该方法通过计算资源的多任务处理指数来估计资源的效率, 并将其作为模拟模型的参数. 文献[24]在文献[23]的基础上, 进一步考虑了资源可用性约束的情况, 即一个资源可能在某些时间段不可用或有限制, 计算模拟结果和真实数据之间的误差, 发现考虑资源可用性约束的算法能够更准确地反映业务流程的实际运行情况. 后来López-Pintado等人[25]提出了基于BPMN模型的差异化的资源模拟, 从原始数据中提取资源的相关限制(性能和可用日历), 嵌入到模拟模型中, 并将模拟结果与原始事件日志进行对比. 差异化资源模拟能更好地表现现实流程, 从而填补了过程模拟在自动化资源约束仿真模拟方面的空缺. 资源限制的模拟可以与资源分配研究结合起来[28,46], 用来验证不同的资源分配比例对流程的影响的程度, 比如是否能缩短流程时间或者减少流程运行成本.

基于过程模型的仿真能够较好保留与反映过程模型中的关键信息, 为模型的验证、优化等工作提供重要支撑. 但其依赖于模型的准确性, 目前尚无公认的准确性衡量标准. 这需要采取多角度检查手段、综合历史信息与经验来判断与验证模型准确性. 而且, 其无法完全反映现实中的模型和流程执行特征, 生成的事件日志无法代表所有可能的实际情况. 最后, 由于细粒度仿真主要提供细节层面上的洞察, 其模拟与预测结果也主要体现在该层面[35]. 同时基于过程模型的方法受到底层过程模型的影响, 仅考虑流程控制与时间行为方面, 忽略其他要素. 这意味着它们受到发现算法引入的偏差的影响. 事实上, 根据给定的事件日志特征选择最佳发现算法没有依据, 这可能导致模拟性能不佳[47].

1.2 基于系统动力学的仿真

在现实中决策需要在不同聚合水平去分析流程的未来. 基于细粒度事件的仿真, 可以反映细的问题也有限, 而且要在单个事件和实例的层面描述过程并建立反映现实的仿真模型是困难的, 需要从其他维度扩展仿真模型, 比如建立更高抽象级别的模型, 如系统动力学模型[35], 其可以从业务流程的上下文中进行更高级别的决策模拟. 但是, 如何从低级事件上抽象出高级仿真模型, 同时弥合低级事件数据和创建高级仿真模型所需的粗粒度过程数据之间的差距是一个挑战. Pourbafrani等人提出了一个完整的方法去解决这个问题[3135,37].

系统动力学主要的目标是如何构建存量流量图和因果图, 而且系统动力学可以根据系统变量随时间推移对系统行为进行建模[48], 在业务流程管理中, 系统动态建模用于模拟业务流程[49], Bowles等人[50]进行了一个案例研究, 以展示流程映射和系统动态建模在改进业务流程中的使用, 这些方法基于传统建模, 并基于用户的领域知识对系统进行建模, 构建存量流量图和因果图. 如图2所示构建系统动力学的方法图, 通过时间窗口检测生成含有过程变量(如计算时间窗口1天内案例的平均等待时间和服务时间等)的系统动力学流程日志(SD-Log), 通过关系检测算法识别过程变量之间的关系(线性或非线性), 构建存量流量图仿真模型, 最后进行模拟, 将生成的模拟日志与SD-Log进行比较相似性, 实现模型评估.

图 2 系统动力学模拟方法图

文献[18]提出的系统动力学模型是手工创建, Petri网中的元素(库所和变迁)被认为是系统动力学模型(存量和流量)中的元素, 此方法是在细粒度的水平上构建仿真模型. 但其需要极强的专业知识, 并且需要创建者对系统动力学和Petri网很了解, 这种方法不利于其他人员使用. 后来, 研究了在粗粒度水平上如何将过程挖掘和系统动力学结合的方法, 并实现了自动化, 验证了提出的方法.

Pourbafrani等人[37]将系统动力学与过程挖掘结合, 预测业务流程中未来的行为, 首先将事件日志转换成具有相关时间顺序的过程参数的SD-Log流程日志, 将过程参数映射到系统动力学的模型元素上, 并凭经验知识定义过程参数之间的数学关系. 在文献[30]中验证了所提出的方法并将模拟应用到决策中. 由于之前的研究, 是基于领域知识设置系统动力学参数之间的数学关系, 会存在一定的主观性. 在文献[31]中作者提出改进, 增加了变量之间的数学关系检测, 避免了传统的系统建模依赖用户给出变量之间的数学关系的缺陷, 此方法还揭示了变量之间的影响并生成因果循环图. SD-Log日志的生成、时间窗口大小选择(1天, 1小时, 1周等)和关系检测模块(如等待时间和服务时间的数学关系), 在文献[32,35]中详细解释其原理. 由于选择适当的时间步长对于准确的预测分析很重要, 因为它会影响用于预测的数据的粒度, 太大会遗漏细节, 太小会导致计算复杂度增大, 都会影响到模型准确性. 在文献[33]中提出一种半自动的时间粒度检测框架, 用于检测最佳的时间粒度和选择精确的时间步长来应对这些挑战. 在文献[34]中则提出了一个完全的自动化生成系统动力学仿真模型的框架, 并采用了各种统计学方法和机器学习技术来发现过程变量之间隐藏的关系.

系统动力学表示聚合程度较高的过程, 并考虑外部因素对过程的影响, 但是对于细节上的模拟有所欠缺, 如具体的活动流程. 而过程模型的模拟缺乏过程变量之间的高级影响, 比如资源每天的工作量对资源效率的影响. 所以在文献[36]中提出了混合业务过程模拟, 结合了过程挖掘和系统动力学技术生成流程的整体模拟模型. 它利用过程挖掘捕获的细节用于操作假设分析, 系统动力学提取的更高级别的信息用于战略假设分析. 比如可以聚合资源疲劳和特定时间步长中工作量对资源效率的影响, 然后更新过程模型中的资源服务时间. 随着使用更新的变量继续执行过程模型, 会生成新的事件日志, 其中包括系统动力学模型的模拟效果. 如图3所示, 首先构建系统动力学模型和过程模型. 将SD-Log中的过程变量v与过程模型中的参数进行映射, 如SD-Log中平均服务时间和等待时间为过程模型中的活动处理时间和等待时间. 随着时间的推移, 通过系统动力学模型模拟, 当案例到达数量、资源数量以及其他的过程变量发生改变时, 其他的过程变量v, 如平均服务时间和等待时间也会发生改变, 随后将变化的值更新过程模型中的值, 从而实现两者结合的模拟. 虚线箭头表示系统动力学模型可以作为输入提供, 也可以从SD-Log中导出.

图 3 系统动力学与过程模型结合

将系统动力学与过程挖掘结合, 能观测和发现流程的抽象层面, 从而捕捉不同因素之间的关系. 基于事件日志, 提取感兴趣的过程性能变量(如活动持续时间、事件频率、流程中涉及的资源数量和平均等待时间等), 使用这些性能参数来创建性能矩阵, 以捕获不同参数之间的关系, 结合专业知识, 生成一个可以回答“what-if”的假设问题, 并预测流程改进的措施对流程的影响结果的系统动力学模型. 这可以帮助组织就流程改进和优化做出明智的决策.

系统动力学的仿真属于粗粒度仿真模型, 是一种特定类型的仿真, 与其他方法不兼容, 该方法具有如下缺点.

(1)假设的是事件日志具有完整性和准确性, 在现实场景中并非如此.

(2)由于系统动力学属于粗粒度仿真模型, 可能无法捕捉到过程的所有细节以及过程中个别案例的变异性和复杂性, 这可能导致结果不准确.

(3)不适用于频繁变化的高动态过程.

未来的研究中, 应探索与其他的仿真技术结合[33], 以及考虑将细粒度与粗粒度相互结合, 弥补各自的不足[36].

1.3 基于深度学习的过程模拟

基于深度学习的过程模拟利用深度学习技术对复杂的过程进行模拟和预测, 是预测性流程监控领域的扩展. 预测过程监控包括一组过程挖掘技术, 主要旨在解决下一个活动、剩余时间和结果预测的问题[51]. 它的原理是使用神经网络模型, 通过学习大量的数据来预测未来的结果. 这种方法的发展始于深度学习技术的兴起, 随着计算机性能的提高和数据的增加, 其在工业、医学和金融等领域得到了广泛的应用.

图4所示, 基于深度学习的方法框架图, 其与基于过程模拟、系统动力学的方法不同的是, 其使用神经网络迭代地预测下一个事件的类型、时间戳、资源等与事件相关的信息, 还可以用于预测当前案例的剩余事件后缀和生成完整的事件轨迹[10,5254]. 这种迭代的预测可以看作以仿真模拟的运行.

图 4 深度学习模拟方法图

Camargo等人[10]提出了一个完全基于深度学习的模拟模型DeepGenerator. 该模型使用长短期记忆网络(LSTM)预测事件日志中给定前缀序列后的剩余事件及其时间戳. 与基于过程模型的方法不同, DeepGenerator直接从事件日志中学习, 而不是依赖人工发现的模型及提取的附加信息. 后续工作证实, 在较大规模事件日志上, DeepGenerator优于基于过程模型方法[7], 在较小规模日志上与后者相似.

由于深度学习的随机性, 所以不适合应用于真实场景为用户创造价值, 所以在文献[38]的研究中引入了一种新的建模方法, 作者加入了约束规则, 提出了一个条件过程模拟模型CoSMo, 来减轻现有仿真模型的完全随机性. 此方法学习如何满足不同条件的轨迹, 并通过特定于事件级和跟踪级评估的指标来验证模拟数据的质量, 证明了条件模拟模型在满足施加条件下学习模拟轨迹的有效性.

虽然基于过程发现的模型能够充分的捕捉和观察到活动的序列以及频率, 但是无法捕捉实际过程的时间动态, 生成式深度模型更能捕捉这种时间动态. 但由于其黑盒性质, 用户无法对它们进行what-if分析. Camargo等人[3941]提出了一种基于过程挖掘和深度学习技术的混合解决方案, 构建一个深度模拟器DeepSimulator[39], 如图5所示, 它使用一个过程模型来模拟控制流和一个深度学习模型来估计活动的处理时间和等待时间, 利用数据驱动模拟技术提取过程模型, 用于生成不带时间戳的活动序列轨迹, 然后将案例创建的数量和时间建模成时间序列模型, 确定案例的第一个活动开始时间, 最后使用预测模型不断迭代预测时间, 生成带时间戳的事件序列. 文献[40,41]则加入了执行活动的上下文信息(资源、活动之间的信息), 使用3种不同的嵌入方法作为活动特征的表示输入到神经网络中, 预测活动的处理时间和等待时间. 实验评估表明, 所得到的混合模拟模型与纯深度学习模型的时间精度相匹配, 同时部分保留了what-if分析能力. 但是此方法生成的日志不包含除活动和时间戳以外的其他属性, 如活动分配的资源. 深度学习方法为多维建模(如包含事件属性、资源和成本)提供了更大的灵活性, 它还支持从中间状态开始进行模拟.

将过程模拟与深度学习结合, 具有分析能力强、自学习能力、适应性强以及泛化等优点, 可以发现复杂过程中的隐含模式与关联, 这有利于构建高精度的仿真模型与进行过程优化, 同时可以自动学习过程数据中的特征与关系, 直接从流程模型映射到事件日志, 无须人工设定大量参数与规则, 这简化了模型构建的难度, 提高了模型构建效率. 其具有很强的泛化能力与适应性优点, 可以应对不同类型的过程建模任务.

由于深度学习方法的黑盒性质, 其具有一些缺陷, 如产生的结果难以解释与理解, 模型的性能取决于许多因素, 如数据质量、网络结构、超参数设置等, 小的变化都可能导致模型性能的大幅提高或下降, 使模型具有一定的不稳定性.

深度学习的过程模拟方法在提高自动化与智能化方面有着巨大潜力, 它提高了模拟模型的泛化能力, 同时拓宽了流程模拟的研究方向, 为流程管理与决策分析带来新的机遇与方法.

图 5 深度学习与过程模型

1.4 模型评估

仿真模型的评估, 主要从时间、轨迹和事件来度量模拟日志与原始日志的相似. 如表2所示, 总结了当前用于计算不同指标的算法.

表 2 模型评估

对模型进行评估后, 如何提高其精度是研究的一个方向. 在传统方法中, 需要专家基于经验手动调整参数, 以获取参数的最佳组合. 但其非常耗时, 且结果不一定是最优的[55], 为了实现模型精度的自动优化, 文献[9]提出了一种基于树状Parzen估计器(TPE)的超参数优化方法[56]. 该方法可以根据历史评估精度, 自动找到参数的最佳设置. 例如, 它可以优化控制流发现算法中的并行度和频率阈值、分支概率分布等超参数. 相比手动调优, 这种方法可以有效地、自动地搜索到使模型精度最优的参数配置. 实现了模型评估后的自动优化提升.

2 挑战

虽然过程模拟在大多行业得到了应用, 但是要投入到生产中, 必须解决几个现存的问题. 除了解决于与其他领域的不同工具间缺乏兼容性的问题[57]以及文献[16]中提到的挑战, 还需面对如下所列的挑战.

(1) 数据质量问题. 由于过程挖掘是以历史事件日志为基础, 所以模型的质量很大程度上取决于收集和存储的数据质量. 在数据的采集阶段, 数据的真实性、准确性、完整性、时效性都会影响数据质量, 此外, 数据的加工、存储过程都有可能涉及对原始数据的修改, 从而引发数据的质量问题. 现有方法主要通过预处理事件日志来维护数据质量, 如过滤、轨迹对齐、日志修复等方式[9,21]或者人工合成日志. 但是这些方法修改了原始事件日志, 对过程模拟中的其他过程度量计算会造成误差, 如资源负载和案例的到达率的计算.

(2) 可扩展性. 实际业务流程往往非常复杂, 需要模拟的流程数量和规模也会增加, 且存在大量的变化和不确定性. 因此, 如何准确地捕捉这些变化并将它们建模到过程模拟中是一个难题.

现在的研究中, 一是采用数学分布以及深度学习方法来捕获时间的动态和活动的变化[26,33,34,40]. 二是采用可拓展性设计原则和工具, 使模型能够容易地扩展和添加新的组件、变量或规则, 以适应未来的变化和需求[19,22,38,42], 如配置Workflows通过流程编排引擎进行流程组合, 快速构建大规模模拟, 提高了模型扩展性. 三是通过抽象水平的模拟给决策者提供不一样的洞察力, 如系统动力学模型. 但是支持的泛化的范围太小, 以及抽象水平的模拟是通过聚合特定时间步长信息来实现[30], 可以考虑基于活动的抽象水平进行模拟.

(3) 模型评估. 参考第1.4节, 模型的验证关系着模型的可用性和正确性, 现有的对于模型的验证只考虑精度, 并没有考虑其他维度的验证[58]. 如果仿真模型不正确, 可能会导致代价高昂的错误决策[2].

(4) 实时性. 一些业务流程需要快速决策和响应, 例如金融交易和制造业生产, 同时需要对流程中的动态变化做出响应, 如活动的增减、路径的变化等. 因此, 过程模拟需要在实时性方面提供支持, 以便在需要时快速生成准确的模拟结果. 目前的研究中考虑到的动态变化有资源的相关属性(如工作量)、活动和案例到达率[36,40,41]. 但现在的研究中缺少模型对动态变化的响应速度的测量.

(5)过程上下文. 事件日志本身难以表达复杂的过程上下文信息, 如资源、时间限制、业务规则等, 而在进行决策的过程中, 上下文的信息不可忽视. 当前的研究中考虑的上下文资源的差异性[2325,27]和加入约束条件[38]的模拟, 以及考虑活动之间的关系[14,40]. 文献[40]将案例到达率(如一天中的案例数量)建模成时间序列预测问题, 认为其值与趋势、季节性和假期有关. 但是这些研究中都是单个分析, 缺少同时考虑这些上下文的研究, 同时考虑的上下文信息太少. 未来可以将其他数据源(如ERP/CRM数据)与事件日志结合, 加入更丰富的上下文信息, 而且资源的工作负载情况也不可忽视[59].

(6) 概念漂移. 在过程模拟中管理假设场景的挑战与调整预测模型来处理概念漂移的问题密切相关. 概念漂移是指输入数据和目标变量之间的关系随时间的变化, 从而影响训练好的预测模型的准确性[40]. 在假设分析和概念漂移这两种情况下, 预测模型必须适应动态, 而不能仅仅依赖于训练数据. 而在现有的研究中并未考虑这个因素, 未来一个潜在的研究方向是调研一些处理概念漂移的技术, 如增量学习[60], 并研究如何将这些技术应用到过程模拟的假设管理中. 这可以帮助过程模拟更好地管理不同假设场景, 使预测模型能自动适应数据分布的变化, 从而提高过程模拟的可靠性.

克服过程模拟的挑战需要采取多种技术和策略, 包括提高日志质量, 构建更丰富的过程上下文, 开发更高级的过程挖掘算法, 综合更广的数据源进行预测, 以及采取渐进式流程优化策略等. 这需要过程挖掘与其他技术、方法的结合与融合, 比如基于代理的业务流程模拟应该被重视起来.

3 未来的发展

过程模拟是过程挖掘的一个重要的分支, 根据过去的研究与发展, 可以总结出如下几个发展方向.

3.1 提供决策依据

由于过程模拟能对流程未来结果的进行预测模拟, 这种特性能给管理者提供决策依据, 所以可以与预测性业务流程监控结合, 当预测出当前流程会以负面结果结束, 做出措施以解决当前问题. 但使用过程模拟来进行辅助决策, 其还需在以下几个方面进行研究.

(1) 实时和动态模拟. 传统的过程模拟主要关注静态的业务流程模型, 但实际业务流程往往是动态变化的, 因此, 过程模拟模型需要能够及时响应环境的变化和调整决策策略, 以应对环境的变化和实时需求. 比如使用深度学习发现的仿真模型具有很好的泛化性, 能更好地面对环境的变化. 以及发展更智能的自适应模型, 能够根据实时数据自动调整和优化, 以适应实际业务的变化[9,40].

(2) 与预测性流程监控技术结合. 目前大多数过程挖掘还停留在历史事件日志的分析, 如在Fahrenkrog-Petersen等人[61]的研究中, 作者将预测性流程监控和流程干预联合起来, 但缺少对流程进行干预之后的结果预测. 所以可以利用过程模拟的特性, 将过程模拟、在线预测和决策推荐进行结合, 为决策者提供决策措施以解决当前问题.

(3) 结合人工智能和机器学习技术. 未来的过程模拟可以结合人工智能和机器学习技术[34]. 通过利用机器学习算法和深度学习模型, 过程模拟可以从历史数据中学习模式和趋势, 并预测未来的情况[54]. 此外, 结合自动化决策系统, 模型可以自动优化决策策略并提供智能化的决策支持. 如使用强化学习进行资源分配[62].

(4) 多维过程分析. 目前过程模拟中考虑到的上下文知识比较少, 较多的关注于资源维度[23,24,27]和时间维度. 但是现实中的决策所需的关键信息比较多, 这就需要将模型扩展到其他维度, 通过引入更多的变量、考虑更多的环境因素和影响因素, 模型将能够更准确地模拟实际业务流程, 并提供更精细化的决策支持. 比如考虑事件之间发生的因果关系模拟等[14], 进行真正的多维过程管理和优化.

(5) 协同模拟与决策. 决策不仅是基于单个流程的决策, 可以建立能够模拟多个相关业务流程之间的协同作用和影响, 帮助企业制定更优化的决策策略. 此外, 模型还可以支持团队协同决策, 通过共享模拟结果和决策建议, 促进团队合作和决策的一致性.

3.2 自动化建模和评估

实现自动或半自动构建和评估仿真模型是使过程模拟能否得到广泛应用的关键点, 其可以减少人为主观对模型的影响, 并基于该模型不断优化和调整过程, 实现由数据驱动的、持续的过程改进, 减轻流程专家的负担. 在现有的研究中已有关于自动化建模和评估的研究方法[21]. 在以后的研究中自动化建模应该继续被当作一个重要的考虑因素.

3.3 混合业务过程模拟

混合模拟[36,3941]可以弥补不同模型中的缺陷, 但在近年来研究较少. 混合业务过程模拟可以在系统层面上模拟不同类型流程的交互执行, 产生在单一过程模拟中难以出现的新的行为模式, 检验不同流程的互操作性, 评估资源使用情况, 模拟异常情况的影响, 并进行what-if分析. 它提供了一个更全面与准确的视角来分析、优化与管理复杂业务过程, 是过程模拟的高级应用手段, 为复杂过程的科学管理与自动化决策提供更可靠的基础支撑. 比如可以将事件日志抽象应用于过程模拟中, 从而实现构建抽象级别的仿真模型.

过程模拟在未来将朝着模型复杂性与精细化、实时和动态模拟、与人工智能和机器学习相结合、多模态数据融合以及协同模拟与决策等多个方向发展. 这些发展方向都将有助于提高过程模拟模型的决策能力, 使其更加适应实际业务需求和决策场景.

4 总结

本文主要对过程模拟近5年内的文献进行了总结, 从过程模拟的发展趋势、挑战、不同模型的优缺点等方面进行了阐述. 近年来, 过程模拟与其他领域的交叉研究日益增多, 特别是涉及与机器学习、人工智能、大数据分析等领域的交叉研究. 这种交叉研究不仅可以丰富过程模拟的技术手段, 还可以拓展过程模拟的应用范围. 过程模拟研究呈现出多样化、交叉性、实践性等特点, 未来将有更广阔的发展前景.

参考文献
[1]
van der Aalst WMP. Process Mining: Data Science in Action. 2nd ed., Heidelberg: Springer, 2016.
[2]
van der Aalst WMP. Business process simulation survival guide. Handbook on Business Process Management 1: Introduction, Methods, and Information Systems. 2nd ed., Berlin, Heidelberg: Springer, 2015. 337–370.
[3]
Rusinaite T, Vasilecas O, Savickas T, et al. An approach for allocation of shared resources in the rule-based business process simulation. Proceedings of the 17th International Conference on Computer Systems and Technologies. Palermo: ACM, 2016. 25–32.
[4]
Peters S, Dijkman RM, Grefen PWPJ. Quantitative effects of advanced resource constructs in business process simulation. Proceedings of the 22nd IEEE International Enterprise Distributed Object Computing Conference. Stockholm: IEEE, 2018. 115–122.
[5]
Sani MF, Gonzalez JJG, van Zelst SJ, et al. Conformance checking approximation using simulation. Proceedings of the 2nd International Conference on Process Mining (ICPM). Padua: IEEE, 2020. 105–112.
[6]
Burattin A. PLG2: Multiperspective processes randomization and simulation for online and offline settings. arXiv:1506.08415, 2015.
[7]
Camargo M, Dumas M, González-Rojas O. Discovering generative models from event logs: Data-driven simulation vs deep learning. PeerJ Computer Science, 2021, 7: e577. DOI:10.7717/peerj-cs.577
[8]
Burattin A, Re B, Rossi L, et al. A purpose-guided log generation framework. Proceedings of the 20th International Conference on Business Process Management. Münster: Springer, 2022. 181–198.
[9]
Camargo M, Dumas M, González-Rojas O. Automated discovery of business process simulation models from event logs. Decision Support Systems, 2020, 134: 113284. DOI:10.1016/j.dss.2020.113284
[10]
Camargo M, Dumas M, González-Rojas O. Learning accurate LSTM models of business processes. Proceedings of the 17th International Conference on Business Process Management. Vienna: Springer, 2019. 286–302.
[11]
Di Francescomarino C, Ghidini C, Maggi FM, et al. An eye into the future: Leveraging a-priori knowledge in predictive business process monitoring. Proceedings of the 15th International Conference on Business Process Management. Barcelona: Springer, 2017. 252–268.
[12]
Tax N, Verenich I, La Rosa M, et al. Predictive business process monitoring with LSTM neural networks. Proceedings of the 29th International Conference on Advanced Information Systems Engineering. Essen: Springer, 2017. 477–492.
[13]
Rozinat A, Wynn M, van der Aalst W, et al. Workflow simulation for operational decision support using design, historic and state information. Proceedings of the 6th International Conference on Business Process Management. Milan: Springer, 2008. 196–211.
[14]
Liu Y, Zhang H, Li CP, et al. Workflow simulation for operational decision support using event graph through process mining. Decision Support Systems, 2012, 52(3): 685-697. DOI:10.1016/j.dss.2011.11.003
[15]
Martin N, Depaire B, Caris A. The use of process mining in a business process simulation context: Overview and challenges. Proceedings of the 2014 IEEE Symposium on Computational Intelligence and Data Mining (CIDM). Orlando: IEEE, 2014. 381–388.
[16]
Keith Norambuena B. Integration of process mining and simulation: A survey of applications and current research. Trends and Advances in Information Systems and Technologies: Volume 1. Cham: Springer, 2018. 287–294.
[17]
Rosenthal K, Ternes B, Strecker S. Business process simulation on procedural graphical process models: Structuring overview and paths for future research. Business & Information Systems Engineering, 2021, 63(5): 569-602.
[18]
Duggan J. A comparison of Petri net and system dynamics approaches for modelling dynamic feedback systems. Proceedings of the 24th International Conference of the Systems Dynamics Society. Galway, 2006. 1–22.
[19]
Pourbafrani M, Vasudevan S, Zafar F, et al. A Python extension to simulate Petri nets in process mining. arXiv:2102.08774, 2021.
[20]
Khodyrev I, Popova S. Discrete modeling and simulation of business processes using event logs. Procedia Computer Science, 2014, 29: 322-331. DOI:10.1016/j.procs.2014.05.029
[21]
Camargo M, Dumas M, Rojas OG. Simod: A tool for automated discovery of business process simulation models. Proceedings of the 2019 Dissertation Award, Doctoral Consortium, and Demonstration Track at BPM Co-located with 17th International Conference on Business Process Management. Vienna: CEUR-WS.org, 2019. 139–143.
[22]
Pufahl L, Wong TY, Weske M. Design of an extensible BPMN process simulator. Proceedings of the 2017 BPM International Workshops on Business Process Management Workshops. Barcelona: Springer, 2018. 782–795.
[23]
Estrada-Torres B, Camargo M, Dumas M, et al. Discovering business process simulation models in the presence of multitasking. Proceedings of the 14th International Conference on Research Challenges in Information Science. Limassol: Springer, 2020. 381–397.
[24]
Estrada-Torres B, Camargo M, Dumas M, et al. Discovering business process simulation models in the presence of multitasking and availability constraints. Data & Knowledge Engineering, 2021, 134: 101897.
[25]
López-Pintado O, Dumas M. Business process simulation with differentiated resources: Does it make a difference? Proceedings of the 20th International Conference on Business Process Management. Münster: Springer, 2022. 361–378.
[26]
Mesabbah M, Abo-Hamad W, McKeever S. A hybrid process mining framework for automated simulation modelling for healthcare. Proceedings of the 2019 Winter Simulation Conference (WSC). National Harbor: IEEE, 2019. 1094–1102.
[27]
Gawin B, Marcinkowski B. How close to reality is the “as-is” business process simulation model? Organizacija, 2015, 48(3): 155–175.
[28]
Mesabbah M, McKeever S. Presenting a hybrid processing mining framework for automated simulation model generation. Proceedings of the 2018 Winter Simulation Conference (WSC). Gothenburg: IEEE, 2018. 1370–1381.
[29]
Pourbafrani M, Jiao S, van der Aalst WMP. SIMPT: Process improvement using interactive simulation of time-aware process trees. Proceedings of the 15th International Conference on Research Challenges in Information Science. Limassol: Springer, 2021. 588–594.
[30]
Pourbafrani M, van Zelst SJ, van der Aalst WMP. Supporting decisions in production line processes by combining process mining and system dynamics. Proceedings of the 3rd International Conference on Intelligent Human Systems Integration (IHSI 2020): Integrating People and Intelligent Systems. Modena: Springer, 2020. 461–467.
[31]
Pourbafrani M, van Zelst SJ, van der Aalst WMP. Supporting automatic system dynamics model generation for simulation in the context of process mining. Proceedings of the 23rd International Conference on Business Information Systems. Colorado Springs: Springer, 2020. 249–263.
[32]
Pourbafrani M, van der Aalst WMP. PMSD: Data-driven simulation using system dynamics and process mining. arXiv:2010.00943, 2020.
[33]
Pourbafrani M, van Zelst SJ, van der Aalst WMP. Semi-automated time-granularity detection for data-driven simulation using process mining and system dynamics. Proceedings of the 39th International Conference on Conceptual Modeling. Vienna: Springer, 2020. 77–91.
[34]
Pourbafrani M, van der Aalst WMP. Discovering system dynamics simulation models using process mining. IEEE Access, 2022, 10: 78527-78547. DOI:10.1109/ACCESS.2022.3193507
[35]
Pourbafrani M, van der Aalst WMP. Extracting process features from event logs to learn coarse-grained simulation models. Proceedings of the 33rd International Conference on Advanced Information Systems Engineering. Melbourne: Springer, 2021. 125–140.
[36]
Pourbafrani M, van der Aalst WMP. Hybrid business process simulation: Updating detailed process simulation models using high-level simulations. Proceedings of the 16th International Conference on Research Challenges in Information Science. Barcelona: Springer, 2022. 177–194.
[37]
Pourbafrani M, van Zelst SJ, van der Aalst WMP. Scenario-based prediction of business processes using system dynamics. Proceedings of the 2019 Confederated International Conferences on the Move to Meaningful Internet Systems: OTM Conferences. Rhodes: Springer, 2019. 422–439.
[38]
Oyamada RS, Tavares GM, Ceravolo P. CoSMo: A framework for implementing conditioned process simulation models. arXiv:2303.17879, 2023.
[39]
Camargo M, Dumas M, González-Rojas O. Learning accurate business process simulation models from event logs via automated process discovery and deep learning. Proceedings of the 34th International Conference on Advanced Information Systems Engineering. Leuven: Springer, 2022. 55–71.
[40]
Camargo M, Báron D, Dumas M, et al. Learning business process simulation models: A hybrid process mining and deep learning approach. Information Systems, 2023, 117: 102248. DOI:10.1016/j.is.2023.102248
[41]
Camargo Chávez MA. Automated discovery of business process simulation models from event logs: A hybrid process mining and deep learning approach. http://hdl.handle.net/1992/54943. (2021-11-11).
[42]
van Dongen BF, de Medeiros AKA, Verbeek HMW, et al. The ProM framework: A new era in process mining tool support. Proceedings of the 26th International Conference on Applications and Theory of Petri Nets. Miami: Springer, 2005. 444–454.
[43]
Rozinat A, Mans RS, Song M, et al. Discovering simulation models. Information Systems, 2009, 34(3): 305-327. DOI:10.1016/j.is.2008.09.002
[44]
Pereira JL, Freitas AP. Simulation of BPMN process models: Current BPM tools capabilities. New Advances in Information Systems and Technologies. Cham: Springer, 2016. 557–566.
[45]
Pereira JL, Almeida M. Business process simulation models: The (re)use of simulation components. Recent Advances in Information Systems and Technologies: Volume 1. Cham: Springer, 2017. 746–756.
[46]
Arias M, Rojas E, Munoz-Gama J, et al. A framework for recommending resource allocation based on process mining. Proceedings of the 13th International Workshops on Business Process Management Workshops. Innsbruck: Springer, 2015. 458–470.
[47]
de Weerdt J, de Backer M, Vanthienen J, et al. A multi-dimensional quality assessment of state-of-the-art process discovery algorithms using real-life event logs. Information Systems, 2012, 37(7): 654-676. DOI:10.1016/j.is.2012.02.004
[48]
Sterman J. System dynamics: Systems thinking and modeling for a complex world. http://hdl.handle.net/1721.1/102741. (2002-05-29).
[49]
An LJ, Jeng JJ. On developing system dynamics model for business process simulation. Proceedings of the 2005 Winter Simulation Conference. Orlando: IEEE, 2005. 10.
[50]
Bowles DE, Gardiner LR. Supporting process improvements with process mapping and system dynamics. International Journal of Productivity and Performance Management, 2018, 67(8): 1255-1270. DOI:10.1108/IJPPM-03-2017-0067
[51]
Rama-Maneiro E, Vidal JC, Lama M. Deep learning for predictive business process monitoring: Review and benchmark. IEEE Transactions on Services Computing, 2023, 16(1): 739-756.
[52]
Taymouri F, La Rosa M, Erfani S, et al. Predictive business process monitoring via generative adversarial nets: The case of next event prediction. Proceedings of the 18th International Conference on Business Process Management. Seville: Springer, 2020. 237–256.
[53]
Lin L, Wen LJ, Wang JM. MM-Pred: A deep predictive model for multi-attribute event sequence. Proceedings of the 2019 SIAM International Conference on Data Mining. Calgary: Society for Industrial and Applied Mathematics, 2019. 118–126.
[54]
Evermann J, Rehse JR, Fettke P. Predicting process behaviour using deep learning. Decision Support Systems, 2017, 100: 129–140.
[55]
Witt N, Seifert C. Understanding the influence of hyperparameters on text embeddings for text classification tasks. Proceedings of the 21st International Conference on Theory and Practice of Digital Libraries. Thessaloniki: Springer, 2017. 193–204.
[56]
Bergstra J, Bardenet R, Bengio Y, et al. Algorithms for hyper-parameter optimization. Proceedings of the 24th International Conference on Neural Information Processing Systems. Granada: Curran Associates Inc., 2011. 2546–2554.
[57]
Liu ST. Integrating process mining with discrete-event simulation modeling [Master’s Thesis]. Rexburg: Brigham Young University, 2015.
[58]
Buijs JCAM, van Dongen BF, van der Aalst WMP. Quality dimensions in process discovery: The importance of fitness, precision, generalization and simplicity. International Journal of Cooperative Information Systems, 2014, 23(1): 1440001. DOI:10.1142/S0218843014400012
[59]
Huang ZX, van der Aalst WMP, Lu XD, et al. Reinforcement learning based resource allocation in business process management. Data & Knowledge Engineering, 2011, 70(1): 127-145.
[60]
Rizzi W, Di Francescomarino C, Ghidini C, et al. How do I update my model? On the resilience of predictive process monitoring models to change. Knowledge and Information Systems, 2022, 64(5): 1385-1416. DOI:10.1007/s10115-022-01666-9
[61]
Fahrenkrog-Petersen SA, Tax N, Teinemaa I, et al. Fire now, fire later: Alarm-based systems for prescriptive process monitoring. Knowledge and Information Systems, 2022, 64(2): 559-587. DOI:10.1007/s10115-021-01633-w
[62]
Żbikowski K, Ostapowicz M, Gawrysiak P. Deep reinforcement learning for resource allocation in business processes. Proceedings of the 2022 International Workshops on Process Mining. Bozen-Bolzano: Springer, 2022. 177–189.