流程挖掘算法(流程挖掘入门介绍)

1. 在我们生活中的流程挖掘

活跃在几乎任何领域的绝大多数公司都执行流程。无论公司的核心业务是交付产品,例如,制造汽车,烹饪美味的披萨等,还是提供服务,例如,为您提供抵押贷款以购买您的梦想的房子,偿还您的保险索赔,等等,为了高效地交付您的产品/服务,都要执行流程。因此,一个自然的问题是:“什么是过程?”一般来说,存在几个关于流程概念的概念。然而,在过程挖掘中,我们通常假设以下概念定义: 流程表示我们为实现某个目标而执行的活动的集合

例如,考虑一下街角的汉堡店,它也提供汉堡。当你打电话给餐厅点你心爱的汉堡时,服务员(让我们叫她露西)接电话的第一个动作就是帮你点单。假设你想要一个美味的芝士汉堡和一罐苏【资 ;源 之.家.】打水。露西把你的订单输入收银机后,她要你的地址,并把地址添加到订单中。最后,她会询问你喜欢的付款方式,然后她会向你提供一个大概的交货时间。露西打完电话后,把你点的菜打印出来交给厨师,我们叫他路易吉吧。既然你打电话来得比较早,路易吉可以马上开始准备你的汉堡。

与此同时,露西从冰箱里拿出一罐苏打水,放在柜台上。另一位客户打来了新电话,她处理电话的方式和你的差不多。当路易吉吃完你的汉堡后,他把它放进一个纸箱里,把盒子递给露西。露西把订单包在袋子里。然后她把装着你的汉堡和苏打水的袋子递给迈克,迈克用一辆漂亮的电动自行车把你点的东西送到你家里。

在这个小示例中,让我们假设我们对流程感兴趣,即为您的订单执行的【资 ;源 之.家.】活动集合。基于我们刚刚展示的场景,步骤如下:

1. 露西为您点菜

2. 露西记下了你的地址

3. 露西记下了你喜欢的付款方式

4. 路易吉为你准备汉堡

5. 露西拿起你的汽水罐

6. 路易吉把你的汉堡放进盒子里

7. 露西包装您的订单

8. 迈克为您送餐

2. 流程挖掘分析算法

1)Petrinets(也叫Petri网)

Petrinets在上个世纪60年代就被提出了,是学术界最主要也是最重要的描述流程节点关联性的图表示方法,它通过动态特性token来作为流程流转的标识,反映着流程流转的动态情况。Petrinets应用很广,其中一个重要的应用就是做Conformance Checking(一致性检验),但目前几乎所【资 ;源 之.家.】有的商业流程挖掘软件都没有用Petrinets作为流程图,原因很简单,那就是Petrinets看起来非常复杂难懂。

2)Process Tree(简称PT,流程树

PT是通过Process Discovery的产物,比如Alpha算法和Inductive mining的产物就是PT,由于PT是通过树形结构存储流程节点关联关系的,因此对于学者和程序员来说是非常好理解的结构,但是不适合业务人员。

3)BPMN 2.0

BPMN 2.0是商业界广泛地用于制作企业业务规范的流程图标准,BPMN 2.0可以和PT做无缝地转换,并且也可以转换成Petrinets,是一个非常标准的流程定义的规范,但是,制作流程图的【资 ;源 之.家.】一个关键核心是要简单,BPMN2.0为了能够精准地描述流程的并行关系、选择关系、循环关系等需要在流程图中加很多的控制门,这些控制门无疑拖累了流程图的简洁性,也不适合作为流程图的展示形式。

4)DFG(直接跟随图)

DFG脱颖而出,它也是目前所有流程挖掘公司都在使用的流程图,虽然很多人诟病DFG的准确性,比如将多个流程路径混为一谈等等,但是DFG简洁而又清晰地描述了流程的走向,无疑是最便于业务人员使用的。

可以说流程图是流程挖掘的“魂”,也是流程挖掘最大价值之一,优秀的流程图算法可以根据EventLog“清晰”地还原企业的真实业务流,让企业流程的执行路径一目了然。这里的我把“清晰”画了重点,“清晰”其【资 ;源 之.家.】实很难用学界量化指标来描述,更多地是人为主观感觉,简而言之就是业务人员能不能从流程图里一眼就能看清楚企业流程“从头到尾”的走向,流程中的层次等等。