李多芹,方賢文
(安徽理工大學(xué)數(shù)學(xué)與大數(shù)據(jù)學(xué)院,安徽淮南 232001)
為了快速應(yīng)對不斷變化的商業(yè)環(huán)境,現(xiàn)代企業(yè)對業(yè)務(wù)流程建模提出了更高的要求;然而流程模型的建立是一項(xiàng)非常耗時耗力的工作,于是流程建模推薦技術(shù)得到越來越多的研究。利用現(xiàn)有流程庫潛在價值驅(qū)動的數(shù)據(jù)挖掘和流程推薦技術(shù)構(gòu)建流程,可以在領(lǐng)域知識不足或缺失時,通過縮短思考時間,加快業(yè)務(wù)流程設(shè)計(jì)工作;可以指導(dǎo)選擇最可能的任務(wù),盡量減少業(yè)務(wù)流程設(shè)計(jì)工作中可能出現(xiàn)的錯誤,通過提供有用的建議來完善主要意圖和模糊的想法;能減少新流程和現(xiàn)有流程之間的不兼容問題。文獻(xiàn)[1]研究表明,盡管推薦技術(shù)已經(jīng)在學(xué)術(shù)研究和工業(yè)領(lǐng)域中得到了廣泛的應(yīng)用,但在業(yè)務(wù)流程管理領(lǐng)域中,推薦技術(shù)還是一個相對較新的課題。
現(xiàn)有的基于數(shù)據(jù)庫的流程建模推薦主要分為兩類。第一類是基于圖結(jié)構(gòu)的推薦,其中:文獻(xiàn)[2]中對現(xiàn)有的度量流程相似性方法做了改進(jìn),并將其用于在流程庫中查詢結(jié)構(gòu)相似的流程;文獻(xiàn)[3]中利用最大公共子圖和最小公共超圖概念,以參考流程和流程模式間距離的計(jì)算結(jié)果作為流程推薦的依據(jù);文獻(xiàn)[4]中提出了一種數(shù)據(jù)模型用以支撐流程建模推薦系統(tǒng)的開發(fā),并通過真實(shí)世界中的系統(tǒng)逆向工程進(jìn)行驗(yàn)證。然而現(xiàn)有基于圖結(jié)構(gòu)的流程推薦方法多數(shù)情況下無法保證準(zhǔn)確性,于是產(chǎn)生了第二類基于行為的推薦方法。目前為止,關(guān)注流程行為的建模推薦方法并不多,其中:文獻(xiàn)[5]中提出了一種基于流的方法,用于捕獲業(yè)務(wù)流程建模中指定的流程,并通過對IBM Blueworks 案例的重新建模,驗(yàn)證了所提的方法;文獻(xiàn)[6]中利用流程結(jié)構(gòu)樹和獨(dú)立路徑概念在流程庫中進(jìn)行相似度計(jì)算,選取高相似度路徑中的節(jié)點(diǎn)作為推薦節(jié)點(diǎn)。然而,在實(shí)際的工作流程中實(shí)現(xiàn)同一業(yè)務(wù)目標(biāo)可能有各種圖結(jié)構(gòu)及多種不同的路徑,因此基于圖結(jié)構(gòu)或路徑的推薦可能導(dǎo)致很多有用推薦信息的丟失。文獻(xiàn)[7]研究表明,目標(biāo)是利益相關(guān)者和系統(tǒng)期望達(dá)成的狀態(tài),回答“為什么”問題,這一問題是流程模型不能處理的,因?yàn)榱鞒躺瞄L回答“何時”的問題,因此兩種視圖是互補(bǔ)的。這一事實(shí)表明,在建模過程中考慮流程的目標(biāo)能夠?yàn)榻U咛峁?qiáng)有力的指引,但是目前為止關(guān)聯(lián)流程目標(biāo)的建模推薦方法并不多見。
本文提出了一種基于行為輪廓定義業(yè)務(wù)目標(biāo)實(shí)現(xiàn)規(guī)則的流程建模推薦方法,旨在為建模者提供更多有用的推薦信息。首先,建模者根據(jù)業(yè)務(wù)陳述將業(yè)務(wù)拆分成更為具體的k個子業(yè)務(wù),同時明確子業(yè)務(wù)間基于行為輪廓表達(dá)的能夠?qū)崿F(xiàn)業(yè)務(wù)目標(biāo)的交互規(guī)則,即制定當(dāng)前建模模型的k階目標(biāo)輪廓。隨后,提取流程庫中流程模型的行為輪廓,并將滿足目標(biāo)輪廓的流程作為候選流程。接著,利用基于行為輪廓的度量方法計(jì)算當(dāng)前建模模型與候選流程庫中模型的相似度,選取相似度最高的m(由建模者自定義的參數(shù))個流程,并將這些流程中與當(dāng)前建模下一節(jié)點(diǎn)匹配的節(jié)點(diǎn)作為推薦節(jié)點(diǎn)。最后,在真實(shí)的數(shù)據(jù)集上驗(yàn)證所提方法的有效性。
定義1標(biāo)簽Petri 網(wǎng)[8]。帶標(biāo)簽的Petri 網(wǎng)是一個三元組(N,L,fL),其 中:N=(S,T;F) 是一個Petri 網(wǎng);L=(l1,l2,…,l|L|)為標(biāo)簽集合fL:T→L是將T中變遷映射到L中標(biāo)簽的標(biāo)簽函數(shù),即?ti∈T,?li∈L使得fL(ti)=li。
圖1 為使用標(biāo)簽Petri 網(wǎng)表示的兩種簡化業(yè)務(wù)流程。
圖1 兩種運(yùn)輸組織的業(yè)務(wù)流程Fig.1 Business processes of two transportation organizations
定義2映射函數(shù)[9]。給定兩個標(biāo)簽Petri 網(wǎng)NL=(N,L,fL)和=,Petri 網(wǎng)間的映射函數(shù)表示為:={ei→ej|ei∈NL,ej∈}。
定義3行為輪廓[10]。令標(biāo)簽Petri 網(wǎng)P=(N,L,fL),其中N=(S,T,F(xiàn)) 且T′ ?T是一個 變遷集,一對變 遷(x,y) ∈(T′×T′)可能呈現(xiàn)的行為關(guān)系如下:
1)嚴(yán)格序關(guān)系x→y,當(dāng)且僅當(dāng)x?y,yx;
2)嚴(yán)格逆序x→-1y,當(dāng)且僅當(dāng)y?x,xy;
3)排他序關(guān)系x+y,當(dāng)且僅當(dāng)xy,yx;
4)交叉序關(guān)系x||y,當(dāng)且僅當(dāng)x?y,y?x。
以上幾種關(guān)系構(gòu)成了網(wǎng)N的行為輪廓,記作BP={ →,→-1,+,||}。
為了聯(lián)合表示標(biāo)簽Petri 網(wǎng)中所有可能變遷對的上述行為關(guān)系,引入行為輪廓矩陣的概念,旨在以矩陣的形式表達(dá)標(biāo)簽Petri 網(wǎng)的上述行為關(guān)系。方便起見,→-1,→,+和‖,分別被簡記為0,1,2 和3。以圖1 中的Process1 為例,由于活動F 既可以發(fā)生在活動G 之前也可以發(fā)生在活動G 之后,即滿足定義3 中的4),于是表1 中的第6 行第7 列及第7 行第6 列元素均為3。類似的,對所有變遷對進(jìn)行上述分析,就可以得到圖1 中兩個流程模型的行為輪廓矩陣如表1 和表2所示。
表1 Process1的行為輪廓矩陣Tab.1 Process1’s behavioral profile matrix
表2 Process2的行為輪廓矩陣Tab.2 Process2’s behavioral profile matrix
為了計(jì)算候選流程庫中的模型與當(dāng)前建模模型的相似度,引入文獻(xiàn)[11]中提出的一種基于行為輪廓量化流程間相似性的度量方法。該方法建立在系數(shù)和流程模型活動對間的行為關(guān)系上,且已經(jīng)證實(shí)了其能夠成功地近似建模專家的評估。具體定義如下:
定義4行為輪廓度量[11]。給定兩個標(biāo)簽Petri 網(wǎng)P和Q,→P和→Q分別代表行為輪廓BPP和BPQ的嚴(yán)格序關(guān)系,于是P和Q 的嚴(yán)格序相似性為:
同理定義排他序和交叉序相似性如下:
于是網(wǎng)P和網(wǎng)Q的行為輪廓相似性為:
以圖1 中的兩個標(biāo)簽Petri 網(wǎng)及表2 中對應(yīng)的行為輪廓為例,計(jì)算得到:
若為每種相似性定義相同的權(quán)重,則可以得到Process1和Process2 的行為輪廓相似性為:
針對企業(yè)內(nèi)部的某一項(xiàng)業(yè)務(wù),尤其是新增業(yè)務(wù),其目標(biāo)指的是期望達(dá)成的狀態(tài)。文獻(xiàn)[7]中闡述了結(jié)合目標(biāo)與過程帶來的許多已知好處,并表明在建模過程中考慮流程的目標(biāo)能夠?yàn)榻U咛峁?qiáng)有力的指引。于是,本章介紹了現(xiàn)存的業(yè)務(wù)目標(biāo)表示方法,并針對這些方法的不足之處提出了一種業(yè)務(wù)目標(biāo)表示的新視角。
關(guān)于業(yè)務(wù)目標(biāo)的表示,很多學(xué)者已經(jīng)做了相關(guān)的研究。文獻(xiàn)[7]中把目標(biāo)表示為有向圖模型,通過有向的圖結(jié)構(gòu)展示子目標(biāo)之間的相互作用。其中,AND-refinement links 表示當(dāng)且僅當(dāng)所有子目標(biāo)都被滿足時,父目標(biāo)才被滿足;ORrefinement links 則只要求滿足可選子目標(biāo)的其中一個。子目標(biāo)之間的兩種聯(lián)系作用描繪了子目標(biāo)對其他子目標(biāo)的積極或消極影響程度。文獻(xiàn)[12]中指出,傳統(tǒng)的方法過分關(guān)注于過程和數(shù)據(jù),不能發(fā)掘過程和數(shù)據(jù)背后更深層次的原因,于是提出了一種相對復(fù)雜的目標(biāo)建模理念,即從使命/任務(wù)陳述中識別執(zhí)行者間的依賴并明確期望、愿景和能力等與活動間的關(guān)系,在這個基礎(chǔ)上目標(biāo)建模的過程就是通過不斷地詢問“為什么”“怎樣做”“如果不這樣做,應(yīng)該如何做”等問題不斷地揭示利益相關(guān)者的訴求。文獻(xiàn)[13]將業(yè)務(wù)流程的目標(biāo)定義為合取范式中布爾條件的結(jié)合,即goal=g1∧g2∧…∧gn,并通過領(lǐng)域約束對子目標(biāo)排序。
上述各種目標(biāo)表示方式各有優(yōu)勢且有相通之處,但對業(yè)務(wù)流程模型的建立而言,這些表達(dá)方式無法在建模過程中為建模者提供明確的指引信息?;诖?,下面將提出一種基于行為輪廓定義規(guī)則的業(yè)務(wù)目標(biāo)表示方法。
企業(yè)的每一項(xiàng)內(nèi)部業(yè)務(wù)都可以拆分成更為具體的子業(yè)務(wù)。用k表示拆分出的子業(yè)務(wù)個數(shù)時,k的大小代表著子業(yè)務(wù)的抽象程度:當(dāng)k為1 時,即整項(xiàng)業(yè)務(wù),抽象程度最高;隨著k的增加,子業(yè)務(wù)的抽象程度逐步降低;當(dāng)k取到可能的最大值時,子業(yè)務(wù)的抽象程度降到最低,此時k值與業(yè)務(wù)中各項(xiàng)具體活動總數(shù)相等。關(guān)于業(yè)務(wù)的拆分,已有學(xué)者做了深入的研究,文獻(xiàn)[12]中以海上搜救活動為例,從使命/任務(wù)陳述中識別子活動。在真實(shí)的業(yè)務(wù)場景中,k值的選取同樣也有很清晰的模塊劃分。以“Package Sorting”業(yè)務(wù)為例,通過業(yè)務(wù)陳 述,建模者 可以該 業(yè)務(wù)分解為a:“Receiving”,b:“Checking”,c:“Sorting”,d:“Dispatching”及e:“Information Updating”這5 個子業(yè)務(wù)。
另一方面,拆分出的子業(yè)務(wù)間都有明確的交互規(guī)則,且這些規(guī)則的滿足情況直接決定著業(yè)務(wù)目標(biāo)能否達(dá)成。在行為輪廓背景下,這些交互規(guī)則同樣可以用行為關(guān)系的形式來表達(dá)。與行為輪廓矩陣的提出類似,為了聯(lián)合表示所有子業(yè)務(wù)對的行為關(guān)系,本文引入目標(biāo)輪廓矩陣的概念。用目標(biāo)輪廓矩陣來形式化子業(yè)務(wù)的交互規(guī)則,除了規(guī)則表達(dá)的規(guī)范性外,更重要的是,對于某一業(yè)務(wù)流程來說,目標(biāo)輪廓矩陣可以看作是行為輪廓矩陣以目標(biāo)為導(dǎo)向的抽象。
于是,在建立模型之前,建模者可以通過對業(yè)務(wù)陳述的分析,將業(yè)務(wù)拆分成更為具體的k個子業(yè)務(wù),明確子業(yè)務(wù)間的交互規(guī)則,用行為輪廓刻畫子業(yè)務(wù)對間的交互規(guī)則后,再通過目標(biāo)輪廓矩陣聯(lián)合表示子業(yè)務(wù)對間的行為關(guān)系。注意,每一個子業(yè)務(wù)對應(yīng)業(yè)務(wù)流程模型中的一個活動。同樣以“Package Sorting”業(yè)務(wù)為例,從業(yè)務(wù)陳述中可以知道:a 總是最先發(fā)生,b 發(fā)生在c 之前,d 與b 和c 之間沒有固定的發(fā)生順序,e 總是最后發(fā)生。利用行為輪廓形式化這些交互規(guī)則之后可以得到如表3 所示的業(yè)務(wù)目標(biāo)輪廓,其中0:嚴(yán)格逆序→-1;1:嚴(yán)格序→;2:排他序+;3:交叉序||。
表3 “Package Sorting”業(yè)務(wù)目標(biāo)輪廓Tab.3 Business target profile of“Package Sorting”
此時,當(dāng)流程庫中某流程滿足表3 中的目標(biāo)輪廓時,即流程的行為輪廓矩陣包含目標(biāo)輪廓矩陣時,就表示執(zhí)行該流程能夠?qū)崿F(xiàn)業(yè)務(wù)目標(biāo),這樣的目標(biāo)表示方式將業(yè)務(wù)目標(biāo)與業(yè)務(wù)流程緊密鏈接,體現(xiàn)業(yè)務(wù)目標(biāo)與業(yè)務(wù)流程間深層次的內(nèi)在聯(lián)系。于是,當(dāng)建模者期望從流程庫中獲取流程知識以輔助建模時,可先制定業(yè)務(wù)目標(biāo)輪廓,然后在流程庫里搜索滿足該輪廓的流程作為候選推薦流程。這種候選推薦流程的捕獲方式能夠打破路徑和圖結(jié)構(gòu)的限制,即那些滿足目標(biāo)輪廓但路徑或圖結(jié)構(gòu)相似度低的流程,同樣有機(jī)會能夠作為候選推薦流程展示給建模者。這些流程對建模者來說也十分重要,因?yàn)樗鼈兡軌蛑敢U咦罱K建立一個能夠?qū)崿F(xiàn)業(yè)務(wù)目標(biāo)的業(yè)務(wù)流程模型。
本文所提方法的整體框架如圖2 所示,共分為預(yù)處理、行為輪廓比對及流程節(jié)點(diǎn)推薦3 個部分。
圖2 本文方法的框架Fig.2 Framework of the proposed method
預(yù)處理部分包括以下兩個方面:
1)目標(biāo)輪廓的制定。建模者根據(jù)業(yè)務(wù)陳述制定用于實(shí)現(xiàn)業(yè)務(wù)目標(biāo)的子業(yè)務(wù)間基于行為輪廓表達(dá)的交互規(guī)則,即制定目標(biāo)輪廓矩陣。
2)流程庫的預(yù)處理。先用標(biāo)簽Petri 網(wǎng)表示流程庫中的所有流程,于是有P={p1,p2,…,pn},其中n為流程庫中流程的數(shù)量;然后,提取流程庫中所有流程的行為輪廓,并獲取流程庫的行為輪廓矩陣集={A1,A2,…,An}。所有的輪廓均以矩陣的形式存儲在后端,于是每個流程模型只需提取一次行為輪廓。
行為輪廓比對指的是當(dāng)前建模模型的目標(biāo)輪廓與從流程庫中提取的行為輪廓之間的比較,旨在從流程庫中找到與當(dāng)前建模模型目標(biāo)一致的流程模型,即獲取候選流程集CPS。節(jié)點(diǎn)推薦部分則是從候選流程集中選出與當(dāng)前建模模型相似度最高的流程,并把對應(yīng)的下一節(jié)點(diǎn)作為推薦節(jié)點(diǎn)。算法1 給出了以和m為輸入生成推薦節(jié)點(diǎn)集Rnodes的具體步驟,其中p0為當(dāng)前建模模型,m是建模者自定義的參數(shù)。
算法1 基于行為輪廓定義目標(biāo)規(guī)則的流程建模推薦算法。
算法1 主要分為4 個部分:
1)首先,第1)行初始化一個候選流程集CPS和一個推薦節(jié)點(diǎn)集Rnodes。
2)通過2)~5)行獲取候選流程集。具體地:首先獲取目標(biāo)輪廓矩陣所關(guān)聯(lián)的事件集E(2)行);然后,對流程庫中的每個流程,如果對應(yīng)的行為輪廓矩陣存在k階子矩陣使得子矩陣關(guān)聯(lián)的事件集與E相等,且子矩陣Di與目標(biāo)輪廓Atark相等,則將對應(yīng)的業(yè)務(wù)流程pi放入取候選流程集CPS中(3)~5)行)。
3)再通過6)~12)行獲取推薦節(jié)點(diǎn)。具體地:對候選流程集中的每一個流程,利用定義4 中給出的行為輪廓度量方法計(jì)算其與當(dāng)前建模模型的相似度(7)行)。然后,篩選出候選流程集CPS中與當(dāng)前建模模型相似度最高的m個流程(8)行),并根據(jù)定義2 中的映射函數(shù)建立這些模型與當(dāng)前建模模型之間的節(jié)點(diǎn)映射(9)~10)行)。最后,將這些流程中與當(dāng)前建模節(jié)點(diǎn)對應(yīng)的節(jié)點(diǎn)的下一節(jié)點(diǎn)作為推薦節(jié)點(diǎn),并放入推薦節(jié)點(diǎn)集Rnodes中(11)~12)行)。
4)最后,13)行返回長度m的推薦節(jié)點(diǎn)集Rnodes。
本文實(shí)驗(yàn)在真實(shí)數(shù)據(jù)集上進(jìn)行,從推薦能力和推薦準(zhǔn)確率兩方面將文本方法與現(xiàn)存方法進(jìn)行對比評估。首先,由于本文所提的基于行為輪廓定義目標(biāo)規(guī)則的流程建模推薦方法,旨在為建模者從流程庫中提取更多有用的信息,于是將在推薦能力上與現(xiàn)有的獨(dú)立路徑匹配方法[6]進(jìn)行比較。其次,在證明了所提方法確實(shí)能夠?yàn)榻U咛峁└嘤杏眯畔⒑?,進(jìn)一步與獨(dú)立路徑匹配算法比較在推薦準(zhǔn)確率方面的表現(xiàn)。此外,實(shí)驗(yàn)中用到的真實(shí)數(shù)據(jù)集可在線訪問:https://github.com/duoqinLi/real-business-process-data。
4.1.1 流程庫數(shù)據(jù)集
為了驗(yàn)證本文所提方法的有效性及適用性,實(shí)驗(yàn)在真實(shí)數(shù)據(jù)集上進(jìn)行評估。該數(shù)據(jù)集是從中國浙江省杭州市某區(qū)政府收集的各種業(yè)務(wù)流程模型,最早在文獻(xiàn)[1]中使用。表4 中給出了該數(shù)據(jù)集的統(tǒng)計(jì)信息。
表4 數(shù)據(jù)集的統(tǒng)計(jì)信息Tab.4 Statistics of dataset
此外,文獻(xiàn)[1]已將這些原始的業(yè)務(wù)流程模型轉(zhuǎn)化為矩陣的形式,同時為每一個流程編號,并用數(shù)字1~52 表示數(shù)據(jù)集中的事件,本文將從該數(shù)據(jù)集中隨機(jī)抽取2 組每組20 個流程作為實(shí)驗(yàn)的流程庫。
4.1.2 當(dāng)前建模模型的構(gòu)造
為確保實(shí)驗(yàn)的可信度,將在剩余的數(shù)據(jù)集中隨機(jī)選取1條業(yè)務(wù)流程模型G531,并取前半部分的模型片段作為當(dāng)前建模模型。同時追溯到原始的業(yè)務(wù)流程模型,在某區(qū)政府工作人員的幫助下制定這些業(yè)務(wù)流程的目標(biāo)輪廓如表5 所示,其中0:嚴(yán)格逆序→-1;1:嚴(yán)格序→;2:排他序+;3:交叉序||。
表5 當(dāng)前建模模型的業(yè)務(wù)目標(biāo)輪廓Tab.5 Business target profile of current modeling model
表5中標(biāo)識符與實(shí)際活動的對應(yīng)關(guān)系如表6所示。
表6 標(biāo)識符與實(shí)際活動的對應(yīng)關(guān)系Tab.6 Corresponding relationship between identifiers and actual activities
本文所提的行為輪廓定義目標(biāo)規(guī)則的流程建模推薦方法,旨在為建模者從流程庫中提供更多有用的信息。為驗(yàn)證這一點(diǎn),將本文方法與文獻(xiàn)[6]中的獨(dú)立路徑匹配方法進(jìn)行比較,評估比較兩種推薦方法搜索流程知識的能力。
4.2.1 實(shí)驗(yàn)步驟
為了評估比較兩種推薦方法搜索流程知識的能力,設(shè)計(jì)如下實(shí)驗(yàn)步驟:首先,當(dāng)固定當(dāng)前建模路徑的節(jié)點(diǎn)數(shù)量時,對表5 中的目標(biāo)輪廓,從實(shí)驗(yàn)流程庫中搜索滿足該目標(biāo)輪廓的流程模型。對搜索出來的每一條流程模型,利用文獻(xiàn)[6]中所給出的基于最長公共子序列計(jì)算獨(dú)立路徑間相似度的方法,分別計(jì)算每條獨(dú)立路徑與當(dāng)前建模路徑的相似度。根據(jù)整體的相似性情況,將計(jì)算出來的相似度劃分為3 個等級:Sim≥0.7,極有可能作為推薦路徑;0.6≤Sim<0.7,有可能作為推薦路徑;Sim<0.6,不可能作為推薦路徑。圖3 給出了第1組實(shí)驗(yàn)流程庫中滿足目標(biāo)輪廓的流程模型,以及當(dāng)分別固定當(dāng)前建模路徑的節(jié)點(diǎn)數(shù)為4~8 時,每條流程模型上3 個相似度等級分別占獨(dú)立路徑總數(shù)的百分比。
注意,當(dāng)業(yè)務(wù)流程中含有循環(huán)結(jié)構(gòu)時,基于獨(dú)立路徑匹配的方法具有一定的局限性,因?yàn)樵谶@種情況下獨(dú)立路徑的數(shù)量是無限的。然而循環(huán)結(jié)構(gòu)在實(shí)際的業(yè)務(wù)流程中是常見的,于是在本實(shí)驗(yàn)中假設(shè),當(dāng)業(yè)務(wù)流程中存在循環(huán)結(jié)構(gòu)時,只考慮包含1 循環(huán)和2 循環(huán)的路徑。
4.2.2 結(jié)果分析
由圖3 可知,實(shí)驗(yàn)流程庫中有12 個流程模型滿足目標(biāo)輪廓。雖然大部分滿足目標(biāo)輪廓的流程模型中都含有與當(dāng)前建模路徑相似度很高的獨(dú)立路徑,但仍存在一些例外。例如,從圖3 中可以看出,當(dāng)前建模路徑的節(jié)點(diǎn)數(shù)7 時,G530、G609 和G623 的每條獨(dú)立路徑與當(dāng)前建模路徑的相似度都在60%以下,并且在獨(dú)立路徑匹配算法中,該流程模型的每條路徑都不會作為候選路徑,相應(yīng)的對應(yīng)節(jié)點(diǎn)也不會作為推薦節(jié)點(diǎn)。然而,該流程滿足目標(biāo)輪廓,即執(zhí)行該流程的某條或某幾條路徑能夠達(dá)成建模者所期望的目標(biāo),對建模者來說是非常具有參考價值的。相較于獨(dú)立路徑匹配方法,本文所提的基于行為輪廓定義目標(biāo)規(guī)則的流程建模推薦方法能從業(yè)務(wù)目標(biāo)達(dá)成的角度為建模者提供更多有用的推薦信息。
圖3 推薦能力實(shí)驗(yàn)結(jié)果Fig.3 Experimental results of recommendation ability
在本節(jié)中將進(jìn)一步評估兩種方法在推薦準(zhǔn)確率方面的表現(xiàn)。
4.3.1 實(shí)驗(yàn)步驟
為了評估比較兩種推薦方法的推薦準(zhǔn)確率,設(shè)計(jì)如下實(shí)驗(yàn)步驟:當(dāng)固定需要推薦的節(jié)點(diǎn)數(shù)量為5 時,對于獨(dú)立路徑匹配方法,先利用流程結(jié)構(gòu)樹和獨(dú)立路徑在流程庫中進(jìn)行相似度計(jì)算,再選取相似度最高的5 條路徑中的節(jié)點(diǎn)作為推薦節(jié)點(diǎn)集;對于本文所提方法,先通過目標(biāo)輪廓矩陣獲取候選流程庫,再利用定義4 中給出的行為輪廓度量方法計(jì)算候選流程庫中流程與當(dāng)前建模模型的相似度,最后,選取相似度最高的5 個流程的下一節(jié)點(diǎn)作為推薦節(jié)點(diǎn)集。
4.3.2 評估標(biāo)準(zhǔn)
分別獲取兩種推薦方法的推薦節(jié)點(diǎn)集后,下面給出評估準(zhǔn)確率所遵循的評估標(biāo)準(zhǔn)。首先,在4.1.2 節(jié)中已經(jīng)給出了當(dāng)前建模模型的構(gòu)造方法,于是其在原模型中的后續(xù)節(jié)點(diǎn)即可作為準(zhǔn)確率評估的參考節(jié)點(diǎn);其次,當(dāng)前建模模型的節(jié)點(diǎn)數(shù)量分別為4~8 時,依次計(jì)算每組實(shí)驗(yàn)流程庫上正確推薦節(jié)點(diǎn)數(shù);最后,兩種推薦方法的準(zhǔn)確率值為兩組實(shí)驗(yàn)流程庫上正確推薦節(jié)點(diǎn)數(shù)之和與10(因?yàn)槊拷M實(shí)驗(yàn)流程庫上獲取的推薦節(jié)點(diǎn)集中都有5 個節(jié)點(diǎn))的比值。
按照上述的實(shí)驗(yàn)步驟和評估標(biāo)準(zhǔn)可計(jì)算得到如圖4 所示的結(jié)果。
圖4 推薦準(zhǔn)確率實(shí)驗(yàn)結(jié)果Fig.4 Experimental results of recommendation accuracy
4.3.3 結(jié)果分析
整體上,兩種方法在準(zhǔn)確率方面的差異是可接受的,這表明本文所提的建模推薦方法在準(zhǔn)確度上是滿足實(shí)際應(yīng)用要求的。更具體地,可以看到,雖然本文所提方法的最低正確率略低于獨(dú)立路徑匹配算法,但平均準(zhǔn)確率為70%高于獨(dú)立路徑匹配算法的68%。這是因?yàn)椋阂环矫妾?dú)立路徑匹配算法只追求路徑的相似度,而忽略了在實(shí)際的業(yè)務(wù)流程執(zhí)行中可能存在相似度較低的兩條路徑都能達(dá)到相同目標(biāo)狀態(tài)的情況。另一方面流程中的循環(huán)結(jié)構(gòu)會在一定程度上影響?yīng)毩⒙窂介g的相似度,而本文所提的方法不會受此影響。此外,從圖4 中可以觀察到,隨著當(dāng)前建模路徑節(jié)點(diǎn)數(shù)的增加,相比獨(dú)立路徑匹配方法,本文所提目標(biāo)輪廓方法的推薦準(zhǔn)確率呈平穩(wěn)上升趨勢。
上述所有的實(shí)驗(yàn)結(jié)果表明,本文所提出的基于行為輪廓定義目標(biāo)規(guī)則的流程建模推薦方法能夠滿足實(shí)際應(yīng)用的需求,同時相較于現(xiàn)有的流程建模推薦方法,可以向建模者提供更多有價值的推薦信息。
本文基于行為輪廓和業(yè)務(wù)流程的目標(biāo)提出了一種新的業(yè)務(wù)流程建模推薦方法。首先,為業(yè)務(wù)目標(biāo)的實(shí)現(xiàn)制定目標(biāo)輪廓;然后通過其與流程庫中行為輪廓矩陣的比對獲取候選流程庫;最后,利用行為輪廓度量方法計(jì)算候選流程庫中流程與當(dāng)前建模模型的相似度,進(jìn)而為當(dāng)前建模模型推薦最可能的下一節(jié)點(diǎn)。實(shí)驗(yàn)結(jié)果表明所提方法在準(zhǔn)確率滿足實(shí)際應(yīng)用需求的同時能夠?yàn)榻U咛峁└嘤袃r值的信息。正如實(shí)驗(yàn)中所反映的,兩種方法在一定程度上是互補(bǔ)的,在未來的工作中將考慮把兩種方法有效地結(jié)合起來以達(dá)到更好的推薦效果。