倪維健,吉桂芳,曾慶田,劉 彤,段 華
(山東科技大學 計算機科學與工程學院,山東 青島 266510)
過程感知信息系統(tǒng)作為一種基于過程模型的軟件系統(tǒng),能夠有效地支持各類業(yè)務(wù)過程的管理和執(zhí)行,在各類企事業(yè)單位中得到了極大的普及。過程感知信息系統(tǒng)的廣泛應(yīng)用積累了大量的業(yè)務(wù)過程模型,特別是由于商業(yè)環(huán)境的復雜性和動態(tài)性,使得企事業(yè)單位往往需要管理數(shù)百甚至上千的業(yè)務(wù)過程模型,這為傳統(tǒng)的業(yè)務(wù)過程管理技術(shù)帶來了很大的挑戰(zhàn)。海量業(yè)務(wù)過程模型管理往往需要依賴一些過程模型分析技術(shù),如過程模型的合法性檢測、過程模型檢索、過程模型合并等。在很多過程模型分析任務(wù)中,過程模型匹配發(fā)揮著基礎(chǔ)性的作用,過程模型的準確性對于各類過程模型分析任務(wù)的實用效果具有重要影響。因此,過程模型匹配已成為業(yè)務(wù)過程管理領(lǐng)域中的一個研究熱點。
過程模型匹配的目標是自動識別多個過程模型之間具有匹配關(guān)系的活動對。近年來,研究者已提出多種過程模型匹配方法[1-2],其中大多數(shù)方法主要關(guān)注過程模型中活動的標簽信息,通過從語法和語義角度計算活動相似度來實現(xiàn)過程模型匹配;也有一些匹配方法除了考慮活動標簽信息之外,還考慮了一些過程模型相關(guān)的結(jié)構(gòu)特征信息,從一定程度上提高了匹配結(jié)果的正確性和完整性。
整體而言,現(xiàn)有的過程模型匹配方法多是依靠活動本身的局部信息,較少考慮活動的上下文信息和活動之間的關(guān)系信息,這使得匹配結(jié)果的準確性大多依賴于活動相關(guān)的描述信息。因此,當相似的活動用不同的方式描述時,這些方法的匹配效果較差。針對上述問題,本文提出一種基于表示學習的過程模型匹配方法。該方法將深度學習領(lǐng)域中的表示學習技術(shù)引入過程模型匹配任務(wù)中,將過程模型中的各個活動表示為多維實數(shù)向量,以更好地反映活動的上下文信息和關(guān)系信息;之后,將不同過程模型對應(yīng)的向量空間進行映射,根據(jù)活動向量之間的相似度實現(xiàn)過程模型的匹配。
根據(jù)過程模型匹配所利用的信息不同,現(xiàn)有過程模型匹配方法可以粗略地被分為基于活動標簽的方法和基于過程模型結(jié)構(gòu)的方法兩類。
(1)基于活動標簽的過程模型匹配方法主要基于活動的標簽描述計算活動之間的相似度,進而實現(xiàn)活動匹配。根據(jù)活動標簽相似度計算方式的不同,這類方法又可以被進一步分為語法相似度和語義相似度兩類。語法相似度主要基于字符串匹配實現(xiàn),如Levenshtein距離計算將給定兩個標簽l1和l2之間進行轉(zhuǎn)換所需編輯操作(即插入,刪除和替換)的數(shù)量;Jaro-Winkler距離與Levenshtein距離相似,但是能夠產(chǎn)生介于0和1之間的距離值。一些語法相似度依賴于活動標簽構(gòu)成的詞袋模型,比如Jaccard系數(shù)和Dice系數(shù)[1],它們均基于共享和非共享單詞數(shù)量來計算兩個活動標簽之間的相似度。當不同活動使用相似的單詞進行描述時,能取得較好的匹配結(jié)果,但是當使用不同的單詞描述時,語法相似度的效果會比較差。語義相似度在活動標簽語法的基礎(chǔ)上進一步考慮了單詞的含義,因此往往可以獲得更高的準確性。通常,語義相似度借助WordNet來識別同義詞,進而計算出活動標簽之間的相似度。代表性的語義相似度包括LIN[3]相似度、Wu&Palmer[1]相似度和Lesk[4]相似度。Lin[3]相似度在WordNet分類法基礎(chǔ)上根據(jù)單詞的信息內(nèi)容來計算單詞之間語義相關(guān)性,往往與詞袋模型結(jié)合在一起使用;Wu&Palmer[1]相似度通過考慮WordNet分類法中兩個單詞之間的路徑長度來計算兩個單詞之間的相似度;Lesk[4]相似度通過比較兩個單詞在WordNet中的定義來計算兩個詞之間的相似度。最近一項研究評估了Resnik、Lin、Jiang、Leacock和Wu&Palme五種語義相似度度量方法[5],發(fā)現(xiàn)在過程模型匹配競賽PMMC15提供的數(shù)據(jù)集上獲得的匹配效果并不理想。語義相似度度量方法雖然已被廣泛用于過程模型匹配,但是由于沒有考慮活動的上下文信息,仍存在匹配準確率較低的問題。
(2)基于過程模型結(jié)構(gòu)的方法在考慮標簽語法和語義的基礎(chǔ)上增加了過程的結(jié)構(gòu)特征[6]或控制流信息[7],這類方法能夠利用活動所在過程模型中的結(jié)構(gòu)特征,在一定程度上減少匹配方法對活動標簽信息的依賴。此外,研究者也提出了一些方法,從過程模型的附加信息出發(fā),考慮更加豐富的語義信息,從而改善匹配效果,如:Sanchez-Ferreres等利用活動基本信息和相關(guān)的模型特征信息來實現(xiàn)過程模型匹配[7-8],VAN DER AA[9]提取日志中的附加信息實現(xiàn)過程模型匹配??傮w而言,這類方法的匹配效果受活動描述信息的影響仍然較大,特別是使用不同的文本來描述不同活動時,現(xiàn)在模型匹配方法很難得到理想的結(jié)果。為了能綜合提升模型匹配效果,本文提出的方法不再局限于活動的描述信息,而是利用整個過程模型學習活動的向量表示,以實現(xiàn)過程模型匹配。本文方法受活動描述信息的影響較小,能更好地識別出具有相同業(yè)務(wù)影響力的活動之間的對應(yīng)關(guān)系。
為便于形象地展示過程模型匹配任務(wù),本文使用兩所大學的新生錄取流程來介紹過程模型匹配任務(wù)。如圖1所示為這兩所大學的新生錄取過程模型。可以看出,這兩所大學的錄取流程略有不同,如大學B將入學資格審查分兩步進行,而大學A則是將所有的資格審查都集中在一步完成;大學B對學生成績進行排名,并基于排名進行錄取,而大學A在準予學生入學之前不僅要進行學生的成績排名,還對學生進行面試排名。此外,大學A的第一項活動與大學B的第一項活動描述“獲取申請表格”完全相同,因此兩者是完全匹配的;而大學A的第二項活動“提交申請”和與大學B中的第二項活動“提交表格”有不同的標簽描述,但是它們表示相同的業(yè)務(wù)內(nèi)容,因此兩者也是匹配的。過程模型匹配任務(wù)的目標是不僅能夠識別出具有相同標簽描述的活動之間的匹配關(guān)系,還能夠識別具有相同業(yè)務(wù)內(nèi)容但標簽描述不同的活動之間的匹配關(guān)系。還需指出的是,過程模型匹配不僅需處理1:1匹配關(guān)系,還需處理1:n與m:n匹配關(guān)系。以圖1為例,大學A的一個活動“審核文檔”與大學B的兩個活動“審核申請材料完整性”和“審核本科學歷真實性”對應(yīng)。在過程模型匹配任務(wù)中,1:n與m:n匹配關(guān)系越多表明匹配任務(wù)越復雜。
基于表示學習的過程模型匹配方法總體框架如圖2所示,整體上可分為活動向量表示模型和向量空間映射模型兩個主要部分?;顒酉蛄勘硎灸P鸵越o定的兩個過程模型為輸入,為每個過程模型構(gòu)建向量表示空間,即得到各個活動的向量表示;向量空間映射模型建立兩個過程模型的向量表示空間之間的映射關(guān)系,使得具有匹配關(guān)系的活動向量在數(shù)值上更為接近,從而實現(xiàn)過程模型匹配。
由于業(yè)務(wù)過程模型以業(yè)務(wù)流程建模與標注(Business Process Modeling Notation,BPMN)、Petri網(wǎng)等多種形式存在,為了能夠利用表示學習技術(shù)得到活動向量表示,首先使用活動關(guān)系三元組的形式表示過程模型中蘊含的結(jié)構(gòu)信息,從而得到不同類型過程模型的規(guī)范化表示,之后設(shè)計了活動關(guān)系向量運算規(guī)則,最后在此基礎(chǔ)上設(shè)計了活動表示學習算法。
3.1.1 過程模型活動關(guān)系三元組抽取
考慮到過程模型中存在多種類型的節(jié)點(活動節(jié)點、網(wǎng)關(guān)節(jié)點等)和并發(fā)、互斥等復雜關(guān)系,直接對之進行規(guī)范化表示較為困難。為此,首先將過程模型轉(zhuǎn)化為過程結(jié)構(gòu)樹[10],將過程模型解析為具有單個入口節(jié)點和單個出口節(jié)點的片段層次結(jié)構(gòu),以便更為形式化地表達活動之間的各類關(guān)系。然而,語法結(jié)構(gòu)樹中可能在一個層次片段中存在兩個以上的活動節(jié)點。因此,利用語法結(jié)構(gòu)樹抽取的關(guān)系元組可能包含兩個以上的活動。為了更好地對活動關(guān)系進行規(guī)范化表示,本文進一步將過程結(jié)構(gòu)樹轉(zhuǎn)化為二叉樹,最后根據(jù)二叉樹得到過程模型對應(yīng)的活動關(guān)系三元組集合。
如圖3所示為一個具體的活動關(guān)系三元組抽取實例,其中,圖3a是一個以BPMN形式表示的過程模型,圖3b是該過程模型對應(yīng)的過程結(jié)構(gòu)樹,圖3c是進一步得到的過程結(jié)構(gòu)二叉樹。在圖3b表示的過程結(jié)構(gòu)樹中,葉子節(jié)點都是活動節(jié)點,父節(jié)點是關(guān)系節(jié)點,表示其子節(jié)點之間存在的關(guān)系。可以看出,過程結(jié)構(gòu)樹中一個父節(jié)點可能包含任意個子節(jié)點,而過程結(jié)構(gòu)二叉樹中每個父節(jié)點的子節(jié)點數(shù)量是固定的,其規(guī)范化程度更高,可以被完整地表示為活動關(guān)系三元組。圖3c所示的過程結(jié)構(gòu)二叉樹對應(yīng)的活動關(guān)系三元組集合為:T={T1,T2,T3,T4,T5,T6},其中:T1=(A,+,B);T2=(T1,→,C);T3=(E,→,G);T4=(D,×,F);T5=(T3,×,T4);T6=(T2,→,T5)。此處,→、+、×分別表示順序、并發(fā)、互斥關(guān)系,本文僅考慮這3種活動之間的關(guān)系。
3.1.2 活動關(guān)系向量運算規(guī)則
對于表示學習模型,本文不僅需要對活動和關(guān)系進行向量表示,還需要得到三元組的向量表示。為此,針對順序、并發(fā)、互斥3種類型的三元組,本文設(shè)計了相應(yīng)的向量運算規(guī)則得到其向量表示。
(1)順序關(guān)系三元組向量運算規(guī)則
對于順序關(guān)系三元組T=(S,→,O),即實體S和實體O之間存在順序關(guān)系,令eT、eS、eO分別表示T、S、O對應(yīng)的向量表示,向量運算關(guān)系如下:
eT=H1(S,→,O)=eo-es。
(1)
(2)并發(fā)關(guān)系三元組向量運算規(guī)則
對于并發(fā)關(guān)系三元組T=(S,+,O),即實體S和實體O之間存在并發(fā)關(guān)系,令eT、eS、eO分別表示T、S、O對應(yīng)的向量表示,向量運算關(guān)系如下:
eT=H2(S,+,O)=avg_pooling(es,eo)。
(2)
(3)互斥關(guān)系三元組向量運算規(guī)則
對于互斥關(guān)系三元組T=(S,×,O),即實體S和實體O之間存在互斥關(guān)系,令eT、eS、eO分別表示T、S、O對應(yīng)的向量表示,向量運算關(guān)系如下:
eT=H3(S,×,O)=max_pooling(es,eo)。
(3)
基于活動向量與三元組向量,本文進一步對活動關(guān)系三元組的存在概率進行量化表示。考慮到過程模型中的各種關(guān)系具有對稱和非對稱等多種特征,本文通過復數(shù)向量點乘的形式計算實體之間存在關(guān)系的概率。給定活動關(guān)系三元組T=(S,r,O),其存在概率
Pr(T)=Re(〈wr,eS,eO〉)
=〈w′r,e′S,e′O〉+〈w′r,e″S,e″O〉+〈w″r,
e′S,e″O〉-〈w″r,e″S,e′O〉。
(4)
(5)
3.1.3 活動表示學習算法
根據(jù)給定的真實活動關(guān)系三元組集合,本文生成用于活動表示學習的訓練數(shù)據(jù)集Ω={((S,r,O),ySrO)}。其中,若三元組(S,r,O)屬于真實的活動關(guān)系三元組集合,則ySrO=1;為了讓訓練過程具有區(qū)分能力,本文將真實的活動關(guān)系三元組中的活動S、O及關(guān)系r進行隨機替換,得到一定數(shù)量的三元組負樣本,其對應(yīng)的ySrO=-1。訓練過程使用式(6)所示的交叉熵損失函數(shù):
(6)
式中 Θ為模型參數(shù),具體包括每個活動及關(guān)系的向量表示;λ為調(diào)節(jié)經(jīng)驗誤差和正則項比重的參數(shù)。在具體訓練過程中,每次迭代中從訓練集中隨機抽取三元組并對選取的三元組進行負采樣作為本次迭代的訓練數(shù)據(jù),利用這批訓練數(shù)據(jù)批量計算式(6)的梯度,根據(jù)梯度更新各個活動的向量表示。
活動向量表示模型為每個過程模型中的活動學習向量表示,換言之是為每個過程模型分別構(gòu)建一個向量空間,過程模型中的活動對應(yīng)著向量空間中的點。由于不同過程模型對應(yīng)著不同的向量空間,無法直接將不同過程模型中的活動進行匹配。為此,本文進一步構(gòu)建了一個向量空間映射模型,將兩個過程模型的向量空間進行對齊。給定兩個過程模型的向量空間Λ1和Λ2,向量空間映射模型的損失函數(shù)如下:
Lmap=∑(a,b)∈Λ1×Λ2f(ea,eb)。
(7)
式中:f(ea,eb)是活動向量懲罰函數(shù),用以量化兩個活動之間的匹配程度,其取值越大表示匹配程度越低。本文從向量直接距離、向量平移和向量線性變換3個角度,定義了如下3個匹配函數(shù):
(1)基于向量直接距離的匹配函數(shù)
該方法假設(shè)兩個過程模型具有相同的向量空間,因而可以直接使用向量距離來反映活動匹配程度,具體計算方式如下:
冰再多,也不能繁衍生命,我們更希望能夠發(fā)現(xiàn)液態(tài)水。于是,科學家在鳳凰號著陸器的著陸腿上,觀察到了冷凝的水滴——露珠?;鹦窍募镜某嗟赖貐^(qū),在一些斜坡上,發(fā)現(xiàn)了一些奇怪的暗色條紋,可能是融化的液態(tài)水,但只是季節(jié)性出現(xiàn),這還不夠。要有生命,就要有穩(wěn)定的液態(tài)水體,但火星上一直沒有發(fā)現(xiàn)。
(8)
(2)基于向量平移的匹配函數(shù)
不同過程模型的向量空間通常是不同的,因而基于向量直接距離的匹配函數(shù)的假設(shè)過強。為此,將向量空間假設(shè)放松,即假設(shè)兩個過程模型的向量空間具有平移關(guān)系。基于向量平移的匹配函數(shù)計算方式如下:
(9)
式中:vΛ1Λ2是向量空間Λ1和Λ2之間平移向量,作為模型訓練的一個參數(shù)。式(9)表明向量空間Λ1中的活動向量ea經(jīng)平移后(平移方式由vΛ1Λ2決定)與向量空間Λ2中的活動向量eb之間的距離決定了兩者的匹配程度。
(3)基于向量線性變換的匹配函數(shù)
該方法進一步放松關(guān)于過程模型向量空間的假設(shè),認為兩者具有線性變換關(guān)系,具體計算方式如下:
(10)
式中:MΛ1Λ2是向量空間Λ1和Λ2之間線性變換矩陣,作為模型訓練的一個參數(shù)。式(10)表明向量空間Λ1中的活動向量ea經(jīng)線性變換后(線性變換方式由MΛ1Λ2決定)與向量空間Λ2中的活動向量eb之間的距離決定了兩者的匹配程度。
基于表示學習的過程模型匹配方法將活動向量表示模型和向量空間映射模型放在一起進行聯(lián)合訓練,總體損失函數(shù)如下:
L=Lvec+α·Lmap。
(11)
式中:Lvec和Lmap分別為式(6)和式(7)中的活動向量表示模型損失函數(shù)和向量空間映射模型損失函數(shù);α為控制兩者重要程度的超參數(shù)。由于本文設(shè)計了3個活動匹配函數(shù),本文提出的基于表示學習的過程模型匹配方法也具有3個變體。
在具體訓練過程中,本文并不直接優(yōu)化總體損失函數(shù),而是交替地優(yōu)化活動向量表示模型損失函數(shù)和向量空間映射模型損失函數(shù),即將每輪迭代分為兩個環(huán)節(jié),分別計算如下梯度:
(12)
(13)
根據(jù)上述梯度分別交替更新Θvec(包括各個過程模型中的活動向量)和Θmap(包括各個過程模型中的活動向量,以及過程模型之間的平移向量或線性變換向量)。模型訓練結(jié)束之后,可以得到所有過程模型的活動向量,根據(jù)向量可以計算活動之間的相似度。對于指定的活動,選取top-k個最相似的活動作為預(yù)測匹配結(jié)果。
本章將對所提出的過程模型匹配方法的實驗內(nèi)容進行詳細介紹。首先介紹實驗使用的數(shù)據(jù)集,之后給出本文方法與傳統(tǒng)方法的對比結(jié)果,最后對本文方法進行深入實驗分析。
本文實驗使用的數(shù)據(jù)集是過程模型匹配競賽PMMC15[注]https://ai.wu.ac.at/emisa2015/contest.php。提供的公開數(shù)據(jù)集,具體包括UA(University Admission processes)和BR(Birth Registration processes)兩個數(shù)據(jù)集。其中,UA由36個模型對組成,這些模型對來自9個模型,代表9所大學碩士研究生的申請過程,模型形式是BPMN;BR由36個模型對組成,這些模型對同樣來自9個模型,代表德國,俄羅斯,南非和荷蘭等9個嬰兒出生登記過程,模型形式是Petri網(wǎng)。表1給出了這兩個數(shù)據(jù)集的主要統(tǒng)計特征。
表1 數(shù)據(jù)集統(tǒng)計特征
4.2.1 對比方法
本實驗選擇代表性的利用活動標簽語法和語義,以及過程模型控制流結(jié)構(gòu)的過程模型匹配方法作為基準方法,各方法描述如下:
(1)ICoP[11]。利用活動標簽的語法信息,并采用啟發(fā)式搜索方法;
(2)RMM/NHCM[1]。利用活動標簽的語義信息,并對活動語義進行聚類;
(3)Triple-S[1]。綜合利用活動標簽的句法和語義信息,以及過程模型的結(jié)構(gòu)特征;
(4)BOT[7]。綜合利用活動標簽的語法和語義信息,并考慮過程模型的控制流結(jié)構(gòu)。
本文使用Pytorch1.1實現(xiàn)所提出的基于表示學習的過程模型匹配方法,并進行了基本調(diào)參,調(diào)參范圍為:
(1)活動和關(guān)系向量的維度:{5,10,20};
(2)映射模型損失的權(quán)重α:{1, 1.5,2, 2.5};
(3)學習率:{0.01,0.001}。
其他參數(shù)設(shè)置方式為:迭代次數(shù)為100輪,優(yōu)化算法為Adam。
4.2.2 評價指標
本實驗選擇經(jīng)典的評估指標精確率(Precision)、召回率(Recall)和F1評價本文方法和各基準方法,具體計算方式如下:
其中:P為通過過程模型匹配方法得到的匹配活動對集合,G為數(shù)據(jù)集中提供的真實匹配活動對集合。
4.2.3 對比實驗結(jié)果
本文方法與各基準方法在兩個數(shù)據(jù)集上的各項評估指標評測結(jié)果如表2所示。
根據(jù)表2可得出以下結(jié)論:
表2 對比實驗結(jié)果
(1)本文方法的各個變種在這兩個數(shù)據(jù)集上均優(yōu)于傳統(tǒng)的基于標簽語法、語義以及過程模型結(jié)構(gòu)信息的方法,從而證實了表示學習方法在過程模型匹配任務(wù)中具有一定的優(yōu)勢。這是因為表示學習方法能夠利用整個過程模型構(gòu)建有效的活動向量表示,可以同時考慮活動在過程模型中的上下文信息和活動之間的關(guān)系信息,并且該方法受活動標簽的影響較小,可以有效處理不規(guī)范的活動標簽形式,進而能夠取得更好的匹配效果。
(2)對比本文提出的基于向量直接距離、向量平移和向量線性變換3種向量空間映射方法。在規(guī)模較小的數(shù)據(jù)集UA上,由于事先給定的真實匹配活動對數(shù)量較少,難以很好地學習到平移向量或線性變換向量,因此相對而言,基于向量直接距離的方法可以取得最好的效果。在規(guī)模較大的數(shù)據(jù)集BR上,基于向量線性變換的方法取得了最好的效果,其主要原因是該方法對向量空間的假設(shè)最為寬松,而且在事先給定真實匹配活動對數(shù)量較多的情況下,有助于學習出參數(shù)更復雜的模型。另外需要注意的是,基于向量平移的方法這兩個數(shù)據(jù)集上效果較差,可能是因為該方法對向量空間平移性的假設(shè)并不符合真實情況。
本節(jié)對本文方法中的主要參數(shù)進行實驗分析,主要包括損失函數(shù)中的權(quán)重參數(shù)和訓練集比例參數(shù)。
4.3.1 損失函數(shù)權(quán)重參數(shù)對匹配結(jié)果的影響
如式(11)所示,本文方法使用的損失函數(shù)中包含了活動向量表示損失和向量空間映射損失兩部分,彼此之間通過α控制兩者的權(quán)重。本實驗中,在固定其他超參數(shù)的前提下,在{1,1.5, 2, 2.5}中令α分別取不同的值,觀察在UA和BR兩個數(shù)據(jù)集上F1值的變化,如圖4所示。
從圖4中可以發(fā)現(xiàn),不同的α值會對模型匹配結(jié)果的F1值有一定的影響。當α=1.5時,得到的匹配效果最好,這意味著此時很好地平衡了活動向量表示模型和向量空間映射模型對匹配結(jié)果的影響。當α更大或更小時,F(xiàn)1值均有所下降,說明當向量空間映射模型權(quán)重過大時,會忽略模型中活動之間的關(guān)系信息,從而不能很好地區(qū)分相鄰活動之間的關(guān)系;而當活動向量表示模型權(quán)重過大時,會忽略模型之間活動的匹配信息,這將直接降低模型匹配的效果??傮w而言,向量空間映射模型的權(quán)重略大,會取得最好的匹配效果。
4.3.2 訓練集比例對匹配結(jié)果的影響
本實驗針對兩個數(shù)據(jù)集分別選擇真實匹配活動對的50%、60%、70%、80%和90%作為訓練集,訓練不同的匹配模型,并評估其Precision、Recall和F1值,如圖5所示??梢园l(fā)現(xiàn),隨著訓練集的增加,本文方法的3個變體在各項評估指標上均有不同程度的提升,這是因為更大的訓練集蘊含了更多的活動匹配關(guān)系,從而使得向量空間映射模型能更好地實現(xiàn)過程模型之間不同活動的匹配,進而可以直接提升最終匹配效果。
本文提出了一種基于表示學習的過程模型匹配方法,該方法主要包括活動向量表示模型和向量空間映射模型兩個主要部分。前者用于構(gòu)建過程模型中各個活動的向量表示,后者用于實現(xiàn)不同過程模型的向量空間的映射,最終根據(jù)活動向量之間的數(shù)值關(guān)系實現(xiàn)活動之間的匹配。相比傳統(tǒng)的過程模型匹配方法,本文方法能夠更好地利用過程模型中活動的上下文信息和活動關(guān)系信息,從而提升了過程模型匹配的準確性。在PMMC15提供的UA和BR兩個公開數(shù)據(jù)集上的實驗結(jié)果表明,本文方法相比于傳統(tǒng)的基于標簽語法、語義以及過程模型結(jié)構(gòu)信息的方法具有明顯的優(yōu)勢。
本文工作初步證實了深度學習領(lǐng)域中的表示學習技術(shù)在過程模型匹配任務(wù)中具有很強的應(yīng)用潛力,這一方向在未來還有許多值得進一步探索的地方,如在已知真實的活動匹配信息較少情況下,如何利用少量的訓練數(shù)據(jù)獲得更好的匹配效果;如何在表示學習框架下考慮除順序、并發(fā)、互斥以外的其他復雜關(guān)系。