馮秀珍,武高峰
(北京工業(yè)大學經(jīng)濟與管理學院,北京100124)
Web Service是一種新興的分布式計算模式,它可以在網(wǎng)絡上被描述、發(fā)布、查找和調(diào)用,由此而形成了一套應用程序在Web上實現(xiàn)互操作的標準。伴隨著Web Service應用的拓展,Internet上的Web Service資源不斷豐富,而具有相似功能的Web Service充斥其中,這些嚴重困擾了服務請求者對于服務的選擇。因此,如何從眾多相似Web Service中按需發(fā)現(xiàn)符合用戶需求的服務成為研究者面臨的重要問題。
Web Service的屬性可以分為功能屬性和非功能屬性。功能屬性描述Web Service提供的操作,非功能屬性描述Web Service的QoS(quality of service)特性。與現(xiàn)有的基于語法級的關(guān)鍵字查詢[1]功能相似的Web Service在 UDDI注冊中心可以查找到,而用戶要發(fā)現(xiàn)合乎需求的服務還必須在多個功能相似服務中以靜態(tài)或動態(tài)的方式[2-3]進行選擇。但是,用戶對服務需求存在認識上的模糊性,其選擇過程較為盲目。Web Service的QoS屬性能夠描述滿足用戶需求的服務,因此,它已經(jīng)成為用戶按需選擇服務的重要依據(jù)[4]。筆者以功能屬性匹配研究為基礎(chǔ),采用區(qū)間表示方式描述QoS的屬性信息,提出了一種基于QoS的按需服務發(fā)現(xiàn)過程,即以先聚類后排序的方式在一類功能屬性相似的服務集中將Web Service資源的QoS信息和用戶的QoS需求信息進行合并聚類,經(jīng)過相似度計算,對同一類中Web Service進行排序處理,通過分析對比剔除不滿足用戶需求的Web Service,以此實現(xiàn)“按需定制,量身定做”的服務發(fā)現(xiàn)。
Web Service資源的QoS信息和用戶的QoS需求信息是實現(xiàn)Web Service聚類的兩類重要信息源。前者主要通過從給定的Web Service信息中抽取WSDL(Web services description language)信息,再經(jīng)過一系列的提取、篩選和裝載過程[5]形成Web Service資源庫,最后通過語義本體的匹配[6],將功能相似的一類Web Service聚類成服務池而獲得;后者通過將用戶需求數(shù)字化而獲得。圖1為按需服務發(fā)現(xiàn)過程。
圖1 按需服務發(fā)現(xiàn)過程圖
網(wǎng)絡環(huán)境的動態(tài)性和不確定性,為基于QoS的服務發(fā)現(xiàn)帶來了困難,加之用戶服務需求的模糊性和多樣性,使服務供需雙方都難以用確切的數(shù)值描述QoS信息,因此采用區(qū)間值的表述方式更具可操作性。模糊C均值聚類(FCM)算法是一種專門處理模糊數(shù)據(jù),根據(jù)一定的隸屬度確定每個樣本點屬于某個聚類的聚類算法。FCM的目標是使被劃分在同一類中的對象之間的相似度最大,而不同類的對象之間的相似度最?。?]。FCM算法由DUNN提出[8],用以解決精確數(shù)值信息模式識別問題和模糊分類問題?;趨^(qū)間數(shù)的聚類分析研究[9-10]擴展了該方法的應用范疇。它可以把n個樣本向量分為m個模糊組,通過反復修改分類矩陣和聚類中心,得到各個樣本對于各類的隸屬度值和各類的聚類中心,從而實現(xiàn)模糊聚類的劃分。
筆者在服務池構(gòu)建的基礎(chǔ)上,采用FCM聚類算法研究面向服務的按需服務發(fā)現(xiàn)過程。該過程通過對給定服務的Web Service資源信息和用戶的服務需求信息進行基于QoS的FCM聚類,把具有相似QoS信息的Web服務聚合為一類,把其他聚合為另一類,并根據(jù)先聚類后排序的方式確定同一類服務中最優(yōu)的Web Service。若同類服務中的對象至少一個優(yōu)于需求,則認為該對象是最適合的。反之,無法找到適合的服務,則需要調(diào)用協(xié)商算法[11]優(yōu)化聚類目標,以期按需發(fā)現(xiàn)最適服務。基于FCM的聚類過程如圖2所示。
圖2 基于FCM的聚類過程圖
基于FCM區(qū)間數(shù)多屬性聚類算法可描述為:
已知指標集 Q={Q1,Q2,…,Qp},即 QoS 數(shù)據(jù)信息。樣本集 X={X1,X2,…,Xn/2,…,Xn},即Web 服務,其中{X1,X2,…,Xn/2}為服務信息資源的樣本集,{Xn/2,…,Xn}為用戶的需求樣本集。樣本Xi針對Qj的區(qū)間信息可表示為
步驟1 量化和標準化。QoS屬性有定量和定性之分。采用統(tǒng)計方法[12]對服務提供者發(fā)布的內(nèi)容進行標準化處理是定量屬性量化的主要方式;定性屬性的量化多采用模糊約束理論,利用專家調(diào)查法或主觀經(jīng)驗法在一定的值域內(nèi)將其數(shù)值化。同時,QoS又有效益和成本之分,前者值愈大,或者后者屬性值愈小,QoS綜合性能愈好。
當Qi為效益型指標時:
當Qi為成本型指標時:
步驟2 聚類標準集初始化。假定X={X1,X2,…,Xn}為待聚類對象集,對象集X的類別為c,模糊加權(quán)指數(shù)為m(m>0),計算迭代精度為ε(ε>0)。取初始化聚類標準原型,其中,設(shè)初始迭代次數(shù)b為0。
相離、包含和相交是區(qū)間關(guān)系的3種形式,筆者以區(qū)間吻合程度來描述區(qū)間關(guān)系的相似度。這里假定用戶的QoS需求信息為,Web Service資源的QoS信息為相對長度法計算的兩個區(qū)間屬性值的相似度為:
式中:L為相應區(qū)間的長度;a∩b為a和b的重疊區(qū)間。
同理,可定義如表1所示的相似度度量值。
表1 區(qū)間關(guān)系相似度度量值
在多屬性綜合評價中,需要先計算服務池中各屬性之和,再進行排序。
若sum=p,則表示服務請求者的需求能夠完全被滿足,此時存在最優(yōu)服務;若0<sum<p,則表示服務請求者的需求被部分滿足,需要調(diào)用協(xié)商程序?qū)ξ礉M足條件的屬性進行協(xié)商;若sum=0,則表示服務請求者的需求無法被滿足,進一步協(xié)商需要花費較大代價。
該算例的目的是通過先聚類后排序的方式驗證所提出的按需服務發(fā)現(xiàn)過程的可行性。算例采用演繹推理法確定某Web服務的QoS屬性。所選用的指標包括QoS屬性的定性、定量、成本型和效益型指標,數(shù)據(jù)描述以區(qū)間形式為主。聚類樣本有15個Web服務資源和1個Web服務需求(即 S01,S02,…,S15,R00),如表2 所示。聚類樣本指標有3個,其中成本(調(diào)用Web服務資源必須支付的費用)為成本型區(qū)間數(shù)指標,可用性(Web服務資源執(zhí)行的正確程度)和易用性(Web服務資源能夠被用戶理解和使用的容易程度)為效益型指標。易用性指標為定性指標,打分范圍為0.1(最差)到1.0(最好)之間。因篇幅所限,規(guī)范化后的聚類指標數(shù)據(jù)不再列出。假設(shè)c=3,m=2,ε=0.000 5,初始聚類標準如表3所示。
表2 聚類對象相關(guān)指標
表3 初始聚類標準V(0)
根據(jù)上述聚類步驟,經(jīng)3次迭代,由收斂精度ε3=J[U(2),V(2)]- J[U(3),V(3)]=0.000 231 <ε可知,最優(yōu)聚類標準V(3)如表4所示和最優(yōu)聚類的隸屬度值U(3)如表5所示。根據(jù)最大隸屬度原則,將服務分為好、中、差3類,分別為{S01,S05,S07,S08,S14}、{S06,S09,S11,S13,R00}和{S02,S03,S04,S10,S12,S15}。
表4 最優(yōu)聚類標準V(3)
R00在分類二中,對該類進行排序。根據(jù)式(9)和表1,有4 個 Web 服務資源(S06,S09,S11,S13)與Web服務需求R00的相似度分別為3.0、1.5、2.0 和 1.0。排序為 S06 >S11 >S09 >S13。S06與R00的相似度值等于指標個數(shù)p。因此,不需要進行進一步協(xié)商,即S06是最符合用戶需求的Web服務。
大量涌現(xiàn)的相似的Web服務對滿足用戶的按需服務發(fā)現(xiàn)提出了嚴峻的挑戰(zhàn)。傳統(tǒng)的Web服務發(fā)現(xiàn)是根據(jù)用戶的需求信息在UDDI中進行檢索,但是這種方式效率低下。筆者提出了一種基于QoS的按需服務發(fā)現(xiàn)過程,可以通過FCM聚類將用戶的QoS需求和Web服務資源的QoS信息進行聚合,在已有分類的基礎(chǔ)上,對同類中的聚類對象進行排序,利用排序結(jié)果做出是否協(xié)商的決定,以滿足用戶的按需服務。算例結(jié)果表明,該服務發(fā)現(xiàn)過程可行,且能夠快速有效地根據(jù)用戶QoS需求發(fā)現(xiàn)適合的服務。
[1]何玲娟,劉連臣,吳澄.一種改進的基于WSDL描述的操作相似性度量方法研究[J].計算機學報,2008,31(8):1331 -1339.
[2]PATHAK J,KOIL N,CARAGEA D,et al.A framework for semantic Web services discovery[C]//Proceedings of the7thACM InternationalWorkshop on Web Information and Data Management.[S.l.]:ACM Press,2005:45-50.
[3]BIANCHINIA D,ANTONELLISV D.Ontology based methodology for e - service discovery[J].Information System,2006(31):361 -380.
[4]戴常英,戴明坤,張會娟.擴展Augment UDDI系統(tǒng)以支持QoS的Web服務發(fā)現(xiàn)模型[J].計算機工程與設(shè)計,2009,30(2):358 -361.
[5]徐德智,鄭春卉,PASSIK.基于SUMO的概念相似度研究[J].計算機應用,2006,26(1):180 -183.
[6]劉譞哲,黃罡,梅宏.用戶驅(qū)動的服務聚合方法及其支撐框架[J].軟件學報,2007,18(8):1883 -1895.
[7]黃良輝,陳常青,趙婷.一種基于模糊聚類思想的評價結(jié)果組合模型[C]//2006年中國控制與決策學術(shù)年會論文集.[S.l.]:[s.n.],2006:1251 -1255.
[8]DUNN JC.A fuzzy relative of the ISODATA process and its use in detecting compactwell-separated clusters[J].JCybernet,1974(3):32 -57.
[9]孟廣武,張興芳,鄭亞林.基于區(qū)間值模糊集的聚類方法[J].工程數(shù)學學報,2001,18(2):69 -73.
[10]于春海,樊治平.一種基于區(qū)間數(shù)多指標信息的FCM聚類算法[J].系統(tǒng)工程學報,2004,19(4):387-393.
[11]FENG X,WU G.A study on interval negotiation algorithm for service-oriented QoS[C]//International Conference on Computational Intelligence and Software Engineering.[S.l.]:[s.n.],2010:1 -4.
[12]李江華,陳淑婷.Web服務QoS信息獲取與處理方法研究[J].江西理工大學學報,2008,29(6):24 -28.