正態(tài)云模型相似度計算方法
李海林,郭崇慧,邱望仁
摘要:目的:在數(shù)據(jù)挖掘領(lǐng)域中,云模型不僅運(yùn)用于挖掘過程的不確定性表示,而且為挖掘結(jié)果的表示提供了符合人類思維習(xí)慣的定性分析方法。通常情況下,數(shù)據(jù)挖掘任務(wù)中的定量數(shù)據(jù)可以通過云模型來實現(xiàn)定性概念轉(zhuǎn)換,同時建立在定性概念基礎(chǔ)之上的數(shù)據(jù)挖掘任務(wù)需要進(jìn)行相似性計算。根據(jù)正態(tài)云模型的云滴分布特征,提出了兩種云模型相似度計算方法。方法:正態(tài)云有明顯的幾何特征,通常可以借助回歸曲線和主曲線來研究其特性。這兩種曲線分別從垂直方向的期望和正交方向的期望來反映云的整體特征,但由于它們的解析式難于求出,只能通過線性逼近的方法近似求得。然而,期望曲線是從水平方向來研究云模型整體特征,通過正態(tài)云的定義可以推出期望曲線的解析式。用期望曲線方法可以很好地反映正態(tài)云的重要幾何特征,所有的云滴都圍繞正態(tài)云期望曲線這條“骨架”的附近隨機(jī)波動。由于具有解析式的正態(tài)云期望曲線能夠方便有效地描述正態(tài)云的總體特征,因此,可以借助正態(tài)云期望曲線來求解云模型的相似度。通過求解兩個云模型的期望曲線相交重疊部分的面積來表示兩個云模型的相似程度,反映了兩個云模型的相似程度,稱為基于期望曲線的云模型相似度(expectation based cloud model,ECM)。另外,幾乎所有的云滴都在這條最大邊界曲線之下,這是由正態(tài)分布的3d規(guī)則所決定的,最大邊界曲線是一種從最大云滴值這個局部性視角來研究云模型幾何特性的方法。利用正態(tài)云定義以及正向正態(tài)云模型的規(guī)則,可得到正態(tài)云模型的最大邊界曲線解析式,并使用兩個正態(tài)云模型的最大邊界曲線重疊面積來度量它們的相似度,稱為基于最大邊界曲線的正態(tài)云相似度計算方法(maximum boundary based cloud model,MCM)。結(jié)果:基于ECM的協(xié)同過濾推薦質(zhì)量總體上要略優(yōu)于傳統(tǒng)云模型相似性度量方法。雖然MCM的平均絕對偏差最大,但差值在0.01之內(nèi),趨勢與前兩者保持一致,協(xié)同過濾推薦實驗結(jié)果驗證了ECM和MCM的可行性和有效性。與此同時,在分類準(zhǔn)確性方面,ECM和MCM隨著降維數(shù)的變化能夠保持穩(wěn)定的分類精度,說明這兩種算法具有很好的伸縮性和魯棒性。但從時間復(fù)雜度的角度出發(fā),除SCM之外,其余3種云模型相似性度量算法所消耗的單位時間相差不大,它們時間復(fù)雜度相同。ECM不僅在時間序列分類結(jié)果的精度上取得優(yōu)勢,而且在時間復(fù)雜度上也幾乎跟傳統(tǒng)方法LICM持平。因此,ECM是一種快速有效的云模型相似度計算方法,而MCM也是一種較為快速有效的云模型相似度計算方法。結(jié)論:鑒于不確性人工智能云模型在數(shù)據(jù)挖掘及機(jī)器學(xué)習(xí)等領(lǐng)域的重要性,提出了ECM和MCM兩種新的正態(tài)云模型相似度計算方法。前者是一種基于正態(tài)云模型期望曲線的相似度計算方法,它是利用云模型的“骨架”并且結(jié)合查詢標(biāo)準(zhǔn)正態(tài)分布表來快速計算出正態(tài)云之間的相似度。后者是基于最大邊界曲線的正態(tài)正態(tài)云相似度計算方法,綜合利用了云的3個數(shù)字特征,從最大邊界這個局部視角來研究相似性的定量數(shù)值。同時,文章不僅從數(shù)學(xué)性質(zhì)的角度對兩種方法的正態(tài)云模型相似度算法進(jìn)行了分析和描述,而且還通過實驗驗證了這兩種方法進(jìn)行描述正態(tài)云模型相似程度的可行性和有效性,并將它運(yùn)用于協(xié)同過濾推薦和時間序列數(shù)據(jù)分類中,取得了良好的效果。
來源出版物:電子學(xué)報, 2011, 39(11): 2561-2567
入選年份:2016
一種精英反向?qū)W習(xí)的粒子群優(yōu)化算法
周新宇,吳志健,王暉,等
摘要:目的:粒子群優(yōu)化算法是近年來較為流行的一種群體智能優(yōu)化技術(shù),概念簡單且易于實現(xiàn),在多個科學(xué)與工程領(lǐng)域中得到了成功應(yīng)用。但該算法在求解復(fù)雜的優(yōu)化問題時,易陷入局部最優(yōu)且收斂速度較慢。從利用粒子的自身極值pbest和全局極值gbest的角度出發(fā),研究如何更好地平衡算法的全局勘探和局部開采能力,從而進(jìn)一步提高算法性能。方法:分析粒子的飛行軌跡,對于一個給定的粒子,在其飛行速度已知的條件下,該粒子的飛行軌跡由自身極值和全局極值共同決定。針對自身極值的特點(diǎn),結(jié)合反向?qū)W習(xí)機(jī)制,將自身極值視為群體的精英粒子,提出了精英反向?qū)W習(xí)策略,利用該策略生成精英粒子的反向解,構(gòu)造與當(dāng)前群體對應(yīng)的反向群體,再同時評估當(dāng)前群體和反向群體的質(zhì)量,從中選擇部分較優(yōu)的粒子進(jìn)入下一次迭代。針對全局極值的特點(diǎn),結(jié)合差分演化算法,提出了差分演化變異策略,利用差分演化算法的best/2/bin機(jī)制對全局極值進(jìn)行擾動。結(jié)果:從14個不同測試函數(shù)上的實驗結(jié)果可看出:(1)與其他兩種基于反向?qū)W習(xí)機(jī)制的粒子群優(yōu)化算法相比,本文算法在13個測試函數(shù)上的結(jié)果要好于或相當(dāng)于這兩種算法,僅在1個測試函數(shù)上的結(jié)果比其中一種算法略差,表明精英反向?qū)W習(xí)策略能夠搜索更多的有效區(qū)域,提高群體的多樣性,增強(qiáng)算法的全局勘探能力;(2)與不含變異策略和集成柯西變異策略的算法相比,本文算法在14個測試函數(shù)上的結(jié)果要好于或相當(dāng)于這兩種算法,在變異策略成功運(yùn)行的次數(shù)上有較大提高,表明差分演化變異策略能夠在一定程度上防止全局極值陷入局部最優(yōu),從而避免整個群體出現(xiàn)搜索停滯,增強(qiáng)算法的局部開采能力;(3)與近年來提出的5種知名粒子群優(yōu)化算法相比,本文算法在10個測試函數(shù)上要好于或相當(dāng)于這5種算法,表明結(jié)合精英反向?qū)W習(xí)策略和差分演化變異策略后,本文算法在整體性能上具有較強(qiáng)的競爭力;(4)與包含基本粒子群優(yōu)化算法在內(nèi)的九種粒子群優(yōu)化算法相比,本文算法在計算復(fù)雜度上并未增加,與基本粒子群優(yōu)化算法的計算復(fù)雜度保持相同。結(jié)論:粒子的飛行軌跡是粒子群優(yōu)化算法尋優(yōu)過程中的重要一環(huán),因此,首先分析了影響粒子飛行軌跡的因素。針對粒子的自身極值和全局極值的特點(diǎn),從利用兩者包含的搜索信息著手,分別提出了精英反向?qū)W習(xí)策略和差分演化變異策略,以平衡算法的全局勘探能力和局部開采能力。粒子群優(yōu)化算法作為一種代表性的群體智能優(yōu)化技術(shù),它與其他群體智能優(yōu)化技術(shù)的共性是以群體的方式進(jìn)行尋優(yōu),因此,精英反向?qū)W習(xí)策略可視為一種通用框架,用于提高其他算法的性能。
來源出版物:電子學(xué)報, 2013, 41(8): 1647-1652
入選年份:2016
智慧協(xié)同網(wǎng)絡(luò)體系基礎(chǔ)研究
張宏科,羅洪斌
摘要:目的:現(xiàn)有互聯(lián)網(wǎng)具有“三重綁定”的特征,即:服務(wù)的“資源和位置綁定”、網(wǎng)絡(luò)的“控制和數(shù)據(jù)綁定”及“身份與位置綁定”。這種網(wǎng)絡(luò)體系與機(jī)制是相對“靜態(tài)”和“僵化”的,在此基礎(chǔ)上的演進(jìn)與發(fā)展無法從根本上滿足信息網(wǎng)絡(luò)“高速”“高效”“海量”“泛在”等通信需求,難以解決網(wǎng)絡(luò)可擴(kuò)展性、移動性、安全性等問題,更難以實現(xiàn)網(wǎng)絡(luò)資源的高效利用、節(jié)能等。為了大幅度提高網(wǎng)絡(luò)資源利用率,降低網(wǎng)絡(luò)能耗等,顯著提升用戶體驗,提出了資源動態(tài)適配的智慧協(xié)同網(wǎng)絡(luò)“三層”“兩域”(“三層”即:智慧服務(wù)層、資源適配層和網(wǎng)絡(luò)組件層;“兩域”即:實體域和行為域)總體系架構(gòu)模型。方法:在深入研究傳統(tǒng)信息網(wǎng)絡(luò)分層體系結(jié)構(gòu)理論及國內(nèi)外新一代信息網(wǎng)絡(luò)體系架構(gòu)理論的基礎(chǔ)上,在“三層”“兩域”新體系結(jié)構(gòu)模型中,“智慧服務(wù)層”主要負(fù)責(zé)服務(wù)的標(biāo)識和描述以及服務(wù)的智慧查找與動態(tài)匹配等;“資源適配層”通過感知服務(wù)需求與網(wǎng)絡(luò)狀態(tài),動態(tài)地適配網(wǎng)絡(luò)資源并構(gòu)建網(wǎng)絡(luò)族群,以充分滿足服務(wù)需求進(jìn)而提升用戶體驗,并提高網(wǎng)絡(luò)資源利用率;“網(wǎng)絡(luò)組件層”主要負(fù)責(zé)數(shù)據(jù)的存儲與傳輸,以及網(wǎng)絡(luò)組件的行為感知與聚類等。該體系在有效解決網(wǎng)絡(luò)可擴(kuò)展性、移動性、安全性等問題的基礎(chǔ)上,大幅度提高網(wǎng)絡(luò)資源利用率,降低網(wǎng)絡(luò)能耗等,顯著提升用戶體驗。結(jié)果:在智慧協(xié)同網(wǎng)絡(luò)體系結(jié)構(gòu)中,“實體域”使用服務(wù)標(biāo)識SID(service ID)來標(biāo)記一次智慧服務(wù),實現(xiàn)服務(wù)的“資源和位置分離”;使用族群標(biāo)識FID(family ID)來標(biāo)記一個族群功能模塊,使用組件標(biāo)識NID(node ID)來標(biāo)記一個網(wǎng)絡(luò)組件設(shè)備,實現(xiàn)網(wǎng)絡(luò)的“控制和數(shù)據(jù)分離”及“身份與位置分離”;“行為域”使用服務(wù)行為描述SBD(service behavior description)、族群行為描述FBD(family behavior description)和組件行為描述NBD(node behavior description)來分別描述實體域中服務(wù)標(biāo)識、族群標(biāo)識和組件標(biāo)識的行為特征。通過映射分別完成服務(wù)需求到族群的選擇、族群內(nèi)網(wǎng)絡(luò)組件與服務(wù)需求的匹配以及網(wǎng)絡(luò)組件的行為聚類功能。在智慧服務(wù)層和資源適配層之間,使用行為匹配機(jī)制。在行為域中根據(jù)服務(wù)需求行為描述和族群功能行為描述形成一次映射,為智慧服務(wù)尋求最佳的族群功能模塊搭配組合,然后根據(jù)實體域的族群間協(xié)作機(jī)制,控制指定的族群功能模塊進(jìn)行協(xié)同工作,從而實現(xiàn)服務(wù)標(biāo)識到族群標(biāo)識的映射過程。在資源適配層和網(wǎng)絡(luò)組件層之間,使用行為聚類機(jī)制,在行為域中根據(jù)族群行為描述和組件行為描述形成另一次映射,為族群功能模塊判定最合理的網(wǎng)絡(luò)組件構(gòu)成,然后根據(jù)實體域的族群內(nèi)聯(lián)動機(jī)制,在族群功能模塊內(nèi)的網(wǎng)絡(luò)組件之間建立相互聯(lián)動關(guān)系,以完成族群功能模塊的整體功能,實現(xiàn)由族群標(biāo)識到組件標(biāo)識的映射過程。通過這兩次映射,網(wǎng)絡(luò)資源可以依據(jù)服務(wù)需求動態(tài)適配,從而實現(xiàn)智慧服務(wù)。結(jié)論:智慧協(xié)同網(wǎng)絡(luò)的“三層”“兩域”體系通過動態(tài)感知網(wǎng)絡(luò)狀態(tài)并智能匹配服務(wù)需求,進(jìn)而選擇合理的網(wǎng)絡(luò)族群及其內(nèi)部組件來提供智慧化的服務(wù),并通過引入行為匹配、行為聚類、網(wǎng)絡(luò)復(fù)雜行為博弈決策等機(jī)制來實現(xiàn)資源的動態(tài)適配和協(xié)同調(diào)度,大幅度提高網(wǎng)絡(luò)資源利用率,降低網(wǎng)絡(luò)能耗等,并顯著提升用戶體驗。
來源出版物:電子學(xué)報, 2013, 41(7): 1249-1254
入選年份:2016
SRLtoRadl生成系統(tǒng)及其范疇論語義
王昌晶,薛錦云,左正康
摘要:目的:形式化軟件規(guī)約技術(shù)便于軟件系統(tǒng)原型、分析、驗證與最終的實現(xiàn),是保證軟件質(zhì)量和提高軟件生產(chǎn)率非常有用和重要的手段。但是形式化規(guī)約的獲取是一項相當(dāng)困難的任務(wù),因此通過自動化轉(zhuǎn)換獲取形式化規(guī)約就顯得尤為必要,這已經(jīng)成為需求工程的重要問題之一。針對問題需求自動化轉(zhuǎn)換為形式化規(guī)約這個重要問題,研究從結(jié)構(gòu)化需求語言SRL到形式化規(guī)約語言Radl自動生成系統(tǒng)及其高可靠性理論。方法:首先設(shè)計了一種受控自然語言-結(jié)構(gòu)化需求語言SRL來描述問題需求;使用基于規(guī)則的方法,將結(jié)構(gòu)化需求語言SRL通過分析—轉(zhuǎn)換—綜合3階段生成為形式化軟件規(guī)約Radl;在該方法的指導(dǎo)下,設(shè)計并實現(xiàn)了從結(jié)構(gòu)化需求語言SRL到形式化軟件規(guī)約Radl的生成系統(tǒng)SRLtoRadl;進(jìn)一步,使用范疇論框架建立了SRLtoRadl生成系統(tǒng)生成過程的語義模型。結(jié)果:形式化軟件規(guī)約或算法規(guī)約生成方法主要可以分為兩類:基于領(lǐng)域知識的方法與基于轉(zhuǎn)換生成的方法?;谥R的方法使用領(lǐng)域知識作為分析需求的基礎(chǔ),重要工作如需求學(xué)徒,SPECIFIER,生成式編程,問題框架方法,MLIRF方法等。采用的生成方法面向非特定應(yīng)用領(lǐng)域,通過用戶自定義ADT類型,也可以方便的擴(kuò)充的其他特定應(yīng)用領(lǐng)域;該生成方法可以看做一個產(chǎn)生式系統(tǒng),易于實現(xiàn);進(jìn)一步,可以使用范疇論框架建立生成過程的語義模型?;谵D(zhuǎn)換生成的方法提供了自動(或人機(jī)交互)的CASE工具由半形式化的問題表示(如圖表、受限自然語言)或非形式化的問題表示(如自由的自然語言)來生成形式化規(guī)約。生成方法可以歸類為一種基于轉(zhuǎn)換生成的方法,不僅可以對語法進(jìn)行分析與轉(zhuǎn)換,通過對語法規(guī)則引入復(fù)雜特征集與合一運(yùn)算,還可以進(jìn)行深層次的語義分析與轉(zhuǎn)換;它不僅可以生成數(shù)據(jù)庫應(yīng)用軟件形式化規(guī)約,還可以生成復(fù)雜算法的形式化規(guī)約;進(jìn)一步,可以使用范疇論框架建立生成過程的語義模型。結(jié)論:研究成果可以從理論和實現(xiàn)兩個方面來總結(jié)。在理論方面的主要成果是使用范疇論框架建立了SRLtoRadl生成系統(tǒng)生成過程的語義模型。在實現(xiàn)方面的主要成果一是設(shè)計了一種受控自然語言-結(jié)構(gòu)化需求語言SRL來描述問題需求;二是設(shè)計并實現(xiàn)了從結(jié)構(gòu)化需求語言SRL到形式化軟件規(guī)約Radl的生成系統(tǒng)SRLtoRadl。進(jìn)一步的工作一是繼續(xù)完善SRLtoRadl生成系統(tǒng)并集成到整個PAR平臺,二是將該研究結(jié)果進(jìn)行擴(kuò)展,進(jìn)一步探索使用范疇論理論框架建立PAR平臺由形式化Radl規(guī)約生成可執(zhí)行程序的整個生成過程語義模型。
來源出版物:電子學(xué)報, 2014, 42(1): 137-143
入選年份:2016