• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于云變換的突發(fā)事件屬性概念樹的構(gòu)建

      2016-02-15 07:07:11張艷瓊鄧三鴻
      現(xiàn)代情報(bào) 2016年2期
      關(guān)鍵詞:正態(tài)定性梯形

      張艷瓊鄧三鴻

      (1.南京特殊教育師范學(xué)院信息科學(xué)學(xué)院,江蘇南京210038;2.南京大學(xué)信息管理學(xué)院,江蘇南京210023;3.江蘇省數(shù)據(jù)工程與知識(shí)服務(wù)重點(diǎn)實(shí)驗(yàn)室(南京大學(xué)),江蘇南京210023)

      基于云變換的突發(fā)事件屬性概念樹的構(gòu)建

      張艷瓊1,2,3鄧三鴻2,3

      (1.南京特殊教育師范學(xué)院信息科學(xué)學(xué)院,江蘇南京210038;2.南京大學(xué)信息管理學(xué)院,江蘇南京210023;3.江蘇省數(shù)據(jù)工程與知識(shí)服務(wù)重點(diǎn)實(shí)驗(yàn)室(南京大學(xué)),江蘇南京210023)

      針對(duì)突發(fā)事件屬性具有模糊性、隨機(jī)性等特點(diǎn),將云變換理論引入到突發(fā)事件屬性概念樹構(gòu)建研究中,在原有算法基礎(chǔ)上,引入梯形云模型,提出一種基于多類型云的概念提取方法,不僅較好地解決了突發(fā)事件屬性的模糊性、隨機(jī)性等不確定性問題,而且在提高擬合數(shù)據(jù)分布曲線精度的同時(shí)減少云模型的個(gè)數(shù)。以全球恐怖主義研究數(shù)據(jù)庫為例,正確有效地構(gòu)建nkill屬性概念樹,為高質(zhì)量地進(jìn)行數(shù)據(jù)挖掘提供科學(xué)而有效的數(shù)據(jù)預(yù)處理方法。

      突發(fā)事件;概念樹;云變換;梯形云

      突發(fā)事件是指突然發(fā)生,造成或者可能造成嚴(yán)重社會(huì)危害,需要采取應(yīng)急處置措施予以應(yīng)對(duì)的自然災(zāi)害、事故災(zāi)難、公共衛(wèi)生事件和社會(huì)安全事件[1]。隨著人口、環(huán)境和能源等方面問題的日益突出,全球范圍內(nèi)的突發(fā)事件頻繁發(fā)生,多年來,積累了海量的各類突發(fā)事件案例,以恐怖事件為例,僅全球恐怖主義研究數(shù)據(jù)庫(Global Terrorism Database,GTD)就收錄了125 000多項(xiàng)案例[2]。突發(fā)事件案例是重要的數(shù)據(jù)資源,如何對(duì)這些數(shù)據(jù)資源進(jìn)行分析和處理,發(fā)現(xiàn)其中潛在、未知的知識(shí)和規(guī)律,為突發(fā)事件管理決策服務(wù),是目前急需解決的問題。一方面,直接面對(duì)數(shù)據(jù)庫中原始概念層的海量細(xì)節(jié)信息,往往無法得到有意義的知識(shí),而對(duì)原始較低粒度的概念進(jìn)行提升,抽象出較高的概念層,可以發(fā)現(xiàn)更普遍、更有指導(dǎo)意義的知識(shí);另一方面,對(duì)于在論域上不同概念之間的關(guān)系,人們習(xí)慣劃分層次,從宏觀、中觀、微觀上理解概念之間的層次關(guān)系,形成概念的樹狀結(jié)構(gòu),所謂的宏觀、中觀、微觀又涉及到概念的粒度表征,概念粒度越大,涵蓋的數(shù)據(jù)范圍越廣,概念越抽象和宏觀,概念粒度越小,涵蓋的數(shù)據(jù)范圍越窄,概念越具體和精細(xì)[3]。因此,如何表示不同粒度的概念以及概念之間的層次關(guān)系,即構(gòu)建概念樹,成為知識(shí)發(fā)現(xiàn)研究面臨的一個(gè)基礎(chǔ)問題。

      突發(fā)事件具有事發(fā)突然、隨機(jī)性、模糊性等不確定性特點(diǎn),如何在構(gòu)建突發(fā)事件屬性概念樹的過程中體現(xiàn)層次之間的不確定性呢?等距離和等頻率區(qū)間法等傳統(tǒng)的概念提取方法對(duì)論域?qū)嵭杏矂澐?,不允許概念中有模糊性,不符合人的認(rèn)知規(guī)律,而且傳統(tǒng)概念樹的形成也無法反映數(shù)據(jù)的實(shí)際分布情況[3],因此,傳統(tǒng)構(gòu)建方法無法滿足突發(fā)事件屬性概念樹的構(gòu)成。李德毅、蔣嶸、杜 等在結(jié)合概率論和模糊數(shù)據(jù)學(xué)理論的基礎(chǔ)上提出的云模型能統(tǒng)一刻畫概念中的隨機(jī)性、模糊性及其關(guān)聯(lián)性,并在云模型的基礎(chǔ)上提出云變換(Cloud Transformation)思想實(shí)現(xiàn)概念的軟劃分,此方法不僅較好地體現(xiàn)出概念的不確定性,而且能夠根據(jù)數(shù)據(jù)的實(shí)際分布實(shí)現(xiàn)概念的劃分[4-5]。用云變換實(shí)現(xiàn)概念劃分的方法,具有一定的優(yōu)勢(shì),得到不少學(xué)者的關(guān)注。Liu等采用數(shù)據(jù)場(chǎng)與云模型相結(jié)合的方法構(gòu)建范概念樹,用于空間數(shù)據(jù)挖掘[6];Weng等將基于云變換構(gòu)建的概念樹用于電價(jià)的預(yù)測(cè)[7];秦昆等針對(duì)云變換過程中,用云模型對(duì)頻率分布函數(shù)進(jìn)行擬合部分進(jìn)行算法改進(jìn),提出了一種新的云變換曲線擬合方法[8];孟暉等對(duì)原有的概念躍升算法進(jìn)行改進(jìn),在進(jìn)行概念云合并時(shí)考慮幅度系數(shù)的影響[9];蔣建兵等在分析現(xiàn)有正態(tài)云的概念劃分和概念提升方法的基礎(chǔ)上,提出了引入梯形云后新的云變換和軟或操作方法,但文章中并沒有給出實(shí)例論證[10];Z Wang提出基于梯形云模型的數(shù)值關(guān)聯(lián)規(guī)則的挖掘方法[11];馬政朝等運(yùn)用梯形云概念提升算法對(duì)物聯(lián)網(wǎng)安全數(shù)據(jù)的定義域進(jìn)行劃分,并對(duì)劃分結(jié)果進(jìn)行合理提升[12]。趙會(huì)園等對(duì)傳統(tǒng)的云變換算法中熵的估計(jì)步驟進(jìn)行改進(jìn),并應(yīng)用到農(nóng)業(yè)領(lǐng)域本體概念的構(gòu)建中[13];劉玉超提出用云模型中數(shù)字特征構(gòu)建概念含混度作為概念外延共識(shí)程度的衡量,設(shè)計(jì)并實(shí)現(xiàn)了高斯云變換算法,將問題域中的數(shù)據(jù)分布自動(dòng)轉(zhuǎn)換為多粒度的不同概念,構(gòu)建出人類概念認(rèn)知中的泛概念樹[14]。

      本文借鑒上述的算法思想,針對(duì)突發(fā)事件屬性特征,提出一種基于多類型云的云變換的算法,對(duì)突發(fā)事件屬性實(shí)現(xiàn)原子概念的歸納提取,通過對(duì)原子概念的提升,逐層構(gòu)建出突發(fā)事件屬性概念樹。這種突發(fā)事件屬性概念樹的構(gòu)建方法,避免了傳統(tǒng)概念劃分邊界過硬的問題,較好地解決突發(fā)事件存在的模糊性和隨機(jī)性等不確定性問題,為更好地進(jìn)行突發(fā)事件知識(shí)發(fā)現(xiàn)提供了一種科學(xué)而有效的數(shù)據(jù)預(yù)處理的方法。

      1 相關(guān)理論簡介

      1.1 云模型概念

      云模型是用自然語言值表示的定性概念與其定量數(shù)據(jù)表示之間的不確定性轉(zhuǎn)換模型,主要反映客觀世界中事物或人類知識(shí)中概念的模糊性和隨機(jī)性,并把兩者完全集成在一起,構(gòu)成定性概念和定量數(shù)據(jù)相互間的轉(zhuǎn)換,深刻揭示了客觀對(duì)象具有的模糊性和隨機(jī)性[3]。云模型用期望Ex、熵En、超熵He 3個(gè)數(shù)字特征整體表征一個(gè)概念,見圖1。期望Ex是云滴在論域空間分布的期望,是最能夠代表定性概念的點(diǎn),或者說是這個(gè)概念量化的最典型樣本。熵En是定性概念不確定性的度量,由概念的隨機(jī)性和模糊性共同決定。一方面,熵En是定性概念隨機(jī)性的度量,反映了能夠代表這個(gè)定性概念的云滴的離散程度;另一方面,又是定性概念亦此亦彼性的度量,反映了在論域空間可被概念接受的云滴的取值范圍。超熵He是熵的不確定性度量,即熵的熵,由熵的隨機(jī)性和模糊性共同決定[3]。云分為完整云、左半云和右半云,半云表示單側(cè)特性,見圖2。

      圖1 正態(tài)云模型(25,3,0.3)的云圖[15]

      1.2 梯形云模型

      從圖1中可以看出,在正態(tài)云圖中,只有當(dāng)定量值x取值為期望Ex時(shí),x的確定度才為1,而在現(xiàn)實(shí)生活中,描述某一類概念時(shí),經(jīng)常是不止一個(gè)元素完全屬于此概念,而是一個(gè)區(qū)間的元素都屬于此概念,因此,期望為一數(shù)值區(qū)間的時(shí)候更具一般性。當(dāng)期望取值為數(shù)值區(qū)間時(shí),便成為梯形云模型。梯形云較正態(tài)云更具有一般性,正態(tài)云是梯形云中一特殊類型,見圖3。梯形云模型的數(shù)字特征由4個(gè)特征值來表示,即C(Exl,Exr,En,He),其中Ex1≤Ex2,期望區(qū)間為[Exl,Exr],當(dāng)Exl=Exr時(shí),C表示正態(tài)云模型。

      當(dāng)通過梯形云期望和熵可以確定梯形云期望曲線方程:

      從圖3中可以看出,梯形云期望曲線光滑地穿過云滴“中間”,勾畫出梯形云的整體輪廓,是云滴集合的骨架,所有云滴都在期望曲線附近做隨機(jī)的波動(dòng)[6]。圖4是左半梯形云和右半梯形云圖,只表示單側(cè)特性。

      圖2 半云(25,3,0.3)的云圖[15]

      圖3 梯形云模型(20,25,3,0.3)與期望曲線

      1.3 云變換的簡介

      給定論域中某個(gè)數(shù)據(jù)屬性X的頻率分布函數(shù)f(x),根據(jù)X的屬性值頻率的實(shí)際分布自動(dòng)生成若干個(gè)粒度不同的云C(Exi,Eni,Hei)的疊加,每個(gè)云代表一個(gè)離散的定性的概念,這種從連續(xù)的數(shù)值區(qū)間到離散的概念的轉(zhuǎn)換過程,稱為“云變換”[3]。

      其數(shù)學(xué)表達(dá)式為:

      其中,ai為幅度系數(shù);n為變換后生成離散概念的個(gè)數(shù);ε(x)為誤差曲線。

      圖4 半梯形云(20,25,3,0.3)

      從數(shù)據(jù)挖掘的角度看,云變換是從某個(gè)粗粒度概念的某一屬性的實(shí)際數(shù)據(jù)分布中抽取更細(xì)粒度概念,出現(xiàn)頻率高的數(shù)據(jù)值對(duì)定性概念的貢獻(xiàn)率大于出現(xiàn)頻率低的數(shù)據(jù)值[3]。

      2 突發(fā)事件屬性概念樹的構(gòu)建

      突發(fā)事件種類繁多,每一類型的突發(fā)事件由不同的屬性進(jìn)行描述,具有不同的知識(shí)范疇,即使是屬于同一大類別的突發(fā)事件的屬性也不盡相同,如,同屬于自然災(zāi)害的火災(zāi)和地震。因此,很難用統(tǒng)一的模型來描述所有的突發(fā)事件的屬性。但經(jīng)分析發(fā)現(xiàn),突發(fā)事件的屬性特征的類型是有限的。本文將這些屬性類型分為:字符型、數(shù)值型和語言值型。字符型是指精確的文本字符值,如突發(fā)事件發(fā)生的地點(diǎn)、突發(fā)事件所屬的類別等。數(shù)值型是指通過觀察、統(tǒng)計(jì)可以得到的數(shù)值,如死亡人數(shù)、財(cái)產(chǎn)損失值等,語言值型是指用語言值表達(dá)某定性值,如恐慌程度等。一般字符型和語言值型的屬性概念樹的構(gòu)建需要領(lǐng)域?qū)<业膮⑴c,不在本文的討論范圍內(nèi),因此本文只對(duì)數(shù)值型屬性概念樹進(jìn)行研究。

      2.1 概念提取

      概念提取就是從連續(xù)的數(shù)據(jù)中提取出離散的概念的過程。傳統(tǒng)的方法主要有:等距離區(qū)間法和等頻率區(qū)間法。等距離區(qū)間法是將論域主觀劃分為多個(gè)寬度相等的子區(qū)間。等頻率區(qū)間法是依據(jù)屬性值發(fā)生的頻率,將論域劃分為頻率寬度相同的子區(qū)間。這些方法都沒有考慮實(shí)際的數(shù)據(jù)分布情況,也不能反映從實(shí)際的連續(xù)數(shù)據(jù)中抽取定性概念的不確定性。為解決上述問題,在云模型表示定性概念的基礎(chǔ)上,引入云變換的思想,可以實(shí)現(xiàn)連續(xù)數(shù)據(jù)的離散化[3]。

      設(shè)突發(fā)事件某屬性X的頻率分布函數(shù)f(x),根據(jù)X的實(shí)際頻率分布情況,自動(dòng)生成若干粒度不同的云C(Exi,Eni,Hei)的疊加,每個(gè)云代表一個(gè)離散、定性的概念,實(shí)現(xiàn)從連續(xù)數(shù)值區(qū)間到離散概念的轉(zhuǎn)換過程。文獻(xiàn)[5]提出一種基于峰值法的云變換方法,即數(shù)據(jù)頻率分布中的局部極大值點(diǎn)是數(shù)據(jù)的匯聚中心,可作為概念的中心,云模型的數(shù)學(xué)期望;峰值越高,表示數(shù)據(jù)匯聚越多,優(yōu)先考慮其反映的定性概念,在原分布中減去該定性概念對(duì)應(yīng)的數(shù)值部分,再尋找局部極大值,依次類推。但此方法就如何擬合變化的頻率分布曲線沒有做具體說明,對(duì)于峰值波動(dòng)不大的情況,擬合精度較高時(shí),就會(huì)出現(xiàn)較多的擬合云模型,增加計(jì)算復(fù)雜度。文獻(xiàn)[8]用梯形云模型代替正態(tài)云模型進(jìn)行曲線擬合進(jìn)行了改進(jìn),本文借鑒文獻(xiàn)[8]的思想,提出一種基于多類型云模型的云變換算法,此算法對(duì)擬合云模型的類型進(jìn)行擴(kuò)充,針對(duì)不同曲線段應(yīng)用不同類型的云模型進(jìn)行擬合,既減少了擬合云模型的個(gè)數(shù),又有利于提高擬合精度,此算法思路見圖5。

      圖5 基于多類型云模型的云變換算法流程圖

      具體算法步驟如下:

      算法1:基于多類型云模型的云變換

      輸入:屬性X的數(shù)據(jù)集合D;變換允許的誤差閾值ε;波峰差閾值θ;

      輸出:n個(gè)離散的不同類型的原子概念的云模型集合Clounds。

      算法步驟:

      (1)對(duì)屬性X的論域中每個(gè)可能屬性值X,計(jì)算其在數(shù)據(jù)集合D中含有該屬性值的記錄個(gè)數(shù)y,得到屬性X的頻率分布函數(shù)f(x)。

      (2)尋找頻率分布函數(shù)f(x)的波峰值所在位置,將其屬性值定義為云模型的中心點(diǎn)g。

      (3)初始值設(shè)l=g,r=g;在中心點(diǎn)g的左右邊尋找最相鄰的波峰值,l=左波峰值,r=右波峰值。

      (4)根據(jù)l和r的值,判斷云模型的類型,并確定云模型期望Exli,Exri。

      a.若l=g,則云模型為右半梯形云,Exli=g;若abs(r-l)≤θ,則繼續(xù)尋找下一個(gè)右波峰點(diǎn),直到abs(r-l)>θ,Exri=r;

      b.若r=g,則云模型為右半梯形云,Exri=g;若abs(r-l)≤θ,則繼續(xù)尋找下一個(gè)左波峰點(diǎn),直到abs(r-l)>θ,Exli=l;

      c.若l≠g且r≠g,如果abs(r-l)>θ,則云模型為正態(tài)云Exli=Exri=g;否則,從左右兩邊繼續(xù)尋找下一個(gè)波峰點(diǎn),直到abs(r-l)>θ,Exli=l,Exri=r。

      (5)計(jì)算用于擬合f(x)的、以Exli,Exri為期望的云模型的熵,計(jì)算云模型的分布函數(shù)fi(x)。

      (6)從f(x)中減去已知云模型的數(shù)據(jù)分布fi(x),得到新的數(shù)據(jù)分布函數(shù)f′(x),并在此基礎(chǔ)上重復(fù)步驟(2)~(4),得到多個(gè)基于云的數(shù)據(jù)分布函數(shù)。

      (7)根據(jù)已有的f(x),最后得到的擬合誤差函數(shù)f′(x)及各個(gè)云模型的分布函數(shù),計(jì)算基于云模型的定性概念的3個(gè)特征值。

      2.2 概念躍升及概念樹的生成

      算法1根據(jù)突發(fā)事件屬性域中數(shù)據(jù)值的分布情況,自動(dòng)生成一系列由云模型表示的基本概念,實(shí)現(xiàn)對(duì)論域的軟劃分。概念躍升就是在這些云模型表示的基本概念的基礎(chǔ)上,通過合并相鄰云概念,生成更高層次的云概念,達(dá)到概念提升來提升知識(shí)的粒度。概念躍升主要有3種策略:(1)用戶預(yù)先指定躍升的概念粒度,即用戶指定概念個(gè)數(shù);(2)自動(dòng)躍升,不預(yù)先由用戶指定,而是根據(jù)具體情況,自動(dòng)將概念躍升到合適的概念粒度;(3)人機(jī)交互式地躍升,即用戶干預(yù)并具體指導(dǎo)概念的躍升[3]。本文采用第(2)種策略進(jìn)行概念躍升。概念粒度提升主要是通過云綜合來完成,即將兩朵或多朵相同類型的子云進(jìn)行綜合,生成有朵新的高層概念的父云??梢允褂谩败浕颉痹凭C合法和“積分”云綜合法?!败浕颉痹凭C合法簡單易于計(jì)算,本文采用“軟或”云綜合法。一般,只會(huì)在頻率分布曲線的兩端才會(huì)出現(xiàn)半云模型,因此,兩類云模型進(jìn)行云綜合只會(huì)出現(xiàn)3種情形:(1)右半云與全云;(2)全云與全云;(3)全云與左半云;其中,全云包括正態(tài)云和梯形云。

      算法2:“軟或”云綜合法

      輸入:給定2個(gè)云模型C1(Exl1,Exr2,En1,He1,type1),C2(Exl2,Exr2,En2,He2,type2)

      輸出:綜合云模型C(Exl,Exr,En,He,type)

      算法步驟:

      (1)若type1為右半云,type2為全云,則根據(jù)下列公式計(jì)算:

      (2)若type1,type2同為全云,則根據(jù)下列公式計(jì)算:

      (3)若type1為全云,type2同為左半云,則根據(jù)下列公式計(jì)算:

      通過對(duì)原子云模型運(yùn)用云綜合算法進(jìn)行概念躍升可以得到較粗的粒度的概念,但不是距離最近的任何兩個(gè)相鄰的云模型都可以進(jìn)行云綜合算法,必須滿足一定的條件。本文在軟或操作中引入距離閾值δ,即距離函數(shù)d(C1,C2)=Exr1-Exl2/(En1+En2)≤δ,根據(jù)3En規(guī)則,δ的取值一般小于3。

      算法3:概念樹的生成

      輸入:云變換生成的原子概念集合C,距離閾值δ

      輸出:概念樹Clay

      算法步驟:

      3 實(shí) 例

      本文實(shí)驗(yàn)數(shù)據(jù)來源于全球恐怖主義研究數(shù)據(jù)庫(簡稱數(shù)據(jù)庫)[2],該數(shù)據(jù)庫包含了從1970-2013年全球超過125 000例恐怖襲擊的相關(guān)信息,每個(gè)案例至少包含45個(gè)特征屬性變量,其中最近發(fā)生的事件包含有120多個(gè)特征屬性變量。本文以nkill(死亡人數(shù))這一屬性為例進(jìn)行概念樹的構(gòu)建。由于各種原因,數(shù)據(jù)庫中存在字段缺失現(xiàn)象,將nkill字段數(shù)據(jù)缺失的記錄刪除后,得到106 099例數(shù)據(jù)。從理論上說,nkill的取值范圍nkill∈[0,∞),但從實(shí)際情況來看,隨著nkill取值越高,數(shù)據(jù)的分布越稀疏,從本數(shù)據(jù)庫的分布情況來看,nkill取值大于100,共有114例,其中nkill取值最大為1 382,由此可以看出:本數(shù)據(jù)nkill取值范圍較廣,數(shù)據(jù)分布非常稀疏,為了清晰的展示下文的效果圖,100以后的這段數(shù)據(jù)不在示圖中顯示,但參與計(jì)算。另外,需要說明的是,nkill取值為0的記錄共有57 363例,占總數(shù)的54.07%,nkill的取值從“0”到“1”,雖然數(shù)值之間只相差1,但是從概念意義實(shí)現(xiàn)了從“無”到“有”的飛躍,在突發(fā)事件的數(shù)值分類上一般把“0”值單獨(dú)劃分為一類,在本文的處理中,“0”不參與計(jì)算,如果處于別的考慮也可以將其加入計(jì)算,計(jì)算方法不變。

      3.1 不確定性概念提取

      圖6是恐怖主義研究數(shù)據(jù)庫中nkill字段數(shù)據(jù)的頻率分布圖。從圖6中可以看出,nkill數(shù)據(jù)的分布具有非常嚴(yán)重的偏倚現(xiàn)象,為了更好地進(jìn)行概念提取,必須對(duì)頻率進(jìn)行對(duì)數(shù)變換,令頻率′=log2(頻率+1),經(jīng)轉(zhuǎn)換后nkill數(shù)據(jù)分布曲線如圖7所示。

      圖6 原始數(shù)據(jù)曲線分布圖

      圖7 變換后數(shù)據(jù)的曲線分布圖

      經(jīng)過對(duì)nkill數(shù)據(jù)進(jìn)行算法1運(yùn)算,得到一系列由半云、梯形云和正態(tài)云組成的原子概念。圖8給出了這些定性概念所對(duì)應(yīng)的云模型,以及這些云模型的期望曲線的疊加。從圖7可以看出,通過云變換得到的定性概念所對(duì)應(yīng)的云模型的期望曲線的疊加非常好地反映了實(shí)際的數(shù)據(jù)分布情況。為了說明此算法的優(yōu)越性,本文將其與基于正態(tài)云擬合的云變換算法進(jìn)行比較。在相同參數(shù)設(shè)置環(huán)境下,相同數(shù)據(jù)經(jīng)過基于正態(tài)云擬合的云變換算法運(yùn)算后,得到的原子概念所對(duì)應(yīng)的云模型如圖9所示。本文算法共得到44個(gè)不同類型的云模型,而基于正態(tài)云的云變換算法得出59個(gè)云模型,前者的殘差方差值為0.1231,后者的殘差方差值為0.1577。由此可以本文改進(jìn)的算法不僅提高了擬合的精度,而且減少了云模型的個(gè)數(shù)。

      圖8 基于多類型云模型的數(shù)據(jù)分布圖

      圖9 基于正態(tài)云模型的數(shù)據(jù)分布圖

      3.2 概念躍升及概念樹的構(gòu)建

      按照概念云綜合算法,對(duì)原子概念進(jìn)行第一輪合并,得到12個(gè)較細(xì)粒度的不確定概念,見圖10。然后對(duì)這12個(gè)較細(xì)度的不確定型概念進(jìn)行近一步的合并,最后得到5個(gè)粗粒度的不確定型概念,其對(duì)應(yīng)的云模型,見圖11,圖12表示概念云的合并過程,圖12中每個(gè)方框表示一個(gè)概念云,格式為C(Ex1,Ex2,En,He,Type),其中,Type表示概念云的類型,1表示右半梯形云,2表示左半梯形云,3表示完整梯形云,4表示完整正態(tài)云。

      圖10 經(jīng)過概念合并后得到的12個(gè)不確定性概念

      圖11 經(jīng)過概念合并后得到的5個(gè)不確定性概念

      圖12 概念云的合并過程

      最終得到的5個(gè)不確定性概念較為客觀地反映了突發(fā)事件nkill數(shù)據(jù)的分布情況。從最初的44個(gè)概念躍升至最終的5個(gè)概念的過程,就是突發(fā)事件屬性nkill概念樹的構(gòu)建過程。該方法不需要人為參與干預(yù),可以直接從數(shù)據(jù)庫中抽取概念,構(gòu)建概念層次關(guān)系,形成概念樹。

      4 結(jié)束語

      本文通過分析現(xiàn)有的概念提取和概念躍升方法,將梯形云模型引入到突發(fā)事件屬性的概念提取和概念躍升的過程中,對(duì)現(xiàn)有的云變換算法進(jìn)行適當(dāng)?shù)母倪M(jìn),提出一種基于多類型云模型的云變換算法。此算法主要的特點(diǎn)是能根據(jù)數(shù)據(jù)分布曲線,自動(dòng)選用合適的云模型類型去擬合數(shù)據(jù)分布函數(shù),既能提高擬合精度,又能減少云模型的個(gè)數(shù)。

      基于云變換構(gòu)建的突發(fā)事件屬性概念樹充分考慮了原始數(shù)據(jù)的分布情況,較好地體現(xiàn)了概念的不確定性,而且還能隨著數(shù)據(jù)庫中數(shù)據(jù)的和誤差閾值的不斷變化進(jìn)行相應(yīng)的調(diào)整,為高質(zhì)量地進(jìn)行數(shù)據(jù)挖掘提供了一種行之有效的數(shù)據(jù)預(yù)處理方法,更有利于突發(fā)事件管理決策。

      [1]國家突發(fā)公共事件總體應(yīng)急預(yù)案[EB/OL].http:∥www.gov.cn/yjgl/2005-08/07/content-21048.htm,2013-07-22.

      [2]National Consortium for the Study of Terrorism and Responses to Terrorism(START).(2015).Global Terrorism Database[Data file].Retrieved from http:∥www.start.umd.edu/gtd.

      [3]李德毅,杜 .不確定性人工智能(第2版)[M].北京:國防工業(yè)出版社,2014.5.

      [4]蔣嶸,李德毅.?dāng)?shù)值型數(shù)據(jù)的泛概念樹的自動(dòng)生成方法[J].計(jì)算機(jī)學(xué)報(bào),2000,23(5):471-477.

      [5]杜 ,李德毅.基于云的概念劃分及其在關(guān)聯(lián)采掘上的應(yīng)用[J].軟件學(xué)報(bào),2001,12(2):196-203.[6]Liu.YF,He.Q,Liu.W..Cloud Segmentation of Spatial Concept Hierarchy Based on Data Field[C].2008 4th International Conference on Wireless Communications,Networking and Mobile Computing,2008:12-17.

      [7]Weng.YL,Shi.LD,zhao.JH.Price Spike Forecasting Using Concept-tree Approach based on Cloud Model[C].2nd ISECS International Colloquium on Computing,Communication,Control and Management(CCCM 2009),2009:8-9.

      [8]秦昆,王佩.基于云變換的曲線擬合新方法[J].計(jì)算機(jī)工程與應(yīng)用,2008,23:56-58,74.

      [9]孟暉,王樹良,李德毅.基于云變換的概念提取及概念層次構(gòu)建方法[J].吉林大學(xué)學(xué)報(bào):工學(xué)版,2010,(3):782-787.

      [10]蔣建兵,梁家榮,江偉,等.梯形云模型在概念劃分及提升中的應(yīng)用[J].計(jì)算機(jī)工程與設(shè)計(jì),2008,(5):1235-1237,1240.

      [11]Z Wang.Quantitative Association Rules Mining Method Based on Trapezium Cloud Model[C].Database Technology and Applications(DBTA),2010 2nd International Workshop on.IEEE,2010:1-4.

      [12]馬政朝,鄭瑞娟,吳慶濤,等.一種物聯(lián)網(wǎng)安全屬性概念提取方法[J].計(jì)算機(jī)仿真,2014,(3):303-307.

      [13]趙會(huì)園,李紹穩(wěn),劉超,等.基于云變換的農(nóng)業(yè)領(lǐng)域本體概念構(gòu)建方法研究[J].安徽師范大學(xué)學(xué)報(bào):自然科學(xué)版,2015,(2):123-128.

      [14]劉玉超.一種自適應(yīng)的多粒度概念提取方法——高斯云變換[J].計(jì)算機(jī)工程與應(yīng)用,2015,(9):1-8.

      [15]張艷瓊,陳祖琴,蘇新寧,等.基于云模型的突發(fā)事件分級(jí)模型研究[J].情報(bào)學(xué)報(bào),2015,(1):76-84.

      (本文責(zé)任編輯:孫國雷)

      The Building of Emergency Concept Tree based on Cloud Transformation

      Zhang Yanqiong1,2,3Deng Sanhong2,3
      (1.School of Information Science,Nanjing Normal University of Special Education,Nanjing 210038,China;2.School of Information Management,Nanjing University,Nanjing 210023,China;3.Jiangsu Key Laboratory of Data Engineering and Knowledge Service(Nanjing University),Nanjing 210023,China)

      According to the emergency characteristics,such as fuzziness,randomness,the cloud transformation was used to build concept tree of emergency attribute.Including Trapezium cloud,a new concept extracting method based on multiple types of clouds is proposed in this paper,which not only solved the fuzziness,randomness problem,but only improved the accuracy of fitting the data distribution curve while reducing the number of cloud model.A test was given on Global Terrorism Database(GTD),the result showed that the algorithm can build concept tree of nkill property.

      emergency;concept tree;cloud transformation;trapezium cloud

      10.3969/j.issn.1008-0821.2016.02.009

      TP393

      A

      1008-0821(2016)02-0046-07

      2015-11-24

      國家社會(huì)科學(xué)基金重大項(xiàng)目“面向突發(fā)事件應(yīng)急決策的快速響應(yīng)情報(bào)體系研究”(項(xiàng)目編號(hào):13&ZD174);地震科技星火計(jì)劃攻關(guān)項(xiàng)目“面向地震應(yīng)急的空間智能決策方法”(項(xiàng)目編號(hào):XH15019)。

      張艷瓊(1982-),女,講師,在讀博士,研究方向:數(shù)據(jù)挖掘、智能信息處理。

      猜你喜歡
      正態(tài)定性梯形
      玩轉(zhuǎn)梯形
      幼兒100(2023年37期)2023-10-23 11:38:58
      分裂平衡問題的Levitin-Polyak適定性
      梯形達(dá)人
      一類變延遲中立型微分方程梯形方法的漸近估計(jì)
      當(dāng)歸和歐當(dāng)歸的定性與定量鑒別
      中成藥(2018年12期)2018-12-29 12:25:44
      梯形
      啟蒙(3-7歲)(2017年6期)2017-11-27 09:34:55
      雙冪變換下正態(tài)線性回歸模型參數(shù)的假設(shè)檢驗(yàn)
      基于泛正態(tài)阻抗云的諧波發(fā)射水平估計(jì)
      半?yún)?shù)EV模型二階段估計(jì)的漸近正態(tài)性
      共同認(rèn)識(shí)不明確的“碰瓷”行為的定性
      福安市| 界首市| 凤台县| 沭阳县| 锦州市| 林甸县| 冷水江市| 庄河市| 长汀县| 永宁县| 杂多县| 宜兴市| 珠海市| 夏河县| 莱芜市| 客服| 姚安县| 元阳县| 吐鲁番市| 云林县| 元氏县| 赤城县| 广河县| 布尔津县| 牙克石市| 宁德市| 鄂托克旗| 鄯善县| 手游| 佛坪县| 萨迦县| 平泉县| 吉水县| 阜南县| 宜章县| 布拖县| 翁牛特旗| 仁布县| 寿宁县| 丽水市| 临沭县|