• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于關(guān)聯(lián)性的目標(biāo)動向熱點分析*

      2016-10-29 02:33:16俞鴻波
      電訊技術(shù) 2016年5期
      關(guān)鍵詞:動向決策樹熱點

      俞鴻波

      (中國西南電子技術(shù)研究所,成都 610036)

      基于關(guān)聯(lián)性的目標(biāo)動向熱點分析*

      俞鴻波**

      (中國西南電子技術(shù)研究所,成都610036)

      為了從海量傳感器數(shù)據(jù)中及時發(fā)現(xiàn)重要目標(biāo)的動向,提出了一種目標(biāo)動向信息表征及關(guān)聯(lián)方法,即從多源異類傳感器獲取的信息中抽取出目標(biāo)關(guān)聯(lián)要素進行動向表征,利用語義決策樹實現(xiàn)動向要素聚類,通過知識規(guī)則進行關(guān)聯(lián)匹配擴展,從而發(fā)現(xiàn)目標(biāo)動向的熱點,并進一步統(tǒng)計分析目標(biāo)活動規(guī)律與發(fā)展趨勢。實驗表明所提出的基于關(guān)聯(lián)性的目標(biāo)動向熱點分析算法準(zhǔn)確率高,具有實用價值。

      信息關(guān)聯(lián);目標(biāo)動向;熱點分析;語義決策樹

      1 引 言

      隨著傳感器技術(shù)的發(fā)展,傳感器用戶每天可獲得大量的數(shù)據(jù),如何從海量信息中及時發(fā)現(xiàn)重要目標(biāo)的動向是用戶關(guān)注的重點問題。傳統(tǒng)的信息分析方法主要是采取人工比對與綜合的方式進行,如今,利用關(guān)聯(lián)分析技術(shù)提取出有用信息,有助于情報人員快速分析并做出決策。

      關(guān)聯(lián)是目前常見的術(shù)語,主要用于關(guān)系型數(shù)據(jù)庫、語義網(wǎng)Web、數(shù)據(jù)挖掘等應(yīng)用領(lǐng)域。在關(guān)系型數(shù)據(jù)庫應(yīng)用領(lǐng)域中,關(guān)聯(lián)指的是一種數(shù)據(jù)的某些特性變化會引起另一種數(shù)據(jù)對應(yīng)變化的關(guān)系;在語義網(wǎng)中,關(guān)聯(lián)數(shù)據(jù)是指用以RDF/XML格式描述的元數(shù)據(jù)信息,且通過鏈接指向其他RDF數(shù)據(jù)的數(shù)據(jù),即通過網(wǎng)址鏈接形成富含元數(shù)據(jù)信息的數(shù)據(jù)關(guān)聯(lián);在數(shù)據(jù)挖掘領(lǐng)域,關(guān)聯(lián)分析主要是指關(guān)聯(lián)規(guī)則挖掘[1],即發(fā)現(xiàn)數(shù)據(jù)庫的項和屬性之間存在的不易察覺的聯(lián)系,而這些聯(lián)系往往預(yù)先未知,且無法通過結(jié)構(gòu)化數(shù)據(jù)庫的簡單查詢操作獲取。最著名的關(guān)聯(lián)規(guī)則是Apriori算法[2],其設(shè)計思想是通過多次迭代運算找出頻繁項集,從而發(fā)現(xiàn)各數(shù)據(jù)項之間的隱藏關(guān)聯(lián)關(guān)系,生成形如X=>Y的規(guī)則。

      在針對目標(biāo)動向研究領(lǐng)域,國內(nèi)外的研究重點主要集中在命名實體識別和突發(fā)事件的識別等。其中,命名實體識別技術(shù)的主要研究成果包括中科院自動化所的漢語詞法分析系統(tǒng)(Institute of Computing Technology,Chinese Lexical Analysis System,ICTCLAS)等;突發(fā)事件的識別大多面向特定的領(lǐng)域,如金融領(lǐng)域、網(wǎng)絡(luò)故障領(lǐng)域、災(zāi)難性事件等,成果包括北京郵電大學(xué)陳莉萍等進行的突發(fā)事件識別的研究[3]。文獻[4-5]針對文本信息中人物目標(biāo)動向的感知與關(guān)聯(lián)方面進行了相關(guān)研究,在完成文本中命名實體識別后,再運用句法分析建立人物動向語義信息,通過本體建模形成的關(guān)系模型抽取人物動向之間的關(guān)聯(lián)關(guān)系。上述方法在應(yīng)用中的主要限制在于僅針對文本信息中的人物動向進行分析,且前期本體建模工作量巨大。

      本文主要以??諜C動目標(biāo)為研究對象,著重研究通過關(guān)聯(lián)分析技術(shù)實現(xiàn)該類目標(biāo)動向識別與聚類,并發(fā)現(xiàn)目標(biāo)活動的熱點、規(guī)律與趨勢,其中熱點包括熱點平臺、熱點區(qū)域及相關(guān)的熱點行為。

      2 目標(biāo)動向概念模型及動向關(guān)聯(lián)模型

      目標(biāo)是指具備行為能力的實體或者物體,目標(biāo)動向是指目標(biāo)的一切行為活動。根據(jù)所使用傳感器的類型,能夠獲取到目標(biāo)動向信息的載體包括文本、圖像、視頻、格式化數(shù)據(jù)等。經(jīng)過對相關(guān)資料的整理,目標(biāo)動向可描述如下∶

      目標(biāo)動向∶={特征<固有特征、動態(tài)特征、感知特征、狀態(tài)特征>、要素<發(fā)生時間、發(fā)生地點、目標(biāo)行為、人物、關(guān)聯(lián)人物、平臺、關(guān)聯(lián)平臺、關(guān)聯(lián)組織機構(gòu)>、模式<規(guī)律、異常>}。

      其中,目標(biāo)動向模型由目標(biāo)自身蘊含的特征和目標(biāo)動向行為等來表征,如圖1所示。目標(biāo)特征包括固有特征、動態(tài)特征、感知特征、狀態(tài)特征,固有特征是目標(biāo)獨特唯一具有的不變特征,例如目標(biāo)機動能力、外形特征等;動態(tài)特征是目標(biāo)的行為規(guī)律;感知特征是目標(biāo)被傳感器捕獲后表現(xiàn)出的特征,如目標(biāo)在聲、光、電上表現(xiàn)出的特征;狀態(tài)特征指目標(biāo)當(dāng)前具備的狀態(tài),如巡邏、警戒等。目標(biāo)動向由動向要素和動向模式組成,其中動向要素是組成動向的實體,包括時間、地點、行為等,是組成目標(biāo)動向的主體;動向模式包括規(guī)律和異常,是目標(biāo)動向在時空層面表現(xiàn)出的統(tǒng)計特性。

      圖1 目標(biāo)動向概念模型Fig.1 Target activity conceptional model

      在應(yīng)用中,目標(biāo)動向分析通常以某一事件或目標(biāo)作為中心或起點進行研究,其中經(jīng)常從時空和類別層面對相關(guān)本體或事件進行關(guān)聯(lián)組織,便于更進一步的挖掘深層次信息。雖然當(dāng)前對目標(biāo)動向關(guān)聯(lián)的研究需求迫切,并有一些相關(guān)概念的研究,但在宏觀格局上的認識并未形成體系,對目標(biāo)動向間聯(lián)系的類型劃分也缺乏專門的探討,導(dǎo)致現(xiàn)有概念之間缺乏好的繼承和整合。因此,本文基于目標(biāo)動向模型演化出目標(biāo)動向關(guān)聯(lián)模型,試圖對概念進行整合和宏觀把握。

      按照目標(biāo)動向的關(guān)聯(lián)要素,可將其劃分為目標(biāo)主體型關(guān)聯(lián)、背景主題型關(guān)聯(lián)和行為模式型關(guān)聯(lián)。其中,目標(biāo)主體型關(guān)聯(lián)主要關(guān)注目標(biāo)動向中的相關(guān)主體特征及要素,包括時空主體、平臺主體、人物主體、特征主體等;目標(biāo)動向由于顯見或潛在突出或不突出的主體因素也能產(chǎn)生關(guān)聯(lián),如某艦隊行為和艦隊指揮官的行為之間存在潛在關(guān)聯(lián)性;行為模式型關(guān)聯(lián)主要關(guān)注目標(biāo)間活動模式之間的關(guān)聯(lián),比如具有相同活動模式與規(guī)律的海監(jiān)巡航編隊;主題型關(guān)聯(lián)是指具有相似或者相同背景主題而產(chǎn)生的廣義目標(biāo)或動向事件的關(guān)聯(lián),譬如以東海巡航為討論主題,關(guān)聯(lián)目標(biāo)動向包括南海維權(quán)事件和建設(shè)東海防空識別區(qū)等?;谏鲜鲅芯糠懂?,圍繞目標(biāo)動向的主體事件出現(xiàn)多方面的關(guān)聯(lián)線索與方向,形成如圖2所示的目標(biāo)動向關(guān)聯(lián)模型。由于主題間具有隱式關(guān)聯(lián)關(guān)系,主題間的關(guān)聯(lián)關(guān)系可依據(jù)動向要素的核心性共現(xiàn)詞語進行關(guān)聯(lián)。

      圖2 目標(biāo)動向關(guān)聯(lián)模型Fig.2 Correlation model of target activity

      3 目標(biāo)動向要素關(guān)聯(lián)分析方法

      由前文所述,目標(biāo)動向信息中既包含了目標(biāo)的基本特征屬性,又包括了目標(biāo)動向的基本要素描述,還包含了目標(biāo)行為的深層次語義特征和相關(guān)知識。其中動向要素形成了目標(biāo)動向的底層描述,可以從傳感器數(shù)據(jù)中通過統(tǒng)計、匹配、識別等方式獲取。目標(biāo)動向要素建立了傳感器數(shù)據(jù)和目標(biāo)動向模式的紐帶,基于目標(biāo)動向要素的關(guān)聯(lián)分析可支撐目標(biāo)動向模式的深度挖掘與分析。因此,本文中目標(biāo)動向信息分析的主要思路就是從傳感器數(shù)據(jù)中抽取目標(biāo)動向要素,并建立不同源傳感器數(shù)據(jù)中基于目標(biāo)動向的關(guān)聯(lián)關(guān)系,在目標(biāo)動向相關(guān)性的基礎(chǔ)上進一步發(fā)現(xiàn)目標(biāo)活動的熱點、規(guī)律與趨勢。

      如圖3所示,目標(biāo)動向要素關(guān)聯(lián)分析方法處理流程分為如下步驟∶

      (1)從多種類、多格式、多媒介的海量信息中抽取目標(biāo)動向要素;

      (2)構(gòu)建目標(biāo)動向要素特征向量,利用語義決策樹對目標(biāo)動向要素進行關(guān)聯(lián)聚類;

      (3)對目標(biāo)動向要素進行知識擴展,進一步關(guān)聯(lián)出潛在的動向主體;

      (4)結(jié)合動向背景,對動向主體進行統(tǒng)計、相關(guān)排序、預(yù)測,發(fā)現(xiàn)動向熱點。

      圖3 目標(biāo)動向要素關(guān)聯(lián)分析方法處理流程Fig.3 Flowchart of target activity factor correlation

      3.1目標(biāo)動向要素抽取與結(jié)構(gòu)化

      3.1.1時空結(jié)構(gòu)化

      傳感器原始數(shù)據(jù)種類雖多,但數(shù)據(jù)的基本屬性一般都包含空間屬性和時間屬性。其中,空間屬性通過經(jīng)緯高或者地址名稱等方式表達了目標(biāo)活動的相關(guān)區(qū)域;時間屬性則是通過將目標(biāo)的歷史活動軌跡投影到時間軸的方式,來表達目標(biāo)動向的時間點或者時間段。在實現(xiàn)關(guān)聯(lián)前,必須對各類數(shù)據(jù)進行時空化分類處理以統(tǒng)一格式和標(biāo)準(zhǔn),如圖4所示。

      圖4 時空化數(shù)據(jù)分類處理Fig.4 Class of temporal and spacial data

      本文使用ICTCLAS自動分詞系統(tǒng)對原始數(shù)據(jù)進行分詞,在得到分詞序列的基礎(chǔ)上進行自動詞性標(biāo)注,然后進行命名實體識別,提取時空信息。其中,基于863詞性標(biāo)注集,利用條件隨機域CRF詞性標(biāo)注器進行詞性標(biāo)注[6],使用Viterbi動態(tài)優(yōu)化方法,即可求出最佳詞性標(biāo)注序列。

      (1)時間信息抽取

      詞性標(biāo)注后的分詞序列仍然是信息量較少、語義不完整的單詞,需要通過命名實體識別,識別出有語義的短語和詞組。有語義的短語和詞組就是要識別的命名實體,通常通過模板規(guī)則來表征實體要素的表達規(guī)則。依據(jù)中文命名實體(NE)識別方法,即可建立時間表達的實體規(guī)則。規(guī)則包括∶數(shù)字+年|月|日,例如,2012年,09年12月;數(shù)字+“年代”或“世紀(jì)”,例如,20世紀(jì),90年代;數(shù)字+時|分|秒|點,例如,上午09hh∶08mm∶17ss。

      (2)空間信息抽取與同化

      地理空間的實體之間有包含和非包含的關(guān)系,包含關(guān)系的地名實體直接組合成一個實體,非包含關(guān)系的實體合并成集合形式。由于命名規(guī)則極不規(guī)范,應(yīng)用時為了快速準(zhǔn)確定位,必須進行規(guī)范化操作和地理同化。

      方式一∶自動匹配切詞技術(shù)。將地址按照數(shù)據(jù)庫中地址/地名信息自動匹配切詞,該方式的優(yōu)點是具有唯一性和高效性。

      方式二∶GPS定位。對GPS類定位數(shù)據(jù),提取數(shù)據(jù)的經(jīng)緯度位置、高度信息,并轉(zhuǎn)換到統(tǒng)一的橢球坐標(biāo)系下。同時,根據(jù)數(shù)據(jù)的產(chǎn)生以及傳感器特點(包括傳感器的類型特點、精度等),計算數(shù)據(jù)定位的誤差范圍,進行定位匹配處理。

      方式三∶地址庫匹配。即將地址數(shù)據(jù)與在知識庫中存儲的地理數(shù)據(jù)信息進行相關(guān)性匹配,從而獲取相應(yīng)的地址信息。

      3.1.2主體信息結(jié)構(gòu)處理

      動向要素中主體信息包括人物、關(guān)聯(lián)人物、平臺、關(guān)聯(lián)平臺、目標(biāo)行為等要素,對該類信息的抽取根據(jù)傳感器數(shù)據(jù)文件類型的不同而有所區(qū)別。對于圖像類數(shù)據(jù),利用圖像解譯算法對數(shù)據(jù)自動或交互式添加語義標(biāo)簽。例如,利用目標(biāo)檢測與識別等算法對數(shù)據(jù)自動添加語義標(biāo)簽,并將目標(biāo)名稱及屬性對應(yīng)的語義標(biāo)簽添加到平臺要素中。對于視頻類數(shù)據(jù),則首先進行視頻文件的結(jié)構(gòu)化處理,結(jié)構(gòu)化過程首先通過邊界檢測方法將視頻分割為多個鏡頭,然后提取每個鏡頭的關(guān)鍵幀來代表整個視頻的內(nèi)容。在完成了鏡頭邊界檢測和關(guān)鍵幀提取后,利用前述的圖像解譯算法及語音識別算法實現(xiàn)對視頻內(nèi)主體信息的提取。對于文字類信息,通過建立專業(yè)領(lǐng)域詞典,提取各要素,例如∶目標(biāo)行為要素包括巡邏、偵察、航渡等。具體過程本文不再贅述。

      3.2動向要素特征向量的語義決策樹關(guān)聯(lián)

      根據(jù)提取出的描述目標(biāo)動向事件的基本要素構(gòu)建一個描述動向的特征向量,假設(shè)描述第i項傳感器中包含向量X(i)∶

      多源傳感器獲取目標(biāo)信息使用基于要素知識模板的向量空間表示后,成為規(guī)則的動向要素描述數(shù)據(jù)。然后利用語義決策樹的方法,依據(jù)要素關(guān)系進行關(guān)聯(lián)。選擇語義決策樹的主要原因一是特征向量由非數(shù)值型的屬性組成,決策樹算法在聚類過程中可比對屬性的標(biāo)稱值,適合于標(biāo)稱屬性向量的非數(shù)值計算;二是多源目標(biāo)信息關(guān)聯(lián)是一個知識發(fā)現(xiàn)的過程,對于能挖掘出多少知識信息不能確定,很大程度上與數(shù)據(jù)隱藏了多少潛在的知識有關(guān),因此,不能預(yù)計關(guān)聯(lián)聚類結(jié)果的數(shù)目,決策樹能夠依據(jù)屬性取值進行自由分裂和合并,從而適應(yīng)聚類數(shù)目不確定的情況。

      在決策樹算法應(yīng)用中,通過從根結(jié)點到葉子結(jié)點的排列來分類樣本實例。對于目標(biāo)動向所屬的文件來說,決策樹的結(jié)點代表了文件中目標(biāo)動向的所屬分類,而每個葉結(jié)點則對應(yīng)動向所包含特征向量中要素的對象取值。通過選擇最有助于分類目標(biāo)動向?qū)嵗膶傩宰鳛榻Q策樹的上層結(jié)點,所以根結(jié)點一般是特征向量中最優(yōu)的屬性。

      使用信息增益來統(tǒng)計并衡量屬性區(qū)分給定訓(xùn)練樣例的能力[7]。為了精確定義信息增益,使用熵刻畫任意樣例集的純度。給定包含c個聚類的樣本集合S,那么S的熵定義為

      式中∶pi為樣本集合S中屬于類別i的概率。

      此時,屬性A相對于樣本集合S的信息增益Gain(S,A)被定義為

      式中∶Value(A)是屬性A的取值范圍集合;Sv是樣本集合中屬性值為v的子集合,即Sv={s∈S|A(s)=v}。通常具有最高信息增益的屬性是最好的屬性,使用最好的屬性作為建立決策樹的根節(jié)點。本文使用ID3算法訓(xùn)練,ID3算法增長樹的每一步使用屬性的信息增益作為選取最佳屬性的度量標(biāo)準(zhǔn)。

      由訓(xùn)練集S構(gòu)造最佳決策樹的算法描述如下[7]∶

      創(chuàng)建結(jié)點N。

      如果S為空,則返回節(jié)點,標(biāo)記失敗。

      If S中的元組都在同類C中,Then返回N作為葉子結(jié)點,用類C標(biāo)記結(jié)點N。

      If屬性列表為空,Then返回N作為葉結(jié)點,用S中的多數(shù)類標(biāo)記結(jié)點N。

      For splitting_criterion每個輸出j

      設(shè)Sj是S中滿足輸出j的數(shù)據(jù)元組的集合;

      If Sj為空

      增加葉結(jié)點N,標(biāo)記為訓(xùn)練集中的多數(shù)類;

      Else

      增加由Generate_decision_tree(Sj,Attribute_list)返回的結(jié)點到N。

      End For

      返回根節(jié)點

      說明∶Generate_decision_tree函數(shù)通過對決策樹各分支的子集遞歸調(diào)用的方式建立決策樹結(jié)點的分支。

      根據(jù)動向特征向量中要素構(gòu)成的假設(shè)決策樹理論上有很多,但很多決策結(jié)果在實際應(yīng)用中比較少見,本文關(guān)注的決策樹主要是目標(biāo)在地點的活動行為,使用Tree(目標(biāo),地點,行為,時間)表示。語義決策樹的關(guān)聯(lián)聚類見圖5。

      圖5 語義決策樹關(guān)聯(lián)聚類處理Fig.5 Correlative classification of decision tree

      語義決策樹的聚類結(jié)果代表目標(biāo)動向要素屬性值合取的析取式,每一條路徑都代表了一類目標(biāo)動向的聚類結(jié)果。例如,<目標(biāo)=中國海監(jiān)編隊∧地點=某海域∧時間=2012年∧行為=巡邏>代表了在“某海域”主題下搜索到的信息中,2012年中國海監(jiān)船編隊在某海域活動的行為等情況。

      3.3擴展關(guān)聯(lián)查詢

      基于要素的聚類關(guān)聯(lián)能夠發(fā)現(xiàn)某個主題下??諜C動目標(biāo)的活動情況,根據(jù)關(guān)聯(lián)知識規(guī)則進行關(guān)聯(lián)人物和關(guān)聯(lián)組織機構(gòu)的擴展,能夠發(fā)現(xiàn)關(guān)鍵人物的活動信息,并發(fā)現(xiàn)潛在目標(biāo)關(guān)聯(lián)信息,如從某艦船編隊的動向擴展關(guān)聯(lián)出編隊指揮官的相關(guān)行為和言論。關(guān)聯(lián)要素的擴展查詢需要建立基于目標(biāo)要素的知識規(guī)則庫。知識規(guī)則庫是基于要素詞典建立的知識擴展映射表格,是基于領(lǐng)域知識對要素項的進一步聯(lián)想與擴展。

      根據(jù)決策樹聚類和擴展查詢的結(jié)果,把傳感器數(shù)據(jù)聚類成不同的分組,保存數(shù)據(jù)之間的分組關(guān)系,作為已知信息用于后續(xù)熱點分析。

      3.4動向熱點分析

      動向熱點定義為指定時間段內(nèi)頻繁發(fā)生的目標(biāo)動向,對海空機動目標(biāo)來說,就是某類目標(biāo)頻繁的行為活動。下面介紹動向熱點的分析方法的具體步驟。

      (1)對某類目標(biāo)的活躍度進行評估。在上述關(guān)聯(lián)聚類結(jié)果中,對目標(biāo)名稱或者類屬進行相似性檢測,經(jīng)過統(tǒng)計后即可發(fā)現(xiàn)目標(biāo)活動的頻率、目標(biāo)熱點活動區(qū)域、目標(biāo)活動的熱點時間段,并對目標(biāo)活躍度進行演化預(yù)測,若演化預(yù)測出的目標(biāo)活躍度提升達到預(yù)警值,則提示相關(guān)部門采取應(yīng)對措施。

      本文中,目標(biāo)動向的趨向性演化預(yù)測采用馬爾科夫預(yù)測模型[8],具體描述如下∶

      (2)對于關(guān)聯(lián)出的熱點目標(biāo)動向信息,通過對應(yīng)傳感器信息文件的主題進行相似度計算,將相似度高的主題提取出來,作為目標(biāo)動向?qū)?yīng)的熱點主題呈現(xiàn)給用戶。

      主題相似度計算采用相似度SimF(c1,c2)來計算∶

      式中∶參數(shù)α和β值的大小決定了主題c1和c2間語義相似度的取值。在同樣的距離下,α和β的值越大對應(yīng)的相似度就越小,通常語義距離為1時,α和β的取值要保證相似度在0.5以上。

      4 仿真結(jié)果

      4.1數(shù)據(jù)描述

      以某海域事件為背景構(gòu)建仿真數(shù)據(jù),仿真某海域事件主題下的3 000份文件,包括文本、圖像、視頻和目標(biāo)數(shù)據(jù),其中涉及到的主題包括“巡航”、“登島維權(quán)”等共7大類13個小類。

      4.2測評指標(biāo)

      可由熱點識別準(zhǔn)確率和召回率對熱點分析結(jié)果進行量化分析。熱點分析準(zhǔn)確率指標(biāo)定義為式中∶Eb表示標(biāo)示出的熱點類別;Ed表示經(jīng)過關(guān)聯(lián)分析后檢索出的熱點類別。

      4.3關(guān)聯(lián)及熱點識別結(jié)果

      利用3.1節(jié)方法,對某海域沖突事件仿真數(shù)據(jù)經(jīng)過抽取后,形成包括“海監(jiān)船編隊”、“漁政船”、“某無人機”等平臺及對應(yīng)的時間要素、地理空間要素和行為要素,根據(jù)3.2節(jié)和3.3節(jié)介紹的語義決策樹方法完成關(guān)聯(lián)聚類后進行熱點分析,共形成平臺-地理-行為熱點17類,經(jīng)過交互類屬合并后為14類。關(guān)聯(lián)出目標(biāo)動向后,分析出的熱點主題包括巡航、領(lǐng)土安全、購島、中日關(guān)系等。通過式(6)計算,熱點分析準(zhǔn)確率達到92.8%,滿足了應(yīng)用中對動向熱點準(zhǔn)確識別的需求。

      以月度作為統(tǒng)計周期,統(tǒng)計了半年的傳感器數(shù)據(jù),對其中關(guān)注的典型目標(biāo)包括海監(jiān)船、海監(jiān)飛機和漁政船的的活躍度進行評估,形成了圖6所示結(jié)果,可以看出到2014年4月形成了動向峰值,與主題聚類的結(jié)果形成了互印證。

      圖6 典型目標(biāo)動向趨向性分析Fig.6 The activity trend analysis graph of concerned targets

      5 結(jié)束語

      本文主要研究了目標(biāo)動向信息表征及關(guān)聯(lián)方法,從多源異類傳感器獲取的信息中抽取出目標(biāo)關(guān)聯(lián)要素進行動向表征,利用語義決策樹實現(xiàn)動向要素聚類,并通過關(guān)聯(lián)知識規(guī)則進行匹配擴展,建立目標(biāo)動向間的關(guān)聯(lián)關(guān)系,從而發(fā)現(xiàn)目標(biāo)動向的熱點,并進一步統(tǒng)計分析目標(biāo)活動規(guī)律與發(fā)展趨勢。文中重點描述了目標(biāo)動向概念模型及動向關(guān)聯(lián)模型的構(gòu)建及動向要素的關(guān)聯(lián)聚類方法。與傳統(tǒng)的方法相比,本文方法的主要優(yōu)點在于∶

      首先,方法針對的數(shù)據(jù)類型包括多源信息數(shù)據(jù),除了文本之外,還包括了圖像、視頻、格式化傳感器數(shù)據(jù)等;

      其次,方法綜合使用基于規(guī)則的命名實體識別技術(shù)和模式識別技術(shù)解決目標(biāo)動向的抽取與聚類,避免了采用復(fù)雜的句法分析,從目標(biāo)行為宏觀語義的角度實現(xiàn)了目標(biāo)信息關(guān)聯(lián);

      此外,本文的方法區(qū)別于關(guān)鍵詞檢索的不同在于,關(guān)鍵詞檢索使用戶只能查詢哪些信息文件中出現(xiàn)了用戶關(guān)注目標(biāo),返回的結(jié)果集數(shù)據(jù)量巨大,因此,還需要結(jié)合上下文采用人機交互的方式,從結(jié)果集中綜合判定獲取目標(biāo)信息的正確性;而本文方法則是在關(guān)聯(lián)過程中,利用目標(biāo)動向的背景知識進行主題事件的聚合與印證,關(guān)聯(lián)過程不再是僅用特定詞語的檢索,更加具有針對性和智能化的特點,因此,關(guān)聯(lián)分析的結(jié)果更加精確。

      后續(xù)工作重點突破目標(biāo)行為的語義理解與描述,從更細粒度分析動向特征的內(nèi)涵與模式。

      [1] 程舒通,徐從富.關(guān)聯(lián)規(guī)則挖掘技術(shù)研究進展[J].計算機應(yīng)用研究,2009,26(9)∶3210-3213.

      CHENG Shutong,XU Congfu.State-of-art on association rules mining technology[J].Application Research of Computers,2009,26(9)∶3210-3213.(in Chinese)

      [2] 張沖.Apriori算法在物聯(lián)網(wǎng)(IOT)數(shù)據(jù)挖掘中的應(yīng)用[J].科技通報,2014,30(11)∶162-164.

      ZHANG Chong.Study of IOT data excavating based on apriori algorithm[J].Bulletin of Science and Technology,2014,30(11)∶162-164.(in Chinese)

      [3] 陳莉萍,杜軍平.突發(fā)事件熱點話題識別系統(tǒng)及關(guān)鍵問題研究[J].計算機工程與應(yīng)用,2011,47(32)∶19-22.

      CHEN Liping,DU Junping.Study on hot topics identification and key issues about emergency events[J].Com-puter Engineering and Applications,2011,47(32)∶19-22.(in Chinese)

      [4] 陳天瑩,蘇智慧.基于語義推理的文本信息關(guān)聯(lián)關(guān)系分析技術(shù)[J].電訊技術(shù),2014,54(1)∶67-73.

      CHEN Tianying,SU Zhihui.Text information relationship analysis based on semantic reasoning[J].Telecommunication Engineering,2014,54(1)∶67-73.(in Chinese)

      [5] 陳天瑩.文本信息中的目標(biāo)動向感知技術(shù)[J].電訊技術(shù),2014,54(6)∶730-734.

      CHEN Tianying.Target activity awareness on text information[J].TelecommunicationEngineering,2014,54(6)∶730-734.(in Chinese)

      [6] 周晶,吳軍華,陳佳,等.基于條件隨機域CRF模型的文本信息抽?。跩].計算機工程與設(shè)計,2008,29(23)∶6094-6097.

      ZHOU Jing,WU Junhua,CHEN Jia,et al.Using conditional random fields model for text information extraction[J].Computer Engineering and Design,2008,29(23)∶6094-6097.(in Chinese)

      [7] 王小巍,蔣玉明.決策樹ID3算法的分析與改進[J].計算機工程與設(shè)計,2011,32(9)∶3069-3076.

      WANG Xiaowei,JIANG Yuming.Analysis and improvement of ID3 decision tree algorithm[J].Computer Engineering and Design,2011,32(9)∶3069-3076.(in Chinese)

      [8] 章登義,歐陽黜霏,吳文李.針對時間序列多步預(yù)測的聚類隱馬爾科夫模型[J].電子學(xué)報,2014,42(12)∶2359-2364.

      ZHANG Dengyi,OUYANG Chufei,WU Wenli.Clusterbased hidden Markov model in time series multi-step prediction[J].Acta Electronica Sinica,2014,42(12)∶2359 -2364.(in Chinese)

      俞鴻波(1977—),男,湖北人,2005年于西北工業(yè)大學(xué)獲博士學(xué)位,現(xiàn)為高級工程師,主要研究方向為圖像處理與信息融合。

      YU Hongbo was born in Hubei Province,in 1977.He received the Ph.D.degree from Northwestern Polytechnical University in 2005. He is now a senior engineer.His research concerns image processing and information fusion.

      Email∶walkeryhb@163.com

      Hot Spot Analysis Based on Correlation of Target Activity Information

      YU Hongbo
      (Southwest China Institute of Electronic Technology,Chengdu 610036,China)

      ∶A target activity expression and correlation method is presented in order to extract important target activity from varying and massive sensor data.Activity factors are extracted from various information to denote target activity,then,semanticdecision tree is used to classify activity factors,correlative relationships between sensor data are established using knowledge and rules.By extraction of target activity information,it is possible to analyze hot spot or predict target activity trends by correspondent historical target activities. Experiment shows that the proposed target activity information correlation algorithm has high precision,which can be used in real data set.

      ∶information correlation;target activity;hot spot analysis;semantic decision tree

      TN971;TP391.4

      A

      1001-893X(2016)05-0483-07

      10.3969/j.issn.1001-893x.2016.05.003

      俞鴻波.基于關(guān)聯(lián)性的目標(biāo)動向熱點分析[J].電訊技術(shù),2016,56(5)∶483-489.[YU Hongbo.Hot spot analysis based on correlation of target activity information[J].Telecommunication Engineering,2016,56(5)∶483-489.]

      2016-01-29;

      2016-03-28Received date:2016-01-29;Revised date:2016-03-28

      **通信作者:walkeryhb@163.comCorresponding author:walkeryhb@163.com

      猜你喜歡
      動向決策樹熱點
      熱點
      動向
      新西部(2022年3期)2022-04-13 22:20:53
      一種針對不均衡數(shù)據(jù)集的SVM決策樹算法
      熱點
      車迷(2019年10期)2019-06-24 05:43:28
      決策樹和隨機森林方法在管理決策中的應(yīng)用
      電子制作(2018年16期)2018-09-26 03:27:06
      結(jié)合熱點做演講
      快樂語文(2018年7期)2018-05-25 02:32:00
      基于決策樹的出租車乘客出行目的識別
      動向
      動向
      動向
      腾冲县| 铜陵市| 资中县| 敦煌市| 东港市| 凌源市| 邵武市| 治县。| 石狮市| 汝城县| 巴中市| 西昌市| 马龙县| 常德市| 平顶山市| 探索| 景洪市| 永和县| 昔阳县| 高碑店市| 奈曼旗| 民丰县| 华坪县| 双鸭山市| 锡林浩特市| 栾川县| 将乐县| 固始县| 鄂尔多斯市| 泊头市| 郯城县| 伊春市| 息烽县| 明光市| 顺义区| 怀宁县| 三门峡市| 锡林郭勒盟| 延津县| 延安市| 武强县|