• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于相似度排名的天氣雷達故障案例檢索

      2021-05-07 02:06:36周欽強李建勇王明輝陳冰懷
      廣東氣象 2021年2期
      關鍵詞:特征向量類別檢索

      周欽強,李建勇,王明輝,陳冰懷

      (廣東省氣象探測數(shù)據(jù)中心,廣東廣州 510080)

      CINRAD/SA新一代天氣雷達網(wǎng)業(yè)務運行十多年以來,各級保障部門和雷達站積累了大量故障維修經(jīng)驗與案例,黃裔誠等[1-2]基于故障樹組織了全省 CINRAD_SA 雷達故障案例;郭澤勇[3]、石城等[4]設計開發(fā)了新一代天氣雷達故障處理和故障標準化平臺。此外,雷達站技術保障人員對每次發(fā)生的雷達故障均給予了充分的分析總結[5-6],基本解決了故障維修經(jīng)驗或案例難以傳承的現(xiàn)狀,對于天氣雷達故障案例或維修經(jīng)驗共享,同步提升天氣雷達保障技術水平發(fā)揮了積極作用。但基于這些案例的二次開發(fā)應用尚屬空白,隨著新一代天氣雷達組網(wǎng)運行日趨穩(wěn)定,其出現(xiàn)的故障重復率較高,常見經(jīng)典故障的診斷分析與處理方法,對于目前大部分新一代天氣雷達故障都具有較好的維修指導意義,可為技術保障人員提供第一手的故障維修參考解決方案。

      本研究在以往故障案例研究成果基礎上,開發(fā)基于相似度排名的故障案例推理系統(tǒng),這不是嚴格意義上的故障診斷系統(tǒng)或?qū)<蚁到y(tǒng)[7-9],而是通過學習天氣雷達歷史案例,對新輸入的故障現(xiàn)象或描述,經(jīng)過案例知識表示、故障特征提取、相似度計算檢索等人工智能技術處理后,從歷史故障案例中自動匹配出相似故障案例,并以相似度排序給出參考故障解決方案。

      1 工作原理

      系統(tǒng)將人工智能領域的機器學習技術和天氣雷達電子信息技術兩個學科緊密結合應用,基于新一代天氣雷達歷史故障案例,致力于指導天氣雷達故障快速排查維修,通過學習成熟的歷史天氣雷達故障案例,獲取新故障信息并基于歷史案例相似度進行智能檢索對比,提出與新故障的參考對照解決方案,其工作原理如圖1所示。

      1.1 案例表示

      天氣雷達歷史案例庫中的每個案例均包括故障的一般描述,即情景與解決方法。系統(tǒng)采用典型的空間向量模型[10-11],將新一代天氣雷達每個歷史故障案例通過中文分詞、詞頻統(tǒng)計等進行知識表示處理,使每一個故障案例成為可機器識別的知識表示形式-空間向量,以便通過機器學習掌握所有天氣雷達歷史案例。

      1.2 案例學習

      經(jīng)過機器識別處理的天氣雷達案例不僅包含了大量代表每個案例的特征詞頻信息,也包含了大量中性、無實意等詞頻信息,因此通過特征提取算法提取最能代表每個案例的詞頻信息,使每個故障案例的空間向量代表性最優(yōu),基于天氣雷達案例庫最優(yōu)空間向量進行學習訓練,以掌握天氣雷達各類故障案例的典型特征,從而生成天氣雷達故障診斷推理模型。

      圖1 系統(tǒng)工作原理示意圖

      1.3 故障檢索

      歷史相似案例檢索或提取過程,也就是從歷史案例庫中找到一個或多個與當前故障現(xiàn)象最相似的案例。當接受了一個新故障的檢索請求后,系統(tǒng)利用樸素貝葉斯(Na?ve Bayes)算法從案例庫中找出與當前故障相近似的排名案例組,并從中選擇一個最佳故障案例解決方案。通過3個子過程實現(xiàn):一是特征辯識,就是對新故障進行分析,提取有關特征;二是初步匹配,指從案例庫中找到與當前故障相關的候選案例;三是最佳選定,就是從初步匹配過程中獲得的案例中選取一個或幾個與當前故障最相近的案例。

      綜上所述,經(jīng)過對歷史案例庫的學習訓練后,當輸入新的天氣雷達故障現(xiàn)象描述時,系統(tǒng)提取故障關鍵特征屬性,對每個類別的故障案例進行檢索,基于Na?ve Bayes算法計算其屬于每類案例的概率,并按照歸屬概率進行排名匹配,技術人員可選擇概率排名靠前的歷史故障案例作參考來排查故障。

      2 關鍵技術

      2.1 故障案例向量化

      天氣雷達故障案例的信息表示屬于自然語言處理范疇,是計算機科學領域與人工智能領域中的一個重要方向,如何能讓計算機正確的理解和使用人類自然語言,繼而從大量的天氣雷達案例中提取出有效的特征信息,是提高故障維修成功率的關鍵前提。當天氣雷達發(fā)生故障時,維護維修人員或雷達站值班員輸入故障現(xiàn)象詳細信息描述,基于向量空間模型利用中文分詞法[12]將雷達故障信息進行分詞處理,并進行屬性抽取與屬性賦值。假設詞與詞相互獨立,以向量表示文本,利用向量之間的幾何度量(正弦、余弦)計算文本間的相似度,簡化文本中關鍵詞之間的復雜關系,使得模型具備可計算性。

      (1)屬性提取。

      通過Apache Lucence中文分詞器IK Analyzer將輸入的故障現(xiàn)象文字描述切分成為單個字或詞,并對切分出來的無實意字符進行預處理,最終得到代表故障現(xiàn)象的詞頻信息[12]。如圖2所示。每一個經(jīng)過上述處理后的詞語基本上為最能代表該篇文本特征的屬性,特征詞在該類案例出現(xiàn)的次數(shù)越多,則越能代表該類案例的特征,即其類別權重值越大,反之,權重值越小。

      圖2 故障描述特征屬性提取

      (2)權重計算。

      對故障案例文本進行中文分詞后,其中包含大量冗余詞匯或沒有多少實際意義的字或詞,需要對其進行剔除后挑取最能代表故障現(xiàn)象描述的關鍵詞或字作為新案例特征向量。TF-IDF[13]算法是最常用的特征詞加權算法,其核心思想是對每一個特征集的特征分配一個權值,即加權,然后設定閾值,利用閾值選取一定數(shù)目的特征作為最終的特征向量。這種閾值統(tǒng)計的方法具有計算代價小、效率高等優(yōu)點,其計算公式為

      特征項:

      則特征向量:

      其中,ti為故障描述c中提取的第i個特征項;wi為故障描述c中第i個特征項的權重值,i=0,1,…,n。

      2.2 Na?ve Bayes算法

      Na?ve Bayes算法[14]是文本分類領域中一種簡單但性能優(yōu)越的分類算法,為了簡化計算,假定各案例特征變量是相互獨立的,即“貝葉斯假設”,它假設天氣雷達案例空間向量中特征項ti和tj之間兩兩獨立,根據(jù)貝葉斯公式為

      其中,C為既定天氣雷達故障案例類別(C1,C2,…,Cj),X為新的天氣雷達故障特征向量(X1,X2,…,Xn);則相似度計算就是將故障案例向量X歸類到與其關聯(lián)最緊密的類別C(C1,C2,…,Cj)中去。也就是說,求解向量X屬于給定類別C的概率值(P1,P2,…,Pn),其中 Pj為 Xj屬于Cj的概率,則 max(P1,P2,…,Pn)所對應的類別就是新故障案例向量X所屬的類別,因此相似度計算被描述為求解方程(3)的最大值。

      其中,P(Cj)為故障案例集中,新故障屬于類別Cj的概率;P(X1,X2,…,Xn(Cj)為如果新故障屬于類別Cj,則類別Cj中包含新故障向量X的概率;P(C1,C2,…,Cj)為給定的所有類別的聯(lián)合概率。

      顯然,對于天氣雷達既定的所有故障類別,分母 P(C1,C2,…,Cj)是一個常數(shù),所以求解式(3)簡化為:

      又根據(jù)貝葉斯假設,新故障特征向量屬性x1,x2,…,xn獨立同分布,其聯(lián)合概率分布等于各個屬性特征概率分布的乘積,即

      所以式(4)變?yōu)?/p>

      即為所求解的天氣雷達故障案例相似度計算函數(shù)。

      盡管推導出了故障案例相似度計算函數(shù),但是函數(shù)中的概率值 P(Cj)和 P(Xi(Cj)還是未知的,式(6)中的先驗概率值分別估算如下:

      其中,N(C=Cj)為天氣雷達案例故障集中屬于Cj類別的文本數(shù)量;N為天氣雷達案例故障集總數(shù)量。

      其中,N(Xi=xi,C=Cj)為類別 Cj中包含特征屬性xi的故障案例數(shù)量;N(C=Cj)為類別Cj中的故障案例數(shù)量;M為故障案例集總數(shù)量。

      2.3 案例檢索

      根據(jù)2.2節(jié)天氣雷達故障案例相似度算法,可知天氣雷達新故障的歷史相似案例檢索過程:

      (1)故障案例集訓練。

      基于CINRAD/SA多普勒天氣雷達故障案例集,經(jīng)過特征提取,生成每類每個故障案例最能代表該案例的關鍵字,并表示成特征向量X(x1,x2,…,xn),計算 P(Cj)和 P(Xi(Cj)的先驗概率值。

      (2)案例相似度計算。

      新的故障現(xiàn)象表述經(jīng)過特征提取,提取出最能代表該故障現(xiàn)象的關鍵字,并表示成向量形式X(x1,x2,…,xn),根據(jù)式(6)計算天氣雷達歷史故障案例相似度函數(shù)值,并依大小值排序。

      3 系統(tǒng)測試

      3.1 學習訓練

      輸入新一代天氣雷達歷史故障案例集,并保存生成的雷達故障推理模型。以CINRAD/SA天氣雷達結構單元為架構,建立起來的包括發(fā)射機UD3、接收機 UD4、監(jiān)控單元 UD5、天饋系統(tǒng)UD2和附屬設備UD0等近20年來全省成功修復的歷史故障案例集,作為系統(tǒng)輸入,進行學習訓練,使系統(tǒng)模型具有解決新故障的推理診斷能力,如圖3所示。

      圖3 系統(tǒng)學習與測試程序界面

      3.2 最優(yōu)測試

      在天氣雷達歷史案例集學習訓練時,對案例集中的每一個故障案例向量化過程中,為有效排除權重低的特征項,采取有效降低案例特征向量維度來提高系統(tǒng)學習效率。降維系數(shù)過高,特征向量維度低,系統(tǒng)學習效率高,但因丟棄了權重高的特征項可能導致診斷結果正確率下降;反之降維系數(shù)低,特征向量維度高,不僅系統(tǒng)學習效率低,因特征向量包含了大量權重較低的特征項,診斷結果正確率也不一定提高,因此采取不同的降維系數(shù)組合,對系統(tǒng)進行反復訓練測試,以獲取學習效率和輸出正確率最優(yōu)的推理診斷模型。圖4給出的4種不同顏色案例相似度準確率曲線分布。

      圖4 降維系數(shù)組合對案例相似度準確率的影響

      (1)降維閾值的選取對診斷準確率具有重大影響。閾值不同時分類準確率變化起伏較大。因此,為了得到最佳性能的故障維修參考模型,必須選取不同的降維閾值反復學習測試。

      (2)盡管系統(tǒng)案例學習的平均準確度達到78.0%,但是對于每一個確定降維閾值的準確率而言,其準確率變化區(qū)間較大。也就是說,對應于圖3中每一種顏色的曲線,天氣雷達各類別測試準確率曲線并不平滑,如何使各類別案例準確率趨于一致也是今后研究的重要問題。

      3.3 相似案例檢索

      (1)導入最優(yōu)相似度的故障推理模型,輸入新故障現(xiàn)象描述文本。

      (2)系統(tǒng)自動對新故障描述進行中文分詞、特征提取等預處理,生成文檔空間向量D(d1,d2,…,dn)。

      (3)對D進行案例相似度檢索,輸出診斷參考解決方案,基于定位部件的歷史參考案例,成功解決故障后,將該次案例更新到案例集中。

      基于雷達保障技術人員、雷達生產(chǎn)廠家近10年的天氣雷達維護維修歷史案例集,開發(fā)了CINRAD/SA天氣雷達故障案例推理系統(tǒng)。本研究詳細闡述了故障案例表示、故障特征提取、相似度計算等關鍵技術,并分析了系統(tǒng)學習訓練、最優(yōu)測試與案例檢索過程。經(jīng)陽江、湛江、韶關、廣州等天氣雷達站試用,在故障發(fā)生時為技術保障人員提供第一手的故障排除參考解決方案,有效提高天氣雷達保障維護效率,對于縮短雷達故障排查時間,幫助準確定位故障部件,降低天氣雷達在線故障率,尤其對于重大天氣過程中雷達故障時快速恢復運行具有重要意義。但也存在一定的技術限制,如天氣雷達故障案例不夠豐富,特征向量維度與相似故障案例正確率的最優(yōu)關系等還需要深入研究,將是今后研究解決的主要技術問題,以為全省新一代天氣雷達高效智慧保障提供更有效的手段,助力提高故障維修效率。

      猜你喜歡
      特征向量類別檢索
      二年制職教本科線性代數(shù)課程的幾何化教學設計——以特征值和特征向量為例
      克羅內(nèi)克積的特征向量
      2019年第4-6期便捷檢索目錄
      一類特殊矩陣特征向量的求法
      EXCEL表格計算判斷矩陣近似特征向量在AHP法檢驗上的應用
      中華建設(2017年1期)2017-06-07 02:56:14
      專利檢索中“語義”的表現(xiàn)
      專利代理(2016年1期)2016-05-17 06:14:36
      服務類別
      新校長(2016年8期)2016-01-10 06:43:59
      論類別股東會
      商事法論集(2014年1期)2014-06-27 01:20:42
      中醫(yī)類別全科醫(yī)師培養(yǎng)模式的探討
      聚合酶鏈式反應快速鑒別5種常見肉類別
      食品科學(2013年8期)2013-03-11 18:21:31
      饶河县| 天祝| 松阳县| 九龙县| 黄龙县| 盘山县| 密山市| 海城市| 淳安县| 灵璧县| 郧西县| 苍南县| 金溪县| 揭西县| 仪陇县| 清新县| 潢川县| 大冶市| 吉安市| 新乡县| 方城县| 宁阳县| 即墨市| 肇东市| 三明市| 光泽县| 克什克腾旗| 穆棱市| 禹城市| 如皋市| 延庆县| 西畴县| 温宿县| 锡林浩特市| 衡水市| 松潘县| 霞浦县| 陵水| 芮城县| 云浮市| 平果县|