顧亞雄,鄧皓天
(西南石油大學(xué)機電工程學(xué)院,成都 610500)
?
基于K-最近鄰算法的管道系統(tǒng)傳感器數(shù)據(jù)有效性分析研究
顧亞雄*,鄧皓天
(西南石油大學(xué)機電工程學(xué)院,成都 610500)
在管道運輸中傳感器的正常使用至關(guān)重要,為了防止因傳感器故障而導(dǎo)致的數(shù)據(jù)采集失效,造成誤報警和漏報警,對傳感器本身的故障診斷和失效分析已經(jīng)成為當(dāng)前研究的重要方向。通過對各傳感器采集數(shù)據(jù)進行組合分析,以各傳感器之間的數(shù)據(jù)關(guān)聯(lián)特性作為研究內(nèi)容,運用K-最近鄰算法對管道上傳感器所采集數(shù)據(jù)進行相似性擬合,提出采用C4.5算法定義各傳感器所采集數(shù)據(jù)對目標(biāo)傳感器的支持度以決定目標(biāo)傳感器數(shù)據(jù)的有效性,對故障傳感器運行狀態(tài)進行分析與定位,進而判斷傳感器的數(shù)據(jù)可靠性和輸差出現(xiàn)位置。實驗結(jié)合西南某管道流量傳感器數(shù)據(jù)進行分析,結(jié)果表明,該算法能夠準(zhǔn)確判斷目標(biāo)傳感器數(shù)據(jù)的有效性和故障傳感器在時域中發(fā)生的位置。
多傳感器;數(shù)據(jù)有效性;關(guān)聯(lián)特性;K最近鄰;C4.5算法
管道運輸(Pipeline transport)是用管道作為運輸工具的一種長距離輸送液體和氣體物資的運輸方式,隨著我國石油和天然氣工業(yè)的快速發(fā)展,油氣管道建設(shè)突飛猛進[1]。而傳感器作為綜合運輸體系的重要組成部分,其技術(shù)的發(fā)展對于系統(tǒng)的正常運行尤為重要。管道運輸體系的龐大,其傳感器節(jié)點容易遭受環(huán)境 、源耗盡以及其他不可預(yù)知因素的影響導(dǎo)致數(shù)據(jù)采集產(chǎn)生故障,影響系統(tǒng)的可靠性,所以對管道運輸中的傳感器采集的數(shù)據(jù)進行合理的有效性分析,以及故障的排查定位顯得尤為重要[2-3]。
目前傳感器故障檢測方法,已提出分布式故障檢測DFD(Distribute-Fault-Detection)[4]、改進DFD[5]、分布式加權(quán)容錯檢[6]、協(xié)同診斷Collaboration Diagnosis[7]等故障檢測算法,其主要思想是通過分析鄰居節(jié)點間的相互投票機制,節(jié)點與鄰居節(jié)點的傳感器數(shù)據(jù)進行比較判斷實現(xiàn)故障檢測[8-11],也正因為如此,節(jié)點所在區(qū)域的傳感器故障比例對局部故障檢測精度有很大影響,造成以上方法都不可避免的會產(chǎn)生局部最優(yōu)的情況,張健利用灰色空間模型對傳感器網(wǎng)絡(luò)進行故障檢測,取得較好的效果[12]。任克強在傳感器網(wǎng)絡(luò)故障檢測中通過對歐式距離誤差進行改進,提高了傳感器的定位精度[13]。徐向華等人采用多傳感器網(wǎng)絡(luò)中的分布式故障檢測算法[14],根據(jù)同一區(qū)域中不同性質(zhì)傳感器的關(guān)聯(lián)特性對目標(biāo)傳感器進行檢測分析,該方法對于小范圍傳感器有一定應(yīng)用,但是不同傳感器需工作在同一環(huán)境條件下。王婉等人采用主元分析傳感器的方法[15]理論上給出了在不同的傳感器故障下,各統(tǒng)計量的變化規(guī)律,并討論了傳感器故障的可檢測性條件,黃曉微等人提出采用聚類算法尋找近鄰的傳感器節(jié)點[16],并應(yīng)用于橋梁傳感器擾度實驗中,取得了一定的成果,但在權(quán)值分配問題上,容易導(dǎo)致累計誤差產(chǎn)生,特別在樣本不平衡的情況下,會出現(xiàn)目標(biāo)傳感器依賴某一特定傳感器的現(xiàn)象。
本文通過K-最近鄰算法研究管道中各流量傳感器之間的關(guān)聯(lián)特性,對各流量傳感器的測量數(shù)據(jù)進行分析對比,尋找出與目標(biāo)傳感器相互關(guān)聯(lián)的近鄰傳感器,從傳感器采集數(shù)據(jù)出發(fā),對于影響傳感器所采集數(shù)據(jù)有效性的具體因素不做考慮,其關(guān)聯(lián)特性將不受地域范圍限定,只與各傳感器采集數(shù)據(jù)有關(guān),隨后利用C4.5算法計算目標(biāo)傳感器對各近鄰流量計的信任程度,進行權(quán)值分配,通過對目標(biāo)流量傳感器采集數(shù)據(jù)進行分析,判斷其數(shù)據(jù)有效性和傳感器性能問題。再將算法應(yīng)用在西南某輸運管道的實驗中,實驗結(jié)果表明該方法具有較高準(zhǔn)確性,能準(zhǔn)確識別出流量傳感器的性能變化以及所采集數(shù)據(jù)的可靠性。
1.1 流量傳感器關(guān)聯(lián)特性
管道運輸是一個龐大復(fù)雜的結(jié)構(gòu)系統(tǒng),包含有各類傳感器,管道中每一參數(shù)的變化,都會引起相應(yīng)傳感器的不同反應(yīng)。根據(jù)管道系統(tǒng)的整體性,以及運輸物質(zhì)質(zhì)量不變的特點,可以明確管道入口物質(zhì)質(zhì)量等于出口物質(zhì)質(zhì)量,各流量傳感器數(shù)據(jù)之間必然有著不同程度的關(guān)聯(lián),根據(jù)以上原理,通過對歷史采集數(shù)據(jù)的挖掘,充分利用這些數(shù)據(jù)潛在的價值規(guī)律,分析各傳感器之間的數(shù)據(jù)特點,將目標(biāo)傳感器與K個近鄰傳感器進行相似性關(guān)聯(lián),關(guān)聯(lián)越是緊密的監(jiān)測點,其傳感器采集的數(shù)據(jù)之間就越表現(xiàn)出趨于一致的變化規(guī)律。
假設(shè)某一管道系統(tǒng)共有N個流量監(jiān)測點,其中u,v是不同地點的采樣傳感器監(jiān)測點,xu(i),xv(i)是同一時刻i流量傳感器u,v的測量值,Xu與Xv分別是u與v在測量時間段T∈(ti|i=1,2,3…,m)T內(nèi)所采集到的m個流量數(shù)據(jù)所構(gòu)成的維向量,根據(jù)K-最近鄰算法確定監(jiān)測點u,v所測數(shù)據(jù)向量之間的距離變化趨勢,就能得到傳感器監(jiān)測點u,v數(shù)據(jù)的相似程度,二者相似度越高,傳感器u,v之間的關(guān)聯(lián)程度就越高。
1.2 K-最近鄰算法
K-最近鄰KNN(K-Nearest Neighbor)分類算法,是一個理論上比較成熟的方法,也是最簡單的機器學(xué)習(xí)算法之一,主要依據(jù)計算特征空間中不同樣本的歐幾里德距離,得出各樣本之間的相似性。兩個點或樣本空間X={1,x2,x3,x4…xm}和Y={y1,y2,y3,y4…ym}的歐氏距離定義如下:
(1)
式中:d(X,Y)越小,則樣本(X,Y)的相似度越高,d(X,Y)=0,表示X,Y完全相等。
在管道運輸系統(tǒng)中,由流量關(guān)聯(lián)原理可設(shè)S(X1,X2,X3…Xn)為其全部流量傳感器采集數(shù)據(jù)集合,在每一個測量時間段T內(nèi),各個傳感器均采集到個數(shù)據(jù),對于流量傳感器v(v∈S,v≠u),在第j個時間段內(nèi)的,其采集的數(shù)據(jù)與目標(biāo)流量傳感器采集數(shù)據(jù)之間歐氏距離為:
(2)
KNN方法雖然從原理上也依賴于極限定理,但在類別決策時,只與極少量的相鄰樣本有關(guān),為避免出現(xiàn)傳感器節(jié)點“瞬時故障”的問題,同時考慮到各流量傳感器在正常使用情況下,其采集數(shù)據(jù)會在一個合理的范圍內(nèi)波動,可認(rèn)為不同時間窗內(nèi)的數(shù)據(jù)在其期望值附近做隨機波動,因此在進行K最近鄰屬性選擇上,本文選擇采用平均歐式距離作為最近鄰選擇依據(jù),綜合考慮各點數(shù)據(jù)的貢獻,避免依賴個別數(shù)據(jù)所造成的決策失衡。
在L個時間段內(nèi),計算傳感器v與傳感器u數(shù)據(jù)之間的平均歐氏距離為:
(3)
由均值定義可知,在數(shù)據(jù)采樣時間L足夠長的情況下,樣本均值近似等于期望值。即d(xu,xv)≈E[d(xu,xv)],對每個流量傳感器使用以上方法計算出目標(biāo)流量計與其他流量傳感器的歐氏距離,找出其平均歐氏距離最小的K個傳感器,作為與目標(biāo)傳感器u關(guān)聯(lián)密切的近鄰傳感器。
西南某天然氣輸送管道全長793 km,采用先進的SCADA(Supervisory Control And Data Acquisition)數(shù)據(jù)采集與監(jiān)視控制系統(tǒng),以實現(xiàn)數(shù)據(jù)采集、設(shè)備控制、測量、參數(shù)調(diào)節(jié)以及各類信號報警等各項功能[17]全線管道使用各類傳感器上千,本文以其中某一段的流量傳感器作為實驗數(shù)據(jù)采樣部分,采樣段共設(shè)有傳感器60個,測量數(shù)據(jù)以2 h為間隔采樣,在系統(tǒng)投入的初期可近似認(rèn)為各傳感器均能正常工作,能準(zhǔn)確測量對應(yīng)節(jié)點的流量,利用初期數(shù)據(jù)進行算法建模能夠準(zhǔn)確反應(yīng)出各傳感器的關(guān)聯(lián)特性,根據(jù)2013年10月20日到2014年1月20日的數(shù)據(jù)采集,除開人為檢修等個別因素,每個流量計共采集數(shù)據(jù)N=965個,設(shè)定時間窗長度T=24 h,則時間T內(nèi)每個樣本數(shù)m=12。
K值的選擇會對算法的結(jié)果產(chǎn)生較大的影響,K值過小,容易出現(xiàn)過擬合現(xiàn)象,造成目標(biāo)傳感器過度依賴某一近鄰傳感器的問題,K值過大,則容易增加算法的時間開銷,同時近似誤差增大,使得結(jié)果誤差率增加,使用交叉驗證方式對最優(yōu)K值進行選取,將傳感器數(shù)據(jù)均分成K組,將每個組的傳感器數(shù)據(jù)分別做一次驗證集,其余的K-1組的傳感器數(shù)據(jù)作為訓(xùn)練集,得到K個模型,用這K個模型最終的驗證集的平均誤差率作為確定K值的性能指標(biāo),通過對管道傳感器數(shù)據(jù)進行不同K值的實驗對比,其結(jié)果誤差平方和如圖1所示。
圖1 不同K值平方誤差和
由圖1可知,隨著K值增加,誤差平方和有逐漸增大趨勢。當(dāng)K=2時,取誤差平方和最小,綜合考慮,為避免出現(xiàn)過擬合現(xiàn)象,本文選擇K=3,計算得到每個目標(biāo)監(jiān)測點關(guān)聯(lián)最緊密的3監(jiān)測點,如表1所示。
表1 目標(biāo)傳感器的最近鄰
從表1結(jié)果還可以發(fā)現(xiàn),相互關(guān)聯(lián)的傳感器之間其實并不需要在地理位置上相鄰,例如目標(biāo)傳感器22#的3個近鄰傳感器39#、59#與6#。其中通過實地考察可知,傳感器22#與傳感器59#相距20 km。進行相關(guān)性分析可以發(fā)現(xiàn),39#、59#、6#傳感器與目標(biāo)傳感器22#的Pearson相關(guān)系數(shù)分別高達(dá)0.954、0.921、0.909,而與其他傳感器56#(K=4時所得近鄰傳感器)的相關(guān)系數(shù)只有0.832。
圖2分別展現(xiàn)了近鄰傳感器39#、59#、6#與目標(biāo)傳感器22#采集數(shù)據(jù)之間的相似性,同時與非關(guān)聯(lián)傳感器45#進行對比分析,可以較直觀看出近鄰傳感器與目標(biāo)傳感器之間的相似性。
圖2 監(jiān)測點22#、39#、59#、6#與非關(guān)聯(lián)檢測點45#數(shù)據(jù)曲線
2.1 傳感器支持度表示
通過前面的分析計算,得出目標(biāo)傳感器與近鄰傳感器在流量數(shù)據(jù)上的的關(guān)聯(lián)關(guān)系,簡單的關(guān)聯(lián)關(guān)系只能說明各關(guān)聯(lián)傳感器所測數(shù)據(jù)的變化趨勢的一致性,要得到目標(biāo)傳感器的準(zhǔn)確運行狀態(tài)和所測數(shù)據(jù)的有效性,還需要對各關(guān)聯(lián)傳感器進行支持度分析。所謂支持度,是指某段時間T內(nèi)目標(biāo)傳感器測得數(shù)據(jù)被其鄰近傳感器所測數(shù)據(jù)支持的程度。
由前面相似關(guān)聯(lián)性分析可知,在測量系統(tǒng)穩(wěn)定的情況下,各目標(biāo)傳感器與其中任意關(guān)聯(lián)傳感器在任意時間窗內(nèi)的歐式距離服從正態(tài)分布[16],根據(jù)正態(tài)分布3σ準(zhǔn)則特點,樣本值離期望值越近,出現(xiàn)概率越大,可認(rèn)為測量數(shù)據(jù)在與均值期望值的誤差在3σ之內(nèi)時,樣本數(shù)據(jù)可被接受[18],即當(dāng)近鄰傳感器與目標(biāo)傳感器數(shù)據(jù)之間向量距離與該時段均值距離|d(xu,xv)-E[d(xu,xv)]|≤3σ時,可認(rèn)為目標(biāo)傳感器受到鄰近傳感器的支持。
以近鄰流量傳感器與目標(biāo)流量傳感器數(shù)據(jù)向量之間的歐式距離與該時段兩者平均歐式距離之差Zi作為支持度函數(shù)變量:
zi=|d(x_u,x_v)-E[d(x_u,x_v)]|
(4)
當(dāng)zi越小,表明該近鄰傳感器對于目標(biāo)傳感器支持度越高,設(shè)定支持度函數(shù)表達(dá)式:
δi(i)=f(zi)
(5)
其中滿足
(6)式中:δl為設(shè)定的支持度置信閾值,即在歐式距離|d(xu,xv)-E(d(xu,xv))|>3σ時,認(rèn)為傳感器的有效性不受到該傳感器支持。為使式子滿足表達(dá)式(5)與(6)的要求,可令函數(shù)具體形式如式(7)所示
(7)
2.2 近鄰傳感器權(quán)值分配
表2 C4.5算法符號說明
Step 1 在流量傳感器正常使用,流量穩(wěn)定階段,統(tǒng)計目標(biāo)傳感器的最佳采樣基準(zhǔn)點個數(shù)Nui與普通采樣點Nuj,其中滿足i+j=N,依據(jù)x(vi|ui)與x(vj|ui)統(tǒng)計近鄰傳感器最佳采樣基準(zhǔn)點數(shù)目Nvi和普通采樣基準(zhǔn)點數(shù)目Nvj。
Step 2 將目標(biāo)傳感器中最佳采樣基準(zhǔn)點占全部采集數(shù)據(jù)比例pi=Nui/N與pj=Nui/N應(yīng)用于C4.5算法,計算信息熵:
info(Nu)=-pilog2(pi)-pilog2(pi)
(8)
Step 3 求解近鄰傳感器的期望熵:
(9)
Step 4 計算目標(biāo)傳感器與近鄰傳感器的信息增益,并計算出近鄰傳感器相對目標(biāo)傳感器的信息增益率:
GainK(U)=Info(Nu)-InfoK(Nu)
(10)
(11)
(12)
Step 5 根據(jù)決策樹分配權(quán)重,將K個近鄰傳感器的C4.5信息熵增益率進行歸一化處理,根據(jù)各自所占比例進行權(quán)重分配。
(13)
Step 6 在規(guī)定時間窗內(nèi),結(jié)合近鄰傳感器對目標(biāo)傳感器的支持度δi(i)加權(quán)計算目標(biāo)傳感器的數(shù)據(jù)有效性μu:
(14)
圖4 67#傳感器測試數(shù)據(jù)有效度曲線
管道系統(tǒng)作為整體性較強的體系,其進出口流量變化是統(tǒng)一的,出口統(tǒng)計流量與進口流量統(tǒng)計密切關(guān)聯(lián),將以上理論應(yīng)用到西南某管道運輸中時,在進行大量傳感器實驗數(shù)據(jù)分析與故障檢修日志對比研究后,依據(jù)數(shù)理統(tǒng)計制定得到適合當(dāng)前系統(tǒng)的傳感器故障診斷方案:即當(dāng)有效度μ=0.90以上,則認(rèn)為傳感器工作正常,采集數(shù)據(jù)有效。當(dāng)目標(biāo)傳感器有效度μ在0.7~0.9則認(rèn)為傳感器可能出現(xiàn)了一定程度的性能衰減,需對傳感器進行現(xiàn)場重新標(biāo)定檢修。對于有效度μ小于0.7,則可認(rèn)為傳感器出現(xiàn)故障,需要進行更換。選擇管道初期傳感器數(shù)據(jù)進行算法分析,得出目標(biāo)傳感器的K=3個近鄰傳感器,以及3個近鄰傳感器對于目標(biāo)傳感器的有效度權(quán)值分配。
圖3根據(jù)2014年6月流量數(shù)據(jù)日志所制作的100號傳感器平均有效度分布??梢园l(fā)現(xiàn),樣本中平均有效度主要分布主要在0.7~0.9之間,占到樣本總數(shù)63%,平均有效度在0.9以上占樣本總數(shù)30%,平均有效度在0.7以下占7%。
圖3 傳感器平均有效度分布
在后期傳感器采樣數(shù)據(jù)測試中,得到以下3種典型有效度圖例。
圖4表示67#傳感器在測試數(shù)據(jù)階段,有效度μ一直在0.9以上波動,表明了目標(biāo)傳感器工作正常,采集數(shù)據(jù)可信度較高,傳感器性能良好。
圖5表示23#傳感器在測試數(shù)據(jù)階段,有效度μ在0.8左右波動,可以發(fā)現(xiàn)目標(biāo)傳感器初期投入使用時,波動較小,采集數(shù)據(jù)可靠性較高,隨著傳感器使用時間增加,后續(xù)有效度波動較大,需要派遣人員實地考察,進行傳感器的修正。
圖6表示33#傳感器在測試數(shù)據(jù)階段,有效度已經(jīng)低于設(shè)定閾值0.7,查詢系統(tǒng)報修日志,發(fā)現(xiàn)在2014年1月19日,傳感器所在位置受到極端天氣影響,采集數(shù)據(jù)能力減弱,管理部門在發(fā)現(xiàn)問題后,經(jīng)過近一周排查,定位到故障傳感器,并于2014年1月25日派遣人員進行傳感器更換,更換后的傳感器使用正常。
圖5 23#傳感器測試數(shù)據(jù)有效度曲線
圖6 33#傳感器測試數(shù)據(jù)有效度曲線
利用不同地點傳感器所采集數(shù)據(jù)之間的關(guān)聯(lián)特性分析目標(biāo)傳感器所測數(shù)據(jù)的有效度,進而得出傳感器的運行狀態(tài),可以不受地域限制,特別適合管道運輸這種整體性較強的體系,運用C4.5算法分析計算各近鄰傳感器對目標(biāo)傳感器的有效性權(quán)值大小,避免傳統(tǒng)的僅根據(jù)向量距離進行權(quán)值設(shè)定所導(dǎo)致的局部最優(yōu),解決了K最近鄰算法在樣本失衡情況下誤差增大的缺點,通過融合不同近鄰傳感器對目標(biāo)傳感器的支持力度,能夠直觀的得到所測量數(shù)據(jù)的評價和測量傳感器性能變化,同時對目標(biāo)傳感器在時域上進行故障定位,方便了管理人員對于系統(tǒng)維護進行判斷。
在權(quán)值分配中采用的時域時間窗對各傳感器數(shù)據(jù)進行分析,所以在算法模型建立的時間窗內(nèi),傳感器數(shù)據(jù)的初期數(shù)據(jù)有效性越好,對于后面的測試數(shù)據(jù)算法就越精準(zhǔn)。
[1] 戚愛華.“十二五”我國油氣管道運輸發(fā)展趨勢分析[J]. 綜合運輸,2011(4):15-18.
[2] 肖嵩,林銘榮,王彥馨,等. 天然氣輸差控制與管理的探討[J]. 煤氣與熱力,2009,29(7):32-36.
[3] 高剛剛. 輸油管道泄漏檢測定位研究[D]. 西安:西安石油大學(xué),2015.
[4] OuldAhmedVall,Riley. A Distributed Fault-Tolerant Algorithm for Event Detection Using Heterogeneous Wireless Sensor Networks[J]. IEEE Transactions on Mobile Computing,2006,11(12):3634-3639.
[5] 蔣鵬. 一種改進的DFD無線傳感器網(wǎng)絡(luò)節(jié)點故障診斷算法研究[J]. 傳感技術(shù)學(xué)報,2008,21(8):1417-1421.
[6] 李宏,謝政,陳建二,等. 一種無線傳感器網(wǎng)絡(luò)分布式加權(quán)容錯檢測算法[J]. 系統(tǒng)仿真學(xué)報,2008,20(14):3750-3755.
[7] Tan R,Xing G,Wang J,et al. Exploiting Reactive Mobility for Collaborative Target Detection in Wireless Sensor Networks[J]. IEEE Transactions on Mobile Computing,2010,9(3):317-332.
[8] 何永強,張文欣,李可. 基于貝葉斯理論的傳感器網(wǎng)絡(luò)節(jié)點故障檢測方法[J]. 河南工程學(xué)院學(xué)報(自然科學(xué)版),2014(4):65-68.
[9] Lee S,Younis M. Optimized Relay Placement to Federate Segments in Wireless Sensor Networks[J]. IEEE Journal on Selected Areas in Communications,2010,28(5):742-752.
[10] Tao L Q,Yu F Q. Low-Jitter Slot Assignment Algorithm for Deadline-Aware Packet Transmission in Wireless Video Surveillance Sensor Networks[J]. International Journal of Communication Systems,2011,24(6):810-827.
[11] Khil S K E,Jlassi I,Estima J O,et al. Current Sensor Fault Detection and Isolation Method for PMSM Drives,Using Average Normalised Currents[J]. Electronics Letters,2016,52(17):1434-1436.
[12] 張健. 基于灰色預(yù)測的分布式傳感器網(wǎng)絡(luò)故障檢測方法[J]. 傳感技術(shù)學(xué)報,2015,28(8):1188-1193.
[13] 任克強,莊放望. 最短路徑距離矩陣修正的多維標(biāo)度定位算法[J]. 傳感技術(shù)學(xué)報,2016,29(1):129-135.
[14] 徐向華,周彪,萬健. 多傳感器網(wǎng)絡(luò)中的分布式故障檢測算法[J]. 傳感技術(shù)學(xué)報,2010,23(4):595-601.
[15] 王婉. 基于PCA的空調(diào)水系統(tǒng)的傳感器故障檢測與診斷研究[D]. 湖南:湖南大學(xué),2014.
[16] 黃曉微,陳偉民,章鵬,等. 基于K-最近鄰算法的撓度傳感器有效度研究[J]. 儀器儀表學(xué)報,2012,33(5):1090-1095.
[17] 張震,張勇. SCADA系統(tǒng)在中緬天然氣管道調(diào)控運行中的應(yīng)用[J]. 石油化工自動化,2015,51(3):25-28.
[18] 孫振綺,丁效華. 概率論與數(shù)理統(tǒng)計[M]. 北京:機械工業(yè)出版社,1995:53-56.
顧亞雄(1962-)男,教授,工學(xué)博士,碩士生導(dǎo)師,主要從事光電檢測技術(shù)與無損檢測技術(shù)等方面的教學(xué)與研究,835261911@qq.com;
鄧皓天(1993-)男,2015年就讀于西南石油大學(xué)機電工程學(xué)院,攻讀儀器科學(xué)與技術(shù)碩士學(xué)位,主要研究方向為傳感器測量,數(shù)據(jù)采集,神經(jīng)網(wǎng)絡(luò)等,201521000526@stu.swpu.edu.cn。
Fault Analysis of Pipeline System Sensor Based onK-Nearest Neighbor Algorithm
GU Yaxiong*,DENG Haotian
(School of mechanical and electrical engineering,Southwest Petroleum University,Chengdu 610500,China)
The normal use of the sensor in the pipeline transportation is very important. In order to prevent the data acquisition failure which caused by the sensor fault. The fault diagnosis and failure analysis of the sensor has become an important direction of the current research. Through the combination analysis of the data collected by the sensors,the data association characteristics between the sensors are used as the research content. TheK-nearest neighbor algorithm is used to fit the data that collected by the sensors of the pipeline. The C4.5 algorithm is proposed to define the support degree of each sensor to determine the target sensor data. To analyze and locate the fault sensor’s running state,and then to determine the data reliability and determine the location of the sensor. The experiment analysis the data of the pipeline flow sensors. The results show that the algorithm can accurately determine the effectiveness of the target sensor and the location of the fault sensor in the time domain.
multi sensors;data validity;association characteristics;KNN;C4.5 algorithm
2016-09-07 修改日期:2017-03-14
TP393
A
1004-1699(2017)07-1076-07
C:6150P
10.3969/j.issn.1004-1699.2017.07.018