王蘇杭,王一棠,龐 勇,李一陽(yáng),宋學(xué)官
(大連理工大學(xué)機(jī)械工程學(xué)院,高性能精密制造全國(guó)重點(diǎn)實(shí)驗(yàn)室,遼寧大連 116024)
城市的地下空間被用于滿(mǎn)足日益增長(zhǎng)的交通、能源和電信的基建需求,而隧道是常見(jiàn)的地下空間利用方式之一[1-2]。盾構(gòu)機(jī)是一種集光電、機(jī)械、液壓、計(jì)算機(jī)技術(shù)為一體的數(shù)字化大型工程機(jī)械裝備[3-4],是隧道掘進(jìn)盾構(gòu)施工的核心,具有高效、安全和環(huán)保等優(yōu)點(diǎn),已廣泛應(yīng)用于國(guó)內(nèi)多個(gè)重點(diǎn)建設(shè)項(xiàng)目。為保障盾構(gòu)機(jī)安全、高效、平穩(wěn)運(yùn)行,其智能運(yùn)維系統(tǒng)將施工現(xiàn)場(chǎng)采集的實(shí)測(cè)掘進(jìn)數(shù)據(jù)進(jìn)行挖掘和分析,從而對(duì)盾構(gòu)機(jī)的性能進(jìn)行精準(zhǔn)預(yù)測(cè)。然而,由于施工現(xiàn)場(chǎng)環(huán)境復(fù)雜,實(shí)際采集的數(shù)據(jù)會(huì)存在異常值情況,嚴(yán)重降低數(shù)據(jù)的利用價(jià)值。
在隧道掘進(jìn)過(guò)程中,部署在盾構(gòu)機(jī)上的傳感器采集信號(hào),通過(guò)數(shù)字轉(zhuǎn)換和相應(yīng)的通信技術(shù),存儲(chǔ)到計(jì)算機(jī)或者服務(wù)器,即可得到盾構(gòu)機(jī)的實(shí)測(cè)數(shù)據(jù)。傳感器按照一定的采樣頻率采集信號(hào),所以盾構(gòu)機(jī)實(shí)測(cè)數(shù)據(jù)是嚴(yán)格的時(shí)間序列數(shù)據(jù)。時(shí)間序列數(shù)據(jù)的異常形式一般分為3類(lèi):點(diǎn)異常、模式異常和序列異常[5-6]。在盾構(gòu)機(jī)實(shí)測(cè)數(shù)據(jù)中,點(diǎn)異常出現(xiàn)較多,而模式異常和序列異常較少見(jiàn),因此點(diǎn)異常是研究的重點(diǎn)。
當(dāng)前,面向時(shí)間序列異常值檢測(cè)算法模型一般有基于預(yù)測(cè)[7]、基于統(tǒng)計(jì)[8-9]、基于機(jī)器學(xué)習(xí)和深度學(xué)習(xí)[10]、基于窗口等方法[11-12]?;诖翱诘姆椒ㄍㄟ^(guò)設(shè)計(jì)滑動(dòng)窗口的大小對(duì)時(shí)間序列進(jìn)行分割,對(duì)各子時(shí)間序列進(jìn)行特征提取,在各子時(shí)間序列中定位異常值點(diǎn)。與其他方法相比,該類(lèi)方法易于理解且計(jì)算簡(jiǎn)單,降低了時(shí)間復(fù)雜度,并且能將動(dòng)態(tài)的數(shù)據(jù)量靜態(tài)化[13],因此得到廣泛的應(yīng)用。戴慧等[14]提出了一種基于滑動(dòng)窗口的由粗到細(xì)的兩階段探測(cè)策略,采用子時(shí)間序列的均值和方差作為子時(shí)間序列的特征信息,實(shí)現(xiàn)了對(duì)某變電站各設(shè)備表采集數(shù)據(jù)的異常值檢測(cè)。高熠飛等[15]計(jì)算窗口內(nèi)子時(shí)間序列的中位數(shù)以及中位數(shù)絕對(duì)偏差作為子時(shí)間序列的特征信息,較好地消除了滑動(dòng)窗口內(nèi)極端異常值對(duì)算法的影響,實(shí)現(xiàn)了對(duì)水文序列異常值的檢測(cè)。唐向紅等[16]計(jì)算子時(shí)間序列內(nèi)相鄰兩點(diǎn)的斜率與設(shè)定的斜率范圍進(jìn)行比較,實(shí)現(xiàn)了對(duì)電流信號(hào)的檢測(cè)?;跀?shù)據(jù)斜率的方式能較準(zhǔn)確描述子時(shí)間序列的結(jié)構(gòu)特征,但工程數(shù)據(jù)中異常數(shù)據(jù)分布隨機(jī)性大、波動(dòng)性大,導(dǎo)致傳統(tǒng)的基于斜率的檢測(cè)方法對(duì)數(shù)據(jù)形態(tài)信息利用不充分,而置信區(qū)間能夠以一定的可靠程度估計(jì)總體數(shù)據(jù)所在的區(qū)間。田騰等[17]采用基于子時(shí)間序列斜率的置信區(qū)間的方式進(jìn)行特征提取,對(duì)盾構(gòu)機(jī)掘進(jìn)速度的異常值檢測(cè)取得了良好的效果。陸秋琴等[18]同樣采用斜率的置信區(qū)間距離半徑對(duì)污染物子序列特征進(jìn)行提取,實(shí)現(xiàn)了對(duì)傳感器數(shù)據(jù)采集中異常值的檢測(cè)。但其對(duì)子時(shí)間序列斜率的置信區(qū)間半徑計(jì)算上,采用了傳統(tǒng)方式,運(yùn)算效率有待改進(jìn)。因此,本文采用一種基于滑動(dòng)窗口提取子時(shí)間序列特征的異常值檢測(cè)方法,采用快速計(jì)算的方式得到子時(shí)間序列斜率的置信距離半徑作為特征,能夠有效利用序列特征進(jìn)行異常識(shí)別,提高了運(yùn)算效率。同時(shí)對(duì)檢測(cè)出的異常值,提出了基于多子時(shí)間序列的填補(bǔ)方法。
所提方法分為異常值檢測(cè)和修正2部分。其中異常值檢測(cè)部分有2個(gè)階段,第1階段是異常子時(shí)間序列檢測(cè),采用滑動(dòng)窗口的方法將未處理的盾構(gòu)機(jī)實(shí)測(cè)數(shù)據(jù)劃分成若干個(gè)子時(shí)間序列,隨后提取子時(shí)間序列的特征,若該特征超過(guò)設(shè)定的閾值,則認(rèn)為該序列為異常子時(shí)間序列;第2階段是采用局部離群因子(local outlier factor,LOF)算法檢測(cè)異常子時(shí)間序列中的異常值。異常值修正部分是對(duì)異常子序列中正常值點(diǎn)采用最小二乘法建立線性回歸模型,預(yù)測(cè)異常值點(diǎn)數(shù)值,最終異常值點(diǎn)數(shù)值取多個(gè)異常子時(shí)間序列預(yù)測(cè)值的均值。
一條時(shí)間長(zhǎng)度為n的時(shí)間序列表示為
X(t)=(x(t1),x(t2),…,x(tn))
式中x(ti)(1≤i≤n)為ti時(shí)刻記錄的數(shù)據(jù),采集時(shí)間ti是嚴(yán)格遞增的。
采用長(zhǎng)度為w(w?n)的滑動(dòng)窗口對(duì)該時(shí)間序列進(jìn)行等長(zhǎng)度分割,步長(zhǎng)為r,連續(xù)滑動(dòng)(n-w)/r次,則會(huì)形成((n-w)/r)+1個(gè)長(zhǎng)度為w的子時(shí)間序列。
1.1.1 直接方法提取子時(shí)間序列特征
假設(shè)時(shí)間序列X(t)的某一個(gè)子時(shí)間序列表示為Xj(1≤j (1) (2) (3) 這樣就可計(jì)算第j個(gè)子時(shí)間序列斜率的置信區(qū)間半徑為 (4) (5) (6) 式中:Z為滿(mǎn)足N(0,1)的正態(tài)分布隨機(jī)變量;α為置信水平,本文取α=0.05。 1.1.2 快速方法計(jì)算子時(shí)間序列斜率均值和均方差 子時(shí)間序列特征值提取的關(guān)鍵在于相鄰兩點(diǎn)斜率的求值k(i),以及后續(xù)斜率的均值和均方差的計(jì)算。通常情況下時(shí)間序列會(huì)有較大的長(zhǎng)度n,從而就會(huì)有(n-w+1)·(w-1)次斜率的計(jì)算量,以及(n-w+1)個(gè)滑動(dòng)窗口的斜率均值和均方差的計(jì)算量,因此研究如何提高數(shù)據(jù)的運(yùn)算效率是非常有必要的。 第j個(gè)子時(shí)間序列任意兩點(diǎn)之間斜率的和與第(j+1)個(gè)子時(shí)間序列任意兩點(diǎn)之間斜率的和之間的關(guān)系為 (7) 故第(j+1)個(gè)子時(shí)間序列只需計(jì)算k(j+w)即可。 (8) (9) 式(9)中的分子,由式(8)可得: (10) 將式(10)帶入式(9)可得: (11) 式(7)、式(8)和式(11)給出了前后2個(gè)子時(shí)間序列斜率、斜率均值和斜率均方差之間的關(guān)系,通過(guò)前一個(gè)子時(shí)間序列的斜率、斜率均值和斜率均方差計(jì)算當(dāng)前子時(shí)間序列的斜率、斜率均值和斜率均方差,會(huì)比直接計(jì)算更迅速。由表1可知,所提出的快速計(jì)算方法與滑動(dòng)窗口長(zhǎng)度w無(wú)關(guān),且明顯優(yōu)于直接計(jì)算方法。 表1 直接計(jì)算和快速計(jì)算的時(shí)間復(fù)雜度 得到子時(shí)間序列的特征,即斜率的置信區(qū)間半徑,若該半徑大于閾值γ,則認(rèn)為該子時(shí)間序列為異常子時(shí)間序列,其中包含異常值,具體的異常值信息需進(jìn)一步分析。 根據(jù)以上描述,異常子時(shí)間序列檢測(cè)的步驟可總結(jié)如下: 輸入:長(zhǎng)度為n的時(shí)間序列,滑動(dòng)窗口長(zhǎng)度w,異常子時(shí)間序列判斷閾值γ。 輸出:異常子時(shí)間序列和正常子時(shí)間序列。 (1)使用長(zhǎng)度為w的滑動(dòng)窗口對(duì)時(shí)間序列X(t)進(jìn)行等長(zhǎng)度劃分,步長(zhǎng)為1,得到若干個(gè)子時(shí)間序列Xj(1≤j≤n-w+1); (4)將子時(shí)間序列斜率的置信區(qū)間半徑與閾值γ進(jìn)行比較,初步確定含有異常值的異常子時(shí)間序列。 針對(duì)每個(gè)檢測(cè)出的異常子時(shí)間序列,采用LOF算法[19-20]計(jì)算每個(gè)數(shù)據(jù)點(diǎn)的離群因子,以此來(lái)識(shí)別異常值。 設(shè)異常子時(shí)間序列為Xl(1≤l≤n-w+1),LOF算法首先計(jì)算每個(gè)數(shù)據(jù)點(diǎn)的可達(dá)距離,通過(guò)可達(dá)距離計(jì)算數(shù)據(jù)點(diǎn)的局部可達(dá)密度,進(jìn)一步計(jì)算出數(shù)據(jù)點(diǎn)的局部離群因子。數(shù)據(jù)點(diǎn)的局部離群因子越大于1,說(shuō)明該數(shù)據(jù)點(diǎn)的密度比其鄰域內(nèi)點(diǎn)的平均密度小,該數(shù)據(jù)點(diǎn)越可能是一個(gè)異常值點(diǎn),反之,則說(shuō)明該數(shù)據(jù)點(diǎn)是正常點(diǎn)。在本方法中,計(jì)算出異常子數(shù)據(jù)序列中每個(gè)數(shù)據(jù)點(diǎn)的局部離群因子,采用離群因子中最大值的1/2作為閾值,若一個(gè)數(shù)據(jù)點(diǎn)的離群因子大于閾值,則為異常值點(diǎn),反之,則為正常點(diǎn)。 點(diǎn)p,o∈Xl,采用式(12)計(jì)算出點(diǎn)p到點(diǎn)o的第k可達(dá)距離,即: RDk(p,o)=max{k-distance(o),dist(p,o)} (12) 式中:k-distance(o)為點(diǎn)o的K-鄰近距離,是指距待測(cè)樣本點(diǎn)o的最近幾個(gè)樣本中,第k個(gè)最近的樣本點(diǎn)跟待測(cè)檢測(cè)點(diǎn)o之間的距離;dist(p,o)為點(diǎn)p到點(diǎn)o的歐式距離。 (13) 式中N為數(shù)據(jù)點(diǎn)的維度。 由式(14)計(jì)算點(diǎn)p的局部可達(dá)密度為 (14) 式中|Ndistance(p)|為到點(diǎn)p的距離小于k-distance(p)的集合。 由式(15)計(jì)算點(diǎn)p的局部離群因子為 (15) 根據(jù)以上描述,LOF算法檢測(cè)異常值步驟可總結(jié)如下: 輸入:異常子時(shí)間序列Xl。 輸出:異常子時(shí)間序列中的異常值。 (1)使用式(15)計(jì)算異常子時(shí)間序列中每個(gè)數(shù)據(jù)點(diǎn)的局部離群因子; (2)選取局部離群因子中最大值的1/2作為閾值ρ; (3)將每個(gè)數(shù)據(jù)點(diǎn)的離群因子與閾值ρ進(jìn)行比較,若大于閾值,則該數(shù)據(jù)點(diǎn)為異常值,否則為正常值。 最小二乘法[21](least square method,LSM)是通過(guò)最小化模型輸出與真實(shí)值之間的誤差平方和計(jì)算樣本點(diǎn)的最佳匹配模型,在線性回歸中,就是試圖尋找到一條直線,使得所有樣本點(diǎn)到直線上的歐式距離之和最小。 在1.2節(jié)中LOF算法從異常子時(shí)間序列中檢測(cè)出具體的異常值點(diǎn),對(duì)異常子時(shí)間序列中正常值點(diǎn)采用最小二乘法,建立線性回歸模型,預(yù)測(cè)異常值點(diǎn)位置的數(shù)值。本方法中滑動(dòng)窗口步長(zhǎng)r=1,所以異常值點(diǎn)存在于多個(gè)子時(shí)間序列中,記錄異常值點(diǎn)在盾構(gòu)機(jī)實(shí)測(cè)數(shù)據(jù)中的索引。若異常值填補(bǔ)數(shù)據(jù)集中無(wú)此索引,則創(chuàng)建該索引和記錄該子時(shí)間序列中預(yù)測(cè)異常值點(diǎn)的數(shù)值;否則,直接記錄該索引位置點(diǎn)的預(yù)測(cè)值。所有子時(shí)間序列檢測(cè)完后,每個(gè)異常值點(diǎn)的最終預(yù)測(cè)值取其在多個(gè)異常子時(shí)間序列中的預(yù)測(cè)值均值。 根據(jù)以上描述,基于多子時(shí)間序列的異常值填補(bǔ)步驟可總結(jié)如下: 輸入:異常子時(shí)間序列Xl和異常子時(shí)間序列中的異常值。 輸出:異常值填補(bǔ)數(shù)據(jù)集。 (1)對(duì)輸入的異常子時(shí)間序列中的正常值采用最小二乘法預(yù)測(cè)異常值點(diǎn)的數(shù)值; (2)記錄異常值點(diǎn)在盾構(gòu)機(jī)實(shí)測(cè)數(shù)據(jù)中的索引,若異常值填補(bǔ)數(shù)據(jù)集中無(wú)該異常值點(diǎn)索引,則創(chuàng)建該索引和記錄預(yù)測(cè)后的數(shù)值,否則,直接記錄該索引位置點(diǎn)的預(yù)測(cè)值; (3)若該子時(shí)間序列是最后子時(shí)間序列,計(jì)算異常值填補(bǔ)數(shù)據(jù)集中每個(gè)異常值點(diǎn)的多個(gè)子時(shí)間序列預(yù)測(cè)數(shù)值的均值,作為該異常值點(diǎn)最終的填補(bǔ)數(shù)據(jù);否則,返回1.1節(jié)異常子時(shí)間序列檢測(cè)中步驟(4)。 完整的盾構(gòu)機(jī)實(shí)測(cè)數(shù)據(jù)點(diǎn)異常處理方法流程圖如圖1所示。 圖1 盾構(gòu)機(jī)實(shí)測(cè)數(shù)據(jù)點(diǎn)異常處理方法流程圖 為了評(píng)價(jià)所提出方法的性能,點(diǎn)異常值檢測(cè)和異常值填補(bǔ)采用不同的指標(biāo)衡量。點(diǎn)異常值檢測(cè)采用召回率R和準(zhǔn)確率P,其數(shù)值越大,說(shuō)明方法檢測(cè)性能越好,計(jì)算公式下: (16) (17) 異常值填補(bǔ)采用決定系數(shù)R2(coefficient of determination),其數(shù)值越接近1,表明填充性能越好,計(jì)算公式如下: (18) 為了驗(yàn)證所提方法的有效性和實(shí)用性,通過(guò)所收集的盾構(gòu)機(jī)實(shí)測(cè)數(shù)據(jù)集進(jìn)行檢驗(yàn)。該數(shù)據(jù)來(lái)源于某城市地鐵修建中的隧道施工標(biāo)段,此隧道前段和后端選用盾構(gòu)掘進(jìn)施工,中段的硬巖階段選用傳統(tǒng)的礦山法施工。在盾構(gòu)掘進(jìn)施工過(guò)程中,隧道掘進(jìn)裝備為土壓平衡式盾構(gòu)機(jī),其主要系統(tǒng)參數(shù)如表2所示。 表2 盾構(gòu)機(jī)主要系統(tǒng)參數(shù) 搭載在該盾構(gòu)機(jī)的數(shù)據(jù)采集系統(tǒng)采樣頻率為1次/s。在掘進(jìn)過(guò)程中,傳感器采集了刀盤(pán)系統(tǒng)、土倉(cāng)系統(tǒng)、推進(jìn)系統(tǒng)等子系統(tǒng)運(yùn)行參數(shù)的實(shí)測(cè)數(shù)據(jù)。 從盾構(gòu)機(jī)實(shí)測(cè)數(shù)據(jù)集中選取88環(huán)段分段運(yùn)行數(shù)據(jù)進(jìn)行試驗(yàn)驗(yàn)證。88環(huán)段包含1 605個(gè)數(shù)據(jù)樣本,選取盾構(gòu)機(jī)推力作為分析對(duì)象。在源數(shù)據(jù)中隨機(jī)插入20個(gè)異常值點(diǎn),異常值位置依次是6、37、120、221、361、405、506、607、685、749、802、900、1 006、1 094、1 212、1 249、1 324、1 427、1 518、1 595。 本文使用的計(jì)算機(jī)配置為Windows10操作系統(tǒng),處理器為Intel(R) Core(TM) i7-6700 CPU @ 3.40 GHz,編程語(yǔ)言為Python3.6.13。 在試驗(yàn)前對(duì)源數(shù)據(jù)采用最小-最大規(guī)范化處理,公式如下: (19) 式中:n為盾構(gòu)機(jī)實(shí)測(cè)數(shù)據(jù)的數(shù)量;min(X)為盾構(gòu)機(jī)實(shí)測(cè)數(shù)據(jù)的最小值;max(X)為盾構(gòu)機(jī)實(shí)測(cè)數(shù)據(jù)的最大值。 滑動(dòng)窗口長(zhǎng)度為7,步長(zhǎng)為1,計(jì)算各子時(shí)間序列斜率置信區(qū)間半徑,最優(yōu)閾值設(shè)為γ=0.04,如圖2所示。將置信區(qū)間半徑大于閾值的子時(shí)間序列設(shè)為異常子時(shí)間序列,如圖3所示。每個(gè)被檢測(cè)出的異常子時(shí)間序列,采用LOF算法識(shí)別點(diǎn)異常值,如圖4所示。 圖2 子時(shí)間序列斜率置信區(qū)間半徑 圖3 檢測(cè)出的異常子時(shí)間序列 圖4 檢測(cè)出的異常值點(diǎn) 用準(zhǔn)確率、召回率指標(biāo)和執(zhí)行時(shí)間衡量不同算法的檢測(cè)結(jié)果,將AD-SV-LOF、AD-SV-GG、AD-Variance-LOF、原LOF算法與本文方法進(jìn)行比較。AD-SV-LOF方法與本文方法都是使用子時(shí)間序列斜率置信區(qū)間半徑作為該子時(shí)間序列的特征,但在計(jì)算過(guò)程中,AD-SV-LOF方法采用直接計(jì)算的方式,本文方法采用快速計(jì)算的方式。AD-SV-GG方法在異常子識(shí)別序列識(shí)別階段與本方法相同,但在異常值識(shí)別中采用了Gath-Geva聚類(lèi)算法,AD-Variance-LOF方法在對(duì)異常子時(shí)間序列識(shí)別中選擇傳統(tǒng)的置信區(qū)間閾值判斷。采用10次重復(fù)實(shí)驗(yàn),各項(xiàng)指標(biāo)取其均值,結(jié)果如表3所示。 表3 異常檢測(cè)結(jié)果比較 在識(shí)別異常子時(shí)間序列時(shí),本文方法采用子時(shí)間序列斜率的置信區(qū)間半徑作為子時(shí)間序列的特征,能夠較好地反映該子時(shí)間序列的變化特征,而AD-Variance-LOF方法采用子時(shí)間序列的均值和方差描述該子時(shí)間序列的結(jié)構(gòu)特征變化情況,不能很好反映子時(shí)間序列特征,因此,在召回率R、準(zhǔn)確率P評(píng)價(jià)指標(biāo)數(shù)值上低于本文方法。AD-SV-GG方法在異常值檢測(cè)階段采用Gath-Geva聚類(lèi)算法,Gath-Geva算法的結(jié)果會(huì)受隨機(jī)生成的初始矩陣影響[17],只能給出是不是異常值點(diǎn)的判斷,相比較而言,基于密度的LOF算法通過(guò)給每個(gè)數(shù)據(jù)點(diǎn)都分配一個(gè)依賴(lài)于鄰域密度的離群因子,進(jìn)而判斷該數(shù)據(jù)點(diǎn)是否為離群點(diǎn),因此本文方法的評(píng)價(jià)指標(biāo)優(yōu)于AD-SV-GG方法。相對(duì)于傳統(tǒng)的LOF算法,本文方法在檢測(cè)過(guò)程中考慮到了時(shí)間序列數(shù)據(jù)的結(jié)構(gòu)變化特征,先識(shí)別異常子時(shí)間序列,再使用LOF算法,因此本文方法的準(zhǔn)確率和召回率均優(yōu)于原LOF算法。 AD-Variance-LOF方法對(duì)當(dāng)前窗口子時(shí)間序列進(jìn)行初步斷定時(shí),采用的子時(shí)間序列是均值和方差,該方法簡(jiǎn)單且運(yùn)行成本低,所以執(zhí)行時(shí)間小于本文方法。AD-SV-LOF在提取子時(shí)間序列特征時(shí)均采用了直接方法,而本文方法采用了快速方法計(jì)算子時(shí)間序列的均值和方差,快速計(jì)算方法時(shí)間復(fù)雜度與滑動(dòng)窗口長(zhǎng)度無(wú)關(guān),隨著數(shù)據(jù)量的增大,優(yōu)勢(shì)越大,所以執(zhí)行時(shí)間比AD-SV-LOF方法少了約0.02 s,但在實(shí)際施工過(guò)程中,采集的盾構(gòu)機(jī)運(yùn)行數(shù)據(jù)量巨大,本文方法的優(yōu)勢(shì)會(huì)進(jìn)一步得到體現(xiàn)。 綜合以上結(jié)果分析,本文方法能夠更好地反映窗口內(nèi)子時(shí)間序列的形態(tài)信息以及內(nèi)在變化特征,因此本文方法在召回率R、準(zhǔn)確率P評(píng)價(jià)指標(biāo)數(shù)值上均優(yōu)于其余 4 種方法。盡管計(jì)算成本相比較于AD-Variance-LOF方法有所提升,考慮到本文方法具有較好的異常識(shí)別率,且對(duì)子時(shí)間序列特征采用了快速計(jì)算方式,提高了計(jì)算效率,故所提出的方法依舊具有較好的實(shí)用性。 最后采用基于多子時(shí)間序列對(duì)異常值進(jìn)行填補(bǔ),如圖5所示,填補(bǔ)結(jié)果的決定系數(shù)R2大于0.9,達(dá)到了預(yù)期。 圖5 多子時(shí)間序列異常值填補(bǔ) 為進(jìn)一步驗(yàn)證本文所提方法在盾構(gòu)機(jī)實(shí)測(cè)數(shù)據(jù)的適用性,選取盾構(gòu)機(jī)其他重要的2個(gè)參數(shù),即推進(jìn)速度和刀盤(pán)扭矩分別進(jìn)行試驗(yàn)驗(yàn)證。推力、推進(jìn)速度和刀盤(pán)轉(zhuǎn)矩是3種不同的物理量,且具有不同的運(yùn)行趨勢(shì)。同樣的,對(duì)這2種參數(shù)隨機(jī)插入異常值點(diǎn),用本文方法進(jìn)行檢測(cè)和修正試驗(yàn)結(jié)果如表4所示。由表4數(shù)據(jù)可知,本文方法在盾構(gòu)機(jī)其他參數(shù)的處理上均取得良好結(jié)果,滿(mǎn)足了工程數(shù)據(jù)要求。 表4 盾構(gòu)機(jī)其他參數(shù)處理結(jié)果 本文針對(duì)盾構(gòu)機(jī)實(shí)測(cè)數(shù)據(jù)中產(chǎn)生的點(diǎn)異常值進(jìn)行處理,提出了一種基于滑動(dòng)窗口的時(shí)間序列異常檢測(cè)方法,通過(guò)快速方法計(jì)算子時(shí)間序列的斜率置信區(qū)間半徑并識(shí)別異常子時(shí)間序列,再使用LOF算法對(duì)異常子時(shí)間序列進(jìn)行異常值檢測(cè)。試驗(yàn)結(jié)果表明:與以子時(shí)間序列均值和方差信息提取子時(shí)間序列特征的檢測(cè)方法和原LOF算法相比,本文方法提高了檢測(cè)精度;與直接計(jì)算子時(shí)間斜率置信區(qū)間半徑的方法相比,本文方法提高了運(yùn)算效率。針對(duì)檢測(cè)出的異常值點(diǎn),采用基于多子時(shí)間序列對(duì)異常值進(jìn)行填補(bǔ),試驗(yàn)結(jié)果表明,填補(bǔ)效果達(dá)到了預(yù)期。本文的點(diǎn)異常值檢測(cè)和修正方法能夠滿(mǎn)足工程數(shù)據(jù)的處理要求,但對(duì)點(diǎn)異常值的產(chǎn)生原因尚未研究,因此下一步將結(jié)合盾構(gòu)機(jī)實(shí)測(cè)數(shù)據(jù)的空間相關(guān)性對(duì)點(diǎn)異常值產(chǎn)生原因進(jìn)行研究。1.2 LOF算法檢測(cè)異常值
1.3 基于多子時(shí)間序列的異常值填補(bǔ)
1.4 評(píng)價(jià)指標(biāo)
2 試驗(yàn)結(jié)果及其分析
2.1 盾構(gòu)機(jī)實(shí)測(cè)數(shù)據(jù)基本情況及試驗(yàn)設(shè)置
2.2 盾構(gòu)機(jī)實(shí)測(cè)數(shù)據(jù)驗(yàn)證
3 結(jié)束語(yǔ)