鄒彤彤 楊 濤 周 勇 王仲平 余來(lái)斌 王東凱 肖 榮 出曉娟
(1、蘭州交通大學(xué)數(shù)理學(xué)院,甘肅 蘭州 730070 2、中國(guó)科學(xué)院海西研究院泉州裝備制造研究所,福建 泉州 362200 3、中國(guó)建筑第八工程局有限公司,上海 200000 4、中建八局有限公司南方公司,廣西 南寧 530022)
近年來(lái),隨著經(jīng)濟(jì)的高速發(fā)展,城市地下工程急劇增加,地面問(wèn)題日趨嚴(yán)重。在隧道開挖中,由于受到地下復(fù)雜的地質(zhì)工程條件、周邊環(huán)境、突發(fā)災(zāi)害以及人為破壞等因素的影響,會(huì)產(chǎn)生滲漏水、裂縫、斷面變形侵限、掉塊、襯砌錯(cuò)臺(tái)錯(cuò)縫、襯砌腐蝕劣化、凍害、震害、鋼筋鋼拱架銹蝕、道板隆起、拱頂坍塌等各種病害,造成人員傷亡及經(jīng)濟(jì)損失[1-2]。針對(duì)以上各種隧道病害,對(duì)隧道進(jìn)行地表變形監(jiān)測(cè)[3],了解場(chǎng)地地表及建筑物變形、沉降發(fā)展動(dòng)態(tài)、規(guī)律,為場(chǎng)地地基穩(wěn)定性鑒別和預(yù)測(cè)、預(yù)警提供依據(jù)是非常必要的[4]。但由于環(huán)境惡化,設(shè)備損壞等多種因素的影響,獲得的監(jiān)測(cè)數(shù)據(jù)中會(huì)存在很多與標(biāo)準(zhǔn)值(或期待值)有偏離的樣本,也就是說(shuō)與絕大部分?jǐn)?shù)據(jù)“長(zhǎng)的不一樣”的樣本,即異常值。傳統(tǒng)的異常監(jiān)測(cè)方法大多是由統(tǒng)計(jì)學(xué)界完成的,因其簡(jiǎn)單易操作等優(yōu)點(diǎn)在工程領(lǐng)域得到了廣泛的應(yīng)用,如胡碧輝等[5]用3σ 準(zhǔn)則和高斯過(guò)程回歸相結(jié)合的方法對(duì)變形異常數(shù)據(jù)進(jìn)行檢測(cè),李增良[6]用箱線圖法對(duì)盾構(gòu)地表變形數(shù)據(jù)進(jìn)行異常識(shí)別。但這種基于統(tǒng)計(jì)學(xué)的檢測(cè)方法主要是對(duì)數(shù)據(jù)做出一定假設(shè),并找出在此假設(shè)之下定義的“異?!保虼送鶗?huì)使用極值分析或假設(shè)檢驗(yàn),且可解釋性弱,具有一定的局限性。隨著數(shù)據(jù)收集技術(shù)的不斷更新,基于數(shù)據(jù)挖掘的異常檢測(cè)開始進(jìn)入大眾視野,并占據(jù)重要地位。各種算法開始廣泛應(yīng)用于異常檢測(cè)中,K-均值聚類算法(K nearest neighbors, KNN)[7]算法因其簡(jiǎn)單高效等諸多優(yōu)點(diǎn)得到了廣泛的應(yīng)用。
對(duì)于無(wú)數(shù)據(jù)標(biāo)簽的異常檢測(cè)問(wèn)題,本文提出了一種K 近鄰算法的無(wú)監(jiān)督異常檢測(cè)算法,并用該算法對(duì)岑溪至水汶高速公路均昌隧道地表變形監(jiān)測(cè)數(shù)據(jù)進(jìn)行異常檢測(cè)。
K 近鄰算法(K-Nearest Neighbor,KNN)是一種常見的分類算法,也常用于數(shù)據(jù)的異常檢測(cè)問(wèn)題中[8、9、10]。其基本思想是:給定測(cè)試樣本,基于某種距離度量找到訓(xùn)練集中與待分類樣本相似度最大的k 個(gè)訓(xùn)練樣本,然后基于這k 個(gè)近鄰樣本的類別信息采用投票方式確定待分類樣本的所屬類別,如圖1 所示,從內(nèi)到外k 值分別取k=1,k=3,k=5。k 的取值決定了待測(cè)樣本的類別,當(dāng)k=1 時(shí),待測(cè)樣本為正類,k=3 時(shí)待測(cè)樣本為負(fù)類,k=5 時(shí)待測(cè)樣本為正類[11]。具體算法原理如下:
圖1 k 近鄰分類器示意圖
式(1)中,I 為指示函數(shù),即當(dāng)yi=cj時(shí)I 為1,否則為0。
在建岑溪至水汶高速公路岑溪大隧道位于岑溪市岑城鎮(zhèn)釣石村及大隆鎮(zhèn)均昌村之間的崇山峻嶺,設(shè)計(jì)為分離式小凈距,凈空(孔- 寬×高)為1-10.75×5m,左線樁號(hào)DK6+455~DK10+725,設(shè)計(jì)高程為316.92~304.48m;右線樁號(hào)DK6+477~DK10+765,設(shè)計(jì)高程為317.03~303.84m,為特長(zhǎng)隧道。隧道穿越構(gòu)造中低山地貌單元,地面標(biāo)高250.00~806.00m,主要地層巖性為第四系沖洪積層粉質(zhì)粘土、卵石、飄石等和殘坡積層砂質(zhì)粘土;下伏基巖為混合巖(片麻狀花崗巖、片麻巖、石英巖等),分布有全風(fēng)化、強(qiáng)風(fēng)化、中風(fēng)化和微風(fēng)化層,見圖2。地質(zhì)構(gòu)造穩(wěn)定,地下埋藏淺,水量豐富。隧道中部從岑溪市岑城鎮(zhèn)山心村下部穿過(guò),村莊周圍地面距隧道頂最小距離約90m,屬于中低山剝蝕形成的小盆地,次生斷層密集,周邊匯水面積大,地表水塘及溪流密布,泉眼分布廣,地下水賦存淺、豐富,地表水與地下水相貫通。居民生活、生產(chǎn)用水為地表泉水和溪流。地表大部分民房為土坯房或簡(jiǎn)易磚混房,淺基礎(chǔ)或無(wú)基礎(chǔ),無(wú)圈梁或框架,地基土質(zhì)松散,修建年代比較久,存在不同程度的原生裂縫。
圖2 均昌隧道地質(zhì)剖面圖
2013 年9 月11 日6:30 左右,正在開挖作業(yè)的右洞CK7+838 掌子面出現(xiàn)股狀涌水,涌水口直徑開始約15cm,隨后增至80cm,初始涌水量約1000m3/h,最大突水量達(dá)1280m3/h,之后9 月12 日~21 日期間,涌水量保持700m3/h,累計(jì)涌水量達(dá)到25 萬(wàn)m3。同時(shí),同時(shí),災(zāi)害發(fā)生后,誘發(fā)地表塌陷、農(nóng)田損壞、房屋開裂、地表水干涸等次生災(zāi)害,如圖3。
圖3 突水災(zāi)害及誘發(fā)地表災(zāi)害情況
為了了解場(chǎng)地地表及建(構(gòu))筑物變形、沉降發(fā)展動(dòng)態(tài)、規(guī)律,為場(chǎng)地地基穩(wěn)定性鑒別和預(yù)測(cè)、預(yù)警提供依據(jù),在民房及道路基礎(chǔ)頂面、墻角設(shè)置23 個(gè)監(jiān)測(cè)點(diǎn)。剔除因環(huán)境干擾、監(jiān)測(cè)誤差等導(dǎo)致的數(shù)據(jù)異常,是保障數(shù)據(jù)可靠性的重要工作,見圖4。
圖4 沉降監(jiān)測(cè)點(diǎn)布置
用KNN 對(duì)每個(gè)監(jiān)測(cè)點(diǎn)分別進(jìn)行異常檢測(cè),檢測(cè)結(jié)果如表1所示,大部分監(jiān)測(cè)點(diǎn)的監(jiān)測(cè)樣本數(shù)均為62,在A 區(qū)異常占比最高的分別是A4 和A2,B 區(qū)中異常占比最高的是B1,C 區(qū)中異常占比最高的是C1,且從不同區(qū)域異常占比變化圖(圖5)可以看出,A 區(qū)的異常點(diǎn)主要分布在前五個(gè)監(jiān)測(cè)點(diǎn)中,越往后監(jiān)測(cè)效果越穩(wěn)定。B 區(qū)中第一個(gè)監(jiān)測(cè)點(diǎn)B1 異常占比為11.3%,相較于B1,監(jiān)測(cè)點(diǎn)B2 的異常占比有明顯的下降趨勢(shì),但由于該區(qū)所設(shè)監(jiān)測(cè)點(diǎn)較少,且B2 中的異常占比與其他監(jiān)測(cè)點(diǎn)相比也相對(duì)較高,所以在B 區(qū)域的監(jiān)測(cè)點(diǎn)設(shè)置需進(jìn)一步考察。C 區(qū)除第一個(gè)監(jiān)測(cè)點(diǎn)存在大量異常點(diǎn)外,其余監(jiān)測(cè)點(diǎn)的監(jiān)測(cè)數(shù)據(jù)異常分布情況相對(duì)趨于穩(wěn)定,監(jiān)測(cè)點(diǎn)C3 和C6 處獲得的監(jiān)測(cè)點(diǎn)異常占比最低,僅占3.2%,相較于A 區(qū),C 區(qū)異常占比在后面的監(jiān)測(cè)點(diǎn)中有緩慢上升的趨勢(shì)。
表1 各監(jiān)測(cè)點(diǎn)異常值占比
圖5 不同區(qū)域異常占比變化圖
對(duì)于無(wú)數(shù)據(jù)標(biāo)簽的隧道地表變形監(jiān)測(cè)數(shù)據(jù)的異常檢測(cè)問(wèn)題,本文提出了一種無(wú)監(jiān)督式的k 近鄰異常監(jiān)測(cè)算法,該算法從全局領(lǐng)域的角度出發(fā)找出偏離數(shù)據(jù)整體趨勢(shì)的點(diǎn)即異常點(diǎn)。將該算法應(yīng)用于岑溪至水汶高速公路岑溪大隧道的地表變形監(jiān)測(cè)數(shù)據(jù)中,對(duì)23 個(gè)監(jiān)測(cè)點(diǎn)分別進(jìn)行異常檢測(cè),并對(duì)不同區(qū)域的異常檢測(cè)結(jié)果進(jìn)行分析,發(fā)現(xiàn)A 區(qū)在監(jiān)測(cè)點(diǎn)A9,A10 兩個(gè)監(jiān)測(cè)點(diǎn)上效果更穩(wěn)定,C 區(qū)監(jiān)測(cè)點(diǎn)C3 和C6 處獲得的監(jiān)測(cè)點(diǎn)異常占比最低。