鄭茂輝,劉少非,,柳婭楠,李浩楠
(1.同濟(jì)大學(xué) 上海防災(zāi)救災(zāi)研究所,上海 200092;2.同濟(jì)大學(xué)土木工程學(xué)院,上海 200092)
隨著城市地下管道設(shè)施規(guī)模的不斷擴(kuò)大和服役年限的增長(zhǎng),管道老化和運(yùn)行安全問(wèn)題得到越來(lái)越多的研究和關(guān)注[1-2]。城市排水管道狀況評(píng)價(jià)是制定管網(wǎng)養(yǎng)護(hù)計(jì)劃和修復(fù)計(jì)劃的重要依據(jù),也是城市安全監(jiān)管的重要內(nèi)容之一。
排水管道狀況包括結(jié)構(gòu)性狀況和功能性狀況兩方面,它們分別描述管道內(nèi)部結(jié)構(gòu)性缺陷類型、等級(jí),以及管道過(guò)流受阻等水力狀況[3]。CCTV(closed circuit television,管道內(nèi)窺檢測(cè))是目前國(guó)內(nèi)外排水管道檢測(cè)評(píng)估先進(jìn)、有效的技術(shù)手段,其關(guān)鍵內(nèi)容就是對(duì)管道影像數(shù)據(jù)信息的判讀,包括確定內(nèi)部缺陷種類、位置表述、等級(jí)和狀況評(píng)估計(jì)算。由于CCTV檢測(cè)成本高昂,通常只是針對(duì)城市特定區(qū)域或運(yùn)行年限較長(zhǎng)的排水管道設(shè)施。而對(duì)于其他缺乏檢測(cè)資料的城市管道網(wǎng)絡(luò),其健康狀況診斷和病害趨勢(shì)預(yù)判等則亟待更多深入的研究。近些年,國(guó)內(nèi)外學(xué)者采用隨機(jī)統(tǒng)計(jì)和機(jī)器學(xué)習(xí)方法研究建立了多種管道狀況模型,如多元回歸模型[4-6]、馬爾科夫鏈模型[7-9]、神經(jīng)網(wǎng)絡(luò)模型[10-12],等等。鑒于管道老化因素眾多、過(guò)程復(fù)雜,數(shù)據(jù)驅(qū)動(dòng)的神經(jīng)網(wǎng)絡(luò)模型無(wú)需深入理解老化機(jī)理,只要通過(guò)數(shù)據(jù)樣本監(jiān)督學(xué)習(xí)即可建立管道狀況同相關(guān)特征變量的關(guān)聯(lián)模式,無(wú)疑具有更好的適用性和應(yīng)用前景[10]。
極限學(xué)習(xí)機(jī)(extreme learning machine,ELM)是Huang等[13]基于廣義逆矩陣?yán)碚撎岢龅囊环N單隱含層前饋神經(jīng)網(wǎng)絡(luò)的監(jiān)督型學(xué)習(xí)算法。本文充分利用ELM計(jì)算速度快、泛化性能好的特點(diǎn),將粒子群優(yōu)化(particle swarm optimization,PSO)[14]方法與其相結(jié)合,選擇最優(yōu)的網(wǎng)絡(luò)參數(shù),建立一個(gè)適用于城市排水管道狀況評(píng)價(jià)的分類器模型,并以上海市洋山港保稅區(qū)排水管網(wǎng)為例進(jìn)行實(shí)證研究,驗(yàn)證模型方法的合理性。
設(shè)n、L、m分別為輸入層、隱含層和輸出層的節(jié)點(diǎn)數(shù)。給定N組任意的樣本(xi,ti)∈Rn×Rm,ELM算法的輸出函數(shù)可以表示為
式中:g(x)為激勵(lì)函數(shù);wi=[wi1wi2…win]T,表示隱含層第i個(gè)神經(jīng)元與輸入層的連接權(quán)值;βi=[βi1βi2…βim]T,表示隱含層第i個(gè)神經(jīng)元與輸出層的連接權(quán)值;bi是隱含層神經(jīng)元的閾值;wi·xj表示wi和xj的內(nèi)積。
假定訓(xùn)練樣本數(shù)量N與隱含層神經(jīng)元節(jié)點(diǎn)數(shù)L相等,則對(duì)于任意給定的βi和wi,ELM能零誤差逼近學(xué)習(xí)樣本[13],即
將其以矩陣形式表達(dá)為
其中
對(duì)ELM的網(wǎng)絡(luò)訓(xùn)練等價(jià)于如下優(yōu)化問(wèn)題:
當(dāng)g(x)無(wú)限可微時(shí),隨機(jī)給定網(wǎng)絡(luò)參數(shù)wi和bi,ELM模型訓(xùn)練過(guò)程可看作求解線性系統(tǒng)Hβ=T關(guān)于的最小二乘解
式中:H+為隱含層輸出矩陣H的Moore-Penrose廣義逆。
ELM模型隨機(jī)生成輸入權(quán)值矩陣和隱含層神經(jīng)元的閾值,無(wú)需迭代調(diào)整就可以解析計(jì)算得出網(wǎng)絡(luò)輸出值。不過(guò)參數(shù)隨機(jī)產(chǎn)生使結(jié)果存在一定的隨機(jī)性[15],容易產(chǎn)生較差的分類效果。本文結(jié)合PSO算法,優(yōu)化ELM網(wǎng)絡(luò)參數(shù)wi和bi,以改善ELM算法輸出權(quán)值βi不穩(wěn)定的缺點(diǎn)。
PSO算法是一種模擬鳥(niǎo)群覓食行為的群體智能優(yōu)化算法,其核心是粒子更新速度和位置,即
式中:pi表示粒子的個(gè)體最優(yōu)位置;gi表示搜索到的群體最優(yōu)位置;ωmax和ωmin分別為慣性權(quán)重的最大值和最小值;c1和c2均為學(xué)習(xí)因子,也稱為加速常數(shù);r1和r2為[0,1]范圍內(nèi)的均勻隨機(jī)數(shù);tmax和t分別為最大迭代次數(shù)和當(dāng)前的迭代次數(shù)。
將ELM輸入權(quán)值wi和隱含層神經(jīng)元偏置bi作為PSO算法的粒子,以極限學(xué)習(xí)機(jī)訓(xùn)練集的均方根誤差作為適應(yīng)度函數(shù),計(jì)算每個(gè)粒子的適應(yīng)度值,通過(guò)比較不斷更新粒子的速度和位置,直至達(dá)到最小誤差或最大迭代次數(shù),得到經(jīng)過(guò)PSO優(yōu)化的ELM網(wǎng)絡(luò)參數(shù)。
影響排水管道結(jié)構(gòu)性狀況的因素較多。為了簡(jiǎn)化網(wǎng)絡(luò)模型,根據(jù)文獻(xiàn)[6],選取管材、管齡、管徑、埋深、管長(zhǎng)、坡度和所在道路類型7項(xiàng)影響因素,作為管道結(jié)構(gòu)性狀況評(píng)價(jià)的輸入向量,以CCTV檢測(cè)結(jié)果中管道修復(fù)指數(shù)(RI)所對(duì)應(yīng)的結(jié)構(gòu)性狀況等級(jí)作為網(wǎng)絡(luò)輸出,利用PSO-ELM算法建立分類器,通過(guò)樣本數(shù)據(jù)訓(xùn)練學(xué)習(xí)確定影響因素與結(jié)構(gòu)性狀況之間的非線性關(guān)系。表1給出的管道修復(fù)指數(shù)及其對(duì)應(yīng)的結(jié)構(gòu)性狀況等級(jí)、修復(fù)建議[3]。其中,等級(jí)Ⅰ(RI≤1)表示基本完好,等級(jí)Ⅱ(1<RI≤4)表示輕微破壞,等級(jí)Ⅲ(4<RI≤ 7)表示中等破壞,等級(jí)Ⅳ(RI>7)表示嚴(yán)重破壞。
根據(jù)上述輸入、輸出向量建立排水管道結(jié)構(gòu)性狀態(tài)評(píng)價(jià)的PSO-ELM網(wǎng)絡(luò)拓?fù)淠P?,并在Matlab R2016b軟件平臺(tái)中實(shí)現(xiàn)。模型仿真時(shí)將采用試驗(yàn)方法設(shè)定不同的神經(jīng)元節(jié)點(diǎn)數(shù)L和激勵(lì)函數(shù)g(x),對(duì)標(biāo)準(zhǔn)ELM和PSO-ELM模型訓(xùn)練測(cè)試結(jié)果進(jìn)行比較分析。
表1 管道修復(fù)指數(shù)與等級(jí)劃分Tab.1 Pipeline rehabilitation index(RI)
混淆矩陣分析方法是評(píng)價(jià)分類器性能好壞最直接有效的方法。假定nij表示被分類為j類的i類樣本數(shù),則分類準(zhǔn)確率以正確分類的樣本數(shù)與總樣本數(shù)N的比值來(lái)表示
定義Ri是第i類樣本的查全率
定義G為樣本所有類別查全率的幾何平均值
指標(biāo)G適于評(píng)價(jià)不平衡數(shù)據(jù)集上分類器性能,其基本思想是使每一分類正確率盡可能大的同時(shí),保持各類之間的平衡。
以上海市浦東新區(qū)洋山港保稅港區(qū)公共排水管道為例,采用標(biāo)準(zhǔn)ELM模型以及優(yōu)化后的PSOELM模型開(kāi)展試驗(yàn)研究,預(yù)測(cè)、判定排水管道結(jié)構(gòu)性狀況等級(jí)。
試驗(yàn)區(qū)基礎(chǔ)數(shù)據(jù)包含兩部分:一是排水管道GIS(地理信息系統(tǒng))數(shù)據(jù),包含管材、管齡、管徑、埋深、管長(zhǎng)、坡度和所在道路類型等模型輸入的特征數(shù)據(jù);二是試驗(yàn)區(qū)2018年10月份排水管道CCTV檢測(cè)數(shù)據(jù),檢測(cè)管道里程20.3 km?;诠芏挝ㄒ恍詷?biāo)識(shí)建立GIS數(shù)據(jù)和CCTV檢測(cè)數(shù)據(jù)對(duì)應(yīng)關(guān)系,提取有效樣本數(shù)據(jù)共559條,采用4折交叉驗(yàn)證法將樣本集平均分為4份,每次驗(yàn)證抽取1份作為測(cè)試集,余下3份作為訓(xùn)練集,重復(fù)進(jìn)行4次,取4次測(cè)試驗(yàn)證結(jié)果的平均值作為模型的誤差估計(jì)。另外,為避免各指標(biāo)量綱和數(shù)量級(jí)不同造成的不平衡性,采用最大最小法對(duì)原始數(shù)據(jù)進(jìn)行了量綱一化處理,使得處理后的數(shù)據(jù)分布范圍在[0,1],公式如下:
式中:x為實(shí)測(cè)值;xmin為樣本數(shù)據(jù)的最小值;xmax為樣本數(shù)據(jù)的最大值。
利用標(biāo)準(zhǔn)ELM構(gòu)建管道狀態(tài)分類評(píng)價(jià)模型時(shí),僅需要設(shè)定隱含層神經(jīng)元節(jié)點(diǎn)數(shù)L和激勵(lì)函數(shù)g(x)的構(gòu)造形式就可以求算輸出權(quán)值矩陣。實(shí)際工程應(yīng)用中隱含層神經(jīng)元節(jié)點(diǎn)數(shù)L一般遠(yuǎn)小于樣本數(shù)N,L過(guò)小網(wǎng)絡(luò)預(yù)測(cè)誤差較大,L過(guò)大則會(huì)增加模型預(yù)測(cè)的時(shí)間、空間成本,容易出現(xiàn)過(guò)擬合現(xiàn)象。圖1給出sigmoid、sin和hardlim 3種常見(jiàn)激勵(lì)函數(shù)下隱含層神經(jīng)元節(jié)點(diǎn)數(shù)L對(duì)分類器能力的影響。其中,sigmoid函數(shù)和sin函數(shù)的分類器性能接近,L增至300時(shí)分類準(zhǔn)確率相對(duì)較高,約為60%。因此,對(duì)于未優(yōu)化的ELM管道狀況分類評(píng)價(jià)模型,激勵(lì)函數(shù)選擇整體性能較優(yōu)的sigmoid函數(shù),隱含層神經(jīng)元節(jié)點(diǎn)數(shù)L設(shè)定為300。
圖1 3種激勵(lì)函數(shù)下隱含層節(jié)點(diǎn)數(shù)對(duì)ELM分類性能的影響Fig.1 Effect of number of hidden nodes on ELM performance in different activation functions
為方便比較,同樣選擇sigmoid激勵(lì)函數(shù),對(duì)PSO-ELM分類器性能進(jìn)行仿真分析。經(jīng)測(cè)試比較,設(shè)定PSO種群數(shù)m=40,c1=c2=1.5,ωmax=0.95,ωmin=0.4,tmax=200。如圖2所示,L=70時(shí),PSOELM分類準(zhǔn)確率約為61%;L=130時(shí),分類準(zhǔn)確率達(dá)到90%以上??梢?jiàn),采用PSO優(yōu)化ELM的網(wǎng)絡(luò)參數(shù),能夠以更少的隱含層神經(jīng)元節(jié)點(diǎn)獲得更高的分類準(zhǔn)確率。需要說(shuō)明的是,在復(fù)雜性程度上PSOELM比標(biāo)準(zhǔn)ELM增加了網(wǎng)絡(luò)參數(shù)尋優(yōu)的步驟,但PSO算法可以較為快速地獲取到最優(yōu)參數(shù),能夠有效避免ELM可能存在的結(jié)果不穩(wěn)健的缺點(diǎn)。
圖2 PSO-ELM隱含層節(jié)點(diǎn)數(shù)影響Fig.2 Effect of number of hidden nodes on PSO--ELM performance
通過(guò)多次試驗(yàn)后,確定PSO-ELM和ELM的隱含層神經(jīng)元節(jié)點(diǎn)數(shù)分別為130和300時(shí)分類效果最佳。如表2所示,經(jīng)PSO優(yōu)化ELM網(wǎng)絡(luò)參數(shù)后,不光分類準(zhǔn)確率P顯著提升,G數(shù)值也由58.36%增至91.0%。通常,城市排水管道的結(jié)構(gòu)性狀況是非均衡分布的,除了整體準(zhǔn)確率,不同分類準(zhǔn)確度、查全率及相互之間的平衡也是分類器的重要評(píng)價(jià)指標(biāo)。
表2 PSO-ELM和ELM模型分類性能比較Tab.2 Comparison of performance of PSO-ELM and ELM
表3以混淆矩陣形式給出PSO-ELM和ELM在測(cè)試集上的分類結(jié)果對(duì)比。其中,結(jié)構(gòu)性損壞比較嚴(yán)重的Ⅲ類管道樣本17條,PSO-ELM準(zhǔn)確預(yù)測(cè)15條,查全率88.2%;Ⅳ類管道樣本23條,準(zhǔn)確預(yù)測(cè)21條,查全率91.3%。ELM分類器的相應(yīng)查全率則分別為64.7%和43.5%。結(jié)果可見(jiàn),相比較ELM,PSOELM對(duì)于非均衡數(shù)據(jù)集顯然具有更優(yōu)的分類預(yù)測(cè)能力。
表3 分類結(jié)果混淆矩陣Tab.3 Confusion matrix for PSO-ELM
圖3給出了測(cè)試集上逐個(gè)樣本的PSO-ELM分類結(jié)果與實(shí)測(cè)值的對(duì)照。結(jié)果也表明,PSO-ELM具備較高的分類精度和擬合能力,能夠較好滿足排水管道結(jié)構(gòu)性狀況評(píng)價(jià)的應(yīng)用要求。
圖3 PSO-ELM分類測(cè)試結(jié)果Fig.3 Predicted versus observed result for PSO-ELM
(1)提出了PSO-ELM排水管道結(jié)構(gòu)性狀況評(píng)價(jià)模型,采用PSO算法優(yōu)化ELM輸入連接權(quán)值和隱含層偏置,避免參數(shù)隨機(jī)初始化造成的分類結(jié)果不穩(wěn)定、準(zhǔn)確率偏低的弊端。
(2)利用CCTV檢測(cè)樣本集對(duì)PSO-ELM、ELM進(jìn)行仿真測(cè)試,試驗(yàn)結(jié)果表明,PSO-ELM能夠以較少的隱含層神經(jīng)元節(jié)點(diǎn)達(dá)到更高的分類精度,提高了ELM模型的擬合能力。
(3)本文為城市排水管道結(jié)構(gòu)性狀況評(píng)價(jià)提供了一個(gè)新型的數(shù)據(jù)驅(qū)動(dòng)的建模方法,具有較好的可行性和適用性。后續(xù)將利用更多的樣本數(shù)據(jù)訓(xùn)練優(yōu)化模型,進(jìn)一步提高預(yù)測(cè)精度和泛化能力。