陳永紅,甘文娟,孟 雪,韓 靜
(長安大學 信息工程學院,陜西 西安 710064)
隨著現代化的飛速發(fā)展,結構工程建設的腳步不斷加快。工程建設進程中結構受多種主客觀因素影響而不可避免發(fā)生形變,嚴重形變量所引發(fā)的重大災害給人民生命和財產安全帶來了巨大損失。因此,對結構工程的施工和運營階段提出了更嚴格的安全性要求,并且對結構變形進行自動監(jiān)測也至關重要。采用科學完備的預測模型對結構沉降監(jiān)測數據進行預測,可以指導有關部門及時采取有效的預防措施,提高工程建設的效率,保障施工建設的安全。當前,為了對結構沉降進行客觀準確實時的預測,預測精度和訓練速度已成為結構沉降變形預測關注的重點。
常用的結構變形預測模型主要有回歸分析預測模型、灰色理論預測模型、時間序列分析預測模型和人工智能預測模型等?;貧w分析預測模型通過分析大量變形數據與影響變形因素之間的數學關系,建立回歸方程進行模型預測[1]。其要求進行分析的數據具有較好的分布規(guī)律。該預測模型的精度由影響結構變形的因素決定。為達到簡化預測模型的目的,通常采用線性回歸模型進行結構變形預測,而實際的變形監(jiān)測變量之間都是相互關聯的,因此該模型在結構沉降預測方面具有一定的局限性?;疑到y(tǒng)理論最早由鄧聚龍教授提出[2],用于研究小樣本數據、貧信息等問題?;疑到y(tǒng)理論的重要部分是灰色預測,其中GM(1,1)是廣
泛應用的預測模型[3]?;疑A測模型對數據的波動變化不敏感,而對數據的光滑度要求較高。灰色分析要求數據包含完整變化趨勢,防止當數據序列較大且快速變化時模型預測誤差增大預測精度降低而導致模型預測失效。以上問題限制了灰色系統(tǒng)理論在實際預測中的應用。時間序列法是一種數理統(tǒng)計學的動態(tài)數據處理法。AR自回歸模型、MA移動平均模型、ARMA自回歸移動平均模型[4-5]、ARIMA自回歸求和移動平均模型[6]都是應用廣泛的時間序列分析模型。時間序列的研究依賴于數據隨時間變化的規(guī)律,其最突出的優(yōu)點是可以找到歷史數據在時間變化范圍內的規(guī)律,實現對未來數據的預測。時間序列的預測結合了影響結構沉降的外部因素,但由于預測中的參數不能實現動態(tài)變化,使模型對于快速變化的數據預測精度較差。時間序列模型進行預測的前提是數據滿足線性關系,而實際的結構變形數據是含趨勢項和隨機部分的非線性數據。因此時間序列法應用于結構沉降預測的發(fā)展不是很理想。
近些年,隨著人工智能的蓬勃發(fā)展及大數據時代的出現使得應用人工智能預測方法解決結構變形預測問題成為熱點。目前神經網絡法[7]、支持向量機[8]等都是應用廣泛的人工智能預測[7-12]方法。神經網絡模型對非線性數據、非確定性系統(tǒng)具有良好的描述特性和抗干擾能力,是一種有效的結構沉降預測算法。但是該模型參數設置缺乏理論支撐,易出現收斂速度慢、局部最優(yōu)等問題。支持向量機預測模型對于小樣本、非線性和局部極小點等問題具有良好的解決能力,但對于突變數據的處理存在預測失效的可能。最初針對神經網絡預測模型的研究大部分采用淺層結構,然而隨著人們對結構沉降預測精度要求的不斷提高,淺層神經網絡的預測精度已不能滿足實際需求,深度學習被提出。近些年來,隨著機器學習研究熱潮的出現,深度學習逐漸應用于結構沉降變形預測。深度學習網絡結構的實質是多層神經網絡,其學習能力和模型泛化性均良好,適合處理大規(guī)模數據。目前應用深度學習的結構沉降預測模型[13-15]已非常強大,但是仍然存在一些亟待解決的問題。為解決深度學習網絡模型結構復雜、訓練耗時等問題,寬度學習系統(tǒng)應運而生。寬度學習的提出旨在為深度學習提供一種替代方法。寬度學習是一種新的機器學習算法,和深度學習算法相比,具有模型結構簡單、訓練速度快、實時性高的優(yōu)勢。寬度學習系統(tǒng)通過對監(jiān)測數據進行訓練,構建預測模型,實現對結構沉降監(jiān)測數據的預測。與現有預測模型相比,寬度學習預測算法具有更快的訓練速度和更高的預測精度。
寬度學習系統(tǒng)(board learning system,BLS)[16]是基于隨機向量函數鏈接神經網絡(random vector functional-link neural network,RVFLNN)[17-18]提出的一種新的學習算法。RVFLNN是一種淺層神經網絡,基本思想是初始數據和其經過簡單映射后的結果共同構成模型輸入訓練得到輸出。寬度學習系統(tǒng)結構如圖1所示。該模型的本質是一個單層網絡,其通常由輸入層、隱藏層和輸出層組成,隱藏層由映射特征節(jié)點層和增強節(jié)點層構成。首先,初始數據經過線性特征映射函數連接輸入權值矩陣變換得到映射特征組,輸入權值通過稀疏自編碼器產生。然后映射特征組經過線性映射和非線性激活函數連接權值矩陣得到增強節(jié)點。最后增強節(jié)點和映射特征節(jié)點共同連接輸出權值矩陣得到系統(tǒng)輸出,輸出層權重通過嶺回歸近似廣義逆計算得到。
(1)映射特征組。
圖1 典型寬度學習系統(tǒng)結構示意圖
X∈Ra×b表示模型訓練的輸入數據,其數量為a,維數為b,Y∈Ra×c表示模型訓練輸出a個c維的數據,φi(·)表示特征映射函數,第i組特征映射用Zi表示,所有的特征映射組用Zn表示。
(1)
其中,Wei表示第i組由稀疏自編碼得到的最優(yōu)輸入連接權值矩陣,βei表示從輸入層到映射特征節(jié)點層的與Wei相對應的偏置矩陣。權重Wei的維數決定了映射特征組Zi中的節(jié)點數。
(2)增強節(jié)點組。
增強節(jié)點組由映射特征組經過函數映射變換得到,第j組增強節(jié)點組用Hj表示,所有的增強節(jié)點組用Hd表示:
(2)
其中,ξj表示非線性激活函數,Whj表示第j組映射特征節(jié)點到增強節(jié)點層的隨機連接權值矩陣,βhj表示第j組偏置矩陣,增強特征組的個數為d。
(3)結果輸出。
增強特征節(jié)點和映射特征節(jié)點共同作為系統(tǒng)輸入,則寬度學習系統(tǒng)的輸出為Y:
Y=[Zn|Hd]Wm=
[Z1,Z2,…,Zn|H1,H2,…,Hd]Wm
(3)
其中,[Zn|Hd]矩陣表示BLS模型的實際輸入,Y作為系統(tǒng)輸出在文中表示結構沉降預測值,Wm是連接系統(tǒng)輸入到輸出層的權值矩陣,通過求解嶺回歸矩陣偽逆的方式得到。
BLS的輸出用式(3)表示,該問題的求解通過采用嶺回歸近似廣義逆[Zn|Hd]+得到,計算公式如下:
Wm=(λI+ATA)-1AΤY
(4)
其中,A=[Zn|Hd],I表示單位矩陣,λ表示正則化系數。
圖2是BLS結構變形預測算法流程。對地鐵沉降數據進行預處理,將進行歸一化處理的數據劃分為訓練集和測試集用于BLS網絡的訓練和測試。BLS網絡進行學習的全過程:輸入樣本P產生包含特征映射節(jié)點的映射特征組,映射特征組連接非線性激活函數產生增強節(jié)點組,映射特征組和增強節(jié)點組共同作用到輸出層得到BLS模型的輸出U。BLS模型的輸出數據,需先進行反歸一化得到最終的地鐵沉降預測數據。將原始地鐵沉降數據和預測數據比較,采用誤差值判斷BLS模型對結構沉降數據的預測精度,采用測試時間驗證BLS模型訓練速度的優(yōu)越性。進一步對不同預測模型的結果進行比較,畫出不同模型預測形變量與真實形變量對比圖。
圖2 BLS結構變形預測算法流程
(5)
(6)
Train_Y=Φ(Train_X)
(7)
(8)
(9)
(10)
(11)
實驗數據來源于某地鐵5號線的地下隧道沉降數據,該數據集包含131個數據,監(jiān)測時間段是從2016年03月10日到2016年12月29日。寬度學習系統(tǒng)本質是一種機器學習算法,由于原始131個地鐵監(jiān)測數據樣本量較少,為了驗證模型的有效性,實驗采用三次樣條插值法對監(jiān)測數據點進行10倍插值。將插值后的數據按順序以7∶3的比例劃分為訓練集和測試集,并對數據集進行歸一化處理。對數據進行歸一化可降低數據之間存在的差異性,在一定程度上減少訓練時間,提高測試精度。實驗采用最值歸一化(min-max normalization,MMN),其實質是對數據進行線性變換,使數據結果值定義到[0,1]區(qū)間。模型對歸一化數據進行預測,因此需要對預測結果進行反歸一化。反歸一化公式由歸一化公式轉換得到。歸一化和反歸一化公式如下:
(12)
y'=y·(xmax-xmin)+xmin
(13)
其中,x表示原始數據,x'表示原始數據歸一化后的數據,xmin表示原始數據的最小值,xmax表示原始數據的最大值,y表示預測數據,y'表示對預測數據進行反歸一化的值。
該文采用均方根誤差(root mean square error,RMSE)和平均絕對百分比誤差(mean absolute percentage error,MAPE)作為評價模型預測精度的指標。這兩種誤差的公式如下:
(14)
(15)
RMSE的計算可以得到預測值與真實值之間的偏差。MAPE的計算可以得到絕對誤差與真實值之間的比例。RMSE、MAPE是常用的模型預測精度的評價指標。RMSE、MAPE值的大小,表示預測精度的高低。值越小,預測精度越高。
經過多次實驗,當映射特征組數、映射特征組內節(jié)點數和增強特征節(jié)點數分別取12、12、15,正則項參數C為2-20時,寬度學習模型對地鐵沉降監(jiān)測數據的預測結果最好。模型預測值與原始地鐵沉降值對比結果如圖3所示。此時,模型測試集均方根誤差為0.006 3,平均絕對百分比誤差為0.000 4,測試時間為0.069 3 s。
圖3 BLS預測結果
為了驗證BLS模型在結構沉降預測方面的有效性,實驗將BLS模型與深度置信網絡-支持向量回歸(deep belief networks,support vector regression,DBN-SVR)、支持向量回歸(support vector regression,SVR)和人工神經網絡(artificial neural network,ANN)模型對地鐵沉降監(jiān)測數據的預測結果進行比較。四種不同模型預測性能評價如表1所示。模型預測結果采用均方根誤差(RMSE)、平均絕對百分比誤差(MAPE)和運行時間進行評估。
表1 四種模型性能評價
由表1可知,BLS模型預測誤差最小,運行時間最快。BLS模型預測精度達到了99.96%,運行速度最快僅為0.157 7 s(訓練時間為0.088 4 s,測試時間為0.069 3 s)。對四種預測模型的性能進行評價可知,BLS模型的預測均方根誤差(RMSE)和平均絕對百分比誤差(MAPE)明顯小于其他三種對比模型。BLS的預測精度比DBN-SVR、SVR和ANN分別提高了94.81%,90.24%,97.10%。BLS模型的運行速度相比于對比模型提高了數十倍至數千倍。綜合考慮模型的預測精度和運行速度,BLS模型用于地鐵沉降數據預測,具有非常高的預測精度和非常快的運行速度。
通過上述DBN-SVR、SVR、ANN和BLS預測模型的實驗,得到BLS與DBN-SVR、SVR和ANN的預測值與真實地鐵沉降值的曲線對比結果,如圖4所示。
圖4 不同模型預測結果
由圖4可知,BLS對地鐵沉降數據預測的擬合度非常高,即預測值與原始地鐵沉降數據高度吻合;在沉降數據變化的拐點處也可以實現精確預測,即局部擬合度也非常高;ANN的擬合度最差,其預測結果和原始數據的變換趨勢整體大致符合。
圖5為BLS、DBN-SVR、SVR和ANN的預測誤差對比,其直觀分析了四種預測模型的預測誤差。由圖5可知,BLS預測誤差最小,即預測精度最高。實驗結果表明,BLS預測模型相比于其他預測模型具有更高的預測精度和更快的運行速度,是一種預測性能優(yōu)良的結構沉降數據預測算法。
圖5 不同模型誤差對比
進一步在不改變模型其他參數的前提下,通過調整模型的正則項參數C,得到寬度學習系統(tǒng)對結構沉降數據的預測結果(見表2),驗證其對模型預測精度的影響。由表2可知,正則項參數C設置為2-20時,模型預測效果最佳,即預測誤差最小,但此時模型運行速率不是最快。
表2 正則項參數對BLS預測結果的影響
圖6 正則項參數對模型預測準確率的影響
圖6中預測準確率是通過1-MAPE定義的。圖中隨著正則項參數C的緩慢增加,寬度學習系統(tǒng)對于結構沉降預測準確率呈緩慢下降趨勢,預測準確率從99.96%下降到99.24%。在一定范圍內,改變正則項參數C對基于寬度學習系統(tǒng)的結構沉降預測準確率的影響非常小。
提出了一種基于寬度學習的結構沉降數據預測模型,通過實測地鐵沉降數據測試結果表明,寬度學習系統(tǒng)模型的預測值和真實值基本吻合,即使在結構沉降數據變化的拐點處吻合度也較高。進一步將BLS與DBN-SVR、SVR和ANN模型預測結果進行對比,模型預測精度采用預測誤差進行驗證,模型預測速度采用模型運行時間進行評估。實驗結果表明,提出的寬度學習系統(tǒng)模型預測精度高、運行速度快,是一種性能良好的結構沉降預測方法。寬度學習系統(tǒng)可通過引入增量學習算法,改變原系統(tǒng)的性能,在將來的研究中應進一步研究增量學習算法對寬度學習系統(tǒng)結構沉降預測精度的影響。