• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于PCA-GRA-AdaBoost的交通流預(yù)測模型研究

      2022-04-20 08:35:28王方偉陳景雅謝敏慧石寶存
      河南科學(xué) 2022年3期
      關(guān)鍵詞:交通流量交通流個體

      王方偉, 陳景雅, 謝敏慧, 石寶存

      (河海大學(xué)土木與交通學(xué)院,南京 210098)

      隨著智能交通系統(tǒng)的快速發(fā)展,交通流預(yù)測作為智能交通系統(tǒng)的核心內(nèi)容,在交通管理和城市規(guī)劃的應(yīng)用中具有重要的意義. 交通流數(shù)據(jù)本身具有非線性和隨機性的特點,會受到時間、空間等諸多因素的影響,這使得傳統(tǒng)機理和經(jīng)典數(shù)學(xué)理論模型難以模擬其過程[1].

      近年來國內(nèi)外研究學(xué)者提出組合模型預(yù)測交通流量,通過結(jié)合多個模型的優(yōu)點提高預(yù)測精度. Li等[2]提出了一種基于集成經(jīng)驗?zāi)B(tài)分解和隨機向量函數(shù)連接網(wǎng)絡(luò)的行程時間預(yù)測模型. Lu 等[3]結(jié)合LSTM 和ARIMA的優(yōu)點對交通流進(jìn)行預(yù)測,也取得了較好的預(yù)測效果. 鄒宗民等[4]用粒子群算法對支持向量機進(jìn)行參數(shù)尋優(yōu),該模型在小樣本交通流序列中表現(xiàn)較好. 李磊等[5]提出一種卷積神經(jīng)網(wǎng)絡(luò)和LSTM結(jié)合的方法,有效提取了交通流的時空特征. Guo等[6]在時空圖卷積網(wǎng)絡(luò)中引入了注意力機制,對交通流序列進(jìn)行了準(zhǔn)確預(yù)測. 隨著研究的深入,有些學(xué)者開始引入多因素進(jìn)行交通流預(yù)測. 丁永兵等[7]構(gòu)建多元時間序列模型進(jìn)行預(yù)測,證明優(yōu)于傳統(tǒng)的ARIMA模型. Wu等[8]挖掘交通流周期性和道路空間特征,構(gòu)建了一種深度神經(jīng)網(wǎng)絡(luò)模型. Tang等[9]將聚類方法與時空相關(guān)性結(jié)合預(yù)測交通流量. Mur?a等[10]提出了一種基于多因素多層聚類分析的概率模型. 但是引入更多的因素會導(dǎo)致模型的復(fù)雜性提高,因此需要在保證預(yù)測精度的同時提高模型運算效率. 林蒙蒙等[11]通過引入因果分析方法量化各因素對交通流的影響程度. 李澤文等[12]提出主成分分析法對引入的多因素降維. Li等[13]將基于最大信息系數(shù)(MIC)與支持向量回歸分析法結(jié)合,降低模型的復(fù)雜性. 徐先鋒等[14]通過K近鄰算法提取特征,兼顧了模型的預(yù)測精度和運算速度.

      綜上所述,目前針對天氣因素對交通流影響的研究較少,而天氣因素與交通流量之間存在復(fù)雜的非線性關(guān)系,往往多種天氣因素對交通流量共同作用. 因此,本文提出一種多因素建模方法. 首先采用PCA 對數(shù)據(jù)進(jìn)行降噪處理,然后利用灰色關(guān)聯(lián)分析法計算各特征與分類標(biāo)簽的關(guān)聯(lián)程度,選擇關(guān)聯(lián)性高的特征作為最終的訓(xùn)練特征,降低模型復(fù)雜度. 最后采用集成學(xué)習(xí)的方式進(jìn)行模型預(yù)測,同時與傳統(tǒng)模型進(jìn)行對比,驗證模型的可靠性.

      1 數(shù)據(jù)預(yù)處理

      1.1 數(shù)據(jù)來源及介紹

      本文的交通量數(shù)據(jù)來自英國公路交通數(shù)據(jù)集,曼徹斯特是英國重要的交通樞紐,交通發(fā)達(dá),因此選取數(shù)據(jù)集中曼徹斯特2020-01-01至2020-10-31的局部路網(wǎng)節(jié)點的交通量作為實驗對象;其他監(jiān)測數(shù)據(jù)來自英國氣象局,包括:氣溫、大氣壓強、風(fēng)速、相對濕度、降水量、云量、可見度. 每隔15 min收集一次數(shù)據(jù),每類數(shù)據(jù)29 280條. 針對采集的數(shù)據(jù)樣本,前70%的數(shù)據(jù)用于模型訓(xùn)練,后30%的數(shù)據(jù)作為測試集用于模型性能驗證.

      1.2 數(shù)據(jù)的歸一化處理

      由于選取的數(shù)據(jù)樣本由8 個不同的指標(biāo)特征變量組成,不同的指標(biāo)特征具有不同的量綱和量綱單位.為了消除不同指標(biāo)之間的量綱影響,讓不同的數(shù)據(jù)指標(biāo)具有可比性,同時又不影響到數(shù)據(jù)分析的結(jié)果,需要對數(shù)據(jù)進(jìn)行歸一化處理. 本文實驗中選用Min-max標(biāo)準(zhǔn)化方法,公式如下所示:

      式中:x′t表示經(jīng)歸一化處理后的數(shù)值;xt表示原始數(shù)值;xmax和xmin分別表示同一個指標(biāo)的樣本數(shù)據(jù)中的最大值和最小值.

      1.3 基于PCA的數(shù)據(jù)降噪處理

      考慮到樣本數(shù)據(jù)的監(jiān)測采集周期較長,測量設(shè)備、測量方法以及一些人為因素都有可能對數(shù)據(jù)帶來一定的誤差. 因此對歸一化后的數(shù)據(jù)再進(jìn)行PCA降噪處理[15],先通過PCA降維,再將降維后的數(shù)據(jù)重建成和原來維度相同的數(shù)據(jù)就可以起到對數(shù)據(jù)降噪的作用[16]. 為了盡可能保留樣本數(shù)據(jù)中的有效信息,實驗中設(shè)置PCA算法保留數(shù)據(jù)95%的有效信息. PCA算法的步驟如下:

      1)對樣本數(shù)據(jù)矩陣Dn×m={x1,x2,…,xm} 進(jìn)行中心化,得到中心化矩陣D′.

      2)計算矩陣D′的協(xié)方差矩陣,并進(jìn)行特征值分解.

      3)取出最大的t個特征值所對應(yīng)的特征向量{W1,W2,…,Wt} ,對其進(jìn)行標(biāo)準(zhǔn)化處理得到矩陣W,降維后的數(shù)據(jù)矩陣即為Y=WTD′.

      4)將矩陣Y與WT相乘得到新的矩陣Y′,即可將降維后的矩陣重建為原來的維度.

      5)求出矩陣的每一列的均值,得到n維的均值向量U,將Y′與均值向量U相加即為接下來實驗中所需的樣本數(shù)據(jù)矩陣.

      1.4 特征變量的篩選

      本文采用GRA方法對多個特征變量進(jìn)一步篩選[17]. 灰色關(guān)聯(lián)分析法是一種通過確定參考數(shù)列和其他比較數(shù)列的幾何形狀相似程度來判斷因素之間的聯(lián)系是否緊密的方法,它可以對一個系統(tǒng)的發(fā)展態(tài)勢進(jìn)行定量的描述和比較. GRA的主要步驟如下:

      1)確定反映系統(tǒng)行為特征的參考數(shù)列(交通流量)和影響系統(tǒng)行為特征的比較數(shù)列(天氣因素).

      2)為了消除各個因素數(shù)列中的數(shù)據(jù)不同量綱的影響,將所有的數(shù)列歸一到[-1,1].

      3)計算參考數(shù)列與比較數(shù)列的關(guān)聯(lián)系數(shù)ξi(k):

      式中:y0(k)為歸一化后的參考數(shù)列;xi(k)為歸一化后的比較數(shù)列;ρ為分辨系數(shù),ρ越小,分辨力越強,通常取0.5.

      4)計算灰色關(guān)聯(lián)度ri:

      其中n為比較數(shù)列的數(shù)目.

      將交通流量與各個天氣因素用灰色關(guān)聯(lián)分析法進(jìn)行計算,計算結(jié)果如表1所示.

      表1 天氣因素灰色關(guān)聯(lián)度Tab.1 Grey relational degrees of various weather factors

      2 建模算法

      2.1 集成學(xué)習(xí)

      由于交通流數(shù)據(jù)中包含著空間、時序、時間等諸多信息,使用單一的模型進(jìn)行預(yù)測往往不能得到很好的效果,為此本文使用集成學(xué)習(xí)的方法進(jìn)行研究[18]. 集成學(xué)習(xí)是使用一系列的個體學(xué)習(xí)器進(jìn)行學(xué)習(xí),然后通過一定的結(jié)合策略把各個學(xué)習(xí)結(jié)果進(jìn)行整合,從而獲得比單一學(xué)習(xí)器更好的學(xué)習(xí)效果的一種機器學(xué)習(xí). 集成學(xué)習(xí)的一般結(jié)構(gòu)如圖1所示.

      圖1 集成學(xué)習(xí)結(jié)構(gòu)Fig.1 Ensemble learning structure

      按照個體學(xué)習(xí)器之間是否存在依賴關(guān)系,集成學(xué)習(xí)方法大致可以分為兩類:一類是個體學(xué)習(xí)器之間都存在強依賴關(guān)系,一系列的個體學(xué)習(xí)器串行生成,代表算法是Boosting系列算法;一類是個體學(xué)習(xí)器之間不存在強依賴關(guān)系,一系列的個體學(xué)習(xí)器并行生成,代表算法是Bagging和隨機森林(Random Forest)系列算法.

      2.2 AdaBoost集成學(xué)習(xí)算法

      自適應(yīng)提升(adaptive boosting,AdaBoost)算法是基于Boosting 集成學(xué)習(xí)系列算法中著名的算法之一,它具有較強的學(xué)習(xí)效率,并且不容易出現(xiàn)過擬合的現(xiàn)象,可以通過不斷地訓(xùn)練提高學(xué)習(xí)能力[19]. 本文選用長短期記憶神經(jīng)網(wǎng)絡(luò)(LSTM)、分類回歸樹(CART)、自回歸積分滑動平均模型(ARIMA)作為AdaBoost 集成模型的個體學(xué)習(xí)器.

      LSTM是一種改進(jìn)后的循環(huán)神經(jīng)網(wǎng)絡(luò),具有長時記憶功能,解決了長序列訓(xùn)練過程中存在的梯度消失和梯度爆炸的問題;ARIMA是一種經(jīng)典的處理時序數(shù)據(jù)的數(shù)理分析模型,在平穩(wěn)性較強的交通流中有著不錯的預(yù)測能力,作為個體學(xué)習(xí)器可以用于初步捕獲數(shù)據(jù)中的時序信息;CART是一種樹構(gòu)建算法,通過二元切分來處理連續(xù)型變量,即特征值大于給定的值就走左子樹或者右子樹,直到獲得最終的結(jié)果. 三個個體學(xué)習(xí)器分別代表了深度學(xué)習(xí)方法、傳統(tǒng)的數(shù)理統(tǒng)計模型、機器學(xué)習(xí)方法. AdaBoost算法流程如下:

      1)給定樣本總數(shù)為N的數(shù)據(jù)集為{(x1,y1) ,(x2,y2),…,(xi,yi),…,(xN,yN)},其中xi是樣本特征,yi是樣本標(biāo)簽,yi∈(- 1,1) ,i=1,2,…,N.

      2)對訓(xùn)練樣本數(shù)據(jù)集進(jìn)行權(quán)值初始化:

      式中w1i是初始第i個特征數(shù)據(jù)的權(quán)重數(shù)值,i=1,2,…,N.

      3)根據(jù)設(shè)定迭代m次,m=1,2,…,M,M為總迭代次數(shù),用權(quán)重分布的訓(xùn)練集Dm訓(xùn)練個體學(xué)習(xí)器hm.

      4)計算個體學(xué)習(xí)器hm的誤差率em:

      5)根據(jù)誤差率計算當(dāng)前個體學(xué)習(xí)器hm的權(quán)值αm:

      6)更新訓(xùn)練集的權(quán)值分布Dm+1:

      其中Zm是規(guī)范化因子,有

      7)重復(fù)步驟(3)~(6)迭代M次,構(gòu)建得到最后的強學(xué)習(xí)器G(x):

      2.3 PCA-GRA-AdaBoost模型

      為了提高預(yù)測模型的訓(xùn)練速度和準(zhǔn)確度,本文提出了一種基于PCA-GRA-AdaBoost 的交通流量預(yù)測模型. 首先將所有的樣本數(shù)據(jù)進(jìn)行歸一無量綱化和PCA降噪處理,然后利用灰色關(guān)聯(lián)分析法對處理后的特征變量進(jìn)一步篩選. 當(dāng)兩個序列的灰色關(guān)聯(lián)度系數(shù)大于0.6時,可認(rèn)為他們之間有很強的相關(guān)性[20],因此將關(guān)聯(lián)系數(shù)大于0.6的特征變量輸入到AdaBoost集成模型中,用于交通流量的預(yù)測. 具體模型預(yù)測流程如圖2所示.

      圖2 預(yù)測模型結(jié)構(gòu)圖Fig.2 Structure diagram of prediction model

      3 應(yīng)用實例

      3.1 評價指標(biāo)

      為了判定模型的預(yù)測性能和優(yōu)劣程度,本文分別使用平均絕對誤差(Mean Absolute Error,MAE)、平均絕對百分比誤差(Mean Absolute Percentage Error,MAPE)、均方根誤差(Root Mean Square Error,RMSE)、決定系數(shù)R2作為模型預(yù)測效果的評價指標(biāo). 其中MAE反映了預(yù)測值和真實值之間絕對誤差的大小,該值越小,表示模型越準(zhǔn)確;MAPE反映了所有的樣本誤差占實際值的比例;RMSE反映了模型的預(yù)測結(jié)果與真實值的偏離程度,該值越小,表示模型越穩(wěn)定;R2體現(xiàn)模型的擬合效果,取值范圍[0,1],該指標(biāo)越接近1,表示模型的擬合效果越好. 各個評價指標(biāo)的具體公式如下:

      式中:y^i表示交通流量的預(yù)測值;yi表示交通流量的真實值;yˉ表示測試樣本中真實交通流量的平均值;n表示樣本個數(shù).

      3.2 模型對比

      為了驗證本文提出的將基于PCA降噪處理、GRA特征篩選與AdaBoost 集成學(xué)習(xí)相結(jié)合方法的有效性,與傳統(tǒng)的LSTM、CART、ARIMA、AdaBoost等預(yù)測模型作對比. 各個預(yù)測模型的結(jié)果如表2所示.

      表2 經(jīng)典預(yù)測模型性能對比Tab.2 Performance comparison of classical prediction models

      由表2可以看出,在前三個單一預(yù)測模型的對比中,LSTM的預(yù)測效果最好. 這是由于樣本數(shù)據(jù)具有時序性,LSTM在處理時序性問題中具有良好的效果,可以發(fā)掘序列間的非線性關(guān)系,從而提高預(yù)測精度[21]. 而AdaBoost集成模型相比三個單一的預(yù)測模型,在各個評價指標(biāo)上都有不同程度的提高. 尤其是與ARIMA模型相比,AdaBoost 集成模型的MAE、MAPE、RMSE、R2分別減少了45.16%、51.51%、48.11%、30.21%. 這是由于三個個體學(xué)習(xí)器具有較強的差異性,一個個體學(xué)習(xí)器可以彌補其他兩個學(xué)習(xí)器表現(xiàn)稍差的學(xué)習(xí)結(jié)果,三個學(xué)習(xí)器相輔相成,使得集成模型在預(yù)測的準(zhǔn)確度和穩(wěn)定性上明顯優(yōu)于單一的預(yù)測模型.

      本文提出的基于PCA-GRA-AdaBoost 組合方法相比傳統(tǒng)的AdaBoost 集成模型,決定系數(shù)R2進(jìn)一步提高,達(dá)到0.942. 模型的MAE、MAPE、RMSE 分別減少了15.95%、17.29%、11.07%. 以上結(jié)果表明,本文提出的PCA-GRA-AdaBoost模型能夠有效減少樣本數(shù)據(jù)中噪音的影響,擬合程度和預(yù)測精度都有了不錯的提升,同時經(jīng)過GRA法對特征變量的篩選,選取與交通流量相關(guān)程度較高的其他因素作為集成模型的輸入,降低了模型的運算復(fù)雜度.

      為了更清楚地展示該模型的預(yù)測效果,從預(yù)測數(shù)據(jù)中隨機抽取一段來進(jìn)行展示,根據(jù)樣本數(shù)據(jù)的預(yù)測值和真實值進(jìn)行曲線繪圖,如圖3所示. 其中橫坐標(biāo)表示時間,縱坐標(biāo)表示交通流量,藍(lán)色曲線為樣本數(shù)據(jù)的真實值,紅色曲線代表預(yù)測值. 從兩圖的對比中可以看出,本文提出的優(yōu)化后的AdaBoost 集成模型有著更好的預(yù)測效果.

      圖3 未優(yōu)化(左)與優(yōu)化后(右)AdaBoost集成模型對比Fig.3 Comparison of unoptimized(left)and optimized(right)AdaBoost integration models

      4 結(jié)論

      本文針對影響交通流量的因素較多且復(fù)雜,考慮其數(shù)據(jù)具有時序性和非線性的特點,提出了一種PCAGRA-AdaBoost的交通流量預(yù)測模型. 通過與傳統(tǒng)單一預(yù)測模型和未被優(yōu)化的AdaBoost集成模型相對比,本文提出的PCA-GRA-AdaBoost 模型顯著提高了交通流量的預(yù)測精度和穩(wěn)定性,同時也提高了抗噪聲干擾能力,并降低了模型運算的復(fù)雜度.

      猜你喜歡
      交通流量交通流個體
      關(guān)注個體防護(hù)裝備
      基于XGBOOST算法的擁堵路段短時交通流量預(yù)測
      基于GA-BP神經(jīng)網(wǎng)絡(luò)的衡大高速公路日交通流量預(yù)測
      交通流隨機行為的研究進(jìn)展
      路內(nèi)停車對交通流延誤影響的定量分析
      個體反思機制的缺失與救贖
      How Cats See the World
      具有負(fù)壓力的Aw-Rascle交通流的Riemann問題
      基于復(fù)合卡和ETC的交通流量采集研究
      MLFF系統(tǒng)在交通流量控制中的應(yīng)用
      子洲县| 宜章县| 吉木萨尔县| 铁力市| 彰武县| 南投县| 军事| 洛浦县| 得荣县| 太白县| 米林县| 兴和县| 泽库县| 贵阳市| 井研县| 泉州市| 五峰| 扶沟县| 贞丰县| 龙山县| 福鼎市| 泸定县| 武功县| 芜湖市| 福安市| 海安县| 澄迈县| 闸北区| 宁国市| 长海县| 通州市| 谷城县| 天津市| 安平县| 松原市| 平江县| 千阳县| 清新县| 鹤庆县| 城固县| 三穗县|