敖瑞澤 強(qiáng)茂山
(清華大學(xué)項目管理與建設(shè)技術(shù)研究所,北京 100084)
進(jìn)度作為傳統(tǒng)項目管理目標(biāo)的“鐵三角”之一,一直以來備受業(yè)界關(guān)注。由于項目施工過程復(fù)雜多變,項目內(nèi)外部的不確定性因素會影響項目工期,進(jìn)而導(dǎo)致工期延誤[1-2]。
當(dāng)前,我國水利工程項目建設(shè)速度逐年提升。由于水利工程項目規(guī)模大、周期長、涉及面廣,在實施過程中普遍存在工期延誤問題,對項目利益相關(guān)方造成一定的負(fù)面影響。“十四五”規(guī)劃提出,構(gòu)建智慧水利體系,引入和推廣機(jī)器學(xué)習(xí)技術(shù),對解決水利工程項目工期延誤問題具有重要意義?;诖?,本文以神經(jīng)網(wǎng)絡(luò)為基礎(chǔ),探究水利工程項目工期延誤風(fēng)險預(yù)測方法,構(gòu)建水利工程項目工期延誤風(fēng)險預(yù)測模型,旨在提高水利工程項目進(jìn)度管理水平。
水利工程項目施工工期受眾多因素的復(fù)雜作用影響[3]。掙值分析法(EVM)的評價指標(biāo)具有簡潔性和科學(xué)性,能夠較為集中地反映工程項目的資金、資源、進(jìn)度、難易度等多種影響因素的綜合作用結(jié)果[4-5]。但是,基于EVM的工期預(yù)測多采用線性假設(shè)[6],與工期和各因素間的高度非線性關(guān)系不符,因此具有一定的局限性。通過梳理和分析相關(guān)研究可知,使用非線性激活函數(shù)和深層神經(jīng)網(wǎng)絡(luò)能夠近似模擬任何連續(xù)函數(shù)[7-8]。基于此,本文采用神經(jīng)網(wǎng)絡(luò)模型對EVM預(yù)測方法進(jìn)行改進(jìn)。
基于以往學(xué)者提出的項目工期影響因素,選擇具有代表性且容易量化的因素與EVM變量指標(biāo)相結(jié)合。
1.1.1 模型的輸入變量
(1)EVM變量指標(biāo)。在EVM變量指標(biāo)中,與項目進(jìn)度密切相關(guān)的指標(biāo)包括計劃值(PV)、掙值(EV)、進(jìn)度偏差(SV)以及進(jìn)度績效指標(biāo)(SPI)。其中,SV和SPI能夠反映實際進(jìn)度與計劃進(jìn)度的差異。但相比SV,SPI更有利于神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練,因此選擇PV、EV和SPI。
(2)工期影響因素。工期影響因素包括環(huán)境因素、人為因素和資源因素[9]。將“雨雪天數(shù)”“大風(fēng)天數(shù)”作為環(huán)境因素;將“合同金額變化率”“勞動力投入變化率”作為人為因素;將“材料設(shè)備質(zhì)量合格率”作為資源因素。
(3)項目自身的靜態(tài)因素指標(biāo)。除了以上能夠反映項目施工的動態(tài)性因素,還應(yīng)選擇項目自身的靜態(tài)因素指標(biāo)。將“合同總金額”“總庫容”“總裝機(jī)容量”和“最大壩高”[10]作為靜態(tài)輸入變量。
(4)項目施工過程中易獲取且有價值的信息的利用率。
(5)實際施工工期(隨時間同步增加)。該指標(biāo)與模型輸出變量“剩余施工工期”具有一定的互補(bǔ)性和相關(guān)性,能夠提高模型的預(yù)測精度。
1.1.2 模型的輸出變量
將水利工程項目施工過程中某一時間節(jié)點的“剩余施工工期”預(yù)測值作為模型的輸出變量,既符合施工過程的動態(tài)性,又能夠?qū)崿F(xiàn)預(yù)測項目工期并識別進(jìn)度偏差的目標(biāo)。
綜上所述,將輸入變量進(jìn)行歸一化或無量綱化處理,得到水利工程項目工期延誤風(fēng)險預(yù)測模型的輸入和輸出變量,見表1。
表1 水利工程項目工期延誤風(fēng)險預(yù)測模型輸入和輸出變量
前饋神經(jīng)網(wǎng)絡(luò)(FNN)采用全連接的網(wǎng)絡(luò)結(jié)構(gòu),通過對輸入進(jìn)行線性組合和非線性激活輸出結(jié)果,實現(xiàn)“原因→結(jié)果”;利用循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)對序列數(shù)據(jù)(如時間序列)建模,將之前和現(xiàn)在的結(jié)果序列數(shù)據(jù)作為輸入,輸出未來的序列數(shù)據(jù),實現(xiàn)“結(jié)果→結(jié)果”。據(jù)此,采用FNN處理輸入變量中的靜態(tài)特征及工期影響因素,采用RNN處理EVM變量指標(biāo)。
此外,輸入RNN的變量應(yīng)為時間序列變量[11],即選擇在時間維度上趨勢性明顯的變量,以提升預(yù)測結(jié)果的精準(zhǔn)度?;诒?中的輸入變量,首先將“實際施工工期”“PV/BAC”以及“EV/BAC”作為時間序列變量輸入RNN,將其余輸入變量輸入FNN;其次,將兩個網(wǎng)絡(luò)的輸出組合相連接;最后,由輸出層輸出預(yù)測結(jié)果。其中,RNN部分采用“無狀態(tài)RNN”并選取時間步長為5。由此,構(gòu)建水利工程項目工期延誤風(fēng)險預(yù)測模型網(wǎng)絡(luò)結(jié)構(gòu),如圖1所示。
圖1 水利工程項目工期延誤風(fēng)險預(yù)測模型網(wǎng)絡(luò)結(jié)構(gòu)
2.1.1 工期延誤風(fēng)險評價
假設(shè)R1表示項目可能發(fā)生的工期延誤程度,R2表示項目發(fā)生該程度工期延誤的概率,利用指標(biāo)R1和R2評價水利工程項目工期延誤風(fēng)險。隨著實際施工時間的持續(xù)增加,R2在項目總工期中的占比逐漸變大,說明在施工中項目進(jìn)度可調(diào)整的空間越來越小,糾正進(jìn)度偏差的難度越來越大,即項目工期延誤風(fēng)險越來越大。具體公式如下
(1)
(2)
式中,EDAC表示項目實際總工期預(yù)測值;EDTC表示剩余施工工期預(yù)測值;(EDAC-EDTC)表示實際施工工期;PD表示計劃總工期。
2.1.2 模型預(yù)測性能評價
模型預(yù)測性能評價旨在比較和分析預(yù)測值與實際值的接近程度?!笆S嗍┕すて凇钡念A(yù)測是一個典型的回歸問題,最常用的精度評價指標(biāo)是均方誤差(MSE)。此外,可采用以下4個指標(biāo)更加全面地評價模型預(yù)測性能。公式如下
(3)
(4)
(5)
(6)
本文以貴州省5個水利工程項目為例,分別用A、B、C、D、E表示。各項目建設(shè)期為2010—2021年,實際總工期為3~5年。
從工程概況、項目合同、施工月報、已報價工程量清單以及施工總進(jìn)度計劃中梳理出各輸入和輸出變量,將每月的項目執(zhí)行情況匯總為1條數(shù)據(jù),即時間間隔為1個月。由于各項目所處地區(qū)在施工期間均未出現(xiàn)6級及以上大風(fēng)天氣、各項目施工月報中記錄的材料設(shè)備供應(yīng)情況未出現(xiàn)不合格問題、項目D和項目E沒有發(fā)電功能,因此,剔除輸入變量“大風(fēng)天數(shù)”“材料設(shè)備質(zhì)量合格率”和“總裝機(jī)容量”。此外,相關(guān)數(shù)據(jù)基于時間維度整理且模型采用無狀態(tài)RNN,因此,將“合同金額變化率”直接并入“合同總金額”。
綜上所述,歸納出9個輸入變量(其中3個為時間序列變量)和1個輸出變量。經(jīng)過數(shù)據(jù)整理和清洗后,共得到230條有效數(shù)據(jù)。
該模型采用Python 3.7編程軟件,通過 TensorFlow神經(jīng)網(wǎng)絡(luò)技術(shù),利用Selenium、NumPy、Pandas、Matplotlib等軟件進(jìn)行數(shù)據(jù)的采集、處理和分析。
輸入FNN1是(n,6)的二維張量,其中,n表示樣本數(shù)量且每個樣本包含其對應(yīng)月份的6個非時間序列變量;輸入RNN是(n,5,3)的三維張量,其中,n表示樣本數(shù)量且每個樣本包含近5個月的3個時間序列。該模型取訓(xùn)練集比例為90%,驗證集比例為10%。
通過多種超參數(shù)組合比選出模型的最優(yōu)超參數(shù)組合。在此最優(yōu)組合下,采用10折交叉驗證,結(jié)果見表2。
表2 工期延誤風(fēng)險預(yù)測模型的10折交叉驗證結(jié)果
(續(xù))
由表2可知,模型的訓(xùn)練精度和驗證精度相差不大,說明模型未發(fā)生過擬合。模型驗證集的平均RMSE為0.011 27,表明模型的預(yù)測誤差約為項目計劃總工期的1.13%。經(jīng)換算可知,工期預(yù)測誤差為8~13天。
由于模型的預(yù)測誤差分布較均勻,殘差分布具有隨機(jī)性和不可預(yù)測性,因此僅以項目A為例進(jìn)行分析。項目A剩余工期的預(yù)測值與實際值對比如圖2所示。從圖2可以看出,該模型對“剩余施工工期”預(yù)測精度較高,與實際值十分接近。
圖2 項目A剩余施工工期的預(yù)測值與實際值對比
3.2.1 模型預(yù)測性能評價分析
采用掙值分析法預(yù)測工期時,假設(shè)剩余項目計劃工期遵循SPI變化趨勢,公式如下
(7)
式中,ED表示當(dāng)前已完成工程量對應(yīng)的計劃工期。
基于式(7)計算結(jié)果,比較該模型與掙值分析法的預(yù)測性能,結(jié)果見表3。
表3 工期延誤風(fēng)險預(yù)測模型與掙值分析法預(yù)測性能比較
由表3可見,掙值分析法的預(yù)測性能明顯低于工期延誤風(fēng)險預(yù)測模型。這是由于水利工程項目受多種因素綜合影響,在項目前期使用掙值分析法預(yù)測得到的結(jié)果準(zhǔn)確性較低。該案例驗證了工期延誤風(fēng)險預(yù)測模型的適用性,說明神經(jīng)網(wǎng)絡(luò)強(qiáng)大的非線性擬合能力和時間序列預(yù)測能力與水利工程施工復(fù)雜程度高、周期長等特點相匹配。
3.2.2 工期延誤風(fēng)險評價分析
利用該模型樣本集的預(yù)測結(jié)果,計算工期延誤風(fēng)險評價指標(biāo)R1、R2的預(yù)測值,并與實際值進(jìn)行比較,結(jié)果如圖3和圖4所示。
圖3 項目A的R1預(yù)測值與實際值對比
圖4 項目A的R2預(yù)測值與實際值對比
由圖3和圖4可以看出,R1、R2的準(zhǔn)確性取決于工期預(yù)測的準(zhǔn)確性。從預(yù)測結(jié)果來看,R1值波動較小,R2值隨時間逐漸增大。從R1、R2的整體趨勢來看,在項目施工前期,由于R1值較大,項目的工期延誤風(fēng)險較大;隨著時間的推移,R1值未明顯減小且R2值越來越大,說明項目發(fā)生工期延誤的概率越來越大。因此,若能在項目早期準(zhǔn)確預(yù)測R1,可以及時采取有效管理措施,避免R2值增大導(dǎo)致嚴(yán)重的工期延誤。
SPI能夠準(zhǔn)確描述當(dāng)前時刻項目的實際進(jìn)度與計劃進(jìn)度的偏差。因此,保持輸入變量不變,將輸出變量改為3個月后的EV,由此計算SPI值,使模型的輸入和輸出中都包含同一變量,但兩者處于不同時間。由此構(gòu)建的模型也稱為因果模型[12]。采用10折交叉驗證得到的結(jié)果見表4。使用預(yù)測結(jié)果計算項目各時間點的SPI,比較預(yù)測值和實際值,結(jié)果如圖5所示。
圖5 項目A的SPI預(yù)測值與實際值對比
表4 輸出變量改為3個月后EV/BAC的模型的10折交叉驗證結(jié)果
通過對比上述兩種建模方式發(fā)現(xiàn):采用第一種方式預(yù)測從當(dāng)前時刻到項目施工結(jié)束的“剩余施工工期”,預(yù)測精度較高,有助于管理者從整體評價項目工期延誤風(fēng)險,并根據(jù)需要采取相關(guān)措施。但是,該方法不能監(jiān)控施工進(jìn)度的階段目標(biāo),不利于制定和實施短期措施。采用第二種方式預(yù)測項目一段時間后的EV,并根據(jù)進(jìn)度計劃計算對應(yīng)的SPI,有助于管理者預(yù)知一段時間后項目的進(jìn)度情況,并在這段時間內(nèi)采取措施盡量糾正進(jìn)度偏差。但該方法存在兩個缺點:一是精度相對較低,且預(yù)測值整體偏大,說明預(yù)測得到的SPI趨勢偏樂觀,可能會誤導(dǎo)管理者;二是只能局部預(yù)測,不能整體把握項目的工期延誤風(fēng)險。因此,為了得到更加準(zhǔn)確的項目進(jìn)度評價結(jié)果,應(yīng)綜合使用上述兩種建模方式。
(1)工期延誤風(fēng)險預(yù)測模型具有良好的預(yù)測性能,明顯優(yōu)于傳統(tǒng)的掙值分析法。在最優(yōu)超參數(shù)組合下,模型驗證集的MSE為1.316 1×10-4,RMSE為0.0112 7,即該模型的工期預(yù)測誤差約為項目計劃總工期的1.13%,換算后為8~13天。由此可見,該模型能夠作為管理者評價項目進(jìn)度執(zhí)行情況和預(yù)測工期延誤風(fēng)險的工具,有助于相應(yīng)進(jìn)度管理措施的制定與實施。
(2)上述兩種建模方式具有一定的互補(bǔ)性。將兩種方法相結(jié)合能夠從整體和局部把握項目進(jìn)度,得到更加準(zhǔn)確的工期延誤風(fēng)險預(yù)測結(jié)果。此外,可以結(jié)合其他建模方式,綜合評價項目工期延誤風(fēng)險,提高項目進(jìn)度管理水平。
在實際應(yīng)用中,項目管理者應(yīng)根據(jù)自身經(jīng)驗識別和糾正數(shù)據(jù)中的錯誤,準(zhǔn)確計算出EV、PV和SPI,從而獲得更加完整、準(zhǔn)確的施工進(jìn)度管理數(shù)據(jù)。同時,管理者可以根據(jù)需要選擇時間序列數(shù)據(jù)的時間間隔,而不局限于以月為單位,以提高模型預(yù)測精度。此外,該模型適用于項目各利益相關(guān)方。借助該模型,各利益相關(guān)方能夠掌握項目實際進(jìn)度,降低工期延誤概率。因此,水利工程項目工期延誤風(fēng)險預(yù)測模型具有較高的應(yīng)用價值。
為了在實踐中有效地使用該模型,應(yīng)強(qiáng)化施工管理人員的數(shù)據(jù)管理意識,建立和完善項目資料歸檔管理制度。同時,應(yīng)制定模型的持續(xù)更新策略。隨著新項目不斷建設(shè)完成以及項目內(nèi)外部環(huán)境的改變,模型的泛化能力將逐漸降低,因此需要持續(xù)對模型進(jìn)行更新。
在“十四五”期間,水利建設(shè)仍然是我國重要的戰(zhàn)略發(fā)展目標(biāo),提高水利項目建設(shè)管理水平具有重要的意義和價值。
隨著智慧水利的推進(jìn)實施,我國水利建設(shè)越來越重視數(shù)據(jù)的收集、存儲以及數(shù)字化應(yīng)用。同時,強(qiáng)調(diào)算法、算力等基礎(chǔ)技術(shù)的支撐作用以及預(yù)測、預(yù)警、預(yù)報等功能的實現(xiàn)。由此可見,通過工期延誤風(fēng)險預(yù)測模型能夠有效解決我國水利工程建設(shè)的進(jìn)度管理和工期延誤問題。具體建議如下:
(1)擴(kuò)大研究數(shù)據(jù)的范圍和數(shù)量,提高模型的預(yù)測精度和泛化效果。
(2)將關(guān)鍵路徑法與掙值分析法相結(jié)合,更加精準(zhǔn)地描述項目關(guān)鍵路徑進(jìn)度。對關(guān)鍵路徑進(jìn)行掙值分析,計算關(guān)鍵路徑上的EV、PV和SPI,以彌補(bǔ)掙值分析法存在的缺陷。
(3)探究集成回歸方法在水利工程工期延誤風(fēng)險預(yù)測中的應(yīng)用,通過綜合多種機(jī)器學(xué)習(xí)方法最大限度地降低預(yù)測結(jié)果誤差。