李曉娟, 張芳媛, 喻玲
(1.新疆大學機械工程學院, 烏魯木齊 830000; 2.新疆大學商學院, 烏魯木齊 830000)
風電行業(yè)因地制宜利用風力發(fā)電,故風電機組主要分布在風能豐富的地方,且受風速隨機波動影響較大。此類地方分布離散且偏遠,因此機組建造及維修方面耗時較多。風電機組所涉及的物料眾多,運行工況復雜多變,技術(shù)升級換代快,長期受極端天氣、溫度等復雜因素影響使得零部件易受損。因此,為了保障風機的正常運行,降低運維成本,提高風力發(fā)電的經(jīng)濟效益,尋找高效精準的方法對風電備件進行需求預測具有重大實際意義。
關(guān)于需求預測,國內(nèi)外學者做了很多研究,一共分為兩大類:定性與定量。關(guān)于定性預測,研究人員通常結(jié)合理論和實踐經(jīng)驗來得出他們對未來需求的判斷[1]。時間序列分析[2-6]將獲得的數(shù)據(jù)僅按時間順序排列成序,避免了復雜線性和篩選影響因素等難點,因而被大量應用。定量需求預測是將仿真與運籌學等相結(jié)合,建立一個數(shù)學模型并加以解決,以產(chǎn)生一個結(jié)果,顯示預期目標和其他因素之間的規(guī)律。基于機器學習的預測方法也受到了國內(nèi)外學者的青睞,具體有支持向量機方法[7-8]、神經(jīng)網(wǎng)絡[9-12]等。呂靖等[13]提出了一種基于GM(1,1)和BP神經(jīng)網(wǎng)絡的組合預測模型,通過MATLAB對大連水產(chǎn)品冷鏈物流需求量進行仿真預測,表明與單一的預測模型相比,該組合模型具有更高的預測精度。徐庶博等[14]針對需求量大且消耗規(guī)律難以把握的部隊車輛周轉(zhuǎn)器材進行傳統(tǒng)灰色模型的無偏優(yōu)化,并對殘差進行馬爾科夫修正,達到了較精確的效果。宋銘星[15]針對動車組不常用備件提出了新的分類及GA-BP神經(jīng)網(wǎng)絡算法預測方法,提高了動車組維護運營效率。徐廷學等[16]提出了一種基于改進非等間距GM(1,1)-BP模型的導彈退化狀態(tài)預測方法,提高了導彈退化狀態(tài)預測的精度。徐仁博[17]構(gòu)建了時間序列與灰色預測備件需求預測模型,降低備件庫存,提升了公司的經(jīng)濟效益。Gutierrez[18]將神經(jīng)網(wǎng)絡預測的性能與單指數(shù)平滑法、克羅斯頓法和Syntetos-Boylan近似法進行了比較,發(fā)現(xiàn)神經(jīng)網(wǎng)絡預測模型的性能普遍優(yōu)于傳統(tǒng)方法。Fan等[19]提出了一種間歇時間序列域劃分算法,通過挖掘序列中的需求發(fā)生時間和需求間隔信息,構(gòu)建度量指標,預測的穩(wěn)定性和準確性都有顯著提高。Portabales等[20]總結(jié)了使用人工神經(jīng)網(wǎng)絡預測電力需求的方法。Song等[21]針對零售業(yè)預測問題,采用雙重相關(guān)分析、LSTM與ARIMA聯(lián)合模型對銷售額進行預測。Babongo等[22]將外部干擾作為預測因素,可提高預測精度,為隨機庫存控制理論做出了貢獻。李云長等[23]針對服裝企業(yè)面料需求非確定性、預測難的痛點,提出基于關(guān)聯(lián)規(guī)則及組合模型的面料需求預測方法,提高預測精度。以上學者發(fā)現(xiàn)相比于單一模型的預測,組合模型預測的效果較好。
上述方法只有在有足夠的歷史數(shù)據(jù)且備件需求波動較小的情況下才能使用,有一定的局限性。此外,只考慮時間序列作為備件需求的影響因素,而忽略了產(chǎn)生備件需求的其他重要因素。風電行業(yè)不同于一般制造業(yè),風機呈現(xiàn)廣域稀疏式網(wǎng)絡分布特點,所處位置偏遠且離散,建造維修及運輸都較為困難,風機所處環(huán)境復雜、運行強度高、零部件量大類多且復雜、故障類型復雜,導致備件預測存在諸多不確定性因素?;谏鲜鰡栴},現(xiàn)從外部環(huán)境、備件自身情況等方面結(jié)合風電行業(yè)特性歸納影響風電備件需求的影響因素,用主成分分析法(principal component analysis,PCA)對其進行因素融合,減少冗余信息的影響。利用MATLAB軟件對作為神經(jīng)網(wǎng)絡輸入值的主成分分析值進行分析預測,并以金風科技企業(yè)近五年齒輪需求數(shù)據(jù)為例進行分析,以實現(xiàn)風電備件需求的準確預測,降低成本,保障風機運行。
主成分分析(PCA)是一種降低數(shù)據(jù)維度的方法,它將幾個相關(guān)的變量結(jié)合起來,消除重復的變量,最大限度地增加新的不相關(guān)變量的數(shù)量,并確保新變量保留原有變量的信息,具體操作步驟如下。
(1)
步驟2計算特征值和相應的特征向量。相關(guān)系數(shù)矩陣R的特征值為λ1≥λ2≥…≥λm≥0,相應的特征向量為u1,u2,…,um,m個新ym指標變量由特征向量組成,其中第一主成分是y1,第二主成分是y2,第m主成分是ym。
R=[rij]m×n
(2)
(3)
步驟3計算特征值λj(j=1,2,…,m)的信息貢獻率和累積貢獻率。
(4)
(5)
式中:bj為主成分yj的信息貢獻率;αp為主成分的累積貢獻率。
步驟4計算綜合得分,根據(jù)綜合得分值可進行評價。
(6)
BP神經(jīng)網(wǎng)絡模擬人類思維,是在誤差反向傳播算法基礎(chǔ)上訓練的多層前饋神經(jīng)網(wǎng)絡。BP神經(jīng)網(wǎng)絡通常由一個前饋層、一個隱含層和一個輸出層組成。如圖1所示,輸入和輸出層是單層結(jié)構(gòu),神經(jīng)元的數(shù)量由訓練模式?jīng)Q定。隱蔽層可以設(shè)置為一個或多個層,神經(jīng)元的數(shù)量,也稱為隱蔽層的節(jié)點數(shù),通常由經(jīng)驗公式確定,即
(7)
圖1 神經(jīng)網(wǎng)絡結(jié)構(gòu)圖流程圖Fig.1 Neural network structure flowchart
式(7)中:h為隱含層神經(jīng)元數(shù);m為輸入層神經(jīng)元數(shù);n為輸出層神經(jīng)元數(shù);s為常數(shù),一般取12 數(shù)據(jù)采集與預處理
2.1 影響因素確立與分析
風機的安裝多于風能豐富之處,所以分布離散,具有廣域稀疏的特點,并且所處自然環(huán)境較為惡劣,如高溫、雷電等易造成零部件故障,一旦故障就會導致停機,增加維護成本;風電機組所包含的物料零件繁多,因此要慎重考慮供應商的選擇及采購周期;在雙碳背景及政策支持下,風機應用廣泛,為了具有競爭力,升級換代快,技術(shù)變更占比較多;這些風機特性決定著風機備件需求預測的因素眾多,其中部分因素難以用定量分析,只能通過賦值將其從定性描述轉(zhuǎn)化為定量的值。并且風機備件加工制造周期長,工藝復雜,具有較高的技術(shù)要求,該類供應商一般是大型企業(yè),數(shù)量少。
綜上,經(jīng)過實際調(diào)研并結(jié)合風機特點,選取歷史需求數(shù)據(jù)、相關(guān)備件歷史需求數(shù)據(jù)、供應商信用程度打分、采購周期、故障處理時間、備件因素停機占比、產(chǎn)前技術(shù)準備周期、技術(shù)變更占比、風機銷售、人為操作、氣候、地域等12個因素作為風電備件需求預測的主要影響因素,以滿足風機備件的需求預測。
(1)近期歷史需求量:收集齒輪的近期歷史需求量。
(2)相關(guān)備件需求量:收集與齒輪相關(guān)的備件的歷史需求量。
(3)供應商信用程度打分:供應商的信用程度反映零部件的質(zhì)量程度,當供應商信用程度良好時,意味著零部件的質(zhì)量較高,從而減少備件的需求。
(4)采購周期:采購周期的長短也影響著備件的需求,當采購周期過長,備件的需求就會增大。
(5)故障處理時間:某個零部件故障后處理時間的長短影響著風機的運行時間,當故障處理時間過長時,就必須有足夠的備件保障風機的運行,因此,備件需求就會增大。
(6)備件因素停機占比:涉及備件因素導致的停機,有備件缺失、備件故障等情況,它直接影響著備件的需求量。
(7)產(chǎn)前技術(shù)準備周期:因為風機機組的復雜性,所以提前進行技術(shù)準備是必要的,備件的需求量會結(jié)合技術(shù)準備周期的長短。
(8)技術(shù)變更占比:為了提高機組性能,提高發(fā)電量等會進行技術(shù)上的優(yōu)化升級改造,這類變更會影響備件的需求量。
(9)風機銷售:風機自身的銷售情況可以反映出備件量,當風機銷售趨勢良好,備件需求量也會增大。
(10)人為操作:新入職的維修操作人員都需要花一定時間去上手業(yè)務,在此期間都會因操作不當或者不熟練而產(chǎn)生備件需求。因此對新手以及業(yè)務不熟練的賦值為3,熟練工人賦值為1,其余為2。
(11)氣候:高溫、潮濕等氣候都會造成風機在運轉(zhuǎn)過程中產(chǎn)生備件需求;比如金屬備件會因腐蝕而導致導電性減弱等;電子備件也會因為高溫而導致接觸不良等;因此,氣候是影響備件需求量的因素之一。根據(jù)風場所在地分布,根據(jù)氣候惡劣程度分為3個等級,對應1~3的整數(shù)值,氣候越惡劣,數(shù)值越大。
(12)地域:風機所處地方必須是蘊含風能的地方,故多選在海拔高或者海上以及一些平原寬廣的地方,因此可以把地域分為2個等級,相應的量化為1~2的整數(shù)值,平原地帶賦值為1,海上及高海拔地區(qū)賦值為2。
以金風科技企業(yè)為例,選取關(guān)鍵部件齒輪作為研究對象,收集了2018—2022年近5年每月的齒輪歷史需求量,以及相關(guān)備件軸承2018—2022年5年每月的歷史需求量如表1和表2所示。
表1 2018—2022年齒輪歷史需求量Table 1 Historical demand for gears from 2018 to 2022
表2 2018—2022年軸承歷史需求量Table 2 Historical demand for bearings from 2018 to 2022
并對齒輪的供應商進行打分,如表3所示;技術(shù)變更占比如圖2所示;結(jié)合其余10個影響因素確定神經(jīng)網(wǎng)絡的輸入量如表4所示。
表3 供應商打分情況Table 3 Scoring of suppliers
表4 BP神經(jīng)網(wǎng)絡輸入量 Table 4 BP Neural Network Inputs
圖2 技術(shù)變更占比Fig.2 Percentage of technical changes
在實際生活中,不同的變量導致數(shù)值之間產(chǎn)生不同,就會引起神經(jīng)網(wǎng)絡預測的結(jié)果出現(xiàn)“過擬合”情況,根據(jù)相關(guān)文獻[24],將對數(shù)據(jù)進行歸一化處理,將輸入BP神經(jīng)網(wǎng)絡的數(shù)據(jù)轉(zhuǎn)為0~1的數(shù),歸一化公式為
(8)
式(8)中:y為歸一化后的數(shù)據(jù);xi為歸一化前的數(shù)據(jù);xmin為數(shù)據(jù)的最小值;xmax為數(shù)據(jù)的最大值。應用MATLAB(2022版)軟件對數(shù)據(jù)進行歸一化處理,處理結(jié)果如表5所示(部分)。處理后的數(shù)據(jù)樣本取值區(qū)間為0~1。
表5 各指標歸一化的結(jié)果Table 5 Normalized results for each indicator
將備件需求量作為輸出,將12個因素變量進行輸入,如表6所示,該BP神經(jīng)網(wǎng)絡模型存在12個輸入節(jié)點和1個輸出節(jié)點。在MATLAB中多次實驗后發(fā)現(xiàn)隱含層節(jié)點數(shù)范圍為4~12,當隱含層數(shù)為6時,BP神經(jīng)網(wǎng)絡的性能最好,訓練次數(shù)設(shè)置為1 000,最終構(gòu)建的神經(jīng)網(wǎng)絡拓撲結(jié)構(gòu)為12-6-1。
表6 參數(shù)對應表Table 6 Normalized results for each indicator
基于上述PCA-BP神經(jīng)網(wǎng)絡模型,對輸入變量進行PCA分析,圖3和表7分別為主成分的特征值和方差貢獻率以及主成分的因子載荷矩陣。從圖3可以看出,前8個主成分的累計方差貢獻率已達80%以上,即前8個主成分體現(xiàn)了12個原始指標信息量的84.59%,因此原始指標可由這8個主成分代替即可,同時與碎石圖顯示信息相一致,如圖4所示。
表7 主成分的因子載荷矩陣表Table 7 Table of factor loading matrix for principal components
圖3 主成分的特征值和方差貢獻率Fig.3 Eigenvalues and variance contribution of principal components
圖4 主成分分析碎石圖Fig.4 Principal components analysis lithotripsy
主成分載荷矩陣主要反映原始變量指標對主成分的貢獻大小,從表7可以得到前8個主成分的因子載荷,第一主成分中相關(guān)備件、風機銷售的載荷系數(shù)很高,主要反映了風機銷售和相關(guān)備件的需求因素的重要性;第四主成分中產(chǎn)前技術(shù)準備具有最高載荷,而其他因素的載荷在第四主成分是負值或者趨近于零,因此第四主成分可稱為“產(chǎn)前技術(shù)準備周期成分”;第七個主成分中故障處理時間的載荷最高;第五個主成分中供應商信用程度打分的載荷最高;第八個主成分的表達式可以看出,所有因素對第八主成分的影響值相當,因此第八主成分可稱為“平均影響成分”。由此可以根據(jù)公式計算獲得前8個主成分得分。基于上述方法的特征篩選,PCA法優(yōu)化的神經(jīng)網(wǎng)絡拓撲結(jié)構(gòu)為8-6-1。
通過將PCA-BP神經(jīng)網(wǎng)絡模型與未降維的BP神經(jīng)網(wǎng)絡模型、ARIMA時間序列模型預測模型的預測結(jié)果進行對比,結(jié)果如圖5、圖6和表8所示。驗證PCA-BP神經(jīng)網(wǎng)絡模型預測風電備件的預測誤差最小,效果最好。
表8 3種模型預測誤差對比結(jié)果Table 8 Results of comparison of prediction errors of the three models
圖5 3種模型實際值與預測值對比Fig.5 Comparison of actual and predicted values of three mode
圖6 3種模型預測值與實際值對比Fig.6 Comparison of predicted and actual values from three models
為了評估預測模型的預測效果,用相關(guān)指標對其進行了比較,以評估預測誤差。選取的評價指標有平均絕對誤差(mean absolute error,MAE)、均方根誤(root mean squared error,RMSE)、平均絕對百分比誤差(mean absolute percentage error,MAPE);MAE和RMSE反映了預測和實際情況之間的差異,指標越低,預測越準確;MAPE是所有誤差歸一化后的平均絕對誤差百分比;如果MAPE為0,說明模型是理想的;如果MAPE大于100%,說明模型的擬合效果不好,不應采用。
若不利用主成分法先進行降維,BP神經(jīng)網(wǎng)絡模型的輸入層節(jié)點數(shù)為12個,輸出節(jié)點數(shù)仍為1個,經(jīng)多次調(diào)試隱藏層節(jié)點數(shù)為6。兩種神經(jīng)網(wǎng)絡其余參數(shù)設(shè)置調(diào)試方法均相同。在對備件的需求預測研究中,有較多研究使用了自回歸積分滑動平均(autoregressive integrated moving average,ARIMA)模型,所以使用2018—2022年齒輪歷史需求量的數(shù)據(jù)構(gòu)建ARIMA模型,根據(jù)相關(guān)數(shù)據(jù)運行SPSS軟件,建立ARIMA(0,2,0)模型,模型殘差序列的白噪聲和異方差檢驗通過了顯著性檢驗,故認為ARIMA(0,2,0)是較為科學合理的預測模型。
3種模型預測對比如圖5所示,可以看出PCA-BP的擬合效果好,而ARIMA單純根據(jù)時間序列分析,沒有考慮非線性因素,導致擬合效果不如PCA-BP;BP神經(jīng)網(wǎng)絡模型的擬合效果也不如PCA-BP好,因為沒有考慮各種因素之間的相關(guān)性。
用3個模型得到的預測值和實際值的比較如圖6所示,PCA-BP的誤差最小。從預測誤差評價指標的角度將PCA-BP神經(jīng)網(wǎng)絡模型、未降維的BP神經(jīng)網(wǎng)絡模型、ARIMA模型的預測效果進行比較分析,預測誤差對比結(jié)果如表8所示??梢钥闯?經(jīng)過主成分分析取主成分后,PCA-BP神經(jīng)網(wǎng)絡模型的預測誤差大幅度減小,MAE、MAPE、RMSE 值分別為2.662 3、6.064 9、3.251 7,均明顯優(yōu)于其他兩種模型。
風機備件由于風能的大量開發(fā)使用呈現(xiàn)逐年增長趨勢,并且會有政策等因素的影響存在。在構(gòu)建 ARIMA 模型前最初的數(shù)據(jù)需要被進行幾次差分處理,差分能夠減少甚至消除不穩(wěn)定性,但是每一次差分都會導致信息的丟失,從而影響最終的預測結(jié)果,故ARIMA模型的參數(shù)并不能優(yōu)于其他模型,并不能很好的適用風機備件的預測。經(jīng)主成分分析的BP神經(jīng)網(wǎng)絡考慮風電備件的諸多影響因素間的相關(guān)性,排除冗雜因素,而不是簡單地將因素輸入,降低神經(jīng)網(wǎng)絡結(jié)構(gòu)復雜性,有效地提高神經(jīng)網(wǎng)絡的預測精度。綜上所述,使用PCA-BP神經(jīng)網(wǎng)絡模型預測風電備件更科學合理。
以風電行業(yè)零部件作為研究對象,結(jié)合風電行業(yè)實際情況,運用PCA-BP神經(jīng)網(wǎng)絡模型對風電備件進行預測,PCA方法消除了影響因素之間的關(guān)聯(lián)性,如風電備件的故障率和周轉(zhuǎn)時間,將12個影響因素減少到8個,從而減少了BP神經(jīng)網(wǎng)絡的數(shù)據(jù)輸入量,提高了預測精度,與未經(jīng)PCA處理的BP神經(jīng)網(wǎng)絡和傳統(tǒng)的ARIMA模型對比,發(fā)現(xiàn)PCA-BP神經(jīng)網(wǎng)絡模型的預測誤差最小, MAPE、RMSE、MAE值都比其他模型低,所以運用PCA-BP神經(jīng)網(wǎng)絡模型預測風電備件是可行的。
影響風電備件需求的研究還有待進一步的完善,研究的不足之處在于未考慮零部件壽命長度以及風機建設(shè)受政策規(guī)劃等影響因素,并且可以先對指標進行分類,這也是今后研究的重要方向之一。