于曉要 李 娜
(商丘工學院 河南 商丘 476000)
近年來,風能作為清潔能源受到了廣泛關注,全球風電裝機容量逐年增長。風力發(fā)電的穩(wěn)定性和可靠性是需要考慮的關鍵問題,因此,有必要進行風電預測。由于風電預測依賴于大氣氣象學和風速,因此提高風速預測的準確性能改善風電預測結果[1]。由于風速數據具有隨機性和混沌性,用線性方法預測相當困難[2]。一般預測時間長短與預測準確性呈負相關關系,根據預測時間可分為超短期、短期和中長期預測。
風速預測方法主要有持續(xù)性模型、基于氣象參數預測、統計學方法和基于機器學習的預測方法等。通常持續(xù)性模型對目標函數作簡單的平滑假設,未來風速被認為等于預測時間內的風速[3],這是最簡單和最經濟的風力預測方法。當預測時間范圍延長時,持續(xù)性模型的性能迅速下降,因此,只適用于超短期預測。數值天氣預測(Numerical Weather Prediction,NWP)適用于大規(guī)模地區(qū)長期預測[4],主要缺點是計算時間和復雜度高,在預測過程中遇到不可測誤差會導致嚴重的偏差,短期預測不可靠。統計學方法旨在找出風速時間序列統計分布規(guī)律和隨機過程來把握趨勢性非平穩(wěn)變化。統計模型以各種回歸預測為主,包括多元線性/非線性回歸、自回歸(Auto Regressive,AR)、自回歸移動平均(Auto Regressive Moving Average,ARMA)、自回歸綜合移動平均(Auto Regressive Integrated Moving Average,ARIMA)。文獻[5]應用多變量ARMA進行逐時風速預測,但由于其中的線性假設,它無法對較長的時間范圍給出準確的估計。文獻[6]充分考慮風速自身高低及風速變化率對條件方差的影響,提出一種基于ARIMA和廣義自回歸條件異方差模型的風速預測方法,可快速實現超短期內風速的點預測與區(qū)間預測。
近年來,提出的基于機器學習的短期風速預測方法主要有模糊邏輯[7]、人工神經網絡[8]和支持向量機(Support Vector Machine,SVM)[9]。人工神經網絡(Artificial Neural Network,ANN)應用廣泛,它能夠捕捉輸入數據與預測風速值之間的關系[8]?,F有研究提出了前饋神經網絡[10]、遞歸神經網絡[11]、徑向基函數(Radial Basis Function,RBF)神經網絡[12]、自適應小波神經網絡[13]和非線性自回歸神經網絡(nonlinear autoregressive networks,NARNN)[14]用于風速和風力發(fā)電預測?;谌斯ど窠浘W絡的預測方法由于能夠反映輸入輸出變量之間復雜的非線性關系,在時序預測中得到了廣泛應用。人工智能方法可分為淺層和深度學習模型。前饋神經網絡等淺層模型利用單隱層來捕獲時間特征,這種模型無法從數據中自動學習無監(jiān)督的特征。深度學習能夠訓練多層隱藏計算單元,具有很高的泛化能力。文獻[15]將深度疊加自動編碼器(Stacked Auto-Encoder,SAE)應用于短期風電預測。文獻[16]采用深度置信網絡(Deep Belief Network,DBN)進行短期風場預測。DBN和SAE可利用無監(jiān)督的數據來初始化模型參數。文獻[17]指出當深度網絡的驗證錯誤率很小時,即使網絡容量大、復雜度高、最小值很小,也能保證網絡具有很好的泛化能力。
各種回歸方法所作的預測具有不確定性[12],現有方法通常假設輸入變量服從伯努利分布,沒有對實值數據建模,為此,本文提出一種新的區(qū)間概率分布學習模型(IPDL),基于受限玻爾茲曼機(Restricted Boltzmann Machines,RBM)[18]和粗糙集理論[19]從底層輸入時間序列中獲取區(qū)間無監(jiān)督特征。在風速時間序列數據集中,通過降低能量函數,同時增加觀測輸入向量的概率來學習概率分布函數。可見層和隱藏層的條件概率可以很容易地分解為簡單的因子,計算量小。此外,為了有效地訓練IPDL模型,提出一種基于對比散度和Gibbs抽樣的無監(jiān)督學習算法。在此基礎上,提出一種具有實值輸入向量的區(qū)間深度置信網絡(IDBN),利用IPDL來獲得風場數據的概率分布。利用IDBN和FT2IS設計一種混合風速預測方法,稱為深度混合(Deep Hybrid,DH)方法,用于未來風速值的有監(jiān)督回歸。與基于監(jiān)督回歸的ANN、SVR和模糊系統等人工智能方法不同,特征提取不需要關于風力數據的先驗知識。此外,仿真結果表明,該方法能夠準確地處理輸入數據的不確定性。
風速是具有許多波動的非線性時間序列,因此,基于平滑性假設的方法存在諸多不足。本文基于數據驅動,從輸入的風速數據中捕捉統計特征。文獻[19]應用自相關函數(Autocorrelation Function,ACF)來獲得不同時間樣本下風速時間序列的相關性。由于ACF只能計算一個變量與自身的線性相關性,引入互信息(Mutual Information,MI)處理風速數據高度非線性。假設兩個隨機變量X、Y,X的熵由H(X)表示,聯合熵H(X,Y)用于計算其不確定度。用條件熵H(Y|X)=H(X,Y)-H(X)表示在已知變量X時Y的不確定度。兩個隨機變量之間的MI是一個非線性函數,用于測量已知一個變量時,另一變量的信息。MI由I(X,Y)=H(Y)-H(Y|X)計算。t時間的風速值為v(t),計算v(t-l+1)和v(t+1)之間的MI作為時滯。將MI大于閾值0的時滯對應的風速數據作為算法的輸入集,以突出風速時間序列中的相關性。
式中:指數1≤j≤H和1≤k≤D分別對應隱層單元和可見單元。定義聯合概率分布函數為:
圖1 含輸入的區(qū)間概率分布學習模型結構
隱藏向量h給定輸入x的概率為:
(8)
由于隱藏層內的節(jié)點是相互獨立的,所以式(8)的分母可寫成與一個特定隱藏單元對應的單個表達式的乘積:
那么,式(8)的條件概率可以改寫為:
其中,給定輸入x和系數αj的上界隱藏條件概率為:
假設上下界隱藏單元權重相同αj=1-βj=0.5,則式(11)-式(12)中條件概率的前饋計算如下:
利用訓練集Dtr={x(t)|1≤t≤T}中的T個數據樣本訓練上界和下界參數,無監(jiān)督對數概率損失函數為:
式中:J(Dtr)是在數據集Dtr上定義的監(jiān)督誤差函數。為了更新參數θ,關于θ的隨機梯度計算如下:
圖2 IPDL算法流程
為了采用式(15)調整IPDL,通過下式對式(15)的期望運算進行估計:
其中,上界和下界隱藏樣本的計算方式為:
(19)
式中:II(·)是指示函數。
該方法由帶粗糙模式識別的區(qū)間深度置信網絡和模糊II型推理系統組成。圖3給出了所提DH模型的結構。首先,將基于互信息的特征選擇算法應用于歷史風速時序數據,并選擇與未來數據更相關的時間滯后作為D維輸入向量〈x1,x2,…,xD〉。為了從風速分布中提取非線性特征,提出一種基于實值輸入變量IPDL生成模型的區(qū)間深度置信網絡。IDBN包含L個IPDL,這些IPDL堆疊在一起以提取時間特征。通過最大化IPDL模型的對數似然來學習這些特征,作為一種無監(jiān)督的方法來初始化多層神經網絡的權值和偏差。初始化過程也可以看作是一個正則化過程,隨機初始化的參數被移動到一個良好的初始子空間。從IDBN接收到的每個數據樣本的結果被饋送到高斯隸屬度函數,其區(qū)間標準差將被模糊II型TSK推理系統所使用。采用TSK作為回歸模型,對未來時間序列值進行了擬合。
圖3 L=3的DH算法結構
3.1.1無監(jiān)督概率分布學習
圖3給出了所提DH模型的結構。首先,利用提出的IPDL模型和TSK模糊系統設計了一個IDBN。與經典的DBN相比,為了更準確地了解實值風力數據的概率密度,本文考慮了初始IPDL的實值輸入單元。IPDL是連續(xù)訓練的,無須監(jiān)控,使用原始風速時間序列,無須預處理。因此,不需要任何先驗知識來從時間序列中提取特征。每個IPDL使用式(17)-式(19)進行訓練。考慮到IDBN中IPDL模型的個數為L,網絡應連續(xù)地訓練L個模型。第一個IPDL的輸入IPDL1是可見的時間序列數據x=〈x1,x2,…,xD〉。該模型從輸入數據中學習特征。第i個IPDL接收從其先前訓練的IPDLi-1中獲得的特征hi-1。
3.1.2監(jiān)督IDBN調整
IDBN在第L層之后應用線性回歸進行微調,期望的預測輸出作為監(jiān)督信號。初始隸屬度函數的參數是通過聚類從IDBN得到的。在此階段采用有監(jiān)督平方誤差損失函數。
3.1.3FT2IS學習和DH微調
混合預測器采用端到端的隨機梯度下降(StochasticGradient Descent,SGD)方法進行微調。由于該網絡的輸出與IPDL模型的上、下界參數和FT2IS模型是可微的,因此能以端到端的方式有效地訓練整個系統。圖2中提出的學習過程作為參數的正則化技術,有助于IPDL找到DH的區(qū)間權重和偏差的精確初始化。與文獻[20]中隨機初始化的模糊網絡相比,該框架利用生成的IPDL對模糊系統的隸屬度函數進行最優(yōu)初始化,更準確地處理了風力數據的不確定性。
由于對時間序列信號采用伯努利分布對風速預測不夠準確。因此,提出實值輸入向量以更高的估計精度模擬風速分布。所以,新的能量函數定義為:
式中:σ是高斯可見層的標準偏差向量x=〈x1,x2,…,xD〉。xi的條件概率計算方法如下:
為了初始化IDBN的權值和偏差參數,將模型的對數似然最大化為σi=1,以便于訓練過程中應用馬爾可夫鏈蒙特卡羅計算式(15)中的期望值。
式中:*是用作T范數函數的乘積算子。第i條規(guī)則的觸發(fā)可以表示為:
通過式(27)計算回歸輸出:
在對IDBN進行預訓練后,得到hL向量,并將K-Means算法作為無監(jiān)督聚類方法用于激活hL,以確定高斯隸屬函數的初始均值。種群數目被設置為所考慮的成員函數的數目。監(jiān)督誤差函數為:
式中:T是訓練樣本數;Ot是DH輸出;Vt是第t次訓練樣本的輸出。EReg是正則化誤差項:
式中:0<λ<1是正則化系數。為了提高SGD的訓練速度,特別是實值IDBN的自由參數,Jsup相對于后續(xù)部分的自由參數的梯度為:
式中:et=Ot-Vt是第t個訓練樣本的誤差。隸屬函數的均值和區(qū)間標準差參數的梯度計算如下:
式中:M是每個FT2IS輸入的隸屬函數數目,因此,MHL是在所提系統中定義的II類規(guī)則的總數。為了更新粗糙特征(區(qū)間權重和IDBN的偏差),關于每個粗糙單元的上下限參數Jsup的偏導數根據式(19)類似公式計算。所提出模型相對于輸入可微,因此,可以端到端地調整整個深度網絡參數。
算例選用了美國國家可再生能源實驗室統計的某地區(qū)風力數據集[21]。數據集中的風速數據有3年的風速值,連續(xù)歷史樣本之間的間隔為10 min,每年包含52 560個數據,有足夠的數據可用于訓練和測試。DH方法使用離線和在線兩種方式進行訓練。用TS表示訓練集,它包含M個樣本(i),1≤i≤M;用TT表示測試集,它包含N個樣本(j),1≤j≤N。首先,模型在TS離線訓練,在SGD的每個訓練時段對TS的每個樣本使用式(30)-式(31)更新參數。然后,對模型進行在線訓練,即模型在N次迭代中逐個觀察TT中的值。每次迭代時,都會向DH模型提供一個樣本TT(j),并計算相應誤差。在隨后的迭代中將TT(j+1)輸入到前一模型,其誤差被于式(30)-式(31)更新模型。前兩年數據集用于訓練,第三年數據用于測試;從第二年每個季度中數據集選擇15%用于測試。在連續(xù)三個訓練階段,當驗證均方根誤差(Root Mean Square Error,RMSE)的相對變化小于5%時,訓練停止。圖4給出了第二年高度變化的風速時間序列。Kolmogorov-Smirnov、Anderson-Darling和卡方檢驗表明,Weibull概率分布的平均值為7.32 m/s,形狀因子為2.15。
圖4 第二年風速值
圖5給出了滯后l=1到l=100的MI。結果表明,風速測量值之間的相關性隨著時滯的增大而減小。選擇τ=0.4的時間滯后相對應的風速數據作為輸入集,以突出顯示風速數據之間的相關性。假設模型在t時間預測未來風速值,輸入集是24+23=47維向量〈v(t-23),Δv(t-22),v(t-22),…,v(t)〉,風速序列差為Δv(t)=v(t)-v(t-1)。
圖5 第二年數據集不同時差的互信息
采用均方根誤差RMSE和絕對百分比平均誤差(the Mean Absolute Percentage Error,MAPE)對模型進行評價,計算如下:
式中:err(n)=t(n)-o(n)是第n個樣本的測試誤差,t(n)是目標值,o(n)是輸出值。
提出的DH模型以互信息產生的47維輸入向量作為特征選擇算法。每一層的激活單元的數目從φ={5,10,15,…,45}中選擇。IDBN可以包含2到5個IPDL作為混合模型的初始隱藏層。底層迭代次數是避免過度擬合的重要因素,考慮最多80次迭代來訓練模型。此外,當驗證過程在5個階段的變化小于等于0.05的閾值時,滿足訓練過程的停止準則。訓練率η和動量項系數設為0.5。L2正則化的權重衰減參數λ從集合{0.2,0.3,0.4,0.5,0.6}中選擇。最優(yōu)λ對應于訓練過程結束時的最小驗證誤差。
為了確定IDBN的最優(yōu)結構(確定DH算法中L值),對固定集φ進行隨機搜索。根據100次運行的平均驗證誤差選擇最優(yōu)模型。圖6給出了隨著IPDL數量的增加,1 h、10 h和24 h前風速預測的驗證RMSE。可以看出,對于提前1 h預測,具有2個IPDL的IDBN存在最小誤差。當提前預測時間延長到10 h,IPDL數量為3時誤差最小。隨著預測復雜性的增加,IPDL的最優(yōu)數目也隨之增加。對于提前24 h的預測,具有4個IPDL的IDBN具有最小的誤差率。更多的IPDL會導致過度擬合問題,而較少的隱藏層會降低DH的處理能力。
(a) 提前1 h預測結果
(b) 提前10 h預測結果
(c) 提前24 h預測結果圖6 RMSE驗證結果
為了將提出的IPDL與經典DBN進行多步預測,訓練了一個帶有Bernoulli-RBM的DBN來代替DH中提出的IDBN模型。如圖6所示,與DBN模型相比,IDBN在驗證集誤差更小。而且,DBN結構需要更多的隱藏層。例如,在提前24 h預測中,Bernoulli-DBN需要5個生成模型(RBM)才能達到最優(yōu)解,而所提出的體系結構由4個IPDL模型組成。因此,利用所提出的區(qū)間分布學習方法,可以減少深度置信網絡的計算負擔,同時獲得更好的精度。FT2IS回歸模型包含4個輸入變量,對于每個輸入,有3個高斯隸屬函數,規(guī)則的數目是34=81。將3個聚類的K-Means算法應用于IDBN特征,以確定隸屬函數的初始均值。這些函數的標準差和自由參數在[0.01,0.2]中隨機選取。
本文提出的DH方法與持續(xù)性(Persistence,PR)模型[22]在超短期及短期風速預測中進行了比較。此外,還將該模型與現有文獻中的單一模型和混合方法進行了比較。單一模型應用單一回歸架構來預測,為了顯示深度學習對風數據回歸的影響,將基于淺層神經網絡的方法,包括前饋神經網絡FFNN[10]、時滯神經網絡TDNN[11]和非線性自回歸神經網絡NARNN[12]與本文方法進行了比較。此外,將所提模型與當前SAE[15]和深度學習方法DBN[16]進行了比較。
為了提高預測精度,混合模型采用了多重風特征提取和回歸方法。在本文中,將DH模型與混合E-GA-APSO-WNN模型[23]進行了比較,該模型應用集成經驗模式分解(Ensemble Empirical Mode Decomposition,EEMD)來降低風速時序數據中的噪聲,以及將遺傳算法(Genetic Algorithm,GA)與粒子群優(yōu)化(Algorithm of Particle Swarm Optimization,APSO)相結合作為小波神經網絡WNN參數優(yōu)化方法。并與文獻[24]提出的基于特征選擇和參數優(yōu)化的混合回溯搜索算法HBSA的混合極值學習機ELM短期風速預測模型進行了比較。文獻[24]中提出的ELM-HBSA模型有效地捕捉了風速信號的非線性特征,并優(yōu)于ARIMA和SVR兩種預測模型。
4.5.1深度學習與淺層特征學習的比較
表1和表2給出了10 min至3 h前風速預測的RMSE和MAPE,并與淺層和深層單模型方法進行了比較。RMSE、MAPE一般隨著預測時間的延長而增加。PR方法可產生準確的短期預測結果,提前10 min的RMSE為0.625 m/s,提前3 h的RMSE為2.785 m/s。提前10 min預測的平均相對誤差為10.983,在提前3 h預測中達到30.174。因此,將PR不適用于長期預測。
表1 單一模型不同時段的RMSE 單位:m/s
表2 單一模型不同時段的MAPE
與PR相比,FFNN得到了更好的結果。在提前10 min預測中,FFNN的RMSE較PR提高了7.04%;對于提前3 h的預測,提高了24.20%。PR在提前3 h預測中性能較差是由于該模型只有簡單平滑假設。TDNN模型和NARNN模型都優(yōu)于FFNN模型,因為這些方法可以在捕獲數據的時間特征的同時對時序數據的序列屬性進行建模。與FFNN相比,TDNN的RMSE和MAPE分別提高了5.80%和8.32%。NARNN的RMSE和MAPE結果分別比FFNN好12.56%和11.60%。與FFNN和TDNN模型相比,NARNN是最好的淺層神經結構。將NARNN與深度網絡SAE進行比較,結果表明,與NARNN相比,SAE的RMSE和MAPE分別改善了7.23%、17.82%。當采用DBN模型時,RMSE和MAPE的改善效果分別提高了8.99%和22.44%。由于具有更多的非線性隱藏層和捕捉輸入分布,使得DBN和SAE具有更好的泛化能力,有助于獲得更精確的風速預測。與文獻[15]中提出的SAE相比,DBN具有更好的準確性,因為無監(jiān)督特征提取是通過RBM完成的,可以更好地獲得輸入分布。
與DBN和SAE相比,該混合模型得到了更為精確的結果。與文獻[16]提出的DBN相比,本文模型使RMSE降低了2.7%,MAPE降低了23.90%。基于DBN的混合模型的改進在于:(1) 利用所提出的區(qū)間特征和FI2IS進行回歸,通過從時間序列中獲取區(qū)間來處理風速數據中存在的不確定性;(2) 采用實值輸入單元,與SAE和DBN相比,具有更高的精度。圖7給出了第三年中72個樣本的提前3 h預測的NARNN和DBN預測結果與實際風速??梢钥闯?DBN通過學習風數據概率分布,改進了NARNN的結果。圖8給出了文獻[16]中提出的采用RBM的DBN與本文方法的比較結果??梢钥闯?DBN的最大絕對誤差值為0.98 m/s,IDBN模型將此誤差減小到0.43 m/s,產生更準確的結果。這是因為:(1) 所提出的IPDL模型從數據中學習到一個區(qū)間隱藏關系;(2) 與使用二進制輸入單元的DBN相比,本文模型采用從實值數據中學習的實值輸入變量。
圖7 第三年某日提前3 h預測值與實際風速
圖8 第三年某日測試樣本與提前1 h預測結果比較
4.5.2混合方法的比較
表3和表4給出了所提DH模型的RMSE和MAPE,以及E-GA-apsown和ELM-HBSA兩種基礎混合方法的結果。兩種基礎混合方法都采用信號分解來降低噪聲,而DH模型從數據中獲取區(qū)間特征,以處理風數據的不確定性。與ELM-HBSA相比,E-GA-APSO-WNN在提前1 h和3 h預測中的MAPE分別改善了10.39%和13.61%。DH模型優(yōu)于E-GA-APSO-WNN。對于超短期(提前10 min)的預測,DH模型相對于E-GA-APSO-WNN的MAPE結果改善了45.96%,這是由于提出的深度網絡采用了自動無監(jiān)督深度特征提取。在提前3 h預測中,與ELM-HBSA和E-GA-APSO-WNN相比,DH模型的MAPE分別減少21.19%和8.79%。
表3 混合模型不同時段的RMSE 單位:m/s
表4 混合模型不同時段的MAPE
圖9和圖10分別給出了從提前1 h預測到提前24 h預測的所有單一模型和混合方法的RMSE和MAPE結果。與混合方法相比,SAE和DBN在提前1 h到提前7 h預測中具有較好的精度;但是,對于較大的預測時間步長,混合方法在RMSE和MAPE中都有顯著的改進。當提前預測時間超過5 h時,所提DH模型的性能明顯優(yōu)于E-GA-APSO-WNN和ELM-HBSA。
圖9 1 h至24 h預測的各模型平均RMSE結果
圖10 1 h至24 h預測的各模型平均MAPE結果
4.5.3不確定性對模型性能的影響
為了說明風速數據不確定性對模型性能的影響,采用兩個擴展的DH模型作為基線,分別為:(1) DHdense采用RBMs代替IPDL模型,為了研究區(qū)間特征學習的效果,將本文提出的DH方法與該模型進行了比較;(2) DHTypeI采用模糊I型推理系統代替FT2IS回歸模型,本文提出的DH方法與該模型進行了比較,研究了從深度網絡中捕獲區(qū)間II型規(guī)則的效果。在不同不確定性條件下,將基線與DH模型進行了比較。根據文獻[15]對風速預測模型的魯棒性實驗,每個風速測試樣本v考慮高斯噪聲Gauss(μ,σ2),μ=0,σ=0.1v。圖11給出了DH、DHdense和DHTypeI每小時絕對預測誤差的盒須圖。與DHdense和DHTypeI對應的框的最小值、中值和最大值都小于采用DH方法相應的值。
圖11 DH、DHdense和DHTypeI每小時絕對預測誤差
可以看出,所測數據均未出現異常點。提前1 h預測時,DH每小時絕對預測誤差為1.25 m/s、DHdense每小時絕對預測誤差為1.11 m/s,DHTypeI每小時絕對預測誤差為1.05 m/s。根據提前1 h預測結果可知,DHTypeI的風速數據不確定性對模型性能的影響較小,整體情況比較穩(wěn)定。提前3 h預測時,DH每小時絕對預測誤差為1.37 m/s、DHdense每小時絕對預測誤差為1.31 m/s,DHTypeI每小時絕對預測誤差為1.15 m/s。根據提前3 h預測結果可知,DHTypeI的不平衡數據較少,整體情況比較穩(wěn)定。
4.5.4IPDL與RBM的比較
為對所提IPDL方法和RBM進行比較,定義了兩個基線:(1) IPDLreg模型包括IPDL和線性回歸模型;(2) RBMreg包括IPDL和線性回歸模型。圖12比較了IPDLreg和RBMreg在測試RMSE方面的性能。如圖6所示,當預測時間范圍延長時,需要具有更多隱藏層的更復雜網絡來獲得高精度;然而,具有太多的層將由于梯度而降低模型性能。在圖12中,IPDLreg在搜索空間的更寬區(qū)域中具有更低的測試RMSE,性能更好,IPDLreg對增加或減少層的數量不太敏感。但是,RBMreg的性能更多地取決于隱藏層的數量。此外,與RBMreg相比,IPDLreg的精度更高,這表明了本文方法相對于RBM的優(yōu)越性。
圖12 多時段IPDLreg與RBMreg的RMSE比較
4.5.5運行時間分析
圖13給出了使用不同下降梯度的DH的離線訓練時間。算例在一個多GPU計算機系統上實現,該系統有兩個NVIDIA GTX980圖形卡和一個4.2 GHz的四核處理器。可以看出,離線訓練時間隨著時間范圍的延長而增加,這是因為隱藏層的數量隨著相應回歸問題的復雜性而增加。本文方法適用于短期風速預測。對于時間范圍小于10 min的預測,在將模型用于實際預測之前,可以使用歷史數據離線調整模型。
圖13 基于不同下降梯度的DH離線訓練時間
本文提出一種基于深度學習、粗糙集理論和模糊集理論的風電預測混合模型。為了從風力數據的概率分布中學習特征,設計了一種基于實值輸入RBM的無監(jiān)督概率分布學習模型。將粗糙集理論與深度模型相結合,設計了區(qū)間分布學習結構?;谒岢龅姆植紝W習模型和模糊II型推理系統,進一步設計了一個具有上下界參數估計的區(qū)間深度置信網絡。利用所提出的IPDL的特征,將模糊系統應用于底層目標函數的有監(jiān)督預測。由于IPDL和FT2IS的可微性,該模型利用有監(jiān)督的期望輸出信號,端到端的方式訓練模型。本文方法采用粗糙集處理噪聲進行特征提取,并且結合模糊推理系統進行預測,仿真結果表明,與其他方法相比,所提出的IPDL模型及其新的學習算法對預測結果有了顯著改善,預測結果相當準確。此外,在處理數據不確定性方面,與RBM算法相比,本文算法由于在IPDL中使用了實值輸入變量以及區(qū)間上下界參數,能夠獲得變量的深層特征,魯棒性更好。后續(xù)可在具有更高多樣性的時間序列特征上進行研究。