• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于CS-AGA-BP神經(jīng)網(wǎng)絡的房價預測分析

      2021-01-15 05:50:40曹亞龍繆妍婧
      電子產(chǎn)品世界 2021年12期
      關鍵詞:房價預測

      曹亞龍 繆妍婧

      摘要:針對傳統(tǒng)BP神經(jīng)網(wǎng)絡容易陷入局部最優(yōu)的缺陷,以及基于遺傳算法改進的BP神經(jīng)網(wǎng)絡仍有改進空間的問題,本文建立CS(chaotic sequence)-AGA(adaptive genetic algorithms)-BP(基于混沌序列的自適應遺傳算法改進的神經(jīng)網(wǎng)絡)改進模型,改進分為兩個方向:1交叉概率和變異概率采用自適應算法確定;2通過Logistic混沌序列對交叉位置進行確定,并進行多基因變異,選取美國波士頓房價數(shù)據(jù)集并按4:1比例設置訓練數(shù)據(jù)與測試數(shù)據(jù),對隱含層節(jié)點進行確定后,選取train訓練函數(shù)。經(jīng)過MATLAB編程對GA-BP神經(jīng)網(wǎng)絡、PSO-BP神經(jīng)網(wǎng)絡、RBF神經(jīng)網(wǎng)絡與傳統(tǒng)BP神經(jīng)網(wǎng)絡進行精度對比;另外經(jīng)過計算發(fā)現(xiàn)CS-AGA-BP神經(jīng)網(wǎng)絡預測精度得到提升,多次運行均方差要低于GA-BP神經(jīng)網(wǎng)絡,可以認為模型優(yōu)化取得良好的效果。

      關鍵詞:CS-AGA-BP;預測;房價

      1算法基本原理

      1.1BP神經(jīng)網(wǎng)絡簡介

      BP(back propagation)神經(jīng)網(wǎng)絡是一種多層前饋型神經(jīng)網(wǎng)絡,其具有三層及三層以上的多層結構,每層均由若干神經(jīng)元組成,相鄰層間的神經(jīng)元均實現(xiàn)全連接,而上下層各神經(jīng)元間無連接。BP神經(jīng)網(wǎng)絡分為輸入層、隱含層和輸出層,輸入層和輸出層均為一層結構,節(jié)點數(shù)目分別為自變量與因變量的數(shù)目,隱含層數(shù)不設限制,依據(jù)Kolrnogorov定理,所有3層的BP神經(jīng)網(wǎng)絡均可以趨近于任意的非線性函數(shù),因此隱含層一般取1層,節(jié)點數(shù)目由經(jīng)驗函數(shù)確定。BP神經(jīng)網(wǎng)絡按有導師的學習方式進行訓練,當一對學習模式提供給網(wǎng)絡后,網(wǎng)絡神經(jīng)元將按“輸入層-隱含層-輸出層”路徑傳播,輸出層輸出網(wǎng)絡響應,信號誤差沿“輸出層-隱含層-輸入層”路徑傳播以逐層修正各連接權和閾值,此過程被稱為“誤差逆?zhèn)鞑ニ惴ā?,隨著修正次數(shù)的增加,網(wǎng)絡對輸入模式響應的正確率不斷提高,輸出值逐步逼近期望輸出。BP神經(jīng)網(wǎng)絡示意圖如圖1所示。

      有監(jiān)督的BP神經(jīng)網(wǎng)絡機器學習步驟:BP神經(jīng)網(wǎng)絡共有輸入層、隱含層和輸出層3層結構,設輸入層有m個變量,隱含層有l(wèi)個變量,輸出層有n個變量。輸入層、隱含層和輸出層的節(jié)點分別用下標g、h、j表示;用ωgh表示輸入層和隱含層節(jié)點間的權值,用ah表示閾值;用ωhi表示隱含層和輸出層節(jié)點間的權值,用bi表示偏置;學習速率設置為θ。對于輸入的因變量數(shù)據(jù)x,設其目標輸出值為y*,實際輸出值為y。將選定的數(shù)據(jù)組作為樣本進行網(wǎng)絡訓練,根據(jù)目標輸出值與實際輸出值間的誤差進行正、反向傳遞處理。

      計算正向反饋:當輸入第j個數(shù)據(jù)時,由輸入層節(jié)點g到隱含層節(jié)點h的總輸入(加權和)為:

      輸入值和隱含層之間的關系通過激勵函數(shù)——Sigmoid函數(shù)處理,隱含層節(jié)點h的輸出值為:

      則輸出層節(jié)點i的輸出值為:

      將j組訓練數(shù)據(jù)的輸出值與目標輸出值的誤差平方和作為網(wǎng)絡訓練指標,即:

      因為Sigmoid激勵函數(shù)連續(xù)可微,所以訓練指標函數(shù)也連續(xù)可微。反向傳遞調(diào)整各層權值:為使誤差盡量減小,進行網(wǎng)絡訓練時需要逐步對網(wǎng)絡結構進行優(yōu)化,采用梯度下降法對權值ωgh、ωhi和閾值ah、bi進行更新以優(yōu)化網(wǎng)絡結構。

      多次對權值和閾值進行修正后網(wǎng)絡達到預先設定的目標誤差或者最大學習次數(shù)則結束算法,網(wǎng)絡訓練成功。

      1.2遺傳算法簡介

      遺傳算法(genetic algorithms,GA)是一種基于達爾文進化論中的自然選擇原理和自然遺傳機制的搜索(尋優(yōu))算法,其通過模擬自然界中的生命進化機制在人工系統(tǒng)中的特定目標進行逐步優(yōu)化。遺傳算法實質(zhì)類似于粒子群算法和模擬退火等智能算法,屬于群體搜索技術,其中的種群會依據(jù)適者生存的原則逐代進化,最終得到最優(yōu)解或準最優(yōu)解。其必備步驟包含以下幾種:初始群體的產(chǎn)生、計算群體中個體的適應度、依據(jù)適者生存的原則選擇適應度較大的優(yōu)良個體、被選出的優(yōu)良個體兩兩配對,隨機交叉染色體基因并隨機變異某些基因生成新群體,按此方法逐代進化,直至達到迭代次數(shù)或滿足精度時終止進化,找出最優(yōu)解。

      生物中的遺傳概念在遺傳算法中的對應關系如表1所示。

      1.3GA-BP神經(jīng)網(wǎng)絡簡介

      傳統(tǒng)BP神經(jīng)網(wǎng)絡存在收斂速度慢且不利于尋求全局最優(yōu)解的缺點,而利用遺傳算法對原始BP神經(jīng)網(wǎng)絡進行優(yōu)化可以對BP神經(jīng)網(wǎng)絡的權值和閾值進行更加精確的修正與優(yōu)化,遺傳算法的加入可以有效克服BP神經(jīng)網(wǎng)絡容易陷入局部最優(yōu)且收斂速度慢的缺陷。遺傳算法部分參數(shù)需要根據(jù)經(jīng)驗進行設定,本研究涉及的遺傳算法參數(shù)如下。

      進化終止代數(shù):進化終止代數(shù)即最大迭代次數(shù),進化終止代數(shù)過小可能不會得到收斂的結果,過大則會造成過擬合現(xiàn)象。本研究選取最大迭代次數(shù)為20。

      種群規(guī)模:種群規(guī)模過小會造成病態(tài)基因的出現(xiàn)概率增大,不利于種群的進化,過大則會造成難以收斂且會浪費資源。本研究選取種群規(guī)模為10。

      交叉概率:交叉概率關系到種群的更新速率,過大會破壞已有的較好的種群,捕捉不到最優(yōu)解,過小則不能有效更新種群。本文選取交叉概率為20%,后續(xù)采用自適應更新公式自行確定交叉概率。

      變異概率:變異概率關系到種群的多樣性變化,變異概率過小會造成種群多樣性下降過快,部分缺陷基因迅速丟失且不易修補,過大則會造成高階模式的破壞概率增大。本研究選取變異概率為10%,后續(xù)采用自適應更新公式自行確定變異概率。

      利用遺傳算法對BP神經(jīng)網(wǎng)絡進行優(yōu)化的具體流程如下。

      1)遺傳算法參數(shù)初始化:對遺傳算法中的迭代次數(shù)、種群規(guī)模、交叉概率和變異概率進行初始化,迭代次數(shù)取20,種群規(guī)模取10,交叉概率取20%,變異概率取10%。

      2)種群初始化:將種群的信息定義為一個結構體,存儲10個個體的適應度值和染色體的編碼信息。

      3)染色體編碼和適應度計算:遍歷10個種群的循環(huán),通過對各種群中每個個體的染色體隨機賦值并測試其取值是否位于變量邊界限制內(nèi),只保留符合條件的編碼;將編碼后的染色體分段,分為輸入層與隱含層連接的權值、隱含層神經(jīng)元閾值、隱含層與輸出層連接的權值和輸出層神經(jīng)元閾值,將編碼作為神經(jīng)網(wǎng)絡權值的賦值,設置網(wǎng)絡的進化參數(shù),迭代次數(shù)為20,學習率為10%,最小目標值誤差為0.0001,訓練網(wǎng)絡并進行模擬預測,將預測值與實際值之差的絕對值作為染色體對應的適應度值。

      4)確定最優(yōu)染色體:根據(jù)適應度值挑選出最好的染色體適應度。

      5)優(yōu)良個體的選擇:將個體適應度值取倒數(shù)得到的數(shù)值作為其被選中的可能,將所有個體的可能值歸一化處理作為概率,該值越大說明適應度值越小,該個體越優(yōu)良,越容易作為父代經(jīng)歷交叉變異的過程,采用輪盤賭算法隨機產(chǎn)生選擇值,根據(jù)其落在哪個個體的概率區(qū)間內(nèi),將該個體作為父代并儲存信息。輪盤賭規(guī)則的算法流程和轉盤概率分布示意如圖2所示。

      6)交叉和變異:對種群所有個體進行遍歷,依據(jù)交叉概率隨機選取2條染色體并隨機選擇交叉位進行交叉,如果2條染色體均可行則進行交叉,然后對新的種群信息進行存儲;依據(jù)變異概率隨機選取2條染色體并進行變異,如果2條染色體均可行則進行變異,然后對新的種群信息進行存儲。

      7)最優(yōu)初始閾值和權值的賦值:將進化了20代的種群的最優(yōu)的基因賦值給神經(jīng)網(wǎng)絡用來預測。8)神經(jīng)網(wǎng)絡的訓練與測試:得到最優(yōu)權值和閾值以及輸入層、隱含層和輸出層的數(shù)值后,利用訓練數(shù)據(jù)對網(wǎng)絡進行訓練,然后利用后面較少的數(shù)據(jù)進行預測以

      及誤差檢驗。

      1.4CS-AGA-BP神經(jīng)網(wǎng)絡的改進簡介

      為更大程度地增強BP神經(jīng)網(wǎng)絡的優(yōu)化效果,本文最終采用CS-AGA-BP神經(jīng)網(wǎng)絡對原模型進行改進。改進分為兩個方向:1交叉概率和變異概率采用自適應算法確定;2通過Logistic混沌序列對交叉位置進行確定,并進行多基因變異。

      普通遺傳算法中的交叉率和變異率是人為給定的,其對遺傳算法的行為和性能有著關鍵影響。交叉率過大,新個體產(chǎn)生的速度就越快,但是很容易破壞遺傳模式,一些高適應度的個體結果很快就會被破壞,如果交叉率過小,個體間不能傳遞信息產(chǎn)生新個體,搜索過程會變得緩慢甚至停滯不前;變異率過大,遺傳算法就變成了隨機搜索算法,變異率過小就不易產(chǎn)生新個體?;诖耍琒rinvivas等人提出用自適應遺傳算法來控制交叉率和變異率的大小,使其隨適應度自動改變,適應度越接近最大適應度值,交叉率和變異率就越小,為防止進化初期最優(yōu)個體不發(fā)生交叉和變異,對其交叉率和變異率進行初始化,同時為了防止每一代的最優(yōu)個體被破壞,通過精英選擇策略將它們直接復制到下一代。交叉率和變異率的調(diào)整公式為:

      其中,fmax為全體中最大的適應度值,favg為全體的平均適應度值,f′為交叉的2個個體中較大的適應度值,f為變異個體的適應度值。該式中Pc1取值為0.2,Pm1取值為0.1。

      遺傳算法跳出局部最優(yōu)解尋求全局最優(yōu)解時依賴于交叉和變異操作,在交叉操作中,單點交叉(段交叉)、多點交叉和均勻交叉使用較多;變異操作一般使用Guassian分布的隨機變異來實現(xiàn)。許多學者采用不同方法進行變異操作以優(yōu)化遺傳算法,但改進效果并不明顯。而混沌系統(tǒng)可以對交叉和變異操作同時進行改進,在交叉操作中,以“門當戶對”原則進行個體配對,通過混沌序列確定交叉點,確保算法收斂精度,削弱和避免尋優(yōu)抖振問題;在變異操作中,混沌序列可以對染色體中多個基因進行變異,以避免算法早熟。本文采用Logistic混沌序列進行遺傳改進,如式所示:

      x(n+1)=4x(n)[1x(n)?](6)

      CS-AGA-BP

      神經(jīng)網(wǎng)絡優(yōu)化過程如圖3所示。

      2算法的基本算例

      2.1數(shù)據(jù)來源與處理

      本文采用數(shù)據(jù)是數(shù)據(jù)挖掘領域常用的美國波士頓房價數(shù)據(jù)集,格式為506?14,取前500行數(shù)據(jù),前80%行用作訓練數(shù)據(jù),后20%行用作測試數(shù)據(jù)。以前13個指標作為模型自變量,以MEDV作為模型因變量。為便于將輸入樣本矩陣的輸入范圍控制在(-1,1)內(nèi)以消除量綱影響,需運用MATLAB軟件中的mapminmax函數(shù)對所有數(shù)據(jù)進行歸一化處理,即:

      其中,α是歸一化前的變量;αmax和αmin分別為α的最大值和最小值;α是歸一化后的變量。

      2.2隱含層節(jié)點確定

      神經(jīng)網(wǎng)絡隱含層節(jié)點數(shù)的選擇相當重要,其對神經(jīng)網(wǎng)絡的性能影響很大,如果隱含層節(jié)點數(shù)過少,神經(jīng)網(wǎng)絡很難建立復雜的判斷界,達不到合適的訓練精度,容錯性差;隱含層節(jié)點數(shù)過多,雖然會降低誤差,提高精度,但是神經(jīng)網(wǎng)絡會趨向于復雜,從而造成訓練時間增加和過擬合的情況。為確保在滿足精度的前提下降低網(wǎng)絡復雜性,即選取合適的隱含層節(jié)點數(shù)目,本研究采取以下經(jīng)驗函數(shù)來確定BP神經(jīng)網(wǎng)絡隱含層的節(jié)點數(shù)目:

      hiddennum=inputnum+outputnum+α(8)

      其中,hiddennum是隱含層節(jié)點的數(shù)目,inputnum是輸入層節(jié)點的數(shù)目,outputnum是輸入層節(jié)點的數(shù)目,α是1~10之間的取整調(diào)節(jié)常數(shù)。本研究中inputnum=13,outputnum=1,hiddennum取值范圍為5~14。為了挑選出最優(yōu)的隱含層節(jié)點數(shù),此處采用均方差誤差(RMSE)進行衡量,其計算公式如下所示:

      其中,n表示樣本數(shù)目,yi表示實際房價,y?i表示預測的房價。將hiddennum從5~14共10個值分別代入MATLAB程序中獨立運行,最后選取RMSE最小時的10作為隱含層節(jié)點數(shù)。

      2.3訓練函數(shù)的選取

      本文運用MATLAB中newff函數(shù)構建前饋型神經(jīng)網(wǎng)絡,newff函數(shù)中的訓練方法有基本梯度下降法(traingd)、帶有動量項的梯度下降法(traingdm)和帶有動量項的自適應學習算法(traingdx)等。本研究選取適用于遺傳算法優(yōu)化神經(jīng)網(wǎng)絡的訓練函數(shù)train進行訓練。網(wǎng)絡進化參數(shù)分別設置最大迭代次數(shù)為100,學習率為0.1,最小目標值誤差為0.0001。

      3算例的MATLAB計算結果與解析

      為了便于探究GA-BP神經(jīng)網(wǎng)絡的優(yōu)化效果,本文選取PSO-BP、傳統(tǒng)BP和RBF神經(jīng)網(wǎng)絡與GA-BP神經(jīng)網(wǎng)絡的預測效果進行對比。神經(jīng)網(wǎng)絡的學習率為0.1,迭代次數(shù)為100,隱含層節(jié)點數(shù)為10。針對后100組數(shù)據(jù)進行預測,并將預測數(shù)據(jù)與實際數(shù)據(jù)進行對比分析誤差,如圖4所示。

      通過MATLAB計算可以看出GA-BP神經(jīng)網(wǎng)絡和PSO-BP神經(jīng)網(wǎng)絡預測精度較高,但是經(jīng)多次運算發(fā)現(xiàn)PSO-BP神經(jīng)網(wǎng)絡預測精度并不穩(wěn)定。RBF神經(jīng)網(wǎng)絡和傳統(tǒng)神經(jīng)網(wǎng)絡誤差較大,但是RBF神經(jīng)網(wǎng)絡的優(yōu)點是輸出結果非常穩(wěn)定。

      通過CS-AGA-BP神經(jīng)網(wǎng)絡對數(shù)據(jù)進行訓練與預測,與原始GA-BP神經(jīng)網(wǎng)絡誤差百分比進行對比,如圖5所示。

      經(jīng)過MATLAB此次計算,精度提升14.97%,雖然遺傳算法對神經(jīng)網(wǎng)絡權值和閾值的更新具有隨機選擇性,但經(jīng)過多次計算對比取平均數(shù),CS-AGA-BP神經(jīng)網(wǎng)絡的均方差要低于GA-BP神經(jīng)網(wǎng)絡的均方差,誤差百分比也有所減小,因此可以認為模型優(yōu)化取得良好的效果。

      參考文獻:

      [1] GEN?AY R,YANG X.A forecast comparison of residential housing prices by parametric versus semiparametric conditional mean estimators[J].Economics Letters,1996,52 (2):129-135.

      [2]王宇星,黃俊,潘英杰.GA-BP神經(jīng)網(wǎng)絡在老人負性情緒預測中的應用[J].小型微型計算機系統(tǒng),2020,41(8):1702-1706.

      [3]羅博煒,洪智勇,王勁屹.多元線性回歸統(tǒng)計模型在房價預測中的應用[J].計算機時代,2020(6):51-54.

      [4]楊再宋,謝菊芳,胡東,等.基于AW-GA-BP算法的配電網(wǎng)設備運行環(huán)境相對濕度的預測方法及應用[J].重慶師范大學學報(自然科學版),2019,36(6):104-109,2.

      [5]惠天宇,杜尚勉,陳樂至,等.基于GA-BP神經(jīng)網(wǎng)絡的手足口病疫情預測[J].教育教學論壇,2020(38):133-134.

      [6]魯明.基于PCA-GA-BP模型對污水BOD的預測[J].湖北汽車工業(yè)學院學報,2019,33(4):57-61,76.

      [7]羅成.基于SVD-GA-BP神經(jīng)網(wǎng)絡模型的股價預測[J].佳木斯大學學報(自然科學版),2019,37(6):988-991.

      [8]趙銘生,劉守強,紀潤清,等.基于遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡的華北型煤田礦壓破壞帶深度預測[J].礦業(yè)研究與開發(fā),2020,40(6):89-93.

      [9]司守奎,孫兆亮.數(shù)學建模算法與應用[M].北京:國防工業(yè)出版社,2015.

      [10]閔江濤,楊杰,馬晨原.基于改進GA-BP網(wǎng)絡算法的邊坡力學參數(shù)反演分析[J].水電能源科學,2019,37(11):152-155.

      [11] NING M,GUAN J,LIU P,et al.GA-BP air quality evaluation method based on fuzzy theory[J]. Computers,materials & continua,2019,58(1):215-227.

      [12] TANG T,Yuan S,Tang Y,et al.Optimization of impulse water turbine based on GA-BP neural network arithmetic[J].Journal of mechanical science and technology,2019,33(1):241-253.

      猜你喜歡
      房價預測
      無可預測
      黃河之聲(2022年10期)2022-09-27 13:59:46
      選修2-2期中考試預測卷(A卷)
      選修2-2期中考試預測卷(B卷)
      選修2—2期中考試預測卷(A卷)
      盛松成:什么才是中國房價持續(xù)上漲的真正原因?
      梧州市房價運行和減少金融杠桿的思考
      活力(2021年6期)2021-08-05 07:24:38
      防范未然 “穩(wěn)房價”更要“穩(wěn)房租”
      中華建設(2019年8期)2019-09-25 08:26:04
      不可預測
      不必預測未來,只需把握現(xiàn)在
      去庫存的根本途徑還在于降房價
      公民與法治(2016年8期)2016-05-17 04:11:34
      阜阳市| 丹棱县| 泾源县| 城口县| 张家界市| 二连浩特市| 桑植县| 福安市| 时尚| 汉川市| 五台县| 江口县| 谷城县| 佛学| 景德镇市| 澄城县| 蕉岭县| 阜平县| 安丘市| 类乌齐县| 藁城市| 万载县| 蓝田县| 无极县| 新建县| 盐亭县| 定西市| 朝阳市| 新干县| 锦屏县| 延吉市| 古蔺县| 平罗县| 灯塔市| 伊春市| 来凤县| 邵阳市| 沙坪坝区| 盐边县| 黄梅县| 井冈山市|