鄒曉玫,修春波
(1.天津商業(yè)大學 法學院,天津300134;2.南開大學 周恩來政府管理學院,天津300071;3.天津工業(yè)大學 電氣工程與自動化學院,天津300160)
中國是世界人口第一大國,人口問題一直是關(guān)系中國發(fā)展的重要因素之一。人口數(shù)量以及人口增長趨勢的正確預測對于人口和宏觀調(diào)控政策的制定具有重要的指導意義。目前,用于人口預測的數(shù)學模型有很多,如一元線性回歸法、自回歸法、指數(shù)函數(shù)法、冪函數(shù)法、多元回歸模型法、灰色系統(tǒng)法、神經(jīng)網(wǎng)絡方法等。這些方法通常是采用擬合歷史數(shù)據(jù)的方法建立近似的數(shù)學模型。
由于人口系統(tǒng)十分復雜,其變化與生育、死亡、疾病、環(huán)境、社會、經(jīng)濟等諸多因素有關(guān)。簡單的數(shù)據(jù)擬合方法很難揭示其內(nèi)在的本質(zhì),因此上述模型的建立具有一定的局限性。
本文提出一種新的混沌算子模型用于預測我國人口數(shù)量。該模型通過不斷訓練控制參數(shù)逐漸逼近人口系統(tǒng)的動力學行為,從而得到良好的預測結(jié)果。
根據(jù)已有人口數(shù)據(jù)建立人口模型十分困難,這主要是由于人口系統(tǒng)是一個非常復雜的非線性動力系統(tǒng),有多種因素直接或間接地對該系統(tǒng)產(chǎn)生影響,這些因素之間也存在著各種復雜的耦合關(guān)系,無法解析表達。另外,目前已有的人口數(shù)據(jù)量少,數(shù)據(jù)信息不全面,數(shù)據(jù)的采樣間隔大,通常兩個相鄰的數(shù)據(jù)之間的采樣間隔為1年。幾個相鄰的數(shù)據(jù)跨越幾年的時間。在這幾年中,社會環(huán)境和自然環(huán)境可能發(fā)生了巨大的變化,人口模型也可能已經(jīng)發(fā)生了本質(zhì)的改變。也就是說,人口模型實質(zhì)上是一個隨著時間的推移不斷變化的動態(tài)模型,本質(zhì)上無法用一成不變的靜態(tài)數(shù)學模型對其進行描述。
據(jù)此,本文提出一種新的預測模型,預測模型由多個混沌算子加權(quán)和的形式構(gòu)成。通過不斷調(diào)整混沌算子的控制參數(shù),來改變各個混沌算子的動力學行為。最終使得預測模型的動力學特性逐漸趨近于人口系統(tǒng)的動力學特性,并不斷隨之變化,從而實現(xiàn)人口數(shù)據(jù)的預測。
混沌映射具有豐富的動力學特性,例如式(1)的映射即為一個混沌映射,調(diào)節(jié)控制參數(shù)α可使該映射產(chǎn)生不同的動力學行為。圖1給出了控制參數(shù)α變化時該映射的Lyapunov指數(shù)圖。Lyapunov指數(shù)大于0時意味著混沌的發(fā)生,且Lyapunov指數(shù)越大,混沌度也越大。
圖1 函數(shù)xn+1=sinαxn的Lyapunov指數(shù)隨α變化圖
本文將式(1)映射選為混沌算子,采用多個混沌算子加權(quán)和的形式構(gòu)造出如下的預測模型:
其中y為模型的預測值,xj為模型的第j個輸入,zi為第i個混沌算子的總輸入,αi為第i個混沌算子的控制參數(shù)。wi2為第i個混沌算子的加權(quán)系數(shù),wji1為第j個輸入與第i個混沌算子的連接系數(shù)。M為混沌算子的數(shù)量,m為輸入數(shù)據(jù)個數(shù)。為了簡化模型,權(quán)值系數(shù)設置為:wi2=1/M,wji1=1。這樣,預測模型的動力學行為就完全由混沌算子的控制參數(shù)決定。調(diào)整每個混沌算子控制參數(shù)的大小,可使得每個混沌算子具有不同的動力學特性,從而可使得預測模型表現(xiàn)出不同的動力學行為。利用已知數(shù)據(jù)可構(gòu)造出預測模型的訓練樣本,通過不斷調(diào)整混沌算子控制參數(shù),可使得預測模型逐漸逼近待預測系統(tǒng)的動力學行為,并保持其隨之變化,從而完成時間序列的預測功能。
設已知的人口數(shù)據(jù)為{x1,x2,…,xn},預測的步長為p,則可構(gòu)造出(n-m+1-p)個訓練樣本,第i個訓練樣本為:Xi=[(xi,xi+1,…,xi+m-1)(xi+m-1+p)],其中(xi,xi+1,…,xi+m-1)為第 i個訓練樣本的輸入數(shù)據(jù),(xi+m-1+p)為第i個訓練樣本的期望輸出。
由于混沌算子具有復雜的動力學行為特性,通常的學習算法很難實現(xiàn)混沌算子參數(shù)的調(diào)整,這里采用一種簡單的試湊法完成混沌算子參數(shù)的訓練。具體描述如下:
Step1.初始化參數(shù)。樣本序號k=1,混沌算子序號l=1,在(0,1)范圍內(nèi)隨機初始化混沌算子參數(shù)αi。
Step2.輸入第k個訓練樣本,計算預測模型的輸出及其與期望值之間的誤差。
Step3.正向調(diào)節(jié)第l個混沌算子參數(shù)值。增大該混沌算子參數(shù),即
其中,λ為調(diào)解尺度,c為(0,1)之間的隨機數(shù)。
計算此時預測模型的輸出與期望值之間的誤差,如果誤差減小,則繼續(xù)按照式(4)向正方向調(diào)節(jié)該混沌算子參數(shù)值。如果誤差增大,則停止調(diào)節(jié),并將該混沌算子參數(shù)值恢復為調(diào)節(jié)之前的值。
Step4.采用Step3中類似的方法,利用式(5)反方向調(diào)節(jié)混沌算子參數(shù)值。
Step5.l=l+1,如果l≤M,則返回Step3繼續(xù)調(diào)節(jié)下一個混沌算子參數(shù)。如果l>M,則轉(zhuǎn)至Step6。
Step6.l=1,k=k+1,如果k≤(n-m+1-p),則返回Step2繼續(xù)訓練參數(shù)。如果k>(n-m+1-p),則完成樣本訓練,轉(zhuǎn)Step7。
Step7.輸入(xk+1,xk+2,…,xk+m),計算預測模型的輸出值即為預測結(jié)果。
預測模型根據(jù)訓練樣本的誤差逐一調(diào)節(jié)混沌算子控制參數(shù),使得預測模型逐步逼近預測序列的動力學特性,并隨之不斷改變。這比單一的靜態(tài)擬和數(shù)據(jù)相比增強了自適應性。對于采樣間隔長、動力學特性隨時改變的系統(tǒng)來說將具有良好的預測性能。
利用《中國人口統(tǒng)計年鑒》和《中華人民共和國2009年國民經(jīng)濟和社會發(fā)展統(tǒng)計公報》上的數(shù)據(jù),對中國人口總數(shù)進行預測分析。所得預測結(jié)果和誤差曲線如圖2和圖3所示。
從預測結(jié)果可見,在預測初期,由于預測模型的控制參數(shù)為隨機選取,訓練不夠充分,因此預測誤差較大,隨著訓練過程的進行,預測模型的控制參數(shù)逐漸得到調(diào)整和訓練,預測模型的動力學特性逐漸與被預測系統(tǒng)的動力學特性相接近,因此誤差逐漸減小,預測效果逐漸得到改善,并得到較高的預測精度。
圖2 全國人口總數(shù)預測結(jié)果
圖3 全國人口總數(shù)預測誤差
采用不同的預測方法對2006年-2008年的人口總數(shù)進行預測,所得預測結(jié)果如表1所示。
表1 不同預測方法的對比結(jié)果
從表1可見,本文方法可較好地實現(xiàn)對我國人口數(shù)據(jù)的預測,與現(xiàn)有的其他方法相比,預測精度更高。這是由于本文所提的預測模型在訓練過程中不斷調(diào)整控制參數(shù),可使預測模型逐漸逼近已知序列的動力學特性,并隨著其動力學特性的改變而一致變化,因此可獲得更準確的預測結(jié)果。
采用本文預測方法對我國未來幾年的人口數(shù)據(jù)進行預測,所得結(jié)果如表2:
表2 對未來幾年人口數(shù)據(jù)預測結(jié)果
從預測結(jié)果可見,未來幾年我國人口數(shù)量仍然處于上升的趨勢,到2015年將達到13.7億左右。
本文提出了一種混沌算子預測模型,并應用其對我國人口數(shù)據(jù)進行預測,預測結(jié)果表明,該模型具有較高的預測精度??蓱闷鋵ξ覈磥韼啄耆丝跀?shù)量進行有效預測。對于人口政策以及宏觀調(diào)控政策的制定具有積極的參考價值。
[1]張錦宗,朱瑜馨,周杰.基于BP網(wǎng)絡與空間統(tǒng)計分析的山東人口空間分布模式預測研究[J].測繪科學,2009,34(6).
[2]田飛.21世紀初人口場景預測研究回顧[J].人口與發(fā)展,2010,16(2).
[3]涂雄苓,徐海云.ARIMA與指數(shù)平滑法在我國人口預測中的比較研究[J].統(tǒng)計與決策,2009,(16).
[4]李國成,吳濤,徐沈.灰色人工神經(jīng)網(wǎng)絡人口總量預測模型及應用[J].計算機工程與應用,2009,45(16).
[5]朱艷偉,張永利.中國人口增長預測模型及其改進[J].統(tǒng)計與決策,2010,(16).