戴曉娟
(寧夏師范學(xué)院 數(shù)學(xué)與計(jì)算機(jī)科學(xué)學(xué)院,寧夏 固原 756000)
基于最大熵原理的人口預(yù)測(cè)模型的最優(yōu)控制
戴曉娟
(寧夏師范學(xué)院 數(shù)學(xué)與計(jì)算機(jī)科學(xué)學(xué)院,寧夏 固原 756000)
本文提出一種基于最大信息熵的人口預(yù)測(cè)模型,該模型以熵函數(shù)作為目標(biāo)函數(shù),以已知數(shù)據(jù)的各階統(tǒng)計(jì)距作為約束條件,通過(guò)最大化熵來(lái)預(yù)測(cè)人口的發(fā)展?fàn)顩r.并通過(guò)現(xiàn)有數(shù)據(jù),對(duì)我國(guó)未來(lái)人口分布做了相應(yīng)的預(yù)測(cè).
最大熵;預(yù)測(cè);模型;最優(yōu)控制
人類(lèi)社會(huì)發(fā)展到今日,面臨著一系列嚴(yán)峻的挑戰(zhàn),諸如戰(zhàn)爭(zhēng)與和平、生態(tài)失衡、人口爆炸、環(huán)境污染、資源短缺等.其中尤為突出是人口問(wèn)題,因?yàn)槿丝诘陌l(fā)展影響和制約著經(jīng)濟(jì)的發(fā)展,而經(jīng)濟(jì)的發(fā)展則關(guān)乎社會(huì)的進(jìn)步,人類(lèi)的文明,它們之間是相輔相成的.
以中國(guó)為例,由于我國(guó)是一個(gè)人口大國(guó),我們所面臨的人口問(wèn)題,不僅有人口數(shù)量控制的問(wèn)題,更重要的是面臨著復(fù)雜的人口流動(dòng)、管理、保障和發(fā)展的問(wèn)題.在這一過(guò)程中,如何遵循以人為本的科學(xué)發(fā)展觀,遵循經(jīng)濟(jì)規(guī)律和人口變動(dòng)規(guī)律,最大限度的實(shí)現(xiàn)社會(huì)公正,是新時(shí)期人口發(fā)展和管理面臨的新課題.正確認(rèn)識(shí)人口變動(dòng)特征,則是解決人口問(wèn)題的前提.
根據(jù)全國(guó)第六次人口普查數(shù)據(jù)的顯示,我國(guó)人口有如下顯著特點(diǎn):
(1)人口增速減緩,經(jīng)濟(jì)社會(huì)發(fā)展推動(dòng)生育率的進(jìn)一步下降
(2)“未富先老”人口老齡化加劇
(3)城市化水平提速,中國(guó)已經(jīng)進(jìn)入城市人口快速增長(zhǎng)期
(4)出生人口性別比例失衡,制約經(jīng)濟(jì)發(fā)展和社會(huì)穩(wěn)定
(5)流動(dòng)人口成正增長(zhǎng)趨勢(shì),影響社會(huì)的發(fā)展
此研究報(bào)告說(shuō)明,人口老齡化速度加快,高齡趨勢(shì)明顯,這顯然也會(huì)影響到將來(lái)的人口發(fā)展.因此我們建立偏微分方程對(duì)我國(guó)將來(lái)的人口數(shù)量作出更加合理的估計(jì).即假設(shè)人口的數(shù)量不僅和時(shí)間t有關(guān),還與年齡x有關(guān).
其中t>0為時(shí)間,x為人的年齡,均為連續(xù)變量,p(x,t)為人口密度函數(shù),μ(x,t)為死亡率,F(xiàn)(x,t)為給定時(shí)刻t年齡小于x的人口分布函數(shù).這個(gè)連續(xù)型人口發(fā)展方程描述了人口的演變過(guò)程,從這個(gè)方程確定出的密度函數(shù)可以直接得到各個(gè)年齡的人口數(shù),即人口分布函數(shù).
本文在此模型的基礎(chǔ)上提出一種基于最大信息熵的人口預(yù)測(cè)模型,該模型以熵函數(shù)作為目標(biāo)函數(shù),以已知數(shù)據(jù)的各階統(tǒng)計(jì)距作為約束條件,通過(guò)最大化熵來(lái)預(yù)測(cè)人口的發(fā)展?fàn)顩r.
2.1 基本原理
熵最初來(lái)源于熱力學(xué).在哲學(xué)和統(tǒng)計(jì)物理中被解釋為物質(zhì)系統(tǒng)的混亂和無(wú)序程度.信息論則認(rèn)為它是信息源的狀態(tài)的不確定程度.所謂熵增加原理,是指孤立系統(tǒng)向著微觀狀態(tài)最混亂的方向變化,直到熵達(dá)到最大.
1948 年,香農(nóng)把波爾茲曼熵的概念引入信息論并把熵作為度量一個(gè)隨機(jī)事件的平均不確定性.因此,信息數(shù)量的大小,可以用被消除的不確定性的多少來(lái)表示,而隨機(jī)事件的不確定性的大小可以用概率分布函數(shù)來(lái)描述.
如果隨機(jī)變量為離散型,X的取值為xi,i=1,2,…,n,xi出現(xiàn)的概率為,則包含其中H是p1,p2,…,pn的信息量為的連續(xù)函數(shù),當(dāng)且僅當(dāng)p1=p2=…=pn時(shí),H取最大值.
如果隨機(jī)變量X是連續(xù)分布的,其分布密度函數(shù)為p(x),X熵定義為
基于熵的定義,可以直觀地說(shuō)明最大熵分布原理:使其熵在一些約束條件下達(dá)可以到最大值,即
maxH(X)=-R∫p(x)logp(x)dx
式中,μn為第n階原點(diǎn)矩,其值可由樣本數(shù)據(jù)計(jì)算出來(lái),N為所用原點(diǎn)矩的階數(shù).
2.2 求解方法
最大熵分布就是在保證樣本的統(tǒng)計(jì)特性條件下通過(guò)調(diào)整p(x)使熵H達(dá)到最大.現(xiàn)用經(jīng)典的變分法求解目標(biāo)函數(shù)的極值問(wèn)題.
引入拉格朗日乘子λ0,λ1,…,λn,令
3.1 模型選取
由于偏微分方程考慮了年齡對(duì)人口增長(zhǎng)的影響,能夠更精確地描述人口年齡的結(jié)構(gòu)及發(fā)展趨勢(shì),故選取我國(guó)1990年到2010年的人口數(shù)據(jù).
鑒于模型(1)屬二維概率分布,有兩個(gè)變量,所以取時(shí)間為任意固定值,密度函數(shù)的變化決定人口的分布.我們首先來(lái)確定時(shí)刻t年齡為x的人口死亡率μ(t,x),由于現(xiàn)階段由于醫(yī)療水平等條件的限制,可以近似地認(rèn)為在一定時(shí)期內(nèi)人口死亡率是保持不變的,即認(rèn)為μ(t,x)僅僅是年齡x的函數(shù)μ(x).利用提供的數(shù)據(jù)進(jìn)行數(shù)據(jù)擬合,得到的年齡與死亡率之間的函數(shù)關(guān)系為:
3.3 根據(jù)特征值矩陣求出各個(gè)約束條件,應(yīng)用最大熵原理求出特征估計(jì)的分布函數(shù),得到一個(gè)預(yù)測(cè)的人口分布函數(shù)pi,根據(jù)式(1),(2)可得
其中x為人口的年齡變量,是預(yù)測(cè)問(wèn)題的變量.通過(guò)調(diào)整p來(lái)使得熵最大,并采用拉格朗日乘子法來(lái)求解此問(wèn)題.
式(10)就是最大熵概率密度函數(shù)的解析形式.將式(10)代入式(3)可得
整理后可得
把(9)式代入(6)式,即可得到此人口的概率密度函數(shù)確定的最大熵.再把(5)與(9)式代入(1)式,可得到人口的結(jié)構(gòu)預(yù)測(cè)和人口分布結(jié)果.
通過(guò)以上所述模型的建立過(guò)程及相應(yīng)的算法,運(yùn)用歷年的統(tǒng)計(jì)數(shù)據(jù),借助Matlab軟件對(duì)我國(guó)人口分布作中長(zhǎng)期(2020年~2050年)預(yù)測(cè),求得以下結(jié)果:
圖1
圖2
由圖1可以看出,我國(guó)人口結(jié)構(gòu)老齡化進(jìn)程加速,在2050年左右達(dá)到高峰,隨機(jī)趨穩(wěn).圖2得出,到2020年鄉(xiāng)鎮(zhèn)人口大批涌入城市,城市人口飽和.除此,還可以看出,在實(shí)現(xiàn)穩(wěn)定低生育水平的前提下,由于人口基數(shù)大,未來(lái)相當(dāng)一個(gè)時(shí)期人口還將持續(xù)增長(zhǎng),但由于計(jì)劃生育政策的執(zhí)行使我國(guó)人口得以控制,在40到50年以后將達(dá)到零增長(zhǎng).
利用最大熵原理分析人口密度函數(shù),從而確定人口分布函數(shù),得到的對(duì)未來(lái)人口結(jié)構(gòu)和分布的預(yù)測(cè)情況.我國(guó)人口的年齡變化是一種隨機(jī)事件,最大熵方法確定的被測(cè)量分布是含有最少主觀假定的分布,因此用最大熵原理來(lái)預(yù)測(cè)其分布是可靠的.
〔1〕朱雪龍.應(yīng)用信息論基礎(chǔ)[M].北京:清華大學(xué)出版社,2001.
〔2〕沈世鎰,吳忠華.信息論基礎(chǔ)與應(yīng)用[M].北京:高等教育出版社,2004.7.
〔3〕徐宗學(xué).熵極大識(shí)別準(zhǔn)則及其應(yīng)用[J].武漢水力電力學(xué)院學(xué)報(bào),1987.
〔4〕馬力,張學(xué)文.最大熵原理與概率分布函數(shù)[M].數(shù)理統(tǒng)計(jì)與應(yīng)用概率,1993.
〔5〕馮利華,張萍.基于最大熵原理的臺(tái)風(fēng)統(tǒng)計(jì)預(yù)報(bào)[J].海洋科學(xué),2003,27(3):47-51.
〔6〕朱成騏,孫宏斌,張伯明.基于最大信息熵原理的短期負(fù)荷預(yù)測(cè)綜合模型[J].中國(guó)電機(jī)工程學(xué)報(bào),2005(l0):1-6.
〔7〕李環(huán),高全勝,李育武,周靜.中國(guó)人口增長(zhǎng)的狀態(tài)空間預(yù)測(cè)模型 [J].武漢工業(yè)學(xué)院學(xué)報(bào),2009,28 (1):101-105.
O232
A
1673-260X(2014)04-0016-03
本文系??蒲许?xiàng)目(YB201347)