楊帥國(guó),胡曉華,朱冬和
(海南師范大學(xué) 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,海南 ???571158)
我國(guó)城鎮(zhèn)登記失業(yè)率的數(shù)學(xué)模型與預(yù)測(cè)
楊帥國(guó),胡曉華,朱冬和
(海南師范大學(xué) 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,海南 ???571158)
結(jié)合中國(guó)國(guó)家統(tǒng)計(jì)局的數(shù)據(jù),使用基于核主成分分析與加權(quán)支持向量機(jī)的方法建立模型,找出了影響就業(yè)(失業(yè))的22個(gè)主要指標(biāo).考慮到這些指標(biāo)相互之間的相關(guān)性,使用核主成分分析與加權(quán)支持向量機(jī)的方法建模,給出了算法的步驟,構(gòu)造了非線性預(yù)測(cè)函數(shù),并對(duì)1995-2009年的城鎮(zhèn)登記失業(yè)率進(jìn)行擬合預(yù)測(cè),得到的結(jié)果具有較高的精度.
失業(yè)率;核主成分;支持向量機(jī)
失業(yè)、經(jīng)濟(jì)增長(zhǎng)和通貨膨脹為宏觀經(jīng)濟(jì)中特別重要的三個(gè)指標(biāo),按照已有的研究,就業(yè)可以定義為三個(gè)月內(nèi)有穩(wěn)定的收入或與用人單位有勞動(dòng)聘用關(guān)系.失業(yè)的統(tǒng)計(jì)方法各國(guó)差異較大,我國(guó)采用城鎮(zhèn)登記失業(yè)率,是指城鎮(zhèn)登記失業(yè)人數(shù)同城鎮(zhèn)從業(yè)人數(shù)與城鎮(zhèn)登記失業(yè)人數(shù)之和的比.其中,城鎮(zhèn)登記失業(yè)人員是指有非農(nóng)業(yè)戶口,在一定的勞動(dòng)年齡內(nèi)(16歲以上及男50歲以下、女45歲以下),有勞動(dòng)能力,無(wú)業(yè)而要求就業(yè),并在當(dāng)?shù)鼐蜆I(yè)服務(wù)機(jī)構(gòu)進(jìn)行求職登記的人員.由于統(tǒng)計(jì)口徑不同,存在一定的差異,有些歷史數(shù)據(jù)也較難獲得.
中央從2008年10月開(kāi)始實(shí)施了4萬(wàn)億元的投資計(jì)劃,確定了十大產(chǎn)業(yè)振興計(jì)劃,采取擴(kuò)大國(guó)內(nèi)消費(fèi)需求的措施,提高對(duì)外開(kāi)放水平以增加出口.同時(shí),中央財(cái)政擬投入420億元資金實(shí)施積極的就業(yè)政策.2009年我國(guó)在就業(yè)方面的目標(biāo)是城鎮(zhèn)新增就業(yè)900萬(wàn)人以上,城鎮(zhèn)登記失業(yè)率控制在4.6%以內(nèi)[1].
本文利用近年來(lái)我國(guó)有關(guān)的統(tǒng)計(jì)數(shù)據(jù)并結(jié)合一年多來(lái)我國(guó)國(guó)民經(jīng)濟(jì)的運(yùn)行數(shù)據(jù)就城鎮(zhèn)登記失業(yè)率做了如下研究.
1)對(duì)有關(guān)統(tǒng)計(jì)數(shù)據(jù)進(jìn)行分析,尋找影響就業(yè)的主要因素或指標(biāo).
2)建立城鎮(zhèn)登記失業(yè)率與上述主要因素或指標(biāo)之間聯(lián)系的數(shù)學(xué)模型.
3)利用所建立的關(guān)于城鎮(zhèn)登記失業(yè)率的數(shù)學(xué)模型,根據(jù)國(guó)家的有關(guān)決策和規(guī)劃對(duì)2009年及2010年上半年的我國(guó)就業(yè)前景進(jìn)行預(yù)測(cè).
結(jié)合國(guó)家統(tǒng)計(jì)局的數(shù)據(jù),從宏觀層面、中觀層面以及中央宏觀調(diào)控政策做定性與簡(jiǎn)單定量分析,對(duì)各項(xiàng)經(jīng)濟(jì)指標(biāo)進(jìn)行歸納、匯總.采用冗余變量檢驗(yàn)法,最終確定了22個(gè)作為影響就業(yè)的主要指標(biāo):即國(guó)內(nèi)生產(chǎn)總值、居民消費(fèi)支出、政府購(gòu)買(mǎi)、城鎮(zhèn)社會(huì)固定資產(chǎn)投資、第一產(chǎn)業(yè)國(guó)內(nèi)生產(chǎn)總值、第二產(chǎn)業(yè)國(guó)內(nèi)生產(chǎn)總值、第三產(chǎn)業(yè)國(guó)內(nèi)生產(chǎn)總值、工業(yè)總產(chǎn)值、建筑增加值、客運(yùn)量、郵件業(yè)務(wù)量、各級(jí)各類(lèi)學(xué)校數(shù)、稅收、國(guó)內(nèi)旅游、人民幣匯率、外匯儲(chǔ)備、貨幣供應(yīng)量、貨物進(jìn)出口總額、國(guó)家財(cái)政收入、國(guó)家財(cái)政支出、對(duì)外經(jīng)濟(jì)合作、城鎮(zhèn)居民人均收入.
基本假設(shè):1)不考慮農(nóng)民工問(wèn)題.2)假設(shè)歷年的數(shù)據(jù)真實(shí)可靠,并從1995年數(shù)據(jù)開(kāi)始使用.3)中央扶持政策執(zhí)行度良好,資金最大限度使用.4)假設(shè)2010年上半年經(jīng)濟(jì)形勢(shì)不會(huì)發(fā)生突變,運(yùn)行平穩(wěn).5)由于前面均以年數(shù)據(jù)考慮,故先預(yù)測(cè)2010年整年的失業(yè)率,并假設(shè)上半年的失業(yè)率不會(huì)發(fā)生太大變化.
本文符號(hào)說(shuō)明:xi(第i年的指標(biāo)集);yi(第i年的失業(yè)率);K(xi,yi)(核函數(shù));Kij(核函數(shù)對(duì)應(yīng)的矩陣);
在經(jīng)濟(jì)模型中,常用的計(jì)量模型在預(yù)測(cè)失業(yè)率時(shí)對(duì)數(shù)據(jù)的假設(shè)有著很強(qiáng)的依賴性,這可能導(dǎo)致模型設(shè)定的偏差.核主成分分析與加權(quán)支持向量機(jī)方法作為一種新型的研究方法,一定程度上可以克服上述模型中的不足,在很多方面表現(xiàn)出了優(yōu)于常用的計(jì)量模型的功能.
核主成分分析方法是一種非線性特征提取方法,是主成份分析方法的一種非線性推廣.該方法通過(guò)一個(gè)非線性映射將數(shù)據(jù)從輸入空間映射到高維空間,然后在高維空間進(jìn)行通常的主成份分析,其中的內(nèi)積運(yùn)算采用一個(gè)核函數(shù)來(lái)代替.本文采用Guass徑向基函數(shù).即:Guass徑向基函數(shù)[2]:
下面介紹核主成分分析加權(quán)支持向量的預(yù)測(cè)方法與步驟.
算法1:
2)選擇一個(gè)核函數(shù) K=(1+xi·xj)3,利用選擇的樣本計(jì)算l×l的矩陣Kij.
5)根據(jù)實(shí)際需要,選取部分貢獻(xiàn)值比較大的特征值及其對(duì)應(yīng)的特征向量構(gòu)成新的空間作為低維投影空間(達(dá)到降維的目的).
7)取初值:C0=100,ε0=0.01,β=0.01,γ=0.01,由公式:
因此,以本文中選取的22個(gè)主要指標(biāo),用它們的一期滯后值來(lái)擬合失業(yè)率,所用數(shù)據(jù)包括1995年到2007年,則一共可以組成13對(duì)樣本.接著,這22項(xiàng)指標(biāo)對(duì)應(yīng)時(shí)間構(gòu)造成22行13列的矩陣,由于各指標(biāo)原始數(shù)據(jù)的差異較大,且量綱不一致,在這里對(duì)這22個(gè)指標(biāo)按下式進(jìn)行預(yù)處理,使其映射到區(qū)間[-1,1]中.
式中x′為與處理后的數(shù)據(jù).
用Matlab編程,核主成份分析法選用的核函數(shù)為三次多項(xiàng)[4]k(xi,xj)=(1+xi·xj)3,經(jīng)過(guò)計(jì)算的特征值、貢獻(xiàn)率見(jiàn)表1.
由表1可知最后四個(gè)貢獻(xiàn)率大,故在此取最后四個(gè)主成份進(jìn)行后面的加權(quán)支持向量機(jī),加權(quán)支持向量基中選用的核函數(shù)為高斯徑向基函數(shù)核
所用參數(shù):測(cè)試結(jié)果見(jiàn)表2.
由上表可以看出,基于核主成份與加權(quán)支持向量機(jī)的預(yù)測(cè)方法擬合及預(yù)測(cè)都取得了很好的效果,最小的相對(duì)誤差0.07%(1997年),最大相對(duì)誤差4.13%(2001).
表1 核主成份計(jì)算結(jié)果Tab.1 Kernel principal component results
表2 訓(xùn)練及測(cè)試結(jié)果Tab.2 Training and test results
[1]中國(guó)統(tǒng)計(jì)年鑒[EB/OL].[2009-09-12].http://www.stats.gov.cn/tjsj/ndsj.
[2]鄧乃楊,田英杰.數(shù)據(jù)挖掘中的新方法——支持向量機(jī)[M].北京:科學(xué)出版社,2004.
[3]向小東,宋芳.基于核主成分與加權(quán)向量機(jī)的福建省城鎮(zhèn)登記失業(yè)率預(yù)測(cè)[J].系統(tǒng)工程理論與實(shí)踐,2009,29(1):74-79.
[4]趙東方.數(shù)學(xué)模型及計(jì)算[M].北京:科學(xué)出版社,2007:143-145.
[5]韓中庚.數(shù)學(xué)建模方法及其應(yīng)用[M].北京:高等教育出版社,2005:57-64.
The Mathematical Model and Prediction in China's Urban Registered Unemployment Rate
YANG Shuaiguo,HU Xiaohua,ZHU Donghe
(College of Mathematics and Statistics,Hainan Normal University,Haikou571158,China)
In this paper,combining with the date of China′s National Bureau of Statistics,we used the Kernel Principal Component Analysis and Kernel Weighted Support Vector Machine method to build the mathematical model.We found 22 key indicators which affect the employment(unemployment).Taking into account of the correlation among these indi?cators,we used the Kernel Principal Component method analysis and Weighted Support Vector Machine method to build the model and give the algorithm on how to construct a non-linear prediction function,and also we used the registered ur?ban unemployment rate during 1995-2009 to fit the predicted results and obtain high accuracy.
unemployment;Kernel Principal Component;Support Vector Machine
O 29
A
1674-4942(2010)04-0372-03
2010-05-21
畢和平