冉星
(重慶師范大學(xué) 數(shù)學(xué)科學(xué)學(xué)院,重慶 401331)
yij=xi(tij)+εij,
(1)
(2)
其中ci=(ci1,ci2,…ciK)T為待估的系數(shù)向量,K為選擇基函數(shù)的個數(shù)。令
X(t)=CΦ.
(3)
下一步就是通過基函數(shù)展開去估計系數(shù)向量,本文利用最小二乘法光滑模型來求解待估的系數(shù)向量。則估計的目標(biāo)函數(shù)為
(4)
解出待估系數(shù)向量,從而就可以求得待估曲線xi(t)。
等高線圖可以反映各因素交互作用對響應(yīng)值的影響。圓形表示因素間交互作用不顯著,橢圓表示因素間交互作用顯著。由圖2可知,漂燙溫度與漂燙時間交互作用較顯著,當(dāng)漂燙時間大于4 min時,標(biāo)準(zhǔn)化得分逐漸降低。漂燙時間越長,溫度越高,導(dǎo)致樣品組織結(jié)構(gòu)破壞嚴(yán)重,品質(zhì)變差,影響最終標(biāo)準(zhǔn)化得分[20]。
函數(shù)型主成分分析[7]的思想與多元統(tǒng)計中主成分分析的思想類似,多元統(tǒng)計中主成分分析的實(shí)質(zhì)就是求解協(xié)方差矩陣的特征值與特征向量問題,而在函數(shù)型主成分分析中,就是求解協(xié)方差函數(shù)的特征函數(shù)問題,即求解如下極大值的優(yōu)化問題:
(5)
(6)
具體的求解過程就是求解特征方程
(7)
其中λ是GX(s,t)的特征值,φ(s)是與特征值λ相對應(yīng)的特征函數(shù)。
常用的估計方法有離散化和基底函數(shù)展開法,詳細(xì)參見[8]。下面利用基底函數(shù)展開法來求解特征方程。設(shè)特征函數(shù)φ(s)由相同的基底Φ(t)進(jìn)行擬合,則特征函數(shù)φ(s)的基函數(shù)展開式為
(8)
其中b=(b1,b2,…,bk)T為待估參數(shù)向量,由此(7)式的左邊為
(9)
N-1ΦT(s)CTCWb=λΦT(s)b.
(10)
由于該方程對所有s都成立,故N-1CTCWb=λb,求解該矩陣方程的特征值問題可得特征函數(shù)φ(s)。通過下式可得主成分得分
(11)
通過函數(shù)的主成分分析降維得到各函數(shù)曲線的主成分得分,現(xiàn)根據(jù)累計方差貢獻(xiàn)率(CPV)大于等于95%的原則,提取各函數(shù)曲線的前幾個主成分得分代替原始的函數(shù)型數(shù)據(jù)進(jìn)行加權(quán)的k-means聚類。定義加權(quán)k-means聚類的相似性度量如下:
(12)
為函數(shù)曲線xi(t)和xj(t)之間加權(quán)的主成分得分距離,其中q為距離參數(shù)。
本研究選擇我國31個省、市、自治區(qū)2001~2019年的失業(yè)人口數(shù)據(jù)作為研究對象。數(shù)據(jù)來源于國家統(tǒng)計局網(wǎng)站。鑒于上述的理論知識,將我國31個省、市、自治區(qū)2001~2019年的失業(yè)人口進(jìn)行函數(shù)型數(shù)據(jù)的加權(quán)K-means聚類,具體流程如圖1。
用4次B樣條基函數(shù)擬合并通過MATLAB編程[9-10]繪制了我國31個省、市、自治區(qū)2001~2019年的失業(yè)人口的標(biāo)準(zhǔn)差函數(shù)圖和均值函數(shù)圖如圖2、3所示。
圖1 流程圖
圖2 標(biāo)準(zhǔn)差函數(shù)曲線
圖3 均值函數(shù)曲線
由圖2標(biāo)準(zhǔn)差函數(shù)曲線可以發(fā)現(xiàn)我國各個省的失業(yè)人口數(shù)前兩年的變化差別大,隨后呈縮小拉大交替的趨勢,但最后從整體上看各省份失業(yè)人口差距逐漸縮小,一定程度上可以反映出我國近年來各個省、市、自治區(qū)的發(fā)展差距在逐漸縮小。由圖3可以看出我國的平均失業(yè)人口數(shù)自2001年以來一直處于不平穩(wěn)的增加趨勢,特別是2008年至2010年突然急劇上升之后又急劇下降, 出現(xiàn)這種原因可能是受全球金融危機(jī)的影響,導(dǎo)致2008年失業(yè)人口急劇上升,2009年金融危機(jī)之后失業(yè)人口數(shù)開始急劇下降,但我國整體平均失業(yè)人口數(shù)上呈現(xiàn)緩慢增長趨勢。
對我國31個省、市、自治區(qū)的失業(yè)人數(shù)的函數(shù)曲線進(jìn)行函數(shù)型主成分分析(FPCA),根據(jù)累計方差貢獻(xiàn)率大于等于95%的原則,提取了前兩個主成分,貢獻(xiàn)率分別為91.76%和5.16%,可以代表曲線的絕大部分信息。利用31個省的第一和第二主成分得分,畫出了各省失業(yè)人口的主成分得分圖(如圖4所示)。
根據(jù)圖4大致可以將31個省分為四類:第一類是遼寧省、湖北省、江蘇?。坏诙愂撬拇ㄊ?、河南省、河北??;第三類是西藏自治區(qū)、海南省、青海省、寧夏回族自治區(qū)、北京市、甘肅省、新疆維吾爾自治區(qū)、重慶市、上海市、貴州省、吉林省、福建省、廣西壯族自治區(qū);剩余的省份為第四類。以上的分類只是根據(jù)圖4主觀進(jìn)行的大致分類,除第一類比較靠近第一主成分以及第三類相對比較集中外,第四類與第三類、二類、一類之間的界限也不是特別的明顯,為了更加客觀的對我國各省失業(yè)人口差異進(jìn)行分類,運(yùn)用加權(quán)主成分得分的k-means聚類對我國失業(yè)人口數(shù)進(jìn)行定量的分類。
圖4 各省失業(yè)人口得分圖
圖5 聚類效果圖
利用上述前兩個主成分得分代表原始數(shù)據(jù),對我國31個省、市、自治區(qū)進(jìn)行加權(quán)主成分得分的k-means聚類,將(12)式作為距離的相似性度量,其中距離參數(shù)q取2,其聚類的結(jié)果如表1所示,相應(yīng)的分類效果圖如圖5所示。
表1 函數(shù)型數(shù)據(jù)聚類結(jié)果分類表
從表1可知,北京、海南、西藏、甘肅、青海、寧夏、新疆這7個省份為第一梯度,失業(yè)人數(shù)最低,北京作為我國的超一線城市,雖然人口基數(shù)大但大多都是年輕人,相對于人口年齡結(jié)構(gòu)老年化的省份,失業(yè)人口比較低。海南作為我國的經(jīng)濟(jì)特區(qū),以其天然的自然地理優(yōu)勢有著豐富的旅游資源,隨著旅游資源帶動的其他服務(wù)業(yè)等,不僅促進(jìn)了海南的經(jīng)濟(jì)發(fā)展,同時也提供了更多的就業(yè)機(jī)會。而其余失業(yè)人數(shù)較小的省份全部來自西部和西北地區(qū),由于中央政府近年來實(shí)施的一系列西部大開發(fā)的政策,使得西部地區(qū)的產(chǎn)業(yè)資源優(yōu)勢得以進(jìn)一步的提升,從而對勞動力的需求量也明顯增加。由表1可知失業(yè)人數(shù)在第二梯度的省份大多在華北地區(qū)和西南地區(qū),西南地區(qū)同樣得益于西部大開發(fā)戰(zhàn)略,在產(chǎn)業(yè)升級、結(jié)構(gòu)轉(zhuǎn)型的發(fā)展背景下,有效解決了城鎮(zhèn)下崗失業(yè)人員再就業(yè)問題。其中重慶處在“一帶一路”和長江經(jīng)濟(jì)帶的聯(lián)結(jié)點(diǎn)上,其自身的“區(qū)位優(yōu)勢”、生態(tài)優(yōu)勢、“產(chǎn)業(yè)優(yōu)勢”以及“體制優(yōu)勢”都尤為突出,因此其對勞動力的需求量自然較大。
由表1可知失業(yè)人數(shù)最多的省份在第四梯度,其中遼寧省和黑龍江省位于東北部地區(qū),作為老工業(yè)基底的代表,隨著產(chǎn)業(yè)結(jié)構(gòu)的調(diào)整和企業(yè)技術(shù)革新的步伐加快,使得遼寧省和黑龍江省與其他省份相比失業(yè)人數(shù)尤為突出,主要可以從兩個方面進(jìn)行解釋:第一,隨著產(chǎn)業(yè)結(jié)構(gòu)的調(diào)整,東北地區(qū)一些老工業(yè)基地在技能結(jié)構(gòu)和勞動力年齡結(jié)構(gòu)等方面與市場需求不相匹配,從而導(dǎo)致勞動力達(dá)不到市場的需求進(jìn)而導(dǎo)致失業(yè)人口數(shù)增加;第二,為了順應(yīng)時代的發(fā)展,加快企業(yè)技術(shù)的革新進(jìn)程,部分企業(yè)會引進(jìn)一些先進(jìn)的設(shè)備、機(jī)器、技術(shù)等,而這些硬件設(shè)施的提升在短時間內(nèi)會對就業(yè)產(chǎn)生“擠出”效應(yīng),進(jìn)而導(dǎo)致失業(yè)人數(shù)增加。除了河南省和山東省外,其余7省的人口老齡化均進(jìn)入全國前12名,一般老齡化嚴(yán)重的地區(qū),經(jīng)濟(jì)發(fā)展活力相對不會太高,相應(yīng)能提供的就業(yè)崗位就減少,就業(yè)競爭壓力大,失業(yè)機(jī)率相對較高。
綜合以上分析,該分類結(jié)果基本符合我國各省的失業(yè)人口之間的差異情況。
在經(jīng)濟(jì)新常態(tài)的背景下,緊密關(guān)注我國失業(yè)人口數(shù)具有重要意義,本文利用加權(quán)函數(shù)型主成分的聚類方法對我國失業(yè)人口的差異進(jìn)行聚類,并結(jié)合相關(guān)政策和各省產(chǎn)業(yè)發(fā)展的優(yōu)勢等對我國失業(yè)人口數(shù)的差異進(jìn)行原因分析。一方面,有助于國家針對各省失業(yè)人口的數(shù)量進(jìn)行產(chǎn)業(yè)結(jié)構(gòu)的調(diào)整,出臺一系列的相關(guān)戰(zhàn)略政策提供科學(xué)的依據(jù);另一方面,由于我國長期處于經(jīng)濟(jì)發(fā)展不平衡的狀態(tài),我國各省失業(yè)人數(shù)的差異一定程度上反應(yīng)了我國經(jīng)濟(jì)發(fā)展的不協(xié)調(diào),因此有利于國家在促進(jìn)經(jīng)濟(jì)發(fā)展的同時,考慮到我國失業(yè)人口的差異,適當(dāng)增加就業(yè)崗位;實(shí)證結(jié)果表明我國勞動力失業(yè)人口的動態(tài)變化特性存在一定的區(qū)域異質(zhì)性,為了平衡我國不同地區(qū)失業(yè)人口之間的差異,鑒于前面的分析,提出以下兩點(diǎn)建議:
1)促進(jìn)我國經(jīng)濟(jì)健康平穩(wěn)增長,縮短不同地區(qū)經(jīng)濟(jì)增長的差距。經(jīng)濟(jì)發(fā)展是第一要務(wù),是解決失業(yè)問題的根本途徑??s短我國不同地區(qū)經(jīng)濟(jì)增長的差距,政府應(yīng)該提出相應(yīng)的宏觀經(jīng)濟(jì)政策,調(diào)整經(jīng)濟(jì)增長方式,增加就業(yè)容量。
2)大力推動私營、中小型企業(yè)的發(fā)展。雖然國企和大型企業(yè)是國家經(jīng)濟(jì)發(fā)展的重要基石,但是作為吸納就業(yè)的中小型、私營企業(yè)才是提供就業(yè)崗位的中流砥柱。國家應(yīng)該加強(qiáng)對中小、私營企業(yè)的幫助,避免選擇性失業(yè)的同時鼓勵大學(xué)生創(chuàng)業(yè),為勞動力市場提供更多的就業(yè)崗位。