考慮到當前中國青年失業(yè)率持續(xù)高位,這對各行業(yè)、企業(yè)以及個人的工作和生活產(chǎn)生了不利影響,并導致一系列消極社會現(xiàn)象,如過度依賴家庭和犯罪率上升。因此,我們需要高度關注青年的發(fā)展狀況。最新的2022年數(shù)據(jù)表明,青年原本應該成為推動社會發(fā)展的優(yōu)質勞動力,但在當今社會背景下,其失業(yè)率仍保持在17%的高水平。這不僅需要引起全社會的關注,還需要從統(tǒng)計學理論的角度對青年失業(yè)率水平進行分析和預測。因此,本文基于中國統(tǒng)計局發(fā)布的2022年全國失業(yè)率調查數(shù)據(jù),并運用各種統(tǒng)計學方法構建模型,結合統(tǒng)計學理論對青年失業(yè)率進行預測和分析,同時參考相關的調研報告,總結出對實際問題有啟示意義的結論。
緒論
研究背景及意義
人口是屬于“牽一發(fā)而動全身”的基礎性戰(zhàn)略性變量,現(xiàn)已有專家建議把“人口建設”納入百年戰(zhàn)略、千年大計之中,根據(jù)2022年已發(fā)布的數(shù)據(jù),年末全國人口為141175萬人,比上年年末減少85萬人,出生人口為956萬人,死亡人口為1041萬人,出生率及死亡率分別為6.77%和7.37%,人口自然增長率為-0.6%。
而人口是關聯(lián)勞動人口、養(yǎng)老、財政收入、消費、醫(yī)療等方面的重大問題,鑒于中國龐大的人口基數(shù),勢必需要有一個合理穩(wěn)定的人口及年齡結構,才能保證社會的發(fā)展,而在這其中,青年及中年人的作用不可忽視。
一般而言,青年勞動者選擇從事低層次工作很可能將其視為個體人力資本投資的機會,在積累工作經(jīng)驗的同時,學習與工作相關的特定技能,為職業(yè)晉升做準備,或者為尋找合適的工作創(chuàng)造更多機會。而失業(yè)對于該個體而言,思想上容易造成自卑、消極及自閉等問題,行為上造成消費低迷,甚至是犯罪,并且目前中國的生育率為2.2%,已是全球最嚴重的低生育國家,針對以上幾個方面,本文從青年失業(yè)率的數(shù)據(jù)出發(fā),研究2022年數(shù)據(jù)分布的特征,并構建與其他變量的關系方程,探討出可預測及推斷青年失業(yè)率水平的方程,進而研究出可監(jiān)測青年失業(yè)率發(fā)展趨勢的方法。
研究設計
1.相關理論、研究重點與分析框架
本研究依據(jù)《現(xiàn)代基礎統(tǒng)計學》關聯(lián)分析理論,結合各類統(tǒng)計檢驗等方法,對實際數(shù)據(jù)進行分析,提出研究假設并構建分析框架。
研究重點1:青年失業(yè)率存在一定的分布特征,如正態(tài)分布、遞減趨勢;
研究重點2:青年失業(yè)率在時間變化上存在序列關系;
數(shù)據(jù)收集及說明
本文從國家統(tǒng)計局-國家數(shù)據(jù)-月度數(shù)據(jù)-指標-就業(yè)人員和工資-城鎮(zhèn)調查失業(yè)率收集的數(shù)據(jù)進行整理及分析。
研究內容及方法
(1)全國16-24歲失業(yè)率的描述性統(tǒng)計分析。分析16-24歲青年失業(yè)率的現(xiàn)狀及數(shù)據(jù)分布情況,各描述性指標情況,闡述目前失業(yè)率的特征及意義。
本章節(jié)主要對青年失業(yè)率的數(shù)據(jù)情況進行描述性說明,包含數(shù)據(jù)特征、數(shù)據(jù)基本規(guī)律及展示圖表內容。
(2)全國16-24歲失業(yè)率的時間序列回歸關系分析?;诂F(xiàn)有的樣本量探索全國青年失業(yè)率時間序列關系,包含平穩(wěn)性檢驗、自相關等方法,構建序列模型,從而對全國青年失業(yè)率進行預測及分析。
全國16-24歲失業(yè)率的描述性統(tǒng)計分析
數(shù)據(jù)預處理
通過中國統(tǒng)計局及數(shù)據(jù)篩選,挑選2022年的數(shù)據(jù)進行分析,整理如下:
描述性統(tǒng)計計算及趨勢分析
計算2022年全國16-24歲青年失業(yè)率集中及離散指標,如下:
從已收集的數(shù)據(jù)來看整體分布均勻,不存在極端值,因此能較好地表示2022年的青年失業(yè)水平為平均數(shù):17.56%;水平保持在比率區(qū)間為[15,20),峰值出現(xiàn)在6月、7月,往后比例逐步下降;其中增幅最大達14%,出現(xiàn)在2月-3月,降幅最大達6%,出現(xiàn)在7月-8月之間。2022年青年失業(yè)率整體呈現(xiàn)增長后下降的變化趨勢,年中達到峰值,接近19.9%后逐步下降。
因為偏度為衡量數(shù)據(jù)分布指標,通過計算的數(shù)值-0.1968474lt;0,趨近于0,2022年青年失業(yè)率處于呈現(xiàn)左偏態(tài)分布,并且峰度1.962489>0,該數(shù)據(jù)峰度呈現(xiàn)尖峰狀態(tài),數(shù)據(jù)較與正態(tài)分布更為集中。
描述性統(tǒng)計分析總結
基于2022年發(fā)布的青年失業(yè)率數(shù)據(jù),從描述性分析的維度進行解讀,得出以下結論:
(1)2022年全年青年失業(yè)率整體水平保持在比率區(qū)間為[15,20),平均水平在17.56%,峰值出現(xiàn)在6月到7月,其中增幅最大達14%,降幅最大達6%,呈現(xiàn)增長后下降的變化趨勢。
(2)對2022年的數(shù)據(jù)進行離散分布分析時,通過偏度數(shù)值比較,發(fā)現(xiàn)全年數(shù)據(jù)整體呈現(xiàn)左偏態(tài),雖存在極小值,但從整體的數(shù)據(jù)分布情況來看,均值仍具備代表全年的失業(yè)率水平的含義,數(shù)據(jù)呈現(xiàn)尖峰態(tài),數(shù)據(jù)分布較正態(tài)分布更為集中,且SW檢驗結果中W接近1,且p值大于0.05,因SW檢驗的原假設為數(shù)據(jù)正態(tài)分布,因此后續(xù)的分析均基于2022年青年失業(yè)率可以近似認為正態(tài)分布趨勢出發(fā)。
全國16-24歲失業(yè)率的時間序列回歸關系分析
本章節(jié)從時間序列的角度,以數(shù)據(jù)層面出發(fā),尋找青年失業(yè)率是否隨時間的發(fā)展而呈現(xiàn)一定特性,從而構建模型,對后續(xù)其發(fā)展進行預測,最后再結合最新的數(shù)據(jù)進行比對,確定分析結論是否可靠。
基于以上思路,設想下面6個步驟分析:(1)觀察2022-01至2023-01之間的失業(yè)率折線圖,判定趨勢平穩(wěn)性。(2)構建時間序列對象ts。(3)比較acf與pacf判定該時間序列適用模型。(4)進行相關性、白噪音點檢驗。(5)構建模型并進行預測。(6)與真實值進行對比及分析。
構建時間序列模型
收集整理2022-01至2023-01 13數(shù)據(jù),按照月度間隔,構建時間序列,結合acf\pacf及自相關性等方法,判斷時間序列平穩(wěn)情況,從而選擇合適的函數(shù)進行預測及分析。
構建時間序列及檢驗說明
按照k=12的間隔構建青年失業(yè)率時間序列,并進行平穩(wěn)及自相關檢驗,驗證模型有效性。
(1)平穩(wěn)序列檢驗-序列趨勢檢驗。基于趨勢圖判斷該序列無明顯的遞增或者遞減趨勢,無波動循環(huán)跡象,可初步判斷為平穩(wěn)序列,為了進一步確認是否為平穩(wěn)序列,進行acf檢驗。構建時間序列的acf及pacf時序圖,觀察得,隨著延遲數(shù)的增加,平穩(wěn)時間序列的自相關函數(shù)會很快向0衰減,呈現(xiàn)拖尾現(xiàn)象,即自相關函數(shù)逐步趨向于0。
(2)自相關檢驗。經(jīng)Box.test檢驗觀察得p值<0.05,非白噪聲序列,具有研究的數(shù)據(jù)價值。
(3)小結說明。結合上述結論,觀察該序列檢驗結果,可初步判定為平穩(wěn)非白噪音序列,并且因其拖尾現(xiàn)象,需選擇AR模型而非MA模型。
參數(shù)估算及構建時間序列
為確定時間序列需使用的參數(shù),為避免人工計算錯誤,基于R語言自帶函數(shù)auto.arima()并將trace= T設置為機器檢驗,減少誤差,觀察結果得該序列最優(yōu)為ARIMA(1, 0, 0)模型,并構建時間序列函數(shù),由計算結果可得,系數(shù)的估計值分別為17.0673和0.7991,估計值的標準差為0.1546及0.9705,模型殘差的方差為0.7263,AIC統(tǒng)計量為39.75。
對模型進行檢驗:
觀察標準化殘差基本分布在零水平線附近,且在-2~2的范圍內;自相關函數(shù)迅速下降到兩條虛線內。但Ljung-Box統(tǒng)計量P值大部分<0.05,可以判斷模型通過檢驗。
最后,對模型進行自相關檢驗,區(qū)間在[0.4966364,1.102693],區(qū)間不包含0,模型顯著。綜上所述,可以采用該模型進行預測。
對AR模型預測及分析
設想選取未來5個月的預測值,并設置95%的置信區(qū)間,輸出預測值,其中整體預測值為17.18416,95%的可能性真實值會位于在[14.85154,19.51678]
另,通過中國統(tǒng)計局查詢最新發(fā)布的2023年2月青年失業(yè)率為18.1%,參考第14序號的預測情況,與真實值相差0.85,位于[14.85154 , 19.51678]之間,因此該模型具有一定的現(xiàn)實意義。
觀察預測圖與真實值趨勢圖,可用于后續(xù)觀察整體趨勢情況及區(qū)間變動情況,其中藍色為預測值,灰色填充為預測置信區(qū)間變動范圍。
本章小結
本章針對時間序列分析方法和各類檢驗方法構建了序列函數(shù)為:
根據(jù)預測及真實值對比,觀察及對比后可以有以下現(xiàn)實意義:
現(xiàn)實意義1:可以使用模型預測未來1-5個月的青年失業(yè)率分布情況,通過與真實值進行對比分析,觀察是否存在超過異常區(qū)間的情況出現(xiàn),及時介入及監(jiān)測。
現(xiàn)實意義2:檢測未來預測值及置信區(qū)間變動范圍,若識別到異常值,及時將青年失業(yè)率逐步控制在一個穩(wěn)定及平穩(wěn)的區(qū)間內。
具體措施可結合發(fā)達國家序列中保持最低青年失業(yè)率的德國舉措,結合國情,嘗試從以下幾方面對青年就業(yè)提供就業(yè)支持:
(1)健全的就業(yè)法規(guī)體系,如完成了普通義務教育而沒有繼續(xù)升學的18歲以下青年接受義務職業(yè)教育,逐步頒布相關法律法規(guī),通過立法將職業(yè)教育納入義務教育范疇。
(2)完備的職業(yè)指導體系,如加強對勞動者在勞動力市場中個人責任感及自我推銷的相關技能,可通過在高等課程中設立自我領導力的就業(yè)指導課程,并在高等院校設立就業(yè)指導辦公室,專項指導青年的就業(yè)。
(3)富有特色的職業(yè)教育體系,如建立并完善學校及企業(yè)“ 雙軌制 ”的 職業(yè)教育,同時接收企業(yè)與學校的雙向教育,合格者準予畢業(yè),從而實現(xiàn)教育及就業(yè)的接軌。
通過中國統(tǒng)計局發(fā)布的中國統(tǒng)計年鑒失業(yè)率數(shù)據(jù),從統(tǒng)計學的描述性分析、時間序列分析,得出16-24歲青年失業(yè)率的數(shù)據(jù)特征及分布,在其分布基礎上,對2022年青年失業(yè)率情況進行評估。
2022年全年青年失業(yè)率平均水平在17.56%,其中增幅最大達14%,降幅最大達6%,呈現(xiàn)增長后下降的變化趨勢,近似可認為符合正態(tài)分布趨勢。
通過序列分析方法,對全國青年失業(yè)率進行時間序列研究發(fā)現(xiàn),2022年的青年失業(yè)率時間序列存在一定的現(xiàn)實意義,可通過對未來1-5個周期的數(shù)據(jù)進行預測,實現(xiàn)及時識別極端值并介入及監(jiān)測的工作。
綜上所述,基于2022年的數(shù)據(jù)來看,初步判斷青年當前的失業(yè)率情況數(shù)據(jù)穩(wěn)定,無因經(jīng)濟下行、就業(yè)形式嚴峻等社會問題出現(xiàn)導致急速上升的趨勢。
從時間序列方程來看,有95%的可能性1-5月內的數(shù)據(jù)應該保持在[14,19]的水平,若后續(xù)出現(xiàn)超過該區(qū)間的青年調查失業(yè)率數(shù)據(jù),可能需要引起關注。
(作者單位:對外經(jīng)濟貿易大學統(tǒng)計學院在職人員高級課程研修班)