曹奇
(常州紡織服裝職業(yè)技術學院 江蘇常州 213164)
根據教育部的統(tǒng)計,2022屆我國普通高校畢業(yè)生規(guī)模首次突破千萬,達到了1076萬人,加之中小企業(yè)困難增多,吸納能力下降,同時近兩年來受多重因素影響,畢業(yè)生擇業(yè)時更加求穩(wěn)求優(yōu),不就業(yè)、緩就業(yè)、慢就業(yè)的現象尤為突出。國際外部環(huán)境更趨復雜多變,國內新冠疫情多點爆發(fā),防控工作更是難度增加,經濟社會的發(fā)展面臨著極為繁重的任務,李克強總理多次強調就業(yè)不僅是民生問題,也是發(fā)展問題[1],教育部在2022年實施高校畢業(yè)生就業(yè)創(chuàng)業(yè)促進行動[2],推動就業(yè)創(chuàng)業(yè)工作提質增效。
百度指數是根據網絡用戶對關鍵詞的關注情況和不斷變化程度,以海量搜索開發(fā)出的網絡信息平臺,通過科學分析各個關鍵詞在百度網頁搜索中搜索頻次的加權,具有多種數據種類、高效處理速度的特征,綜合搜索指數,根據數據來源分為PC端指數和移動端指數。在經濟學、社會學、心理學、教育學領域,學者主要對百度搜索的大數據進行數據挖掘、趨勢預測、輿情監(jiān)測研究[3]。
目前,在就業(yè)領域中互聯網指數運用研究相對較少:彭賡等(2013)利用谷歌指數建立了三個回歸模型預測失業(yè)率[4],張應劍等(2017)基于網絡搜索數據構造的指數模型對陜西互聯網企業(yè)進行了統(tǒng)計監(jiān)測和趨勢預判[5],肖周燕(2021)通過百度指數對城市群未來城際人口遷移態(tài)勢進行了研判[6]。
高校就業(yè)態(tài)勢百度指數除了含有長時間跨度的趨勢成分,由于受到年度政策調整、國家經濟變化、搜索模糊錯誤等影響,還包括整年期、半年期等季節(jié)性波動成分。利用百度指數大數據平臺,搜索關鍵詞“高校大學生”和“找工作”采集2010年12月27日—2021年8月23日共10年8個月的綜合指數(移動端+PC端)數據,基于小波分析算法對就業(yè)態(tài)勢指數的周期振蕩成分進行識別分析,解析近10年來我國高校大學生群體時頻域上的求職特征,并根據識別結果對高校就業(yè)工作部門提供政策建議,從而促進高校畢業(yè)生高質量就業(yè)。
小波分析(Wave analysis)是由Morle在20世紀80年代初提出的一種具有時頻多分辨率功能的方法[7],主要適用于信號降噪濾波、多維時間尺度特征識別,在地學領域、氣象領域廣泛應用[8]。對于就業(yè)態(tài)勢數據這種非平穩(wěn)時間序列分析建模,需要時段信息與頻段信息相對應,僅從時域或頻域單個分析很難解決問題,小波分析能夠有效對就業(yè)態(tài)勢數據進行降噪濾波、分形維數與信號系數的計算和多維時間尺度振蕩成分識別分析。
小波分析通過小波簇函數系來無限接近時間序列,所以小波函數能起到關鍵作用,其特征是波動振蕩性能快速接近到零的一種函數,用符號ψ(t)∈L2(R)表示基小波函數,公式為:
ψ(t)經壓縮尺度與移動時間軸處理組成相應簇函數系為:
式(2)中:ψa,b(t)表示子小波或基小波;a為反映周期長度的尺度因子;b為平移因子。
在對就業(yè)態(tài)勢數據進行分析時,由于不同的基小波函數處理結果往往不太一致,需要根據處理對象不同合理選用基小波函數,可以用比較不同基小波函數處理的結果與給定數據的精準度來評判其適用性。
若ψa,b(t)是由式(2)給出的基小波函數,根據能量有限信號f(t)∈L2(R),其連續(xù)小波變換(Continue WaveletTransform CWT,)為:
式(3)和式(4)即為小波分析方法基本原理??梢哉{節(jié)伸縮尺度a和平移參數b得到坐標時間序列的低頻或者高頻信息,通過觀察頻域信息可對時間序列的不同時間尺度和空間局部特征進行分析研究。在通過小波分析方法處理時間序列時,最常使用小波變換方程中的小波系數來分析其序列的時域與頻域變化特征。
小波方差為小波系數的平方值在平移參數b上積分,公式為:
式(5)中:小波方差在時間尺度a域中的分布狀況叫做小波方差圖。由式(5)可知,小波方差圖表示信號波動的能量隨時間尺度a的變化情況,故可通過不同時間尺度擾動的強弱情況來識別提取信號中的主周期。
選取適用的基小波函數是運用小波分析理論來識別就業(yè)態(tài)勢時間序列周期振蕩成分的前提,常用的基小波函數有墨西哥帽(Mexican Hat)、Haar、Morlet及Meyer基小波等。通過Morlet基小波函數來識別就業(yè)態(tài)勢數據的多時間尺度周期振蕩成分,公式為:
式(6)中:kψ是常數,用于確定基小波的高斯波包寬度,為使Morlet小波被適用,kψ應大于等于6。當kψ增加時,高斯波包寬度增加,小波系數時間分辨率下降,為得到最優(yōu)時間分辨率,應取允許最小值6。
圖1為小波分析方法應用于識別就業(yè)態(tài)勢數據時間序列周期振蕩成分流程。首先利用多項式函數擬合對就業(yè)態(tài)勢數據分量進行周期振蕩成分提??;由于就業(yè)態(tài)勢數據時間序列長度有限,在其序列兩端也許存在“邊際效應”,可通過算法延展兩端時間序列來去除或減弱開始與結束端處的“邊際效應”;開始小波變換處理,消去兩端延展多余的小波變換系數,僅留存原就業(yè)態(tài)勢數據時間域中的小波系數進行后續(xù)步驟分析;選擇Morle基小波函數計算其復小波系數實部值;進行小波時間尺度的判斷,如果顯示的等值線圖不能正常識別主周期振蕩成分則需要重新計算小波系數;在選擇合適的小波時間尺度后,繪制就業(yè)態(tài)勢時間分量周期項成分小波系數實部等值曲線圖與小波方差圖,用來識別和分析就業(yè)態(tài)勢數據時間序列在長時間跨度內的周期振蕩成分。
圖1 小波分析方法識別周期振蕩成分流程
高校就業(yè)態(tài)勢指數屬于非平穩(wěn)時間序列[9],這些指數序列中可能含有因季節(jié)變化導致的周期性趨勢。其處理流程一般是根據原始序列的大致趨勢用多項式函數(階數N<5)擬合,保證曲線光滑。因高校就業(yè)態(tài)勢指數有明顯的趨向性,離散程度不是很高,采用4階函數進行大致擬合y=6 ×10-9x4-0.0011x3+67.419x2-2 ×106x+2 ×106決定系數R2=0.5274,說明擬合效果良好。圖2為2010—2021年就業(yè)態(tài)勢時間序列全景分布。從趨勢成分可以看出:求職高峰在每年的3、4月和7月,分別為春季和大學生畢業(yè)季;2010—2018年就業(yè)態(tài)勢總體保持平穩(wěn),受2018年貿易摩擦影響,2018—2020年就業(yè)態(tài)勢序列振蕩較為異常,存在綜合搜索指數春節(jié)前開始增高的現象,這也說明高校應加強學生先就業(yè)后擇業(yè)的就業(yè)觀,開拓就業(yè)門路,在2020年之后的時間段內謹防學生出現不就業(yè)、慢就業(yè)、頻繁跳槽現象,保證就業(yè)穩(wěn)定。
圖2 2010—2021年就業(yè)態(tài)勢時間序列全景分布(點線為趨勢項成分)
從圖2就業(yè)態(tài)勢原始坐標時間序列可見,除了趨勢成分外,還具有明顯的振蕩行為。通過Morlet基小波對就業(yè)態(tài)勢序列周期項成分進行小波變換來更加細致地分析就業(yè)態(tài)勢特征的時間尺度和周期性特征。圖3為就業(yè)態(tài)勢時間分量周期項成分Morlet小波系數實部等值線,小波系數實部值代表了不同時間尺度的變化周期在時間域上的能量密度分布情況,時間尺度上周期振蕩強度與相應的系數實部值呈正相關;等值線中黑實線表示小波系數實部值為正,表示上升偏移,紅實線表示小波系數實部值為負,代表下沉偏移。
圖3 就業(yè)態(tài)勢時間分量周期項成分小波系數實部等值曲線
小波方差圖能夠顯示就業(yè)態(tài)勢分量的波動能量強度隨尺度days的變化狀況,可用來確定就業(yè)態(tài)勢在長時間受到季節(jié)性、政策、國民經濟、模糊搜索、搜索失誤、惡意搜索影響變化中存在的主周期,圖4為2010—2021年就業(yè)態(tài)勢周期項成分小波方差曲線。
圖4 周期項成分小波方差曲線
從圖3可知,2010—2021年就業(yè)態(tài)勢在整個時間演變過程中存在多時間尺度周期振蕩特征,并且具有明顯的年際變化,其存在明顯的主周期,存在全域性的90~140d的小尺度的周期變化規(guī)律,其主周期振蕩頻率主要受到3~4個月周期尺度的影響。
圖4小波方差圖中存在至少3個較為顯著的峰值,按峰值的大小可以對應為第一、第二、第三等主周期,最大峰值的時間尺度對應最強周期振蕩,并且這些主周期的波動控制著整個就業(yè)態(tài)勢在2010年12月27日—2021年8月23日時間域內的周期變化特征。從圖中峰值情況分析就業(yè)態(tài)勢分量的主要振蕩周期為14d、143d、249d、74d,可利用這些數據建立三角函數擬合模型,結合趨勢項模型可對2021年之后的就業(yè)態(tài)勢變形規(guī)律進行預測預報。
以“高校大學生”和“找工作”為關鍵詞,利用百度搜索平臺構造高校就業(yè)態(tài)勢需求指數,及時有效地反映了2010—2021年大學生就業(yè)的周期性特點及市場供需變化趨勢;通過多項式擬合模型實現了對高校就業(yè)態(tài)勢的趨勢成分提取,分析發(fā)現:2010—2021年就業(yè)態(tài)勢平穩(wěn),2018年以來存在就業(yè)態(tài)勢劇烈振蕩現象。
基于小波分析方法對就業(yè)態(tài)勢數據進行周期振蕩成分提取分析,探析近10年來我國高校大學生群體時頻域上的求職特征,探析藏匿于時間序列中的14d、143d、249d、74d的多周期變化,并且明顯存在季節(jié)性變化,定性評估出就業(yè)態(tài)勢指數的發(fā)展趨勢。