晁嘉佑 范哲苑
摘 要:掌握互聯(lián)網(wǎng)招聘市場的規(guī)律對于利用好互聯(lián)網(wǎng)招聘平臺有著重要的意義。本文采用詞云、文本挖掘、相關分析等方法對互聯(lián)網(wǎng)招聘信息大數(shù)據(jù)進行研究,發(fā)現(xiàn):招聘信息中的“福利待遇”在不同的地域中存在較大差異,一線城市最注重基本福利;二線城市注重發(fā)展福利;三線城市最重視生活福利等規(guī)律。了解這些規(guī)律有利于招聘企業(yè)更好地發(fā)布招聘信息,吸引優(yōu)秀人才。
關鍵詞:互聯(lián)網(wǎng)招聘 詞云 數(shù)據(jù)可視化 數(shù)據(jù)挖掘
中圖分類號:F724.6 文獻標識碼:A 文章編號:2096-0298(2018)11(a)-017-03
隨著全球化和知識經(jīng)濟時代的來臨,現(xiàn)代企業(yè)之間最大的競爭已經(jīng)由產(chǎn)品之間的競爭轉變?yōu)槿瞬胖g的競爭。如何科學合理地選拔所需的人才是企業(yè)人才隊伍建設的第一步,同時也是最重要的一步。
與傳統(tǒng)的招聘方式相比,互聯(lián)網(wǎng)招聘都具有顯著的優(yōu)勢。對企業(yè)來講,互聯(lián)網(wǎng)招聘既能減少企業(yè)在時間成本上的投入,也能為企業(yè)減少人力物力成本,節(jié)省招聘費用,對企業(yè)降低招聘成本有著重要意義 [1]。
對應聘者而言,互聯(lián)網(wǎng)招聘克服了傳統(tǒng)招聘方式時間和空間上的限制,應聘者足不出戶就能了解企業(yè)人才選拔要求以及企業(yè)的薪資待遇,福利水平,減少了應聘的盲目性。
然而,企業(yè)在實行互聯(lián)網(wǎng)招聘過程中也面臨諸多挑戰(zhàn),由于無法同應聘者進行面對面的交流,企業(yè)與應聘者之間缺乏足夠的互動,企業(yè)難以了解應聘者的需求,往往無法提供給應聘者所關注的信息。因此招聘信息應該包含哪些必要的內(nèi)容,如何發(fā)布有效的招聘信息對企業(yè)完成一次成功的互聯(lián)網(wǎng)招聘至關重要。
“福利待遇”是招聘企業(yè)給予員工的間接報酬,是求職者最關注的指標之一。通過對“福利待遇”字段的研究,可以更好地了解招聘企業(yè)吸引和激勵人才的手段和方法,反映不同地域求職者關注點的差異與特色。然而, 由于“福利待遇”信息一般以文本的形式呈現(xiàn),這就給研究者帶來了困難和挑戰(zhàn)。因此,分析好“福利待遇”數(shù)據(jù),關鍵在于對文本數(shù)據(jù)進行有效的統(tǒng)計和分類。詞云分析可以在分析文本數(shù)據(jù)后快速、形象而有效地呈現(xiàn)統(tǒng)計結果,本文在此基礎上,將企業(yè)招聘信息中的內(nèi)容按“基本福利”“發(fā)展福利”“生活福利”“薪酬補充”“健康關懷”這5個維度進行分析和比較。
1 數(shù)據(jù)來源與研究方法
本文使用的數(shù)據(jù)來自發(fā)布在北京大學開放研究數(shù)據(jù)平臺的“互聯(lián)網(wǎng)招聘網(wǎng)站數(shù)據(jù)”。該數(shù)據(jù)采集的是2014年4月—2017年10月由58同城、智聯(lián)網(wǎng)站發(fā)布的企業(yè)招聘數(shù)據(jù)[2]。
1.1 數(shù)據(jù)處理系統(tǒng)
找到兩個在招聘信息結構上類似的A、B網(wǎng)站,分別爬取信息。將B網(wǎng)站的數(shù)據(jù)作為目標分析數(shù)據(jù),將A網(wǎng)站的數(shù)據(jù)作為參照數(shù)據(jù)。
1.2 數(shù)據(jù)預處理模塊
使用Python對爬取到的JSON文件進行解析和數(shù)據(jù)提取分析。
在城市分類的提取中,注意到有些公司的登記地址以“xx區(qū)”作為開頭,即地址中本身不包含“市”一級的信息。針對這個問題,使用已有的庫函數(shù)chinese_province_city_area_mapper中的transform方法,將地址轉換為一個DataFrame。
例如,針對“歷下區(qū)和平路xx號xx”可以直接輸入后得到輸出“山東省 濟南市歷下區(qū)”,讀取到地址映射到的城市信息——濟南市,提高了分析結果的可信度,如圖1所示。
1.3 詞頻統(tǒng)計模塊1(簡稱“詞頻1”)
網(wǎng)站A的數(shù)據(jù)經(jīng)過前面的數(shù)據(jù)預處理得到“五險一金包住帶薪年假”(節(jié)選),如何有效地進行分詞和詞頻統(tǒng)計呢?
經(jīng)過觀察,發(fā)現(xiàn)福利大多以二字詞、四字詞構成,同時詞與詞之間會出現(xiàn)重復字,例如常見的“休”“假”等,建立三個list,存儲所有單字、相鄰2字、相鄰4字,并分別進行循環(huán)計數(shù)得到每個元素相對應的出現(xiàn)頻次。
1.4 SVM(支持向量機)處理模塊
SVM模塊是詞頻統(tǒng)計系統(tǒng)的關鍵,在詞頻1中只計算出單字、相鄰2字、相鄰4字出現(xiàn)的頻率,根據(jù)這些信息可以初步判斷出相鄰2字是否能組成兩字詞語。
其中,P(A,B)是A和B聯(lián)合出現(xiàn)的概率,P(A)和P(B)為字符串A和字符串B出現(xiàn)的概率。此時,若I(A,B)≥0,即P(A,B)≥P(A)P(B),則可以認為漢字A和漢字B之間是正相關的。
1.5 詞典生成模塊
獲取到糾正的詞頻統(tǒng)計DataFrame(分割完成的詞匯集合),需要生成需要的福利詞典。通過設計高通濾波器,提取其中的高頻分量即高頻詞條,存入list導出。
1.6 詞頻統(tǒng)計模塊2(簡稱“詞頻2”)
詞頻1不同在于,詞頻2依據(jù)的是已經(jīng)生成的基于A網(wǎng)站數(shù)據(jù)的詞典List,使用pandas對數(shù)據(jù)B統(tǒng)計List中詞語出現(xiàn)的頻次,如圖2所示。
2 基于詞云的福利待遇分析
基于地域的分類分析。對地域進行適當分類有利于更好地體現(xiàn)出地域的特色和差異,因此本文首先利用“工作地址”字段中的城市數(shù)據(jù)進行關鍵詞匹配,從而將數(shù)據(jù)劃分為一線城市、二線城市和三線城市三種類別。
2.1 基本福利待遇
基本福利,是指“人們在特定的社會生活環(huán)境中,維持和從事正常的生命活動,并基本上能夠發(fā)展自身的體能與智能,所形成的對物質(zhì)生活資料、精神生活資料以及必要的社會活動的需要 ”[3]。從一、二、三線城市的詞頻統(tǒng)計結果中可以看出,人們對福利待遇的首要關注的內(nèi)容基本是一致的,不同城市間人們對于各種基本福利待遇的關注程度存在高度相關性。
然而,相同的背后也仍表現(xiàn)出巨大的地域性差異。以相關分析為例,如圖3所示,一線城市關于二線城市的回歸系數(shù)只為1.3,而關于三線城市的回歸系數(shù)則高達2.7,側面反映了一線城市的求職者更為注重基本福利待遇的保障,這可能是由于一線城市的工作節(jié)奏更快,生活成本更大,因此基本福利待遇的保障對這部分群體而言有更為重要的意義。
2.2 發(fā)展福利
發(fā)展福利指對職工未來職業(yè)發(fā)展有幫助的福利,其中“培訓”是企業(yè)給予求職者的一項重要福利待遇,包括“免費培訓”“帶薪培訓”等。此外,很多企業(yè)也把晉升空間大、晉升機制的公平性等內(nèi)容作為企業(yè)福利待遇的一種。本文發(fā)現(xiàn),三類城市對發(fā)展福利的要求基本相似,就地域差異而言,二線城市對培訓相關的福利待遇關注度最高,三線城市對“晉升”的關注度最高,而一線城市在這兩者都屬于關注程度最低的。一線城市晉升空間較大,大多數(shù)都有完善的企業(yè)培訓制度,因此一線城市的求職者對與發(fā)展性福利關注度比較低。與之相反,二、三線城市在企業(yè)晉升機制和培訓制度上相對不夠完善,對于謀求長遠發(fā)展的求職者而言對于發(fā)展性福利無疑更為關注和重視。
2.3 生活福利
生活福利指提高職工生活質(zhì)量的福利,主要包括“旅游”相關和“休假”相關的福利,很多企業(yè)或者推出“定期旅游”“國外旅游”等手段吸引求職者,或者給予額外有保障的假期,來吸引求職者。通過分類分析可以看到,如圖4所示,三線城市的求職者對“旅游”的關注度最高,對“休假”的關注度最低,與之恰好相反的是,一線城市對“旅游”的關注度最低,對“休假”的關注度最高。這可能是因為生活在一線城市的群體由于生活成本高、競爭壓力大等原因,在空閑時間更愿意在家休息;相比之下,三線城市的工作群體對旅游表現(xiàn)出更強烈的興趣。呂晃的研究《贏得 下一個十億亞洲游客—起航中 國》[4]也認為二、三線城市的旅游力量正在爆發(fā),并且認為八成以上的中產(chǎn)階級和有能力的消費群體聚集在二、三線城市。其數(shù)據(jù)分析還預測了2030年中國將有29個二線、三線城市擁有300萬以上的中產(chǎn)階級和極具消費潛力的人群。
2.4 薪酬補充
薪酬補充中,企業(yè)常常用“獎金”或給予“年底雙薪”的手段來吸引和激勵公司員工??梢钥吹剑鐖D5所示,給予年底雙薪的企業(yè)已接近一半,可見年底雙薪已逐漸成為像“基本福利”一樣的“標配”。具體而言,一線城市和二線城市的情況十分相似,并無明差異。與之不同的是,三線城市給予年底雙薪的僅為32.3%,比一、二線城市均少了超過15個百分點,可見更多的企業(yè)傾向給予員工獎金來作為薪酬補充。
此外,部分企業(yè)通過給予員工公司“期權”來作為補充和獎勵,然而在三類城市中采用這種方法的都只有0.3%,可見給予期權獎勵在現(xiàn)互聯(lián)網(wǎng)招聘市場中尚不流行。
2.5 健康關懷
健康關懷類福利待遇主要指企業(yè)給“五險”之外的商業(yè)保險或給予員工“定期體檢”。從統(tǒng)計結果中可以看到,給予健康關懷類福利待遇在互聯(lián)網(wǎng)招聘中并不流行,占比基本在3%以下。這一方面與人們對于自身健康狀況的關注不夠有關,求職者普遍缺少定期體檢、關注自身健康的觀念;另一方面,通過互聯(lián)網(wǎng)方式參與招聘的群體以年輕人為主,發(fā)生健康疾病的風險相對較小。還應考慮到傳統(tǒng)的五險一金中的工傷保險和醫(yī)療保險已經(jīng)基本能夠對職工可能發(fā)生的人身意外傷害和健康問題給予保障,客觀上使得額外商業(yè)保險的吸引力變小。
3 給招聘企業(yè)的結論與建議
對于一線城市的招聘企業(yè)而言,給予員工“基本福利待遇”的保障無疑是重要的,考慮到一線城市有生活成本高的特點,部分求職者是從外地來的務工人員,因而基本福利待遇對他們而言就顯得有特別的意義。由于很多員工是外來務工人員,年底回家過年時都有經(jīng)濟上的壓力,因而一線城市的求職者對于“年底雙薪”的保障最為重視,應當?shù)玫秸衅钙髽I(yè)的注意。對于三線城市的招聘企業(yè)而言,三線城市求職者對于晉升的條件更為重視。因此,三線城市的企業(yè)想要吸引求職者應當注重宣傳企業(yè)內(nèi)部晉升的空間、公平性等問題,以吸引到優(yōu)秀的員工。三線城市的娛樂生活相對單調(diào),適當組織旅游活動對促進求職者對企業(yè)的關注有很大的幫助。二線城市的求職者對于于福利待遇的關注大都介于一線城市和三線城市之間。然而,二線城市的求職者是最“好學”的,企業(yè)在條件允許的情況下,適當給予員工一些專業(yè)培訓,既能夠使員工獲得更好地薪資和職位,也利于企業(yè)提高員工的整體素質(zhì),可以說是雙贏的措施。
一、二、三線城市對福利待遇對關注點有明顯的區(qū)別,企業(yè)如能根據(jù)自身情況和所處位置有針對性地發(fā)布信息,可以有效提高招聘信息的質(zhì)量。
參考文獻
[1] 陳曉霞.網(wǎng)絡招聘與傳統(tǒng)招聘方式之比較[J].人力資源管理(學術版),2009(3).
[2] 國家信息中心.“互聯(lián)網(wǎng)招聘網(wǎng)站數(shù)據(jù)”[EB/OL].http:// dx.doi.org/10.18170/DVN/TWEHQO,北京大學開放研究數(shù)據(jù)平臺,2017,V1.
[3] 王裕國,趙吉林.將保障公民基本福利確立為我國現(xiàn)階段的重要國策[J].消費經(jīng)濟,2006(5).
[4] 呂晃.贏得下一個十億亞洲游客-起航中國[J].銷售與管理, 2014(5).
①基 金項目:山東大學校級科技創(chuàng)新基金立項(2018075)。
作者簡介:晁嘉佑(1997-),男,漢族,江蘇省徐州市人,本科在讀,主要從事數(shù)理統(tǒng)計方面的研究。