摘要:本文基于Kaggle平臺(tái)的員工離職數(shù)據(jù)集,運(yùn)用Python進(jìn)行數(shù)據(jù)分析,旨在探討影響員工離職的關(guān)鍵因素。通過統(tǒng)計(jì)描述、相關(guān)性分析等方法,識(shí)別出對(duì)員工離職有顯著影響的特征變量。研究發(fā)現(xiàn),薪酬、員工滿意度、近期考核、工作時(shí)長(zhǎng)、職業(yè)發(fā)展機(jī)會(huì)等因素與員工離職率密切相關(guān),并提出管理建議。本文為企業(yè)管理和人力資源策略提供了數(shù)據(jù)支持,有助于企業(yè)制定更有效的留人措施,減少員工流失,提升整體競(jìng)爭(zhēng)力。
關(guān)鍵詞:人力資源;員工流失;數(shù)據(jù)分析
中圖分類號(hào):F24"""""""文獻(xiàn)標(biāo)識(shí)碼:A""""""doi:10.19311/j.cnki.16723198.2025.05.045
0"引言
在當(dāng)今競(jìng)爭(zhēng)激烈的商業(yè)環(huán)境中,員工流失成為企業(yè)管理和學(xué)術(shù)研究的關(guān)鍵話題[12]。高流失率不僅增加企業(yè)招聘及培訓(xùn)成本,還可能導(dǎo)致知識(shí)流失、團(tuán)隊(duì)穩(wěn)定性下降及業(yè)務(wù)發(fā)展減緩,影響企業(yè)長(zhǎng)期戰(zhàn)略[34]。因此,深入理解員工流失根源并制定有效管理策略至關(guān)重要[56]。隨著大數(shù)據(jù)和人工智能技術(shù)發(fā)展,數(shù)據(jù)分析成為揭示復(fù)雜問題規(guī)律的重要手段。通過收集和分析員工離職前數(shù)據(jù),如基本信息、工作考核、薪酬福利、工作環(huán)境和職業(yè)發(fā)展機(jī)會(huì)等,可精準(zhǔn)識(shí)別影響離職的關(guān)鍵因素,為制定個(gè)性化留人策略提供科學(xué)依據(jù)[78]。Kaggle作為全球性數(shù)據(jù)科學(xué)平臺(tái),提供大量員工離職真實(shí)數(shù)據(jù)集,為研究者提供寶貴資源[9]。本文利用Kaggle員工離職數(shù)據(jù)集分析影響離職的關(guān)鍵因素,并提出應(yīng)對(duì)措施,旨在幫助企業(yè)減少員工流失,提高組織績(jī)效,具有極高現(xiàn)實(shí)意義和研究?jī)r(jià)值。
1"數(shù)據(jù)準(zhǔn)備
1.1"樣本選擇與數(shù)據(jù)說明
本研究選取了Kaggle平臺(tái)的HR_comma_sep數(shù)據(jù)集進(jìn)行研究。該數(shù)據(jù)集提供了詳實(shí)的員工信息和他們的工作特征,是開源社區(qū)中評(píng)價(jià)較高、使用頻率較高的人員數(shù)據(jù)集之一。
HR_comma_sep數(shù)據(jù)集包含了數(shù)千名員工的信息,每位員工在數(shù)據(jù)集中被分配了多個(gè)描述他們工作狀態(tài)的變量。這些變量涵蓋了不同層面的特征,以量化員工的工作滿意度、最近的績(jī)效評(píng)估、項(xiàng)目參與度、月平均工作小時(shí)數(shù)、在公司工作年數(shù)、是否出現(xiàn)工作事故、5年內(nèi)是否晉升、以及部門與薪資水平等信息。這個(gè)豐富的特征集合可以為我們提供更為全面細(xì)致的分析視角,幫助分析員工流失的潛在原因。數(shù)據(jù)集狀態(tài)變量如表1"所示。
1.2"數(shù)據(jù)清洗
該數(shù)據(jù)集有14999條數(shù)據(jù),10個(gè)特征。對(duì)其進(jìn)行數(shù)據(jù)清洗,包括處理缺失值、去除重復(fù)記錄、標(biāo)準(zhǔn)化字段名稱后的數(shù)據(jù)集數(shù)據(jù)如表2所示。
1.3"數(shù)據(jù)編碼
將薪資分類數(shù)據(jù)進(jìn)行編碼,映射關(guān)系為:{'low':"1,'medium':"2,'high':"3},1表示低薪資,2表示中等薪資,3表示高薪資。編碼后的數(shù)據(jù)集如表3所示。
2"數(shù)據(jù)分析
2.1"描述性統(tǒng)計(jì)分析
根據(jù)上表,可得如下結(jié)論:
(1)員工滿意度分布:均值為0.61,中位數(shù)0.64,范圍在0.09~1之間,50%的員工滿意度在0.44~0.82之間。整體滿意度中等。
(2)最新評(píng)估考核分布:均值為0.72,中位數(shù)0.72,范圍在0.36~1之間,50%的員工績(jī)效考核在0.56~0.87間。整體員工考核中等偏上。
(3)員工參與項(xiàng)目數(shù)分布:均值為3.8,中位數(shù)4,范圍在2~7之間,50%的員工參與3~5個(gè)項(xiàng)目,適中。
(4)每月工作時(shí)長(zhǎng)分布:均值為201小時(shí),中位數(shù)200,范圍在96~310之間,50%的員工每月工作時(shí)長(zhǎng)在156~245之間,25%的人在245~310之間;按國(guó)家規(guī)定的標(biāo)準(zhǔn)一個(gè)月工時(shí)176個(gè)小時(shí)計(jì),該企業(yè)加班現(xiàn)象嚴(yán)重。
(5)工作年限分布:均值為3.5,中位數(shù)3,范圍在2~10之間,50%的員工工作年限在3~4年之間,公司團(tuán)隊(duì)年輕。
(6)工作事故分布:總體上有14%的員工出現(xiàn)過工作事故,該企業(yè)工作事故率高。
(7)員工離職率分布:總體員工離職率為24%,一般公司離職率在10%,可見離職率非常高。
(8)員工近5年內(nèi)升職分布:總體員工升職幾率僅為2%,遠(yuǎn)低于一般水平,升職率非常低。
(9)薪資分布:薪資取值在1~3之間,1表示低薪資,2表示中等薪資,3表示高薪資,均值1.59,中位數(shù)為2,有50%的人在1~2之間,可見總體薪資水平低,達(dá)不到中等薪資水平。
2.2"員工離職因素分析
2.2.1"員工滿意度
數(shù)據(jù)集中是否離職員工對(duì)公司的滿意度箱線圖如圖1所示。假定滿意度以0.6為閾值,是否離職和滿意度分析表如表5所示。
圖1可反應(yīng)員工滿意度和是否離職數(shù)據(jù)分布的特征。在職員工的滿意度相對(duì)集中,中位數(shù)為0.7左右,50%的人集中在0.55~0.85之間,整體對(duì)公司滿意度偏上;離職人員的員工滿意度中位數(shù)較低為0.4左右,且離職員工滿意度波動(dòng)非常大,50%的人在0.1~0.75之間,且離職人員中滿意度沒有為1的;從表5可知,離職員工中有高達(dá)72.70%對(duì)公司滿意度低于0.6,未離職員工中滿意度達(dá)到0.6及以上的比例為65.52%;離職員工和在職員工對(duì)公司滿意度的平均值存在較大的差異,說明員工滿意度對(duì)離職有較大影響。
2.2.2"員工近期考核
將最近考核結(jié)果從0.4到1之間分割成6個(gè)區(qū)間,分別計(jì)算在每個(gè)區(qū)間中離職人數(shù)和離職率,結(jié)果如表6所示。一般以0.6為考核合格線,從表6可知,考核不合格的員工離職率高,因?yàn)榭?jī)效不好而離職。同時(shí)可以發(fā)現(xiàn)隨著績(jī)效考核得分越高,離職人數(shù)和離職率明顯上升,特別是考核分在0.8以上的員工,說明大部分離職員工并非考核不好,而是比較優(yōu)秀而選擇跳槽,企業(yè)要反思優(yōu)秀員工留不住的問題。
2.2.3"平均每月工作時(shí)長(zhǎng)
月工作時(shí)長(zhǎng)和是否離職箱線圖如圖2所示,從圖中可知,離職員工的工作時(shí)長(zhǎng)中位數(shù)、3/4位數(shù)、最小值、最大值均比未離職員工高,說明工作時(shí)長(zhǎng)對(duì)離職有一定的影響;以國(guó)家標(biāo)準(zhǔn)月工作時(shí)長(zhǎng)176小時(shí)為閾值,超過為存在加班情況,以平均每天加班一小時(shí)為一個(gè)區(qū)間,超工作時(shí)長(zhǎng)與離職率對(duì)比如表7所示,顯然隨著加班時(shí)長(zhǎng)的增加,離職率迅速上升。說明加班對(duì)離職有很大影響。
2.2.4"項(xiàng)目數(shù)
各項(xiàng)目數(shù)人員占比如圖3所示。各參與項(xiàng)目數(shù)是否離職統(tǒng)計(jì)如圖4所示。
從圖3可知,整體員工參與項(xiàng)目數(shù)在3~5間占比為74.5%;從圖4可知,員工參與的項(xiàng)目數(shù)從3~7逐漸增加,離職率也隨之增加,特別是參與項(xiàng)目數(shù)為6和7的,離職率很高,參與項(xiàng)目數(shù)為7的離職率100%,這說明離職人員的參與項(xiàng)目數(shù)越多,可能帶來工作時(shí)間過長(zhǎng)嚴(yán)重加班而離職;其中參與項(xiàng)目數(shù)最少的為2,離職率也很高,可能是因?yàn)槟芰η啡?,不足以支撐?xiàng)目能力需求,被迫離職;說明公司對(duì)技術(shù)骨干的流失問題比較嚴(yán)重。
2.2.5"工作年限
不同工作年限統(tǒng)計(jì)圖如圖5所示。不同工作年限是否離職的分布如圖6所示。
由圖5可知,工作年限在2~4年占比81.6%,占比最高的是3年43%,是一支非常年輕的隊(duì)伍,同時(shí)也反映公司人流動(dòng)性非常大;離職員工的工作年限在2~6年間,超過6年各方面趨于穩(wěn)定,年齡較大,不易更換工作,離職率較高的集中在4~6年,此工作年限的員工擁有豐富的工作經(jīng)驗(yàn),并且年輕精力充沛,更易選擇更優(yōu)公司。
2.2.6"是否發(fā)生工作事故
由上表可知,發(fā)生事故的員工離職率為7.79%,遠(yuǎn)小于未發(fā)生工作事故的離職率26.52%。離職員工中僅有4.73%發(fā)生過工作事故,而在職員工中有17.50%發(fā)生過工作事故,說明發(fā)生事故對(duì)離職無明顯影響。
2.2.7"5年內(nèi)是否晉升
從上表可知,總體晉升率為2.1%,非常低,5年未晉升的離職率高達(dá)24.2%,遠(yuǎn)大于晉升的離職率5.96%。說明晉升對(duì)員工保持穩(wěn)定有明顯的促進(jìn)作用,而過低的晉升率會(huì)對(duì)員工流失有明顯影響。
2.2.8"部門
從上表可知,銷售部門人數(shù)占比最高為27.6%,"其次是技術(shù)和支持部門為18.13%和14.86%,最少為管理層,占4.2%,各部門人員分布較為合理。離職人員中銷售部離職率最高,站總員工數(shù)的6.76%,占離職人數(shù)的28.4%,其次是技術(shù)部、后勤部分別占總員工數(shù)的4.65%和3.7%,占離職人數(shù)的19.52%和15.54%。從部門視角來看,每個(gè)部門內(nèi)部離職人員占部門總?cè)藬?shù)的比例,最高的是的是人力資源29.09%,其次是財(cái)務(wù)部26.6%,技術(shù)部25.62%,人力資源和財(cái)務(wù)部一般來講比較穩(wěn)定的部門,在該公司流動(dòng)性非常大,確實(shí)比較異常,反映出公司內(nèi)部的管理存在一定的問題。
2.2.9"薪資
從上表可知,該公司近一半員工是低收入,占比較高。低收入員工的離職率最高,占離職總?cè)藬?shù)的比例高達(dá)60.82%;中等收入員工占離職總?cè)藬?shù)的36.88%;高收入員工占離職人數(shù)的2.3%。說明薪資水平對(duì)離職率有較為明顯的影響。
3"結(jié)論和管理建議
本文以HR_comma_sep公開數(shù)據(jù)集為研究樣本,對(duì)每個(gè)可能的員工流失影響因素進(jìn)行數(shù)據(jù)分析,得出以下研究結(jié)論:?jiǎn)T工滿意度低、近期績(jī)效考核極端(過高或過低)、月均工作時(shí)長(zhǎng)長(zhǎng)、承擔(dān)項(xiàng)目多、工作年限3~4年、銷售與IT部門、薪資低等因素均導(dǎo)致離職率高;而5年內(nèi)升職的員工離職率較低;事故與離職率無特定規(guī)律。
根據(jù)以上結(jié)論,減少該公司的員工離職率給出以下對(duì)策:建議總體提升低收入員工的薪資水平;減少工作強(qiáng)度,"進(jìn)而減少工作時(shí)間;員工的參與項(xiàng)目數(shù)不宜超過5;進(jìn)一步了解員工的晉升通道設(shè)置是否合理;對(duì)員工開展個(gè)人職業(yè)規(guī)劃咨詢;盡量通過加薪、升職等綜合措施穩(wěn)住3~4年的有工作經(jīng)驗(yàn)的員工;優(yōu)化內(nèi)部管理,提升員工對(duì)公司的滿意度。員工滿意度的提高不僅對(duì)員工個(gè)體有益,對(duì)企業(yè)形象也有積極影響[10],從而減少公司離職率,有助于公司穩(wěn)步發(fā)展。
參考文獻(xiàn)
[1]劉奕彤.A醫(yī)藥公司員工流失影響因素及對(duì)策研究[D].南京:南京郵電大學(xué),2024:2330.2024(03):6672.
[2]劉紅娜,劉曉靜.企業(yè)員工績(jī)效考核評(píng)價(jià)的合理性與人員流失的關(guān)系研究[J].科技創(chuàng)業(yè)月刊,2024,37(03):6672.
[3]張學(xué)銳.基于結(jié)構(gòu)方程模型的重慶中小企業(yè)新生代員工流失因素研究[J].現(xiàn)代商業(yè),2024,(04):149152.
[4]劉敏佳.互聯(lián)網(wǎng)公司員工離職現(xiàn)象分析[J].合作經(jīng)濟(jì)與科技,2023,(10):99101.
[5]何彩萍.淺析中小型企業(yè)基層人才流失的成因及規(guī)避技巧[J].科技創(chuàng)新與應(yīng)用,2018,(11):610.
[6]孫小麗.關(guān)于企業(yè)員工流動(dòng)問題的探討[M].天津:南開大學(xué)出版社,2020.
[7]周思思.大數(shù)據(jù)技術(shù)背景下的人力資源管理發(fā)展策略研究[J].現(xiàn)代商業(yè)研究,2023,(06):125127.
[8]鄭國(guó)濤.基于大數(shù)據(jù)的企業(yè)人力資源績(jī)效管理創(chuàng)新研究[J].商場(chǎng)現(xiàn)代化,2024,(14):8689.
[9]孫文軒.基于隨機(jī)森林算法的公司人才流失問題與對(duì)策研究——以Kaggle平臺(tái)人力資源分析數(shù)據(jù)集為例[D].吉林:吉林大學(xué),2022:11.
[10]呂翠.人力資源管理策略在提升企業(yè)經(jīng)濟(jì)競(jìng)爭(zhēng)力中的作用研究[J].商場(chǎng)現(xiàn)代化,2024,(10):7476.