• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于改進(jìn)決策樹算法的人力資源智能推薦方法研究

      2023-12-29 01:39:16汪映隆
      關(guān)鍵詞:決策樹人力資源樣本

      王 卓 汪映隆

      (國(guó)網(wǎng)固原供電公司,寧夏 固原 756000)

      隨著企業(yè)的發(fā)展,公司的人事管理部門面臨很大的挑戰(zhàn):一方面,不同地區(qū)的文化不同,工資結(jié)構(gòu)也不同。因此,要保證員工的穩(wěn)定性,減少由于人員流動(dòng)而導(dǎo)致經(jīng)營(yíng)和管理費(fèi)用增加。另外,由于人員不斷增加,企業(yè)的人事部也要不斷完善現(xiàn)有的管理方式以及服務(wù)觀念。改善經(jīng)營(yíng)方式,提升服務(wù)觀念,就需要以大量的信息作為決策依據(jù)。在這種情況下,為了明確求職人員的求職意向與招聘企業(yè)的崗位需求,為不同的用戶提供自己需要的信息,需要緩解人才市場(chǎng)上的就業(yè)難題。

      文獻(xiàn)[1]使用決策樹算法進(jìn)行多級(jí)冗余數(shù)據(jù)智能檢索方法的研究,在云計(jì)算的基礎(chǔ)上,對(duì)決策樹進(jìn)行信息量處理,并根據(jù)信息量的大小,在每個(gè)節(jié)點(diǎn)上選取一個(gè)檢測(cè)屬性。在建立決策樹后,再對(duì)其中的分類規(guī)則進(jìn)行抽取,有效地檢索數(shù)據(jù)智能成果,因此,該文提出基于改進(jìn)決策樹算法的人力資源智能推薦方法研究。

      1 基于改進(jìn)決策樹算法的人力資源智能推薦方法研究

      1.1 基于改進(jìn)決策樹算法歸納分類資源

      在數(shù)據(jù)挖掘的各方面,其中,最常用的方法就是決策樹算法。決策樹算法的分類就是要找出同一種東西的相同之處和同一種東西之間的差別。例如普通的病毒庫(kù)在發(fā)現(xiàn)一種新的病毒后對(duì)其進(jìn)行特征分析,然后將其歸入病毒庫(kù)中的某一種,在該基礎(chǔ)上根據(jù)已有的樣本生成的分類規(guī)則,對(duì)新樣本進(jìn)行分區(qū)[2]。決策樹是一種具有樹形結(jié)構(gòu)的分類器,每個(gè)樹的內(nèi)結(jié)點(diǎn)代表一個(gè)屬性的檢驗(yàn),檢驗(yàn)結(jié)果由樹的一條枝干代表,而葉子節(jié)點(diǎn)則由一個(gè)類來標(biāo)注,而根結(jié)點(diǎn)是最上層的一個(gè)節(jié)點(diǎn)。圖1 就是分類算法中是最典型的決策樹分類示意圖。

      圖1 決策樹分類

      傳統(tǒng)ID3 算法是決策樹算法中一種較為典型的構(gòu)造算法,相關(guān)研究學(xué)者發(fā)現(xiàn)該方法也存在一些缺點(diǎn)和問題。改進(jìn)決策樹算法已成為當(dāng)前數(shù)據(jù)分類挖掘算法的首要算法,該算法利用信息量大的特點(diǎn)選取一個(gè)屬性作為劃分決策樹的結(jié)點(diǎn),從而克服了ID3 算法偏向于某一屬性的缺點(diǎn)。采用不同的修剪技術(shù),在樹木構(gòu)造的過程中或者是在樹木構(gòu)造結(jié)束后,可以防止樹木不平衡。修正ID3 算法無法克服連續(xù)屬性的缺點(diǎn),對(duì)連續(xù)屬性進(jìn)行離散后處理[3]。

      改進(jìn)決策樹算法給出了一組人力資源樣本集S,信息增量計(jì)算如公式(1)所示。

      式中:G(s,a)為屬性a在樣本集的信息增益;s為樣本集;S(s,a)為樣本集S按屬性;a為進(jìn)行分裂的均勻性及廣度。

      利用公式(1)計(jì)算具有最大信息量的屬性a,并以a為決策樹的根節(jié)點(diǎn),分割人力資源樣本集,得到一棵決策樹[4]。按照這個(gè)準(zhǔn)則將一個(gè)樣本集合劃分為n個(gè)子集合,然后一步一步地分割,當(dāng)?shù)趈個(gè)子集合S中的數(shù)據(jù)屬于同一類型時(shí),就會(huì)停止分割,并且將這個(gè)結(jié)點(diǎn)當(dāng)作樹的葉子節(jié)點(diǎn)。對(duì)其他子集也是如此,通過遞歸的方式逐漸形成一棵樹,直至各子集內(nèi)的數(shù)據(jù)屬于同一類別,可以得出改進(jìn)決策樹的表達(dá)式,如公式(2)所示。

      式中:pi為任意樣本對(duì)應(yīng)類別ci的概率,用來估算,t為訓(xùn)練集樣本總數(shù)。

      當(dāng)對(duì)人力資源數(shù)據(jù)進(jìn)行歸納分類時(shí),首先,對(duì)數(shù)據(jù)進(jìn)行預(yù)處理。其次,對(duì)數(shù)據(jù)進(jìn)行屬性選擇、變換以及清洗。數(shù)據(jù)清理主要是對(duì)資料進(jìn)行預(yù)處理[5]、去除噪聲、清除空白值等工作。屬性選擇的任務(wù)就是利用相關(guān)性分析的方法,找到與分類任務(wù)有關(guān)的屬性,剔除無關(guān)或冗余的,從而加快學(xué)習(xí)速度,避免在學(xué)習(xí)中出現(xiàn)錯(cuò)誤。數(shù)據(jù)變換是指將數(shù)據(jù)規(guī)范化或一般化的過程。

      1.2 采集人力資源數(shù)據(jù)

      人力資源推薦方法的整體流程如下:對(duì)人力資源信息進(jìn)行收集,將其與該信息的有關(guān)特性進(jìn)行組合。對(duì)已收集的信息進(jìn)行預(yù)處理,將預(yù)處理后的人力資源信息保存在人力資本數(shù)據(jù)庫(kù)中,使用數(shù)據(jù)庫(kù)中保存的人力資源信息,運(yùn)用改進(jìn)決策樹計(jì)算來實(shí)現(xiàn)人力資源推廣。根據(jù)得到的結(jié)果產(chǎn)生推薦列表,從而完成人力資源智能推薦方法[6]。

      在人力資源智能推薦方法的運(yùn)行過程中,數(shù)據(jù)來源是十分關(guān)鍵的,對(duì)人力資源數(shù)據(jù)進(jìn)行采集,這樣既能提供廣泛的人力資源數(shù)據(jù),又能提高數(shù)據(jù)采集速度,還能對(duì)大規(guī)模的人力資源推薦問題進(jìn)行分析。從大量的數(shù)據(jù)中提取有用的人才信息是實(shí)現(xiàn)人力推薦的前提[7]。采用分散式云集組的數(shù)據(jù)收集方法,收集人力資源信息。該文充分利用云集群高可用性和高并發(fā)度的優(yōu)勢(shì),并使用基于改進(jìn)決策樹分區(qū)相關(guān)任務(wù)隊(duì)列的實(shí)時(shí)、高質(zhì)量的人力資源數(shù)據(jù)收集方法,從而提高后續(xù)數(shù)據(jù)預(yù)處理和算法產(chǎn)生的數(shù)據(jù)利用率。圖2 為采集人力資源數(shù)據(jù)的過程圖。

      圖2 人力資源的數(shù)據(jù)采集過程

      采用分散式云集組的數(shù)據(jù)收集方法,收集人才信息。該文充分利用云集群高可用性和高并發(fā)性的優(yōu)勢(shì),能夠收集基于任務(wù)排隊(duì)的實(shí)時(shí)、高質(zhì)量的人力資源數(shù)據(jù),從而有效提高了后續(xù)數(shù)據(jù)預(yù)處理和算法產(chǎn)生的數(shù)據(jù)利用率。改進(jìn)決策樹算法將同一個(gè)任務(wù)隊(duì)列中的每個(gè)子服務(wù)器劃分到同一個(gè)任務(wù)隊(duì)列中,從而提高數(shù)據(jù)的數(shù)據(jù)匯聚和增量采集效率的吞吐率。同時(shí),還可以通過執(zhí)行對(duì)下級(jí)服務(wù)器的配置來擴(kuò)充收集任務(wù),從而有效地提高了收集的可擴(kuò)充性。主服務(wù)器合理地利用了內(nèi)存模式中的高效率存儲(chǔ)特性,保證分布式人力資源數(shù)據(jù)采集的實(shí)時(shí)性,實(shí)現(xiàn)了以內(nèi)存模式為基礎(chǔ)的流式處理[8]。

      1.3 實(shí)現(xiàn)智能人力資源推薦

      當(dāng)初始的決策樹建立完畢后,要通過修剪技術(shù)對(duì)決策樹進(jìn)行剪枝,以去除由噪聲數(shù)據(jù)和孤立點(diǎn)面引起的分支異常。這要求設(shè)置1 個(gè)用于計(jì)算出錯(cuò)率的最大閾值,將該值設(shè)為10%。當(dāng)子樹的錯(cuò)誤率被剪除后,其差錯(cuò)率比出錯(cuò)率高時(shí),則必須保留節(jié)點(diǎn),反之,則可剪除節(jié)點(diǎn)。

      在改進(jìn)決策樹中,以單個(gè)指標(biāo)作為參考,在決策樹的每個(gè)節(jié)點(diǎn)上傳遞,考慮到企業(yè)對(duì)人才的真實(shí)需求與所收集的人才資料中所包括的信息內(nèi)容不可能完全一致。因此,該研究將對(duì)“1”與“0”的結(jié)果進(jìn)行統(tǒng)計(jì)來決定最后的推薦結(jié)果。設(shè)定企業(yè)的人才需要的信息為y={y1,y2,...,ym},在決策樹的根節(jié)點(diǎn)位置上,其輸出結(jié)果如公式(3)、公式(4)所示。

      式中:k為企業(yè)的根節(jié)點(diǎn)信息粒、人才需求信息的相交數(shù)據(jù)。當(dāng)k=ε時(shí),表示該需求信息與根節(jié)點(diǎn)的信息粒沒有發(fā)生相交,其輸出結(jié)果為“0”,當(dāng)k=ε時(shí),代表該需求信息與根節(jié)點(diǎn)的信息粒相交,其輸出結(jié)果為“1”。

      采用上述方式對(duì)改進(jìn)決策樹中的人才需要信息進(jìn)行擬合計(jì)算。在輸出結(jié)果中,“1”代表的數(shù)字越大,說明該人才與公司的實(shí)際需要符合得越好。

      2 試驗(yàn)測(cè)試與分析

      為證明該文提出的基于改進(jìn)決策樹算法的人力資源智能推薦方法的有效性,進(jìn)行試驗(yàn)測(cè)試,對(duì)比該文方法與傳統(tǒng)方法1、2 的管理效果。為驗(yàn)證該文方法的正確性,本章將該文方法運(yùn)用到測(cè)試中,并對(duì)其能否滿足規(guī)定的試驗(yàn)標(biāo)準(zhǔn),能否取得良好的推薦效果進(jìn)行檢驗(yàn)。在試驗(yàn)測(cè)試前,需要一些準(zhǔn)備工作,保證本次試驗(yàn)的準(zhǔn)確性。

      2.1 試驗(yàn)準(zhǔn)備

      本次試驗(yàn)選用Matlab 軟件作為仿真試驗(yàn)環(huán)境,基于改進(jìn)決策樹算法的人力資源智能推薦方法進(jìn)行有效性測(cè)試,試驗(yàn)環(huán)境的參數(shù)見表1。

      表1 試驗(yàn)環(huán)境

      目前測(cè)試環(huán)境市場(chǎng)中主流的算法是KNIME,RapidMiner,Weka,這些都是以Weka 為基礎(chǔ)的算法,并且Weka 可以很方便地對(duì)算法進(jìn)行改進(jìn)。因此,在該試驗(yàn)研究中選擇以Java為開發(fā)環(huán)境的Weka 作為工作平臺(tái)。在研究過程中,對(duì)試驗(yàn)環(huán)境進(jìn)行詳細(xì)的參數(shù)設(shè)定。表2 為Weka 測(cè)試的詳細(xì)參數(shù)。

      表2 測(cè)試參數(shù)

      2.2 試驗(yàn)結(jié)果與分析

      根據(jù)上述試驗(yàn)環(huán)境進(jìn)行準(zhǔn)備,將3 種人力資源推薦方法進(jìn)行對(duì)比,該試驗(yàn)挑選5000 條人力資源數(shù)據(jù)作為樣本數(shù)據(jù),采用3 種方法進(jìn)行人力資源推薦后,查看各方法的職位入職人數(shù),將結(jié)果進(jìn)行對(duì)比,其試驗(yàn)結(jié)果見表3。

      表3 試驗(yàn)結(jié)果

      由表3 的試驗(yàn)結(jié)果可知,使用該文設(shè)計(jì)的基于改進(jìn)決策樹算法的人力資源智能推薦方法經(jīng)過人力資源智能推薦后,成功入職的人數(shù)要遠(yuǎn)遠(yuǎn)大于其余兩種方法的人數(shù),在方法2 中,當(dāng)樣本數(shù)據(jù)不超過2000 條時(shí),其入職人數(shù)與該文方法的人數(shù)趨于一致。隨著樣本數(shù)據(jù)增加,該方法的推薦性能逐漸降低,與方法1 相比,該文方法減少了1098 個(gè)職位,與方法2 相比,該文方法減少了1008 個(gè)職位。由此可以證明基于改進(jìn)決策樹算法的人力資源智能推薦方法的有效性,有一定的參考價(jià)值。

      3 結(jié)語(yǔ)

      該文對(duì)決策樹方法及其在人力資本智能推薦方法中的運(yùn)用進(jìn)行深入研究,并將相應(yīng)數(shù)據(jù)預(yù)處理與分布式數(shù)據(jù)收集流程結(jié)合,建立人力資本信息倉(cāng),并使該資料倉(cāng)儲(chǔ)內(nèi)數(shù)據(jù)成為決策樹計(jì)算的輸入訓(xùn)練數(shù)據(jù)集,采用該算法獲得推薦結(jié)果列表,從而實(shí)現(xiàn)人力資源推薦。在實(shí)踐中,所提出的方法在推薦質(zhì)量和效果方面都有優(yōu)勢(shì),可以用于各類人力資源招聘平臺(tái),為不同的用戶提供所需的人力資源信息。

      猜你喜歡
      決策樹人力資源樣本
      用樣本估計(jì)總體復(fù)習(xí)點(diǎn)撥
      一種針對(duì)不均衡數(shù)據(jù)集的SVM決策樹算法
      決策樹和隨機(jī)森林方法在管理決策中的應(yīng)用
      電子制作(2018年16期)2018-09-26 03:27:06
      推動(dòng)醫(yī)改的“直銷樣本”
      隨機(jī)微分方程的樣本Lyapunov二次型估計(jì)
      寶雞:松綁人力資源
      試論人力資源會(huì)計(jì)
      基于決策樹的出租車乘客出行目的識(shí)別
      村企共贏的樣本
      基于肺癌CT的決策樹模型在肺癌診斷中的應(yīng)用
      勐海县| 浦江县| 曲靖市| 什邡市| 开封市| 周宁县| 黄大仙区| 承德县| 鞍山市| 湄潭县| 明光市| 剑川县| 奉贤区| 沐川县| 旌德县| 台中市| 龙岩市| 德钦县| 桦甸市| 东乡县| 大方县| 凤山市| 安徽省| 桂林市| 江永县| 兴国县| 丹棱县| 新津县| 乌苏市| 噶尔县| 鹤庆县| 凤山县| 龙陵县| 全州县| 平谷区| 古蔺县| 上犹县| 遵化市| 蒙城县| 乌海市| 通渭县|