• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于知識(shí)圖譜和語(yǔ)義相似度的崗位匹配與排序方法

    2021-10-25 08:49:22何春輝郭博譞
    關(guān)鍵詞:求職者命名專業(yè)知識(shí)

    何春輝,郭博譞

    (1.湘潭大學(xué) 數(shù)學(xué)與計(jì)算科學(xué)學(xué)院,湖南 湘潭 411105;2.北京工業(yè)大學(xué) 北京-都柏林國(guó)際學(xué)院,北京 100124)

    從人力資源的角度看,組織機(jī)構(gòu)之間的核心競(jìng)爭(zhēng)力主要體現(xiàn)在人才的競(jìng)爭(zhēng)上,誰擁有了核心人才和團(tuán)隊(duì),誰就占據(jù)了市場(chǎng)的主導(dǎo)地位.不同企業(yè)在核心人才的招聘中,存在著非常激烈的競(jìng)爭(zhēng)關(guān)系[1].隨著“互聯(lián)網(wǎng)+”政策的推進(jìn)和人類思維方式的轉(zhuǎn)變,傳統(tǒng)線下招聘與求職方式已無法滿足用人單位和求職者的招聘與求職需求.很多用人單位的招聘形式和求職者的求職方式都發(fā)生了變化,越來越多的用人單位會(huì)通過網(wǎng)絡(luò)招聘平臺(tái)發(fā)布崗位招聘信息,而求職者也更傾向于采用電子簡(jiǎn)歷在網(wǎng)絡(luò)平臺(tái)上進(jìn)行求職.

    網(wǎng)絡(luò)招聘能夠成為用人單位和求職者的首選招聘方式,是因?yàn)樗哂腥缦聨追矫鎯?yōu)點(diǎn)[2]:1)用人單位和求職者的信息更加透明且可信度更高;2)網(wǎng)絡(luò)招聘的成本更低;3)網(wǎng)絡(luò)招聘的渠道更寬廣;4)網(wǎng)絡(luò)招聘更有助于實(shí)現(xiàn)人-崗匹配;5)網(wǎng)絡(luò)招聘信息能夠?qū)崿F(xiàn)跨平臺(tái)共享.雖然網(wǎng)絡(luò)招聘具有諸多優(yōu)點(diǎn),但目前也存在2個(gè)問題急需解決[3]:1)用人單位所發(fā)布的1個(gè)招聘崗位,雖然可以收到成百上千份簡(jiǎn)歷,但其中真正對(duì)口的極少;2)求職者雖然可以同時(shí)申請(qǐng)很多不同的就業(yè)崗位,但是經(jīng)常會(huì)發(fā)現(xiàn)投遞大量簡(jiǎn)歷之后卻無法收到用人單位的面試通知.結(jié)合行業(yè)特點(diǎn)并經(jīng)過深入分析之后發(fā)現(xiàn),若想突破上述困境,解決好以下2個(gè)問題是關(guān)鍵:1)如何為用人單位發(fā)布的崗位精準(zhǔn)匹配潛在的求職者;2)如何根據(jù)求職者所具備的專業(yè)知識(shí)和就業(yè)意向自動(dòng)匹配對(duì)口的就業(yè)崗位.若能解決好這2個(gè)問題,就可以極大地推動(dòng)網(wǎng)絡(luò)招聘平臺(tái)的發(fā)展.

    基于此,本文提出了一種基于知識(shí)圖譜和語(yǔ)義相似度的崗位匹配與排序方法:首先,構(gòu)建一個(gè)高等教育的學(xué)科專業(yè)知識(shí)圖譜,并以它作為中間橋梁,將用人單位、求職者以及人才培養(yǎng)單位聯(lián)系起來;其次,用人單位可根據(jù)自己的業(yè)務(wù)崗位需求,實(shí)時(shí)發(fā)布自己的招聘崗位與對(duì)應(yīng)的專業(yè)技能要求信息,而求職者則可以結(jié)合自己的專業(yè)特性和招聘崗位的要求有針對(duì)性地進(jìn)行專業(yè)知識(shí)的學(xué)習(xí)和強(qiáng)化培訓(xùn),從而掌握相應(yīng)崗位所要求的技能;最后,人才培養(yǎng)單位可以根據(jù)人才市場(chǎng)的行情,快速捕獲用人單位提供的相關(guān)崗位任職要求并及時(shí)修訂相關(guān)專業(yè)的培養(yǎng)方案,根據(jù)不同的專業(yè)做到有針對(duì)性地培養(yǎng)高級(jí)人才,從而進(jìn)一步提高求職者與就業(yè)崗位之間的匹配度.系統(tǒng)相關(guān)實(shí)體之間的關(guān)系如圖1所示.

    圖1 相關(guān)實(shí)體關(guān)系

    從圖1中可以看出,用人單位和求職者屬于整個(gè)網(wǎng)絡(luò)招聘過程中的直接參與者,而人才培養(yǎng)單位屬于一個(gè)隱形的間接參與者,它主要起到調(diào)節(jié)整個(gè)市場(chǎng)供需平衡的作用.因此,本文的研究重點(diǎn)是解決用人單位發(fā)布的崗位與求職簡(jiǎn)歷之間的智能匹配與排序問題.

    1 專業(yè)知識(shí)圖譜構(gòu)建

    考慮到用人單位發(fā)布的崗位任職要求和求職者所具備的專業(yè)知識(shí)之間存在一種很強(qiáng)的隱含關(guān)系(用人單位希望招聘到可以勝任崗位要求的求職者),二者之間可以建立映射關(guān)系的是專業(yè)、學(xué)科名稱或者學(xué)位門類等實(shí)體,所以用人單位在發(fā)布招聘崗位時(shí),通常會(huì)給出崗位的任職要求,其中會(huì)包含相關(guān)崗位對(duì)應(yīng)的學(xué)科專業(yè)和技能要求等信息.

    為了構(gòu)建一個(gè)盡量完善的學(xué)科專業(yè)知識(shí)圖譜,本文以國(guó)家教育部公布的普通高等學(xué)校本科專業(yè)目錄[4]作為構(gòu)建專業(yè)知識(shí)圖譜的基礎(chǔ)數(shù)據(jù).該目錄中的數(shù)據(jù)經(jīng)過預(yù)處理后,最終構(gòu)建出了一個(gè)專業(yè)知識(shí)圖譜,并采用Neo4j[5]圖數(shù)據(jù)庫(kù)進(jìn)行存儲(chǔ)與查詢.整個(gè)圖譜共包含703個(gè)專業(yè)實(shí)體,93個(gè)專業(yè)類實(shí)體和12個(gè)學(xué)位門類實(shí)體.此外,還包含專業(yè)所屬專業(yè)類和專業(yè)可授予學(xué)位類型以及專業(yè)所屬門類3種實(shí)體關(guān)系共2 165條.所構(gòu)建專業(yè)知識(shí)圖譜的部分實(shí)體與所屬關(guān)系的查詢結(jié)果如圖2所示.

    圖2 專業(yè)知識(shí)圖譜的部分實(shí)體關(guān)系查詢結(jié)果

    2 命名實(shí)體識(shí)別

    命名實(shí)體識(shí)別[6]屬于自然語(yǔ)言處理中的熱點(diǎn)研究方向,其目標(biāo)是從給定的一段文本序列中自動(dòng)識(shí)別出命名實(shí)體并打上對(duì)應(yīng)實(shí)體類型標(biāo)簽.本文用命名實(shí)體識(shí)別算法從崗位任職要求對(duì)應(yīng)的文本片段中自動(dòng)識(shí)別并抽取出相應(yīng)的學(xué)歷、專業(yè)名稱、所屬專業(yè)類和學(xué)位門類等信息.特別地,對(duì)于那種沒有學(xué)歷和專業(yè)知識(shí)要求的崗位,此步驟識(shí)別的結(jié)果為空,也就意味著這類崗位對(duì)所有求職者都沒有學(xué)歷和專業(yè)知識(shí)的門檻要求.近些年,命名實(shí)體識(shí)別任務(wù)在很多領(lǐng)域都取得了很好的效果,最常見的有2大類方法.

    第一類是基于條件隨機(jī)場(chǎng)(CRF)的命名實(shí)體識(shí)別方法[7];第二類是基于預(yù)訓(xùn)練語(yǔ)言模型和深度學(xué)習(xí)的Bi-LSTM-CRF命名實(shí)體識(shí)別方法[8-10].上述2類方法有一個(gè)共同點(diǎn),即只適用于已知命名實(shí)體類別,且命名實(shí)體列表無法窮舉的情況.考慮到招聘崗位要求中所涉及的命名實(shí)體比較特殊,它屬于既知道命名實(shí)體類型又可以窮舉實(shí)體列表的情況.因此,上述2類方法對(duì)它并不太適用.為解決這個(gè)問題,本文采用基于規(guī)則庫(kù)的命名實(shí)體識(shí)別方法,用于完成崗位要求中的命名實(shí)體識(shí)別任務(wù).由于識(shí)別任務(wù)中需要識(shí)別學(xué)歷、專業(yè)名稱、專業(yè)類和學(xué)位門類4類命名實(shí)體,本文設(shè)計(jì)了4種可擴(kuò)展的規(guī)則庫(kù),分別為學(xué)歷庫(kù)(涵蓋所有學(xué)歷類型:專科、本科、研究生),專業(yè)名稱庫(kù)(涵蓋專業(yè)目錄[4]中提取的計(jì)算機(jī)科學(xué)與技術(shù)、數(shù)學(xué)與應(yīng)用數(shù)學(xué)等703個(gè)不同的專業(yè)名稱),專業(yè)類庫(kù)(涵蓋專業(yè)目錄[4]中提取的計(jì)算機(jī)類、數(shù)學(xué)類等93個(gè)不同的專業(yè)類名稱)和學(xué)位門類庫(kù)(涵蓋專業(yè)目錄[4]中提取的理學(xué)、工學(xué)等12個(gè)不同的學(xué)位門類名稱).首先,通過對(duì)上述4個(gè)規(guī)則庫(kù)進(jìn)行實(shí)體標(biāo)注和權(quán)重賦值,并以自定義方式集成到HanLP[11]自然語(yǔ)言處理工具包中,構(gòu)建出一個(gè)簡(jiǎn)單高效的命名實(shí)體識(shí)別模型;其次,用該方法對(duì)崗位要求的文本片段內(nèi)容進(jìn)行分詞和命名實(shí)體識(shí)別建模求解,抽取出對(duì)應(yīng)的實(shí)體.

    3 智能匹配與排序

    現(xiàn)有的主流網(wǎng)絡(luò)招聘平臺(tái),通常都是在同一個(gè)大平臺(tái)下,劃分成不同的2個(gè)子系統(tǒng),即用人單位登錄子系統(tǒng)和求職者登錄子系統(tǒng),且其功能各不相同.

    對(duì)于用人單位登錄子系統(tǒng)而言,主要功能是給用人單位編輯和發(fā)布招聘崗位信息.用人單位注冊(cè)賬號(hào)后,就可以在授權(quán)范圍內(nèi)發(fā)布一定量的有效招聘崗位.其發(fā)布的崗位信息需要通過平臺(tái)提供的模板、按照特定的格式要求(便于解析和存儲(chǔ))進(jìn)行組織;招聘平臺(tái)還允許用人單位查詢與導(dǎo)出部分與相關(guān)崗位要求契合度較高的求職者的簡(jiǎn)歷.求職者登錄子系統(tǒng)的主要功能是讓求職者填寫簡(jiǎn)歷和瀏覽崗位并投遞簡(jiǎn)歷.招聘平臺(tái)服務(wù)提供方會(huì)免費(fèi)為實(shí)名制認(rèn)證的求職者開放賬號(hào)并允許其準(zhǔn)備和發(fā)布一定量的求職簡(jiǎn)歷,這些求職簡(jiǎn)歷同樣需要通過平臺(tái)提供的模板、按照特定的格式進(jìn)行組織;招聘平臺(tái)也允許實(shí)名制認(rèn)證的求職者瀏覽自己感興趣的崗位并投遞簡(jiǎn)歷.

    在上述場(chǎng)景下,如何有效地將2個(gè)子系統(tǒng)從后臺(tái)關(guān)聯(lián)起來并自動(dòng)根據(jù)簡(jiǎn)歷信息對(duì)崗位進(jìn)行匹配與排序是打通2個(gè)系統(tǒng)壁壘的關(guān)鍵.為解決上述問題,本文提出了一個(gè)基于知識(shí)圖譜和語(yǔ)義相似度的崗位匹配和排序方法.

    3.1 智能匹配

    考慮到求職簡(jiǎn)歷通常只會(huì)包含求職者基本情況、學(xué)歷、所學(xué)專業(yè)、項(xiàng)目經(jīng)歷或者掌握的專業(yè)技能等信息.因此,提出了兩階段方法來解決崗位和求職簡(jiǎn)歷之間的智能匹配與排序問題.

    第一階段(初篩階段),利用第2節(jié)所述命名實(shí)體識(shí)別方法對(duì)平臺(tái)中有效招聘崗位的要求內(nèi)容進(jìn)行分析,得到所有崗位要求中對(duì)應(yīng)的學(xué)歷、專業(yè)、專業(yè)類、學(xué)位門類4種實(shí)體列表;將專業(yè)類列表和學(xué)位門類列表中的所有實(shí)體通過第1節(jié)所述的專業(yè)知識(shí)圖譜進(jìn)行查詢(查詢示例如圖2所示),得到它們對(duì)應(yīng)的專業(yè)名稱,將其與命名實(shí)體識(shí)別專業(yè)列表中的專業(yè)實(shí)體名稱進(jìn)行融合并去重,僅保留學(xué)歷和專業(yè)名稱2個(gè)列表;采用“與或”相結(jié)合的方式對(duì)學(xué)歷列表中實(shí)體和專業(yè)列表中實(shí)體構(gòu)造統(tǒng)一的檢索表達(dá)式,即[e.g:((學(xué)歷=??芆R學(xué)歷=本科OR學(xué)歷=研究生)AND(專業(yè)=軟件工程OR專業(yè)=信息安全OR專業(yè)=計(jì)算機(jī)科學(xué)與技術(shù)OR專業(yè)=網(wǎng)絡(luò)工程))],并在求職者簡(jiǎn)歷庫(kù)中進(jìn)行檢索,找出符合學(xué)歷和專業(yè)要求的簡(jiǎn)歷子集.

    第二階段(排序階段),所得簡(jiǎn)歷子集包含的簡(jiǎn)歷雖然都符合崗位所要求的學(xué)歷和專業(yè)知識(shí),但是崗位所要求的技能信息和工作經(jīng)驗(yàn)等情況并未考慮,因此,需要根據(jù)求職簡(jiǎn)歷中填寫的技能信息以及工作經(jīng)歷與崗位任職要求的匹配程度進(jìn)行排序,才能實(shí)現(xiàn)最終的崗位與簡(jiǎn)歷的匹配,詳細(xì)的排序算法見3.2小節(jié).

    3.2 排序算法

    排序算法的功能是對(duì)3.1節(jié)得到的簡(jiǎn)歷子集,采用基于BERT向量表示[12]的語(yǔ)義相似度排序算法對(duì)簡(jiǎn)歷進(jìn)行排序,為招聘崗位自動(dòng)匹配最相關(guān)且符合崗位要求的簡(jiǎn)歷.整個(gè)排序算法共分為4個(gè)核心步驟:

    1)輸入某份招聘崗位任職要求所對(duì)應(yīng)的文本片段和3.1節(jié)中篩選出的簡(jiǎn)歷子集中所對(duì)應(yīng)的技能和工作經(jīng)驗(yàn)文本片段.

    2)調(diào)用開源的BERT向量轉(zhuǎn)化模型[12],將上述文本轉(zhuǎn)化為向量(詳細(xì)步驟見文獻(xiàn)[13]).

    3)利用余弦相似度[14]算法計(jì)算這2個(gè)向量之間的相似度,以此作為崗位和簡(jiǎn)歷之間的匹配度得分,輸入到下一步.

    4)按照每個(gè)崗位與不同簡(jiǎn)歷的匹配得分進(jìn)行降序排序,排序列表即為崗位與簡(jiǎn)歷的最優(yōu)匹配結(jié)果.用人單位可以根據(jù)該列表找到最合適的潛在求職者.換言之,根據(jù)上述匹配結(jié)果,求職者也可以知道當(dāng)前招聘系統(tǒng)中最適合自己的崗位.

    值得注意的是,BERT預(yù)訓(xùn)練語(yǔ)言模型采用雙向transformer作為編碼器實(shí)現(xiàn)特征抽取,并結(jié)合多頭注意力機(jī)制捕獲更多的上下文信息,從而將詞語(yǔ)轉(zhuǎn)化為語(yǔ)義特征更豐富的向量形式.注意力機(jī)制輸入部分由Query(Q),Key(K)和Value(V)3個(gè)不同的向量構(gòu)成,先通過Q*K向量來表示輸入部分字向量之間的相似度,再通過Dk進(jìn)行合理的縮放,并由softmax函數(shù)做歸一化處理得到最終的概率分布,進(jìn)而得到句中所有詞向量的權(quán)重求和表示.注意力和多頭注意力公式為

    4 實(shí)驗(yàn)結(jié)果與分析

    為了驗(yàn)證BERT語(yǔ)義相似度算法的排序準(zhǔn)確性,在實(shí)驗(yàn)中,人工標(biāo)注了200組招聘崗位任職要求文本片段與求職簡(jiǎn)歷中所對(duì)應(yīng)的技能和工作經(jīng)驗(yàn)文本片段數(shù)據(jù)集,分別用ESim[15],Linkage[15]和BERT+余弦相似度算法來計(jì)算語(yǔ)義相似度匹配準(zhǔn)確性,并采用平均準(zhǔn)確率指標(biāo)(accuracy)來評(píng)估相關(guān)模型的性能,實(shí)驗(yàn)結(jié)果如表1所示.

    表1 不同算法的語(yǔ)義相似度匹配準(zhǔn)確率 %

    從表1可看出,BERT+余弦相似度匹配準(zhǔn)確性最高,平均準(zhǔn)確率為85.6%.

    以Java開發(fā)工程師和數(shù)據(jù)分析師簡(jiǎn)歷作為樣例進(jìn)行分析,圖3展示了本文所提方法分別為其自動(dòng)匹配的Top5崗位列表.

    圖3 Java工程師和數(shù)據(jù)分析師簡(jiǎn)歷智能匹配的Top5崗位列表

    5 結(jié)束語(yǔ)

    本文提出了一種先按字符檢索來篩選符合招聘崗位的簡(jiǎn)歷子集,后按語(yǔ)義相似度算法對(duì)所選簡(jiǎn)歷子集進(jìn)行排序的兩階段崗位智能匹配與排序方法.實(shí)驗(yàn)結(jié)果表明,引入知識(shí)圖譜和基于BERT+余弦的語(yǔ)義相似度計(jì)算方法后,其平均排序準(zhǔn)確率相對(duì)基線方法有顯著的提升,它可以根據(jù)簡(jiǎn)歷中的求職要求給出契合度最高的崗位.本研究目前僅采用BERT+余弦的語(yǔ)義相似度計(jì)算方法來實(shí)現(xiàn)排序,在后續(xù)研究中,可以考慮結(jié)合BERT和全連接網(wǎng)絡(luò)來提升語(yǔ)義相似度的計(jì)算性能,進(jìn)一步優(yōu)化排序結(jié)果.

    猜你喜歡
    求職者命名專業(yè)知識(shí)
    起初為娛樂,現(xiàn)在做招聘:直播幫中國(guó)求職者找工作
    命名——助力有機(jī)化學(xué)的學(xué)習(xí)
    有一種男人以“暖”命名
    東方女性(2018年3期)2018-04-16 15:30:02
    為一條河命名——在白河源
    加納移民局招聘:有妊娠紋不行
    民生表情
    傳播專業(yè)知識(shí),啟迪成長(zhǎng)智慧
    風(fēng)能(2017年2期)2017-05-15 01:52:42
    面試中的12個(gè)禁忌
    軟件技術(shù)專業(yè)知識(shí)地圖的應(yīng)用研究
    如何判斷你的老板是個(gè)“精神病”
    远安县| 桃园市| 浏阳市| 资溪县| 南通市| 苏尼特左旗| 清徐县| 紫金县| 白朗县| 南投市| 石狮市| 凌源市| 天门市| 龙里县| 泗水县| 永定县| 西乌珠穆沁旗| 井陉县| 南雄市| 韶关市| 宿松县| 北票市| 油尖旺区| 英德市| 高唐县| 长治县| 温宿县| 延津县| 黄浦区| 尚志市| 平利县| 江永县| 宁晋县| 五华县| 乌鲁木齐市| 静乐县| 横山县| 越西县| 龙游县| 荣成市| 安徽省|