• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于協(xié)同過濾算法的求職推薦系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)

      2023-09-24 05:33:18張勇豪鄭佳宜
      現(xiàn)代計(jì)算機(jī) 2023年13期
      關(guān)鍵詞:余弦視圖協(xié)同

      張勇豪,鄭佳宜,劉 莉

      (廣東白云學(xué)院大數(shù)據(jù)與計(jì)算機(jī)學(xué)院,廣州 510450)

      0 引言

      在數(shù)字化變革的時(shí)代,各平臺(tái)加速AI、大數(shù)據(jù)、云計(jì)算等技術(shù)布局,網(wǎng)絡(luò)招聘相比傳統(tǒng)的線下招聘更方便快捷,更受企業(yè)和求職者的青睞。根據(jù)艾瑞咨詢2022 年發(fā)布的中國(guó)網(wǎng)絡(luò)招聘市場(chǎng)發(fā)展研究報(bào)告可知,2022 年高校畢業(yè)生達(dá)1076 萬人,青年群體結(jié)構(gòu)性就業(yè)矛盾更加突出,供需脫節(jié)、人崗不適、“慢就業(yè)”現(xiàn)象時(shí)有發(fā)生[1],且企業(yè)數(shù)量的不斷新增給用戶造成了信息資源過載的問題,人們需要采用更主動(dòng)、更精準(zhǔn),同時(shí)也更加有效的方法從海量數(shù)據(jù)中找到自身所需要的有效數(shù)據(jù)[2],而推薦系統(tǒng)則是實(shí)現(xiàn)個(gè)性化職業(yè)推薦的一個(gè)重要途徑。在此背景下,本文提出一種基于協(xié)同過濾算法的求職推薦系統(tǒng),該系統(tǒng)通過分析用戶的操作行為,可以更好地理解用戶的求職傾向,進(jìn)而構(gòu)建其個(gè)人偏好模型,形成用戶標(biāo)簽體系,為求職者特別是高校畢業(yè)生提高人崗匹配的準(zhǔn)確性。

      1 算法模型簡(jiǎn)介

      1.1 協(xié)同過濾算法

      目前最受歡迎的推薦算法是協(xié)同過濾算法,核心是只需用戶的評(píng)分歷史,與被推薦的內(nèi)容無關(guān)[3]。目前,推薦算法分為兩類:基于項(xiàng)目評(píng)分的協(xié)同過濾算法和基于用戶評(píng)分的協(xié)同過濾算法[4]。協(xié)同過濾算法的思想就是根據(jù)用戶之間具有的相同興趣或相同的歷史行為,通過分析用戶群的興趣傾向或者歷史行為信息,利用鄰域方法給予信息相當(dāng)程度的回應(yīng)并記錄下,采用Jaccard 系數(shù)預(yù)測(cè)當(dāng)前用戶可能感興趣的東西或可能產(chǎn)生的行為,從而進(jìn)行智能推薦。

      1.2 余弦相似度

      余弦相似度是度量相關(guān)性方法之一,該方法通過對(duì)兩個(gè)矢量的夾角余弦進(jìn)行數(shù)值分析,進(jìn)而評(píng)估兩個(gè)矢量之間的相似度。如果弦值接近1,而夾角趨于0°,則表示兩個(gè)矢量的相似性愈大;余弦值愈接近0,夾角愈趨向90°,說明兩個(gè)矢量愈不相像。余弦相似度的計(jì)算式(1)如下:

      1.3 Jaccard系數(shù)

      Jaccard 系數(shù)是用來對(duì)有限樣本組的相似性和差異性進(jìn)行比較的,而Jaccard 系數(shù)所對(duì)應(yīng)的指數(shù)稱為Jaccard 距離,用以描述不同的集合間的相似性。在很多實(shí)際應(yīng)用中,由于評(píng)估的數(shù)據(jù)集稀疏度過高,因此在計(jì)算項(xiàng)目之間的余弦相似度會(huì)產(chǎn)生誤差。而將Jaccard 系數(shù)運(yùn)用于推薦系統(tǒng),并建立相關(guān)的評(píng)估與分析方法,可以彌補(bǔ)余弦相似度僅考慮用戶評(píng)分而忽視其他數(shù)據(jù)的不足之處,尤其適用于稀疏度較高的數(shù)據(jù)集。Jaccard 系數(shù)值越大,樣本相似度越高。Jaccard系數(shù)計(jì)算式(2)如下:

      2 系統(tǒng)實(shí)現(xiàn)

      2.1 功能模塊設(shè)計(jì)

      根據(jù)市場(chǎng)調(diào)研進(jìn)行用戶需求分析,將基于協(xié)同過濾算法求職推薦系統(tǒng)分為后臺(tái)管理和用戶端。

      (1)后臺(tái)管理:主要包括系統(tǒng)管理、系統(tǒng)監(jiān)控、首頁(yè)內(nèi)容發(fā)布管理、崗位推薦信息管理、用戶行為數(shù)據(jù)管理、用戶信息管理、簡(jiǎn)歷管理、崗位管理八個(gè)模塊。管理員能夠?qū)κ醉?yè)信息、崗位信息、用戶數(shù)據(jù)進(jìn)行管理,其功能模塊設(shè)計(jì)如圖1所示。

      圖1 基于協(xié)同過濾算法的求職推薦系統(tǒng)后臺(tái)管理

      (2)用戶端:主要包括用戶登錄、個(gè)性化崗位推薦、在線簡(jiǎn)歷生成、簡(jiǎn)歷投遞、崗位查找、職友圈、個(gè)人中心七個(gè)模塊。用戶可以通過登錄注冊(cè)編輯個(gè)人信息,生成在線簡(jiǎn)歷進(jìn)行簡(jiǎn)歷投遞,查找崗位信息和招聘詳情;通過協(xié)同過濾模型推薦的Top-N崗位列表生成個(gè)性化崗位推薦;通過職友圈瀏覽其他求職者發(fā)布的求職經(jīng)驗(yàn)和心得,其功能模塊設(shè)計(jì)如圖2所示。

      圖2 基于協(xié)同過濾算法的求職推薦系統(tǒng)用戶端

      2.2 協(xié)同過濾推薦模型流程

      由于企業(yè)崗位數(shù)量巨大,造成用戶的關(guān)系矩陣較于稀疏,因此在協(xié)同過濾算法的基礎(chǔ)上,采用Jaccard 系數(shù)解決數(shù)據(jù)的稀疏性。首先,利用目標(biāo)用戶對(duì)崗位的興趣偏好構(gòu)建數(shù)據(jù)模型,計(jì)算出具有相同興趣的用戶作為領(lǐng)域用戶,并向其推薦得分最高的Top-N項(xiàng)目。算法流程如圖3所示。

      圖3 協(xié)同過濾推薦模型流程

      2.3 基于協(xié)同過濾算法的系統(tǒng)推薦實(shí)現(xiàn)

      系統(tǒng)架構(gòu)的設(shè)計(jì)是系統(tǒng)實(shí)現(xiàn)過程中一個(gè)非常重要的環(huán)節(jié)。本系統(tǒng)架構(gòu)采用常見的MVC 三層架構(gòu)模型,分別為視圖層、業(yè)務(wù)層、數(shù)據(jù)訪問(持久)層,三層架構(gòu)實(shí)現(xiàn)了更好地降低各層之間的耦合,上層對(duì)下層的調(diào)用,是采用接口的形式,從而實(shí)現(xiàn)了軟件開發(fā)中低耦合的基本要求,其系統(tǒng)架構(gòu)如圖4所示。

      圖4 系統(tǒng)架構(gòu)

      視圖層為用戶提供數(shù)據(jù)顯示和輸入功能,用戶可以通過鼠標(biāo)、鍵盤和系統(tǒng)進(jìn)行交互,系統(tǒng)整體上采用B/S結(jié)構(gòu)。

      業(yè)務(wù)層作為系統(tǒng)的核心部分,起到了承上啟下的作用,業(yè)務(wù)層通過從視圖層接受到的HTTP 請(qǐng)求,根據(jù)不同的請(qǐng)求地址調(diào)用不同的Handle 來實(shí)現(xiàn)不同的業(yè)務(wù)功能,并通過持久層對(duì)數(shù)據(jù)庫(kù)進(jìn)行操作,數(shù)據(jù)庫(kù)返回的數(shù)據(jù)經(jīng)業(yè)務(wù)層處理后返回到視圖層,視圖層渲染后展示出來。本系統(tǒng)業(yè)務(wù)層采用Java常用Web框架Spring Boot 和Mybatis框架進(jìn)行實(shí)現(xiàn)。

      持久層可將系統(tǒng)實(shí)體類與數(shù)據(jù)庫(kù)表進(jìn)行一一映射,從而可以幫我們快速實(shí)現(xiàn)對(duì)數(shù)據(jù)庫(kù)的增刪改查操作。

      3 系統(tǒng)測(cè)試

      3.1 系統(tǒng)測(cè)試數(shù)據(jù)

      本文系統(tǒng)測(cè)試是在一臺(tái)Window10 64位操作系統(tǒng)、內(nèi)存8 GB、CPU 為i5 6500 3.2 GHz 的電腦上進(jìn)行。本文數(shù)據(jù)集來自某數(shù)據(jù)挖掘比賽的數(shù)據(jù)集,該數(shù)據(jù)集包含1907 個(gè)用戶、1762 個(gè)項(xiàng)目數(shù)、307624條評(píng)分?jǐn)?shù),見表1。實(shí)驗(yàn)中將數(shù)據(jù)集分成了訓(xùn)練集和測(cè)試集,并且在4∶1 的比率下進(jìn)行了實(shí)驗(yàn)。

      表1 系統(tǒng)測(cè)試的數(shù)據(jù)集信息

      3.2 系統(tǒng)測(cè)試指標(biāo)

      推薦系統(tǒng)的評(píng)測(cè)指標(biāo)很多,常用的有平均誤差(MAE)、準(zhǔn)確率(Precision)和召回率(Recall)[5],本文實(shí)驗(yàn)使用MAE 作為測(cè)試指標(biāo)。MAE 用于度量?jī)蓚€(gè)連續(xù)變量之間的差異,即用戶對(duì)項(xiàng)目的實(shí)際評(píng)分和預(yù)測(cè)評(píng)分之間的平均絕對(duì)誤差[6]。計(jì)算式(3)如下:

      其中:yi為該用戶對(duì)推薦崗位的實(shí)際評(píng)分;為該用戶對(duì)推薦崗位的預(yù)測(cè)評(píng)分。MAE值越小,表示推薦質(zhì)量越好。

      3.3 系統(tǒng)測(cè)試結(jié)果及分析

      為驗(yàn)證本系統(tǒng)的推薦效果,實(shí)驗(yàn)計(jì)算近鄰數(shù)量同推薦數(shù)量的推薦MAE值。從數(shù)據(jù)集中隨機(jī)選取500個(gè)用戶的評(píng)分?jǐn)?shù)代入系統(tǒng)模型中進(jìn)行多次推薦,參考文獻(xiàn)[7],選取近鄰數(shù)k的范圍為[10, 70],推薦數(shù)N= 5、10 進(jìn)行試驗(yàn),結(jié)果如圖5所示。

      圖5 近鄰數(shù)量同推薦數(shù)量的推薦MAE值

      由圖5 可知,k值較小反而MAE的值較大,系統(tǒng)模型的準(zhǔn)確率降低也就是系統(tǒng)推薦效率較低。在k值為[10,40]時(shí),MAE的值隨k的增加而顯著減小,說明系統(tǒng)推薦效率明顯增強(qiáng)。在k值為[40,70]時(shí),推薦數(shù)N= 10的推薦效果比推薦數(shù)N= 5的推薦效果好。實(shí)驗(yàn)證明,為達(dá)到系統(tǒng)推薦效率最優(yōu),應(yīng)使k>40,N= 10。

      4 結(jié)語

      基于協(xié)同過濾算法的求職推薦系統(tǒng)能夠根據(jù)職業(yè)偏好、興趣偏好、歷史行為數(shù)據(jù)等特征,為其提供準(zhǔn)確的職位推薦,解決大量的崗位信息給求職者造成信息資源過載的問題。同時(shí)縮短了企業(yè)招聘周期,降低時(shí)間成本。但目前求職推薦系統(tǒng)數(shù)據(jù)集樣本有限且面向的主要用戶是求職者,后續(xù)將繼續(xù)增加數(shù)據(jù)量和完善企業(yè)招聘方的功能模塊,使求職推薦系統(tǒng)更好為用戶服務(wù)。

      猜你喜歡
      余弦視圖協(xié)同
      蜀道難:車與路的協(xié)同進(jìn)化
      “四化”協(xié)同才有出路
      汽車觀察(2019年2期)2019-03-15 06:00:50
      5.3 視圖與投影
      視圖
      Y—20重型運(yùn)輸機(jī)多視圖
      SA2型76毫米車載高炮多視圖
      兩個(gè)含余弦函數(shù)的三角母不等式及其推論
      三醫(yī)聯(lián)動(dòng) 協(xié)同創(chuàng)新
      分?jǐn)?shù)階余弦變換的卷積定理
      圖像壓縮感知在分?jǐn)?shù)階Fourier域、分?jǐn)?shù)階余弦域的性能比較
      出国| 黑山县| 金湖县| 苗栗县| 胶南市| 宿迁市| 于田县| 花莲市| 肇庆市| 赤城县| 珠海市| 名山县| 沈丘县| 兰考县| 九龙县| 甘德县| 博乐市| 当雄县| 定襄县| 临海市| 安阳县| 时尚| 五指山市| 高青县| 宁城县| 乌什县| 咸丰县| 大名县| 云南省| 江安县| 颍上县| 集安市| 斗六市| 新巴尔虎右旗| 韶关市| 乐清市| 珠海市| 乌拉特后旗| 莱西市| 壤塘县| 谷城县|