朱海萍 趙成成 劉啟東 鄭慶華 曾疆維 田 鋒 陳 妍
(西安交通大學(xué)電子與信息學(xué)部 西安 710049) (智能網(wǎng)絡(luò)與網(wǎng)絡(luò)安全教育部重點(diǎn)實(shí)驗(yàn)室(西安交通大學(xué)) 西安 710049)
近年來,隨著推薦系統(tǒng)的廣泛應(yīng)用,就業(yè)推薦在輔助大學(xué)生就業(yè)方面逐漸起到重要作用[1].但是,相比于一般的推薦場景,就業(yè)推薦除了需要考慮學(xué)生對于就業(yè)單位的興趣,還需要考慮就業(yè)單位對于學(xué)生的能力要求[2].課題組發(fā)現(xiàn),若忽略了就業(yè)單位對學(xué)生能力的要求,很可能導(dǎo)致學(xué)生與推薦的單位之間出現(xiàn)“能力失配”問題.同時(shí),在就業(yè)推薦過程中,推薦結(jié)果的解釋信息對于指導(dǎo)老師和學(xué)生都具有重要的參考價(jià)值.然而,當(dāng)前大多數(shù)基于隱因子模型(latent factor model, LFM)來實(shí)現(xiàn)協(xié)同過濾[3](collaborative filtering, CF)的方法通常缺乏解釋性.負(fù)樣本不置信問題(即訓(xùn)練數(shù)據(jù)中的負(fù)樣本通常從大量未交互樣本中隨機(jī)采樣得到[4])是推薦系統(tǒng)研究中一個(gè)普遍存在的問題[5],而在就業(yè)推薦數(shù)據(jù)中一個(gè)用戶只有其就業(yè)單位一條交互記錄,使得該問題更加嚴(yán)重.為了解決上述問題,本文開展基于互惠性約束的可解釋就業(yè)推薦研究.
首先,借鑒文獻(xiàn)[6]中擁有相似特征的人傾向于做出相似行為的結(jié)論,本文設(shè)計(jì)了一種基于相似度的隨機(jī)負(fù)采樣模塊,即根據(jù)學(xué)生間和就業(yè)單位間的相似度從一個(gè)學(xué)生的負(fù)樣本全集中劃分出與其較為不相似的負(fù)樣本集;再從該縮小范圍的負(fù)樣本集中,隨機(jī)采樣得到高置信度的負(fù)樣本,結(jié)合已有正樣本形成高質(zhì)量訓(xùn)練樣本集,從而提供數(shù)據(jù)級有效支撐.
其次,為了滿足可解釋性需求,分別設(shè)計(jì)2個(gè)可解釋模塊:1)借鑒意圖決定行為這一心理學(xué)研究成果[4],設(shè)計(jì)基于就業(yè)意圖的可解釋模塊,用以提升推薦系統(tǒng)的解釋性;2)考慮到不同單位對學(xué)生能力要求的側(cè)重點(diǎn)不同且不同學(xué)生對單位期望的側(cè)重點(diǎn)也不同,設(shè)計(jì)基于就業(yè)特征的可解釋模塊,輸出單位特征和學(xué)生特征的重要性分?jǐn)?shù),以此支撐推薦結(jié)果的可解釋.
然后,基于上述可解釋性輸出,設(shè)計(jì)基于互惠性約束的就業(yè)推薦模塊,以緩解推薦結(jié)果可能出現(xiàn)的“能力失配”問題.關(guān)鍵在于,因?yàn)閷Σ煌膶W(xué)生和就業(yè)單位來說,就業(yè)興趣和單位能力要求的重要程度是不同的,使用模糊門機(jī)制自適應(yīng)地聚合兩者的表征向量.
本文所提基于互惠性約束的可解釋就業(yè)推薦方法的主要貢獻(xiàn)有4個(gè)方面:
1)所提隨機(jī)負(fù)采樣模塊,綜合考慮學(xué)生間和單位間相似度,破解了負(fù)樣本不置信問題.
2)所提2個(gè)可解釋模塊,綜合運(yùn)用多任務(wù)學(xué)習(xí)、注意力機(jī)制、門控網(wǎng)絡(luò),兼顧就業(yè)特征和就業(yè)意圖演化過程,滿足了推薦結(jié)果的可解釋需求.
3)提出了基于互惠性約束的就業(yè)推薦模塊,其特色在于,采用模糊門機(jī)制自適應(yīng)地聚合學(xué)生就業(yè)興趣和單位能力要求的表征向量,緩解了“能力失配”問題.
4)在某高校5屆畢業(yè)生就業(yè)真實(shí)數(shù)據(jù)集(employ-ment data for undergraduate, EMDAU)上的實(shí)驗(yàn)結(jié)果表明:相比于多個(gè)經(jīng)典和同時(shí)代的推薦方法,本文所提出的基于互惠性約束的可解釋就業(yè)推薦方法在AUC指標(biāo)上超出6%;且通過用戶調(diào)研,驗(yàn)證了所提方法可解釋性的有效性;設(shè)計(jì)并執(zhí)行針對以上3個(gè)模塊的消融實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果證明了其有效性.
本節(jié)主要概述與本研究相關(guān)的就業(yè)推薦、互惠推薦以及可解釋性推薦的研究現(xiàn)狀.
現(xiàn)有的就業(yè)推薦算法通常根據(jù)歷史用戶的就業(yè)記錄,使用隱因子模型構(gòu)建基于協(xié)同過濾的方法,為用戶推薦有潛在興趣的就業(yè)單位[3].但是,CF算法本身是基于用戶的歷史記錄來進(jìn)行推薦的[7-8],而在一般的就業(yè)數(shù)據(jù)中每個(gè)用戶只有其最終選擇的就業(yè)單位這一條交互記錄,因此不能直接使用CF算法.針對該問題,一些就業(yè)推薦研究重點(diǎn)關(guān)注用戶相似度計(jì)算的方法.文獻(xiàn)[9]提出使用基于語義的方法,從用戶遞交的簡歷中提取出其求職能力等結(jié)構(gòu)化信息,利用這些結(jié)構(gòu)化信息可以計(jì)算出用戶之間的相似度;文獻(xiàn)[10]則引入了學(xué)生畫像,首先根據(jù)畢業(yè)生在校數(shù)據(jù)生成學(xué)生畫像,然后利用畢業(yè)生學(xué)生畫像計(jì)算畢業(yè)生相似度,從而進(jìn)行就業(yè)單位推薦;文獻(xiàn)[11-12]利用學(xué)生在校數(shù)據(jù)將學(xué)生劃分為不同的群體,將個(gè)人所在群體的歷史就業(yè)記錄作為個(gè)人歷史就業(yè)記錄使用CF算法,解決了畢業(yè)生因缺少歷史就業(yè)記錄而難以使用CF算法的問題.
現(xiàn)有的就業(yè)推薦算法研究大多集中于研究學(xué)生就業(yè)興趣建模,而本文同時(shí)對就業(yè)單位能力要求進(jìn)行了建模.由于通過計(jì)算學(xué)生相似度來更好地使用CF算法進(jìn)行就業(yè)推薦不是本文的研究重點(diǎn),因此本文僅使用學(xué)生的各類屬性特征作為其協(xié)同過濾特征.
互惠推薦系統(tǒng)(reciprocal recommender systems, RRS)[13]是一類需要最大化成功匹配概率而非只滿足推薦對象偏好的推薦算法.Xia等人同樣針對在線約會(huì)場景,提出了基于協(xié)同過濾的互惠推薦模型[14].該模型通過被推薦用戶與和目標(biāo)用戶交互用戶的相似度來計(jì)算2個(gè)單向偏好分?jǐn)?shù),然后將這2個(gè)偏好得分的諧波平均值作為2個(gè)用戶之間匹配可能性的互惠得分.RCF已經(jīng)成功應(yīng)用于在線約會(huì)場景,并且成為RRS的標(biāo)準(zhǔn)對照算法[15-16].除了在線約會(huì)場景,互惠推薦還有一些其他的應(yīng)用場景,比如社交網(wǎng)絡(luò)[17]和技能分享平臺(tái)[18]等.
當(dāng)前,互惠推薦主要應(yīng)用于社交推薦場景當(dāng)中.而本文將互惠推薦的思想引入到就業(yè)推薦場景中,為就業(yè)推薦模型設(shè)計(jì)了互惠性約束,滿足了在就業(yè)推薦中同時(shí)考慮學(xué)生就業(yè)興趣與單位能力要求的需求.
可解釋推薦(interpretable recommendation)因其有助于提高推薦系統(tǒng)的透明度、說服力、可信度等,得到了研究者們更多的關(guān)注[19-20].現(xiàn)有可解釋推薦按照可解釋模塊與推薦模型是否相關(guān),可被分為兩大類:模型可知的可解釋推薦與模型未知的可解釋推薦.模型可知的可解釋推薦,可解釋模塊嵌入在推薦模型當(dāng)中,推薦結(jié)果與對推薦結(jié)果的解釋是同時(shí)由模型輸出的,如EFM模型[21].模型不可知的可解釋推薦,又稱為后處理方法,該類方法單獨(dú)設(shè)計(jì)一個(gè)解釋模型,輸出推薦結(jié)果之后再由解釋模型輸出對該推薦結(jié)果的解釋,如DualPC模型[22].按照解釋結(jié)果的信息源分類,可解釋推薦方法可被分為三大類:基于相關(guān)用戶或物品的、基于特征的和基于文本的.基于相關(guān)用戶和物品的方法是將與目標(biāo)用戶相似的其他用戶或者目標(biāo)用戶之前交互過的一些物品作為當(dāng)前推薦物品的解釋,如Xian等人提出的EX3模型[23].基于特征的方法通常以物品特征的重要程度作為解釋信息,如Hou等人[24]使用物品特征重要性的雷達(dá)圖來解釋為什么推薦某一物品.基于文本的方法通常生成對推薦物品的評價(jià)作為解釋信息,如Wang等人[25]設(shè)計(jì)用戶偏好建模與評論內(nèi)容建模的多任務(wù)模型,輸出預(yù)測的用戶評論用以解釋推薦結(jié)果.
雖然解釋信息對于就業(yè)推薦有著重要的作用,但是現(xiàn)有就業(yè)推薦研究很少涉及可解釋性.本文為了滿足就業(yè)推薦可解釋這一亟待解決的實(shí)際需求,提出了基于就業(yè)意圖和就業(yè)特征的可解釋推薦模塊.
基于互惠性約束的可解釋就業(yè)推薦方法整體結(jié)構(gòu)如圖1所示,圖中實(shí)框是基于相似度的隨機(jī)負(fù)采樣模塊,用于提供高置信度的負(fù)樣本,再結(jié)合已有正樣本形成高質(zhì)量訓(xùn)練樣本集D;通過嵌入層從樣本集D中抽取高階的特征向量表示;點(diǎn)框內(nèi)包含基于就業(yè)意圖和基于就業(yè)特征的2個(gè)解釋模塊,提供推薦結(jié)果的解釋;虛線框內(nèi)是基于互惠性約束的就業(yè)推薦模塊,輸出針對某一學(xué)生的被推薦單位評分.本節(jié)將詳述這3個(gè)模塊.
Fig.1 A framework of reciprocal-constrained interpretable job recommendation method
針對就業(yè)推薦數(shù)據(jù)中的負(fù)樣本不置信問題,本文受同一學(xué)生群體在就業(yè)選擇上相似這一想法啟發(fā),設(shè)計(jì)并實(shí)現(xiàn)了基于相似度的隨機(jī)負(fù)采樣模塊,包括學(xué)生間相似度計(jì)算與就業(yè)單位間相似度計(jì)算、基于相似度的隨機(jī)采樣2個(gè)步驟.
1)在借鑒文獻(xiàn)[26]相似度計(jì)算方法的基礎(chǔ)上,本文設(shè)計(jì)學(xué)生間相似度和單位間相似度的計(jì)算:
(1)
(2)
其中,sim(stui,stuj)表示學(xué)生stui和stuj之間的相似度,Nd和Nc分別表示學(xué)生的離散特征和連續(xù)特征的個(gè)數(shù),fk表示第k個(gè)特征的值.sim(uniti,unitj)表示就業(yè)單位uniti和unitj之間的相似度,Md表示就業(yè)單位的離散特征的個(gè)數(shù).
2)為了得到高置信度的負(fù)樣本,同時(shí)避免嚴(yán)重改變訓(xùn)練集的樣本分布,本文提出在考慮相似度的同時(shí)還保留隨機(jī)采樣的方法.首先計(jì)算學(xué)生u與其他學(xué)生的相似度以及學(xué)生u的就業(yè)單位與其他就業(yè)單位的相似度,選取最不相似的TopN個(gè)學(xué)生的就業(yè)單位和最不相似的TopN個(gè)單位作為高置信度負(fù)樣本集.然后從該負(fù)樣本集中隨機(jī)采樣,產(chǎn)生用于訓(xùn)練的負(fù)樣本.
基于相似度的隨機(jī)負(fù)采樣計(jì)算偽代碼如算法1所示:
算法1.基于相似度的隨機(jī)負(fù)采樣算法.
輸入:學(xué)生集合studentSet、就業(yè)單位集合unitSet;
輸出:負(fù)樣本集合negativeSet.
①negtiveSet=[];
② forstuiinstudentSet
③sims=[],simu=[];
④uniti=get_unit(stui);/*獲取學(xué)生交互的單位*/
⑤ forstujinstudentSet
⑥simij=sim(stui,stuj);/*調(diào)用式(1)計(jì)算學(xué)生間相似度*/
⑦sims.add(simij);
⑧ end for
⑨unsims=TopN(sims);/*按相似度從小到大排序,獲取最不相似的N個(gè)學(xué)生*/
⑩ forunitjinunitSet
該模塊包含基于就業(yè)意圖的解釋模塊和基于就業(yè)特征的解釋模塊,分別從不同角度為推薦結(jié)果提供解釋.
2.2.1 基于就業(yè)意圖的解釋模塊
借鑒就業(yè)意圖決定就業(yè)行為這一心理學(xué)研究成果[27],及文獻(xiàn)[28]的通過學(xué)習(xí)不同任務(wù)間的關(guān)聯(lián)關(guān)系有利于提升多個(gè)任務(wù)的建模效果這一結(jié)論,利用多任務(wù)學(xué)習(xí)的思路同時(shí)設(shè)計(jì)就業(yè)意圖的可解釋模塊和就業(yè)單位推薦模塊(見2.3節(jié)),其特點(diǎn)在于:2個(gè)任務(wù)共享特征嵌入層參數(shù),即得到學(xué)生和單位特征嵌入后,分別對2個(gè)任務(wù)建模,如圖1所示的點(diǎn)框內(nèi).
針對就業(yè)意圖演化問題,借鑒自我感知理論研究成果[29-30](一個(gè)人的目標(biāo)和內(nèi)在動(dòng)機(jī)可以通過人的行為來推斷,而人們的行為反映出的日常生活規(guī)律被證明與工作或?qū)W業(yè)成績有強(qiáng)烈的相關(guān)性),利用學(xué)生的學(xué)業(yè)成績來輔助就業(yè)意圖建模,提出門控循環(huán)單元(gated recurrent unit, GRU)網(wǎng)絡(luò)[31]的就業(yè)意圖演化過程學(xué)習(xí)方法,計(jì)算為
Gt=GRU(Gt-1,xt),t=1,2,…,6,
(3)
其中,Gt為第t個(gè)學(xué)期學(xué)生成績的隱藏狀態(tài),xt∈d為第t個(gè)學(xué)期學(xué)生成績的嵌入向量.將最后一個(gè)學(xué)期學(xué)生成績的隱藏狀態(tài)G6作為學(xué)生就業(yè)意圖的演化結(jié)果,與學(xué)生和單位特征嵌入向量拼接,得到用于表征學(xué)生就業(yè)意圖的嵌入向量,計(jì)算公式為
E=concat([P1,P2,…,PM,G6]).
(4)
Pm∈M×d為學(xué)生側(cè)特征嵌入向量.最后,使用多層感知機(jī)(multilayer perceptron, MLP)[32]對就業(yè)意圖進(jìn)行建模,計(jì)算為
Op=Softmax(MLP(E)).
(5)
2.2.2 基于就業(yè)特征的解釋模塊
該模塊包含2個(gè)注意力機(jī)制:抽取學(xué)生就業(yè)偏好的注意力機(jī)制和抽取單位能力要求的注意力機(jī)制.
1)抽取學(xué)生就業(yè)偏好的注意力機(jī)制有3個(gè)步驟:
① 在給定一對學(xué)生和就業(yè)單位信息的條件下,通過嵌入層得到學(xué)生側(cè)特征的嵌入向量Pm∈M×d和就業(yè)單位側(cè)特征的嵌入向量Qn∈N×d,其中M和N分別為學(xué)生側(cè)和就業(yè)單位側(cè)特征數(shù)量,m為學(xué)生特征的第m個(gè),n為就業(yè)單位特征的第n個(gè),d為嵌入向量維度.通過加和池化操作,將學(xué)生側(cè)特征嵌入向量Pm聚合,得到學(xué)生表征向量Ps為
(6)
② 將學(xué)生表征向量Ps作為計(jì)算注意力權(quán)重的查詢向量[33],用來計(jì)算學(xué)生對就業(yè)單位不同特征的偏好程度,結(jié)構(gòu)如圖2(a)所示,計(jì)算方法為
(7)
計(jì)算得到的注意力權(quán)重wn即表示了學(xué)生對就業(yè)單位第n個(gè)特征的偏好程度.
Fig.2 The structure of attention mechanism for extracting interests and requirements
③ 利用注意力權(quán)重對單位特征嵌入向量進(jìn)行加權(quán)求和,得到學(xué)生就業(yè)偏好嵌入向量P具體計(jì)算方法為
(8)
2)抽取單位能力要求的注意力機(jī)制有3個(gè)步驟:
① 獲得學(xué)生側(cè)特征的嵌入向量Pm∈M×d和就業(yè)單位側(cè)特征的嵌入向量Qn∈N×d.通過加和池化操作,將就業(yè)單位側(cè)特征嵌入向量Qn聚合,得到就業(yè)單位表征向量Qu為
(9)
② 將就業(yè)單位表征向量Qu作為計(jì)算注意力權(quán)重的查詢向量,用來計(jì)算就業(yè)單位對學(xué)生不同特征的偏好程度,結(jié)構(gòu)如圖2(b)所示,計(jì)算方法為
(10)
其中,計(jì)算得到的注意力權(quán)重wm即表示了就業(yè)單位對學(xué)生第m個(gè)特征的偏好程度.
③ 利用注意力權(quán)重對學(xué)生特征嵌入向量進(jìn)行加權(quán)求和,得到單位能力要求嵌入向量Q具體計(jì)算方法為
(11)
該機(jī)制不僅使用可排序的就業(yè)單位特征重要性向?qū)W生解釋了其就業(yè)偏好,還使用可排序的學(xué)生特征重要性解釋了就業(yè)單位的能力要求.具體地,依據(jù)式(7)與式(10)將互惠性約束中對學(xué)生就業(yè)偏好和單位能力要求注意力機(jī)制輸出的注意力分?jǐn)?shù)(可排序的重要性評分)作為特征層級的解釋.由式(7)計(jì)算出的已經(jīng)歸一化的注意力權(quán)重wn∈(0,1)表示學(xué)生對該就業(yè)單位第n個(gè)特征的注意力分?jǐn)?shù),即為學(xué)生的就業(yè)偏好解釋.由式(10)計(jì)算出的已經(jīng)歸一化的注意力權(quán)重wm∈(0,1)表示該就業(yè)單位對學(xué)生第m個(gè)特征的注意力分?jǐn)?shù),即為單位的能力要求解釋.
互惠性約束的就業(yè)單位推薦需要同時(shí)滿足學(xué)生就業(yè)偏好和單位能力要求.本模塊采用模糊門機(jī)制[34]自適應(yīng)聚合對學(xué)生就業(yè)偏好和單位能力要求的表征向量,輸入到一個(gè)多層感知機(jī),最終輸出推薦結(jié)果,如圖1虛線框所示.該模塊的核心是基于模糊門機(jī)制聚合就業(yè)偏好與能力要求特征,即使用神經(jīng)網(wǎng)絡(luò)自適應(yīng)動(dòng)態(tài)地計(jì)算聚合權(quán)重,其計(jì)算方法為
R=wP+(1-w)Q,
(12)
其中,自適應(yīng)權(quán)重w由一個(gè)二元神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn),計(jì)算為
w=σ(WpP+WqQ).
(13)
其中,Wp和Wq分別為神經(jīng)網(wǎng)絡(luò)的參數(shù)矩陣.
本文實(shí)驗(yàn)所用數(shù)據(jù)集EMDAU的統(tǒng)計(jì)信息如表1所示,其中用戶數(shù)為5屆畢業(yè)生的總和,就業(yè)單位是5屆學(xué)生就業(yè)單位的總和,交互記錄為學(xué)生與就業(yè)單位的信息對(表達(dá)學(xué)生到就業(yè)單位的就業(yè)關(guān)系).該數(shù)據(jù)集中,學(xué)生特征含10個(gè)離散特征和6個(gè)連續(xù)特征,如表2所示;就業(yè)單位特征含6個(gè)離散特征,如表2所示.數(shù)據(jù)集中的就業(yè)意圖由專家總結(jié)為出國留學(xué)、國內(nèi)升學(xué)、簽約就業(yè)3種,分布如圖3所示.
Table 1 Statistical Information of EMDAU
Table 2 Feature Information of EMDAU
Fig.3 The distribution of employment intention in dataset
本文根據(jù)學(xué)生的畢業(yè)年份,將數(shù)量較小的兩屆畢業(yè)生數(shù)據(jù)分別作為驗(yàn)證集758條和測試集2 018條,將其余3屆的畢業(yè)生數(shù)據(jù)作為訓(xùn)練集5 594條.
在推薦研究領(lǐng)域,曲線下面積(area under curve,AUC)是一個(gè)被廣泛應(yīng)用的評價(jià)指標(biāo)[35].AUC是衡量二分類模型性能的指標(biāo),其測量的是測試集中正樣本排序在負(fù)樣本前面的概率,反映了模型的排序能力.本文采用AUC這一評價(jià)指標(biāo)來衡量就業(yè)推薦性能,其計(jì)算方法為
(14)
其中,ypos和yneg分別為模型對正樣本和負(fù)樣本的預(yù)測值,Npos和Nneg分別表示測試集中正樣本和負(fù)樣本的數(shù)量.
此外,本文參考文獻(xiàn)[36],引入相對增益(relative improvement,RelaImpr)來衡量本文所提出方法與其他方法的增益.對于一個(gè)隨機(jī)高斯分類器,AUC=0.5,因此RelaImpr的定義為
(15)
由于就業(yè)意圖預(yù)測是一個(gè)多分類的任務(wù),因此本文選用宏觀F1(Macro-F1)和微觀F1(Micro-F1)來衡量模型性能,計(jì)算方法為
(16)
(17)
式(16)中,N為類別數(shù),F(xiàn)1-scorei為第i個(gè)類別的F1分?jǐn)?shù).式(17)中,Recall和Precision為所有類別總的召回率和精確率.
本文參考文獻(xiàn)[37],使用多任務(wù)收益(MTL-Gain)指標(biāo)衡量多任務(wù)學(xué)習(xí)相較于單任務(wù)學(xué)習(xí)的收益,其計(jì)算為
MTL-Gain=MMTL-Msingle,
(18)
其中,MMTL和Msingle分別為使用多任務(wù)學(xué)習(xí)和使用單任務(wù)學(xué)習(xí)的模型指標(biāo).
本文將所提出方法與7個(gè)方法進(jìn)行對比:
1)LR.Logistic回歸方法在深度神經(jīng)網(wǎng)絡(luò)應(yīng)用于推薦領(lǐng)域之前,被廣泛使用.本文將其作為最基本的對照算法.
2)FM[38].因子分解機(jī)(factorization machines, FM)是經(jīng)典的特征交叉方法,現(xiàn)在被廣泛應(yīng)用于各類推薦場景當(dāng)中.
3)DeepFM[39].該方法是將FM算法和DNN結(jié)構(gòu)結(jié)合的一種方式,①DNN用于抽取特征間的高階交叉信息;②FM用于抽取特征間低階交叉信息.
4)DeepCross[40].該方法利用帶有殘差連接的深度全連接神經(jīng)網(wǎng)絡(luò)以顯式的方式學(xué)習(xí)非線特征交叉信息.
5)AutoInt[4].該方法利用多頭自注意力機(jī)制代替專家知識(shí),自動(dòng)挑選有價(jià)值的特征組合進(jìn)行特征交叉.
6)EXPLORE[41].EXPLORE是一個(gè)基于矩陣分解的方法,其利用主題建模算法學(xué)習(xí)標(biāo)簽的語義信息,推薦帶有標(biāo)簽解釋的物品.由于本文采用的數(shù)據(jù)集中一個(gè)用戶僅有一條交互記錄,無法直接使用矩陣分解.因此本文在實(shí)驗(yàn)中將學(xué)生特征和單位特征作為矩陣分解的表征向量.
7)AFN[42].該方法利用對數(shù)轉(zhuǎn)換層將每個(gè)特征的冪轉(zhuǎn)換為待學(xué)習(xí)的參數(shù),實(shí)現(xiàn)自適應(yīng)調(diào)整特征組合的階數(shù).
3.4.1 整體性能及分析
表3展示了在數(shù)據(jù)集EMDAU上各方法5次實(shí)驗(yàn)結(jié)果的平均.該實(shí)驗(yàn)結(jié)果表明,本文所提出的就業(yè)推薦方法性能優(yōu)于所選對比方法;基于深度神經(jīng)網(wǎng)絡(luò)的方法效果均超過了LR;與文獻(xiàn)[42]結(jié)果不一致的是:本實(shí)驗(yàn)中DeepCross的效果差于DeepFM,本課題組分析認(rèn)為其主因是數(shù)據(jù)集EMDAU特征分布復(fù)雜性不高,且FM的低階顯式特征交叉[38](feature interaction)效果優(yōu)于CrossNet的相對高階顯式特征交叉效果;本文所提方法優(yōu)于AutoInt與AFN兩個(gè)方法的主因是,后兩者無法顯式地聚合學(xué)生就業(yè)興趣與單位能力要求;所提方法優(yōu)于EXPOLRE的主因是,后者缺乏特征間的交互.
Table 3 The Recommendation Performance of Various Methods
3.4.2 互惠性約束的消融實(shí)驗(yàn)結(jié)果及分析
為了驗(yàn)證本文所提互惠性約束的有效性,課題組完成了4個(gè)消融實(shí)驗(yàn):1)去除來自抽取學(xué)生就業(yè)偏好的注意力機(jī)制的輸入;2)去除來自抽取單位能力要求的注意力機(jī)制的輸入;3)去除模糊門聚合函數(shù);4)保持所提方法不變.
如表4所示,該實(shí)驗(yàn)結(jié)果表明所提方法的推薦性能優(yōu)于實(shí)驗(yàn)1)~3)方法,說明了本文所提出的互惠性約束3個(gè)成分對于就業(yè)推薦方法有增益作用.
Table 4 The Results of Ablation Experiment for Reciprocal-constrained Module
本文還同直接拼接(none)、平均池化(mean)、點(diǎn)積(dot)以及調(diào)和平均(harmonic)[43]等不同聚合方法進(jìn)行了對比實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果表明:使用模糊門聚合函數(shù)的推薦效果最好,如表5所示,驗(yàn)證了模糊門聚合方法的有效性.
3.4.3 可解釋模塊對推薦任務(wù)性能影響分析
鑒于基于就業(yè)特征的解釋模塊未改變就業(yè)推薦模塊的結(jié)構(gòu),對推薦性能沒有影響,故本節(jié)分別對就業(yè)意圖建模的單模型IntentPre、就業(yè)推薦建模的單模型UnitRec和本文所提出的多任務(wù)方法Ours進(jìn)行對比實(shí)驗(yàn),以驗(yàn)證基于就業(yè)意圖的解釋模塊對推薦任務(wù)性能影響.如表6所示,實(shí)驗(yàn)結(jié)果表明所提多任務(wù)方法對于就業(yè)推薦任務(wù)和就業(yè)意圖預(yù)測任務(wù)均有增益作用.
Table 5 The Comparison of Performance Between Different Aggregation Functions
Table 6 The Experimental Results of Interpretation Module
3.4.4 不同負(fù)采樣方法對比和參數(shù)實(shí)驗(yàn)分析
為了驗(yàn)證基于相似度的隨機(jī)負(fù)采樣模塊的有效性,本節(jié)完成2個(gè)實(shí)驗(yàn).
1)5個(gè)不同負(fù)采樣方法的對比實(shí)驗(yàn).為了排除互惠性約束的干擾,在實(shí)驗(yàn)中,使用特征拼接的方式代替了互惠性約束.5個(gè)負(fù)采樣方法分別為:①隨機(jī)負(fù)采樣方法Random;②基于相似度排序的負(fù)樣本生成方法Similarc,即直接選擇最不相似的N個(gè)單位(N為負(fù)樣本個(gè)數(shù))為負(fù)樣本;③基于學(xué)生間相似度的隨機(jī)負(fù)采樣方法Similars,即使用學(xué)生間相似度得到高置信度負(fù)樣本集,在該集合上隨機(jī)負(fù)采樣;④基于單位間相似度的隨機(jī)負(fù)采樣方法Similaru,即使用單位間相似度得到高置信度的負(fù)樣本集合,在該集合上隨機(jī)負(fù)采樣;⑤本文所提的隨機(jī)負(fù)采樣方法Ours.如表7所示,實(shí)驗(yàn)結(jié)果表明基于相似度的隨機(jī)負(fù)采樣方法(Similars,Similaru,Ours)均優(yōu)于隨機(jī)負(fù)采樣方法(Random),證明了本文所提出的基于相似度的負(fù)采樣方法的有效性;基于相似度排序的負(fù)樣本生成方法Similarc相比于其他方法性能下降明顯,分析認(rèn)為是由于該策略過分拉大了正負(fù)樣本間的距離導(dǎo)致方法難以收斂,且該方法很大程度上改變了原始的數(shù)據(jù)分布;基于學(xué)生間相似度的隨機(jī)負(fù)采樣方法Similars和基于單位間相似度的隨機(jī)負(fù)采樣方法Similaru均略差于融合兩者相似度的隨機(jī)負(fù)采樣方法,說明所提方法結(jié)合單位間相似度和學(xué)生間相似度完成隨機(jī)負(fù)采樣,得到的負(fù)樣本置信度更高.
Table 7 The Experimental Results of Various Negative Sampling Methods
2)閾值參數(shù)實(shí)驗(yàn).負(fù)樣本選擇閾值是按照相似度降序排序的負(fù)樣本全集中選擇出的負(fù)樣本比例.該實(shí)驗(yàn)分別采用Similars,Similaru,Ours這3種隨機(jī)負(fù)采樣方法,以前10%,30%,50%,80%和100%的閾值選擇,形成3組(每組5個(gè))高置信度負(fù)樣本集,訓(xùn)練出相應(yīng)推薦模型,并在同一測試集上測試其性能.如圖4所示,實(shí)驗(yàn)結(jié)果表明:3種隨機(jī)負(fù)采樣方法分別在30%,50%,80%的閾值上取得組內(nèi)最佳效果.
Fig.4 The results of different dissimilar sets for random negative sampling
借鑒文獻(xiàn)[42]中的隨機(jī)生成解釋性評估方法,本文通過用戶滿意度調(diào)研,對比并統(tǒng)計(jì)分析所提方法生成的和隨機(jī)生成的推薦解釋效果.
3.5.1 實(shí)驗(yàn)設(shè)置
實(shí)驗(yàn)?zāi)康脑谟谠u估所提方法的解釋性,而非其準(zhǔn)確性,因此本文假設(shè)學(xué)生實(shí)際就業(yè)單位即為方法所推薦的單位,即保留學(xué)生實(shí)際就業(yè)單位在推薦列表Top10以內(nèi)的樣本.依此規(guī)則,從測試集中隨機(jī)選擇50名學(xué)生作為實(shí)驗(yàn)對象.針對每個(gè)學(xué)生,分別用所提方法生成推薦解釋和隨機(jī)生成推薦解釋.其中推薦解釋信息包含2個(gè)模塊輸出:基于就業(yè)意圖的解釋模塊輸出學(xué)生每一類就業(yè)意圖的概率作為解釋,以餅狀圖形式呈現(xiàn),如圖5(a)所示;基于就業(yè)特征的解釋模塊分別輸出重要性評分前三的學(xué)生特征和重要性評分前三的就業(yè)單位特征作為解釋,以柱狀圖形式呈現(xiàn),如圖5(b)和圖5(c)所示.
Fig.5 Illustration of interpretable recommendation information for a student
本實(shí)驗(yàn)依據(jù)隨機(jī)雙盲原則設(shè)計(jì)問卷,調(diào)研用戶滿意度來評估所提方法生成推薦解釋的有效性.問卷中,給出所提方法生成的解釋信息和隨機(jī)生成的解釋信息,并在問卷中隨機(jī)編排為“解釋1”和“解釋2”;同時(shí)對每一個(gè)解釋信息的滿意度進(jìn)行設(shè)問如表8中問題1~6.滿意度設(shè)問基于李克特量表衡量用戶滿意度(即1~5分5個(gè)選項(xiàng)分別代表了“非常不同意”“不同意”“不一定”“同意”“非常同意”).問題7調(diào)研用戶是否認(rèn)為所提方法輸出的解釋信息更加合理,驗(yàn)證解釋信息的有效性.
由于數(shù)據(jù)集EMDAU中實(shí)例已脫敏處理,無法對實(shí)驗(yàn)所選學(xué)生直接進(jìn)行調(diào)研.為了保證調(diào)研對象的專業(yè)性和公平性,本實(shí)驗(yàn)從數(shù)據(jù)來源學(xué)校中邀請10名在學(xué)生就業(yè)輔導(dǎo)方面有豐富經(jīng)驗(yàn)的教師作為問卷對象.在問卷調(diào)查中,考慮到不同教師在就業(yè)輔導(dǎo)經(jīng)驗(yàn)上具有差異性,將10位教師隨機(jī)分為2組,2組教師分別對實(shí)驗(yàn)所選的50位學(xué)生進(jìn)行評價(jià),每位教師回答10份學(xué)生問卷,最后共收回100份學(xué)生問卷.
Table 8 The Content of Questionnaire
3.5.2 實(shí)驗(yàn)結(jié)果分析
如表9所示,問題7的統(tǒng)計(jì)結(jié)果表明:認(rèn)為所提方法生成解釋性合理的問卷數(shù)量超隨機(jī)生成方法的近1倍,證明了所提方法生成解釋信息的有效性.
Table 9 The Statistical Results of Interpretation Rationality
圖6以堆積圖的形式展示了問題1~6滿意度分?jǐn)?shù)的統(tǒng)計(jì)結(jié)果,其中Mi,Ms,Mu分別表示所提方法生成的就業(yè)意圖解釋、學(xué)生特征解釋以及就業(yè)單位特征解釋,Ri,Rs,Ru分別表示隨機(jī)生成的就業(yè)意圖解釋、學(xué)生特征解釋以及就業(yè)單位特征解釋.圖6表明:從用戶滿意度角度觀察,所提方法生成的就業(yè)意圖解釋和學(xué)生特征解釋優(yōu)于隨機(jī)生成的解釋;所提方法生成的就業(yè)單位特征解釋略好于隨機(jī)生成的解釋,即所提方法的解釋性較好.
Fig.6 The statistical results of question 1~6
從統(tǒng)計(jì)顯著性角度來分析用戶滿意度,其結(jié)果如表10所示.可以看出:對于就業(yè)意圖解釋和學(xué)生特征解釋,所提方法生成解釋的滿意度平均分高于隨機(jī)生成解釋,且配對t檢驗(yàn)的p-value遠(yuǎn)小于0.05,這說明所提方法在統(tǒng)計(jì)意義上是顯著有效的;對于單位特征解釋,所提方法生成解釋與隨機(jī)生成解釋的滿意度平均分相近,且配對t檢驗(yàn)的p-value遠(yuǎn)超0.05,這說明所提方法生成的單位特征解釋有效性低.課題組分析認(rèn)為后者的可能原因是數(shù)據(jù)集EMDAU中單位特征的數(shù)量較少且特征之間語義區(qū)分度[44]較小.
Table 10 The Average Scores and t-test Results of Question 1-6
本文提出了基于互惠性約束的可解釋就業(yè)推薦方法.其特色在于綜合運(yùn)用多任務(wù)學(xué)習(xí)、注意力機(jī)制、門控網(wǎng)絡(luò),引入互惠性約束緩解了“能力失配”問題,構(gòu)建兼顧就業(yè)特征和就業(yè)意圖演化過程的可解釋模塊增強(qiáng)可解釋性,設(shè)計(jì)基于相似度的隨機(jī)負(fù)采樣方法緩解了負(fù)樣本不置信的問題.在真實(shí)數(shù)據(jù)集EMDAU上開展對比和消融實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果驗(yàn)證了所提出方法的性能優(yōu)且有效.
未來,進(jìn)一步擴(kuò)展就業(yè)數(shù)據(jù)的特征集,深入地研究和分析就業(yè)特征之間的因果關(guān)系,使得就業(yè)推薦的解釋具有因果性,破解潛在的可解釋性失效問題.
作者貢獻(xiàn)聲明:朱海萍、田鋒、陳妍3位作者提出研究思路,設(shè)計(jì)研究方案;趙成成作者負(fù)責(zé)設(shè)計(jì)和實(shí)施實(shí)驗(yàn);田鋒、劉啟東作者負(fù)責(zé)論文起草和最終版本的修訂,輔助實(shí)驗(yàn);曾疆維作者負(fù)責(zé)數(shù)據(jù)采集、清洗和分析數(shù)據(jù)、實(shí)施實(shí)驗(yàn);鄭慶華、陳妍作者負(fù)責(zé)行政、技術(shù)和材料支持.