• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      融合需求與評價(jià)的科技服務(wù)平臺(tái)機(jī)構(gòu)推薦方法研究*

      2022-12-26 03:16:28徐尚英徐書情陳冬林吳天昊
      情報(bào)雜志 2022年12期
      關(guān)鍵詞:需方列表服務(wù)平臺(tái)

      徐尚英 徐書情 陳冬林 吳天昊

      (1. 武漢理工大學(xué)經(jīng)濟(jì)學(xué)院 武漢 430070;2.湖北省電子商務(wù)大數(shù)據(jù)工程技術(shù)研究中心 武漢 430070)

      0 引 言

      為推進(jìn)科技革命和產(chǎn)業(yè)變革深入發(fā)展,推動(dòng)全國科技服務(wù)體系建設(shè),2014年國務(wù)院印發(fā)《關(guān)于加快科技服務(wù)業(yè)發(fā)展的若干意見》。科技服務(wù)業(yè)雙向鏈接科技與產(chǎn)業(yè),極大促進(jìn)了知識(shí)技術(shù)的產(chǎn)業(yè)化,以研發(fā)創(chuàng)新驅(qū)動(dòng)全社會(huì)的經(jīng)濟(jì)增長,帶動(dòng)產(chǎn)業(yè)轉(zhuǎn)型升級,是提高經(jīng)濟(jì)效益的關(guān)鍵環(huán)節(jié)[1-2]??萍挤?wù)業(yè)創(chuàng)新進(jìn)程中,平臺(tái)化成為主流,促進(jìn)了信息展示與交互,協(xié)調(diào)了資源共享與釋放,有利于供需雙方的有效匹配[3]。

      科技服務(wù)平臺(tái)上存在運(yùn)營環(huán)境多變、供需匹配過程不易控制優(yōu)化、服務(wù)非標(biāo)準(zhǔn)化等復(fù)雜特性[4]。不同于一般電商平臺(tái)僅關(guān)注商品自身屬性以生成商品推薦,而無需關(guān)注店鋪特征進(jìn)行店鋪推薦??萍挤?wù)需方不僅需要科技服務(wù),更需與機(jī)構(gòu)進(jìn)行深度交互且充分了解機(jī)構(gòu)綜合能力水平以實(shí)現(xiàn)服務(wù)的有效轉(zhuǎn)化。同時(shí),科技服務(wù)需求內(nèi)容的多樣化和復(fù)雜化催生了大批科技服務(wù)機(jī)構(gòu)的涌現(xiàn)[5]??萍挤?wù)平臺(tái)上機(jī)構(gòu)數(shù)量的快速增加一方面為平臺(tái)注入了新鮮優(yōu)質(zhì)的科技服務(wù)資源,使得平臺(tái)能更好的滿足科技服務(wù)需方。但另一方面,也為科技服務(wù)需方定位契合的科技服務(wù)平臺(tái)供方即機(jī)構(gòu)增加了難度。故在科技服務(wù)平臺(tái)開展機(jī)構(gòu)推薦極具重要性與必要性。

      現(xiàn)有文獻(xiàn)在云服務(wù)、O2O服務(wù)等領(lǐng)域有針對性的開展基于需求相似度和基于評分的機(jī)構(gòu)推薦研究,但針對科技服務(wù)平臺(tái)機(jī)構(gòu)的推薦方法研究還有待補(bǔ)充。鑒于此,本文立足科技服務(wù)平臺(tái)長遠(yuǎn)發(fā)展,提出融合科技服務(wù)需求(需求標(biāo)題和需求描述)、科技服務(wù)平臺(tái)評分和科技服務(wù)機(jī)構(gòu)評價(jià)標(biāo)簽的機(jī)構(gòu)推薦方法CDAE(Combining Demand and Evaluation),通過引入科技服務(wù)機(jī)構(gòu)推薦指數(shù)為科技服務(wù)需方生成最符合其偏好且能力水平高的機(jī)構(gòu)推薦列表,解決科技服務(wù)平臺(tái)供需雙方有效匹配問題。

      1 相關(guān)研究

      為更好實(shí)現(xiàn)科技服務(wù)資源的充分利用,滿足日趨復(fù)雜多樣的科技服務(wù)需求,基于互聯(lián)網(wǎng)大數(shù)據(jù)技術(shù)展開科技服務(wù)平臺(tái)個(gè)性化推薦[7]。其相關(guān)研究可總結(jié)為以下2個(gè)方面:a.從科技服務(wù)需求的時(shí)間維度看,搜集科技服務(wù)數(shù)據(jù)后,平臺(tái)將多維度識(shí)別出科技服務(wù)需方的多樣需求以進(jìn)行精準(zhǔn)推薦[3]。對于較迫切的現(xiàn)實(shí)需求,平臺(tái)可通過分析科技服務(wù)需方的服務(wù)請求,推送已有服務(wù)資源[8-9]。對于較隱性的潛在需求,平臺(tái)可通過分析科技服務(wù)需方“痕跡數(shù)據(jù)”,利用隱語義算法生成需求圖譜,主動(dòng)推送感興趣信息[8-9]。對于較模糊的未來需求,平臺(tái)可通過分析科技服務(wù)需方“痕跡數(shù)據(jù)”與國家政策信息,預(yù)測需求并進(jìn)行集成化推薦[8]。b.從推薦列表的排序維度看,丁宅榮等[10]得到待推薦的內(nèi)容后,還根據(jù)新鮮度、多元化、不重復(fù)等原則對待推薦內(nèi)容進(jìn)行重排以返回個(gè)性化推薦列表。Qin等[11]將得到待推薦資源后,還根據(jù)資源相關(guān)度和資源新鮮度對待推薦資源進(jìn)行重排以返回個(gè)性化推薦列表。楊迪等[12]得到供方待推薦列表后,還通過需方對供方的搜索、選擇、刪除等操作行為對待推薦列表進(jìn)行重排以返回優(yōu)質(zhì)供方推薦列表。但除文獻(xiàn)[12]外,其他研究均未展開具體實(shí)驗(yàn),從技術(shù)角度論證所述方法的可行性與有效性。故本文將參考其他領(lǐng)域推薦展開本文推薦方法設(shè)計(jì)。

      傳統(tǒng)推薦方法大致分為協(xié)同、內(nèi)容和混合過濾三種,其對象主要是項(xiàng)目或產(chǎn)品。但隨著服務(wù)業(yè)的蓬勃發(fā)展和人們服務(wù)需求的復(fù)雜化,服務(wù)機(jī)構(gòu)數(shù)量逐年增加。為此,學(xué)者們不斷研究不同服務(wù)領(lǐng)域機(jī)構(gòu)推薦方法以解決供需雙方匹配的難題?,F(xiàn)有其他領(lǐng)域機(jī)構(gòu)推薦方法主要集中在基于需求相似度和基于評分的推薦。a.基于需求相似度是通過計(jì)算供需雙方或需方之間的相似度以返回推薦結(jié)果的方法。如禹春霞等[13]以三角模糊評價(jià)法量化云服務(wù)用戶需求偏好和云服務(wù)提供商服務(wù)能力后,利用歐式模糊距離算出兩者的綜合相似度,生成機(jī)構(gòu)推薦列表。朱文強(qiáng)等[14]以相似度計(jì)算得到用戶之間對于O2O機(jī)構(gòu)偏好的相似度高低值,再算出機(jī)構(gòu)聲譽(yù)值,最后結(jié)合用戶間的機(jī)構(gòu)偏好相似度和機(jī)構(gòu)聲譽(yù)值返回機(jī)構(gòu)推薦結(jié)果。b.基于評分的推薦是通過預(yù)測供方的評分高低值以返回推薦結(jié)果的方法。如陳貴濤等[15]立足初創(chuàng)企業(yè)視角,綜合考慮投資機(jī)構(gòu)三個(gè)維度生成投資機(jī)構(gòu)得分后,基于ALS算法返回投資機(jī)構(gòu)推薦列表。但在商品推薦研究中,有學(xué)者認(rèn)為僅依據(jù)評分進(jìn)行推薦,極易導(dǎo)致平臺(tái)出現(xiàn)評分評價(jià)不一致(典型的高評分負(fù)向評價(jià))現(xiàn)象,影響需方的購買決策[16]。同時(shí)考慮到評價(jià)作為需方自發(fā)生成的文本信息,極大程度上更加真實(shí)地反映了他們的消費(fèi)體驗(yàn)和消費(fèi)期望[17]。故學(xué)者們常常融合評分和評價(jià)進(jìn)行推薦以提高推薦性能[18-19]。

      綜上,若單純基于需求相似度返回推薦結(jié)果,僅保證了供需雙方在服務(wù)方向與內(nèi)容上的一致性,未充分考慮機(jī)構(gòu)自身的能力水平,可能使得優(yōu)質(zhì)機(jī)構(gòu)的推薦位置靠后;若單純基于評分返回推薦結(jié)果,可能導(dǎo)致需求挖掘的深度不夠以及評分所反映信息的真實(shí)度不夠,影響供需匹配的效率和性能。故本文參考云服務(wù)、O2O服務(wù)等領(lǐng)域,針對科技服務(wù)平臺(tái)上的現(xiàn)實(shí)需求,引入科技服務(wù)機(jī)構(gòu)推薦指數(shù),研究融合科技服務(wù)需求、科技服務(wù)平臺(tái)評分和科技服務(wù)機(jī)構(gòu)評價(jià)標(biāo)簽的機(jī)構(gòu)推薦方法CDAE,為科技服務(wù)需方推薦他們感興趣的評分評價(jià)好即能力水平高的科技服務(wù)機(jī)構(gòu)列表。

      2 科技服務(wù)平臺(tái)機(jī)構(gòu)推薦方法研究

      融合科技服務(wù)需求、科技服務(wù)平臺(tái)評分和科技服務(wù)機(jī)構(gòu)評價(jià)標(biāo)簽生成機(jī)構(gòu)推薦列表的方法,主要包括兩個(gè)步驟,如圖1所示。

      圖1 融合需求與評價(jià)的科技服務(wù)平臺(tái)機(jī)構(gòu)推薦

      a.科技服務(wù)需求模型的構(gòu)建與需求內(nèi)容雙層相似度的計(jì)算。綜合考慮科技服務(wù)需求標(biāo)題和科技服務(wù)需求描述,通過VSM和TFIDF算法完成科技服務(wù)需求模型的構(gòu)建后,計(jì)算需求內(nèi)容雙層相似度。進(jìn)一步以相似度值高低返回近鄰科技服務(wù)需方列表后,再借助購買關(guān)聯(lián)生成機(jī)構(gòu)候選集合。

      b.科技服務(wù)機(jī)構(gòu)推薦指數(shù)的構(gòu)建與度量。綜合科技服務(wù)平臺(tái)給出的評分和科技服務(wù)需方給出的評價(jià)標(biāo)簽,構(gòu)建科技服務(wù)機(jī)構(gòu)推薦指數(shù)。再以頻次量化評價(jià)標(biāo)簽生成標(biāo)簽評分后,結(jié)合平臺(tái)評分度量科技服務(wù)機(jī)構(gòu)推薦指數(shù)值。最后以科技服務(wù)機(jī)構(gòu)推薦指數(shù)值對2.1候選集合中的機(jī)構(gòu)進(jìn)行重排,并取前N個(gè)機(jī)構(gòu)組成機(jī)構(gòu)推薦列表。

      2.1 科技服務(wù)需求模型構(gòu)建與需求內(nèi)容雙層相似度計(jì)算

      2.1.1科技服務(wù)需求模型的構(gòu)建

      根據(jù)VSM模型,首先利用jieba對文本進(jìn)行分詞。接著在使用常用停用詞表如哈工大停用詞表、百度停用詞表、四川大學(xué)機(jī)器智能實(shí)驗(yàn)室停用詞表的基礎(chǔ)上,引入部分針對科技服務(wù)需求內(nèi)容描述的停用詞,如“需求”“需要”“公司”“企業(yè)”“機(jī)構(gòu)”等,得到文本的詞項(xiàng)集合。再選擇詞頻及TF-IDF(Term Frequency-Inverse Document Frequency)方法計(jì)算詞項(xiàng)的權(quán)重。最后根據(jù)詞項(xiàng)及其權(quán)重將文本表示為空間向量,如下:

      u={(t1:w1),(t2:w2),…,(tj:wj)}

      (1)

      其中tj為詞項(xiàng),wj為對應(yīng)詞項(xiàng)的權(quán)重。

      對科技服務(wù)需求標(biāo)題和需求描述進(jìn)行分詞去停后得到其詞項(xiàng)集合。需求標(biāo)題的語言一般均十分精煉,而需求描述一般較長較詳細(xì),屬于長文本。故建立需求標(biāo)題的VSM模型,利用詞頻即詞項(xiàng)在文本中出現(xiàn)的頻次即可表示詞項(xiàng)權(quán)重。建立需求描述的VSM模型,利用經(jīng)典權(quán)重計(jì)算方法TF-IDF表示詞項(xiàng)權(quán)重,權(quán)重計(jì)算公式如下:

      (2)

      整合上述需求標(biāo)題和需求描述向量,得到科技服務(wù)需求模型,如下:

      PDi=

      (3)

      其中PDi表示第i個(gè)科技服務(wù)需方的需求模型;DTi、DAi分別表示第i個(gè)需方的需求標(biāo)題和需求描述的VSM;t1p表示需求標(biāo)題模型中第p個(gè)詞項(xiàng),w1p表示對應(yīng)詞項(xiàng)權(quán)重,p為相應(yīng)模型空間長度;t2q表示需求描述中第q個(gè)詞項(xiàng),w2q表示對應(yīng)詞項(xiàng)權(quán)重,q為相應(yīng)模型空間長度。

      2.1.2需求內(nèi)容雙層相似度的計(jì)算

      需求標(biāo)題和需求描述文本向量化后生成高維向量,以余弦值計(jì)算文本相似度。故科技服務(wù)需求內(nèi)容雙層相似度計(jì)算公式如下:

      sim(PDi,PDj)=α1sim(DTi,DTj)+

      β1sim(DAi,DAj)

      (4)

      其中,sim(DTi,DTj)、sim(DAi,DAj)分別表示科技服務(wù)需方PDi與PDj在需求標(biāo)題和需求描述方面的相似度,α1和β1分別代表這兩個(gè)相似度的權(quán)重,且α1+β1=1。

      根據(jù)需求相似度值高低排序,返回前K個(gè)近鄰科技服務(wù)需方,組成近鄰科技服務(wù)需方列表NDL(Near Demander List, |NDL|=K)。再借助平臺(tái)供需方購買關(guān)聯(lián)生成與這前K個(gè)近鄰需方發(fā)生購買關(guān)聯(lián)的機(jī)構(gòu)組成機(jī)構(gòu)候選集合ICS(Institution Candidate Set, |ICS|=M)。

      2.2 科技服務(wù)機(jī)構(gòu)推薦指數(shù)的構(gòu)建與度量

      2.2.1科技服務(wù)機(jī)構(gòu)推薦指數(shù)的構(gòu)建

      為緩解優(yōu)質(zhì)機(jī)構(gòu)推薦位置靠后的問題,本文在科技服務(wù)需求挖掘的基礎(chǔ)上,引入科技服務(wù)機(jī)構(gòu)推薦指數(shù)IRI(Institution Recommendation Index),對機(jī)構(gòu)滿足科技服務(wù)需求的能力水平進(jìn)行衡量。其由科技服務(wù)平臺(tái)評分和科技服務(wù)機(jī)構(gòu)評價(jià)標(biāo)簽兩個(gè)維度構(gòu)建所成。

      科技服務(wù)平臺(tái)一般從咨詢響應(yīng)、交付質(zhì)量、用戶評價(jià)和售后服務(wù)等多維度考量科技服務(wù)機(jī)構(gòu)并生成綜合的科技服務(wù)平臺(tái)評分。這些維度所反映的實(shí)際需求都是科技服務(wù)平臺(tái)進(jìn)行推薦時(shí)的優(yōu)化目標(biāo)[20]。故本文將采集科技服務(wù)平臺(tái)評分用于科技服務(wù)機(jī)構(gòu)推薦指數(shù)的構(gòu)建。

      評價(jià)是科技服務(wù)需方自發(fā)生成的文本,極大程度上真實(shí)反映了他們的消費(fèi)體驗(yàn)和消費(fèi)期望[16]。故通過對科技服務(wù)平臺(tái)機(jī)構(gòu)評價(jià)內(nèi)容進(jìn)行分析,可了解到科技服務(wù)需方對機(jī)構(gòu)的真實(shí)態(tài)度。但科技服務(wù)機(jī)構(gòu)評價(jià)的數(shù)量隨互聯(lián)網(wǎng)大數(shù)據(jù)的發(fā)展而暴增,且評價(jià)內(nèi)容本身具有不規(guī)則性、冗余性的特征[21]。而評價(jià)標(biāo)簽將在線評價(jià)按產(chǎn)品特征或消費(fèi)體驗(yàn)分類[22],其信息規(guī)范性和有效性都較強(qiáng)[23]。故本文將采集科技服務(wù)機(jī)構(gòu)所有評價(jià)標(biāo)簽用于科技服務(wù)機(jī)構(gòu)推薦指數(shù)的構(gòu)建。

      2.2.2科技服務(wù)機(jī)構(gòu)推薦指數(shù)的度量

      對于科技服務(wù)機(jī)構(gòu)的平臺(tái)評分PS(滿分為5分即PS≤5),本文直接以此總分取相應(yīng)權(quán)重進(jìn)行計(jì)算。

      對于科技服務(wù)機(jī)構(gòu)評價(jià)標(biāo)簽,本文參考文獻(xiàn)[23]通過人工梳理和頻次分析進(jìn)行機(jī)構(gòu)特征屬性的提取。不同于一般電商產(chǎn)品評論標(biāo)簽的清晰化描述,如對于手機(jī)系統(tǒng)流暢的評論,標(biāo)簽顯示為“系統(tǒng)流暢”??萍挤?wù)平臺(tái)上機(jī)構(gòu)評價(jià)標(biāo)簽描述均較為模糊,如對于服務(wù)效率的評價(jià),標(biāo)簽會(huì)顯示為“速度快”“高效”“工期延誤”等。由此可窺見科技服務(wù)區(qū)別于一般電商行業(yè)的特別之處,以及在科技服務(wù)平臺(tái)上提取機(jī)構(gòu)特征屬性的難度。因此本文參考相關(guān)文獻(xiàn)[24]采用三人小組進(jìn)行標(biāo)注,確定標(biāo)注標(biāo)準(zhǔn)是在最大化保留原始評價(jià)標(biāo)簽的情況下充分體現(xiàn)評價(jià)標(biāo)簽所反映出的科技服務(wù)業(yè)獨(dú)有特性,保證標(biāo)注結(jié)果精煉且符合標(biāo)準(zhǔn)。

      對于科技服務(wù)機(jī)構(gòu)的標(biāo)簽評分LS,相關(guān)文獻(xiàn)[23,25]通過重構(gòu)sigmoid函數(shù)進(jìn)行計(jì)算。但此計(jì)分方式未充分考慮評價(jià)情感傾向的影響。故本文針對特征屬性的不同情感傾向提出不同計(jì)分公式如下:

      PLSji=

      (5)

      NLSji=

      (6)

      LSj=∑PLSji+∑NLSji

      (7)

      其中PLSji代表機(jī)構(gòu)PIj正向特征屬性評分且0≤PLSji≤1,NLSji代表機(jī)構(gòu)負(fù)向特征屬性評分且-1≤NLSji≤0,LSj代表機(jī)構(gòu)標(biāo)簽評分;gji代表在機(jī)構(gòu)中特征屬性fi出現(xiàn)的頻次,Gj代表機(jī)構(gòu)評價(jià)標(biāo)簽總數(shù)。

      科技服務(wù)機(jī)構(gòu)推薦指數(shù)計(jì)算公式如下:

      IRIj=α2PSj+β2LSj

      (8)

      其中,IRIj表示機(jī)構(gòu)PIj的科技服務(wù)機(jī)構(gòu)推薦指數(shù)值,PSj表示機(jī)構(gòu)平臺(tái)評分,LSj表示機(jī)構(gòu)的標(biāo)簽評分;α2和β2分別代表平臺(tái)評分和標(biāo)簽評分的權(quán)重,且α2+β2=1

      根據(jù)2.1可得科技服務(wù)機(jī)構(gòu)候選集合ICS。利用科技服務(wù)機(jī)構(gòu)推薦指數(shù)值高低對候選集合中的機(jī)構(gòu)進(jìn)行重排,取排序后前N個(gè)不同的機(jī)構(gòu)組成機(jī)構(gòu)推薦列表IRL(Institution Recommendation List, |IRL|=N)。這個(gè)機(jī)構(gòu)推薦列表是融合挖掘科技服務(wù)需求、科技服務(wù)平臺(tái)評分和科技服務(wù)機(jī)構(gòu)評價(jià)標(biāo)簽的結(jié)果,不僅考慮了需方主動(dòng)上傳的科技服務(wù)需求,還考慮了平臺(tái)機(jī)構(gòu)的能力水平。

      3 實(shí)驗(yàn)與結(jié)果分析

      3.1 數(shù)據(jù)準(zhǔn)備

      本文利用八爪魚爬取豬八戒網(wǎng)“軟件開發(fā)”板塊交易數(shù)據(jù)1 392條。經(jīng)預(yù)處理(如圖2)后得1 227條交易數(shù)據(jù),包含存在購買關(guān)聯(lián)的供需雙方名稱、需求標(biāo)題、需求描述以及機(jī)構(gòu)評價(jià)標(biāo)簽。將1227條交易數(shù)據(jù)隨機(jī)分成5組,于每組數(shù)據(jù)中隨機(jī)取70%用作訓(xùn)練集,其余30%作為測試集。

      圖2 數(shù)據(jù)清洗處理主要流程

      豬八戒網(wǎng)科技服務(wù)機(jī)構(gòu)總體評價(jià)板塊至多包含12個(gè)不同評價(jià)標(biāo)簽。為準(zhǔn)確提取科技服務(wù)機(jī)構(gòu)特征屬性,除上述交易數(shù)據(jù)中已有的504個(gè)機(jī)構(gòu)外,再次爬取豬八戒網(wǎng)“軟件開發(fā)”板塊214個(gè)機(jī)構(gòu)數(shù)據(jù),經(jīng)人工剔除評價(jià)標(biāo)簽無內(nèi)容及無效的機(jī)構(gòu)后共得484個(gè)機(jī)構(gòu),包含300 908個(gè)評價(jià)標(biāo)簽。

      目前尚無完整的科技服務(wù)機(jī)構(gòu)評價(jià)語料庫,本文以上述300 908個(gè)評價(jià)標(biāo)簽組建科技服務(wù)機(jī)構(gòu)評價(jià)標(biāo)簽庫。經(jīng)頻次統(tǒng)計(jì)后得484個(gè)機(jī)構(gòu)共有4 903個(gè)評價(jià)標(biāo)簽,每個(gè)機(jī)構(gòu)平均有10個(gè)評價(jià)標(biāo)簽。人工梳理4 903個(gè)評價(jià)標(biāo)簽可發(fā)現(xiàn)其中存在“一義多詞”和用語不規(guī)范現(xiàn)象。故根據(jù)標(biāo)注標(biāo)準(zhǔn)進(jìn)行剔除整理,再以頻次分析法篩選評價(jià)標(biāo)簽結(jié)果如表1,評價(jià)標(biāo)簽分布不均,其中“專業(yè)度高、準(zhǔn)時(shí)交付、嚴(yán)謹(jǐn)認(rèn)真”等9個(gè)評價(jià)標(biāo)簽的出現(xiàn)頻率和高達(dá)83.47%。故本文選取出現(xiàn)頻率不小于0.1%的評價(jià)標(biāo)簽用于特征屬性的提取,最終得25個(gè)科技服務(wù)機(jī)構(gòu)特征屬性,其中有20個(gè)正向特征屬性和5個(gè)負(fù)向特征屬性(如圖3)。

      表1 科技服務(wù)機(jī)構(gòu)評價(jià)標(biāo)簽頻率表

      圖3 科技服務(wù)平臺(tái)機(jī)構(gòu)特征屬性

      3.2 實(shí)驗(yàn)設(shè)置

      基于上述內(nèi)容,本文設(shè)計(jì)的CDAE方法推薦流程為:根據(jù)2.1生成NDL后,基于需方與機(jī)構(gòu)間購買關(guān)聯(lián)返回ICS。再利用2.2生成的IRI對集合中機(jī)構(gòu)進(jìn)行重排以返回IRL。在該方法中,科技服務(wù)需方和機(jī)構(gòu)在NDL和IRL中排序的思路是:需求標(biāo)題與描述加權(quán)組合,平臺(tái)評分與標(biāo)簽評分加權(quán)組合,其中各權(quán)值設(shè)置如下:α1=β1=0.5,α2=0.4,β2=0.6,以及|NDL|=K=367,|ICS|=M=50。

      以豬八戒網(wǎng)某機(jī)構(gòu)為例說明IRI計(jì)算。在機(jī)構(gòu)首頁頂部可查此機(jī)構(gòu)PS=4.5分,標(biāo)簽評分計(jì)算如表2。故此機(jī)構(gòu)IRI=0.4*PS+0.6*LS=0.4*4.5+0.6*1.14 18=2.48 51。

      表2 豬八戒網(wǎng)某科技服務(wù)機(jī)構(gòu)標(biāo)簽評分計(jì)算

      標(biāo)簽評分LS:26/134+22/134+(19+16)/134+18/134+(15+11+10)/134+8/134+8/134=1.14 18

      3.3 評價(jià)指標(biāo)

      現(xiàn)有推薦系統(tǒng)重在實(shí)現(xiàn)精準(zhǔn)推薦。但在機(jī)構(gòu)推薦中,若僅強(qiáng)調(diào)推薦列表的精準(zhǔn)度而忽視覆蓋度,則可能導(dǎo)致推薦集中于“頭部”機(jī)構(gòu),使得“尾部”機(jī)構(gòu)愈加冷門而不利于平臺(tái)發(fā)展。實(shí)際推薦過程中,不僅關(guān)注推薦列表中機(jī)構(gòu)是否被選擇,還關(guān)注推薦列表與需求的整體契合度。故基于機(jī)構(gòu)推薦列表的精準(zhǔn)度、覆蓋度與契合度多重目標(biāo),采用以下指標(biāo)進(jìn)行效果評價(jià):①精準(zhǔn)度:a.分類精準(zhǔn)度:準(zhǔn)確率P(Precision)、召回率R(Recall)、F值(F-measure);b.排序精準(zhǔn)度:平均精度均值MAP(Mean Average Precision)、歸一化折損累積增益NDCG(Normalized Discounted Cumulative Gain)。②覆蓋度:覆蓋率COV(Coverage)。③契合度:參考相關(guān)文獻(xiàn)[26]邀請5位科技服務(wù)業(yè)技術(shù)專家對推薦列表中機(jī)構(gòu)逐一打分,評分標(biāo)準(zhǔn)是1-100分,分值越高說明機(jī)構(gòu)越能契合需求。評分過程中,技術(shù)專家逐一查看機(jī)構(gòu)詳情頁以確保對機(jī)構(gòu)較為了解。5位技術(shù)專家對同一列表中同一機(jī)構(gòu)的綜合平均分即為該機(jī)構(gòu)得分IS(Institution Score),同一列表中所有機(jī)構(gòu)綜合平均分即為該列表得分ILS(Institution List Score),代表該列表與科技服務(wù)需求的契合程度。各指標(biāo)計(jì)算公式如下:

      其中,N代表推薦列表中機(jī)構(gòu)數(shù);PD代表測試集中科技服務(wù)需方集合,本文中|PD|=368;IRLpd(N)代表Top-N推薦列表;Ipd代表與科技服務(wù)需方發(fā)生實(shí)際購買關(guān)聯(lián)的機(jī)構(gòu);prei表示機(jī)構(gòu)i在推薦列表中的位置,prej

      3.4 結(jié)果分析

      為驗(yàn)證CDAE方法的有效性與可行性,選擇以下兩種方法進(jìn)行對比:傳統(tǒng)內(nèi)容過濾方法(CBF);基于科技服務(wù)需方的協(xié)同過濾推薦方法(CF-D):即得本文機(jī)構(gòu)候選集合ICS。

      以科技服務(wù)需方“羅***14”為例,3種方法所得部分推薦結(jié)果如表3。

      表3 豬八戒網(wǎng)部分機(jī)構(gòu)推薦結(jié)果

      3.4.1 Top-N條件下分類精準(zhǔn)度分析

      將CDAE方法與CF-D和CBF方法進(jìn)行準(zhǔn)確率、召回率和F值比較。取N=1/5/10/15/20/25,實(shí)驗(yàn)結(jié)果如圖4。

      圖4 不同Top-N條件下3種推薦方法的分類精準(zhǔn)度對比

      由圖4可得,CDAE方法的P值和F1值隨列表長度N的增大而減小,CF-D和CBF的P值和F1值基本呈現(xiàn)隨列表長度N的增大而緩慢增大的趨勢,但三種方法的P值和F1值均隨N的增大而趨于穩(wěn)定。同時(shí),三種方法的R值均隨N的增大而增大。CDAE方法相對于CF-D和CBF方法的P值、R值和F1值要大,推薦分類精準(zhǔn)度更好。

      CDAE方法的P值和F1值隨列表長度N的增大而減小。這是因?yàn)閷?shí)際推薦列表中機(jī)構(gòu)數(shù)N=1(如表3),故推薦結(jié)果中N的增大給準(zhǔn)確率帶來的直接影響大于其間接影響,即準(zhǔn)確推薦的需方數(shù)隨N的增大而增大,但其影響弱于推薦結(jié)果中N的增大帶來的直接影響??傮w來看,三種方法的F1值趨于穩(wěn)定,但可明顯看出N=10為拐點(diǎn)。

      3.4.2 Top-N條件下排序精準(zhǔn)度分析

      將CDAE方法與CF-D和CBF方法進(jìn)行平均精度均值、歸一化折損累積增益比較。取N=1/5/10/15/20/25,實(shí)驗(yàn)結(jié)果如圖5。

      圖5 不同Top-N條件下3種推薦方法的排序精準(zhǔn)度對比

      由圖 5可得,三種方法MAP值均隨N的增大而減小,三種方法的NDCG值均隨N的增大而增大,CDAE方法相對于CF-D和CBF方法的MAP值和NDCG值要大,推薦排序精準(zhǔn)度更好。其中,MAP值均隨N增大而減小的原因是推薦結(jié)果中N的增大給MAP值帶來的直接影響大于其間接影響??傮w來看,三種方法的MAP值趨于穩(wěn)定而NDCG值的差距越來越大,同時(shí)可明顯看出N=5為一個(gè)拐點(diǎn)。

      3.4.3 Top-N條件下覆蓋度分析

      將CDAE與CF-D和CBF方法進(jìn)行覆蓋率比較。取N=5/10/15/20/25,實(shí)驗(yàn)結(jié)果如圖 6。

      圖6 不同Top-N條件下3種推薦方法的覆蓋度對比

      由圖6可得,CDAE方法相對于CF-D和CBF方法的COV值要小,但整體隨N的增大而趨同(經(jīng)統(tǒng)計(jì),測試數(shù)據(jù)集中共有93個(gè)不同機(jī)構(gòu))。這是因?yàn)镃F-D方法只考慮科技服務(wù)需求之間的相似度這一個(gè)約束條件,CBF方法只考慮科技服務(wù)需求與科技服務(wù)機(jī)構(gòu)簡介間的相似度這一個(gè)約束條件,而CDAE方法考慮了需求內(nèi)容雙層相似度及科技服務(wù)機(jī)構(gòu)能力兩個(gè)約束條件。當(dāng)N較小時(shí),CDAE方法所得推薦結(jié)果的覆蓋度小于CF-D和CBF方法,但隨N的增大,CDAE方法的推薦覆蓋度效果不會(huì)受到影響。

      3.4.4 N=10條件下精準(zhǔn)度分析

      經(jīng)上述分析可得,N=10在分類精準(zhǔn)度分析中為拐點(diǎn),N=5在排序精準(zhǔn)度分析中為拐點(diǎn),且推薦覆蓋度隨N的增大而增大。故以下取N=10,將CDAE方法與CF-D和CBF方法進(jìn)行精準(zhǔn)度比較,實(shí)驗(yàn)結(jié)果如圖7。

      圖7 N=10條件下3種推薦方法的精準(zhǔn)度分析

      由圖7可得,N=10時(shí),CDAE方法獲得的精準(zhǔn)度性能優(yōu)于CF-D方法優(yōu)于CBF方法。這說明充分挖掘科技服務(wù)需求和購買關(guān)聯(lián)的推薦方法優(yōu)于挖掘科技服務(wù)需求與科技服務(wù)機(jī)構(gòu)簡介的方法。其原因可能是科技服務(wù)機(jī)構(gòu)簡介重在介紹企業(yè)整體服務(wù)業(yè)務(wù)和企業(yè)背景,而需求文本重在描述需求的目標(biāo)和要求,兩者匹配度不高。在此基礎(chǔ)上,再引入科技服務(wù)機(jī)構(gòu)推薦指數(shù)以衡量科技服務(wù)機(jī)構(gòu)滿足科技服務(wù)需求的能力,緩解了優(yōu)質(zhì)機(jī)構(gòu)推薦位置靠后的問題,有效提升了推薦性能。

      3.4.5機(jī)構(gòu)推薦列表契合度分析

      將CDAE方法與CF-D和CBF方法進(jìn)行契合度比較,取測試集中18個(gè)科技服務(wù)需方,通過3種推薦方法生成3組推薦列表,每組有18份,共54份推薦列表,每份推薦列表包含10個(gè)不同機(jī)構(gòu)。

      統(tǒng)計(jì)3組推薦列表的評分情況(如表4):a.CDAE、CF-D、CBF這3組推薦列表之中,最高最低得分分別相差14.4分、8.6分、9.6分。專家對三組推薦結(jié)果的評分相對穩(wěn)健,總體評分結(jié)果真實(shí)有效。b.CDAE方法所得18份推薦列表得分均高于60分,最高分達(dá)75.2,推薦列表中所有機(jī)構(gòu)與需求的契合度較好。CF-D和CBF方法18份推薦列表中,除CF-D中第11份推薦達(dá)到60.8分外,其他推薦列表得分均低于60分。故CDAE方法所得機(jī)構(gòu)推薦列表更能滿足科技服務(wù)需求。c.CDAE方法所得三組推薦列表的平均分相較CF-D提升20%,相較CBF方法提升26%。故CDAE方法所獲得的性能優(yōu)于另外兩種方法,即本文中融合考慮科技服務(wù)需求和科技服務(wù)機(jī)構(gòu)能力水平進(jìn)行推薦的方法有更好的推薦性能。

      表4 3種推薦方法契合度對比

      4 結(jié) 語

      為解決科技服務(wù)平臺(tái)供需雙方匹配問題,本文提出融合科技服務(wù)需求、科技服務(wù)平臺(tái)評分和科技服務(wù)機(jī)構(gòu)評價(jià)標(biāo)簽的機(jī)構(gòu)推薦方法CDAE。以科技服務(wù)需求為基礎(chǔ),將非結(jié)構(gòu)性需求文本向量化進(jìn)行雙層相似度計(jì)算并輔以購買關(guān)聯(lián)而生成機(jī)構(gòu)候選集合;同時(shí),從平臺(tái)評分和評價(jià)標(biāo)簽雙維度出發(fā),創(chuàng)新性地構(gòu)建并度量了科技服務(wù)機(jī)構(gòu)推薦指數(shù),對集合機(jī)構(gòu)重排以生成機(jī)構(gòu)推薦列表?;谪i八戒網(wǎng)軟件開發(fā)板塊真實(shí)數(shù)據(jù)集開展實(shí)驗(yàn),通過與CF-D和CBF這2組方法進(jìn)行對比,結(jié)果顯示Top-N條件下,CDAE方法在精準(zhǔn)度和契合度指標(biāo)上優(yōu)于對比方法,在覆蓋度上同樣有較好的性能。面對未來復(fù)雜多樣的科技服務(wù)應(yīng)用場景,該方法仍需進(jìn)一步優(yōu)化。首先,后續(xù)研究應(yīng)采集多元數(shù)據(jù),設(shè)計(jì)面向潛在需求和未來需求科技服務(wù)平臺(tái)機(jī)構(gòu)推薦方法。另外,在科技服務(wù)機(jī)構(gòu)的標(biāo)簽評分上,未來可探索更科學(xué)的量化方式,充分揭示評價(jià)標(biāo)簽中所體現(xiàn)的需方消費(fèi)態(tài)度與機(jī)構(gòu)優(yōu)劣信息用于科技服務(wù)平臺(tái)機(jī)構(gòu)推薦的研究。

      猜你喜歡
      需方列表服務(wù)平臺(tái)
      巧用列表來推理
      密碼服務(wù)平臺(tái)
      需求拉動(dòng)與供應(yīng)推動(dòng)
      ——滿足與創(chuàng)新問題
      鈑金與制作(2022年5期)2022-11-22 04:36:04
      打造一體化汽車服務(wù)平臺(tái)
      學(xué)習(xí)運(yùn)用列表法
      論基于云的電子政務(wù)服務(wù)平臺(tái)構(gòu)建
      擴(kuò)列吧
      基于云計(jì)算的民航公共信息服務(wù)平臺(tái)
      需方對分級診療制度的滿意度分析——以青海省為例
      高校思想政治理論課需方激勵(lì)弱化提升路徑研究
      理論觀察(2015年5期)2015-05-30 02:33:22
      平远县| 门源| 天津市| 武冈市| 辽宁省| 迭部县| 垦利县| 兰溪市| 芦山县| 三台县| 渭源县| 和硕县| 新营市| 铅山县| 淳化县| 成安县| 江都市| 邵阳市| 博野县| 望谟县| 垦利县| 射洪县| 南投市| 永川市| 新乡市| 乐昌市| 响水县| 瓦房店市| 永康市| 巴马| 同心县| 许昌市| 永济市| 和平区| 法库县| 安岳县| 布拖县| 方山县| 吴旗县| 公安县| 萨嘎县|