周康渠,張家銘,何 苗+,龍 梅
(1.重慶理工大學(xué) 機(jī)械工程學(xué)院,重慶 400054;2.豬八戒股份有限公司,重慶 401120)
隨著以大數(shù)據(jù)和云計(jì)算為代表的新一代信息技術(shù)的快速發(fā)展,互聯(lián)網(wǎng)正以高效的資源共享和便捷的用戶交互深刻地改變著人類(lèi)生產(chǎn)生活的方方面面。在產(chǎn)品設(shè)計(jì)領(lǐng)域,“互聯(lián)網(wǎng)+”的乘數(shù)效應(yīng)極大地加快了產(chǎn)品設(shè)計(jì)模式的創(chuàng)新,國(guó)內(nèi)外大量眾包平臺(tái)興起,如任務(wù)中國(guó)、威客、豬八戒、Amazon Mechanical Turk、Local Motors等,使得企業(yè)或個(gè)人都可以通過(guò)互聯(lián)網(wǎng)發(fā)布設(shè)計(jì)需求或者參與設(shè)計(jì)過(guò)程,形成了“集眾智匯眾力”的產(chǎn)品設(shè)計(jì)新模式。在這種模式下,企業(yè)或個(gè)人都可以整合吸收平臺(tái)上的各種資源,加快創(chuàng)新速度,從而提高產(chǎn)品研發(fā)的競(jìng)爭(zhēng)力。目前,眾包已經(jīng)成為許多企業(yè)或個(gè)人獲取創(chuàng)新源泉的重要途徑[1]。例如,中國(guó)西部不銹鋼市場(chǎng)在豬八戒平臺(tái)上發(fā)布創(chuàng)意設(shè)計(jì)任務(wù),收集到了900多份創(chuàng)意作品;2014年海爾在HOPE平臺(tái)上發(fā)布空氣凈化器的相關(guān)需求,獲得了來(lái)自世界各地128個(gè)設(shè)計(jì)師的專項(xiàng)設(shè)計(jì),歷時(shí)半年終于成功研發(fā)出空氣魔方產(chǎn)品;2017年海爾通過(guò)HOPE平臺(tái)尋求到了超低溫制冷技術(shù)方案,進(jìn)而在2017年成功將-60℃超低溫冷柜推向市場(chǎng)并大獲成功。由于越來(lái)越多的企業(yè)或個(gè)人通過(guò)互聯(lián)網(wǎng)解決設(shè)計(jì)問(wèn)題,導(dǎo)致眾包平臺(tái)產(chǎn)生海量信息。例如,“一品威客”從2010年創(chuàng)辦至2019年3月,已發(fā)布了760多萬(wàn)個(gè)任務(wù),聚集了1 800多萬(wàn)個(gè)用戶;2019年“豬八戒網(wǎng)”有約300多萬(wàn)個(gè)眾包任務(wù),注冊(cè)用戶達(dá)到2 000多萬(wàn)。平臺(tái)任務(wù)流量過(guò)大使問(wèn)題解決者(Problem Solver,PS)需要花費(fèi)更多時(shí)間和精力才能選擇到合適的任務(wù),如果選擇的任務(wù)并非他所喜歡或者不在其能力范圍內(nèi),不但會(huì)影響最終任務(wù)完成的質(zhì)量,而且會(huì)嚴(yán)重影響PS下一次參與;平臺(tái)PS用戶流量過(guò)大會(huì)使問(wèn)題提出者(Questioner,QR)花費(fèi)更多的時(shí)間和精力來(lái)比較篩選合適的PS,大量的時(shí)間成本降低了QR參與眾包的熱情,如果得到的任務(wù)解決方案不能滿足其要求,則會(huì)影響QR下一次參與,甚至使QR不再將眾包作為解決問(wèn)題的方式。GEIGER等[2]提出個(gè)性化推薦作為解決該問(wèn)題的方法,然而目前大多數(shù)眾包平臺(tái)并未采用個(gè)性化推薦[3]。因此,眾包平臺(tái)迫切需要采用個(gè)性化推送方式來(lái)滿足廣大平臺(tái)用戶的需求。
眾包按其協(xié)作方式分為合作式眾包和競(jìng)爭(zhēng)式眾包[4],目前國(guó)內(nèi)眾包平臺(tái)大多為競(jìng)爭(zhēng)式,即通過(guò)招標(biāo)或比稿的形式來(lái)完成任務(wù)的眾包。競(jìng)爭(zhēng)式眾包平臺(tái)主要包括PS,QR和平臺(tái)3個(gè)對(duì)象。針對(duì)競(jìng)爭(zhēng)式眾包的個(gè)性化推薦問(wèn)題,相關(guān)學(xué)者做了許多研究。仲秋雁等[5]以PS的個(gè)性化需求為目的建立了融合PS能力和興趣的工人興趣能力模型,依靠協(xié)同過(guò)濾算法計(jì)算PS之間相似度,來(lái)實(shí)現(xiàn)任務(wù)到PS的推薦;SAFRAN等[6]以滿足PS和QR的個(gè)性化需求為目的,引入匹配分?jǐn)?shù),提出向PS推薦QR的前TOP-K任務(wù)推進(jìn)(TOP-K-Task,TOP-K-T)算法以及向QR推薦PS的前TOP-K工人推薦(TOP-K-Worker,TOP-K-W)算法,然而該算法并未全面考慮PS的能力及其參與動(dòng)機(jī),而且計(jì)算任務(wù)之間的相似度比較困難;仲秋雁等[7]從PS的收益偏好、素質(zhì)能力及對(duì)發(fā)包方的信任3個(gè)方面出發(fā),提出考慮PS參與意愿影響因素的競(jìng)爭(zhēng)式眾包任務(wù)推薦方法,然而該方法并未考慮QR對(duì)PS能力的要求;AMBATI等[8]建立了基于技能和興趣的隱式模型,然后向PS建議任務(wù),但并未考慮PS和QR的雙向選擇性。因此,亟待一種能夠客觀評(píng)價(jià)PS能力并能衡量其參與動(dòng)機(jī)的推薦算法。
本文針對(duì)產(chǎn)品設(shè)計(jì)眾包的個(gè)性化推薦問(wèn)題,基于任務(wù)類(lèi)別和PS的歷史信息提出雙向推薦算法。首先,建立任務(wù)模型、PS的能力模型和參與意愿模型。然后,根據(jù)任務(wù)類(lèi)別和PS的技能標(biāo)簽匹配到對(duì)應(yīng)的任務(wù)原始集和PS原始集,對(duì)于匹配到的任務(wù)原始集,將基于PS的參與意愿模型向其推薦QR;對(duì)于PS原始集,則在集合內(nèi)部進(jìn)行能力評(píng)價(jià),按最終的量化排序結(jié)果向QR推薦PS。實(shí)驗(yàn)表明,本文所提算法的綜合推薦效率較優(yōu)。
產(chǎn)品設(shè)計(jì)眾包分為大眾參與設(shè)計(jì)或直接由大眾進(jìn)行產(chǎn)品設(shè)計(jì)兩種類(lèi)型[9]。大眾參與設(shè)計(jì)即由QR先給出初始設(shè)計(jì)方案,再由眾包平臺(tái)或眾包社區(qū)中的人員對(duì)方案提出建議,或?qū)π膬x的設(shè)計(jì)方案進(jìn)行投票,目前多數(shù)企業(yè)采用這種方法,從而使其產(chǎn)品的終端用戶能夠?qū)⒆约旱南敕ê蛣?chuàng)意反饋給企業(yè)。直接由大眾進(jìn)行設(shè)計(jì)即直接將產(chǎn)品設(shè)計(jì)需求作為任務(wù)發(fā)包給大眾,由大眾完成產(chǎn)品設(shè)計(jì),并由企業(yè)支付相應(yīng)的報(bào)酬,如今絕大部分眾包平臺(tái)上的設(shè)計(jì)任務(wù)都采用這種模式,其流程如圖1所示。QR提出設(shè)計(jì)需求并設(shè)置獎(jiǎng)勵(lì)提交給眾包平臺(tái),眾包平臺(tái)根據(jù)任務(wù)所需技能將設(shè)計(jì)任務(wù)分解為若干小任務(wù)發(fā)布在平臺(tái)上,吸引PS參與競(jìng)標(biāo),同時(shí)平臺(tái)根據(jù)PS的技能標(biāo)簽將其分類(lèi),通過(guò)匹配規(guī)則將設(shè)計(jì)需求和PS結(jié)合。PS參與競(jìng)標(biāo)提出設(shè)計(jì)方案,平臺(tái)將設(shè)計(jì)方案反饋給QR,QR選擇最滿意的設(shè)計(jì)方案反饋給平臺(tái),平臺(tái)再給予PS獎(jiǎng)勵(lì)。在PS選擇設(shè)計(jì)任務(wù)競(jìng)標(biāo)階段,即圖1中的資源匹配部分,目前大多數(shù)眾包平臺(tái)都僅為用戶提供了搜索或者過(guò)濾機(jī)制來(lái)獲取任務(wù),沒(méi)有考慮任務(wù)的固有特性以及用戶的參與意愿和能力大小[10]。
當(dāng)設(shè)計(jì)任務(wù)過(guò)于復(fù)雜時(shí),本文設(shè)計(jì)的產(chǎn)品設(shè)計(jì)眾包流程可能需要PS和設(shè)計(jì)需求多次匹配,對(duì)平臺(tái)管控形成巨大的挑戰(zhàn)。傳統(tǒng)單向QR到PS的推薦不能滿足這種眾包模式,低效的匹配會(huì)使平臺(tái)對(duì)整個(gè)眾包流程的管理滯后,降低平臺(tái)對(duì)眾包設(shè)計(jì)過(guò)程管控的效率。在眾包平臺(tái)上,匹配規(guī)則只有體現(xiàn)了PS和QR的個(gè)性化需求,才能提高匹配效率,因此采用雙向推薦能夠滿足QR和PS的個(gè)性化需求。本文研究的是圖1中的資源匹配部分,其個(gè)性化主要體現(xiàn)在:PS希望所選擇的任務(wù)能夠滿足其喜好(也稱參與動(dòng)機(jī));QR希望其需求能夠被能力強(qiáng)且有意愿參加的PS來(lái)解答。眾包平臺(tái)流量也會(huì)影響資源匹配的時(shí)效性,因此所提出的推薦算法最好可以線下運(yùn)算,以避免線上運(yùn)行降低任務(wù)和PS的匹配效率。
為了解決資源匹配階段相關(guān)因素對(duì)推薦的影響,本文利用技能標(biāo)簽和任務(wù)類(lèi)別一一對(duì)應(yīng)的關(guān)系建立PS和QR的聯(lián)系,以滿足PS和QR對(duì)推薦內(nèi)容的個(gè)性化需求,建立衡量PS能力大小和參與動(dòng)機(jī)的模型,同時(shí)借鑒基于內(nèi)容的推薦方法,完成了QR和PS的雙向推薦。
基于內(nèi)容的推薦[11]是以用戶的歷史信息作為依據(jù),不用參考其他用戶群,直接為用戶推薦與其歷史信息相似的信息。該推薦方法分為3個(gè)步驟:①抽取每個(gè)任務(wù)的特征,如任務(wù)類(lèi)型、任務(wù)賞金等;②利用PS的歷史數(shù)據(jù)學(xué)習(xí)其對(duì)任務(wù)的喜好程度;③根據(jù)任務(wù)的特征和PS對(duì)任務(wù)的喜好程度進(jìn)行推薦?;趦?nèi)容的推薦的優(yōu)點(diǎn)[12]在于:①任務(wù)和PS的特征均來(lái)自自身,在一定程度上能夠避免新任務(wù)的冷啟動(dòng)問(wèn)題;②其推薦結(jié)果的解釋性強(qiáng)。然而,該算法也存在難以區(qū)分推薦內(nèi)容質(zhì)量的高低、不能發(fā)現(xiàn)用戶新的興趣等弊端。在競(jìng)爭(zhēng)式眾包中,QR從眾多PS提交的方案中選擇最為滿意的一個(gè)或幾個(gè),然后支付賞金給相關(guān)PS,該過(guò)程體現(xiàn)了PS能力的差異,最終被采納的任務(wù)解決方案必定是高質(zhì)量的。在大多數(shù)情況下,僅依靠PS的興趣愛(ài)好并不能讓其方案脫穎而出[13],即短時(shí)間培養(yǎng)起來(lái)的興趣愛(ài)好不具備有效的競(jìng)爭(zhēng)力。因此,可以通過(guò)排序來(lái)區(qū)分推薦內(nèi)容的質(zhì)量,而新的興趣愛(ài)好可以在眾包平臺(tái)上定期補(bǔ)充填寫(xiě)技能標(biāo)簽。
參考基于內(nèi)容的推薦算法建模流程,建立如圖2所示的推薦方法框架。該框架由PS到QR推薦(簡(jiǎn)稱PStoQR)、QR到PS推薦(簡(jiǎn)稱QRtoPS)兩條推薦路線和3個(gè)模型組成,其中3個(gè)模型是完成推薦的基礎(chǔ)。本文通過(guò)提取任務(wù)的編號(hào)、賞金、類(lèi)別、所屬PS編號(hào)等相關(guān)屬性建立任務(wù)模型;基于參與動(dòng)機(jī)理論研究,建立通過(guò)隱式方式表達(dá)的參與動(dòng)機(jī)模型;以KSAO模型,即從知識(shí)(knowledge)、技能(skill)、能力(ability)和其他特征(other)4部分建立顯式方法和隱式方法相結(jié)合表達(dá)的面向競(jìng)爭(zhēng)式眾包的能力模型。建立好任務(wù)模型、參與動(dòng)機(jī)模型和能力模型后,再根據(jù)任務(wù)類(lèi)別和技能標(biāo)簽一一對(duì)應(yīng)的關(guān)系,分別匹配到QR集合和PS集合。在QRtoPS中,將初步匹配到的QR集合按參與動(dòng)機(jī)的優(yōu)先級(jí)排序后推薦給PS;在PStoQR中,對(duì)初步匹配到的PS集合中的PS按能力大小排序后推送給QR。
2.3.1 任務(wù)模型
PS擁有完成任務(wù)所需要的技能是推送的關(guān)鍵[14]。在豬八戒平臺(tái)上,QR在發(fā)布任務(wù)時(shí)需要選擇任務(wù)類(lèi)型,該處的任務(wù)類(lèi)型與PS的技能標(biāo)簽一一對(duì)應(yīng)。對(duì)于不提供任務(wù)類(lèi)型選擇的平臺(tái),機(jī)器學(xué)習(xí)則是一種很好的解決方法。任務(wù)的描述性文本是眾包任務(wù)分類(lèi)的信息來(lái)源,有關(guān)文本的分類(lèi)方法已有許多研究,例如ZHOU等[15]提出一種基于語(yǔ)義擴(kuò)展的高性能短文本算法。另外,在分類(lèi)效果不理想時(shí),可以采用人工在線標(biāo)注的方式來(lái)提高分類(lèi)準(zhǔn)確率。針對(duì)提供任務(wù)類(lèi)型選擇并且任務(wù)標(biāo)簽和技能標(biāo)簽有對(duì)應(yīng)關(guān)系的則簡(jiǎn)化了數(shù)據(jù)上的處理,即可以直接提取任務(wù)m所屬的類(lèi)別i、賞金Mrm、QR編號(hào)IDQR和任務(wù)編號(hào)IDm,如式(1)所示。
Tm=(i,Mrm,IDQR,IDm);
(1)
T=(T1,T2,…,Tm,…)。
(2)
式中:Tm表示任務(wù)m的模型;T表示所有任務(wù)集合。
2.3.2 參與動(dòng)機(jī)模型
ZHAO等[16]認(rèn)為PS對(duì)任務(wù)的整體偏好是因?yàn)槿蝿?wù)符合其參與動(dòng)機(jī)。參與動(dòng)機(jī)被劃分為外部動(dòng)機(jī)和內(nèi)部動(dòng)機(jī)[17],外部動(dòng)機(jī)包括獲得任務(wù)報(bào)酬、獲得名譽(yù)或聲望、獲得工作機(jī)會(huì)等,內(nèi)部動(dòng)機(jī)包括提升技能或能力、自我滿足、參與樂(lè)趣、社會(huì)交往等。參與動(dòng)機(jī)類(lèi)型眾多,但相關(guān)研究[18]表明,PS的興趣愛(ài)好、任務(wù)的獎(jiǎng)金刺激及其認(rèn)為該任務(wù)是否對(duì)個(gè)人能力有鍛煉是主要?jiǎng)訖C(jī),即任務(wù)是否為其所喜歡的類(lèi)型、任務(wù)的賞金是否滿足其對(duì)賞金的預(yù)期、任務(wù)是否對(duì)其能力有鍛煉。現(xiàn)需要對(duì)以上3種動(dòng)機(jī)進(jìn)行量化,JIN等[20]認(rèn)為可以采用顯式方法、隱式方法或者兩者相結(jié)合獲取信息來(lái)構(gòu)建模型,基于此建立了如式(4)所示的參與動(dòng)機(jī)模型。因?yàn)镻S鍛煉能力的目的是增強(qiáng)其自身的能力[19],能力要得到鍛煉就需要經(jīng)過(guò)多次訓(xùn)練,所以用各個(gè)類(lèi)型任務(wù)的投標(biāo)次數(shù)表示PS對(duì)不同類(lèi)型任務(wù)渴望得到能力鍛煉的程度。式(4)中的Xj,i表示PSj在i類(lèi)型任務(wù)下的投標(biāo)次數(shù)。再統(tǒng)計(jì)出PSj在各種類(lèi)型任務(wù)下不同賞金的投標(biāo)次數(shù),用期望表示在各個(gè)類(lèi)型任務(wù)下PS對(duì)任務(wù)賞金的預(yù)期。Avgj,i表示PSj對(duì)i類(lèi)型任務(wù)賞金的預(yù)期,如式(3)所示。tk表示在i類(lèi)型任務(wù)下任務(wù)賞金為rk的投標(biāo)次數(shù),共有m種賞金額度。ci表示PSj喜歡的任務(wù)類(lèi)型。Pwj,i表示PSj對(duì)i類(lèi)型任務(wù)的整體偏好,Pwj,i表示PSj對(duì)任務(wù)i的整體偏好,如式(5)所示。
(3)
Pwj,i=(Xj,i,Avgj,i,ci);
(4)
Pwj=(Pmj,1,Pmj,2,…,Pmj,i,…)。
(5)
2.3.3 能力模型
適用于眾包模式的能力模型,已經(jīng)有相關(guān)學(xué)者進(jìn)行了研究,仲秋雁等[5]將勝任力KSAO模型引入眾包模式,將PS對(duì)任務(wù)的勝任力按知識(shí)、技能、能力和其他特征4個(gè)方面來(lái)建模;劉景方等[21]將眾包人才交流過(guò)程中產(chǎn)生的信息進(jìn)行文本聚類(lèi),經(jīng)過(guò)分析得到眾包人才的5種能力特征,并通過(guò)實(shí)驗(yàn)驗(yàn)證了方法的有效性;呂英杰等[22]通過(guò)總結(jié)和分析前人[19]勝任力模型形成眾包知識(shí)型人才指標(biāo)評(píng)價(jià)體系,在此基礎(chǔ)上采用基于理想解相似度順序偏好法(Technique for Order Preference by Similarity to Ideal Solution,TOPSIS)的多指標(biāo)決策算法對(duì)人才進(jìn)行優(yōu)劣評(píng)價(jià)并排序。參考上述文獻(xiàn),考慮到評(píng)價(jià)指標(biāo)的科學(xué)性、系統(tǒng)性和可操作性[23],本文從技能和能力兩方面構(gòu)建能力模型,如圖3所示。
能力模型是從PS的知識(shí)面廣度和知識(shí)深度兩個(gè)方面建模。技能建模指對(duì)PSj的技能進(jìn)行標(biāo)簽化,表示PSj知識(shí)的覆蓋面,技能建模中的所有技能標(biāo)簽均來(lái)自PSj的個(gè)人信息。建立一個(gè)維度等于所有技能標(biāo)簽數(shù)的模型Kj來(lái)表示PSj的知識(shí)廣度,即
Kj=(h1,h2,…,hi)。
(6)
式中hi為i技能標(biāo)簽名稱。
能力評(píng)價(jià)模型是從信譽(yù)和知識(shí)能力兩個(gè)方面綜合衡量PSj在i技能標(biāo)簽下的能力,該模型用7個(gè)指標(biāo)描述PSj在i技能標(biāo)簽的能力。YANG等[24]認(rèn)為在歷史任務(wù)中勝出率較高的人才在后續(xù)參與的任務(wù)中仍然有較高的勝出率,因此以PSj的歷史數(shù)據(jù)為依據(jù),分別提取PSj在各個(gè)技能標(biāo)簽下的入圍數(shù)、中標(biāo)數(shù)和任務(wù)賞金總數(shù),表示在各個(gè)技能標(biāo)簽下PSj的知識(shí)能力Kaj,即
Kaj=(Smj,Sj,Bj)。
(7)
Smj=(M1,M2,…,Mi);
(8)
Sj=(s1,s2,…,si);
(9)
Bj=(w1,w2,…,wi)。
(10)
式中:Smj為任務(wù)的賞金總數(shù)向量,Mi為PSj在i技能下所獲任務(wù)的賞金總數(shù);Sj為入圍的個(gè)數(shù)向量,si為PSj在i技能下入圍的次數(shù);Bj為中標(biāo)的個(gè)數(shù)向量,wi為PSj在i技能下中標(biāo)的次數(shù)。
反饋評(píng)價(jià)一直是電子商務(wù)環(huán)境中提高賣(mài)方聲譽(yù)、建立信任機(jī)制的主要手段[25]。在眾包中信譽(yù)尤為重要,QR將任務(wù)托付給PS,并規(guī)定完成任務(wù)的截止時(shí)間,QR希望PS在規(guī)定的時(shí)間內(nèi)交出滿意的任務(wù)解決方案。如果PS的信譽(yù)較差,未在規(guī)定的時(shí)間內(nèi)完成任務(wù)或者完成的任務(wù)質(zhì)量未達(dá)到QR的心理預(yù)期,不但影響PS的最后收益,而且影響QR下一次參與的興趣,甚至導(dǎo)致QR對(duì)眾包平臺(tái)不信任,不再選擇眾包方式來(lái)解決問(wèn)題。對(duì)于PS的信譽(yù),可以通過(guò)好評(píng)率、完成態(tài)度評(píng)分、完成速度評(píng)分和完成質(zhì)量評(píng)分等顯式指標(biāo)反映。完成速度評(píng)分、完成質(zhì)量評(píng)分和完成態(tài)度評(píng)分是PSj在完成任務(wù)后,QR對(duì)其完成任務(wù)情況的綜合評(píng)分,表示QR對(duì)PS的滿意程度;好評(píng)率Pr為百分?jǐn)?shù);其他能力的向量表達(dá)為
Cj=(Pr,Ss,Qs,As),
(11)
Csj=(IDp,Kj,Kaj,Cj),
(12)
Cs=(Cs1,Cs2,…,Csj,…)。
(13)
式中:Csj為PSj的能力模型;IDp為PS的編號(hào)。式(13)表示所有PS的能力模型。
將PS推薦給QR就是通過(guò)匹配規(guī)則將適合任務(wù)的PS推薦給QR。因?yàn)榧寄軜?biāo)簽和任務(wù)類(lèi)型一一對(duì)應(yīng),所以可以通過(guò)該關(guān)系完成推薦。首先,以式(1)為基準(zhǔn),將式(13)中各個(gè)PS所擁有的技能標(biāo)簽和式(1)中的任務(wù)類(lèi)型進(jìn)行對(duì)比。例如:如果PSj擁有完成任務(wù)m的技能標(biāo)簽,則將PSj加入P,P表示有能力完成任務(wù)m的PS集合,然后對(duì)PS集合P的能力進(jìn)行排序。
為了能更清楚地展示在能力評(píng)價(jià)中如何應(yīng)用熵權(quán)法,現(xiàn)給出用熵權(quán)法評(píng)價(jià)PS能力的步驟。xji表示PSj在第i項(xiàng)的評(píng)價(jià)指標(biāo)下的值,共m個(gè)PS、7個(gè)評(píng)價(jià)指標(biāo)。
(1)將原始數(shù)據(jù)進(jìn)行歸一化
因?yàn)樵诒驹u(píng)價(jià)體系下,評(píng)價(jià)值和最終的推薦成正相關(guān),所以采用大為優(yōu)的歸一化公式
(14)
式中pji為PSj在第i項(xiàng)評(píng)價(jià)指標(biāo)下歸一化后的值。
(2)計(jì)算第i項(xiàng)的評(píng)價(jià)指標(biāo)的熵值ei
(15)
(3)計(jì)算第i項(xiàng)指標(biāo)的差異性系數(shù)gi
面向分布式主體的可交易能源系統(tǒng):體系架構(gòu)、機(jī)制設(shè)計(jì)與關(guān)鍵技術(shù)//陳啟鑫,王克道,陳思捷,夏清//(3):1
對(duì)于給定的i,xji的差異性越小,ei越大;當(dāng)xji全部相等時(shí),ei=emax=1,此時(shí)對(duì)于方案的比較,指標(biāo)ei毫無(wú)作用;當(dāng)各方案的指標(biāo)值相差越大時(shí),ei越小,該項(xiàng)指標(biāo)對(duì)方案比較所起的作用越大。定義差異性系數(shù)
gi=1-ei,
(16)
gi越大,指標(biāo)越重要。
(4)定義權(quán)數(shù)
(17)
(5)計(jì)算綜合經(jīng)濟(jì)效益系數(shù)vj
(18)
vi為PSj在技能標(biāo)簽i下的綜合評(píng)價(jià)值。
能力評(píng)價(jià)的對(duì)象是具有同一類(lèi)技能標(biāo)簽的PS集合,當(dāng)PS具有多種技能標(biāo)簽時(shí),需要重復(fù)以上能力評(píng)價(jià)步驟,然后得到相關(guān)的能力大小排序。另外,能力評(píng)價(jià)的運(yùn)算可以線下進(jìn)行,因此可以節(jié)約大量的算法運(yùn)行時(shí)間,增強(qiáng)了推薦的實(shí)效性。在完成權(quán)值計(jì)算后,將綜合評(píng)價(jià)值vi降序排列,向QR進(jìn)行前TOP-N的PS推薦。
以式(12)為基準(zhǔn),將式(2)中各個(gè)任務(wù)的任務(wù)類(lèi)型和式(12)中PSj的技能標(biāo)簽進(jìn)行對(duì)比。例如,如果PSj擁有完成任務(wù)m的技能標(biāo)簽,則將任務(wù)m加入T,T表示PSj有興趣的任務(wù)集合。
情況1歷史數(shù)據(jù)稀疏,PS在注冊(cè)時(shí)填寫(xiě)的技能標(biāo)簽即為推薦的依據(jù),直接將集合T中的任務(wù)隨機(jī)推送給PS。
情況2歷史數(shù)據(jù)不稀疏,則根據(jù)PS的參與意愿模型推送任務(wù)。YE等[27]討論了參與任務(wù)的動(dòng)機(jī),在其結(jié)論中金錢(qián)的回報(bào)是一個(gè)非常重要的影響因素。首先,從任務(wù)集合T中篩選出任務(wù)的賞金大于或等于Avgj,i的任務(wù),形成任務(wù)集合T′;然后以投標(biāo)次數(shù)作為排序規(guī)則降序排列任務(wù);最后按TOP-N的方式將排序后的任務(wù)推薦給PSj。當(dāng)篩選出來(lái)的任務(wù)集合T′為空集或集合內(nèi)的元素太少時(shí),為情況1。
采用對(duì)比實(shí)驗(yàn)驗(yàn)證本文方法的有效性。對(duì)比的推薦方法如下:①傳統(tǒng)的基于內(nèi)容的推薦算法,即僅依靠任務(wù)類(lèi)別和PS的技能標(biāo)簽進(jìn)行任務(wù)和PS的雙向推薦;②文獻(xiàn)[5]提到的TOP-K-W算法和TOP-K-T算法。對(duì)比實(shí)驗(yàn)采用相同的數(shù)據(jù)集對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行對(duì)比分析。
本文的實(shí)驗(yàn)數(shù)據(jù)來(lái)源于眾包平臺(tái)Z在實(shí)際運(yùn)行中產(chǎn)生的真實(shí)數(shù)據(jù),涉及1 879項(xiàng)任務(wù)、2 100項(xiàng)投標(biāo)記錄和1 307個(gè)PS,最終得到的數(shù)據(jù)集為:1 307位PS的信息,包括PS名稱、PS的技能標(biāo)簽、好評(píng)率、完成質(zhì)量評(píng)分、完成態(tài)度評(píng)分、完成速度評(píng)分等;1 307位PS各自的入圍任務(wù)集合和中標(biāo)任務(wù)集合,包括任務(wù)編號(hào)、任務(wù)類(lèi)型、任務(wù)報(bào)酬、入圍次數(shù)、中標(biāo)次數(shù)等;1 879項(xiàng)任務(wù)的信息,包括任務(wù)編號(hào)、任務(wù)報(bào)酬、任務(wù)類(lèi)型等。將從眾包平臺(tái)Z中爬取下來(lái)的真實(shí)數(shù)據(jù)以8∶2的比例隨機(jī)分為訓(xùn)練集和測(cè)試集。
本文采用推薦系統(tǒng)中普遍適用的準(zhǔn)確率Precision、召回率Recall和F值對(duì)最終的預(yù)測(cè)結(jié)果進(jìn)行度量,F值由準(zhǔn)確率和召回率組成:
(19)
(20)
(21)
在不同推薦路線中,Ri和Li的含義不同。在QRtoPS中,Ri為用戶PSi的投標(biāo)記錄列表,Li為QR推薦列表,|Li|為QR推薦列表的長(zhǎng)度,|Ri|為用戶PSi的投標(biāo)記錄列表長(zhǎng)度,n為需要為其推薦的PS數(shù)量。在PStoQR中,Ri為QRi的被投標(biāo)記錄列表,Li為PS推薦列表,|Li|為PS推薦列表的長(zhǎng)度,|Ri|為任務(wù)QRi的被投標(biāo)記錄列表長(zhǎng)度,n為需要為之推薦的QR數(shù)量。
首先建立眾包任務(wù)模型,該模型包括任務(wù)類(lèi)型、任務(wù)所屬Q(mào)R編號(hào)、任務(wù)的賞金和任務(wù)的編號(hào),所建立的任務(wù)模型部分?jǐn)?shù)據(jù)如表1所示。
表1 任務(wù)模型部分?jǐn)?shù)據(jù)
(1)PStoQR
首先建立PS的能力模型,該模型包括技能模型和能力評(píng)價(jià)兩部分,所建立的能力模型部分?jǐn)?shù)據(jù)如表2所示。
表2 能力模型部分?jǐn)?shù)據(jù)
在建立PS的能力模型和眾包任務(wù)模型后,根據(jù)技能標(biāo)簽將眾包任務(wù)匹配到能夠完成任務(wù)的PS集合,然后采用熵權(quán)法對(duì)PS進(jìn)行評(píng)價(jià),表3所示為技能標(biāo)簽為工具軟件的部分評(píng)價(jià)PS能力的數(shù)據(jù)。技能評(píng)分后再根據(jù)效益值向QR推薦所對(duì)應(yīng)的PS。
表3 能力評(píng)價(jià)后的部分?jǐn)?shù)據(jù)
(2)QRtoPS
PS動(dòng)機(jī)模型部分?jǐn)?shù)據(jù)如表4所示。首先根據(jù)PS參與動(dòng)機(jī)模型與任務(wù)模型中的技能標(biāo)簽匹配關(guān)系,得到PS能完成的任務(wù)集合,以參與動(dòng)機(jī)模型中的期望為篩選條件過(guò)濾出賞金大于或等于PS期望賞金的任務(wù),再以入圍次數(shù)作為排序條件對(duì)任務(wù)進(jìn)行排序,然后向PS進(jìn)行任務(wù)推薦。當(dāng)適合PS的任務(wù)數(shù)量過(guò)少時(shí),只能依靠技能標(biāo)簽推送。
表4 參與動(dòng)機(jī)模型的部分?jǐn)?shù)據(jù)
本實(shí)驗(yàn)從PStoQR和QRtoPS兩方面討論實(shí)際推薦效果。因?yàn)槿蝿?wù)推薦結(jié)果采用前TOP-N的推薦形式,所以推薦列表長(zhǎng)度N的取值也會(huì)影響推薦效果,為此將N作為變量來(lái)觀察評(píng)價(jià)值的變化。
本文以Python 3.7為編程語(yǔ)言,PyCharm 2019為編譯器,進(jìn)行實(shí)驗(yàn)驗(yàn)證。
(1)QRtoPS過(guò)程 其準(zhǔn)確率和召回率的變化如圖4和圖5所示??梢?jiàn),TOP-K-W和傳統(tǒng)算法在準(zhǔn)確率和召回率上各有千秋,準(zhǔn)確率上TOP-K-W大于傳統(tǒng)算法,召回率則反之;隨著N值的增大,QRtoPS算法的準(zhǔn)確率和召回率始終高于其他兩種算法,表明本文算法無(wú)論查準(zhǔn)率還是覆蓋性均優(yōu)于其他兩種算法。各算法的F值如圖6所示,可見(jiàn)本文算法的F值始終大于其他兩種算法。在本文數(shù)據(jù)集中,QR的被投標(biāo)記錄大多小于5,當(dāng)N=5時(shí),F取得最大值。QRtoPS過(guò)程3種評(píng)價(jià)值的平均值如表5所示。
表5 QRtoPS過(guò)程3種評(píng)價(jià)值的平均值
(2)PStoQR過(guò)程 其準(zhǔn)確率和召回率的變化如圖7和圖8所示??梢?jiàn)隨著N值的增大,PStoQR算法的準(zhǔn)確率處于其他兩種算法之間,但是召回率一直處于領(lǐng)先地位;雖然TOP-K-W算法在準(zhǔn)確率上最高,但是召回率卻最低;PStoQR的召回率隨N值變化始終高于其他兩種算法。圖9所示為召回率和準(zhǔn)確率共同作用下F值的變化趨勢(shì),可見(jiàn)本文算法在推薦長(zhǎng)度N<20時(shí)優(yōu)于其他兩種算法。數(shù)據(jù)集中PS的投標(biāo)記錄大多小于5,當(dāng)N=5時(shí),F取得最大值。PStoQR過(guò)程3種評(píng)價(jià)值的平均值如表6所示。
表6 PStoQR過(guò)程3種評(píng)價(jià)值的平均值
針對(duì)競(jìng)爭(zhēng)式眾包的產(chǎn)品設(shè)計(jì)任務(wù),考慮問(wèn)題解決者能力和參與動(dòng)機(jī),本文基于標(biāo)簽匹配提出一種適用于雙向推薦的方法,實(shí)驗(yàn)結(jié)果表明,本文所提雙向推薦方法不但有效,而且優(yōu)于傳統(tǒng)的基于標(biāo)簽匹配的算法以及考慮匹配分?jǐn)?shù)的TOP-K-T和TOP-K-W算法。本文提出的雙向推薦機(jī)制可以節(jié)約PS發(fā)現(xiàn)任務(wù)所花費(fèi)的時(shí)間,并填補(bǔ)了目前大多數(shù)平臺(tái)只有PS尋找任務(wù)而沒(méi)有QR尋找PS的空白。本文是在完成任務(wù)所需技能標(biāo)簽的基礎(chǔ)上完成推薦,技能可能會(huì)被用于不同領(lǐng)域,下一階段研究將考慮技能應(yīng)用的領(lǐng)域,得到PS在不同領(lǐng)域?qū)寄軕?yīng)用的熟練程度,以此實(shí)現(xiàn)QR和PS更加精確的雙向推薦。
計(jì)算機(jī)集成制造系統(tǒng)2023年10期