胡德斌 米春橋
摘要:針對農(nóng)業(yè)信息用戶群,提出一種基于信任的個性化農(nóng)業(yè)信息推薦方法。通過情境感知搜索一組偏好相似的推薦用戶,并通過皮爾遜相關(guān)系數(shù)計算用戶的評價相似度,引入信任機(jī)制,使用戶之間的相似度計算更加準(zhǔn)確,從而為目標(biāo)用戶提供更好的推薦結(jié)果,使推薦信息更為可信。
關(guān)鍵詞:農(nóng)業(yè)信息;推薦技術(shù);個性化;信任機(jī)制
中圖分類號:TP391.1 文獻(xiàn)標(biāo)識碼:A 文章編號:0439-8114(2018)03-0094-03
DOI:10.14088/j.cnki.issn0439-8114.2018.03.023
Abstract: For agricultural information users,a recommendation method for personalized agricultural information based on trust is proposed,and calculate the similarity of users by pearson correlation coefficient,introduce mechanism of trust,the similarity between users is more accurate,better recommendation results for the target user are provided.
Key words: agricultural information; recommendation technology; individuation; mechanism of trust
目前,國家對農(nóng)業(yè)信息技術(shù)日益重視,對農(nóng)業(yè)信息技術(shù)的支持不斷加大,傳統(tǒng)的農(nóng)業(yè)信息服務(wù),面對信息過載等問題不能有效利用和處理海量農(nóng)業(yè)信息,難以滿足農(nóng)業(yè)從業(yè)者多方位的需求。在計算機(jī)技術(shù)、網(wǎng)絡(luò)技術(shù)和智能技術(shù)的推動下,個性化農(nóng)業(yè)信息服務(wù)應(yīng)運而生。個性化信息服務(wù)能根據(jù)用戶模糊的、潛在的需求轉(zhuǎn)化為明確的、現(xiàn)實的需求,通過對環(huán)境、用戶習(xí)慣、個性的分析,進(jìn)而向用戶主動提供其可能需要的信息。推薦系統(tǒng)是一種典型個性化信息服務(wù),可以為用戶推薦感興趣的信息,相對農(nóng)業(yè)用戶而言,極大地簡化了用戶獲得所需要信息的方式。
大部分推薦系統(tǒng)采用了協(xié)同過濾算法[1]來提高推薦質(zhì)量(如淘寶網(wǎng)),這種推薦系統(tǒng)并不分析信息之間的相似性,而是學(xué)習(xí)用戶之間獲取信息行為的相似性,從而根據(jù)相似用戶獲得推薦結(jié)果。研究指出,優(yōu)點是用戶可以發(fā)現(xiàn)新的感興趣的信息而不需要考慮信息本身。缺點是如果用戶對信息的評價矩陣非常稀疏,這樣得到用戶間的相似性可能不準(zhǔn)確,存在“稀疏問題”;如果一直沒有用戶對某一信息進(jìn)行評價,則這個信息就不可能被推薦,存在“冷開始問題”[2]。為此,提出了基于信任模型的協(xié)同過濾推薦算法[3],然而在農(nóng)業(yè)信息推薦領(lǐng)域,由于客戶群體的差異,以上2個問題更為普遍,本研究借鑒電子商務(wù)領(lǐng)域的做法,在協(xié)同過濾推薦算法中引入信任機(jī)制的同時加入了農(nóng)業(yè)情境個性化感知,使目標(biāo)用戶獲得更優(yōu)的最近鄰居集,進(jìn)而獲得更好的推薦效果。
1 農(nóng)業(yè)情境個性化感知
如果一個新用戶從未對系統(tǒng)中的信息項目進(jìn)行評價,就無法獲知其興趣點,無法找到相似用戶,也就不知道推薦什么信息項目給該用戶。一般采用新用戶進(jìn)入系統(tǒng)前,先注冊個人用戶信息來解決新用戶問題,但是如果需要輸入的信息過多,用戶就會放棄使用推薦系統(tǒng)。由于農(nóng)業(yè)用戶群體,整體來講,信息獲取能力較低,信息素質(zhì)不高,不善于網(wǎng)絡(luò)信息的交互,基本上只是被動獲取信息。因此,本研究提出了一種農(nóng)業(yè)情境感知的個性化信息服務(wù)方法,利用現(xiàn)代網(wǎng)絡(luò)技術(shù)和智能技術(shù)自動感知用戶的情境信息,在盡可能減少輸入信息的條件下,預(yù)測用戶的偏好,通過建立農(nóng)業(yè)信息資源分類方法,及時地、有針對性地向用戶主動推薦所需內(nèi)容,更高效地滿足不同農(nóng)業(yè)用戶的個性化需求,提供更靈活、更簡單的信息服務(wù)。
農(nóng)業(yè)情境信息通常包括空間信息、時間信息、氣象信息、用戶行為等[4],通過感知技術(shù)使之能影響業(yè)務(wù)邏輯和頁面顯示,主要分2種類型:一種是基本情境信息,用于描述用戶工作環(huán)境的情境信息;一種是時序情境信息,用于描述用戶在服務(wù)系統(tǒng)中與時間緊密相關(guān)所進(jìn)行的一系列操作。
目前,大部分農(nóng)業(yè)用戶采用移動終端和PC機(jī)獲取信息,分別運用GPS定位和IP定位方式獲得地理位置信息,通過服務(wù)端的系統(tǒng)信息可獲得詳細(xì)的時間分布信息,再利用Web Service技術(shù)獲得氣象等相關(guān)信息。用戶只需輸入少量簡單的注冊用戶信息,通過智能情境感知,可獲得具有個性化的用戶信息,建立更全面的用戶檔案,作為推薦的基礎(chǔ),有效地減少了協(xié)同過濾推薦技術(shù)中經(jīng)常出現(xiàn)的2個問題。
2 基于信任的推薦方法
與傳統(tǒng)推薦系統(tǒng)不同,基于信任的推薦系統(tǒng)通過增加用戶間的評分?jǐn)?shù)據(jù),把推薦系統(tǒng)中的用戶聯(lián)系起來,自然地形成一個社會網(wǎng)絡(luò),形成用戶之間的信任關(guān)系。大部分用戶,尤其是農(nóng)業(yè)用戶群體更相信朋友的推薦。
2.1 相似度計算
基于協(xié)同過濾算法采用比較當(dāng)前用戶與其他用戶的評分,使用皮爾遜相似度方法計算相似度[5]。其中,ra,i表示用戶a對項i的評分;m是a、b兩個共同評分過的項的數(shù)目;ra表示用戶a的平均評分。
2.2 預(yù)測評分
通過預(yù)測評分的高低,向當(dāng)前用戶推薦評分最高的項。鄰居定義為與用戶a相似度較高的一組用戶,其他定義如公式(1)。
這種計算相似度方法,只有在比較多的項目上評分比較相似時,才得出相似度是可信的,但如果用戶評分?jǐn)?shù)據(jù)極端稀疏,此時得出的相似度并不可靠。因此,在協(xié)同過濾推薦算法中引入信任機(jī)制,來改進(jìn)傳統(tǒng)相似度計算方法的不足。
2.3 信任度計算
借鑒大型電子商務(wù)系統(tǒng)(如eBay),如果2個用戶共同對一項目進(jìn)行了評價,就認(rèn)為他們之間進(jìn)行了一次直接交易,通過評價值可以計算兩者之間的直接信任度。一般情況,共同評價的項目會比較少,僅僅用直接信任是不準(zhǔn)確的,另一種情況,如果2個用戶中只有1個用戶對項目進(jìn)行了評價,這樣就無法計算2個用戶的直接信任度,那么可以先對未評價的用戶進(jìn)行預(yù)測項目的評價值,再計算2個用戶的間接信任,這種間接信任可有效地提高用戶間信任的準(zhǔn)確度。用戶之間的信任值可通過借鑒社會網(wǎng)絡(luò)中人之間的信任評價方法進(jìn)行計算:
2.3.1 直接信任度 如果a、b兩個用戶共同對1個項目進(jìn)行了評價,那么就認(rèn)為a、b兩個用戶進(jìn)行了一次交易,a、b兩個用戶的直接信任可以通過a、b兩個用戶共同評價項目的相關(guān)度反映出來。因此,直接信任度計算如下:
2.3.2 間接信任度 假定Ia為用戶a評價的項目集合,Ib為用戶b評價的項目集合,用集合Ia-{Ia∩Ib}作為用戶a評價但用戶b未評價的項目,這種情況,在這些項目上用戶a對用戶b的直接信任程度無法知道,所以用戶b對這些項目需要進(jìn)行預(yù)測。因此,在集合Ia-{Ia∩Ib}項目上,通過用戶a的評價值與用戶b的預(yù)測值,獲得用戶a和用戶b之間的相關(guān)度,從而間接地反映用戶a對用戶b的間接信任度??梢岳霉剑?)的方法獲得沒有評分的項目的預(yù)測值,先進(jìn)行項目之間的相關(guān)度計算,得到最近鄰居,再通過最近鄰居對相關(guān)項目的評分來預(yù)測未評分項目的評分[6]。計算方法:
2.3.3 預(yù)測推薦 可以通過選擇用戶u最信任的k個用戶或信任度值大于指定閥值的用戶作為最近鄰居集合Nu,再通過用戶的最近鄰居集合Nu來預(yù)測在用戶u∈U中未被評價的項目i∈I,計算方法如下:
推薦預(yù)測評分值最高的N個項目給目標(biāo)用戶u。其中,ru表示用戶u對項目的平均評分、rk分別表示用戶k對項目的平均評分;rk,i作
為用戶k對項目i的評分。
3 結(jié)果與分析
試驗時,在TAB=β·Rd+(1-β)Rr公式中選取不同的權(quán)重β值以獲得不同的推薦效果。通過在不同鄰居數(shù)的情況下試驗,取得當(dāng)β=0.8時產(chǎn)生較好的推薦結(jié)果,說明在基于農(nóng)業(yè)信息的推薦中,直接信任占主導(dǎo),用戶更愿意相信朋友。β=0表示只采用間接信任,β=1表示只采用直接信任,相當(dāng)于傳統(tǒng)協(xié)同過濾算法推薦的結(jié)果。比較這2種情況發(fā)現(xiàn),采用直接信任推薦質(zhì)量更好,說明直接信任可信度更高,直接通過朋友的推薦更可信。間接信任度計算因為依賴預(yù)測,因此預(yù)測的準(zhǔn)確度對推薦效果產(chǎn)生了積極的影響。由于本研究引入了情景感知,可以取得更多的項目鄰居數(shù),所以準(zhǔn)確度更高,推薦效果更好。
將傳統(tǒng)的協(xié)同過濾算法與本研究提出的算法進(jìn)行了5次對比試驗,如圖1所示,結(jié)果表明,本研究提出的算法,由于采用了個性化情境感知,又引入了信任機(jī)制,因此獲得了更好的推薦效果。這里相關(guān)度是指用戶需求與推薦結(jié)果的匹配程度。
4 小結(jié)
本研究針對農(nóng)業(yè)用戶群的特點,提出了一種基于信任的個性化農(nóng)業(yè)信息推薦方法,通過情景感知和用戶注冊,獲得更為豐富的用戶信息,簡化了用戶操作的方式。加上信任機(jī)制的引入,通過用戶間的直接信任和間接信任的結(jié)合,使用戶間的相似度計算更準(zhǔn)確,使目標(biāo)用戶能獲得更近的鄰居集,更好地識別和預(yù)測了用戶的興趣偏好,有效地減少了協(xié)同過濾推薦技術(shù)中經(jīng)常出現(xiàn)“稀疏問題”和“冷開始問題”,起到了更好的推薦效果。
參考文獻(xiàn):
[1] ADOMAVICIUS G,TUZHILIN A. Toward the next generation of recommender systems:A survey of the state-of-the-art and possible extensions[J].IEEE Transactions on Knowledge and Data Engineering,2005,17(6):734-749.
[2] 鄧愛林,朱楊勇,施伯樂.基于項目評分預(yù)測的協(xié)同過濾推薦算法[J].軟件學(xué)報,2003,14(9):1621-1628.
[3] 夏小伍,王衛(wèi)平.基于信任模型的協(xié)同過濾推薦算法[J].計算機(jī)工程,2011,37(21):26-28.
[4] 楊寶祝,劉 妍,吳華瑞,等.基于情境感知的個性化農(nóng)業(yè)信息服務(wù)模型研究[J].農(nóng)機(jī)化研究,2012(11):10-13.
[5] 徐 翔,王煦法.協(xié)同過濾算法中的相似度優(yōu)化方法[J].計算機(jī)工程,2010,36(6):52-54.
[6] DESHPANDE M,KARYPIS G. Item-based Top-n recommendation algorithms[J].ACM Transactions on Information Systems,2004,22(1):143-177.