黃小根
摘? 要: 在現(xiàn)階段的興趣點(diǎn)推薦模型與算法中,對(duì)于興趣點(diǎn)間的連續(xù)過(guò)渡因素以及區(qū)域影響因素的考量較為忽視,導(dǎo)致推薦準(zhǔn)確性的降低?;诖耍疚脑O(shè)計(jì)了一種基于語(yǔ)義位置和區(qū)域劃分的興趣點(diǎn)推薦模型,對(duì)其中的算法展開(kāi)了詳細(xì)的介紹。利用真實(shí)數(shù)據(jù)集進(jìn)行檢測(cè)實(shí)驗(yàn)后,證實(shí)了該模型的有效性。
關(guān)鍵詞: 語(yǔ)義位置;區(qū)域劃分;興趣點(diǎn)推薦模型
【Abstract】: In current interest point recommendation model and algorithm, it has been neglected of considering continuous transition factors between interest points and regional factors, which leads to decrease of recomm endation accuracy. Based on this, the paper designs an interest point recommendation model based on semantic location and region partition, and introduces algorithm in details, and verifies validity of the model with experiments on real data sets.
【Key words】: Semantic location; Region partition; Interest point recommendation model
0? 引言
目前,我國(guó)對(duì)于基于位置的社交網(wǎng)絡(luò)的研究與應(yīng)用更加重視,對(duì)于個(gè)性化的興趣點(diǎn)推薦更為關(guān)注。就現(xiàn)階段的發(fā)展來(lái)看,大眾點(diǎn)評(píng)、美團(tuán)網(wǎng)等都實(shí)現(xiàn)了基于用戶歷史簽到記錄而展開(kāi)個(gè)性化的興趣點(diǎn)推薦。在這樣的方式下,不僅能夠?yàn)橛脩魩?lái)更好的社交體驗(yàn),還能為相應(yīng)的企業(yè)或商家?guī)?lái)更多的經(jīng)濟(jì)利益。但是,在現(xiàn)有的興趣點(diǎn)推薦模型中,還存在著推薦結(jié)果準(zhǔn)確性不高的問(wèn)題,對(duì)于時(shí)間、地理位置等的考量并不全面??梢钥闯觯_(kāi)發(fā)出一款基于語(yǔ)義位置和區(qū)域劃分的興趣點(diǎn)推薦模型有著較高的實(shí)用價(jià)值。
1? 興趣點(diǎn)推薦的主流技術(shù)分析
1.1? 多特征融合的興趣點(diǎn)推薦算法
現(xiàn)階段,興趣點(diǎn)推薦的常用算法能夠分成以下三類(lèi):
第一,直接使用傳統(tǒng)推薦算法。在這一類(lèi)的算法中,普遍使用了用戶興趣點(diǎn)的簽到次數(shù)作為偏好程度的指標(biāo),并構(gòu)建起了用戶-興趣點(diǎn)簽到矩陣,結(jié)合傳統(tǒng)的推薦算法實(shí)現(xiàn)了興趣點(diǎn)推薦。這一類(lèi)算法主要包括基于正則化矩陣分解算法、基于用于與興趣點(diǎn)的混合協(xié)同算法、概率矩陣分解算法等等。對(duì)于這類(lèi)算法來(lái)說(shuō),由于其數(shù)據(jù)集不夠密集,所以推薦的質(zhì)量相對(duì)較低。
第二,引入地理因素的興趣點(diǎn)推薦算法。在這一類(lèi)算法中,融合了用戶與興趣點(diǎn)的地理距離,將其也視為推薦的一項(xiàng)指標(biāo)。目前,普遍使用了多中心高斯分布模型加入算法,提升了興趣點(diǎn)推薦的效果。
第三,引入社交影響的推薦算法。這一類(lèi)算法中,將社交網(wǎng)絡(luò)中的“朋友”有著相同興趣作為了前提,結(jié)合朋友的簽到歷史記錄,完成了興趣點(diǎn)推薦。在該類(lèi)算法中,對(duì)于地理因素較為忽視。實(shí)踐證明,該類(lèi)算法的興趣點(diǎn)推薦質(zhì)量相對(duì)較低,可以得出,社交關(guān)系對(duì)推薦準(zhǔn)確率的影響較小。
1.2? 基于評(píng)論信息以及地理位置的興趣點(diǎn)推薦技術(shù)
對(duì)于社交網(wǎng)絡(luò)興趣點(diǎn)推薦來(lái)說(shuō),基于評(píng)價(jià)內(nèi)容完成推薦是一項(xiàng)十分有效的方式。通過(guò)分析用戶的評(píng)價(jià)內(nèi)容,能夠準(zhǔn)確的捕捉到用戶的興趣偏好。針對(duì)這樣的理念,有關(guān)研究人員對(duì)用戶評(píng)價(jià)內(nèi)容展開(kāi)建模,完成了用戶興趣相關(guān)特征的采集,提升了興趣點(diǎn)推薦的效果。
為了進(jìn)一步提升該興趣點(diǎn)推薦模型的效果,相關(guān)研究人員也將地理位置因素融入于該模型中,建立起了基于評(píng)價(jià)信息以及地理位置的興趣點(diǎn)推薦模型。在進(jìn)行基于地理位置的興趣點(diǎn)推薦模型中,主要使用了用戶的興趣點(diǎn)歷史簽到地理位置,自動(dòng)生成用戶的地理坐標(biāo),為興趣點(diǎn)推薦提供了參考。在基于評(píng)價(jià)信息以及地理位置的興趣點(diǎn)推薦模型中,雖然參考了用戶興趣偏好以及地理位置,但是,由于評(píng)價(jià)信息的缺乏或準(zhǔn)確性不高,興趣點(diǎn)推薦的實(shí)際效果依舊有待提升[1]。
1.3? 基于混合神經(jīng)網(wǎng)絡(luò)矩陣分解的興趣點(diǎn)推薦模型
隨著人工智能技術(shù)的不斷發(fā)展,其應(yīng)用范圍也更加廣泛。神經(jīng)網(wǎng)絡(luò)作為一種常用的人工智能技術(shù),在興趣點(diǎn)推薦模型的建立中發(fā)揮著較大的優(yōu)勢(shì)。神經(jīng)網(wǎng)絡(luò)為興趣點(diǎn)推薦提供了更多的參考指標(biāo),提升了推薦的質(zhì)量?,F(xiàn)階段,有關(guān)研究人員已經(jīng)建立起了基于混合神經(jīng)網(wǎng)絡(luò)矩陣分解的興趣點(diǎn)推薦模型,在該模型中,利用神經(jīng)網(wǎng)絡(luò)對(duì)用戶和興趣點(diǎn)的初始化參數(shù)進(jìn)行學(xué)習(xí),最終得出了用戶的簽到特征以及興趣點(diǎn)簽到特征。結(jié)合評(píng)論信息的學(xué)習(xí),能夠得出潛在的向量特征,最后完成興趣點(diǎn)評(píng)分的預(yù)測(cè)。
2? 基于語(yǔ)義位置的建模分析
2.1? 實(shí)際需求分析
在基于位置的社交網(wǎng)絡(luò)中,興趣點(diǎn)的推薦主要是用過(guò)對(duì)用戶歷史簽到記錄展開(kāi)分析,并向用戶推薦之前并沒(méi)有訪問(wèn)、且可能感興趣的位置信息。此時(shí),基于位置的社交網(wǎng)絡(luò)中應(yīng)當(dāng)包含用戶在興趣點(diǎn)上的歷史簽到記錄集、用戶集、興趣點(diǎn)集。在基于位置的社交網(wǎng)絡(luò)的體系結(jié)構(gòu)中,包含著大量的用戶、興趣點(diǎn)以及多種社交關(guān)系、用戶與興趣點(diǎn)之間的簽到關(guān)系、興趣點(diǎn)之間的關(guān)聯(lián)關(guān)系等等。在基于語(yǔ)義位置和區(qū)域劃分的興趣點(diǎn)推薦模型的建立中,筆者融合了多種源數(shù)據(jù),并對(duì)用戶未訪問(wèn)的興趣點(diǎn)偏好進(jìn)行預(yù)測(cè)與推薦[2]。
2.2? 用戶偏好的計(jì)算
在進(jìn)行用戶偏好的計(jì)算中,筆者主要使用功了狄利克雷分配算法(LDA算法)。為了對(duì)用戶不同地理位置的時(shí)間偏好進(jìn)行考量,筆者將時(shí)間偏好引入狄利克雷分配算法中,建立起了基于時(shí)間分割的狄利克雷分配算法,完成了用戶偏好的計(jì)算[3]。
4? 基于語(yǔ)義位置和區(qū)域劃分的興趣點(diǎn)推薦模型的分析與驗(yàn)證
4.1? 實(shí)驗(yàn)條件的確定
為了驗(yàn)證該基于語(yǔ)義位置和區(qū)域劃分興趣點(diǎn)推薦模型的真實(shí)性,筆者對(duì)其展開(kāi)了驗(yàn)證實(shí)驗(yàn)。在本次驗(yàn)證實(shí)驗(yàn)中,使用了兩個(gè)真實(shí)的簽到數(shù)據(jù)集。為進(jìn)一步提升本次驗(yàn)證實(shí)驗(yàn)的有效性,在數(shù)據(jù)集中剔除了簽到記錄數(shù)少于5以及簽到興趣點(diǎn)少于80的用戶。最終得出數(shù)據(jù)集A中包含637個(gè)用戶、數(shù)據(jù)集B中包含732個(gè)用戶;數(shù)據(jù)集A中包含80544條簽到記錄、數(shù)據(jù)集B中包含80817條簽到記錄;數(shù)據(jù)集A中包含2756個(gè)興趣點(diǎn)、數(shù)據(jù)集B中包含3827個(gè)興趣點(diǎn)。在這兩個(gè)數(shù)據(jù)集中,隨機(jī)抽取每一名用戶的75%條簽到數(shù)據(jù)作為訓(xùn)練集;25%條簽到數(shù)據(jù)設(shè)為測(cè)試集。
在驗(yàn)證實(shí)驗(yàn)中,筆者對(duì)該基于語(yǔ)義位置和區(qū)域劃分的興趣點(diǎn)推薦模型中包含的相關(guān)參數(shù)進(jìn)行了優(yōu)化確定。設(shè)置主題參數(shù)K為50;時(shí)間段為4;共同參數(shù)α與β的數(shù)值為1和0.01。結(jié)合梯度下降法,能夠得出參數(shù)數(shù)值,具體如下:對(duì)于數(shù)據(jù)集A,使用的參數(shù)、、、、、分別為0.2、0.3、0.5、0.5、0.2、0.5;對(duì)于數(shù)據(jù)集B,使用的參數(shù)、、、、、分別為0.3、0.2、0.6、0.4、0.3、0.2。
為了證明該基于語(yǔ)義位置和區(qū)域劃分的興趣點(diǎn)推薦模型的有效性,筆者使用了推薦準(zhǔn)確率以及召回率作為評(píng)價(jià)指標(biāo),并設(shè)置了“不同興趣點(diǎn)推薦數(shù)量下”以及“不同簽到時(shí)間間隔下”兩種實(shí)驗(yàn)條件[9]。
4.2? 實(shí)驗(yàn)結(jié)果分析
經(jīng)過(guò)實(shí)際的實(shí)驗(yàn)與計(jì)算能夠得出,在不同興趣點(diǎn)推薦數(shù)量的條件下,該基于語(yǔ)義位置和區(qū)域劃分的興趣點(diǎn)推薦模型的準(zhǔn)確率,會(huì)隨著推薦興趣點(diǎn)數(shù)量的增加而有所降低。經(jīng)過(guò)筆者的進(jìn)一步分析發(fā)現(xiàn),造成該結(jié)果的主要原因在于:興趣點(diǎn)推薦數(shù)量的增加會(huì)提升該模型中時(shí)間的復(fù)雜程度。而召回率卻與之相反,在推薦興趣點(diǎn)數(shù)量增加的情況下,召回率有所提升。與ULR(基于用戶的簽到記錄數(shù)據(jù)以及地理信息完成推薦)相比,該模型中包含的所有算法在性能上有著較為明顯的提升。相比于USTTM(基于概率生成模型)來(lái)說(shuō),本文提出的興趣點(diǎn)推薦模型在算法的性能方面有所提升。
在不同簽到時(shí)間間隔的條件下,算法的推薦準(zhǔn)確性以及召回率均有所降低。造成這一情況的主要原因在于,由于用戶移動(dòng)至了遠(yuǎn)離興趣點(diǎn)的位置,所以導(dǎo)致連續(xù)推薦性能的降低。基于此,對(duì)時(shí)間間隔進(jìn)行控制對(duì)于該模型預(yù)測(cè)效果的保證十分重要[10]。
5? 結(jié)束語(yǔ)
綜上所述,在現(xiàn)有的興趣點(diǎn)推薦模型中,并沒(méi)有對(duì)興趣點(diǎn)間的連續(xù)過(guò)渡因素以及區(qū)域影響因素進(jìn)行重點(diǎn)的考量。筆者結(jié)合這一情況,建立起了一種基于語(yǔ)義位置和區(qū)域劃分的興趣點(diǎn)推薦模型,緩解了數(shù)據(jù)密集程度不足的問(wèn)題。經(jīng)過(guò)驗(yàn)證實(shí)驗(yàn),證實(shí)了該模型有著更好的功能優(yōu)勢(shì),證明了該模型的有效。
參考文獻(xiàn)
[1]宋亞偉. 融合時(shí)空特征的興趣點(diǎn)推薦算法研究[D]. 燕山大學(xué), 2016.
[2]常曉雨. 基于位置的社交網(wǎng)絡(luò)中高性能興趣點(diǎn)推薦算法研
究[D]. 杭州電子科技大學(xué), 2016.
[3]王嘯巖, 袁景凌, 秦鳳. 位置社交網(wǎng)絡(luò)中基于評(píng)論文本的興趣點(diǎn)推薦[J]. 計(jì)算機(jī)科學(xué), 2017, 44(12): 245-248+278.
[4]丁順, 陳世平. 云計(jì)算中基于包簇映射的多目標(biāo)蟻群資源分配算法[J]. 軟件, 2018, 39(11): 1-6.
[5]黃金金, 陳晶, 張?chǎng)H. 基于RS-SVM的無(wú)線傳感器網(wǎng)絡(luò)安全的應(yīng)用研究[J]. 軟件, 2018, 39(11): 18-20.
[6]曹妍, 陳偉. 基于MATLAB GUI的指紋圖像增強(qiáng)技術(shù)研究[J]. 軟件, 2018, 39(11): 30-32.
[7]趙璇. 位置服務(wù)中基于k匿名的隱私保護(hù)方法研究[D]. 河北大學(xué), 2018.
[8]劉妍. 面向移動(dòng)對(duì)象角色發(fā)現(xiàn)的行為模式挖掘算法研究[D]. 遼寧大學(xué), 2018.
[9]俞童. 興趣場(chǎng)約束下空間數(shù)據(jù)多尺度智能化表達(dá)研究[D]. 解放軍信息工程大學(xué), 2017.
[10]曾俊. 基于LBS的電子商務(wù)個(gè)性化推薦研究[D]. 湖北工業(yè)大學(xué), 2016.