汪 瀅
(南昌師范學(xué)院,江西 南昌 330032)
傳統(tǒng)購買旅游產(chǎn)品的方式是通過銷售人員介紹和推薦旅游產(chǎn)品,從眾多旅游產(chǎn)品中選擇一個適合的旅游產(chǎn)品。為了為客戶提供良好的咨詢服務(wù),相關(guān)學(xué)者設(shè)計開發(fā)了旅游產(chǎn)品個性化推薦系統(tǒng),根據(jù)客戶購買心理和喜好,為客戶推薦適合的旅游產(chǎn)品。但是現(xiàn)有的推薦系統(tǒng)僅根據(jù)其他游客的評分,以及產(chǎn)品的歷史評分?jǐn)?shù)據(jù)推測客戶的旅游喜好,從而為客戶推薦旅游產(chǎn)品,傳統(tǒng)系統(tǒng)未考慮客戶旅游喜好動態(tài)轉(zhuǎn)移的特性,也未根據(jù)客戶的實際情況,比如年齡、性別和學(xué)歷等,為客戶推薦的旅游產(chǎn)品中符合客戶喜好的數(shù)量較少,導(dǎo)致無法滿足客戶對旅游產(chǎn)品個性化需求,傳統(tǒng)系統(tǒng)存在推準(zhǔn)率較低的問題,因此,筆者提出基于區(qū)塊鏈技術(shù)的旅游產(chǎn)品個性化推薦系統(tǒng)研究。
系統(tǒng)的硬件結(jié)構(gòu)主要由旅游產(chǎn)品信息搜索引擎、網(wǎng)絡(luò)瀏覽器以及SVM分類器構(gòu)成,系統(tǒng)的硬件結(jié)構(gòu)如圖1所示。
圖1 推薦系統(tǒng)硬件結(jié)構(gòu)圖
由圖1可知,通過網(wǎng)絡(luò)連接,搜索引擎主動搜索旅游網(wǎng)站信息,由VSM分類器分類處理旅游網(wǎng)站信息,并傳送至服務(wù)器,通過處理、計算和分析信息,將信息傳遞給網(wǎng)絡(luò)瀏覽器顯示,最終使客戶可通過瀏覽器瀏覽旅游產(chǎn)品。
旅游網(wǎng)頁信息搜索引擎的主要作用是獲取旅游網(wǎng)頁信息。根據(jù)旅游產(chǎn)品個性化推薦系統(tǒng)功能要求,本文選擇英國DFGG公司生產(chǎn)的GST-AFT-026型號的網(wǎng)絡(luò)搜索引擎[1]。該搜索引擎以統(tǒng)一資源定位符地址為搜索起點,將統(tǒng)一資源定位符地址加入到搜索列隊,自動啟動一個信息下載線程,從搜索列隊中取出統(tǒng)一資源定位符,自動下載該頁面,并利用SFAGT芯片分析旅游網(wǎng)頁頁面的旅游產(chǎn)品鏈接[2]。再將每個旅游產(chǎn)品網(wǎng)頁鏈接的統(tǒng)一資源定位符加入到搜索列隊中,并重復(fù)上述搜索步驟。搜索引擎每個下載線程均從統(tǒng)一資源定位符中取出一個網(wǎng)頁地址并下載,從而獲取旅游網(wǎng)頁信息。在搜索信息過程中,避免了處理旅游網(wǎng)頁的重定向問題,對旅游網(wǎng)頁信息搜索引擎HTTP協(xié)議的狀態(tài)碼進(jìn)行定義,編輯了101和102兩個狀態(tài)碼,當(dāng)HTTP響應(yīng)Response返回的狀態(tài)碼是101和102時,搜索引擎采用從Location域中取出的統(tǒng)一資源定位符進(jìn)行重新構(gòu)造,將新的統(tǒng)一資源定位符放入到搜索列隊中,對旅游網(wǎng)頁信息進(jìn)行下載,并將下載的信息保存在內(nèi)置的32GB硬盤中。
網(wǎng)絡(luò)瀏覽器的作用是方便用戶瀏覽旅游產(chǎn)品信息,選擇德國西本子公司生產(chǎn)的6AV6362-1AB00網(wǎng)絡(luò)瀏覽器,該瀏覽器輸出頻率可以達(dá)到50 kHz,具備監(jiān)控功能,并可記錄用戶的旅游產(chǎn)品瀏覽時間和瀏覽內(nèi)容[3]。其將用戶瀏覽的旅游信息,按照瀏覽路徑保存到特定的瀏覽目錄,并通過瀏覽器中瀏覽監(jiān)視標(biāo)簽頁中時間符記錄用戶在旅游網(wǎng)頁中的瀏覽時間信息[4]。瀏覽器通過對每個旅游網(wǎng)頁的用戶瀏覽時間間隔求和,得到用戶瀏覽旅游網(wǎng)頁的總時間,利用Content-Type程序自動下載網(wǎng)頁中客戶瀏覽信息,保存至瀏覽器的歷史日志。
旅游產(chǎn)品個性化推薦系統(tǒng)的推薦要素主要分為用戶瀏覽內(nèi)容、瀏覽時間以及操作時間三部分,其中用戶瀏覽時間和瀏覽內(nèi)容兩個要素體現(xiàn)出用戶對某一類旅游產(chǎn)品的興趣;操作時間體現(xiàn)用戶對不同類別旅游產(chǎn)品的興趣。該三個信息對系統(tǒng)實現(xiàn)旅游產(chǎn)品個性化推薦功能非常重要。為了減小系統(tǒng)計算壓力,通過SVM分類器分類搜索引擎和瀏覽器搜索和記錄的信息,根據(jù)需求選擇美國SFA公司生產(chǎn)的FGE-ASFGT-034分布式SVM分類器,將引擎搜索的信息存儲到建立的HTML文檔,并經(jīng)過清洗程序清洗網(wǎng)頁中的純文字信息,進(jìn)而通過html程序?qū)⑺阉餍畔⒑蜑g覽信息,按照用戶瀏覽內(nèi)容、瀏覽時間和操作時間分成三類,并且標(biāo)準(zhǔn)文本的類別,最后經(jīng)過分布式SVM分類器訓(xùn)練生成SVM信息文件。
用戶模型是系統(tǒng)的核心軟件,用于描述、存儲和管理用戶的旅游產(chǎn)品購買興趣和需求,其建立是一個從用戶旅游興趣和行為信息中歸納出可計算的用戶模型過程,通過主題表示法構(gòu)建用戶模型,假設(shè)用戶的旅游興趣為一個n維的特征向量,特征向量由用戶搜索關(guān)鍵詞和關(guān)鍵詞的權(quán)重組成,權(quán)重表示用戶對某一旅游產(chǎn)品概念感興趣的程度。用用戶搜索關(guān)鍵詞和關(guān)鍵詞權(quán)重三元組表示模型中用戶旅游興趣節(jié)點,假設(shè)用戶有m個旅游興趣節(jié)點,則構(gòu)建的用戶模型如下:
式中,F(xiàn)為用戶旅游興趣模型;f為用戶旅游興趣的特征項;(k1,w1,t1)為用戶旅游興趣的第1個特征節(jié)點;k為用戶輸入系統(tǒng)的關(guān)鍵詞;w為關(guān)鍵詞的權(quán)重;t為用戶最近一次搜索關(guān)鍵詞的更新時間。利用上述模型描述用戶對旅游產(chǎn)品的喜好和興趣。
本文通過區(qū)塊鏈技術(shù)建立系統(tǒng)數(shù)據(jù)庫,分類存儲旅游產(chǎn)品信息,提高安全性和完整性。按照旅游景區(qū)級別和非物質(zhì)文化遺產(chǎn)等分類信息,利用區(qū)塊鏈技術(shù)將信息分成六類,建立3A級旅游產(chǎn)品信息、4A級旅游產(chǎn)品信息、5A級旅游產(chǎn)品信息、歷史文化旅游產(chǎn)品信息、政治文化旅游產(chǎn)品信息、非物質(zhì)文化旅游產(chǎn)品信息六個區(qū)塊節(jié)點,由六個區(qū)塊節(jié)點構(gòu)建系統(tǒng)數(shù)據(jù)庫[5]。在區(qū)塊Block中加密處理每個區(qū)塊節(jié)點,并為每個旅游信息文檔建立區(qū)塊鏈接chain,系統(tǒng)在對數(shù)據(jù)庫中信息調(diào)取時,通過區(qū)塊鏈接chain即可完成。將區(qū)塊鏈接與用戶模型鏈接,實現(xiàn)用戶模型的訓(xùn)練和學(xué)習(xí),此外用戶可以根據(jù)需求增加區(qū)塊和刪減區(qū)塊,實現(xiàn)管理旅游產(chǎn)品信息。
匹配用戶模型與數(shù)據(jù)庫中的每一個文檔信息,計算出數(shù)據(jù)庫中符合用戶模型的旅游產(chǎn)品信息,將其推薦給用戶,實現(xiàn)系統(tǒng)個性化推薦功能。本文通過興趣加權(quán)算法加權(quán)求和個性化推薦要素,將其作為關(guān)鍵詞匹配度的最終得分[6]。推薦要素的加權(quán)得分公式如下:
式中,scorew為系統(tǒng)數(shù)據(jù)庫中對于用戶搜索關(guān)鍵詞計算旅游產(chǎn)品信息的得分;U為當(dāng)前用戶瀏覽的頁面相對于歷史瀏覽頁面的特征向量;V為旅游產(chǎn)品信息文檔相對于數(shù)據(jù)庫的特征向量;scoreb為用戶瀏覽時間的得分;P為用戶當(dāng)前瀏覽的旅游產(chǎn)品信息文檔所在SVM分類的總時間;D為用戶歷史瀏覽旅游產(chǎn)品信息時間總和;scoreq為用戶在系統(tǒng)操作時間的得分;S為計算的旅游產(chǎn)品信息文檔所在SVM分類的用戶使用該分類進(jìn)程的總時間;Q為用戶在系統(tǒng)中搜索、瀏覽等操作時間總和[7]。將推薦要求得分進(jìn)行加權(quán)處理,計算出旅游產(chǎn)品信息文檔加權(quán)得分,公式如下:
式中,scoreT為數(shù)據(jù)庫針對用戶搜索關(guān)鍵詞匹配度的加權(quán)得分;ρ為特征向量權(quán)重[8]。利用公式計算數(shù)據(jù)庫中旅游產(chǎn)品信息文檔,得分最高的旅游產(chǎn)品信息文檔,其與用戶關(guān)鍵詞匹配度最高,系統(tǒng)通過輸出該文檔信息,實現(xiàn)向用戶推薦旅游產(chǎn)品。
實驗以某旅游網(wǎng)站數(shù)據(jù)作為實驗數(shù)據(jù),該旅游網(wǎng)站涉及1 698個旅游產(chǎn)品和2 540個用戶,利用本文系統(tǒng)與傳統(tǒng)系統(tǒng)為該旅游網(wǎng)站用戶推薦旅游產(chǎn)品。根據(jù)該旅游網(wǎng)站實際情況,安裝4臺旅游產(chǎn)品信息搜索引擎,2臺服務(wù)器,2臺分布式SVM分類器和1臺網(wǎng)絡(luò)服務(wù)器,組建了硬件環(huán)境。選擇100名用戶作為兩個旅游產(chǎn)品個性化推薦系統(tǒng)的體驗者,令100名用戶在80 h時間內(nèi)使用系統(tǒng)進(jìn)行旅游產(chǎn)品搜索,每個用戶每小時搜索2次。旅游產(chǎn)品信息搜索引擎收集到信息共264.26 GB,網(wǎng)絡(luò)瀏覽器記錄的瀏覽信息共162.34 GB,SVM分類器將分類信息建立了HTML1文檔、HTML2文檔和HTML3文檔,并上傳至數(shù)據(jù)庫。得到系統(tǒng)個性化推薦旅游產(chǎn)品情況如表1所示。
表1 旅游產(chǎn)品個性化推薦情況
以推準(zhǔn)率為實驗指標(biāo),推準(zhǔn)率為系統(tǒng)推薦的旅游產(chǎn)品數(shù)與用戶感興趣的旅游產(chǎn)品數(shù)的比例,推準(zhǔn)率越高表示推薦精度越高。實驗隨機抽選8名用戶搜索與推薦情況,計算出兩個系統(tǒng)的推準(zhǔn)率,具體如表2所示。
表2 兩個系統(tǒng)旅游產(chǎn)品推準(zhǔn)率對比
從表2可知,本文系統(tǒng)推薦的旅游產(chǎn)品數(shù)量與用戶感興趣的旅游產(chǎn)品數(shù)量基本穩(wěn)定,平均推準(zhǔn)率為81.4%,表明本文介紹系統(tǒng)為用戶推薦的旅游產(chǎn)品基本符合用戶需求。而傳統(tǒng)系統(tǒng)平均推準(zhǔn)率僅為35.4%,最高推準(zhǔn)率為48.2%,低于本文介紹系統(tǒng)。因此,本文介紹系統(tǒng)具有良好的推薦效果,可以滿足用戶的個性化需求,同時證明了區(qū)塊鏈技術(shù)在旅游產(chǎn)品個性化推薦中具有良好的應(yīng)用效果。
本文在傳統(tǒng)推薦系統(tǒng)基礎(chǔ)上,通過區(qū)塊鏈技術(shù)優(yōu)化和創(chuàng)新了其硬件和軟件,并且用實驗證明了該系統(tǒng)具有良好的推薦效果,有效提高了旅游產(chǎn)品個性化推薦精度,能夠為用戶提供良好的個性化推薦服務(wù)。