程彩霞+段雪+李曉倩
摘 要 隨著互聯(lián)網(wǎng)科技的迅速發(fā)展,旅游住宿信息不斷增多,呈指數(shù)形式上升。目前,旅游住宿資源信息量大,內(nèi)容紛雜,使得人們很難從中挑選滿足其需求的信息,影響了游客的旅游體驗(yàn)。隨著智能化的進(jìn)一步應(yīng)用,旅游住宿也在不斷地朝智能化方向發(fā)展,在對(duì)比“游客的需求”和“互聯(lián)網(wǎng)提供的旅游信息”后,考慮到游客的實(shí)際住房需求和現(xiàn)實(shí)情況,簡要分析研究“隨游而安”智能推薦系統(tǒng)。
關(guān)鍵詞 智能推薦系統(tǒng);旅游住宿;數(shù)據(jù)挖掘
中圖分類號(hào) TP3 文獻(xiàn)標(biāo)識(shí)碼 A 文章編號(hào) 1674-6708(2017)191-0044-02
隨著“互聯(lián)網(wǎng)+”的興起,越來越多的服務(wù)業(yè)及其輔助業(yè)務(wù)通過互聯(lián)網(wǎng)進(jìn)入電子商務(wù)行業(yè),他們的進(jìn)入使得互聯(lián)網(wǎng)信息不斷增長,信息的暴增為用戶提供更多樣化服務(wù)的同時(shí),也給他們帶來了困擾,無法在短時(shí)間內(nèi)篩選出有價(jià)值的信息。這為智能推薦系統(tǒng)的發(fā)展提供了機(jī)遇。智能推薦系統(tǒng)可以抓取分析用戶的需求,為他們推送個(gè)性化的信息,用一種實(shí)用并且友好的方式解決客戶困擾,減少其在信息的搜集和篩選上花費(fèi)的時(shí)間。
智能推薦系統(tǒng)為:通過搜索以及分析客戶的需求及愛好,為其推薦符合其需求愛好的個(gè)性化信息,將處理后的數(shù)據(jù)利用互聯(lián)網(wǎng)分享給客戶,并提出建議幫助客戶解決怎么搜索信息,怎么進(jìn)行刪選等問題的系統(tǒng)。在處理過程中,系統(tǒng)會(huì)模擬客戶在整個(gè)互聯(lián)網(wǎng)中進(jìn)行搜集以及處理信息。因?yàn)槠渫扑]的個(gè)性化,研究人員也將智能推薦系統(tǒng)成為個(gè)性化推薦系統(tǒng)[1]。
1 “隨游而安”智能推薦系統(tǒng)
“隨游而安”給用戶提供一個(gè)平臺(tái),在這個(gè)平臺(tái)中,游客可以發(fā)布自己需求,如:地點(diǎn)、住宿條件、愿意接受的價(jià)格范圍等來選擇自己的住宿地點(diǎn);從游客角度來講,打破了原來被動(dòng)接受商家制定的價(jià)格的局面,同時(shí)有了更多及更便宜的選擇。我們的第二個(gè)用戶群以能提供住宿的景點(diǎn)周圍居民為主,在游客發(fā)布求房信息的同時(shí),當(dāng)?shù)鼐用竦姆孔忧『每粘鰜?,也許家里孩子上學(xué)有一間臥室空出來,也許只有一個(gè)空沙發(fā)。這時(shí)供方與求方就需要一個(gè)交流的平臺(tái),“隨遇而安”提供這樣一個(gè)平臺(tái)更方便供方和求方的交流。
在目前旅游行業(yè)借助各種現(xiàn)代化信息技術(shù)基礎(chǔ)上,“隨游而安”智能住宿推薦系統(tǒng)不斷添加各類各樣的旅游元素,并且將智能推薦定位核心,通過詳細(xì)科學(xué)的整合、分析網(wǎng)絡(luò)上大量的旅游資源信息,不斷豐富系統(tǒng)服務(wù)功能,從而為大家提供各式各樣的旅游需求和體驗(yàn),進(jìn)一步增加旅游業(yè)的新穎性和經(jīng)濟(jì)價(jià)值。
2 數(shù)據(jù)挖掘
“隨游而安”智能住宿推薦系統(tǒng)在整個(gè)運(yùn)行過程中,并不需要消費(fèi)者提供自己精確的消費(fèi)需求。通過用戶已有的歷史行為針對(duì)用戶興趣建模,從而讓信息呈現(xiàn)對(duì)它感興趣的用戶面前,同時(shí)幫助新的用戶尋找發(fā)現(xiàn)對(duì)其有價(jià)值的信息,最終實(shí)現(xiàn)信息生產(chǎn)者和消費(fèi)者二者之間的雙贏。
數(shù)據(jù)挖掘利用分類技術(shù),在網(wǎng)上找到潛在客戶,確定目標(biāo)客戶,對(duì)客戶進(jìn)行細(xì)分,并動(dòng)態(tài)的向客戶展示產(chǎn)品,引導(dǎo)客戶進(jìn)在合適的時(shí)間進(jìn)行合適的產(chǎn)品消費(fèi),為客戶提供個(gè)性化服務(wù)。利用數(shù)據(jù)挖掘不僅能夠很好的預(yù)測(cè)趨勢(shì)發(fā)展,還能檢測(cè)誤差和描述概念,從整個(gè)數(shù)據(jù)庫查找數(shù)據(jù),這些數(shù)據(jù)就能夠很好的進(jìn)行預(yù)測(cè)。
2.1 顯示反饋和隱式反饋
將系統(tǒng)建立在強(qiáng)大的數(shù)據(jù)基礎(chǔ)上,是實(shí)現(xiàn)推薦信息和用戶需求高度貼合的基礎(chǔ),在智能推薦系統(tǒng)中,用戶的一般行為稱為顯式反饋和隱式反饋。顯式反饋能夠體現(xiàn)用戶明確表示對(duì)某一產(chǎn)品內(nèi)容的喜好,而隱式反饋則不能夠明確的反應(yīng)用戶的喜好[2]。從正負(fù)反饋來看,前者都有,后者只有正反饋。在用戶登錄瀏覽“隨游而安”后,記錄用戶點(diǎn)擊、瀏覽、停留、跳轉(zhuǎn)、關(guān)閉等隱式反饋數(shù)據(jù)。后期,顯式反饋數(shù)據(jù)密集以后,對(duì)用戶歷次入住的地點(diǎn)、時(shí)間、住宿方式等深度挖掘達(dá)到智能推薦的目的。
從用戶興趣來看,顯式反饋的數(shù)據(jù)相對(duì)于隱式反饋比較明確;從數(shù)據(jù)的數(shù)量和儲(chǔ)存來看,顯式反饋的數(shù)據(jù)較少且存在數(shù)據(jù)庫中,隱式反饋的數(shù)據(jù)較為龐大。基于此,我們應(yīng)充分利用隱式反饋數(shù)據(jù),疊加用戶的點(diǎn)擊數(shù)據(jù),通過判斷加成后的隱式反饋數(shù)據(jù)和用戶點(diǎn)擊信息,以降低在隱式反饋數(shù)據(jù)處理過程中造成的誤差。
2.2 靜態(tài)數(shù)據(jù)與動(dòng)態(tài)數(shù)據(jù)
靜態(tài)數(shù)據(jù)是指用戶由于前一時(shí)間段的行為而產(chǎn)生的對(duì)接下來的行為造成影響的數(shù)據(jù)。動(dòng)態(tài)數(shù)據(jù)指在用戶在產(chǎn)生行為時(shí)系統(tǒng)捕捉的瞬時(shí)數(shù)據(jù)。在租客和房主進(jìn)行注冊(cè)時(shí)就可以對(duì)其所在地、住宿條件、和年齡、性別等靜態(tài)數(shù)據(jù)進(jìn)行首次的獲取。動(dòng)態(tài)數(shù)據(jù)則是在用戶產(chǎn)生進(jìn)行點(diǎn)擊、搜索、瀏覽等行為時(shí)獲取。靜態(tài)數(shù)據(jù)是動(dòng)態(tài)數(shù)據(jù)的基礎(chǔ),動(dòng)態(tài)數(shù)據(jù)是對(duì)靜態(tài)數(shù)據(jù)進(jìn)一步的解析。
3 數(shù)據(jù)處理
3.1 數(shù)據(jù)預(yù)處理
運(yùn)用一定的數(shù)據(jù)挖掘算法(分類算法,聚類算法決策樹等),首先收集Web服務(wù)器數(shù)據(jù)和用戶數(shù)據(jù)的,對(duì)數(shù)據(jù)問題進(jìn)行判定,然后用一定的基準(zhǔn)衡量數(shù)據(jù),對(duì)有用的數(shù)據(jù)進(jìn)行提取,沒用的數(shù)據(jù)進(jìn)行去除,最后得到最終數(shù)據(jù)。對(duì)數(shù)據(jù)進(jìn)行進(jìn)一步挖掘,進(jìn)行分類,聚類。然后將選出的數(shù)據(jù)進(jìn)行預(yù)處理,為之后的數(shù)據(jù)分析奠定有效的數(shù)據(jù)基礎(chǔ)。數(shù)據(jù)預(yù)處理包括數(shù)據(jù)清洗、數(shù)據(jù)集成、數(shù)據(jù)選擇和數(shù)據(jù)變換4個(gè)方面[3]。
數(shù)據(jù)清洗是對(duì)景區(qū)景點(diǎn)資源、房屋住宿資源等進(jìn)行加工處理和組織重構(gòu),為下一步數(shù)據(jù)處理過程提供基礎(chǔ)平臺(tái),并對(duì)數(shù)據(jù)進(jìn)行分析、調(diào)整。例如把天津市的所有待租房屋信息的相關(guān)數(shù)據(jù)列出,再根據(jù)客戶需求:北辰區(qū)、一張沙發(fā)、?50/晚,對(duì)讀取、抽取、過濾等操作,選擇出客戶滿意的結(jié)果。
數(shù)據(jù)集成是將多組原始數(shù)據(jù)源通過匹配相似信息合并成一致的數(shù)據(jù)存儲(chǔ),例如有三組原始數(shù)據(jù),數(shù)據(jù)1:天津北辰區(qū)某小區(qū)的單間,?150/晚;數(shù)據(jù)2:天津市北辰區(qū)某小區(qū)某單元房客廳沙發(fā),?30/晚;天津市北辰區(qū)別墅一套,?800/晚;可以通過關(guān)鍵字“天津市北辰區(qū)”將以上3個(gè)數(shù)據(jù)統(tǒng)一管理;數(shù)據(jù)選擇是修整刪除冗余數(shù)據(jù),選擇性的壓縮信息;數(shù)據(jù)轉(zhuǎn)化是通過規(guī)范化等方法將旅游點(diǎn)的住房及租客等信息轉(zhuǎn)換成適合檢索挖掘的形式。
3.2 靜態(tài)數(shù)據(jù)和動(dòng)態(tài)數(shù)據(jù)處理
針對(duì)租客進(jìn)行搜索過程中靜態(tài)與動(dòng)態(tài)數(shù)據(jù)處理如下:系統(tǒng)首先綜合房主所在地、住宿條件價(jià)格等靜態(tài)數(shù)據(jù),通過抓取關(guān)鍵詞進(jìn)行分類打包,存于數(shù)據(jù)庫中。根據(jù)租客進(jìn)行搜索點(diǎn)擊過程中產(chǎn)生數(shù)據(jù)對(duì)包中的數(shù)據(jù)進(jìn)行更正。針對(duì)房主來說,靜態(tài)數(shù)據(jù)和動(dòng)態(tài)數(shù)據(jù)的處理如下:系統(tǒng)綜合租客的性別、年齡、所在地等靜態(tài)數(shù)據(jù),根據(jù)關(guān)鍵字進(jìn)行分類打包,存于數(shù)據(jù)庫中,根據(jù)房主提供的租住信息等對(duì)包中的數(shù)據(jù)進(jìn)行修正。
4 推薦結(jié)果處理
4.1 推薦結(jié)果的展示
智能推薦系統(tǒng)中,數(shù)據(jù)經(jīng)過預(yù)處理后并不直接推薦給用戶,而是將推薦結(jié)果通過關(guān)鍵字權(quán)重值進(jìn)行排序后,將排序完畢的數(shù)據(jù)在網(wǎng)頁上依次展現(xiàn)給用戶。
4.2 推薦結(jié)果的測(cè)試
推薦結(jié)果的優(yōu)劣程度,我們從兩個(gè)方面進(jìn)行判斷:覆蓋率以及準(zhǔn)確性。準(zhǔn)確性是指推薦系統(tǒng)產(chǎn)生的推薦和用戶真實(shí)需求之間的契合程度,即正確推薦結(jié)果的程度,覆蓋率是推薦系統(tǒng)包含可能被用戶需要的推薦結(jié)果的能力。通過用戶對(duì)推薦結(jié)果的點(diǎn)擊率,停留時(shí)間以及進(jìn)行再次搜索的頻率對(duì)準(zhǔn)確性和覆蓋率進(jìn)行判斷。也可進(jìn)行網(wǎng)上調(diào)研問卷的形式得到更有效的判斷數(shù)據(jù),進(jìn)而對(duì)系統(tǒng)進(jìn)行修改完善。
5 結(jié)論
隨著人類社會(huì)信息化的不斷深化發(fā)展以及互聯(lián)網(wǎng)的廣泛應(yīng)用,智能應(yīng)用系統(tǒng)將有更加廣泛的需求,總而言之,“隨游而安”智能推薦系統(tǒng)的誕生,不僅滿足了人們對(duì)各種旅游資源的需求與體驗(yàn),使得用戶獲得信息更加明確和精準(zhǔn),節(jié)約了用戶資源,同時(shí),也為旅游行業(yè)開辟了更加廣闊的發(fā)展空間。實(shí)現(xiàn)了基于新一代信息技術(shù),滿足游客個(gè)性化需求的智能住宿推薦系統(tǒng),主動(dòng)感知旅客住宿要求相關(guān)信息,從而達(dá)到對(duì)旅游住宿的智能推薦,提供高品質(zhì)、高滿意度、高效率的服務(wù)。
參考文獻(xiàn)
[1]沙志強(qiáng).數(shù)據(jù)挖掘技術(shù)在智能推薦系統(tǒng)中的研究與應(yīng)用[D].北京工業(yè)大學(xué),2005.
[2]趙茜.IPIV智能推薦系統(tǒng)的設(shè)計(jì)與研究[D].廣州:華南理工大學(xué),2015.
[3]張晗.旅游服務(wù)智能推薦系統(tǒng)的研究與設(shè)計(jì)[D].2006,22(15):170-171.