胡致杰,胡羽沫
(1.廣東理工學(xué)院 信息工程系,廣東 肇慶 526100;2.中山大學(xué) 數(shù)據(jù)科學(xué)與計(jì)算機(jī)學(xué)院,廣東 廣州 510006)
?
協(xié)同過(guò)濾推薦瓶頸問(wèn)題研究
胡致杰1,胡羽沫2
(1.廣東理工學(xué)院 信息工程系,廣東肇慶526100;2.中山大學(xué) 數(shù)據(jù)科學(xué)與計(jì)算機(jī)學(xué)院,廣東廣州510006)
摘要:進(jìn)入21世紀(jì)以來(lái),我國(guó)的科學(xué)技術(shù)取得了巨大進(jìn)步,互聯(lián)網(wǎng)和電子商務(wù)正處于迅猛發(fā)展的階段,促進(jìn)信息化不斷深入到人們的日長(zhǎng)生活工作當(dāng)中。在現(xiàn)代社會(huì)中人們的工作繁忙,在購(gòu)物方面越來(lái)越多偏向于在電子商務(wù)網(wǎng)站上進(jìn)行,在享受足不出戶的便利的同時(shí),也因?yàn)殡娮由虅?wù)網(wǎng)站所提供的大量商品造成嚴(yán)重的“信息超載”,于是就出現(xiàn)了電子商務(wù)推薦系統(tǒng)。其中協(xié)同過(guò)濾推薦是目前最為常用的電子商務(wù)推薦系統(tǒng),它已經(jīng)被廣泛應(yīng)用于各商務(wù)網(wǎng)站中,但是在使用過(guò)程中還存在許多的問(wèn)題,這些協(xié)同過(guò)濾推薦瓶頸問(wèn)題嚴(yán)重阻礙了它的進(jìn)一步發(fā)展。因此,文章的主旨就是針對(duì)協(xié)同過(guò)濾推薦瓶頸問(wèn)題進(jìn)行研究,并提出相對(duì)應(yīng)的解決措施清掃阻礙。
關(guān)鍵詞:協(xié)同過(guò)濾推薦;瓶頸問(wèn)題;解決措施
電子商務(wù)網(wǎng)站在用戶瀏覽的過(guò)程中需要將適合該用戶的商品推薦給它需要在大量的商品信息中進(jìn)行過(guò)濾,所以協(xié)同過(guò)濾推薦系統(tǒng)的使用對(duì)解決這問(wèn)題其中重要的輔助作用,克服因信息的大量超載為用戶帶來(lái)的不良體驗(yàn),進(jìn)而更好的促成商品交易的成功率,幫助企業(yè)增加銷售額。協(xié)同過(guò)濾推薦系統(tǒng)作為互聯(lián)網(wǎng)及電子商務(wù)網(wǎng)站發(fā)展的產(chǎn)物,是電子商務(wù)網(wǎng)站進(jìn)行正常運(yùn)行的一種“一對(duì)一營(yíng)銷”戰(zhàn)略技術(shù),是網(wǎng)站客戶關(guān)系管理過(guò)程中的重要組成部分,在各個(gè)大型網(wǎng)站運(yùn)行過(guò)程中的得到很好的應(yīng)用。隨著協(xié)同過(guò)濾推薦系統(tǒng)的快速發(fā)展以及互聯(lián)網(wǎng)技術(shù)的不斷變化,需要不斷對(duì)協(xié)同過(guò)濾推薦系統(tǒng)進(jìn)行更新以滿足時(shí)代發(fā)展的需要,目前,在協(xié)同過(guò)濾推薦系統(tǒng)的使用過(guò)程中發(fā)現(xiàn)在稀疏性、冷啟動(dòng)、可擴(kuò)展性等方面出現(xiàn)了發(fā)展的瓶頸,這些瓶頸問(wèn)題制約著協(xié)同過(guò)濾推薦系統(tǒng)的進(jìn)一步發(fā)展。因此,需要根據(jù)實(shí)際需求對(duì)協(xié)同過(guò)濾推薦系統(tǒng)的瓶頸問(wèn)題做出相關(guān)對(duì)策,以更好的為電子商務(wù)網(wǎng)站及用戶服務(wù)。
第一,稀疏性問(wèn)題的瓶頸。電子商務(wù)市場(chǎng)的快速發(fā)展讓更多的電子商務(wù)站及商品不斷加入到這中間來(lái),這樣容易造成用戶的分流,不在集中在某些固定的網(wǎng)站進(jìn)行購(gòu)買活動(dòng),因此用戶評(píng)分?jǐn)?shù)據(jù)的稀疏性問(wèn)題成為制約電子商務(wù)網(wǎng)站發(fā)展的一個(gè)重要瓶頸。由于協(xié)同過(guò)濾推薦系統(tǒng)對(duì)用戶評(píng)分的依賴性極強(qiáng),所以越來(lái)越多的技術(shù)人員開(kāi)始提出要改善協(xié)同過(guò)濾推薦系統(tǒng)的稀疏性問(wèn)題,并不斷根據(jù)實(shí)際情況進(jìn)行技術(shù)研究,通過(guò)統(tǒng)計(jì)技術(shù)的應(yīng)用來(lái)選擇與用戶購(gòu)買目標(biāo)有著相同或者相似屬性的商品,讓用戶可以在眾多選擇中選出最適合自己需求的商品。因此,稀疏性的瓶頸問(wèn)題在于提高對(duì)用戶評(píng)分的收集,進(jìn)而提高過(guò)濾商品的質(zhì)量。
第二,冷啟動(dòng)的瓶頸問(wèn)題。領(lǐng)啟動(dòng)問(wèn)題是對(duì)稀疏性問(wèn)題的一種惡化,是一種極端的情況,根據(jù)不同的情況可以分為新用戶問(wèn)題和新項(xiàng)目問(wèn)題兩大類。這2種問(wèn)題的發(fā)生情況為當(dāng)一個(gè)新用戶被推薦或者是自動(dòng)加入?yún)f(xié)同過(guò)濾推薦系統(tǒng)之后,由于還沒(méi)有開(kāi)始使用網(wǎng)站進(jìn)行購(gòu)買活動(dòng),所以也就沒(méi)有提交用戶評(píng)價(jià),未對(duì)任何項(xiàng)目進(jìn)行評(píng)分,導(dǎo)致協(xié)同過(guò)濾推薦系統(tǒng)無(wú)法根據(jù)相關(guān)信息進(jìn)行可能喜歡的商品和項(xiàng)目推薦,在協(xié)同過(guò)濾推薦系統(tǒng)運(yùn)行過(guò)程中,讓每個(gè)用戶在每個(gè)項(xiàng)目的各個(gè)階段都面臨著嚴(yán)重的冷啟動(dòng)問(wèn)題??蛻魧?duì)網(wǎng)站的忠誠(chéng)度需要在使用的早期就開(kāi)始建立,這對(duì)電子商務(wù)網(wǎng)站的進(jìn)一步發(fā)展具有十分重要的作用。
第三,可擴(kuò)展性的瓶頸問(wèn)題。協(xié)同過(guò)濾推薦算法是基于內(nèi)存的協(xié)同過(guò)濾算法,這大大節(jié)約了算法建立模型的時(shí)間,提高了系統(tǒng)的工作效率,但也存在一定的局限性,就是無(wú)法及時(shí)對(duì)用戶的信息和新的商品項(xiàng)目進(jìn)行更新,還需要定期根據(jù)網(wǎng)站各個(gè)階段內(nèi)容的變化進(jìn)行新的模型建立。而隨著電子商務(wù)網(wǎng)站的不斷擴(kuò)大規(guī)模,用戶以及商品的大量增加,協(xié)同過(guò)濾推薦系統(tǒng)難以保證推薦商品對(duì)用戶是否真正需要,這就不利于系統(tǒng)的可擴(kuò)展性發(fā)展,嚴(yán)重?fù)p失了對(duì)用戶之間的差異性,對(duì)數(shù)據(jù)模型的參數(shù)調(diào)整造成阻礙。
第一,針對(duì)稀疏性問(wèn)題上的不足,可以提出非目標(biāo)用戶類型區(qū)分理論,對(duì)已有用戶采用最近鄰搜索的方式,將其分為無(wú)推薦能力和有推薦能力2種類型,并針對(duì)不同的類型的用戶采取相對(duì)應(yīng)的措施,以提高協(xié)同過(guò)濾推薦系統(tǒng)的工作效率和信息更改的實(shí)時(shí)性。在這個(gè)過(guò)程中為了有效防止用戶評(píng)分項(xiàng)數(shù)據(jù)的極端稀疏現(xiàn)象需要進(jìn)一步采取一種基于Rough集理論的用戶評(píng)分項(xiàng)并集未評(píng)分值填補(bǔ)方法,讓用戶評(píng)分項(xiàng)能夠更加的完備化,對(duì)領(lǐng)域最近鄰理論實(shí)現(xiàn)有效的補(bǔ)充。
第二,針對(duì)冷啟動(dòng)中的新用戶問(wèn)題,目前已經(jīng)提出了一種冷啟動(dòng)消除方法。這種方法可以根據(jù)用戶訪問(wèn)電子商務(wù)網(wǎng)站的項(xiàng)序理論來(lái)獲取用戶的訪問(wèn)項(xiàng)序,進(jìn)而對(duì)此進(jìn)行相應(yīng)的邏輯分析以及用戶訪問(wèn)項(xiàng)序分解,再在基于上面提到的領(lǐng)域最近鄰理論對(duì)新用戶的訪問(wèn)項(xiàng)序進(jìn)行集合,建立一種新型的數(shù)據(jù)鏈模型,實(shí)現(xiàn)最終對(duì)用戶的商品協(xié)同過(guò)濾推薦。
第三,針對(duì)可擴(kuò)展性瓶頸問(wèn)題,需要對(duì)日益增長(zhǎng)的用戶和商品采用一種新機(jī)制,并可以讓新機(jī)制完美使用用戶各種各樣的興趣愛(ài)好,在大量的商品信息中進(jìn)行篩選。既可以消除傳統(tǒng)的篩選方法在梅西進(jìn)行推薦計(jì)算的時(shí)候遇到需要對(duì)全體項(xiàng)目商品進(jìn)行掃描的狀況,有效的改善了協(xié)同過(guò)濾推薦系統(tǒng)的可擴(kuò)展性,還可以得到最新的用戶評(píng)分?jǐn)?shù)據(jù),掌握用戶的興趣偏好的動(dòng)態(tài)變化。
第四,將電子商務(wù)網(wǎng)站的瀏覽用戶轉(zhuǎn)變?yōu)橘?gòu)買者,根據(jù)用戶的瀏覽記錄對(duì)網(wǎng)站商品信息進(jìn)行篩選,選出用戶可能喜歡的商品進(jìn)行推送,這樣大大增加了用戶的購(gòu)買力。其次就是可以提高電子商務(wù)網(wǎng)站的交叉銷售能力,在現(xiàn)代社會(huì),電子商務(wù)網(wǎng)站購(gòu)物逐漸成為人們生活購(gòu)物的一大選擇,在商業(yè)發(fā)展過(guò)程中是不可或缺的一部分,較強(qiáng)交叉銷售能力,可以更好的引導(dǎo)用戶購(gòu)買一些自己潛在需要但是未計(jì)劃購(gòu)買的商品,協(xié)同過(guò)濾推薦系統(tǒng)可以對(duì)這類商品進(jìn)行推送,從而增加商品的銷售量,獲得更多的利潤(rùn)。最后就是可以幫助建立用戶對(duì)電子商務(wù)網(wǎng)站的客戶忠誠(chéng)度,贏得客戶對(duì)網(wǎng)站的忠誠(chéng)度是提高商品銷售量的一項(xiàng)重要商業(yè)策略,在互聯(lián)網(wǎng)的運(yùn)行過(guò)程中,客戶的忠誠(chéng)度是網(wǎng)站之間的強(qiáng)有力競(jìng)爭(zhēng)對(duì)象,協(xié)同過(guò)濾推薦系統(tǒng)的使用一方面可以通過(guò)對(duì)用戶的習(xí)慣和偏好來(lái)推薦用戶所需求的合適商品,另一方面,客戶越多的使用協(xié)同過(guò)濾推薦系統(tǒng)來(lái)進(jìn)行購(gòu)買活動(dòng),系統(tǒng)就能對(duì)用戶的喜好進(jìn)一步了解,在下次推薦時(shí)則會(huì)對(duì)商品的質(zhì)量進(jìn)行一定的優(yōu)化,從而生成一種良性循環(huán),既提高了客戶的忠誠(chéng)度,還提高了客戶多網(wǎng)站的粘性。
本研究結(jié)果說(shuō)明在互聯(lián)網(wǎng)發(fā)展規(guī)模不斷擴(kuò)大,人們?cè)谛畔⑸鐣?huì)中獲取信息的渠道越來(lái)越多的環(huán)境下,協(xié)同過(guò)濾推薦系統(tǒng)的使用可以幫助用戶每天在大量的信息傳播中周旋中面對(duì)海量的信息過(guò)濾選取一些自己有用的信息,并根據(jù)用戶的日常檢索行為來(lái)形成一種個(gè)性化推薦,讓相關(guān)信息可以在大量的信息中被推薦給用戶,節(jié)約用戶的時(shí)間并起到重要作用。同時(shí)對(duì)協(xié)同過(guò)濾推薦在使用過(guò)程中遇到的瓶頸問(wèn)題進(jìn)行相關(guān)探索,對(duì)有關(guān)問(wèn)題的看法進(jìn)行檢驗(yàn),證實(shí)在稀疏性、冷啟動(dòng)、可擴(kuò)展性等方面存在發(fā)展問(wèn)題,并有針對(duì)性的進(jìn)行有效措施解決,修正其中的不足,并對(duì)協(xié)同過(guò)濾推薦在未來(lái)電子商務(wù)網(wǎng)站中的應(yīng)用發(fā)展給以肯定,但需要徹底解決發(fā)展問(wèn)題還需要相關(guān)人員的不斷努力,共同不斷推動(dòng)它向前發(fā)展。
[參考文獻(xiàn)]
[1]張紅霞,楊淵,郎維.基于客戶行為和興趣變化的電子商務(wù)推薦系統(tǒng)[J].寶雞文理學(xué)院學(xué)報(bào):自然科學(xué)版,2012(2):52-56.
[2]張光衛(wèi),李德毅,李鵬,等.基于云模型的協(xié)同過(guò)濾推薦算法[J].軟件學(xué)報(bào),2007(10):46-49.
[3]鄧愛(ài)林,朱揚(yáng)勇,施伯樂(lè).基于項(xiàng)目評(píng)分預(yù)測(cè)的協(xié)同過(guò)濾推薦算法[J].軟件學(xué)報(bào),2003(9):1621-1628.
[4]冷亞軍,陸青,梁昌勇.協(xié)同過(guò)濾推薦技術(shù)綜述[J].模式識(shí)別與人工智能,2014(8):123-127.
[5]李改,李磊.基于雙向主題模型的協(xié)同過(guò)濾算法[J].中山大學(xué)學(xué)報(bào):自然科學(xué)版,2013(5):68-72.
Research on Collaborative Filtering Recommendation Bottleneck Problem
Hu Zhijie1, Hu Yumo2
(1.Department of Information Engineering, Guangdong Polytechnic College, Zhaoqing526100, China;2.School of Data and Computer Science, Sun Yat-Sen University, Guangzhou510006, China)
Abstract:The 21st century, our country has made great progress of science and technology, the Internet and e-commerce is in rapid development stage, promote the informatization continuously go deep into the People's Daily life long work. In modern society people's job is busy, in terms of shopping more and more favor in e-commerce site, enjoying the housebound convenient at the same time, also because e-commerce sites provide a large number of goods caused serious "information overload", hence the e-commerce recommendation system.The collaborative fltering recommendation is currently the most commonly used e-commerce recommender system, it has been widely applied to an e-commerce site, but many problems still exist in the process of using, the collaborative fltering recommendation bottleneck seriously hindered the further development of it. Therefore, the purpose of this article is in view of the collaborative fltering recommendation bottleneck problem, and put forward the corresponding solutions for cleaning the block.
Key words:collaborative fltering recommendation; bottleneck problem; the measures
作者簡(jiǎn)介:胡致杰(1974-),男,湖北蘄春,碩士,講師;研究方向:數(shù)據(jù)挖掘,推薦系統(tǒng)。