天津工業(yè)大學(xué)計算機科學(xué)與軟件學(xué)院 梁 宇
移動互聯(lián)網(wǎng)用戶的增加,將給移動互聯(lián)網(wǎng)企業(yè)帶來更大的利潤空間,隨之而來的是更多的移動互聯(lián)網(wǎng)企業(yè)的出現(xiàn),更多移動互聯(lián)網(wǎng)信息載體的出現(xiàn)。Internet上的個性化信息推薦已經(jīng)得到了很好的應(yīng)用,國內(nèi)外都有一些應(yīng)用中的個性化推薦系統(tǒng),而在移動網(wǎng)絡(luò)上進(jìn)行個性化推薦還處于起步階段,還沒有成熟的產(chǎn)品投入使用。
個性化推薦系統(tǒng)是應(yīng)用知識發(fā)現(xiàn)技術(shù),在與用戶互動的過程中為用戶提供個性化的信息,產(chǎn)品與服務(wù)。個性化推薦系統(tǒng)主要融合了用戶建模技術(shù),數(shù)據(jù)庫中的知識發(fā)現(xiàn),Web挖掘技術(shù)等。個性化推薦技術(shù)主要分為三類:基于規(guī)則的推薦,基于內(nèi)容分類的推薦和基于協(xié)同過濾技術(shù)的推薦。
基于規(guī)則的推薦主要根據(jù)用戶歷史瀏覽記錄,采取一定的方法,分析出信息之間的潛在的關(guān)聯(lián)關(guān)系,根據(jù)這種關(guān)聯(lián)關(guān)系建立規(guī)則庫,在其他用戶再次訪問某信息條目I時,在規(guī)則庫中查找與條目I對應(yīng)規(guī)則,根據(jù)這些規(guī)則決定向用戶推薦的信息集。于規(guī)則的推薦結(jié)構(gòu)簡單,易于應(yīng)用。主要缺點是:規(guī)則的數(shù)量隨著數(shù)據(jù)量的增大急劇增加;規(guī)則集的確定依賴于支持度-可信度模型,而支持度、可信度的確定并沒有確定的標(biāo)準(zhǔn),支持度或可信度的改變對規(guī)則集的大小影響較大;對用戶的推薦是根據(jù)當(dāng)前已有的規(guī)則,并不能發(fā)現(xiàn)新的用戶偏好
基于內(nèi)容分類的推薦(Content-based Recommendation)是建立在信息內(nèi)容的基礎(chǔ)上,而不需要依據(jù)用戶對信息的評價,主要采用機器學(xué)習(xí)的方法將信息進(jìn)行分類。并且根據(jù)用戶提供的定制信息類型或者用戶的興趣模型,將同類信息或者與用戶模型最為相似的信息條目推薦給用戶?;趦?nèi)容的推薦是建立在信息內(nèi)容的基礎(chǔ)之上的,因此基于內(nèi)容的推薦技術(shù)比較適用于機器容易識別的信息載體,如文本,而不適用與音頻,視頻等信息內(nèi)容不容易獲取的信息載體?;趦?nèi)容的推薦系統(tǒng)的另外一個關(guān)鍵技術(shù)是文本特征的提取,基于內(nèi)容的推薦技術(shù)是根據(jù)文本的特征與用戶的興趣模型進(jìn)行匹配的程度來決定是否向用戶推薦該文本信息。因此文本的特征選擇在基于內(nèi)容的推薦算法中尤為重要,特征選取的優(yōu)劣決定了個性化推薦的質(zhì)量。
協(xié)同過濾推薦建立在群體性和多數(shù)原則的基礎(chǔ)之上,由于人具有社會屬性,因此個人的行為一定是包含了某類群體行為的表現(xiàn),在此假設(shè)基礎(chǔ)之上協(xié)同過濾推薦才會有意義。協(xié)同過濾推薦主要分為基于用戶的推薦(Userbased),基于項目的推薦(Item-based),基于模型的推薦(Model-based)三類。當(dāng)前協(xié)同過濾推薦已經(jīng)廣泛的應(yīng)用到電子商務(wù)網(wǎng)站,某些社會化網(wǎng)絡(luò)中。比較成功的應(yīng)用主要有亞馬遜,當(dāng)用戶購買某本書籍時系統(tǒng)會向用戶推薦可能喜歡的書籍列表。還有一些如豆瓣,一些視頻音樂網(wǎng)站等也都應(yīng)用了協(xié)同過濾推薦技術(shù),基于協(xié)同過濾的個性化推薦也應(yīng)用到了博客、微博等網(wǎng)絡(luò)產(chǎn)品上。
協(xié)同過濾技術(shù)較基于規(guī)則與基于內(nèi)容的推薦優(yōu)點:(1)能夠過濾機器難以進(jìn)行自動內(nèi)容分析的信息類型,如音樂,視頻等;(2)應(yīng)用統(tǒng)計學(xué)原理,對大量的歷史記錄進(jìn)行分析,推薦的精確度更高;(3)可以發(fā)現(xiàn)用戶興趣的變化,并且獲得用戶的新興趣;(4)利用了用戶的反饋信息,可以即時修正推薦集。但是,協(xié)同過濾也不是完美無缺的,比如它存在冷啟動,歷史記錄稀疏性,新項目推薦失效等問題,這需要在具體的推薦算法實現(xiàn)中去解決。
移動網(wǎng)絡(luò)較傳統(tǒng)Internet具有更多的特殊性,因此移動網(wǎng)絡(luò)上的個性化信息推薦質(zhì)量不但受到推薦算法本身的影響,也會受到移動網(wǎng)絡(luò)資源的影響,本節(jié)將介紹影響移動網(wǎng)絡(luò)個性化信息推薦質(zhì)量的關(guān)鍵因素。
個性化推薦技術(shù)需要一定的歷史信息作為依據(jù)來對用戶進(jìn)行推薦,個性化推薦技術(shù)是建立在歷史信息記錄的基礎(chǔ)之上的,或是用戶顯性輸入的信息,或是通過機器學(xué)習(xí)分析出來的信息。而信息具有時效性和時滯性,信息在一定時間內(nèi)是有效的信息,一旦超過了一定的期限它就沒有意義,此時就是無效信息。信息本身從信息源產(chǎn)生到需要該信息的宿主都需要一定的時間,因此信息又具有時滯性。因此時間的價值隨時間的流逝而變得越來越小,因此歷史信息在產(chǎn)生用戶推薦集的過程中發(fā)揮的作用是不盡相同的,如何使各個歷史階段的信息發(fā)揮不同的作用是移動網(wǎng)絡(luò)個性化推薦系統(tǒng)要考慮的問題之一。
系統(tǒng)初始化時由于系統(tǒng)積累的用戶信息或者瀏覽記錄信息不足,造成不能產(chǎn)生用戶推薦集,或者推薦集不準(zhǔn)確,這個問題被稱為推薦系統(tǒng)的冷啟動問題。冷啟動在大多數(shù)軟件系統(tǒng)都存在,由于信息的積累需要一定的時間,因此在系統(tǒng)剛剛發(fā)布運行時不能產(chǎn)生正確的結(jié)果集。個性化推薦系統(tǒng)是建立在大量事實信息基礎(chǔ)之上的,因此要產(chǎn)生比較滿意的推薦結(jié)果需要積累大量的事實信息。因此如何解決推薦系統(tǒng)的冷啟動問題是改進(jìn)推薦質(zhì)量的又一關(guān)鍵問題。
移動終端的私有性可以保證用戶獲取到有效的用戶信息需求。但是移動終端設(shè)備在內(nèi)存,處理能力方面比較有限,決定了移動終端設(shè)備不能處理復(fù)雜的人機交互功能,因此移動網(wǎng)絡(luò)信息推薦系統(tǒng)不能像傳統(tǒng)的Internet信息推薦系統(tǒng)那樣在客戶端運行監(jiān)控用戶行為特征的程序。移動終端屏幕大小的限制,以及操控能力的限制決定了移動終端在顯示能力方面的不足,它不可能像PC上以圖文并茂的方式進(jìn)行信息顯示以及動態(tài)的輸入客戶端請求。移動設(shè)備的電源以及數(shù)據(jù)存儲能力方面的限制,決定了移動推薦系統(tǒng)不能不間斷的向終端用戶推薦信息。因此,針對移動終端設(shè)備的種種不足,對移動個性化推薦系統(tǒng)的推薦準(zhǔn)確性,推薦信息類型,推薦方式以及終端的顯示與信息反饋形式都提出了新的要求。
移動網(wǎng)絡(luò)具有移動性,靈活性,使得人們獲取網(wǎng)絡(luò)信息不再約束在固定的位置上。移動網(wǎng)絡(luò)質(zhì)量受到自身帶寬,地理位置等因素的限制,傳輸能力不能與傳統(tǒng)的有線網(wǎng)絡(luò)相比。因此移動網(wǎng)絡(luò)上進(jìn)行信息傳遞需要考慮更多的問題,比如傳遞信息的格式,信息文件的大小,降低網(wǎng)絡(luò)延時等。移動網(wǎng)絡(luò)的個性化信息推薦對推薦的準(zhǔn)確度,系統(tǒng)響應(yīng)速度,獲取用戶信息反饋等方面都提出了新的要求。因此一個高效的移動個性化推薦系統(tǒng)應(yīng)該具有運行簡單,響應(yīng)速度快,推薦準(zhǔn)確及時的特點。當(dāng)前移動終端的計算能力相對有限,為了提高用戶的使用體驗,移動客戶端程序應(yīng)該盡量減少計算數(shù)據(jù)量。
移動互聯(lián)網(wǎng)的迅速發(fā)展,勢必會使移動互聯(lián)網(wǎng)獲取有價值信息變得越困難,移動個性化推薦成為今后解決移動互聯(lián)網(wǎng)信息膨脹的主要方式。文章主要論述了與移動網(wǎng)絡(luò)中應(yīng)用個性化信息推薦技術(shù)相關(guān)的技術(shù),以及影響移動網(wǎng)絡(luò)個性化信息推薦的主要因素分析。
[1]劉枚蓮,叢曉琪,楊懷珍.改進(jìn)鄰居集合的個性化推薦算法[J].計算機工程,2009(11).
[2]張瑞華,周延年,王樅,李蕾.移動終端離線瀏覽系統(tǒng)的新聞推薦研究[J].北京郵電大學(xué)學(xué)報,2006,12(6).