洪英漢++郭才
摘要:針對(duì)目前綜合信息發(fā)布平臺(tái)信息數(shù)據(jù)量多、內(nèi)容雜、分類(lèi)不科學(xué),導(dǎo)致網(wǎng)絡(luò)訪(fǎng)客淹沒(méi)在信息海洋中。該文提出了基于SVD技術(shù)的智能新聞推薦算法,首先定義用戶(hù)的興趣愛(ài)好模型,根據(jù)用戶(hù)訪(fǎng)問(wèn)網(wǎng)站的日志,不斷調(diào)整用戶(hù)的興趣愛(ài)好模型,實(shí)時(shí)為客戶(hù)提供精準(zhǔn)的內(nèi)容推薦。該算法的設(shè)計(jì)符合目前綜合信息服務(wù)平臺(tái)的實(shí)際需求,系統(tǒng)的實(shí)現(xiàn)證明該算法應(yīng)用的效果良好,同時(shí)具備可擴(kuò)展性。
關(guān)鍵詞:SVD算法; 智能推薦; 數(shù)據(jù)挖掘
中圖分類(lèi)號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2016)07-0160-02
1 構(gòu)建智能新聞推薦系統(tǒng)的意義
1.1傳統(tǒng)的綜合信息發(fā)布模式的不足
傳統(tǒng)的中小微企業(yè)信息綜合發(fā)布平臺(tái)遠(yuǎn)遠(yuǎn)不滿(mǎn)足企業(yè)的發(fā)展需求。在大數(shù)據(jù)時(shí)代的到來(lái),海量的平臺(tái)信息總讓網(wǎng)絡(luò)用戶(hù)眼花繚亂,只會(huì)讓用戶(hù)陷入信息過(guò)載和信息迷航問(wèn)題之中。如何讓中小微企業(yè)在最短時(shí)間內(nèi)獲得最精確的平臺(tái)服務(wù)的同時(shí)提供最精準(zhǔn)的服務(wù)產(chǎn)品,如何讓網(wǎng)絡(luò)用戶(hù)在最短到時(shí)間內(nèi)獲得最精準(zhǔn)的企業(yè)服務(wù)產(chǎn)品,是目前中小微信息服務(wù)平臺(tái)的棘手解決問(wèn)題。個(gè)性化服務(wù)打破了傳統(tǒng)的以被動(dòng)服務(wù)模式,能夠充分利用各種資源優(yōu)勢(shì),主動(dòng)開(kāi)展以滿(mǎn)足用戶(hù)個(gè)性化需求為目的的全方位服務(wù)。
1.2 智能推薦系統(tǒng)的優(yōu)勢(shì)
搭建基于個(gè)性化服務(wù)關(guān)鍵技術(shù)的中小微企業(yè)智能化信息服務(wù)平臺(tái)是眾多中小微企業(yè)的迫切期望。與傳統(tǒng)的信息發(fā)布平臺(tái)比較,具有以下的優(yōu)勢(shì):
1)為平臺(tái)用戶(hù)提供精準(zhǔn)的個(gè)性化服務(wù)信息。通過(guò)個(gè)性化服務(wù)關(guān)鍵技術(shù)對(duì)網(wǎng)絡(luò)用戶(hù)描述文件進(jìn)行準(zhǔn)確分類(lèi)、中小微企業(yè)用戶(hù)描述文件進(jìn)行準(zhǔn)確分類(lèi)、平臺(tái)資源描述文件進(jìn)行準(zhǔn)確分類(lèi),結(jié)合網(wǎng)絡(luò)用戶(hù)、企業(yè)、資源的行為記錄,最終精準(zhǔn)地挖掘適合用戶(hù)的個(gè)性化服務(wù)信息。
2)為平臺(tái)用戶(hù)提供快速的個(gè)性化服務(wù)信息。通過(guò)實(shí)時(shí)獲取平臺(tái)用戶(hù)的行為特征,利用個(gè)性化服務(wù)有關(guān)技術(shù),在較短的時(shí)間內(nèi)獲得平臺(tái)用戶(hù)的興趣行為,把跟用戶(hù)對(duì)應(yīng)的個(gè)性化服務(wù)信息快速地展現(xiàn)給用戶(hù)。
3)提高對(duì)中小微企業(yè)信息化的服務(wù)質(zhì)量,幫助中小微企業(yè)的準(zhǔn)確向客戶(hù)推薦產(chǎn)品。個(gè)性化服務(wù)平臺(tái)提供更具智能化的功能,使得中小微企業(yè)在最短的時(shí)間內(nèi)可以得到平臺(tái)推薦的準(zhǔn)備服務(wù),滿(mǎn)足自身所需。同時(shí)企業(yè)發(fā)布的產(chǎn)品,也在最短時(shí)間內(nèi)通過(guò)平臺(tái)準(zhǔn)備得推薦到網(wǎng)絡(luò)客戶(hù),提高網(wǎng)絡(luò)客戶(hù)的購(gòu)買(mǎi)產(chǎn)品興趣。
總之,基于智能新聞推薦系統(tǒng),從技術(shù)上、模式上、服務(wù)理念都具有非常強(qiáng)的可行性。
2 基于SVD算法的智能新聞推薦系統(tǒng)算法設(shè)計(jì)
根據(jù)中小微企業(yè)信息化服務(wù)平臺(tái)的具體需求,結(jié)合平臺(tái)的軟硬件條件,融入當(dāng)前流行的智能推薦算法,最終設(shè)計(jì)出適合系統(tǒng)的模型,模型如圖1 所示。模型以用戶(hù)興趣愛(ài)好為導(dǎo)向,分析用戶(hù)日常訪(fǎng)問(wèn)日志,結(jié)合相鄰用戶(hù)的興趣及行為特點(diǎn),最終推薦出適合用戶(hù)的相關(guān)資訊。
具體實(shí)現(xiàn)策略如下:
1)判斷用戶(hù)是否新用戶(hù),如果用戶(hù)是新用戶(hù),則按照新聞的訪(fǎng)問(wèn)量由高到低推薦給新用戶(hù);如果用戶(hù)不是新用戶(hù),則通過(guò)SVD推薦算法推薦新聞。
2)用戶(hù)每一次登錄網(wǎng)站,實(shí)時(shí)收集用戶(hù)的訪(fǎng)問(wèn)時(shí)間、訪(fǎng)問(wèn)新聞內(nèi)容、訪(fǎng)問(wèn)次數(shù)等。
3)通過(guò)用戶(hù)訪(fǎng)問(wèn)日志的分析,計(jì)算出該用戶(hù)對(duì)所訪(fǎng)問(wèn)新聞的感興趣度,并記錄進(jìn)數(shù)據(jù)庫(kù)。
4)使用SVD推薦算法,計(jì)算出當(dāng)前用戶(hù)可能感興趣的新聞列表。
5)以上步驟不斷的迭代訓(xùn)練,最終訓(xùn)練出更加準(zhǔn)確的模型。
通過(guò)以上過(guò)程,使得推薦新聞不再像以前一樣,只能推薦訪(fǎng)問(wèn)量由高到低的方式,進(jìn)而推薦出合適用戶(hù)的興趣愛(ài)好,大大提高網(wǎng)址的訪(fǎng)問(wèn)量。
3 基于SVD算法的智能新聞推薦系統(tǒng)的實(shí)現(xiàn)
3.1 主要數(shù)據(jù)庫(kù)設(shè)計(jì)
數(shù)據(jù)庫(kù)中關(guān)鍵的數(shù)據(jù)庫(kù)表有:新聞表,用戶(hù)訪(fǎng)問(wèn)日志表,游客訪(fǎng)問(wèn)日志表,新聞喜愛(ài)度表。
3 總結(jié)
本文提出的基于SVD算法的智能新聞推薦系統(tǒng)構(gòu)建方案目的是為大中型網(wǎng)絡(luò)信息服務(wù)平臺(tái)做好智能化信息服務(wù)。其主要核心思想是利用SVD算法,結(jié)合用戶(hù)的訪(fǎng)問(wèn)日志、興趣愛(ài)好、相鄰客戶(hù)網(wǎng)絡(luò)行為等基礎(chǔ)數(shù)據(jù),最終達(dá)到人性化的信息服務(wù)管理模式,適應(yīng)當(dāng)今信息化服務(wù)的主流趨勢(shì)。
在完成系統(tǒng)研發(fā)過(guò)程中,也發(fā)現(xiàn)了一些不足的問(wèn)題,主要是:智能化模塊算法計(jì)算時(shí)間偏長(zhǎng),影響用戶(hù)體驗(yàn);冷啟動(dòng)問(wèn)題一直是推薦系統(tǒng)的挑戰(zhàn)熱點(diǎn),需要不斷調(diào)整推薦策略。在今后工作中,應(yīng)該做到:第一、將不斷完善推薦算法的準(zhǔn)確率和時(shí)間復(fù)雜度;第二、隨著智能手機(jī)的普及,把智能推薦算法的方案移植到手機(jī)客戶(hù)端中。
參考文獻(xiàn):
[1] 陳清浩.基于SVD的協(xié)同過(guò)濾推薦算法研究[D].成都:西南交通大學(xué),2015.
[2] 推薦系統(tǒng)相關(guān)算法(1):SVD[EB/OL]. http://www.cnblogs.com/FengYan/archive/2012/05/06/2480664.html.
[3] 陸興華,陳平華.基于定量遞歸聯(lián)合熵特征重構(gòu)的緩沖區(qū)流量預(yù)測(cè)算法[J].計(jì)算機(jī)科學(xué),2015(4).
[4] 機(jī)器學(xué)習(xí)經(jīng)典算法12-SVD及其在推薦中的應(yīng)用[EB/OL].http://blog.csdn.net/moodytong/article/details/10085215.
[5] 劉劍波,楊健.基于SVD++與行為分析的社交推薦[J].計(jì)算機(jī)應(yīng)用,2013(Z1).