• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于用戶興趣挖掘技術(shù)的移動校園信息推送系統(tǒng)研究與探索

      2014-12-13 20:18:45黃蓉
      軟件工程 2014年12期
      關(guān)鍵詞:移動終端

      黃蓉

      摘? 要:本文主要從分析現(xiàn)有的校園信息發(fā)布平臺出發(fā),圍繞個性化主動信息推送這一目標(biāo),研究及探索一種基于移動網(wǎng)絡(luò)和用戶興趣挖掘技術(shù)的校園信息推送系統(tǒng)。針對不同的用戶訂制個性化的服務(wù)策略和功能模式,并通過分析用戶信息和瀏覽行為以及用戶信息訂閱來構(gòu)建用戶興趣模型,主動將用戶可能感興趣的信息推送給他們,并對推送結(jié)果進行反向跟蹤,實現(xiàn)信息的“推”技術(shù),以此構(gòu)建一個全新的校園信息推送服務(wù)系統(tǒng),達到信息的主動投放和精確獲取的效果。

      關(guān)鍵詞:校園信息推送系統(tǒng);興趣挖掘;移動終端;Android

      中圖分類號:TP319?????????? 文獻標(biāo)識碼:A

      1?? 引言(Introduction)

      校園信息發(fā)布平臺[1]是校園信息化建設(shè)的核心內(nèi)容之一,通常用于發(fā)布學(xué)校內(nèi)部各行政機構(gòu)、院系部門、課程平臺、學(xué)生社團的相關(guān)信息,有利于職能部門工作的開展和信息公布,并能有效促進學(xué)校與社會的信息交流。一個全面、快捷、個性化的校園信息平臺能讓師生實時關(guān)注、參與、發(fā)布校園信息,如:會議、活動、講座、展覽、比賽、實習(xí)、求職等,讓師生充分利用好身邊的資源,為工作學(xué)習(xí)帶來便利,并根據(jù)自己的興趣和愛好,結(jié)交興趣相投的朋友,使校園生活充實起來,同時能有力提高校區(qū)管理和服務(wù)水平,提升學(xué)校的社會競爭力和知名度。

      隨著互聯(lián)網(wǎng)時代的逐步深入,移動互聯(lián)網(wǎng)蓬勃發(fā)展,移動終端設(shè)備不斷普及,傳統(tǒng)的校園信息發(fā)布形式已經(jīng)不能滿足當(dāng)今智慧校園“任何時間、任何地點、任何方式”的信息發(fā)布要求,同時,目前校園的信息平臺通常只是在Web上將信息內(nèi)容進行簡單的按時間或者分類展示,用戶被動瀏覽的信息不一定與用戶興趣相關(guān),不容易取得用戶的共鳴、信任與支持,用戶必須能夠準(zhǔn)確地表達自己的信息需求,才能獲得所需的信息,這樣勢必制約了用戶獲取信息的興趣和能力;另一方面,移動設(shè)備性能和移動互聯(lián)網(wǎng)帶寬及流量的限制也要求減少無效信息的發(fā)送。在此背景下,個性化移動信息推送服務(wù)[2]應(yīng)運而生,和傳統(tǒng)“人找信息”的方式不同的是,它提供給用戶一種新的服務(wù)模式以解決“移動信息爆炸(過載)”[3]的問題。因此,研究并設(shè)計一種基于興趣挖掘技術(shù)[4]的移動校園信息推送系統(tǒng)對校園信息化建設(shè)都有著重要的意義。

      本文主要從分析現(xiàn)有的校園信息發(fā)布平臺出發(fā),圍繞個性化主動信息推送這一目標(biāo),構(gòu)建基于移動網(wǎng)絡(luò)和用戶興趣挖掘技術(shù)的校園信息推送服務(wù)系統(tǒng)。智能推送服務(wù)系統(tǒng)基于移動終端,方便隨時隨地訪問,并能通過用戶信息訂閱以及分析用戶信息和瀏覽行為來獲得用戶的興趣,主動將這些用戶可能感興趣的信息推送給他們,達到信息的主動投放和精確獲取的效果。

      2?? 問題的由來(Origins)

      目前,國內(nèi)校園信息發(fā)布、宣傳、獲取、溝通、共享的各種渠道與平臺普遍存在不足,已有的校園信息發(fā)布平臺一般僅基于Web,雖然Web有其信息量大、不需安裝的優(yōu)點,但會受到時間、地點的限制,獲取信息不及時;而使用手機訪問院校Web,也有界面呈現(xiàn)不友好、操作不方便等缺點;其他移動通信常用解決方案如SMS、微信,雖然使用簡單,但又具有信息量小,功能不能個性化訂制,且需依賴服務(wù)提供商等局限,不能使用戶真正享受到快捷準(zhǔn)確的信息服務(wù),不能滿足校園信息平臺主動投放和精確獲取的服務(wù)要求。

      主動信息獲取方式很多,目前應(yīng)用最廣泛的是推送技術(shù)[5]。推送技術(shù),最早由PointCast Network公司在1996年提出,推出目的是為了提高計算機網(wǎng)絡(luò)的信息獲取效率。作為一種高效快捷的主動信息獲取方法,推送技術(shù)是解決信息爆炸問題的有效途徑,并為信息服務(wù)的智能化、個性化及主動性提供了新的方向。自此,國外各機構(gòu)就開始研究如何利用推送技術(shù)更好地滿足用戶的個性化信息需求問題,研究基于個性化用戶需求的信息分析、篩選和過濾技術(shù),并且開始將Push技術(shù)應(yīng)用于Web信息主動推送服務(wù)。Push技術(shù)的應(yīng)用研究涉及個性化產(chǎn)品推薦、信息導(dǎo)覽與檢索、信息推薦系統(tǒng)、信息共享平臺、移動平臺推薦服務(wù)等眾多領(lǐng)域。

      國內(nèi)對Push技術(shù)的研究雖然起步較晚,但從2004年至今的十年間,國內(nèi)有關(guān)Push技術(shù)的文獻就涌現(xiàn)了近2000篇,其中有相當(dāng)大的部分是對Push技術(shù)的理論和應(yīng)用的研究。最近五年,研究主要集中在信息檢索、電子商務(wù)個性化服務(wù)、WEB目錄推薦、圖書館個性化主動服務(wù)以及手機等移動終端推薦服務(wù)的Push技術(shù)等領(lǐng)域,尤其是移動推薦領(lǐng)域,通過獲取和預(yù)測移動終端用戶潛在偏好及興趣來過濾不相關(guān)的信息,為移動終端用戶提供能滿足其個性化需求的信息,逐漸成為緩解“移動信息過載”的有效手段,獲得越來越多的關(guān)注。其優(yōu)勢在于:①提高消息準(zhǔn)確率。消息推送技術(shù)可以有效控制搜索的廣度和深度,查找、過濾類似消息和無關(guān)消息,提高消息服務(wù)的準(zhǔn)確性。②節(jié)省查找時間開銷。在移動網(wǎng)絡(luò)環(huán)境下,網(wǎng)絡(luò)情況不穩(wěn)定,用戶的時間被切割成“碎片”,很難保證查找消息的時間,利用消息推送技術(shù)可以有效減少獲取消息的時間,避免無目的性的點擊查詢。

      ③推送和保存的消息形式多樣。可以推送各種圖像、小程序、音頻、視頻等,并且可以文本文件的形式保存在用戶設(shè)備。④提高消息推送效率。消息推送服務(wù)器可以針對用戶興趣對推送消息進行智能識別和預(yù)測,按照用戶興趣模型自動篩選、搜集信息,定期向目標(biāo)用戶主動發(fā)送滿足不同用戶興趣的信息。

      在關(guān)注信息推送技術(shù)優(yōu)點的同時,本文通過研究分析發(fā)現(xiàn):信息推送技術(shù)在信息服務(wù)的實際應(yīng)用中仍然存在信息過載情況嚴(yán)重、個性化程度不高等有待解決的問題,還需對其進行完善和優(yōu)化。目前,國內(nèi)外針對推送技術(shù)具體方法及其改進策略的研究主要集中在Web挖掘技術(shù)、RSS推送技術(shù)、Agent推送技術(shù)、基于網(wǎng)格的信息推送技術(shù)和協(xié)同過濾(Collaborative filtering)推送技術(shù)。但就目前推送技術(shù)的應(yīng)用現(xiàn)狀而言,上述多數(shù)推送技術(shù)的個性化程度不強,難以滿足用戶有針對性的推送要求,具體表現(xiàn)在訂制信息時要求用戶具有專業(yè)的知識背景,用戶只有能準(zhǔn)確地表達自己的信息需求,才有可能獲得準(zhǔn)確的相關(guān)信息,這樣往往制約了用戶獲取信息的興趣和能力,因此以上技術(shù)在信息服務(wù)中均表現(xiàn)不佳。endprint

      近年來,針對用戶興趣建模的相關(guān)技術(shù)已逐漸成為信息推送服務(wù)系統(tǒng)中最關(guān)鍵也是最需解決的研究內(nèi)容,如何進一步挖掘用戶可能興趣,關(guān)注用戶潛在需求已經(jīng)成為數(shù)據(jù)挖掘領(lǐng)域的研究熱點。2012年,由王微微等人提出的基于用戶行為的興趣度模型,可以利用期望最大化算法并結(jié)合用戶興趣,實現(xiàn)用戶聚類,以此創(chuàng)建用戶興趣度模型,進而對用戶進行個性化信息管理[6];趙妍、趙學(xué)民在《基于CURE的用戶聚類算法研究》中提出可以根據(jù)用戶興趣的主要特征,提取元素的顯著屬性進行預(yù)聚類,為小類合并提供合理的初始類集,達到聚類降維的效果[7]。雖然這些聚類算法在個性化推薦應(yīng)用中表現(xiàn)出較好的效果和質(zhì)量,但是這些用戶模型的建立都是基于傳統(tǒng)互聯(lián)網(wǎng),由于移動用戶與傳統(tǒng)互聯(lián)網(wǎng)用戶相比面臨著更加融合、復(fù)雜、協(xié)作的移動網(wǎng)絡(luò)環(huán)境和泛在的移動信息提供環(huán)境,只有在充分、準(zhǔn)確提取和預(yù)測移動用戶在移動網(wǎng)絡(luò)環(huán)境下對各種類型移動信息內(nèi)容的偏好后,才能有效的生成移動推薦[8]。因此,盡管移動推薦系統(tǒng)的基本思想與傳統(tǒng)互聯(lián)網(wǎng)推薦系統(tǒng)相似,仍需著重考慮移動網(wǎng)絡(luò)環(huán)境給推薦系統(tǒng)帶來的影響,如:移動推薦系統(tǒng)中用戶移動性強,移動信息推薦需求受上下文影響很大;且移動設(shè)備屏幕小、處理能力差、輸入受限;無線網(wǎng)絡(luò)帶寬窄、穩(wěn)定性不佳等因素使其對信息準(zhǔn)確度和實時性的要求更高,從而使得適應(yīng)傳統(tǒng)互聯(lián)網(wǎng)的用戶推薦方法并不能直接應(yīng)用到移動推薦系統(tǒng)中,在此方面還有許多工作需要研究和解決。

      3?? 技術(shù)分析(Technical analysis)

      目前關(guān)于信息推送和用戶興趣模型建模技術(shù)的研究不少,但卻沒有一套完整的、成熟的技術(shù)體系,導(dǎo)致在此基礎(chǔ)上的應(yīng)用不多,特別是將移動信息推送和用戶興趣挖掘技術(shù)相結(jié)合的研究更是少之又少,需要進一步的研究。

      根據(jù)以上分析,本文提出了基于用戶興趣挖掘技術(shù)且適用于移動網(wǎng)絡(luò)的個性化信息推送模型,并以此為基礎(chǔ)提出個性化信息推送服務(wù)框架,針對不同用戶設(shè)計個性化的服務(wù)策略和系統(tǒng),通過分析用戶信息和瀏覽行為以及信息訂閱來獲得用戶的興趣,主動將這些用戶可能感興趣的信息推送給他們,并對推送結(jié)果進行反向跟蹤,實現(xiàn)信息的“推”技術(shù),以此構(gòu)建一個全新的校園信息推送服務(wù)系統(tǒng)。

      本文通過深入研究并借鑒國內(nèi)外校園信息平臺已有的研究成果,理論結(jié)合實際,在現(xiàn)有研究工作的基礎(chǔ)上,開發(fā)個性化校園信息推送系統(tǒng),探索和研究校園信息平臺的新思路、新方法,將根據(jù)移動互聯(lián)網(wǎng)中校園用戶興趣的各種特點,深入研究移動信息推送服務(wù)中用戶興趣管理和興趣更新的難題,并結(jié)合數(shù)學(xué)建模技術(shù),構(gòu)建用戶興趣更新模型和用戶興趣管理模型,建立適用于移動互聯(lián)網(wǎng)的基于用戶興趣挖掘技術(shù)的校園信息推送模型,最終研究設(shè)計出基于移動終端的個性化校園信息推送系統(tǒng)原型,對研究成果進行測試、驗證,并調(diào)優(yōu)。

      4?? 基于用戶興趣挖掘技術(shù)的移動校園信息推送系

      統(tǒng)設(shè)計(Design of mobile campus information

      push system based on user interest in mining

      technology )

      4.1?? 移動校園信息推送系統(tǒng)總體架構(gòu)設(shè)計

      在充分對移動校園信息推送系統(tǒng)的業(yè)務(wù)需求、網(wǎng)絡(luò)需求進行綜合分析后,本文研究的移動校園信息推送系統(tǒng)總體架構(gòu)采用C/S架構(gòu),分為客戶端和服務(wù)器端。

      客戶端需安裝移動校園信息推送APP應(yīng)用軟件,應(yīng)用基于Android平臺和應(yīng)用程序框架進行開發(fā),分為展示層、業(yè)務(wù)層和持久層。展示層主要負(fù)責(zé)調(diào)用視圖展示系統(tǒng)中定義的各類信息;業(yè)務(wù)層主要提供接收、存儲、維護服務(wù)器端推送過來的信息,并提供對各類信息的查詢、維護和簡單的業(yè)務(wù)邏輯功能;持久層提供各類推送信息、多媒體資源和日志記錄等的持久化存儲功能,提供數(shù)據(jù)、文件的通用訪問接口。

      服務(wù)器端則包括信息的檢索、維護、信息推送和權(quán)限控制等關(guān)鍵業(yè)務(wù)功能,采用成熟的開源框架進行開發(fā),分為業(yè)務(wù)層、服務(wù)層、數(shù)據(jù)層三層架構(gòu)。業(yè)務(wù)層提供信息檢索、信息分發(fā)、信息維護、信息下載、信息內(nèi)容過濾等服務(wù);服務(wù)層為業(yè)務(wù)層提供支持,提供信息分發(fā)、信息維護、權(quán)限管理和各類推送方式接口,是信息推送系統(tǒng)的核心,負(fù)責(zé)收集用戶使用習(xí)慣、分析用戶興趣、信息維護、推送方式選擇等核心服務(wù);數(shù)據(jù)層提供資源目錄、基本信息、用戶訂閱信息、權(quán)限和日志數(shù)據(jù)的持久化存儲和文件和數(shù)據(jù)庫訪問接口。

      客戶端和服務(wù)器端之間通過Socket或HTTP方式連接,客戶端用戶登錄后,系統(tǒng)記錄用戶的連接信息,并定時向客戶端發(fā)送?;钸B接信息,直至客戶端退出。無線通信網(wǎng)絡(luò)主要由移動通信基站(如3G、4G網(wǎng)絡(luò)等)和Wi-Fi網(wǎng)絡(luò)提供通信功能。

      4.2?? 消息訂閱及推送機制研究

      用戶興趣模型建立的一個主要依據(jù)就是用戶對消息的訂閱列表。用戶訂閱列表建立在服務(wù)器中系統(tǒng)創(chuàng)建的消息分類數(shù)據(jù)結(jié)構(gòu)基礎(chǔ)之上,消息分類數(shù)據(jù)結(jié)構(gòu)在系統(tǒng)初始化時即被創(chuàng)建,在服務(wù)器運行期間可以動態(tài)新增、刪除、修改、移動和管理消息分類子項。訂閱的內(nèi)容包括用戶消息和系統(tǒng)消息。系統(tǒng)消息是系統(tǒng)強制要求用戶訂閱的內(nèi)容,普通用戶不能隨意刪除或修改該消息,訂閱規(guī)則由各部門相關(guān)管理人員根據(jù)實際需求制定及調(diào)整,根據(jù)規(guī)則推送消息;用戶消息則是用戶根據(jù)興趣自行訂閱相關(guān)內(nèi)容。不論是系統(tǒng)消息還是用戶消息在申請時都必須對訂閱用戶權(quán)限級別進行審核,如果經(jīng)審核發(fā)現(xiàn)訂閱內(nèi)容要求權(quán)限高于申請人員的已有權(quán)限,系統(tǒng)將提示用戶沒有訂閱權(quán)限,不予執(zhí)行此次訂閱要求。

      消息推送機制包括消息推送和消息反饋兩個階段。推送階段有人工消息推送和系統(tǒng)消息推送方法實現(xiàn),人工消息推送是指管理人員人工選擇推送內(nèi)容和方式將消息推送到指定的接收端;系統(tǒng)消息推送是服務(wù)器將處理過的消息按要求自動推送到接收端。其中系統(tǒng)推送方式是指服務(wù)器根據(jù)消息的時間要求和重要程度來智能選擇推送方式,以此來保障消息的實時性和準(zhǔn)確性要求,實現(xiàn)推送效率最優(yōu)。消息按重要程度分為高優(yōu)先級、中優(yōu)先級和低優(yōu)先級三個層次;消息的實時性要求分為緊急、一般、不緊急三個層次。endprint

      消息反饋階段可以保證重要消息能夠安全及時被推送到指定客戶端,采取消息跟蹤反饋機制實現(xiàn),流程如下:

      (1)首先,每當(dāng)服務(wù)器端發(fā)送一條消息到客戶端,先根據(jù)消息的重要程度進行判斷,如果是重要消息,則開始跟蹤,并啟動一個計時器進行計時。

      (2)客戶端收到消息后立即將一條反饋消息發(fā)還給服務(wù)器端。

      (3)如果服務(wù)器端在計時器超時前接收到客戶端的反饋消息,則終止計時,并將反饋消息存儲到反饋消息表中。

      (4)如果服務(wù)器端超時仍未收到反饋消息,則重新發(fā)送該條消息到客戶端,重啟計時器,重復(fù)步驟(3),同時令發(fā)送失敗計數(shù)器加1;如果計數(shù)器大于4,系統(tǒng)則認(rèn)為該客戶端不可達,停止發(fā)送此消息到該客戶端,同時將未成功發(fā)送消息存到表中。

      通過該消息跟蹤反饋機制,系統(tǒng)能夠清楚知道重要消息的發(fā)送情況,有利于保障實時性和管理人員后階段行動安排。

      同時,為了提升消息推送的準(zhǔn)確度,推送之前系統(tǒng)先對消息進行過濾,消息過濾模塊的主要功能就是針對不同用戶特征,綜合多個制約因素對推送消息進行篩選和過濾。本文中消息過濾主要參考因素包括用戶的興趣訂閱列表、系統(tǒng)訂閱規(guī)則、用戶當(dāng)前上下文、所屬部門及職務(wù)和當(dāng)前位置等。

      4.3?? 用戶興趣挖掘算法研究

      如何針對不同用戶特征定制個性化服務(wù),挖掘用戶感興趣的偏好是最有效的手段,通過用戶興趣挖掘,建立用戶興趣模型,不僅可以保障推送到用戶的消息的精確度,而且可以發(fā)現(xiàn)潛藏興趣。用戶興趣分為顯式興趣和隱式興趣:

      I=X+Y

      公式中:I表示用戶所有興趣,X表示用戶顯式興趣,Y表示用戶隱式興趣。

      其中,顯式興趣較易獲得,我們可以先根據(jù)不同用戶對各種類型消息的訂閱列表取得用戶感興趣的消息清單,然后統(tǒng)計每位用戶對不同類型消息的訪問次數(shù),并進行排名,序號靠前的就是用戶相對比較感興趣的消息類別。雖然我們可以通過上述計算求得用戶的顯式興趣,但如何發(fā)掘用戶的潛在興趣仍是研究的難題。數(shù)據(jù)挖掘技術(shù)中的聚類算法可以通過分析一類用戶群體的共同特征,以此獲得某個特定用戶的隱式興趣。

      聚類算法的實現(xiàn)原理是在數(shù)據(jù)庫中創(chuàng)建用戶訪問記錄表,用戶的所有訪問記錄全部存儲在此表中,表結(jié)構(gòu)參見表1。

      表1 用戶訪問記錄存儲結(jié)構(gòu)表

      Tab.1 User access records storage structure

      主鍵?用戶ID?信息分類ID?訪問次數(shù)?訪問時間

      但是,當(dāng)用戶數(shù)量龐大,系統(tǒng)使用時間較長時,訪問記錄表將變得非常巨大,需要按時間周期分成不同子表,每個時間周期對應(yīng)一張子表,本周期內(nèi)的所有用戶訪問記錄都保存在這張子表中,系統(tǒng)按時間檢索不同子表,從而有效提高檢索速度。

      系統(tǒng)定期分析此時間周期的用戶訪問記錄子表,挖掘用戶潛在興趣。主要步驟如下:首先構(gòu)建用戶相似度矩陣進行聚類。用戶相似度算法可以反映兩個用戶的相似程度,系統(tǒng)著重考慮此時間周期內(nèi)的用戶相似度,同時兼顧前一時間周期的用戶相似度,通過加權(quán)求和得出用戶總體相似度,計算公式如下:

      式中:—當(dāng)前兩個用戶間的相似度,—兩個用戶的訪問相同鏈接次數(shù),—兩個用戶所訪問的鏈接的總數(shù)。

      由此可以得出多個用戶的相似度矩陣如下:

      系統(tǒng)將用戶訪問記錄分割成以T為時間間隔的表中,為了保持?jǐn)?shù)據(jù)的連續(xù)性和提高系統(tǒng)處理效率,系統(tǒng)只生成最近時間間隔T內(nèi)用戶間相似矩陣,然后與上一次最新用戶間相似矩陣加權(quán)求和,取得最新的用戶間相似矩陣,數(shù)學(xué)表示為:

      式中:—最新的用戶間相似矩陣,—上一次最新用戶間相似矩陣,—最近時間間隔T內(nèi)用戶間相似矩陣。

      在加權(quán)求和時,如果某用戶被刪除,將中矩陣對應(yīng)的行和列刪除;如果添加新用戶,則在矩陣的行和列尾部添加相應(yīng)的行和列,新加項的初始值均為0,后續(xù)再根據(jù)訪問情況進行修改,求得用戶的相似矩陣后,再通過用戶瀏覽路徑算法對用戶進行聚類。本文中,由于采用了分時間周期加權(quán)求和的方法,避免了聚類算法每次對所有的用戶來求用戶間相似矩陣的問題,時間開銷大大減少。

      5?? 結(jié)論(Conclusion)

      本文通過研究移動信息訂閱和信息推送機制以及基于聚類算法的用戶興趣挖掘和服務(wù)器端混合信息過濾技術(shù),設(shè)計并實現(xiàn)一個基于用戶興趣挖掘技術(shù)的移動校園信息推送服務(wù)系統(tǒng),并在已覆蓋Wi-Fi等移動互聯(lián)網(wǎng)的校園區(qū)域內(nèi)進行測試,對系統(tǒng)功能進行測試驗證。系統(tǒng)能過濾用戶感興趣的信息,提高信息推送的質(zhì)量和準(zhǔn)確度,減少無關(guān)信息推送到客戶端;同時能通過數(shù)據(jù)挖掘技術(shù),進一步發(fā)掘用戶潛在興趣,從而獲得更好的用戶體驗。本文的研究是對現(xiàn)有信息推送技術(shù)的優(yōu)化和改進,在傳統(tǒng)的基礎(chǔ)上,結(jié)合數(shù)據(jù)挖掘技術(shù)和用戶模型管理,建立一套適合移動網(wǎng)絡(luò)的混合型信息推送系統(tǒng),結(jié)合用戶身份信息、用戶訂閱的主題、用戶所屬的任務(wù)信息、用戶所在位置等信息,通過數(shù)據(jù)挖掘獲取用戶潛在興趣,解決用戶模型的更新問題,是對現(xiàn)有信息推送技術(shù)理論的有力補充與完善,同時,雖然本文是圍繞校園信息推送系統(tǒng)進行研究,但是研究構(gòu)建的基于用戶興趣挖掘技術(shù)并適用于移動網(wǎng)絡(luò)的個性化信息推送模型同樣適用于其他應(yīng)用領(lǐng)域,如:移動新聞信息推送、移動旅游信息推送、移動電子商務(wù)個性化服務(wù)等。因此,研究完成后,研究成果將具有廣泛的項目應(yīng)用前景。

      參考文獻(References)

      [1] 王晨輝.基于Android平臺校園信息發(fā)布系統(tǒng)[J].數(shù)字技術(shù)與

      應(yīng)用,2010,(08):123.

      [2] 孟祥武,等.移動推薦系統(tǒng)及其應(yīng)用[J].軟件學(xué)報,2013,24(1):

      91-108.

      [3] 王立才,孟祥武.移動網(wǎng)絡(luò)服務(wù)中基于認(rèn)知心理學(xué)的用戶偏好

      提取方法[J].電子學(xué)報,2011,39(11):2547-2553.

      [4] 林霜梅,等.個性化推薦系統(tǒng)中的用戶建模及特征選擇[J].計

      算機工程,2007,33(17):196-230.

      [5] 廖軼宸.基于移動網(wǎng)絡(luò)的混合型信息推送系統(tǒng)的研究[J].計算

      機工程與設(shè)計,2012,33(8):3268-3273.

      [6] 王微微,夏秀峰,李曉明.一種基于用戶行為的興趣度模型[J].

      計算機工程與應(yīng)用,2012,48(8):148-151.

      [7] 趙妍,趙學(xué)民.基于CURE的用戶聚類算法研究[J].計算機工

      程與應(yīng)用,2012,48(11):97-101.

      [8] 宋樂怡,熊輝,張蓉.下一代移動推薦系統(tǒng)[J].華東師范大學(xué)學(xué)

      報(自然科學(xué)版),2013,5(3):37-45.

      作者簡介:

      黃? 蓉(1981-),女,碩士,講師.研究領(lǐng)域:移動計算,通信

      工程.endprint

      消息反饋階段可以保證重要消息能夠安全及時被推送到指定客戶端,采取消息跟蹤反饋機制實現(xiàn),流程如下:

      (1)首先,每當(dāng)服務(wù)器端發(fā)送一條消息到客戶端,先根據(jù)消息的重要程度進行判斷,如果是重要消息,則開始跟蹤,并啟動一個計時器進行計時。

      (2)客戶端收到消息后立即將一條反饋消息發(fā)還給服務(wù)器端。

      (3)如果服務(wù)器端在計時器超時前接收到客戶端的反饋消息,則終止計時,并將反饋消息存儲到反饋消息表中。

      (4)如果服務(wù)器端超時仍未收到反饋消息,則重新發(fā)送該條消息到客戶端,重啟計時器,重復(fù)步驟(3),同時令發(fā)送失敗計數(shù)器加1;如果計數(shù)器大于4,系統(tǒng)則認(rèn)為該客戶端不可達,停止發(fā)送此消息到該客戶端,同時將未成功發(fā)送消息存到表中。

      通過該消息跟蹤反饋機制,系統(tǒng)能夠清楚知道重要消息的發(fā)送情況,有利于保障實時性和管理人員后階段行動安排。

      同時,為了提升消息推送的準(zhǔn)確度,推送之前系統(tǒng)先對消息進行過濾,消息過濾模塊的主要功能就是針對不同用戶特征,綜合多個制約因素對推送消息進行篩選和過濾。本文中消息過濾主要參考因素包括用戶的興趣訂閱列表、系統(tǒng)訂閱規(guī)則、用戶當(dāng)前上下文、所屬部門及職務(wù)和當(dāng)前位置等。

      4.3?? 用戶興趣挖掘算法研究

      如何針對不同用戶特征定制個性化服務(wù),挖掘用戶感興趣的偏好是最有效的手段,通過用戶興趣挖掘,建立用戶興趣模型,不僅可以保障推送到用戶的消息的精確度,而且可以發(fā)現(xiàn)潛藏興趣。用戶興趣分為顯式興趣和隱式興趣:

      I=X+Y

      公式中:I表示用戶所有興趣,X表示用戶顯式興趣,Y表示用戶隱式興趣。

      其中,顯式興趣較易獲得,我們可以先根據(jù)不同用戶對各種類型消息的訂閱列表取得用戶感興趣的消息清單,然后統(tǒng)計每位用戶對不同類型消息的訪問次數(shù),并進行排名,序號靠前的就是用戶相對比較感興趣的消息類別。雖然我們可以通過上述計算求得用戶的顯式興趣,但如何發(fā)掘用戶的潛在興趣仍是研究的難題。數(shù)據(jù)挖掘技術(shù)中的聚類算法可以通過分析一類用戶群體的共同特征,以此獲得某個特定用戶的隱式興趣。

      聚類算法的實現(xiàn)原理是在數(shù)據(jù)庫中創(chuàng)建用戶訪問記錄表,用戶的所有訪問記錄全部存儲在此表中,表結(jié)構(gòu)參見表1。

      表1 用戶訪問記錄存儲結(jié)構(gòu)表

      Tab.1 User access records storage structure

      主鍵?用戶ID?信息分類ID?訪問次數(shù)?訪問時間

      但是,當(dāng)用戶數(shù)量龐大,系統(tǒng)使用時間較長時,訪問記錄表將變得非常巨大,需要按時間周期分成不同子表,每個時間周期對應(yīng)一張子表,本周期內(nèi)的所有用戶訪問記錄都保存在這張子表中,系統(tǒng)按時間檢索不同子表,從而有效提高檢索速度。

      系統(tǒng)定期分析此時間周期的用戶訪問記錄子表,挖掘用戶潛在興趣。主要步驟如下:首先構(gòu)建用戶相似度矩陣進行聚類。用戶相似度算法可以反映兩個用戶的相似程度,系統(tǒng)著重考慮此時間周期內(nèi)的用戶相似度,同時兼顧前一時間周期的用戶相似度,通過加權(quán)求和得出用戶總體相似度,計算公式如下:

      式中:—當(dāng)前兩個用戶間的相似度,—兩個用戶的訪問相同鏈接次數(shù),—兩個用戶所訪問的鏈接的總數(shù)。

      由此可以得出多個用戶的相似度矩陣如下:

      系統(tǒng)將用戶訪問記錄分割成以T為時間間隔的表中,為了保持?jǐn)?shù)據(jù)的連續(xù)性和提高系統(tǒng)處理效率,系統(tǒng)只生成最近時間間隔T內(nèi)用戶間相似矩陣,然后與上一次最新用戶間相似矩陣加權(quán)求和,取得最新的用戶間相似矩陣,數(shù)學(xué)表示為:

      式中:—最新的用戶間相似矩陣,—上一次最新用戶間相似矩陣,—最近時間間隔T內(nèi)用戶間相似矩陣。

      在加權(quán)求和時,如果某用戶被刪除,將中矩陣對應(yīng)的行和列刪除;如果添加新用戶,則在矩陣的行和列尾部添加相應(yīng)的行和列,新加項的初始值均為0,后續(xù)再根據(jù)訪問情況進行修改,求得用戶的相似矩陣后,再通過用戶瀏覽路徑算法對用戶進行聚類。本文中,由于采用了分時間周期加權(quán)求和的方法,避免了聚類算法每次對所有的用戶來求用戶間相似矩陣的問題,時間開銷大大減少。

      5?? 結(jié)論(Conclusion)

      本文通過研究移動信息訂閱和信息推送機制以及基于聚類算法的用戶興趣挖掘和服務(wù)器端混合信息過濾技術(shù),設(shè)計并實現(xiàn)一個基于用戶興趣挖掘技術(shù)的移動校園信息推送服務(wù)系統(tǒng),并在已覆蓋Wi-Fi等移動互聯(lián)網(wǎng)的校園區(qū)域內(nèi)進行測試,對系統(tǒng)功能進行測試驗證。系統(tǒng)能過濾用戶感興趣的信息,提高信息推送的質(zhì)量和準(zhǔn)確度,減少無關(guān)信息推送到客戶端;同時能通過數(shù)據(jù)挖掘技術(shù),進一步發(fā)掘用戶潛在興趣,從而獲得更好的用戶體驗。本文的研究是對現(xiàn)有信息推送技術(shù)的優(yōu)化和改進,在傳統(tǒng)的基礎(chǔ)上,結(jié)合數(shù)據(jù)挖掘技術(shù)和用戶模型管理,建立一套適合移動網(wǎng)絡(luò)的混合型信息推送系統(tǒng),結(jié)合用戶身份信息、用戶訂閱的主題、用戶所屬的任務(wù)信息、用戶所在位置等信息,通過數(shù)據(jù)挖掘獲取用戶潛在興趣,解決用戶模型的更新問題,是對現(xiàn)有信息推送技術(shù)理論的有力補充與完善,同時,雖然本文是圍繞校園信息推送系統(tǒng)進行研究,但是研究構(gòu)建的基于用戶興趣挖掘技術(shù)并適用于移動網(wǎng)絡(luò)的個性化信息推送模型同樣適用于其他應(yīng)用領(lǐng)域,如:移動新聞信息推送、移動旅游信息推送、移動電子商務(wù)個性化服務(wù)等。因此,研究完成后,研究成果將具有廣泛的項目應(yīng)用前景。

      參考文獻(References)

      [1] 王晨輝.基于Android平臺校園信息發(fā)布系統(tǒng)[J].數(shù)字技術(shù)與

      應(yīng)用,2010,(08):123.

      [2] 孟祥武,等.移動推薦系統(tǒng)及其應(yīng)用[J].軟件學(xué)報,2013,24(1):

      91-108.

      [3] 王立才,孟祥武.移動網(wǎng)絡(luò)服務(wù)中基于認(rèn)知心理學(xué)的用戶偏好

      提取方法[J].電子學(xué)報,2011,39(11):2547-2553.

      [4] 林霜梅,等.個性化推薦系統(tǒng)中的用戶建模及特征選擇[J].計

      算機工程,2007,33(17):196-230.

      [5] 廖軼宸.基于移動網(wǎng)絡(luò)的混合型信息推送系統(tǒng)的研究[J].計算

      機工程與設(shè)計,2012,33(8):3268-3273.

      [6] 王微微,夏秀峰,李曉明.一種基于用戶行為的興趣度模型[J].

      計算機工程與應(yīng)用,2012,48(8):148-151.

      [7] 趙妍,趙學(xué)民.基于CURE的用戶聚類算法研究[J].計算機工

      程與應(yīng)用,2012,48(11):97-101.

      [8] 宋樂怡,熊輝,張蓉.下一代移動推薦系統(tǒng)[J].華東師范大學(xué)學(xué)

      報(自然科學(xué)版),2013,5(3):37-45.

      作者簡介:

      黃? 蓉(1981-),女,碩士,講師.研究領(lǐng)域:移動計算,通信

      工程.endprint

      消息反饋階段可以保證重要消息能夠安全及時被推送到指定客戶端,采取消息跟蹤反饋機制實現(xiàn),流程如下:

      (1)首先,每當(dāng)服務(wù)器端發(fā)送一條消息到客戶端,先根據(jù)消息的重要程度進行判斷,如果是重要消息,則開始跟蹤,并啟動一個計時器進行計時。

      (2)客戶端收到消息后立即將一條反饋消息發(fā)還給服務(wù)器端。

      (3)如果服務(wù)器端在計時器超時前接收到客戶端的反饋消息,則終止計時,并將反饋消息存儲到反饋消息表中。

      (4)如果服務(wù)器端超時仍未收到反饋消息,則重新發(fā)送該條消息到客戶端,重啟計時器,重復(fù)步驟(3),同時令發(fā)送失敗計數(shù)器加1;如果計數(shù)器大于4,系統(tǒng)則認(rèn)為該客戶端不可達,停止發(fā)送此消息到該客戶端,同時將未成功發(fā)送消息存到表中。

      通過該消息跟蹤反饋機制,系統(tǒng)能夠清楚知道重要消息的發(fā)送情況,有利于保障實時性和管理人員后階段行動安排。

      同時,為了提升消息推送的準(zhǔn)確度,推送之前系統(tǒng)先對消息進行過濾,消息過濾模塊的主要功能就是針對不同用戶特征,綜合多個制約因素對推送消息進行篩選和過濾。本文中消息過濾主要參考因素包括用戶的興趣訂閱列表、系統(tǒng)訂閱規(guī)則、用戶當(dāng)前上下文、所屬部門及職務(wù)和當(dāng)前位置等。

      4.3?? 用戶興趣挖掘算法研究

      如何針對不同用戶特征定制個性化服務(wù),挖掘用戶感興趣的偏好是最有效的手段,通過用戶興趣挖掘,建立用戶興趣模型,不僅可以保障推送到用戶的消息的精確度,而且可以發(fā)現(xiàn)潛藏興趣。用戶興趣分為顯式興趣和隱式興趣:

      I=X+Y

      公式中:I表示用戶所有興趣,X表示用戶顯式興趣,Y表示用戶隱式興趣。

      其中,顯式興趣較易獲得,我們可以先根據(jù)不同用戶對各種類型消息的訂閱列表取得用戶感興趣的消息清單,然后統(tǒng)計每位用戶對不同類型消息的訪問次數(shù),并進行排名,序號靠前的就是用戶相對比較感興趣的消息類別。雖然我們可以通過上述計算求得用戶的顯式興趣,但如何發(fā)掘用戶的潛在興趣仍是研究的難題。數(shù)據(jù)挖掘技術(shù)中的聚類算法可以通過分析一類用戶群體的共同特征,以此獲得某個特定用戶的隱式興趣。

      聚類算法的實現(xiàn)原理是在數(shù)據(jù)庫中創(chuàng)建用戶訪問記錄表,用戶的所有訪問記錄全部存儲在此表中,表結(jié)構(gòu)參見表1。

      表1 用戶訪問記錄存儲結(jié)構(gòu)表

      Tab.1 User access records storage structure

      主鍵?用戶ID?信息分類ID?訪問次數(shù)?訪問時間

      但是,當(dāng)用戶數(shù)量龐大,系統(tǒng)使用時間較長時,訪問記錄表將變得非常巨大,需要按時間周期分成不同子表,每個時間周期對應(yīng)一張子表,本周期內(nèi)的所有用戶訪問記錄都保存在這張子表中,系統(tǒng)按時間檢索不同子表,從而有效提高檢索速度。

      系統(tǒng)定期分析此時間周期的用戶訪問記錄子表,挖掘用戶潛在興趣。主要步驟如下:首先構(gòu)建用戶相似度矩陣進行聚類。用戶相似度算法可以反映兩個用戶的相似程度,系統(tǒng)著重考慮此時間周期內(nèi)的用戶相似度,同時兼顧前一時間周期的用戶相似度,通過加權(quán)求和得出用戶總體相似度,計算公式如下:

      式中:—當(dāng)前兩個用戶間的相似度,—兩個用戶的訪問相同鏈接次數(shù),—兩個用戶所訪問的鏈接的總數(shù)。

      由此可以得出多個用戶的相似度矩陣如下:

      系統(tǒng)將用戶訪問記錄分割成以T為時間間隔的表中,為了保持?jǐn)?shù)據(jù)的連續(xù)性和提高系統(tǒng)處理效率,系統(tǒng)只生成最近時間間隔T內(nèi)用戶間相似矩陣,然后與上一次最新用戶間相似矩陣加權(quán)求和,取得最新的用戶間相似矩陣,數(shù)學(xué)表示為:

      式中:—最新的用戶間相似矩陣,—上一次最新用戶間相似矩陣,—最近時間間隔T內(nèi)用戶間相似矩陣。

      在加權(quán)求和時,如果某用戶被刪除,將中矩陣對應(yīng)的行和列刪除;如果添加新用戶,則在矩陣的行和列尾部添加相應(yīng)的行和列,新加項的初始值均為0,后續(xù)再根據(jù)訪問情況進行修改,求得用戶的相似矩陣后,再通過用戶瀏覽路徑算法對用戶進行聚類。本文中,由于采用了分時間周期加權(quán)求和的方法,避免了聚類算法每次對所有的用戶來求用戶間相似矩陣的問題,時間開銷大大減少。

      5?? 結(jié)論(Conclusion)

      本文通過研究移動信息訂閱和信息推送機制以及基于聚類算法的用戶興趣挖掘和服務(wù)器端混合信息過濾技術(shù),設(shè)計并實現(xiàn)一個基于用戶興趣挖掘技術(shù)的移動校園信息推送服務(wù)系統(tǒng),并在已覆蓋Wi-Fi等移動互聯(lián)網(wǎng)的校園區(qū)域內(nèi)進行測試,對系統(tǒng)功能進行測試驗證。系統(tǒng)能過濾用戶感興趣的信息,提高信息推送的質(zhì)量和準(zhǔn)確度,減少無關(guān)信息推送到客戶端;同時能通過數(shù)據(jù)挖掘技術(shù),進一步發(fā)掘用戶潛在興趣,從而獲得更好的用戶體驗。本文的研究是對現(xiàn)有信息推送技術(shù)的優(yōu)化和改進,在傳統(tǒng)的基礎(chǔ)上,結(jié)合數(shù)據(jù)挖掘技術(shù)和用戶模型管理,建立一套適合移動網(wǎng)絡(luò)的混合型信息推送系統(tǒng),結(jié)合用戶身份信息、用戶訂閱的主題、用戶所屬的任務(wù)信息、用戶所在位置等信息,通過數(shù)據(jù)挖掘獲取用戶潛在興趣,解決用戶模型的更新問題,是對現(xiàn)有信息推送技術(shù)理論的有力補充與完善,同時,雖然本文是圍繞校園信息推送系統(tǒng)進行研究,但是研究構(gòu)建的基于用戶興趣挖掘技術(shù)并適用于移動網(wǎng)絡(luò)的個性化信息推送模型同樣適用于其他應(yīng)用領(lǐng)域,如:移動新聞信息推送、移動旅游信息推送、移動電子商務(wù)個性化服務(wù)等。因此,研究完成后,研究成果將具有廣泛的項目應(yīng)用前景。

      參考文獻(References)

      [1] 王晨輝.基于Android平臺校園信息發(fā)布系統(tǒng)[J].數(shù)字技術(shù)與

      應(yīng)用,2010,(08):123.

      [2] 孟祥武,等.移動推薦系統(tǒng)及其應(yīng)用[J].軟件學(xué)報,2013,24(1):

      91-108.

      [3] 王立才,孟祥武.移動網(wǎng)絡(luò)服務(wù)中基于認(rèn)知心理學(xué)的用戶偏好

      提取方法[J].電子學(xué)報,2011,39(11):2547-2553.

      [4] 林霜梅,等.個性化推薦系統(tǒng)中的用戶建模及特征選擇[J].計

      算機工程,2007,33(17):196-230.

      [5] 廖軼宸.基于移動網(wǎng)絡(luò)的混合型信息推送系統(tǒng)的研究[J].計算

      機工程與設(shè)計,2012,33(8):3268-3273.

      [6] 王微微,夏秀峰,李曉明.一種基于用戶行為的興趣度模型[J].

      計算機工程與應(yīng)用,2012,48(8):148-151.

      [7] 趙妍,趙學(xué)民.基于CURE的用戶聚類算法研究[J].計算機工

      程與應(yīng)用,2012,48(11):97-101.

      [8] 宋樂怡,熊輝,張蓉.下一代移動推薦系統(tǒng)[J].華東師范大學(xué)學(xué)

      報(自然科學(xué)版),2013,5(3):37-45.

      作者簡介:

      黃? 蓉(1981-),女,碩士,講師.研究領(lǐng)域:移動計算,通信

      工程.endprint

      猜你喜歡
      移動終端
      基于移動終端平臺的編輯學(xué)習(xí)和交流方法
      出版廣角(2016年21期)2017-01-07 19:12:58
      國內(nèi)移動數(shù)字出版發(fā)展現(xiàn)狀及對策研究
      基于移動終端的高校移動學(xué)習(xí)體系構(gòu)建研究
      移動終端云計算應(yīng)用分析
      手機APP在學(xué)生信息化管理中的應(yīng)用探索
      人間(2016年27期)2016-11-11 17:32:55
      基于移動終端的APP營銷策略研究
      盐亭县| 应城市| 长阳| 浦城县| 星座| 云和县| 扎兰屯市| 宿州市| 溧阳市| 宁河县| 那曲县| 图木舒克市| 鞍山市| 西乌珠穆沁旗| 利津县| 建昌县| 财经| 阿巴嘎旗| 新蔡县| 抚松县| 台东县| 夹江县| 铁力市| 镇平县| 霍林郭勒市| 海安县| 精河县| 宜都市| 玉山县| 沙田区| 方正县| 新蔡县| 南郑县| 海盐县| 瑞安市| 佛冈县| 深州市| 隆德县| 磐石市| 从化市| 嘉禾县|