• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      大數(shù)據(jù)挖掘技術(shù)的圖書館移動(dòng)用戶行為分析

      2020-09-23 08:06:20孫慧
      現(xiàn)代電子技術(shù) 2020年18期
      關(guān)鍵詞:移動(dòng)用戶分析方法數(shù)據(jù)挖掘

      孫慧

      摘? 要: 傳統(tǒng)行為分析方法存在預(yù)測(cè)能力不足、分析片面化,獲取的行為特征數(shù)據(jù)規(guī)律性較差等問(wèn)題,導(dǎo)致得到的分析結(jié)果與實(shí)際不符?;诖耍岢龃髷?shù)據(jù)挖掘技術(shù)的圖書館移動(dòng)用戶行為分析方法。該方法將獲取的大數(shù)據(jù)預(yù)先清洗、篩選,并利用轉(zhuǎn)換算法集成特征數(shù)據(jù);使用BP神經(jīng)網(wǎng)絡(luò)適應(yīng)度函數(shù)構(gòu)建評(píng)估預(yù)測(cè)模型,挖掘行為特征規(guī)律,根據(jù)預(yù)測(cè)結(jié)果將特征相互信息值排序;通過(guò)聚類算法捕捉具有關(guān)聯(lián)的數(shù)據(jù),利用交叉分析法分析用戶行為內(nèi)在性質(zhì),實(shí)現(xiàn)全面的圖書館移動(dòng)用戶行為的全面挖掘。實(shí)驗(yàn)結(jié)果表明,與傳統(tǒng)方法相比,所提分析方法挖掘用戶行為特征數(shù)據(jù)的能力更強(qiáng),分析結(jié)果準(zhǔn)確度更高,可應(yīng)用于現(xiàn)階段圖書館移動(dòng)用戶行為分析。

      關(guān)鍵詞: 圖書館移動(dòng)用戶; 行為分析; 大數(shù)據(jù)挖掘技術(shù); 數(shù)據(jù)獲取; 預(yù)測(cè)建模; 交叉分析

      中圖分類號(hào): TN919?34; TP392? ? ? ? ? ? ? ? ? ?文獻(xiàn)標(biāo)識(shí)碼: A? ? ? ? ? ? ? ? ? ? ? 文章編號(hào): 1004?373X(2020)18?0164?04

      Abstract: As the traditional behavior analysis method has some problems, such as insufficient prediction ability, one?sided analysis and poor regularity of the obtained behavior characteristic data, which leads to the fact that the analysis results are not consistent with the actual situation. On this basis, a library mobile users′behavior analysis based on big data mining technology is proposed. In this method, the acquired big data is cleaned and screened in advance, and the feature data is integrated by means of the transformation algorithm. The fitness function of BP neural network is used to construct the evaluation prediction model, excavate the behavior feature law, and sort the feature mutual information values according to the prediction results. The related data are captured by clustering algorithm, the inherent properties of user behavior are analyzed by means of cross analysis method, and the comprehensive mining of library mobile users′ behavior is realized. The experimental results show that, in comparison with the traditional methods, the proposed analysis method has stronger ability to mining users′behavior features, and higher accuracy of analysis results. It can be applied to the analysis of library mobile users′behavior at present.

      Keywords: library mobile users; behavior analysis; big data mining technology; data acquisition; prediction modeling; cross analysis

      0? 引? 言

      現(xiàn)階段,信息環(huán)境高速變革,趨于全面化發(fā)展,正處于信息化網(wǎng)絡(luò)化時(shí)代。圖書館作為信息供給機(jī)構(gòu)之一,可以深度挖掘圖書館用戶的需求偏好,提供針對(duì)性強(qiáng)的服務(wù)方案,從而達(dá)到吸引用戶的目的。由于圖書館用戶的基本信息量龐大,選擇條件居多,因此針對(duì)海量用戶信息,采用多種方法對(duì)圖書館移動(dòng)用戶的行為進(jìn)行分析,根據(jù)用戶需求偏好的變化情況,提出滿意度更高的服務(wù)方案,完成對(duì)圖書館用戶的維護(hù)工作。由于科技飛速發(fā)展,互聯(lián)網(wǎng)的普及令圖書館的基本職能、服務(wù)方式和服務(wù)內(nèi)容均發(fā)生實(shí)質(zhì)性改變,圖書館正在由過(guò)去的封閉式管理模式,向主動(dòng)化、個(gè)性化開(kāi)發(fā)型圖書館轉(zhuǎn)變。但同時(shí)也給圖書館的發(fā)展帶來(lái)諸多困難,包括圖書館使用率不高、圖書館用戶滿意度較低以及用戶借書率下降等問(wèn)題[1]。為此,相關(guān)研究人員也提出了多種解決方法。

      文獻(xiàn)[2]通過(guò)預(yù)測(cè)算法,對(duì)圖書館移動(dòng)用戶行為進(jìn)行分析;文獻(xiàn)[3]通過(guò)情景分析,挖掘圖書館用戶行為特征;文獻(xiàn)[4]則通過(guò)元分析法采納影響用戶行為的因素,以此確定用戶行為。上述所提出的3種方法,雖然在一定程度上掌握了圖書館用戶的行為特征,但不具有普遍性。當(dāng)圖書館用戶超過(guò)一定數(shù)量時(shí),行為數(shù)據(jù)失去其所具有的行為特征,進(jìn)而失去了用戶。

      針對(duì)上述存在的問(wèn)題,提出大數(shù)據(jù)挖掘技術(shù)的圖書館移動(dòng)用戶行為分析方法。該方法通過(guò)數(shù)據(jù)挖掘,找出海量用戶的行為特征,利用聚類算法獲取行為特征與用戶選擇偏好之間的隱含關(guān)聯(lián),從而制定合理的服務(wù)方案,以提高圖書館針對(duì)性強(qiáng)的管理能力,為圖書館的長(zhǎng)遠(yuǎn)發(fā)展,提供合理的技術(shù)支持。

      1? 圖書館移動(dòng)用戶行為分析

      1.1? 圖書館移動(dòng)用戶行為數(shù)據(jù)獲取與處理

      數(shù)據(jù)獲取和預(yù)處理是數(shù)據(jù)挖掘分析的首要前提,預(yù)處理后的數(shù)據(jù)結(jié)果,直接關(guān)系到分析結(jié)果的可靠程度,因此分析用戶行為,需要預(yù)先獲取圖書館移動(dòng)用戶行為數(shù)據(jù),并對(duì)此數(shù)據(jù)進(jìn)行過(guò)濾。從圖書館應(yīng)用系統(tǒng)的源數(shù)據(jù)庫(kù)中,抽取圖書館移動(dòng)用戶的基本訪問(wèn)信息,并對(duì)這些基本信息進(jìn)行預(yù)處理,過(guò)程如圖1所示。

      現(xiàn)階段的數(shù)據(jù)抽取方式主要包括全量抽取和增量抽取。本文提出的分析方法,在全量抽取的基礎(chǔ)上,增量抽取insert,update或者delete數(shù)據(jù)[5]。通常,在這些龐大的用戶信息數(shù)據(jù)中,包含有不完整、質(zhì)量差的基本信息數(shù)據(jù),從而無(wú)法從這些數(shù)據(jù)中獲取有價(jià)值的信息。為了避免因數(shù)據(jù)采集錯(cuò)誤、計(jì)算錯(cuò)誤等失誤造成噪聲、不一致且重復(fù)數(shù)據(jù)的出現(xiàn),需對(duì)這些數(shù)據(jù)進(jìn)行過(guò)濾清洗,實(shí)現(xiàn)對(duì)數(shù)據(jù)的預(yù)處理[6?7]。首先將獲取的數(shù)據(jù)清洗,通過(guò)清洗發(fā)現(xiàn)、糾正數(shù)據(jù)集合中的可識(shí)別錯(cuò)誤,同時(shí)檢查數(shù)據(jù)是否屬性一致、真實(shí)有效。對(duì)于存在問(wèn)題的集合,需要填補(bǔ)遺漏數(shù)據(jù)、消除異常數(shù)據(jù)以及平滑噪聲數(shù)據(jù),分別抽取、整合集合中的清洗數(shù)據(jù),通過(guò)轉(zhuǎn)換將數(shù)據(jù)集合統(tǒng)一格式,去除集合中冗余等數(shù)據(jù),合并數(shù)據(jù)意義一致或?qū)傩灶悇e相似的數(shù)據(jù),再將數(shù)據(jù)集合到一個(gè)新的數(shù)據(jù)集中,實(shí)現(xiàn)對(duì)清洗數(shù)據(jù)的集成[8]。集成結(jié)果如表1所示。

      根據(jù)表1中集成的數(shù)據(jù)信息,利用轉(zhuǎn)換算法對(duì)行為特征數(shù)據(jù)進(jìn)行轉(zhuǎn)換處理,該算法的計(jì)算公式為:

      式中:[H]表示轉(zhuǎn)換后得到的評(píng)價(jià)指標(biāo);[n]表示轉(zhuǎn)換次數(shù);[λ]表示移動(dòng)用戶的日?;顒?dòng)參數(shù)。利用該公式轉(zhuǎn)換不同行為特征數(shù)據(jù)集合,根據(jù)所獲結(jié)果將集合無(wú)規(guī)律的混合,重新按照數(shù)據(jù)特征屬性劃分集合。

      1.2? 評(píng)估預(yù)測(cè)模型挖掘行為變化規(guī)律

      評(píng)估預(yù)測(cè)模型是數(shù)據(jù)挖掘過(guò)程中的關(guān)鍵步驟,該環(huán)節(jié)直接決定了分析結(jié)果的可靠程度[9],因此該文以上述數(shù)據(jù)為基礎(chǔ),構(gòu)建評(píng)估預(yù)測(cè)模型,利用該模型分析圖書館用戶的行為變化規(guī)律。采用改進(jìn)的BP神經(jīng)網(wǎng)絡(luò)算法,預(yù)測(cè)圖書館移動(dòng)用戶行為,將用戶網(wǎng)絡(luò)行為構(gòu)成的參數(shù)作為樣本數(shù)據(jù),通過(guò)該算法的不斷學(xué)習(xí)、判斷、更新,促使數(shù)據(jù)輸出值逼近預(yù)期數(shù)值。該神經(jīng)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)如圖2所示。

      BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)確定后,初始化維度數(shù)據(jù)、位置數(shù)據(jù)、權(quán)重參數(shù),確定用戶行為特征集合,利用適應(yīng)度函數(shù)[10]計(jì)算待分析數(shù)據(jù)的適應(yīng)度值,將當(dāng)前數(shù)據(jù)最優(yōu)位置記為[b],將集合中同類屬性特征數(shù)據(jù)收縮的最優(yōu)位置記為[b0]。根據(jù)適應(yīng)度函數(shù)的計(jì)算結(jié)果,得到評(píng)估預(yù)測(cè)模型為:

      式中:[git]表示數(shù)據(jù)經(jīng)由輸出層[t]和隱含層[i]輸出預(yù)測(cè)結(jié)果;[f*]表示適應(yīng)度函數(shù);[kit]表示隱含層[i]與輸出層[t]之間的節(jié)點(diǎn)連接權(quán)值;[m]表示輸出次數(shù);[h*]表示預(yù)測(cè)函數(shù);[ωij]表示隱含層[i]與輸入層[j]節(jié)點(diǎn)之間的連接權(quán)重;[d]表示輸入次數(shù);[Xit]表示輸出的行為數(shù)據(jù)影響因素;[τi]表示隱含層閾值;[μt]表示輸出層閾值。利用評(píng)估預(yù)測(cè)模型分析用戶行為變化規(guī)律,輸出結(jié)果如圖3所示。

      根據(jù)圖3曲線走勢(shì)可知,利用該模型分析用戶行為變化規(guī)律與期望結(jié)果基本相似,該模型分析的用戶規(guī)律可信。根據(jù)該規(guī)律分析用戶偏好行為,將特征數(shù)據(jù)進(jìn)行排序,排序結(jié)果如表2所示。

      根據(jù)挖掘的行為變化規(guī)律獲取特征相互信息參數(shù)值,通過(guò)大數(shù)據(jù)聚類,實(shí)現(xiàn)對(duì)圖書館用戶的行為分析[11?13]。

      1.3? 基于聚類算法交叉分析用戶行為

      利用聚類算法將所獲特征數(shù)據(jù)劃分為[n]個(gè)有序數(shù)據(jù)集,以數(shù)據(jù)集在空間分布的稠密度為依據(jù),在帶有干擾數(shù)據(jù)的數(shù)據(jù)集中,挖掘出影響用戶行為的關(guān)鍵數(shù)據(jù),同時(shí)允許這些數(shù)據(jù)之間大小不同、屬性不一。在樣本集合中,對(duì)象[a]在核心對(duì)象[q]的領(lǐng)域內(nèi),那么[a]從[q]直接密度可達(dá);當(dāng)樣本集合中,存在[q=q1],[a=qn]時(shí),那么此時(shí)[qi+1]從[qi]直接密度可達(dá),此時(shí)稱[a]從[q]密度可達(dá),如圖4所示。圖中字母代表特征數(shù)據(jù)簇,利用聚類算法[14?15]對(duì)具有關(guān)聯(lián)規(guī)則的數(shù)據(jù)進(jìn)行聚類,并將聚類結(jié)果收斂,得到的結(jié)果為:

      式中:[Q]表示多個(gè)特征數(shù)據(jù)的收斂結(jié)果;[r]表示特征數(shù)據(jù)類簇?cái)?shù)量;[u]表示特征數(shù)據(jù);[ui]表第[i]類特征數(shù)據(jù)的平均值;[k]表示特征數(shù)據(jù)總個(gè)數(shù);[Wi]表示特征數(shù)據(jù)屬性集合。根據(jù)上述聚類結(jié)果,交叉分析圖書館移動(dòng)用戶特征數(shù)據(jù)的內(nèi)在性質(zhì),主要包括用戶年齡層的交叉分析、使用圖書館目的交叉分析以及年齡和圖書館使用方式的交叉分析。根據(jù)該分析結(jié)果設(shè)置不同年齡層移動(dòng)用戶行為關(guān)鍵詞,完成大數(shù)據(jù)挖掘技術(shù)的用戶行為分析方法。

      2? 實(shí)? 驗(yàn)

      為了驗(yàn)證本文所提方法的有效性,對(duì)提出的分析方法進(jìn)行實(shí)驗(yàn)測(cè)試,將文獻(xiàn)[2]方法、文獻(xiàn)[3]方法、文獻(xiàn)[4]方法作為實(shí)驗(yàn)對(duì)照組,對(duì)比4種方法的分析效果,根據(jù)差異值明確分析方法之間的功能特性,得出實(shí)驗(yàn)測(cè)試結(jié)論。

      2.1? 實(shí)驗(yàn)準(zhǔn)備

      為保證實(shí)驗(yàn)數(shù)據(jù)真實(shí)可靠,選擇某市已開(kāi)設(shè)20年的圖書館作為實(shí)驗(yàn)環(huán)境,利用4種分析方法,分析該圖書館中移動(dòng)用戶的行為。該圖書館的實(shí)際環(huán)境如圖5所示。

      收集近1年內(nèi)圖書館開(kāi)館基本信息,按照月份進(jìn)行統(tǒng)計(jì),統(tǒng)計(jì)結(jié)果如表3所示。

      統(tǒng)計(jì)1年內(nèi)圖書館出入用戶的基本信息,包括人數(shù)、年齡、職業(yè)等,將這些用戶作為行為分析對(duì)象,得到的統(tǒng)計(jì)結(jié)果如表4所示。

      根據(jù)上述實(shí)驗(yàn)環(huán)境數(shù)據(jù)和實(shí)驗(yàn)對(duì)象數(shù)據(jù),分別利用4種分析方法進(jìn)行圖書館用戶行為分析。

      2.2? 結(jié)果分析

      將本文所提方法的測(cè)試結(jié)果作為實(shí)驗(yàn)A組,將文獻(xiàn)提出的3種方法分別作為實(shí)驗(yàn)B組、C組和D組,圖6為對(duì)比實(shí)驗(yàn)測(cè)試的結(jié)果。分析圖6可知,所提出的分析方法共分析出6組行為特征影響程度不同的數(shù)據(jù),且這些數(shù)據(jù)有序排列。文獻(xiàn)[2]方法雖然獲得了大量的特征數(shù)據(jù),但這些數(shù)據(jù)屬于同一類型;文獻(xiàn)[3]方法獲得的特征數(shù)據(jù)量少、特征種類不夠齊全;文獻(xiàn)[4]方法挖掘出的行為特征數(shù)據(jù)極少,分析結(jié)果不具備說(shuō)服力。綜上所述,本文所提分析方法挖掘到的特征數(shù)據(jù)量大、種類齊全,分析結(jié)果更符合實(shí)際。

      3? 結(jié)? 語(yǔ)

      本文提出大數(shù)據(jù)挖掘技術(shù)的圖書館移動(dòng)用戶行為分析方法,利用大數(shù)據(jù)挖掘技術(shù)將圖書館用戶的行為偏好特征進(jìn)行挖掘,找出特征數(shù)據(jù)之間的隱含關(guān)聯(lián),根據(jù)關(guān)聯(lián)程度分析行為規(guī)律,實(shí)現(xiàn)對(duì)用戶行為的分析。該方法有效解決了傳統(tǒng)分析方法存在的問(wèn)題,提升了行為分析結(jié)果的精準(zhǔn)度,為圖書館的發(fā)展提供合理的技術(shù)支持。但該分析方法還存在很多不足,在今后的研究與探析中需要不斷改進(jìn)。

      參考文獻(xiàn)

      [1] 畢強(qiáng),王福,丁夢(mèng)曉.移動(dòng)圖書館信息接受關(guān)鍵影響因素識(shí)別及調(diào)控[J].圖書情報(bào)工作,2018,62(15):6?15.

      [2] 田磊,任國(guó)恒,王偉.面向閱讀推廣的微博用戶轉(zhuǎn)發(fā)行為預(yù)測(cè)[J].情報(bào)學(xué)報(bào),2017,36(11):1175?1182.

      [3] 高永梅,鮑福光.融入位置情景的移動(dòng)用戶行為挖掘方法研究[J].數(shù)學(xué)的實(shí)踐與認(rèn)識(shí),2018,48(16):72?84.

      [4] 陳鶴陽(yáng).基于元分析的云計(jì)算用戶采納行為影響因素研究[J].圖書館雜志,2018,37(4):86?94.

      [5] 鄭明輝,呂經(jīng)華.基于機(jī)器學(xué)習(xí)的企業(yè)私有云用戶行為分析模型[J].中南民族大學(xué)學(xué)報(bào)(自然科學(xué)版),2017,36(3):95?100.

      [6] 趙從軍.一種新的水平分布式隱私保護(hù)數(shù)據(jù)挖掘算法:NPPA算法[J].科技通報(bào),2018,34(3):174?178.

      [7] 曹樹金,劉慧云,王連喜.大數(shù)據(jù)驅(qū)動(dòng)的圖書館精準(zhǔn)服務(wù)研究[J].大學(xué)圖書館學(xué)報(bào),2019,37(4):54?60.

      [8] 吳文光.基于流程挖掘的圖書館用戶滿意分析[J].圖書館雜志,2018,37(4):108?114.

      [9] 梁榮賢.基于用戶畫像的圖書館精準(zhǔn)信息服務(wù)研究[J].圖書館工作與研究,2019(4):65?69.

      [10] 秦鵬,曹天杰.基于樸素貝葉斯網(wǎng)頁(yè)分類的用戶行為推衍[J].沈陽(yáng)工業(yè)大學(xué)學(xué)報(bào),2018,40(1):82?87.

      [11] 弓建華,釗林真,李書寧.受眾行為分析視角的圖書館微信運(yùn)營(yíng)策略[J].圖書館論壇,2019,39(3):91?96.

      [12] 任永功,索全明,劉洋.基于環(huán)型網(wǎng)絡(luò)模體應(yīng)用馬爾科夫聚類的圖挖掘模型[J].模式識(shí)別與人工智能,2017,30(9):803?814.

      [13] 徐永順,劉淵,周宇,等.大學(xué)圖書館用戶多需求深度挖掘設(shè)計(jì)研究[J].圖書館,2019(6):66?73.

      [14] 高艷,岳昆,武浩,等.面向用戶偏好發(fā)現(xiàn)的隱變量模型構(gòu)建與推理[J].計(jì)算機(jī)應(yīng)用,2017,37(2):360?366.

      [15] 李裕礞,練緒寶,徐博,等.基于用戶隱性反饋行為的下一個(gè)購(gòu)物籃推薦[J].中文信息學(xué)報(bào),2017,31(5):215?222.

      猜你喜歡
      移動(dòng)用戶分析方法數(shù)據(jù)挖掘
      基于EMD的MEMS陀螺儀隨機(jī)漂移分析方法
      探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
      一種角接觸球軸承靜特性分析方法
      中國(guó)設(shè)立PSSA的可行性及其分析方法
      基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
      電力與能源(2017年6期)2017-05-14 06:19:37
      無(wú)線通信技術(shù)未來(lái)發(fā)展趨勢(shì)分析
      基于預(yù)測(cè)位置的移動(dòng)用戶位置隱私保護(hù)研究
      一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
      聯(lián)通4個(gè)月流失移動(dòng)用戶887萬(wàn)
      核安全設(shè)備疲勞分析方法與步驟
      海晏县| 竹溪县| 遵义县| 商南县| 张掖市| 平塘县| 博爱县| 林甸县| 阿拉尔市| 洱源县| 当阳市| 同江市| 高尔夫| 庆安县| 和静县| 雷州市| 敦化市| 九龙城区| 渝中区| 古田县| 榆中县| 航空| 德庆县| 铜鼓县| 樟树市| 彭阳县| 扶沟县| 防城港市| 寿光市| 胶州市| 施甸县| 二连浩特市| 常熟市| 峨山| 哈密市| 浪卡子县| 阳曲县| 汶川县| 青川县| 麻城市| 伊川县|