秦永俊
(桂林師范高等??茖W(xué)校 數(shù)學(xué)與計算機技術(shù)系,廣西 桂林 541001)
移動計算環(huán)境下遠程用戶體驗數(shù)據(jù)挖掘方法研究
秦永俊
(桂林師范高等專科學(xué)校 數(shù)學(xué)與計算機技術(shù)系,廣西 桂林 541001)
在移動計算環(huán)境下,通過對遠程用戶的體驗數(shù)據(jù)優(yōu)化挖掘,滿足遠程用戶的個性化需求,提高對遠程用戶QoS服務(wù)質(zhì)量;傳統(tǒng)的數(shù)據(jù)挖掘方法采用顯著特征關(guān)聯(lián)信息提取算法,當(dāng)遠程用戶體驗數(shù)據(jù)之間的差異性特征不明顯時,挖掘的準(zhǔn)確性不好;提出一種基于關(guān)聯(lián)用戶自適應(yīng)鏈路跟蹤補償?shù)囊苿佑嬎悱h(huán)境下遠程用戶體驗數(shù)據(jù)挖掘模型,進行遠程用戶體驗數(shù)據(jù)挖掘模型的總體設(shè)計和數(shù)據(jù)結(jié)構(gòu)特征分析,對采集的遠程用戶體驗數(shù)據(jù)進行非線性時間序列分解,對數(shù)據(jù)序列通過自相關(guān)特征匹配和特征壓縮實現(xiàn)挖掘數(shù)據(jù)的指向性信息優(yōu)化提取,采用關(guān)聯(lián)用戶自適應(yīng)鏈路跟蹤補償方法實現(xiàn)對數(shù)據(jù)挖掘誤差的控制和補償,提高了數(shù)據(jù)挖掘的準(zhǔn)確性和有效性;仿真結(jié)果表明,采用該挖掘方法進行移動計算環(huán)境下遠程用戶體驗數(shù)據(jù)挖掘的準(zhǔn)確度高,實時性較好,滿足了移動遠程用戶的個性化需求,提高了對用戶服務(wù)的針對性。
移動計算;用戶體驗數(shù)據(jù);數(shù)據(jù)挖掘;特征提取;QoS
隨著大數(shù)據(jù)信息處理技術(shù)和移動網(wǎng)絡(luò)通信技術(shù)的發(fā)展,大量的數(shù)據(jù)信息流通過移動網(wǎng)絡(luò)進行傳輸。在移動計算環(huán)境下,遠程用戶對移動服務(wù)的體驗和要求不一致,移動遠程用戶的體驗數(shù)據(jù)有效地反應(yīng)了用戶的個性化需求,需要對在移動計算環(huán)境下對遠程用戶體驗數(shù)據(jù)進行有效挖掘,通過對數(shù)據(jù)的關(guān)聯(lián)信息的特征分析,挖掘出能有效反應(yīng)移動遠程用戶的個性化體驗特征,滿足遠程用戶的個性化需求,提高對遠程用戶QoS服務(wù)質(zhì)量。因此,研究移動計算環(huán)境下遠程用戶體驗數(shù)據(jù)挖掘方法具有重要意義。
傳統(tǒng)方法中,對移動計算環(huán)境下遠程用戶體驗數(shù)據(jù)挖掘方法主要有基于演化博弈的移動計算環(huán)境下遠程用戶體驗數(shù)據(jù)挖掘算法、基于統(tǒng)計信號分析的移動計算環(huán)境下遠程用戶體驗數(shù)據(jù)挖掘算法、基于語義特征提取的數(shù)據(jù)挖掘算法、基于自適應(yīng)粒子群算法的數(shù)據(jù)挖掘算法、基于相空間重構(gòu)及混沌時間序列分析的移動計算環(huán)境下遠程用戶體驗數(shù)據(jù)挖掘方法等[1-3],上述算法通過求得移動計算環(huán)境下遠程用戶體驗數(shù)據(jù)的特征空間,對訓(xùn)練樣本和測試集進行時間序列分析,通過特征提取實現(xiàn)數(shù)據(jù)挖掘,移動計算環(huán)境下遠程用戶體驗數(shù)據(jù)的具有較強的自耦合性非線性特征,在受到較大的環(huán)境干擾下,挖掘難度較大。對此,相關(guān)學(xué)者進行了移動計算環(huán)境下遠程用戶體驗數(shù)據(jù)挖掘算法設(shè)計和改進,其中,文獻[4]提出一種基于語義本體特征指向性波束聚類的移動計算環(huán)境下遠程用戶體驗數(shù)據(jù)挖掘算法,實現(xiàn)移動計算環(huán)境下的數(shù)據(jù)挖掘和信息檢索,但是該算法計算開銷較大,對數(shù)據(jù)挖掘的實時性不好。文獻[5]提出一種基于模糊C均值聚類的移動計算環(huán)境下遠程用戶體驗數(shù)據(jù)挖掘算法,采用模糊C均值聚類算法實現(xiàn)語義本體特征指向性波束聚類,實現(xiàn)數(shù)據(jù)挖掘算法改進,在云計算平臺下實現(xiàn)移動計算環(huán)境下遠程用戶體驗數(shù)據(jù)挖掘,具有較好的精度,但是該算法抗干擾能力不好,且收斂性受到限制。文獻[6]提出采用顯著特征關(guān)聯(lián)信息提取算法,當(dāng)遠程用戶體驗數(shù)據(jù)之間的差異性特征不明顯時,挖掘的準(zhǔn)確性不好。針對上述問題,本文提出一種基于關(guān)聯(lián)用戶自適應(yīng)鏈路跟蹤補償?shù)囊苿佑嬎悱h(huán)境下遠程用戶體驗數(shù)據(jù)挖掘模型,進行遠程用戶體驗數(shù)據(jù)挖掘模型的總體設(shè)計和數(shù)據(jù)結(jié)構(gòu)特征分析,對采集的遠程用戶體驗數(shù)據(jù)進行非線性時間序列分解,對數(shù)據(jù)序列通過自相關(guān)特征匹配和特征壓縮實現(xiàn)挖掘數(shù)據(jù)的指向性信息的優(yōu)化提取,采用關(guān)聯(lián)用戶自適應(yīng)鏈路跟蹤補償方法實現(xiàn)對數(shù)據(jù)挖掘誤差的控制和補償,提高了數(shù)據(jù)挖掘的準(zhǔn)確性和有效性。最后通過仿真實驗進行性能測試,展示了本文方法對移動計算環(huán)境下遠程用戶體驗數(shù)據(jù)挖掘的準(zhǔn)確性和實時性,得出有效性結(jié)論。
1.1 移動計算環(huán)境下遠程用戶體驗數(shù)據(jù)挖掘總體模型設(shè)計與數(shù)據(jù)時間序列分析
為了實現(xiàn)移動計算環(huán)境下遠程用戶體驗數(shù)據(jù)挖掘,首先進行數(shù)據(jù)挖掘模型的總體設(shè)計。在移動云平臺和物聯(lián)網(wǎng)等環(huán)境下,通過求得移動計算環(huán)境下遠程用戶體驗數(shù)據(jù)的特征空間,對訓(xùn)練樣本和測試集進行時間序列分析,通過特征提取實現(xiàn)數(shù)據(jù)挖掘。由于移動計算環(huán)境下遠程用戶體驗數(shù)據(jù)的具有較強的自耦合性非線性特征,在受到較大的環(huán)境干擾下,挖掘難度較大,且數(shù)據(jù)挖掘的特征空間維數(shù)較高,需要進行特征提取和特征壓縮[7-10],在高維特征空間中,通過對移動計算環(huán)境下遠程用戶體驗數(shù)據(jù)的狀態(tài)識別和數(shù)據(jù)測試,實現(xiàn)對數(shù)據(jù)的準(zhǔn)確挖掘,在移動計算環(huán)境下,遠程用戶體驗數(shù)據(jù)分成3×3拓撲結(jié)構(gòu),設(shè)置4個負載區(qū)域?qū)哟蔚妮斎胼敵鐾ǖ?,以近鄰點為中心構(gòu)建移動計算環(huán)境下遠程用戶體驗數(shù)據(jù)的向量量化特征編碼模型,通過伴隨跟蹤器進行數(shù)據(jù)挖掘的性能修正分析。本文采用基于關(guān)聯(lián)用戶自適應(yīng)鏈路跟蹤補償?shù)囊苿佑嬎悱h(huán)境下遠程用戶體驗數(shù)據(jù)挖掘模型,進行遠程用戶體驗數(shù)據(jù)挖掘模型的總體設(shè)計和數(shù)據(jù)結(jié)構(gòu)特征分析,對采集的遠程用戶體驗數(shù)據(jù)進行非線性時間序列分解,根據(jù)上述描述,得到本文設(shè)計的移動計算環(huán)境下遠程用戶體驗數(shù)據(jù)挖掘總體模型如圖1所示。
圖1 移動計算環(huán)境下遠程用戶體驗數(shù)據(jù)挖掘總體模型
根據(jù)圖1所示的移動計算環(huán)境下遠程用戶體驗數(shù)據(jù)挖掘總體模型設(shè)計,進行數(shù)據(jù)挖掘算法改進設(shè)計,進行移動計算環(huán)境下遠程用戶體驗數(shù)據(jù)時間序列分析,移動計算環(huán)境下遠程用戶體驗數(shù)據(jù)的語義檢索的控制參量采用I(x,y)表示,采用關(guān)鍵詞查詢指向性曲線C劃分移動計算環(huán)境下遠程用戶體驗數(shù)據(jù)的特征分布區(qū)域R1和R2,其中一個移動計算環(huán)境下遠程用戶體驗數(shù)據(jù)的文本區(qū)域,一個為移動計算環(huán)境下遠程用戶體驗數(shù)據(jù)挖掘的干擾背景區(qū)域。在移動計算環(huán)境下,遠程用戶體驗數(shù)據(jù)的特征信息流采樣模型為:
(1)
式中,a(t)稱為遠程用戶體驗數(shù)據(jù)的復(fù)信號時間序列,z(t)的瞬時幅度,移動計算環(huán)境下遠程用戶體驗數(shù)據(jù)包絡(luò)為φ(t),在,域徙動抑制的情況下,采用H(f)為用戶體驗數(shù)據(jù)的相群合成傳輸函數(shù),由此實現(xiàn)了移動計算環(huán)境下遠程用戶體驗數(shù)據(jù)的時間序列分析。
1.2 移動計算環(huán)境下遠程用戶體驗數(shù)據(jù)特征分析及預(yù)處理
移動計算環(huán)境下,對遠程用戶體驗數(shù)據(jù)的鏈路狀態(tài)模型T的子模式為X=I1I2…Ik,對于一個正整數(shù)k,采用離群因子p來表示遠程用戶在第k距離的體驗差異性,表示為k_distance(p),測量數(shù)據(jù)zt對用戶對象p的關(guān)聯(lián)度主特征量為:
(2)
求移動計算的每個用戶點的第k距離鄰域,對于給定的正整數(shù)k,移動計算的用戶體驗數(shù)據(jù)對象p能有效傳遞對數(shù)據(jù)挖掘的關(guān)聯(lián)度主特征量,由此構(gòu)建移動計算環(huán)境下遠程用戶體驗數(shù)據(jù)特征分解模型為:
(3)
假設(shè)移動計算環(huán)境下遠程用戶體驗數(shù)據(jù)的標(biāo)量時間序列x是集合X中的一個數(shù)據(jù)對象,那么移動計算環(huán)境下遠程用戶體驗數(shù)據(jù)的狀態(tài)鏈路集合Y中存在一個數(shù)據(jù)對象y使得關(guān)聯(lián)度主特征量滿足|k_distance(y)-k_distance(x)|=Δk_distance(X,Y),則有:
(4)
對數(shù)據(jù)信息流的標(biāo)量時間序列在時域上進行時頻分解,對采集的遠程用戶體驗數(shù)據(jù)進行非線性時間序列分解,得到結(jié)果為:
(5)
其中:
(6)
假設(shè)待挖掘的遠程用戶體驗數(shù)據(jù)具有d個特性,在特征相空間中,通過特征提取,進行移動計算環(huán)境下遠程用戶體驗數(shù)據(jù)挖掘優(yōu)化。
2.1 問題描述及數(shù)據(jù)信息流特征提取
在上述進行了移動計算環(huán)境下遠程用戶體驗數(shù)據(jù)挖掘總體模型設(shè)計及數(shù)據(jù)特征分析的基礎(chǔ)上,進行數(shù)據(jù)挖掘算法改進設(shè)計,滿足遠程用戶的個性化需求,提高對遠程用戶QoS服務(wù)質(zhì)量。傳統(tǒng)的數(shù)據(jù)挖掘方法采用顯著特征關(guān)聯(lián)信息提取算法,當(dāng)遠程用戶體驗數(shù)據(jù)之間的差異性特征不明顯時,挖掘的準(zhǔn)確性不好。為了克服傳統(tǒng)方法的弊端,本文提出一種基于關(guān)聯(lián)用戶自適應(yīng)鏈路跟蹤補償?shù)囊苿佑嬎悱h(huán)境下遠程用戶體驗數(shù)據(jù)挖掘模型,對采集的遠程用戶體驗數(shù)據(jù)進行非線性時間序列分解,對數(shù)據(jù)序列通過自相關(guān)特征匹配和特征壓縮實現(xiàn)挖掘數(shù)據(jù)的指向性信息的優(yōu)化提取,定義移動計算環(huán)境下遠程用戶的體驗數(shù)據(jù)數(shù)據(jù)對象p的差異性特征因子,記為OF(p),定義如下:
(7)
通過對數(shù)據(jù)信息流的差異性特征提取,求遠程用戶每個點的第k距離鄰域,假設(shè)x是集合X中的一個數(shù)據(jù)對象,數(shù)據(jù)挖掘的相異性特征變量為O(nk2),在關(guān)鍵詞查詢指向性曲線約束規(guī)則下,得到移動計算環(huán)境下遠程用戶體驗數(shù)據(jù)結(jié)構(gòu):
Ecv(c1,c2)=μ·Length(C)+ν·Area(inside(C))+
(8)
其中:c1和c2分別表示移動計算環(huán)境下遠程用戶體驗數(shù)據(jù)挖掘的目標(biāo)特征區(qū)域和干擾區(qū)域的自適應(yīng)特征匹配特征系數(shù),Length(C)表示待挖掘的移動計算環(huán)境下遠程用戶體驗數(shù)據(jù)的語義狀態(tài)信息歸一化耦合系數(shù),時間復(fù)雜度為O(nlogn),采用關(guān)聯(lián)度主特征提取方法,得到移動計算環(huán)境下遠程用戶的體驗數(shù)據(jù)的解空間基函數(shù)可以描述為:
(9)
對數(shù)據(jù)序列通過自相關(guān)特征匹配和特征壓縮實現(xiàn)挖掘數(shù)據(jù)的指向性信息的優(yōu)化提取,數(shù)據(jù)挖掘的子空間特征響應(yīng)迭代函數(shù)為:
(10)
采用匹配投影法進行移動計算環(huán)境下遠程用戶體驗數(shù)據(jù)的橫向鏈距離估計,得到t時刻節(jié)點i對節(jié)點j的可靠性挖掘的QoS預(yù)測結(jié)果為:
(11)
將每個點的遠程用戶體驗數(shù)據(jù)行合并,引入調(diào)和平均值F-measure實現(xiàn)數(shù)據(jù)挖掘鏈路通道中的信道均衡,提高數(shù)據(jù)挖掘的精度。
2.2 基于關(guān)聯(lián)用戶自適應(yīng)鏈路跟蹤補償?shù)臄?shù)據(jù)挖掘誤差修正及優(yōu)化
(12)
關(guān)聯(lián)用戶自適應(yīng)鏈路通過橫向和豎向兩個梯度方向分解進行誤差的漸進補償,補償?shù)目刂谱兞繛椋?/p>
(13)
(14)
采用跟蹤補償方法實現(xiàn)對數(shù)據(jù)挖掘誤差的控制和補償,實現(xiàn)移動計算環(huán)境下遠程用戶的體驗數(shù)據(jù)挖掘優(yōu)化,其中,數(shù)據(jù)挖掘的收斂性判決式為:
(15)
設(shè)定閾值進行數(shù)據(jù)挖掘過程中的收斂性判決和控制,提高了數(shù)據(jù)挖掘的精度。
為了測試本文設(shè)計的基于關(guān)聯(lián)用戶自適應(yīng)鏈路跟蹤補償?shù)囊苿佑嬎悱h(huán)境下遠程用戶體驗數(shù)據(jù)挖掘模型在進行數(shù)據(jù)挖掘優(yōu)化中的性能,進行仿真實驗。實驗的硬件環(huán)境為:處理器Intel(R)Core(TM)2 Duo CPU 2.94 GHz,內(nèi)存:8.00 GB。采用Matlab仿真軟件,進行移動計算環(huán)境下遠程用戶體驗數(shù)據(jù)挖掘算法的編程設(shè)計。移動計算環(huán)境下遠程用戶體驗數(shù)據(jù)的測試數(shù)據(jù)來自于移動通信網(wǎng)絡(luò)的大型用戶集團數(shù)據(jù)庫KDP2016。移動計算環(huán)境下遠程用戶體驗數(shù)據(jù)采樣樣本的個數(shù)為1 024,采樣的周期為T=0.04 s,數(shù)據(jù)的采樣帶寬為25.8 Bit, 離散采樣率為fs=10*f0Hz=10kHz,正交解調(diào)的帶寬B=1 000Hz,干擾數(shù)據(jù)項為22.4dB的強度進行特征分區(qū)。根據(jù)上述仿真環(huán)境和參數(shù)設(shè)定,進行數(shù)據(jù)仿真分析,對采集的遠程用戶體驗數(shù)據(jù)進行非線性時間序列分解,得到原始采集的移動計算環(huán)境下遠程用戶體驗數(shù)據(jù)的時間序列波形如圖2所示。
圖2 原始采集的移動計算環(huán)境下遠程用戶體驗數(shù)據(jù)的
時間序列波形
以上述采樣數(shù)據(jù)為測試樣本訓(xùn)練集,進行數(shù)據(jù)挖掘仿真分析,對數(shù)據(jù)序列通過自相關(guān)特征匹配和特征壓縮實現(xiàn)挖掘數(shù)據(jù)的指向性信息的優(yōu)化提取,得到提取結(jié)果如圖3所示。
從圖可見,采用本文算法進行移動計算環(huán)境下遠程用戶體驗數(shù)據(jù)挖的特征聚焦性能較好,提高數(shù)據(jù)挖掘的指向性增益,為了定量對比性能,采用本文算法和傳統(tǒng)算法(分別為文獻[4]和文獻[6]的ALE測試算法和AdjHCFCOM算法),以數(shù)據(jù)挖掘的精度為測試指標(biāo),得到對比結(jié)果如圖4所示。
圖4 數(shù)據(jù)挖掘性能分析
圖3 移動計算環(huán)境下遠程用戶體驗數(shù)據(jù)挖掘特征提取結(jié)果
對相關(guān)技術(shù)指標(biāo)數(shù)據(jù)進行整理分析,得到詳細的性能對比結(jié)果見表1。
表1 不同算法下進行數(shù)據(jù)挖掘的技術(shù)指標(biāo)分析
分析上述結(jié)果可知,采用本文算法進行移動計算環(huán)境下遠程用戶體驗數(shù)據(jù)挖掘的收斂精度為100%,收斂時間迭代步數(shù)較小,時間較短,計算開銷較低,各項技術(shù)指標(biāo)具有優(yōu)越性。
為了滿足了移動遠程用戶的個性化需求,提高了對用戶服務(wù)的針對性,本文提出一種基于關(guān)聯(lián)用戶自適應(yīng)鏈路跟蹤補償?shù)囊苿佑嬎悱h(huán)境下遠程用戶體驗數(shù)據(jù)挖掘模型,進行遠程用戶體驗數(shù)據(jù)挖掘模型的總體設(shè)計和數(shù)據(jù)結(jié)構(gòu)特征分析,對采集的遠程用戶體驗數(shù)據(jù)進行非線性時間序列分解,對數(shù)據(jù)序列通過自相關(guān)特征匹配和特征壓縮實現(xiàn)挖掘數(shù)據(jù)的指向性信息的優(yōu)化提取,采用關(guān)聯(lián)用戶自適應(yīng)鏈路跟蹤補償方法實現(xiàn)對數(shù)據(jù)挖掘誤差的控制和補償,提高了數(shù)據(jù)挖掘的準(zhǔn)確性和有效性。仿真結(jié)果表明,采用該挖掘方法進行移動計算環(huán)境下遠程用戶體驗數(shù)據(jù)挖掘的準(zhǔn)確度高,實時性較好,性能優(yōu)越。
[1] 余曉東,雷英杰,岳韶華,等.基于粒子群優(yōu)化的直覺模糊核聚類算法研究[J].通信學(xué)報,2015,(5):2015099.
[2] 劉經(jīng)南,方 媛,郭 遲,等.位置大數(shù)據(jù)的分析處理研究進展[J].武漢大學(xué)學(xué)報·信息科學(xué)版,2014,39(4):379-385.
[3] 李 鵬, 劉思峰. 基于灰色關(guān)聯(lián)分析和D-S 證據(jù)理論的區(qū)間直覺模糊決策方法[J]. 自動化學(xué)報, 2011, 37(8): 993-999.
[4] Eldemerdash Y A, Dobre O A, and Liao B J. Blind identification of SM and Alamouti STBC-OFDM signals[J]. IEEE Transactions on Wireless Communications, 2015, 14(2): 972-982.
[5] Xu Y, Tong S, Li Y. Prescribed performance fuzzy adaptive fault-tolerant control of non-linear systems with actuator faults[J]. IET Control Theory and Applications, 2014, 8(6): 420-431.
[6] Huang X, Wang Z, Li Y, et al. Design of fuzzy state feedback controller for robust stabilization of uncertain fractional-order chaotic systems[J]. Journal of the Franklin Institute, 2015, 351(12): 5480-5493.
[7] 崔永君,張永花.基于特征尺度均衡的Linux系統(tǒng)雙閾值任務(wù)調(diào)度算法[J].計算機科學(xué),2015,42(6):181-184.
[8] 劉 俊,劉 瑜,何 友,等. 雜波環(huán)境下基于全鄰模糊聚類的聯(lián)合概率數(shù)據(jù)互聯(lián)算法[J]. 電子與信息學(xué)報, 2016, 38(6): 1438-1445.
[9] 陸興華,陳平華.基于定量遞歸聯(lián)合熵特征重構(gòu)的緩沖區(qū)流量預(yù)測算法[J].計算機科學(xué),2015, 42(4): 68-71.
[10] 黃國順,文 翰. 基于邊界域和知識粒度的粗糙集不確定性度量[J]. 控制與決策, 2016, 31(6): 983-989.
Research on Remote User Experience Data Mining Method in Mobile Computing Environment
Qin Yongjun
(Department of Mathematics and Computer Science, Guilin Normal College, Guilin 541001, China)
In the mobile computing environment, through the optimization of the remote user experience data mining, to meet the personalized needs of remote users, improve the quality of QoS service for remote users. The traditional data mining methods use significant feature association information extraction algorithm, when the difference between the remote user experience data is not obvious, the accuracy of mining is not good. Put forward remote user experience data mining model based on a associated with the user adaptive link tracking compensation of mobile computing environment, remote user experience data mining model of overall design and data structure feature analysis, on the acquisition of the remote user experience data of non linear time series decomposition, the sequence of data by self correlation feature matching and feature compression to achieve data mining point of information optimization extraction, associated user adaptive link tracking compensation method to realize the error control and compensation of data mining is used to improve the accuracy and efficiency of the data mining. Simulation results show that using the mining method for mobile computing environment remote user experience data mining of high accuracy, real-time well and meet the personalized needs of remote mobile users, the increase of user services targeted.
mobile computing; user experience data; data mining; feature extraction; QoS
2016-06-28;
2016-09-13。
秦永俊(1966-),男,廣西桂林人,碩士,講師,主要從事數(shù)據(jù)挖掘、人工智能方向的研究。
1671-4598(2017)01-0111-03
10.16526/j.cnki.11-4762/tp.2017.01.032
TP391
A