常瑩,王婧,朱慶華
(北京電子科技職業(yè)學(xué)院,北京100176)
基于網(wǎng)頁(yè)瀏覽業(yè)務(wù)的QoE評(píng)價(jià)模型實(shí)驗(yàn)及仿真
?,?,王婧,朱慶華
(北京電子科技職業(yè)學(xué)院,北京100176)
QoE即用戶體驗(yàn)質(zhì)量已經(jīng)成為評(píng)價(jià)網(wǎng)頁(yè)的重要指標(biāo),在對(duì)基于圖像信息的網(wǎng)頁(yè)瀏覽業(yè)務(wù)QoE評(píng)價(jià)模型進(jìn)行了研究后,為了得到更多用戶瀏覽網(wǎng)頁(yè)時(shí)的體驗(yàn),該文再次研究了基于視覺信息的網(wǎng)頁(yè)瀏覽業(yè)務(wù)的QoE評(píng)價(jià)模型。在對(duì)網(wǎng)頁(yè)視覺信息進(jìn)行提取的同時(shí),有針對(duì)性地做了部分仿真實(shí)驗(yàn)并進(jìn)行驗(yàn)證。
體驗(yàn)質(zhì)量;瀏覽業(yè)務(wù);視覺信息評(píng)估;仿真實(shí)驗(yàn);頁(yè)面分析
多媒體技術(shù)及其應(yīng)用
首先要分析一般的網(wǎng)頁(yè)的頁(yè)面結(jié)構(gòu)形式,廣泛地來(lái)說,網(wǎng)頁(yè)內(nèi)容可以廣泛地分為圖片和文本信息兩大類?;谌说囊曈X感知,一個(gè)網(wǎng)頁(yè)的視覺信息量是由網(wǎng)頁(yè)的圖像視覺信息量和文本視覺信息量組成的,如公式(1)所示。
圖像的視覺信息通過視覺塊的出現(xiàn)概率圖像來(lái)確定,并在不同的位置,視覺塊都有不同的視覺吸引力。使用圖像信息圖,以獲得有吸引力的重量。
文本信息分為語(yǔ)法、語(yǔ)義和語(yǔ)用信息。句法信息是最簡(jiǎn)單和基本的水平,而語(yǔ)用的信息是最復(fù)雜和最實(shí)際的層面,語(yǔ)義信息的水平在他們之間。語(yǔ)義和語(yǔ)用信息是主觀的指標(biāo)。這可能需要采取人工智能和人類的知識(shí)庫(kù)去考慮獲得這些信息,這就意味著他們的獲取相當(dāng)困難。在這里,為了降低計(jì)算的復(fù)雜性,只考慮句法信息作為文本信息。根據(jù)香農(nóng)信息理論,文本信息可以通過計(jì)算每個(gè)文本出現(xiàn)的概率來(lái)計(jì)算。現(xiàn)在模擬下面這樣兩個(gè)情況,情景一:
Q1:下面哪一個(gè)是哺育動(dòng)物?
A、鯊魚 B、鯊魚 C、鯨魚 D、鯊魚
Q2:下面哪一個(gè)是哺育動(dòng)物?
A、泥鰍 B、鯨魚 C、鯊魚 D、海龜
上面兩個(gè)同樣的問題:都是四個(gè)選項(xiàng)。并且每個(gè)選項(xiàng)里面的文字都是一樣多的,按照正常的計(jì)算方法來(lái)計(jì)算,應(yīng)該是兩個(gè)情況所得到的信息量一樣,但是事實(shí)卻是不一樣的,通過調(diào)查參加測(cè)試人員的反映,50個(gè)人里面有42個(gè)人認(rèn)為Q2的信息量比Q1信息量多,而剩下的八人認(rèn)為從本身來(lái)說,兩個(gè)問題提供的信息量一樣,但是從人的感覺上來(lái)說,是Q2的信息量多。
情景二:打開了兩個(gè)不同的網(wǎng)頁(yè),一個(gè)網(wǎng)頁(yè)內(nèi)容很豐富,標(biāo)題很多,涉及的內(nèi)容比較多,重復(fù)的文本信息較少。另一個(gè)網(wǎng)頁(yè)是關(guān)于一個(gè)具體事件的詳細(xì)描述,文字很多,但是重復(fù)的文本信息也比較多。雖然可能總的文字?jǐn)?shù)量差不多,但是因?yàn)榈谝粋€(gè)網(wǎng)頁(yè)人的主觀視覺感受比第二個(gè)網(wǎng)頁(yè)好,將會(huì)造成人潛意識(shí)里面對(duì)于第一個(gè)網(wǎng)頁(yè)的主觀等待時(shí)間忍耐時(shí)間延長(zhǎng)。
通過上面的分析,可以提出一種文本的計(jì)算方法,考慮使用人眼可識(shí)別的最小視覺文本信息作為統(tǒng)計(jì)單位。在英文中,使用獨(dú)立的單詞作為統(tǒng)計(jì)單位;在中文中,使用基本漢字作為統(tǒng)計(jì)單位,其他語(yǔ)言類似。使用下面的公式(2)計(jì)算平均文本視覺信息量Hi(I)Hi(I):
上面式子中pi表示每個(gè)基本文本信息在整個(gè)部分文本中出現(xiàn)的概率,比如:在英語(yǔ)中,不再使用單個(gè)字母作為基本的文本信息,否則會(huì)出現(xiàn)上面的情況。改用每個(gè)不重復(fù)的英語(yǔ)單詞在整個(gè)文本中出現(xiàn)的頻率來(lái)做pi;在中文中,由于并不存在類似英文中有26個(gè)固定的字母作為基本的構(gòu)造字符,中文博大精深,漢字的構(gòu)造字符比起英文來(lái)更加復(fù)雜,這里就用簡(jiǎn)單的將每個(gè)單個(gè)的漢字作為基本的文本信息,同時(shí)這樣也可以避免上面情況的出現(xiàn)。如公示(3)所示。
SiSi表示第i個(gè)文本塊的大小,IitextIitext表示第i個(gè)文本塊的視覺信息量。
在每個(gè)終端都下載睿思頁(yè)面分析工具,并且使用睿思頁(yè)面分析工具來(lái)打開網(wǎng)頁(yè),這個(gè)工具會(huì)記錄本次打開網(wǎng)頁(yè)所用的時(shí)間,在每次測(cè)試之前,都要清理一下緩存,防止本地端的緩存影響到下次測(cè)試的等待時(shí)間。在此之前使用工具來(lái)提取網(wǎng)頁(yè)上面的內(nèi)容,來(lái)進(jìn)行網(wǎng)頁(yè)的視覺信息量提取。選取10個(gè)網(wǎng)頁(yè),這10個(gè)網(wǎng)頁(yè)具有不同的大小,并且圖像信息跟文本信息都具有很大差異,可以滿足實(shí)驗(yàn)需求。
實(shí)驗(yàn)需要尋找50個(gè)非專業(yè)測(cè)試人員來(lái)進(jìn)行主觀測(cè)試,這也是為了防止測(cè)試人員之間的相互干擾,同時(shí),由于實(shí)驗(yàn)環(huán)境的限制,僅僅能提供五臺(tái)的電腦,所以需要把測(cè)試人員分成10組,每組5人進(jìn)行測(cè)試。每組設(shè)置3個(gè)不同網(wǎng)絡(luò)環(huán)境,將五個(gè)人的評(píng)分求平均值,作為主觀MOS值,由此可以取得150個(gè)數(shù)據(jù)。
考慮到本文的研究?jī)?nèi)容,即提出的視覺信息量構(gòu)成,所以僅僅考慮圖像和文本信息,并且不考慮他們之間的復(fù)雜關(guān)系。本次測(cè)試就選取一些結(jié)構(gòu)簡(jiǎn)單的頁(yè)面來(lái)做實(shí)驗(yàn),即既包含文字也包含圖像,同時(shí)結(jié)構(gòu)簡(jiǎn)單的網(wǎng)頁(yè),如圖1所示。
圖1 測(cè)試頁(yè)面展示
以這個(gè)網(wǎng)頁(yè)為例,因?yàn)檫@個(gè)頁(yè)面的結(jié)構(gòu)很簡(jiǎn)單,超級(jí)鏈接也不多。下載網(wǎng)頁(yè)到本地端,得到的網(wǎng)頁(yè)文件大小為3879KB。然后,通過計(jì)算,得出這個(gè)網(wǎng)頁(yè)的有效視覺信息量為692.7KB大小。其中原網(wǎng)頁(yè)中圖片大小為761KB,經(jīng)過視覺信息量的計(jì)算方法計(jì)算之后,只有677.29KB大小;文本信息有38.7KB大小,計(jì)算視覺信息量之后,文本有效的視覺信息只有15.41KB大小。計(jì)算發(fā)現(xiàn)文本信息的視覺信息量信息與圖像的視覺信息量相比低很多。剩下的4個(gè)網(wǎng)頁(yè)都通過這種方法計(jì)算出視覺信息量。
用獲得的250個(gè)數(shù)據(jù)中的200個(gè)數(shù)據(jù)來(lái)進(jìn)行數(shù)據(jù)擬合,剩下的80個(gè)用來(lái)驗(yàn)證試驗(yàn)結(jié)果,同時(shí)排除明顯偏離測(cè)量數(shù)據(jù)主體的測(cè)試值。通過Matlab進(jìn)行數(shù)據(jù)擬合,得到公式(4):
公式(4)中,V表示視覺信息下載速度,使用網(wǎng)頁(yè)視覺信息量與總的網(wǎng)頁(yè)加載時(shí)間的比值。為了驗(yàn)證這個(gè)評(píng)估模型與傳統(tǒng)評(píng)估模型的性能差異,使用剩下的80測(cè)試值進(jìn)行驗(yàn)證實(shí)驗(yàn)。依然使用RMSE和R-Square兩個(gè)指數(shù)來(lái)說明。如表1所示。
表1 兩種評(píng)估模型的RMSE和R-Square指標(biāo)
Matlab擬合圖像如圖2和圖3所示。圖2中主觀值與預(yù)測(cè)值之間具有很好的關(guān)聯(lián)性。圖3中擬合效果不好,可以看出主觀值與預(yù)測(cè)值之間存在分塊現(xiàn)象。
圖2 文提出的模型的擬合函數(shù)
圖3 傳統(tǒng)評(píng)估模型的擬合函數(shù)
單純地使用等待時(shí)間作為因變量分析網(wǎng)頁(yè)瀏覽業(yè)務(wù)具有很大的局限性,網(wǎng)頁(yè)的展示過程非常復(fù)雜,僅僅使用一個(gè)網(wǎng)頁(yè)的等待時(shí)間來(lái)計(jì)算網(wǎng)頁(yè)瀏覽的QoE在不同的網(wǎng)頁(yè)中是不合理的。傳統(tǒng)模型適用于相類似的網(wǎng)頁(yè)(結(jié)構(gòu)和大小),比如:“搜狗搜索”和“百度一下”這兩個(gè)網(wǎng)頁(yè),他們兩個(gè)之間的比較就可以簡(jiǎn)單地使用一個(gè)等待時(shí)間T來(lái)表示用戶體驗(yàn)質(zhì)量。但是當(dāng)使用這個(gè)模型來(lái)比較“淘寶”和“百度”這兩個(gè)網(wǎng)頁(yè)時(shí),大家都有感覺,在使用百度時(shí),如果2秒打不開“百度”,就會(huì)認(rèn)為網(wǎng)絡(luò)有問題,但是如果2秒打開了“淘寶”的網(wǎng)頁(yè),會(huì)覺得這個(gè)網(wǎng)路很好,這次用戶體驗(yàn)度會(huì)很高。我認(rèn)為這就是上面兩幅擬合圖的差距,在第二幅圖中可以看出當(dāng)網(wǎng)頁(yè)大小具有差距時(shí),預(yù)測(cè)值會(huì)顯示出一些分層現(xiàn)象。所以在網(wǎng)頁(yè)瀏覽業(yè)務(wù)中加入視覺信息量I,使用視覺信息下載速度代替是等待時(shí)間有利于建立更優(yōu)的模型。
同時(shí),由于此次試驗(yàn)的網(wǎng)頁(yè)大小不相同,相同主觀MOS值情況下,等待時(shí)間隨著網(wǎng)頁(yè)大小的增大而增大,所以在圖3中可以看出的分層現(xiàn)象,這就是由于使用了多個(gè)各不相同的網(wǎng)頁(yè)造成的結(jié)果。而在一個(gè)網(wǎng)頁(yè)如果內(nèi)容豐富,那么用戶在瀏覽的時(shí)候就會(huì)降低下拉網(wǎng)頁(yè)的速度,這樣就給了瀏覽器更多的時(shí)間來(lái)加載網(wǎng)頁(yè),同時(shí)在不影響用戶當(dāng)前閱讀的情況下,提高了用戶的主觀質(zhì)量。而在這里,簡(jiǎn)單的使用單位時(shí)間內(nèi)下載的視覺信息量來(lái)更加貼近用戶的主觀感受,而且實(shí)驗(yàn)證明,這個(gè)模型具有一定的作用。
[1]林闖,胡杰,孔祥震.用戶體驗(yàn)質(zhì)量(QoE)的模型與評(píng)價(jià)方法綜述[J].計(jì)算機(jī)學(xué)報(bào),2012,35(1):1-15.
[2]文藝林,黎文偉.移動(dòng)視頻業(yè)務(wù)QoE自適應(yīng)測(cè)量工具[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2017,26(2).
[3]姚會(huì)剛,黃永峰.基于BP神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)視頻QoE評(píng)估[J].計(jì)算機(jī)工程與設(shè)計(jì),2017(1):1-6.
[4]劉延偉,劉金霞,慈松,等.3DQoE評(píng)價(jià)方法及其模型研究進(jìn)展綜述[J].電子學(xué)報(bào),2015,43(3):568-576.
[5]劉繼春.面向用戶體驗(yàn)的視頻流業(yè)務(wù)質(zhì)量評(píng)測(cè)方法[D].北京郵電大學(xué),2014.
[6]羅意.移動(dòng)互聯(lián)網(wǎng)業(yè)務(wù)QoE研究[D].北京:北京郵電大學(xué),2013.
[7]王松,劉新民,丁黎黎.基于在線信息的C2C顧客可感知風(fēng)險(xiǎn)評(píng)價(jià)研究[J].商業(yè)研究,2011(10).
[8]郭亞軍,易平濤.線性無(wú)量綱化方法的性質(zhì)分析[J].統(tǒng)計(jì)研究,2008(2).
TP393
A
1009-3044(2017)24-0183-02
2017-07-10
?,?1972—),女,北京人,講師,碩士,主要研究方向?yàn)檐浖こ蹋苿?dòng)終端技術(shù)等;王婧(1980—),女,山東人,副教授,碩士,主要研究方向?yàn)榇髷?shù)據(jù)與移動(dòng)云計(jì)算,移動(dòng)終端技術(shù)等;朱慶華(1972—),男,北京人,講師,學(xué)士,主要研究方向?yàn)槲锫?lián)網(wǎng),電子技術(shù)等。