• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于彈幕情感分析和聚類算法的視頻用戶群體分類*

    2018-07-05 10:47:48王思堯趙欽佩李江峰饒衛(wèi)雄
    計算機工程與科學 2018年6期
    關(guān)鍵詞:彈幕聚類距離

    洪 慶,王思堯,趙欽佩,李江峰,饒衛(wèi)雄

    (同濟大學軟件學院,上海 200092)

    1 引言

    近年來,隨著數(shù)字媒體技術(shù)的快速發(fā)展,彈幕系統(tǒng)在網(wǎng)絡視頻中的使用規(guī)模一直呈上升趨勢。這種實時評論的數(shù)據(jù)能夠以滑動字幕的方式直接顯示在視頻界面上,有助于加深觀眾對視頻內(nèi)容的理解,也可以促進相同類型視頻的觀眾之間的交流。彈幕視頻系統(tǒng)源自于日本視頻網(wǎng)站niconico動畫(http://www.nicovideo.jp/),經(jīng)國內(nèi)視頻網(wǎng)站AcFun(http://www.acfun.cn/)和嗶哩嗶哩(https://www.bilibili.com/)引進后逐漸流行,現(xiàn)在在一些主流視頻網(wǎng)站如騰訊視頻(https://v.qq.com/)和樂視視頻(http://www.letv.com/)中也被采用。因大量評論同時出現(xiàn)時的效果像是射擊游戲中的彈幕,故網(wǎng)友稱之為彈幕。

    與傳統(tǒng)評論不同的是,彈幕評論可以在發(fā)送后直接顯示在視頻界面上,并且在之后其他觀眾觀看到該時間點的視頻情節(jié)時也會顯示出來,即觀眾可以實時發(fā)布自己對視頻內(nèi)容的看法,并且能夠看到其他觀眾在看到相同視頻片段時的感受,促進了視頻網(wǎng)站用戶之間的交流,增強了觀眾即時互動效果。

    一方面,相對于傳統(tǒng)評論來說,彈幕文本的實時性和簡潔性更有利于表達視頻用戶的真實觀點和對于視頻情節(jié)及時的評價。針對彈幕文本的分類可以將描述不同角色、視頻片段、故事情節(jié)等方面的彈幕分離出來,從而可以進行基于視頻內(nèi)容的信息挖掘,比如視頻精彩片段集錦的提取,視頻中場景的分類等。另一方面,針對不同用戶群體發(fā)送彈幕文本用詞習慣、表達的情緒的不同,可以以此為基礎將用戶群體進行分類,并根據(jù)分類結(jié)果更精確地向用戶推薦適合的網(wǎng)絡視頻或者廣告產(chǎn)品。

    本文主要對網(wǎng)絡視頻中出現(xiàn)的時間序列相關(guān)的彈幕數(shù)據(jù)進行分析和處理,在清洗冗余彈幕之后提取出具有實際意義的彈幕文本,并通過情感分析手段對彈幕用戶所發(fā)表的彈幕進行情感計算(樂、好、怒、哀、懼、惡、驚)。由于每個彈幕數(shù)據(jù)都包含了視頻時間信息,因此我們提取了情感指數(shù)在時間上的分布作為該用戶的特征,然后利用聚類算法對這些用戶進行情感分類。具體來說,本文的貢獻包括以下方面:

    (1)以近年出現(xiàn)的網(wǎng)絡視頻彈幕為研究對象,了解彈幕數(shù)據(jù)的特征,知道數(shù)據(jù)的字段含義,掌握彈幕數(shù)據(jù)的基本處理方法。通過構(gòu)建網(wǎng)絡視頻彈幕常用詞詞典和選擇停用詞,對彈幕數(shù)據(jù)進行預處理,清除冗余彈幕。

    (2)對彈幕用戶進行情感分析。利用情感分析技術(shù)從網(wǎng)絡視頻用戶所發(fā)彈幕中提取情感信息。通過處理短文本中的情感詞匯獲取每一條彈幕可能的情感傾向,從而獲取觀眾在視頻不同時間的態(tài)度與情感,并以此作為用戶特征來進行后續(xù)分類。

    (3)提出基于七維情感指數(shù)的k-means聚類算法,改進了聚類算法中的距離計算方式,并通過聚類評價指標來對類的個數(shù)k進行估算。

    我們通過實驗結(jié)果及其分析介紹了對彈幕數(shù)據(jù)的預處理方法,并就用戶分類結(jié)果進行了分析。

    2 相關(guān)工作

    隨著社交網(wǎng)絡的盛行和互聯(lián)網(wǎng)的蓬勃發(fā)展,傳統(tǒng)的文本逐漸向“簡短”“口語化”方向發(fā)展,由此產(chǎn)生了短文本的概念。最近幾年隨著自然語言處理技術(shù)的流行和廣泛運用,國內(nèi)外針對短文本的研究也一直在進行。一些基于Twitter和Facebook等社交媒體的短文本研究也逐漸變得成熟。許多相關(guān)方向的學者對此非常重視,并做了一些研究。

    Song等人[1]指出Twitter內(nèi)容分類是一項有挑戰(zhàn)性的工作,因為用戶發(fā)送的tweets詞語稀疏并且用詞不規(guī)范。Wijeratne等人[2]提出了一種基于關(guān)鍵詞消除的方法來過濾Twitter的噪聲數(shù)據(jù)。Wang等人[3]提出了一種基于圖的標簽情感分類方法,將用戶發(fā)Twitter時用于表示發(fā)送內(nèi)容主題的標簽(Hashtag)分為三類。通過這些標簽的相關(guān)性,對它們建立圖的聯(lián)系,然后對Twitter文本的主題情感進行分類。Sakaki等人[4]提出了一種基于關(guān)鍵詞特性、單詞數(shù)量和上下文信息的分類系統(tǒng)來監(jiān)測目標事件,將每一個Twitter用戶當作一個傳感器,由于日本的地震發(fā)生次數(shù)較多,并且全國范圍內(nèi)有大量的Twitter用戶,這個系統(tǒng)可以監(jiān)測出93%三級及以上的地震。同時,通過信息過濾可以快速估計事件發(fā)生的地理位置。這種實時的事件監(jiān)測方法可以迅速地從大量的社交信息中提取出關(guān)鍵信息,從而達到信息實時共享的目的。Kouloumpis等人[5]對Twitter數(shù)據(jù)的情感分析作出了概括性的總結(jié)。

    另外,在實時數(shù)據(jù)方面,Bollen等人[6]研究了Twitter情感和社會經(jīng)濟現(xiàn)象之間的聯(lián)系。Wang等人[7]設計了一個系統(tǒng),通過Twitter的實時數(shù)據(jù)來分析2012年美國總統(tǒng)選舉。Hays等人[8]設計了一種基于Unix的多線程系統(tǒng)來獲取和控制實時數(shù)據(jù)。Lee等人[9]提出了基于實時數(shù)據(jù)的入侵事件監(jiān)測,通過對數(shù)據(jù)的實時分析來判斷是否發(fā)生了入侵事件。Witten等人[10]對數(shù)據(jù)挖掘需要使用到的實踐性的機器學習工具和技術(shù)進行了研究。Fan等人[11]通過對大數(shù)據(jù)的挖掘,分析數(shù)據(jù)現(xiàn)在的狀態(tài),并通過算法和相應改進對未來的情況進行預測,從而更加充分地挖掘出數(shù)據(jù)的價值。在醫(yī)療領域,Lee等人[12]應用Twitter數(shù)據(jù)對疾病進行實時監(jiān)測,并且由此建立了流感和癌癥的模型演示,從而為醫(yī)療健康發(fā)展提供很有價值的信息。

    從本質(zhì)上來看,彈幕文本是基于時間序列的短文本,每一條彈幕都對應于相應的網(wǎng)絡視頻里的一個時間點。由于彈幕出現(xiàn)的時間較短,彈幕系統(tǒng)最近幾年才開始被中國的一些視頻網(wǎng)站所采用,目前,針對彈幕數(shù)據(jù)的研究還比較少。詹雪美[13]通過對彈幕視頻區(qū)別于傳統(tǒng)視頻的特點出發(fā),討論了彈幕視頻網(wǎng)站的產(chǎn)生、發(fā)展與意義。鄭飏飏等人[14]利用網(wǎng)絡彈幕數(shù)據(jù)句子級別的情感分析方法,建立了基于情感詞典的分析模型,并通過對彈幕文本進行分詞及計算單詞情感值來繪制可視化曲線,以獲取用戶在觀看網(wǎng)絡視頻時發(fā)送的彈幕數(shù)據(jù)中的情感分布。Xian等人[15]提出了一種視頻情節(jié)邊界檢測的方法來識別和抽取視頻情節(jié)的高潮部分。

    由目前學者們的研究成果可見,雖然基于時間序列的短文本的研究較為成熟,但是這種短文本大多是基于社交媒體的內(nèi)容,主要與發(fā)送者個人為中心,以發(fā)送者的視角、經(jīng)歷和分享內(nèi)容為素材進行研究;而彈幕系統(tǒng)里的基于時間序列的短文本則是以視頻為中心,一個視頻的所有彈幕都是以這個視頻為中心,觀看該視頻的用戶根據(jù)視頻內(nèi)容發(fā)布評論,包括觀看感受、劇情評價、吐槽等內(nèi)容。這樣的實時數(shù)據(jù)更有利于我們實時分析該視頻的內(nèi)容及用戶的真實反饋;同時,通過分析觀看相同視頻情節(jié)的用戶發(fā)送的彈幕特征,我們可以對用戶進行分類,發(fā)現(xiàn)他們對不同情節(jié)的不同反應和態(tài)度。

    3 彈幕數(shù)據(jù)及其預處理

    3.1 彈幕數(shù)據(jù)來源及獲取

    鑒于國內(nèi)視頻網(wǎng)站AcFun和嗶哩嗶哩是最早引進彈幕系統(tǒng)的網(wǎng)站,彈幕系統(tǒng)較為成熟,且有大量用戶使用其觀看視頻,其中,網(wǎng)站上視頻每天播放量超過一億,彈幕總量超過14億,因此本文選擇了嗶哩嗶哩視頻網(wǎng)站的彈幕數(shù)據(jù)作為本課題的數(shù)據(jù)來源,通過多種不同類型的視頻的彈幕文本進行實驗。

    在數(shù)據(jù)的獲取方面,通過Python引用的requests模塊,將每次觀看某視頻時網(wǎng)絡請求所返回的數(shù)據(jù)(彈幕文本及相關(guān)內(nèi)容)保存到本地中。由于每次請求最多可以返回8 000條彈幕文本數(shù)據(jù),因此通過嗶哩嗶哩網(wǎng)站開放的一個相關(guān)接口取得能夠請求的最大次數(shù),再經(jīng)過遍歷得到每個視頻可取的所有彈幕。

    3.2 彈幕數(shù)據(jù)特點

    當大量彈幕出現(xiàn)在屏幕上的時候,密集程度很大,在動態(tài)播放視頻的時候,它們大多在屏幕上從右往左飄過,像是飛行的子彈,如圖1所示。

    Figure 1 An example of barrage comments圖1 彈幕數(shù)據(jù)示例

    嗶哩嗶哩視頻網(wǎng)站目前活躍用戶超過1.5億,從嗶哩嗶哩網(wǎng)站下載的彈幕數(shù)據(jù)中,每條彈幕包含8個參數(shù),這些參數(shù)構(gòu)成了一條彈幕的所有屬性,這8個參數(shù)分別是:

    (1)彈幕出現(xiàn)時間(以距離視頻開始的秒數(shù)為單位);

    (2)彈幕的模式(包含滾動彈幕、頂端彈幕、高級彈幕等);

    (3)彈幕的字號大??;

    (4)彈幕的字體顏色;

    (5)彈幕的發(fā)布時間(Unix格式的時間戳);

    (6)彈幕池;

    (7)加密后的彈幕發(fā)送者的ID;

    (8)彈幕在彈幕數(shù)據(jù)庫中的rowID(查看“歷史彈幕”的時候使用)。

    Figure 2 Part of the barrage comments of “The Garden of Words”圖2 動畫電影《言葉之庭》中的部分彈幕

    圖2為動畫電影《言葉之庭》中的6條彈幕,本文使用的彈幕文本數(shù)據(jù)源均為該格式。由圖2可知,這些彈幕是按照XML文本格式存儲的,其中〈d〉標簽里的內(nèi)容是彈幕文本,即彈幕內(nèi)容,〈d〉標簽的p屬性是該彈幕的其他特征。下面以圖2的第一條彈幕數(shù)據(jù)對其格式進行具體說明,如表1所示。

    Table 1 Description of parameters based on examples表1 結(jié)合彈幕實例對參數(shù)的說明

    3.3 彈幕問題數(shù)據(jù)的預處理

    由于視頻用戶的多樣性和彈幕系統(tǒng)支持的語言的多樣性,不同用戶發(fā)送的彈幕內(nèi)容風格完全不一樣。有的用戶發(fā)送的彈幕內(nèi)容偏口語化,有的用戶偏好發(fā)送網(wǎng)絡流行詞,有的用戶偶爾發(fā)送表情或者由文字與符號組成的用于表示心情的圖案(以下簡稱顏文字)。因此,在分析彈幕文本的時候需要分情況考慮,這樣才能更好地理解用戶發(fā)送的彈幕所要表達的含義。同時,有的用戶只發(fā)送一兩條彈幕,而這一兩條彈幕中僅有的幾個詞不能體現(xiàn)出該用戶發(fā)送彈幕的特點,反而造成了數(shù)據(jù)稀疏的問題。

    問題數(shù)據(jù)的存在很有可能會影響彈幕數(shù)據(jù)的完整性和合理性,從而影響彈幕分析的結(jié)果。因此,對彈幕數(shù)據(jù)進行預處理是必須的。本文通過判斷Python的字符類型來判斷用戶發(fā)送的文本內(nèi)容的格式,從而有針對性地進行處理。

    經(jīng)過思考和多次嘗試,針對不同的問題確認了相應的處理方法,具體的處理方法如表2所示。

    Table 2 Processing of dirty data表2 問題數(shù)據(jù)的處理方法

    4 基于彈幕的情感分析

    4.1 彈幕情感分析的目的

    隨著網(wǎng)絡視頻的流行和網(wǎng)絡視頻用戶的快速增多,用戶在網(wǎng)絡視頻上留下的彈幕很可能被其他用戶當作對視頻內(nèi)容的參考。而且,彈幕視頻的流行與“吐槽”文化快速發(fā)展之間的關(guān)系不可分割,它能讓人與人之間針對同類視頻進行交流和互動。

    目前來說,在情感分析領域很少有以彈幕文本數(shù)據(jù)為對象的研究。而事實上,隨著彈幕系統(tǒng)的發(fā)展和日益豐富,彈幕文本數(shù)據(jù)所表達出的情感趨勢和觀點會更具有參考性,這些情感信息在用戶選擇視頻的時候可以作為參考內(nèi)容,滿足用戶對于視頻類型、情節(jié)內(nèi)容的視頻檢索需求。

    因此,情感分析在彈幕文本數(shù)據(jù)的基礎上是很有價值的研究需求,對于網(wǎng)絡視頻的選擇和視頻內(nèi)容的判斷都有一定意義。

    4.2 網(wǎng)絡彈幕常用詞詞典的建立

    隨著互聯(lián)網(wǎng)的發(fā)展和數(shù)字媒體的流行,使用網(wǎng)絡媒體的人越來越多。與此同時,由于社會實踐或者具有影響力的“名人”效應,一些本沒有意義的詞匯被賦予了某些特殊含義,如“藍瘦”一詞,就是因為一段網(wǎng)絡視頻的出現(xiàn),里面的人發(fā)音不標準,將“難受”讀作“藍瘦”而被廣大網(wǎng)友用來表示自己難受的心情;一些本來具有意義的詞匯被當作其他的含義使用,如“高能”一詞,在文學中指才能過人,在化學中指(對象)具備很高的能量,影視中指內(nèi)容擁有高度的表現(xiàn)力,而隨著時代的變遷,在現(xiàn)代社會中“高能”一詞常常被用來指對社會做出突出貢獻的人。在網(wǎng)絡視頻中,常搭配作“前方高能”一起使用,表示視頻即將到來的情節(jié)有亮點,含有調(diào)侃意味。這是因為在科幻電影中,當戰(zhàn)艦遇到敵方發(fā)射光束攻擊時檢測器所檢測到的粒子反應出現(xiàn)偏高的情況被稱為高能反應現(xiàn)象。

    在常用的分詞程序中,使用普通的詞典不能將這些詞匯識別出來,從而不能夠?qū)渥舆M行有效的分詞,也就會影響最終對文本語義及情感分析的結(jié)果。因此,需要建立一個網(wǎng)絡視頻彈幕常用詞詞典,用來對彈幕數(shù)據(jù)中經(jīng)常出現(xiàn)的非常用詞進行識別,通過分詞程序?qū)⒅殖蓡蝹€的詞,從而為后續(xù)的文本分析和情感分析做準備。

    在網(wǎng)絡彈幕常用詞詞典的建立過程中,詞匯的選擇是非常重要的。也就是說,需要有一定的建立原則,才能更好地覆蓋彈幕視頻用戶的網(wǎng)絡用語習慣。具體的詞典建立原則主要如表3所示。

    Table 3 Construction standards of barrage comments dictionary表3 網(wǎng)絡彈幕常用詞詞典的建立原則

    由表3可知,網(wǎng)絡彈幕常用詞主要來源于兩方面。一方面是近幾年的網(wǎng)絡流行語,如“神馬”“藍瘦”“香菇”等;另一方面是在彈幕系統(tǒng)中具有特殊含義的詞匯,如“前方高能”“前排打卡”“淚目”等。通過收集與分析這些詞匯,將結(jié)合起來的詞匯集合成相關(guān)詞典。

    4.3 彈幕文本分詞原則

    我們使用“結(jié)巴”中文分詞的精確模式對彈幕文本進行分詞,并且對詞匯進行情感分析。在統(tǒng)計詞頻的時候發(fā)現(xiàn)有很多無明確含義的詞在所有詞的出現(xiàn)頻率中占比非常高,比如“有”“的”“然后”等。國內(nèi)研究文本分析的學者也對這個問題進行了一些研究和討論。王素格等人[16]通過實驗指出停用詞表對文本情感分類的影響與特征選擇和權(quán)重計算不盡相同,選用除去形容詞、動詞和副詞外的其余詞語作為文本分析時的停用詞表,與不使用停用詞表相比,情感分類的結(jié)果相差較大。熊文新等人[17]總結(jié)了停用詞過濾在信息檢索用戶查詢語句中的使用情況。

    一般來說,停用詞表有兩種獲取方式:一是通用停用詞表;二是專用停用詞表。通用停用詞表一般是由一些研究人員專門統(tǒng)計、收集大量停用詞,并將其制作成詞典文件。通用停用詞表具有詞匯量大、詞匯范圍全的特點,但是它也在一定程度上限制了識別停用詞的速度;專用停用詞表則是基于統(tǒng)計的自動學習方法,先是從語料庫中統(tǒng)計出高頻停用詞,然后構(gòu)建停用詞表,之后再由專人進行核查[18]。

    詳細的原則及說明如表4所示。

    Table 4 Word segmentation principles表4 分詞原則

    4.4 情感分析的主要步驟

    4.4.1 建立彈幕數(shù)據(jù)情感分析模型

    由于情感分析對情感詞典的依賴性很強,為了針對網(wǎng)絡彈幕數(shù)據(jù)進行更有針對性的情感分析,本文采用了常見的情感詞典庫和網(wǎng)絡彈幕用詞詞典庫結(jié)合的方式,通過將含有情感傾向的詞匯本身、詞匯情感傾向、詞性種類、情感強度等進行計算和統(tǒng)計,得到每個句子的情感狀況。然后結(jié)合彈幕時間點的參數(shù),將相同或相近時間段的彈幕數(shù)據(jù)分別進行統(tǒng)計,最后展現(xiàn)和分析結(jié)果。詳細流程如下所示:

    (1)選擇含有彈幕數(shù)據(jù)的視頻,并獲取該視頻的所有彈幕數(shù)據(jù);

    (2)使用分詞工具對彈幕文本進行分詞處理,詞性標注,按照分詞原則保留剩下的詞匯;

    (3)通過使用情感詞典,將每條彈幕評論數(shù)據(jù)分詞后的詞匯與情感詞典進行匹配,識別情感詞,計算情感值,并對每條彈幕評論數(shù)據(jù)進行標注和統(tǒng)計;

    (4)結(jié)合彈幕數(shù)據(jù)的時間序列,對該視頻的所有彈幕所表現(xiàn)出來的整體情感趨勢和局部情感數(shù)據(jù)進行統(tǒng)計、分析和可視化處理;

    (5)重復(2),但是在處理彈幕文本的時候,刪除部分噪音彈幕,再進行后續(xù)步驟的處理,將得到的結(jié)果與之前所有彈幕進行處理得到的結(jié)果作比較,觀察兩次分析的情感趨勢和極值點的位置是否相同。

    4.4.2 構(gòu)建情感詞典

    本文的情感詞典構(gòu)建素材,都是來自于大連理工大學信息檢索研究室的中文情感詞匯本體庫(http://ir.dlut.edu.cn/),徐琳宏等人[19]針對情感詞匯的構(gòu)造作了研究和說明。這是一個從多個角度描述中文詞匯或者短語的詞匯庫,其中包括的部分有詞性種類、情感類別、情感強度以及情感極性等多方面信息。

    該情感詞匯本體庫將詞匯情感分為7大類,再細分為21小類,為了便于對彈幕文本進行情感數(shù)據(jù)的分析和統(tǒng)計,本文將主要考慮這7個大類情感,分別是樂、好、怒、哀、懼、惡、驚。其中,前兩個情感屬于正向情感,后面的屬于負向情感。

    通過對動漫劇集《全職高手》第一集進行處理,得到這一集的彈幕數(shù)據(jù)中包含的情感詞。將各個情感類別出現(xiàn)的情感詞進行統(tǒng)計,得到該視頻中屬于這7個大類的情感詞。部分數(shù)據(jù)如表5所示。

    Table 5 Sentiment category表5 情感類別表

    4.4.3 計算彈幕情感值

    每條彈幕的情感值是這條彈幕里所有具有情感傾向的詞語的情感值之和。例如,一條彈幕為“我很喜歡這條狗”,則計算這條彈幕返回的情感值為[0,2,0,0,0,0,0]??梢钥闯?,彈幕返回的情感值是一個含有7個元素的列表,列表中每個元素代表一個維度的情感值,按照樂、好、怒、哀、懼、惡、驚的順序。例如,第一個元素0表示該句彈幕中“樂”的情感值為0;第二個元素2表示該句彈幕中“好”的情感值為2。其中,“喜歡”一詞可以表示值為1的“好”的情感,而它前面的“很”作為程度副詞,加強了“喜歡”的情感值,故乘以2倍,情感值為2。后面的幾個0依此類推,表示在這條彈幕中,其他五個維度的情感值均為0。

    在分析彈幕情感的時候,可以考慮分為二維和多維的情感分布。在之前介紹的7類情感類別中,樂、好、驚可以作為正向情感,其余4類作為負向情感,通過將所有彈幕的正向情感值和負向情感值繪成曲線,對比觀察該視頻不同階段用戶對于視頻內(nèi)容的情感傾向。

    與此同時,可以作出7維情感圖,從多個角度來分析彈幕用戶對于視頻內(nèi)容的觀感和評價。制作7維情感圖的步驟主要如下:

    首先,對分詞后的彈幕進行7個角度的情感值計算,將之存儲在7維列表中;然后,將每一段時間(如30 s)7種情感的值求平均數(shù);再將這些數(shù)據(jù)分別繪出,其中,沒有相應情感值的彈幕不作記錄。

    通過對情感類型進行細分,可以更加詳細地描述彈幕用戶在視頻各個階段的情感動態(tài),方便對彈幕和視頻進行分析。

    5 彈幕用戶的分類

    通過每個用戶發(fā)表的所有彈幕數(shù)據(jù)的情感分析,7維的情感分布可以代表該用戶的情感特征。本文提出基于情感的自動k-means聚類算法來進行用戶自動分類。在聚類算法中,有兩個需要解決的難題,包括數(shù)據(jù)間的距離計算以及如何自動確定類的個數(shù)。為了使得該基于情感的k-means能自動分類,我們引入了聚類評價準則。由于聚類的對象是用戶的7維情感分布,我們提出在聚類算法中應用動態(tài)時間規(guī)整DTW(Dynamic Time Warping)算法來計算距離。

    算法1基于情感的自動k-means算法

    輸入:用戶情感數(shù)據(jù)DN*T。

    輸出:各個用戶屬于某個類的標簽P。

    調(diào)用基于情感的k-means(m),得到WB(m);

    end

    根據(jù)WB(m)拐點,自動確定類的個數(shù)k;

    調(diào)用基于情感的k-means(k)得到P。

    算法2是基于情感分布的自動k-means聚類算法偽代碼。

    算法2基于情感的k-means算法

    輸入:用戶情感數(shù)據(jù)DN*T,聚類個數(shù)k。

    輸出:P,WB(k)。

    隨機生成k個點,作為初始的中心點;

    while(算法未收斂)

    對N個點:計算每個點到k個中心點的DTW距離,最近距離的中心點即為屬于那一類;

    對于k個中心點:

    (1)找出所有屬于自己這一類的數(shù)據(jù)點;

    (2)把自己的坐標修改為這些數(shù)據(jù)點的中心點坐標;

    if(新的中心點與舊的中心點坐標相同)

    break

    end

    end

    計算類內(nèi)距離SSW(k),類間距離SSB(k),得到WB(k);

    算法的輸入數(shù)據(jù)DN*T是由N個用戶、視頻時間長度T組成的數(shù)組,其中每個用戶在每個時間刻度由7維情感數(shù)據(jù)來代表。我們首先根據(jù)聚類評價準則來尋找最優(yōu)類的數(shù)目k,確定k后獲得具體的聚類結(jié)果。

    5.1 距離計算

    動態(tài)時間規(guī)整DTW算法是一種結(jié)合時間規(guī)整和間距測量計算的算法。它通過將部分時間間隔伸長或縮短,使其與另一時間序列的長度相對應,從而用來計算兩個時間序列的最短距離,該距離即可表示它們的相似度,該算法在語音識別領域使用較多。

    具體的計算如圖3所示,其中,對于時間序列Q和C,它們的長度分別是n和p,如果n不等于p,就可以通過動態(tài)規(guī)劃將它們對齊。

    Figure 3 Regulation of two time series圖3 兩個時間序列的規(guī)整

    為此構(gòu)造一個n*p的矩陣網(wǎng)格,矩陣元素(i,j)表示qi和cj兩個點的距離d(qi,cj),尋找一條通過此網(wǎng)格中若干格點的路徑,路徑通過的格點即為兩個序列進行計算的對齊的點。我們把這條路徑定義為規(guī)整路徑,并用W來表示,W的第k個元素定義為wk=(i,j)k,于是,W的計算公式如下所示:

    W=w1+w2+w3+…+wk

    (1)

    這條路徑的選擇需要滿足以下幾個條件:

    (1)邊界條件:w1=(1,1)和=wk(n,p)。一個時間序列的先后次序不可能改變,因此所選的路徑必定是從左下角出發(fā),在右上角結(jié)束。

    (2)連續(xù)性:如果wk-1= (a′,b′),那么路徑的下一個點wk=(a,b)需要滿足 (a-a′) ≤1和(b-b′) ≤1,以保證Q和C中的每個坐標都在W中出現(xiàn)。

    (3)單調(diào)性:如果wk-1= (a′,b′),那么路徑的下一個點wk=(a,b)需要滿足0≤(a-a′)和0≤(b-b′),以保證圖中W的點隨時間單調(diào)。

    這樣,每個點就只有三個路徑方向,我們需要的路徑是能夠讓規(guī)整代價最小的路徑。

    定義累加距離為y(i,j),它表示當前格點距離d(i,j),也就是點qi和cj的歐氏距離與可以到達該點的最小的鄰近元素的累積距離之和,計算公式如下所示:

    y(i,j)=d(qi,cj)+

    min{y(i-1,j-1),y(i-1,j),y(i,j-1)}

    (2)

    通過以上規(guī)整計算,就可以得到n*p矩陣左下角到右上角的最小代價路徑,即為序列Q與C的DTW距離。

    5.2 聚類評價指標

    由于聚類算法是一種無監(jiān)督的方法,我們需要聚類評價指標來對類的個數(shù)進行確定,也需要通過聚類評價指標來對聚類的結(jié)果進行評估。一般來說,評價的原則主要有類內(nèi)距離和類間距離兩種。

    5.2.1 類內(nèi)距離

    類內(nèi)距離是指聚類后一個類內(nèi)元素之間的距離,一般有兩種方式度量,分別是平均距離法和組內(nèi)平方和誤差法。

    平均距離法首先要計算出所有元素兩兩之間的距離,然后得到它們的平均值,這個平均值作為類內(nèi)距離。公式如下:

    (3)

    其中,i表示類的序號,表示第i個類的類內(nèi)距離,Ci表示第i個類,N表示元素的數(shù)量,x、y表示第i個類中的兩個元素,在這里指的是兩個用戶,d(x,y)表示元素x和元素y之間的DTW距離。

    組內(nèi)平方和誤差法SSW(Sum of Squares Within)也是首先計算每個類中各個元素與其他元素之間的距離,然后取所有距離的平方和,這個平方和就被當作這個類的類內(nèi)距離。公式(4)介紹了計算類內(nèi)距離的組內(nèi)平方和誤差法的計算公式:

    (4)

    其中,m表示元素的序號,n表示元素的數(shù)量,xm表示第m個元素,Pm表示中心點的序號,CPm表示中心點。

    5.2.2 類間距離

    類間距離是指聚類后兩個類之間的距離,一般有以下幾種方式度量,分別是最短距離法、最長距離法、平均距離法、中心點距離法和組間平方和誤差法。

    最短距離法Dsl首先計算一個類中各個元素與另一個類中所有元素之間的距離,然后取其中的最小距離,這個最小距離就被當作這個類的類內(nèi)距離。下面公式介紹了計算類內(nèi)距離的最短距離法的計算方法:

    Dsl(Ci,Cj)=minx,y{d(x,y)|x∈Ci,y∈Cj}

    (5)

    其中,i表示類的序號,Ci表示第i個類,Cj表示第j個類,x、y分別表示Ci和Cj中的兩個元素,d(x,y)表示x、y這兩個元素的距離。

    最長距離法Dcl也是首先計算一個類中各個元素與另一個類中所有元素之間的距離,然后取其中的最大距離,這個最大距離就被當作這個類的類內(nèi)距離。下面公式介紹了類內(nèi)距離的最長距離法的計算方法:

    Dcl(Ci,Cj)=maxx,y{d(x,y)|x∈Ci,y∈Cj}

    (6)

    其中,i表示類的序號,Ci表示第i個類,Cj表示第j個類,x、y分別表示Ci和Cj中的兩個元素,d(x,y)表示x、y這兩個元素的距離。

    平均距離法Davg也是首先計算一個類中各個元素與另一個類中所有元素之間的距離,然后取所有距離的平均值,這個平均值就被當作這個類的類內(nèi)距離。下面公式介紹了計算類內(nèi)距離的平均距離法的計算公式:

    (7)

    其中,i表示類的序號,Ci表示第i個類,Cj表示第j個類,x、y分別表示Ci和Cj中的兩個元素,d(x,y)表示x、y這兩個元素的距離。

    中心點距離法Dcentroids采用每個類的中心點作為計算的元素,用兩個類的中心點之間的距離來表示它們的類間距離。公式如下:

    Dcentroids(Ci,Cj)=d(ri,rj)

    (8)

    其中,i表示類的序號,Ci表示第i個類,Cj表示第j個類,ri表示第i個類的中心點,rj表示第j個類的中心點,d(ri,rj)表示第i個類和第j個類的中心點的距離。

    組間平方和誤差法SSB(Sum of Squares Between)先計算出每個類的中心點和所有類的中心點,用它們的距離的平方和累加得到類間距離。公式如下:

    (9)

    可以看出,組間平方和誤差法和平均距離法比較類似,它們都采用了類內(nèi)所有元素的距離。組間平方和誤差法采用每個類的中心點和所有類的總中心點的距離,當作該類中所有元素與總中心點距離的平均值,從而計算距離平方的和;平均距離法采用的是所有元素的距離和的平均值,可以減小因為類內(nèi)某些元素分布不均造成的計算誤差。

    5.2.3 結(jié)合評價

    由于聚類結(jié)果沒有統(tǒng)一標準的評價方式,因此國內(nèi)外一些學者針對聚類結(jié)果的衡量標準做了很多研究。Zhao等人[20]提出了一種基于平方和的指標WB-index,該指標具有更容易尋找類的個數(shù)的特點,因此在本文中,我們運用該指標確定類的個數(shù)。

    WB-index結(jié)合類內(nèi)距離的評價標準組內(nèi)平方和誤差、類間距離的評價標準組件平方和誤差和聚類個數(shù),通過檢測曲線拐點來確定最小的聚類數(shù)量。

    一般來說,拐點是可能選擇最優(yōu)聚類數(shù)量的地方,但是在評價聚類效果的時候,沒有明確的理論或者研究結(jié)論可以定位拐點。這方面的研究也不夠完善。曲線中的最大值和最小值是最直接的拐點,但是有一些指標是單調(diào)遞減或者單調(diào)遞增的,也就是說沒有明顯的拐點,即沒有最佳聚類數(shù)量。另一些評價聚類效果的指標隨著聚類數(shù)量的增加,會出現(xiàn)曲線拐點,即可以找到最佳聚類數(shù)量。

    當檢測指標的曲線出現(xiàn)拐點時,其所對應的橫坐標數(shù)值很大概率是最優(yōu)的類的數(shù)目,如圖4所示。其中,橫坐標表示類的個數(shù),縱坐標表示的是采用的聚類評價指標的值,K點為曲線的拐點,N1是K點對應的聚類數(shù)量。在K點之前,指標數(shù)值一直在增加,在K點時到達極大值,K點之后指標數(shù)值開始減小。因此,K點所對應的聚類數(shù)量N1即可作為聚類時選擇的類型數(shù)量。

    Figure 4 Curve point detection圖4 曲線拐點檢測

    SSW聚類評價方式常被用于衡量類內(nèi)元素的緊湊度,SSB聚類評價方式常被用于衡量類與類之間的分離度。基于平方和的指標,即WB-index常會在聚類數(shù)量增加的時候出現(xiàn)拐點,其公式如下所示:

    (10)

    其中,k表示聚類的數(shù)量,SSW表示組內(nèi)平方和誤差,SSB表示組間平方和誤差。

    6 實驗結(jié)果分析及應用

    本文中數(shù)據(jù)全部來源于嗶哩嗶哩視頻網(wǎng)站。視頻彈幕數(shù)據(jù)主要包括彈幕文本內(nèi)容、彈幕出現(xiàn)時間、彈幕發(fā)布時間和加密后的用戶id。所有的數(shù)據(jù)預處理及分析算法都是用Python實現(xiàn)的。

    6.1 數(shù)據(jù)預分析

    以電視劇《青云志》第七集為例,將視頻每20 s的彈幕數(shù)量進行統(tǒng)計,并繪出整個視頻的彈幕數(shù)量分布圖,如圖5所示。

    Figure 5 Distribution of the number of barrage comments and time圖5 彈幕數(shù)量-時間分布圖

    圖5中,實線表示每20 s的彈幕總數(shù),虛線是通過最小二乘法對實線的擬合,可以用來表示實線的整體趨勢。由圖5中可以看出,彈幕數(shù)量隨著視頻播放的進行變化趨勢較為明顯。在視頻一開始,彈幕數(shù)量比較多,隨后慢慢減少,這是因為很多視頻觀眾喜歡在視頻一開始的時候發(fā)送大量“問候”用語,如“前排打卡”“重新來看”等彈幕。這些彈幕雖然經(jīng)常出現(xiàn),但是并不能夠表達用戶對于視頻的真實感受。這樣的彈幕就會成為噪音彈幕,從而影響彈幕文本分析的結(jié)論。

    從圖5還可以看到,每隔一段時間,彈幕數(shù)量就會出現(xiàn)峰值和谷值。如時間為5 min(圖中x軸為15)、18 min(圖中x軸為54)、27 min(圖中x軸為81)時,即圓圈內(nèi)均為該視頻彈幕數(shù)量的峰值點,說明這些地方的情節(jié)引起了觀眾的共鳴,因此觀眾發(fā)送彈幕表達自己的所見所思所感。通過觀看視頻,發(fā)現(xiàn)第一處是時下很受歡迎的兩個少年歌手在打鬧的情節(jié);第二處是一位得道高人給男主角傳授功法的情節(jié),此時很多人在吐槽他的選擇;第三處是劇中神獸靈尊出現(xiàn)的情節(jié),引起了眾多觀眾對特效的評論。因此,彈幕數(shù)量是可以大致反映情節(jié)對觀眾的吸引力的。

    相對而言,時間在11 min(圖中x軸為33),21~22 min(圖中x軸為65左右),33~34 min(圖中x軸為100)時,即方框內(nèi)均為該視頻彈幕數(shù)量的谷值點,說明這些地方的情節(jié)觀眾不太愿意發(fā)送彈幕評論,是因為這里的故事情節(jié)平淡無奇,沒有什么可“吐槽”或評論的特點。

    本視頻共有7 634條彈幕,2 628個單獨用戶,人均彈幕發(fā)送量2.9條。為了降低噪音彈幕對分析的干擾,對視頻的每個用戶發(fā)送的彈幕數(shù)量進行統(tǒng)計,結(jié)果如圖6所示。

    Figure 6 Statistical chart of the number of barrage comments per user and the number of users圖6 每個用戶發(fā)送的彈幕條數(shù)-用戶數(shù)量統(tǒng)計圖

    由圖6可以看出,僅發(fā)送1條彈幕的用戶數(shù)量有1 468位,遠超僅發(fā)送2條彈幕的用戶數(shù)量兩倍有余,而隨著每個用戶發(fā)送彈幕條數(shù)的增多,用戶數(shù)量也成單調(diào)遞減狀態(tài),彈幕發(fā)送數(shù)量超過10條的用戶共有130人。

    為了更清楚地分析每個用戶發(fā)送彈幕數(shù)量的比例關(guān)系,將不同情況下用戶數(shù)量所占比例繪制成餅圖,如圖7所示。

    Figure 7 Pie chart of the number of users sending different numbers of barrage comments圖7 發(fā)送不同彈幕條數(shù)的用戶數(shù)量統(tǒng)計餅圖

    由圖7餅圖可以很清晰地看出,僅發(fā)送1條彈幕的用戶占用戶總數(shù)的一半以上,僅發(fā)送2條彈幕的用戶占用戶總數(shù)的接近五分之一?,F(xiàn)在,刪去發(fā)送彈幕數(shù)量少于3條的用戶發(fā)送的彈幕,再對彈幕數(shù)量與視頻時間的函數(shù)關(guān)系進行統(tǒng)計,結(jié)果如圖8所示。

    Figure 8 Distribution of the number of barrage comments after filtering and time圖8 噪音彈幕過濾后的彈幕數(shù)量-時間分布圖

    Figure 9 Time distribution of the number of noisy and original barrage comments圖9 噪音彈幕數(shù)量/原始彈幕數(shù)量-時間分布圖

    將圖8與圖5對比可以發(fā)現(xiàn),在各個時間段,視頻彈幕的數(shù)量都相應減少,而彈幕數(shù)量隨著視頻時間的變化趨勢還是與過濾彈幕前幾乎一樣。為了更好地看清楚噪音彈幕在各個時間段的分布,將噪音彈幕數(shù)量/原始彈幕數(shù)量和視頻時間之間的關(guān)系輸出出來,結(jié)果如圖9所示??v坐標采用的參數(shù)是噪音彈幕數(shù)量的比重niIndex,它是噪音彈幕數(shù)量noiseBNum和原始彈幕數(shù)量initialBNum的比值,公式如下:

    (11)

    其中,噪音彈幕是指發(fā)送彈幕條數(shù)少于3條的用戶發(fā)送的彈幕,原始彈幕是指未經(jīng)過濾的視頻彈幕。它們的比值反映了噪音彈幕在視頻不同時間段的所有彈幕中所占的比重情況。

    從圖9中兩個視頻虛線的趨勢可以看出,噪音彈幕在視頻開始和視頻結(jié)束的時候有兩個很明顯的峰值,點P1和點P2。它們的值都接近或超過0.5,也就是說,在視頻開始(0 s)和視頻結(jié)束(43~44 min)時,觀眾發(fā)出的彈幕有接近或超過一半的都是噪音彈幕。這與之前關(guān)于彈幕用戶喜歡在視頻開始和結(jié)束時發(fā)送“前排打卡”“完結(jié)撒花”“進度條撐住”等彈幕的假設相符合。

    將《青云志》第七集視頻與第一集視頻對比可以發(fā)現(xiàn),第七集視頻的中間部分噪音彈幕的比重維持在0.2~0.4,而第一集視頻從開始到10 min(圖中x軸為30),噪音彈幕比例一直在下降,之后維持在0.2~0.3,由此可見,噪音彈幕比不僅與視頻的時間分布有關(guān),還與視頻的內(nèi)容有關(guān)。有理由推測,第一集視頻的中間情節(jié)比第七集更加吸引用戶發(fā)表評論。

    6.2 情感分析

    在對彈幕文本進行情感分析的過程中,需要注意的地方主要有兩個:一是彈幕文本的選擇,即對哪些彈幕文本進行情感分析,刪除哪些彈幕文本;二是每條彈幕中需要分析的詞語的選擇,有些詞語沒有實際意義或者沒有情感趨向,需要在情感分析的過程中將其過濾,保留具有情感傾向的詞語。

    Figure 10 Time distribution of 7-dimension sentiment value圖10 彈幕7維情感值的時間分布

    基于以上考慮,以及對比和研究,本文決定采用去除噪音彈幕的方法來提升分析的準確度。在去除噪音彈幕之后,對彈幕分詞后的詞語進行判斷,分析它們是否具有明顯的情感傾向。通過將同一段時間內(nèi)的所有彈幕的情感值取平均數(shù),即可獲得這段時間彈幕用戶對于該段視頻的情感傾向。

    針對電影《言葉之庭》的彈幕數(shù)據(jù),它共有32 323條彈幕。我們進行7維情感分析,即樂、好、怒、哀、懼、惡、驚,得到的結(jié)果如圖10所示。

    從圖10的彈幕數(shù)據(jù)情感圖可以看出,在不同的時間段(每30 s)的同一項情感的數(shù)值有較大差異。在相同的時間段,7種不同的情感類型的數(shù)據(jù)值也有較大差異。

    如第一種情感“樂”,在視頻的4~10 min(圖中x軸為[8,20]),15~20 min(圖中x軸為[30,40]),15~18 min(圖中x軸為[45,54])等處,其值在2以上。說明這段時間的視頻情節(jié)含有“樂”的內(nèi)容,因此彈幕用戶會選擇在這里發(fā)送有關(guān)于“樂”的彈幕。而在視頻的其余一些時間段,彈幕用戶幾乎沒有發(fā)送過“樂”相關(guān)的彈幕,說明這段時間的視頻情節(jié)沒有什么內(nèi)容吸引用戶發(fā)送“樂”相關(guān)的彈幕。即可推測,這里的視頻內(nèi)容不夠“樂”。

    而與“樂”具有相近含義的“好”則表現(xiàn)出了一些不同的特點,它的分布區(qū)間更大,出現(xiàn)“好”相關(guān)的彈幕也較多。這是因為“喜歡”“表白”等詞都屬于“好”,在觀看視頻過程中,彈幕用戶經(jīng)常發(fā)表自己對演員角色的評價。比較常見的積極性評價一般為“喜歡”某演員或者某角色,并向他們“表白”等。

    第三種情感“怒”和第七種情感“驚”均一直為0,也就是說,在這個視頻中,沒有用戶發(fā)表有關(guān)這兩種情感的彈幕內(nèi)容。從實際內(nèi)容來看,這個視頻由于是一部40 min左右的電影《言葉之庭》,并且電影沒有戲劇沖突十分強烈的情節(jié),也沒有出其不意的部分,更多的是以平鋪直敘的方式展開敘述。因此,沒有彈幕用戶發(fā)表這兩種情感的彈幕也是合理的。

    其余幾種情感也是各自分布不同,如第六種情感“惡”就幾乎一直貫穿在視頻中間,說明該視頻的情節(jié)內(nèi)容經(jīng)常會讓用戶想發(fā)送“惡”相關(guān)的彈幕,而“惡”和“好”也是這7種情感中僅有的兩種貫穿全劇的情感。

    顯然,每個不同的視頻,情感的分布是會有差異的。但是,通過在其它類型的視頻中運用相同的計算法則,發(fā)現(xiàn)出現(xiàn)較多的情感類型常為“好”和“惡”。其它類型的情感則根據(jù)視頻的不同會有相應的分布變化。

    例如,在視頻《西游降魔篇》中,也是“好”和“惡”的相關(guān)彈幕最多。具體的情感分布如圖11所示。對比圖10,從分布比例上看,第五種情感的出現(xiàn)頻率顯然增大。也就是說“懼”相關(guān)的彈幕出現(xiàn)頻率增大,有更多觀眾在觀看這部視頻的時候發(fā)送了具有“懼”含義的彈幕。試著將其中一部分彈幕輸出出來,如表6所示。

    Figure 11 Time distribution of 7-dimensional sentiment value in “Journey to the West:Conquering the Demons”圖11 《西游降魔篇》彈幕7維情感值的時間分布Table 6 Partial barrage comments that represent “scare” in “Journey to the West:Conquering the Demons”表6 《西游降魔篇》表示“懼”的部分彈幕

    表示“懼”的彈幕(部分)豬剛鬣的臉好恐怖這段超可怕啊這段比魚怪恐怖多了…這段挺嚇人的,同志們注意了這一段恐怖爆了這段也超恐怖前面好嚇人

    從表6可以看出,用戶普遍在表達對于視頻內(nèi)容的“懼”,有表示“恐怖”的,也有表示“嚇人”的,因為這段視頻中豬剛鬣恢復成原本的樣貌,是頭很可怕的豬,電影造型也非??植?。因此,很多觀眾表達了自己對于這個場景的“恐懼”,說明這部電影的“懼”的元素比《青云志》第七集的多。

    經(jīng)過這樣的情感標注,可以對視頻內(nèi)容進行情感預測。例如,有些觀眾害怕“恐懼”的內(nèi)容,則可以通過對彈幕的情感分析,在出現(xiàn)大規(guī)?!翱謶帧睆椖恢疤崾鞠嚓P(guān)用戶,從而幫助用戶更好地觀看視頻。

    從相同的時間段來看,不同類型情感的數(shù)值差異更為明顯。在圖11的開始部分(x軸為[0,50])這一階段,第一種情感“樂”和第二種情感“哀”分布都較為稀疏,說明這兩種情感在這段時間的視頻內(nèi)容上分布較少。而第三種情感“怒”和第七種情感“驚”,它們不僅在視頻開始的時間段沒有情感值,在整個視頻中也極少有相關(guān)彈幕。

    由此說明,對于每段不同的情節(jié),彈幕情感類型的分布會有較大差異,且差異隨著視頻內(nèi)容的改變而相應變化。

    6.3 用戶情感類型分析

    將彈幕用戶發(fā)送的所有彈幕進行統(tǒng)計、歸類,為了使彈幕數(shù)據(jù)可以更好地反映出用戶的情感信息,將個人發(fā)送彈幕數(shù)據(jù)量少于3、5、10、15以及20條的分別刪去,對剩下的用戶進行情感值(只計算積極和消極情感)的計算和統(tǒng)計,結(jié)果如圖12所示。

    從圖12中可以看出,隨著個人彈幕發(fā)送數(shù)量的增加,用戶情感值相對較小(正向和負向)的依次減少,剩下的用戶發(fā)送的彈幕的情感值偏高。由此可以得出,用戶發(fā)送的彈幕數(shù)量越多,含有情感傾向的趨勢越明顯,也就是說,發(fā)送的彈幕內(nèi)容越多,越容易從中抽取出用戶針對某個視頻發(fā)送彈幕的個人情感傾向。還可以看出,一般來說用戶的積極情感值顯著高于消極情感值,將用戶中消極情感值高于積極情感值的情感數(shù)據(jù)輸出出來,并繪制成圖,如圖13所示。

    從上面的分析我們可以得知,從彈幕中得到的情感指數(shù)可以反映一個用戶的特征,比如正能量或負能量,這樣的情感特征可以幫助我們?nèi)τ脩暨M行分類。

    6.4 用戶分類

    Figure 12 Sentiment value distribution of users圖12 彈幕用戶的情感值分布

    Figure 13 Sentiment value of users who are more negative than positive圖13 消極情感多于積極情感的用戶的情感數(shù)據(jù)

    首先,我們利用聚類評價指標來選取k-means算法中類的個數(shù)。圖14表示SSW,SSB,SSW/SSB,WB-index與用戶聚類個數(shù)k的關(guān)系,隨著k值增大,采用的WB-index評價指標在降低的過程中多次出現(xiàn)拐點。因此,根據(jù)它衡量聚類個數(shù)時,可以認為拐點出現(xiàn)時的k值可作為合適的用戶類別數(shù)。

    由圖14可以看出,隨著k值的增大,表示類內(nèi)距離和類間距離的衡量參數(shù)都呈增大趨勢,其中,SSW/SSB值在短暫波動后趨于穩(wěn)定上升。而按照WB-index衡量指標來看,隨著k值的增大,雖然其值呈上升趨勢,但是上升過程中出現(xiàn)了多個谷值點,如主題數(shù)量為7、9、14等的時候,這些拐點為我們提供了確定k值的可選范圍。

    在k為7的時候,WB-index第一次出現(xiàn)拐點,這個點意味著7比附近的k值(如6、8等)更合適作為聚類個數(shù)的選取。接下來,我們以7個類型為基礎,對用戶進行聚類。7個用戶類數(shù)量分布如圖15所示。由圖15可以看出,類0、2、4含有較少的用戶,均在70個左右;類5含有最多的用戶,共有1 010個用戶;類2含有的彈幕條數(shù)僅次于類型5,為607個;其他類的用戶個數(shù)都在400左右。

    Figure 14 Relationship between clustering measurement index and k圖14 聚類相關(guān)衡量指標與k值的關(guān)系

    Figure 15 User distribution of each category when k=7圖15 k=7時,各個類的用戶數(shù)量分布圖

    分析各個類型的用戶發(fā)送的彈幕的內(nèi)容,將第一類隨機取出兩個用戶發(fā)送的所有彈幕進行觀察,這些彈幕如圖16所示。

    Figure 16 Comparison among all barrage comments sent by two users圖16 兩個用戶發(fā)送的所有彈幕對比

    由圖16可以看出用戶15cc0dec(以下簡稱用戶1)與用戶cdc9677a(以下簡稱用戶2)發(fā)送的彈幕情感數(shù)值和相應時間。

    實線框內(nèi)的彈幕時間約在200~300 s內(nèi)發(fā)送,且彈幕情感數(shù)據(jù)的值(7維情感都考慮的值)在DTW算法拉伸后較為相近;同樣,在虛線框內(nèi)的彈幕是1 100~1 800 s發(fā)送的,相似度看起來不是很高,在有情感值的彈幕中,只有虛線框內(nèi)的最后一條彈幕情感數(shù)據(jù)完全一樣;而實線框內(nèi)的2 100~2 500 s內(nèi)的彈幕則相似度較高,一方面彈幕情感值較為接近,另一方面它們的發(fā)送時間也較為連續(xù),經(jīng)過DTW對時間序列進行動態(tài)規(guī)整后,距離更加接近。

    因此,通過以上的實驗結(jié)果可以看出,在對彈幕數(shù)據(jù)進行情感分析的過程中,噪音彈幕多集中在視頻的首尾部分。通過去除噪音彈幕可以更好地分析用戶發(fā)送彈幕的情感以及視頻情節(jié)對觀眾情感產(chǎn)生的影響。在根據(jù)用戶情感對用戶進行聚類的過程中,考慮到視頻時間序列的拉伸和用戶通過彈幕表達的對視頻情節(jié)的情感狀態(tài),聚在一類的用戶在觀看視頻時的確有相似的情感偏好,他們會在相同的時間節(jié)點上產(chǎn)生相同的情感。由此可見,通過彈幕情感數(shù)據(jù)對用戶進行聚類可以較好地將同一類用戶聚在一起,一方面可以分析這些用戶發(fā)送彈幕的愛好和用詞特征;另一方面,也能夠據(jù)此對同類用戶進行更加精準的視頻推薦,分析他們對特定類型的視頻是否具有相同的愛好。這些也可以作為視頻推薦或者“知音”推薦等的依據(jù)。

    7 結(jié)束語

    彈幕數(shù)據(jù)的分析工作目前來說較少,本文主要對彈幕數(shù)據(jù)的獲取、預處理以及深層次的分析方法進行了詳細介紹,提出了基于彈幕數(shù)據(jù)情感分析的用戶分類算法。該算法引入用戶的情感指標,并以此指標作為用戶特征進行無監(jiān)督的分類。我們改進了傳統(tǒng)k-means算法,使之能自動確定類的數(shù)目,并引入DTW來計算用戶情感分布之間的距離。實驗結(jié)果表明,我們的分析方法能很好地進行彈幕數(shù)據(jù)分析,并對彈幕用戶進行分類標簽。

    在本文的基礎上,未來還有其他可繼續(xù)研究的方向。例如,可以通過彈幕的發(fā)布時間(如2017年5月30號)來研究視頻從發(fā)布在網(wǎng)絡上開始,用戶的關(guān)注度、情感數(shù)據(jù)以及彈幕評論的內(nèi)容是否會隨著時間推移而顯現(xiàn)特別的規(guī)律。同時,可以通過算法研究檢測異常點,通過彈幕異常點的監(jiān)測,分析相關(guān)視頻的演職人員是否有了新的動態(tài),從而造成了用戶發(fā)送彈幕頻率或狀態(tài)出現(xiàn)了很大的變化等。

    在這個大數(shù)據(jù)愈發(fā)流行的時代,對于數(shù)據(jù)的收集、處理和分析也顯得愈加重要。彈幕這種新型的文本數(shù)據(jù)為我們在這個領域的研究提供了一個新的方向,同時這也是新的挑戰(zhàn)。

    [1] Song G,Ye Y,Du X,et al.Short text classification:A survey[J].Journal of Multimedia,2014,9(5):635-643.

    [2] Wijeratne S, Heravi B R. Keyword sense disambiguation based approach for noise filtering in Twitter[C]∥Proc of the 1st Insight Student Conference,2014:1.

    [3] Wang X, Wei F,Liu X,et al.Topic sentiment analysis in Twitter:A graph-based hashtag sentiment classification approach[C]∥Proc of ACM International Conference on Information and Knowledge,2011:1031-1040.

    [4] Sakaki T,Okazaki M,Matsuo Y.Earthquake shakes Twitter users:Real-time event detection by social sensors[C]∥Proc of International World Wide Web Conference,2010:851-860.

    [5] Kouloumpis E,Wilson T,Moore J D.Twitter sentiment analysis:The good the bad and the omg![C]∥Proc of International Conference on Weblogs Social Media,2011:164.

    [6] Bollen J,Mao H,Pepe A.Modeling public mood and emotion:Twitter sentiment and socio-economic phenomena[C]∥Proc of ICWSM,2011:450-453.

    [7] Wang H,Can D,Kazemzadeh A,et al.A system for real-time Twitter sentiment analysis of 2012 U.S. presidential election cycle[C]∥Proc of the ACL 2012 System Demonstrations.Association for Computational Linguistics,2012:115-120.

    [8] Hays A V,Richmond B J,Optican L M A. A Unix-based multiple process system for real-time data acquisition and control[C]∥Proc of Wescon Conference,1982:1-10.

    [9] Lee W, Stolfo S J,Chan P K,et al.Real time data mining-based intrusion detection[C]∥Proc of DARPA Information Survivability Conference & Exposition II,2001:89-100.

    [10] Witten I H, Frank E,Hall M A,et al.Data mining:Practical machine learning tools and techniques[M].San Francisco:Morgan Kaufmann,2016.

    [11] Fan W,Bifet A.Mining big data:Current status,and forecast to the future[J].ACM SIGKDD Explorations Newsletter,2013,14(2):1-5.

    [12] Lee K,Agrawal A,Choudhary A.Real-time disease surveillance using Twitter data:Demonstration on flu and cancer[C]∥Proc of the 19th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining,2013:1474-1477.

    [13] Zhan Xue-mei.Development of barrage of video website in China[J].Popular Science & Technology,2014,16(10):232-233.(in Chinese)

    [14] Zheng Yang-yang, Xu Jian,Xiao Zhuo.Utilization of sentiment analysis and visualization in online video bullet-screen comments[J].New Technology of Library and Information Service,2015,31(11):82-90.(in Chinese)

    [15] Xian Y,Li J,Zhang C,et al.Video highlight shot extraction with time-sync comment[C]∥Proc of International Workshop on Hot Topics in Planet-Scale Mobile Computing and Online Social Networking,2015:31-36.

    [16] Wang Su-ge, Wei Ying-jie.The Influence of stoplist on the Chinese text sentiment categorization[J].Journal of the China Society for Scientific and Technical Information,2008,27(2):175-179.(in Chinese)

    [17] Xiong Wen-xin,Song Rou.Removal of stop word in users’ request for information retrieval[J].Computer Engineering,2007,33(6):195-197.(in Chinese)

    [18] Hua Bo-lin. Stop-word processing technique in knowledge extraction[J].New Technology of Library and Information Service,2007,2(8):48-51.(in Chinese)

    [19] Xu Lin-hong,Lin Hong-fei,Pan Yu,et al.Constructing the affective lexicon ontology[J].Journal of the China Society for Scientific and Technical Information,2008,27(2):180-185.(in Chinese)

    [20] Zhao Q,Fr?nti P.WB-index:A sum-of-squares based index for cluster validity[J].Data & Knowledge Engineering,2014,92(7):77-89.

    附中文參考文獻:

    [13] 詹雪美.淺析彈幕視頻網(wǎng)站在我國的發(fā)展[J].大眾科技,2014,16(10):232-233.

    [14] 鄭飏飏,徐健,肖卓.情感分析及可視化方法在網(wǎng)絡視頻彈幕數(shù)據(jù)分析中的應用[J].現(xiàn)代圖書情報技術(shù),2015,31(11):82-90.

    [16] 王素格,魏英杰.停用詞表對中文文本情感分類的影響[J].情報學報,2008,27(2):175-179.

    [17] 熊文新,宋柔.信息檢索用戶查詢語句的停用詞過濾[J].計算機工程,2007,33(6):195-197.

    [18] 化柏林.知識抽取中的停用詞處理技術(shù)[J].現(xiàn)代圖書情報技術(shù),2007,2(8):48-51.

    [19] 徐琳宏,林鴻飛,潘宇,等.情感詞匯本體的構(gòu)造[J].情報學報,2008,27(2):180-185.

    猜你喜歡
    彈幕聚類距離
    彈幕
    HOLLOW COMFORT
    漢語世界(2021年2期)2021-04-13 02:36:18
    “彈幕”防御大師
    一大撥彈幕正在向你襲來……
    算距離
    基于DBSACN聚類算法的XML文檔聚類
    電子測試(2017年15期)2017-12-18 07:19:27
    每次失敗都會距離成功更近一步
    山東青年(2016年3期)2016-02-28 14:25:55
    基于改進的遺傳算法的模糊聚類算法
    愛的距離
    母子健康(2015年1期)2015-02-28 11:21:33
    一種層次初始的聚類個數(shù)自適應的聚類方法研究
    亚洲av成人av| 七月丁香在线播放| 一级毛片久久久久久久久女| 国内精品宾馆在线| 精品亚洲乱码少妇综合久久| 麻豆成人av视频| 天堂中文最新版在线下载 | 欧美精品一区二区大全| 亚洲av成人av| 男人爽女人下面视频在线观看| 国产在视频线在精品| 黄色配什么色好看| 久久99精品国语久久久| 舔av片在线| 亚洲国产色片| 欧美一级a爱片免费观看看| 欧美区成人在线视频| 亚洲怡红院男人天堂| 最近中文字幕高清免费大全6| 亚洲精品日本国产第一区| 久久久久久久亚洲中文字幕| av.在线天堂| 色综合亚洲欧美另类图片| 亚洲欧美日韩卡通动漫| 亚洲av不卡在线观看| 久久精品国产亚洲av涩爱| 国产黄频视频在线观看| 我要看日韩黄色一级片| 麻豆av噜噜一区二区三区| 欧美高清成人免费视频www| 午夜福利高清视频| 精品一区在线观看国产| 精品人妻熟女av久视频| 国产又色又爽无遮挡免| 神马国产精品三级电影在线观看| 久久久久久久午夜电影| 免费黄色在线免费观看| kizo精华| 国产黄频视频在线观看| 久久精品久久精品一区二区三区| 亚洲av电影不卡..在线观看| 天天一区二区日本电影三级| 久久久久精品久久久久真实原创| 毛片一级片免费看久久久久| av线在线观看网站| 大陆偷拍与自拍| 亚洲伊人久久精品综合| 亚洲综合精品二区| 午夜精品一区二区三区免费看| 国产午夜福利久久久久久| 国产精品久久久久久精品电影| 久久6这里有精品| 欧美日韩亚洲高清精品| 黄色日韩在线| 亚洲一级一片aⅴ在线观看| videossex国产| 亚洲国产精品国产精品| 天堂中文最新版在线下载 | 一级二级三级毛片免费看| 青春草国产在线视频| 亚洲精品一二三| 国产亚洲5aaaaa淫片| 搡老乐熟女国产| 99热6这里只有精品| 18+在线观看网站| 亚洲av中文av极速乱| 91久久精品国产一区二区三区| 午夜爱爱视频在线播放| 亚洲精华国产精华液的使用体验| av在线观看视频网站免费| 嫩草影院精品99| 午夜激情福利司机影院| 内射极品少妇av片p| 精品人妻视频免费看| 91在线精品国自产拍蜜月| 亚洲国产成人一精品久久久| 成人亚洲欧美一区二区av| 亚洲av男天堂| 毛片女人毛片| 午夜视频国产福利| 国产黄频视频在线观看| 一二三四中文在线观看免费高清| 亚洲精品乱码久久久v下载方式| 精品酒店卫生间| 久久久成人免费电影| 久久久久九九精品影院| 成人一区二区视频在线观看| 午夜福利在线在线| 成人午夜高清在线视频| 亚洲精品乱码久久久v下载方式| 欧美区成人在线视频| av又黄又爽大尺度在线免费看| 在现免费观看毛片| 日韩在线高清观看一区二区三区| av国产免费在线观看| 嫩草影院入口| 成人美女网站在线观看视频| 男女边摸边吃奶| 我要看日韩黄色一级片| 内地一区二区视频在线| 成年女人看的毛片在线观看| 激情五月婷婷亚洲| 中文字幕免费在线视频6| 老司机影院毛片| 婷婷六月久久综合丁香| 在线 av 中文字幕| 日韩成人伦理影院| 欧美bdsm另类| 午夜精品在线福利| 91精品一卡2卡3卡4卡| 国产 一区精品| 久久韩国三级中文字幕| 欧美日韩亚洲高清精品| 老师上课跳d突然被开到最大视频| 国产 亚洲一区二区三区 | 少妇熟女aⅴ在线视频| 99re6热这里在线精品视频| 免费看光身美女| 夫妻性生交免费视频一级片| 亚洲国产精品专区欧美| 午夜精品在线福利| 伦精品一区二区三区| 久久精品国产自在天天线| 丰满少妇做爰视频| 18+在线观看网站| 日本午夜av视频| 性色avwww在线观看| 大又大粗又爽又黄少妇毛片口| 午夜日本视频在线| 色播亚洲综合网| 久久久a久久爽久久v久久| 日韩欧美 国产精品| 有码 亚洲区| 国产成人福利小说| 精品99又大又爽又粗少妇毛片| 老司机影院成人| 亚洲国产成人一精品久久久| 国产成人午夜福利电影在线观看| 精品一区二区三区人妻视频| www.色视频.com| 色综合亚洲欧美另类图片| 欧美日韩国产mv在线观看视频 | 久久热精品热| 高清日韩中文字幕在线| 高清av免费在线| 亚洲精品国产成人久久av| 欧美日韩国产mv在线观看视频 | 国产av码专区亚洲av| 肉色欧美久久久久久久蜜桃 | 精品国产三级普通话版| 久久久久久伊人网av| 搡老妇女老女人老熟妇| 青春草亚洲视频在线观看| 亚洲最大成人手机在线| 建设人人有责人人尽责人人享有的 | 久久久精品免费免费高清| 永久网站在线| av在线天堂中文字幕| 欧美成人午夜免费资源| 天天躁夜夜躁狠狠久久av| 一区二区三区四区激情视频| 欧美一级a爱片免费观看看| 亚洲真实伦在线观看| 一个人观看的视频www高清免费观看| 99热这里只有是精品50| 91aial.com中文字幕在线观看| 搡老妇女老女人老熟妇| 国内精品宾馆在线| 精品一区二区免费观看| 只有这里有精品99| 亚洲成人中文字幕在线播放| 日韩三级伦理在线观看| 五月天丁香电影| 午夜精品一区二区三区免费看| 熟女电影av网| 久久精品人妻少妇| 欧美日韩精品成人综合77777| 婷婷六月久久综合丁香| 久久久久网色| 网址你懂的国产日韩在线| 高清av免费在线| 色视频www国产| 亚洲无线观看免费| 国产免费福利视频在线观看| 大陆偷拍与自拍| 国产一级毛片七仙女欲春2| 夜夜看夜夜爽夜夜摸| 亚洲av中文av极速乱| 日韩大片免费观看网站| 一级毛片电影观看| 日韩欧美精品免费久久| 久久久久性生活片| 一级爰片在线观看| 国产精品一区二区三区四区免费观看| 欧美三级亚洲精品| 美女主播在线视频| or卡值多少钱| 简卡轻食公司| 99久久精品一区二区三区| 久久久久久久久久成人| 熟妇人妻久久中文字幕3abv| 纵有疾风起免费观看全集完整版 | 国产片特级美女逼逼视频| 欧美+日韩+精品| 一级毛片 在线播放| 三级国产精品片| 国产男女超爽视频在线观看| av在线天堂中文字幕| 老女人水多毛片| 神马国产精品三级电影在线观看| 99久久精品国产国产毛片| 国产精品99久久久久久久久| 国产av不卡久久| 亚洲国产成人一精品久久久| 日日啪夜夜撸| 好男人在线观看高清免费视频| 搞女人的毛片| 丰满乱子伦码专区| 国产乱人偷精品视频| 亚洲精品乱码久久久久久按摩| 欧美成人a在线观看| 国产精品麻豆人妻色哟哟久久 | 色播亚洲综合网| 久久国产乱子免费精品| 激情 狠狠 欧美| 亚洲欧美中文字幕日韩二区| 少妇的逼水好多| 亚洲精品成人久久久久久| 亚洲va在线va天堂va国产| 天堂网av新在线| av天堂中文字幕网| 久久久成人免费电影| 最近2019中文字幕mv第一页| 性插视频无遮挡在线免费观看| 青春草国产在线视频| 精品酒店卫生间| 2018国产大陆天天弄谢| 韩国av在线不卡| 天堂av国产一区二区熟女人妻| 纵有疾风起免费观看全集完整版 | 九色成人免费人妻av| 精品久久久精品久久久| 99热全是精品| 免费看不卡的av| av天堂中文字幕网| 免费av毛片视频| 精品一区在线观看国产| 亚洲人与动物交配视频| 尤物成人国产欧美一区二区三区| 国产白丝娇喘喷水9色精品| av播播在线观看一区| 日韩大片免费观看网站| 日日摸夜夜添夜夜爱| 亚洲国产精品国产精品| 夜夜看夜夜爽夜夜摸| 777米奇影视久久| 久久久久久久大尺度免费视频| 久久精品人妻少妇| 麻豆成人午夜福利视频| 免费观看在线日韩| 亚洲国产最新在线播放| 国产精品.久久久| 青春草亚洲视频在线观看| 国产免费又黄又爽又色| 99久久中文字幕三级久久日本| 极品教师在线视频| 91aial.com中文字幕在线观看| 亚洲欧美中文字幕日韩二区| 身体一侧抽搐| 亚洲国产最新在线播放| 精品酒店卫生间| 亚洲av电影在线观看一区二区三区 | 精品国内亚洲2022精品成人| 国产精品国产三级国产av玫瑰| 国产精品蜜桃在线观看| 欧美日韩在线观看h| 国产麻豆成人av免费视频| 插逼视频在线观看| 一二三四中文在线观看免费高清| 日本熟妇午夜| 校园人妻丝袜中文字幕| 色5月婷婷丁香| 麻豆国产97在线/欧美| 极品少妇高潮喷水抽搐| 亚洲美女视频黄频| 亚洲精品乱码久久久v下载方式| 国产真实伦视频高清在线观看| 国产精品美女特级片免费视频播放器| 日本黄大片高清| 国产精品久久视频播放| h日本视频在线播放| 综合色丁香网| 久久久久免费精品人妻一区二区| 国产黄a三级三级三级人| 日日啪夜夜爽| 国产伦精品一区二区三区视频9| 亚洲精品456在线播放app| 日韩人妻高清精品专区| 亚洲四区av| 国产精品一区二区在线观看99 | 91精品一卡2卡3卡4卡| 久久久国产一区二区| av在线老鸭窝| 一本—道久久a久久精品蜜桃钙片 精品乱码久久久久久99久播 | 夜夜爽夜夜爽视频| 亚洲自偷自拍三级| 十八禁国产超污无遮挡网站| 亚洲精品乱久久久久久| 十八禁国产超污无遮挡网站| 久久久久久久久久黄片| 久久久a久久爽久久v久久| 热99在线观看视频| 色尼玛亚洲综合影院| 少妇被粗大猛烈的视频| 欧美 日韩 精品 国产| 街头女战士在线观看网站| 久久精品夜色国产| 国产极品天堂在线| 亚洲精品成人av观看孕妇| 国产高潮美女av| 禁无遮挡网站| 亚洲成色77777| 日韩三级伦理在线观看| 一二三四中文在线观看免费高清| 国产成人91sexporn| 一级毛片久久久久久久久女| 亚洲一区高清亚洲精品| 久久久a久久爽久久v久久| 99视频精品全部免费 在线| 高清日韩中文字幕在线| 一个人观看的视频www高清免费观看| 欧美 日韩 精品 国产| 大香蕉久久网| 亚洲熟女精品中文字幕| 久久人人爽人人爽人人片va| 亚洲国产最新在线播放| 亚洲久久久久久中文字幕| 午夜视频国产福利| 国产午夜精品久久久久久一区二区三区| 国产成人福利小说| 麻豆成人午夜福利视频| av专区在线播放| 亚洲自拍偷在线| 亚洲av一区综合| 麻豆精品久久久久久蜜桃| 国产精品不卡视频一区二区| 亚洲真实伦在线观看| 啦啦啦中文免费视频观看日本| 国产91av在线免费观看| av网站免费在线观看视频 | 日本爱情动作片www.在线观看| 久久久久性生活片| 亚洲欧美日韩东京热| 亚洲乱码一区二区免费版| 久久久精品欧美日韩精品| 午夜精品在线福利| 丝袜喷水一区| 国产毛片a区久久久久| 91aial.com中文字幕在线观看| 91久久精品国产一区二区三区| 99久国产av精品国产电影| 国产探花在线观看一区二区| 日本黄大片高清| 国产亚洲91精品色在线| 日本欧美国产在线视频| 午夜免费观看性视频| 久久99蜜桃精品久久| 天天躁日日操中文字幕| 乱码一卡2卡4卡精品| 91久久精品电影网| 久久久久精品性色| 国内少妇人妻偷人精品xxx网站| 久99久视频精品免费| 22中文网久久字幕| 麻豆精品久久久久久蜜桃| 国产黄频视频在线观看| 嘟嘟电影网在线观看| 亚洲熟女精品中文字幕| 亚洲不卡免费看| 精品一区二区免费观看| 一级爰片在线观看| 一级毛片电影观看| 亚洲熟女精品中文字幕| 国产乱来视频区| 自拍偷自拍亚洲精品老妇| 三级国产精品片| 久久99蜜桃精品久久| 国产单亲对白刺激| 搡女人真爽免费视频火全软件| 亚洲国产精品国产精品| 美女黄网站色视频| 99久久精品一区二区三区| 成人特级av手机在线观看| 18+在线观看网站| 久久综合国产亚洲精品| 大香蕉久久网| 亚洲精品国产av成人精品| 亚洲欧美精品自产自拍| 国产美女午夜福利| 亚洲欧美日韩无卡精品| 亚洲图色成人| xxx大片免费视频| 欧美潮喷喷水| 我要看日韩黄色一级片| 岛国毛片在线播放| videossex国产| 亚洲电影在线观看av| 2021少妇久久久久久久久久久| 夜夜看夜夜爽夜夜摸| 久久精品久久精品一区二区三区| 赤兔流量卡办理| 色吧在线观看| 日韩一区二区三区影片| 少妇熟女aⅴ在线视频| 日本猛色少妇xxxxx猛交久久| 欧美日韩亚洲高清精品| 国内少妇人妻偷人精品xxx网站| 综合色丁香网| 午夜视频国产福利| 国产一区亚洲一区在线观看| 高清毛片免费看| 黄片无遮挡物在线观看| 简卡轻食公司| 日本免费在线观看一区| 一区二区三区四区激情视频| 国产又色又爽无遮挡免| 国产国拍精品亚洲av在线观看| 国产在线一区二区三区精| 国产 一区精品| 久久人人爽人人片av| 国产精品一区二区性色av| 日韩欧美精品免费久久| 黄色配什么色好看| 免费大片18禁| 亚洲精品一二三| 久久久久久国产a免费观看| 国产一区有黄有色的免费视频 | 一级毛片久久久久久久久女| 天天躁日日操中文字幕| 国产探花极品一区二区| 久久人人爽人人爽人人片va| 精品亚洲乱码少妇综合久久| 国产精品国产三级专区第一集| 18禁裸乳无遮挡免费网站照片| 精品酒店卫生间| 视频中文字幕在线观看| 午夜免费男女啪啪视频观看| 亚洲熟妇中文字幕五十中出| 国产在线一区二区三区精| 3wmmmm亚洲av在线观看| 欧美3d第一页| 亚洲激情五月婷婷啪啪| 午夜精品在线福利| 最近中文字幕2019免费版| 丝袜美腿在线中文| 亚洲欧美日韩东京热| 深爱激情五月婷婷| 18+在线观看网站| 精品久久国产蜜桃| 精品久久久噜噜| 亚洲精品色激情综合| 又爽又黄a免费视频| 99久久精品热视频| 内地一区二区视频在线| 精品久久久久久久久亚洲| 又爽又黄无遮挡网站| 亚洲真实伦在线观看| 午夜爱爱视频在线播放| 永久网站在线| 日韩av在线大香蕉| 人妻制服诱惑在线中文字幕| 亚洲最大成人av| 一级毛片aaaaaa免费看小| 亚洲国产欧美在线一区| 中文在线观看免费www的网站| 久久久久精品久久久久真实原创| 欧美 日韩 精品 国产| 深夜a级毛片| 超碰97精品在线观看| 久久久亚洲精品成人影院| 乱系列少妇在线播放| xxx大片免费视频| 亚洲av中文字字幕乱码综合| 69人妻影院| 国产熟女欧美一区二区| 久久久久性生活片| 亚洲国产精品专区欧美| 国产午夜精品一二区理论片| 国产精品久久久久久av不卡| 国内少妇人妻偷人精品xxx网站| 嘟嘟电影网在线观看| av免费在线看不卡| 日韩在线高清观看一区二区三区| 精品久久久久久久末码| 亚洲精品乱码久久久久久按摩| 国产精品久久久久久久久免| 看非洲黑人一级黄片| 成人美女网站在线观看视频| 国产精品一区二区三区四区久久| 一级爰片在线观看| 亚洲国产欧美在线一区| 真实男女啪啪啪动态图| 亚洲怡红院男人天堂| 99久国产av精品| 亚洲精品成人久久久久久| 成年免费大片在线观看| 亚洲av国产av综合av卡| 亚洲欧美中文字幕日韩二区| 国产高潮美女av| 精品人妻熟女av久视频| 久久久亚洲精品成人影院| 最近的中文字幕免费完整| 日韩av在线免费看完整版不卡| 国产精品久久久久久精品电影小说 | 国产精品国产三级专区第一集| 最近2019中文字幕mv第一页| 亚洲av二区三区四区| 91久久精品国产一区二区三区| 亚洲精华国产精华液的使用体验| 青春草亚洲视频在线观看| 特级一级黄色大片| 两个人视频免费观看高清| 女人久久www免费人成看片| 国模一区二区三区四区视频| 1000部很黄的大片| 成人二区视频| 国产亚洲91精品色在线| 久久久久国产网址| 中文乱码字字幕精品一区二区三区 | 最近手机中文字幕大全| 国产精品国产三级专区第一集| 国产乱人偷精品视频| 日韩强制内射视频| av天堂中文字幕网| 建设人人有责人人尽责人人享有的 | 波多野结衣巨乳人妻| av卡一久久| 午夜日本视频在线| 国产在视频线在精品| 噜噜噜噜噜久久久久久91| 亚洲av二区三区四区| 非洲黑人性xxxx精品又粗又长| 菩萨蛮人人尽说江南好唐韦庄| 国产精品人妻久久久久久| 亚洲国产最新在线播放| 街头女战士在线观看网站| 99热这里只有是精品50| 国产高清有码在线观看视频| 我的老师免费观看完整版| 99久国产av精品| 麻豆国产97在线/欧美| 亚洲经典国产精华液单| 日韩一区二区三区影片| 日韩欧美三级三区| 久久精品国产亚洲av涩爱| 成年人午夜在线观看视频 | 亚洲一区高清亚洲精品| 国产亚洲91精品色在线| 少妇高潮的动态图| 欧美xxxx性猛交bbbb| 婷婷六月久久综合丁香| 午夜精品一区二区三区免费看| 夫妻午夜视频| 亚洲在久久综合| 亚洲av成人av| 午夜免费男女啪啪视频观看| 听说在线观看完整版免费高清| 国产成人freesex在线| 日日摸夜夜添夜夜爱| 欧美区成人在线视频| 成人av在线播放网站| 久久久午夜欧美精品| 干丝袜人妻中文字幕| 哪个播放器可以免费观看大片| 久久精品国产亚洲av天美| 高清日韩中文字幕在线| 成年女人在线观看亚洲视频 | 国产高清有码在线观看视频| 在线a可以看的网站| 日本欧美国产在线视频| 久久久亚洲精品成人影院| 欧美丝袜亚洲另类| 亚洲精品日韩av片在线观看| 欧美成人午夜免费资源| 中文精品一卡2卡3卡4更新| 免费av观看视频| 69人妻影院| 国产av码专区亚洲av| 亚洲欧美一区二区三区国产| 国产真实伦视频高清在线观看| 丝瓜视频免费看黄片| 欧美精品国产亚洲| 亚洲国产日韩欧美精品在线观看| 91久久精品国产一区二区成人| 亚洲国产高清在线一区二区三| 少妇人妻精品综合一区二区| 美女主播在线视频| 日韩视频在线欧美| 一区二区三区免费毛片| 精品人妻视频免费看| 80岁老熟妇乱子伦牲交| 久久久久九九精品影院| 看非洲黑人一级黄片| 在线播放无遮挡| 日韩亚洲欧美综合| 菩萨蛮人人尽说江南好唐韦庄| 熟妇人妻久久中文字幕3abv| 亚洲欧美一区二区三区国产| 国产精品国产三级国产av玫瑰| 国产成人精品福利久久| 99热这里只有是精品在线观看| 一边亲一边摸免费视频| 精品国产露脸久久av麻豆 | 久久99精品国语久久久| 联通29元200g的流量卡|