• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    一種基于重疊社區(qū)標(biāo)簽傳播的學(xué)科劃分方法

    2021-03-22 02:52:58遆慧穎
    關(guān)鍵詞:詞條社團(tuán)標(biāo)簽

    遆慧穎,耿 騫,靳 健

    (北京師范大學(xué)政府管理學(xué)院,北京 100875)

    1 引言

    隨著網(wǎng)絡(luò)技術(shù)迅猛發(fā)展,網(wǎng)絡(luò)信息內(nèi)容主要呈現(xiàn)出信息總量大、增速快和來(lái)源多樣化等特征。同時(shí),作為一種典型的非結(jié)構(gòu)性化數(shù)據(jù),海量的文本信息也不斷涌現(xiàn)。普通用戶以及廣大學(xué)習(xí)者和研究人員可以通過(guò)Wikipedia、百度百科、必應(yīng)百科為代表的網(wǎng)絡(luò)全書類網(wǎng)站獲取各學(xué)科概念定義以及使用發(fā)展等信息。但是各學(xué)科在理論與實(shí)用領(lǐng)域不斷發(fā)展,并且不少研究都呈現(xiàn)了蓬勃的交叉融合、系統(tǒng)發(fā)展的趨勢(shì)。這使得不具備專業(yè)知識(shí)的普通用戶很難通過(guò)該類百科全書在短時(shí)間內(nèi)獲取目標(biāo)概念所屬學(xué)科的整體信息。因此,利用算法有效地、自動(dòng)地實(shí)現(xiàn)學(xué)科領(lǐng)域劃分將大大提高用戶獲取信息的效率。

    同時(shí),不同學(xué)科各具特點(diǎn),且有的學(xué)科知識(shí)存在著一定的交叉融合。例如,藝術(shù)領(lǐng)域?qū)I(yè)性較強(qiáng)。但在數(shù)學(xué)領(lǐng)域,除核心的概念定理之外,不少概念還廣泛應(yīng)用于各個(gè)學(xué)科。而情報(bào)學(xué)中有的概念是由計(jì)算機(jī)科學(xué)和數(shù)學(xué)等學(xué)科交叉產(chǎn)生。正如有學(xué)者研究指出[1],交叉學(xué)科在各個(gè)學(xué)科的知識(shí)、技術(shù)以及視野方面均有所交叉融合,而學(xué)科這一概念已經(jīng)不能通過(guò)簡(jiǎn)單的“三獨(dú)立說(shuō)”實(shí)現(xiàn),即獨(dú)立的概念系統(tǒng)、獨(dú)立的研究方法和獨(dú)立的研究對(duì)象。傳統(tǒng)的簡(jiǎn)單的規(guī)則已很難從包含海量知識(shí)的網(wǎng)絡(luò)百科全書中獲取當(dāng)前的學(xué)科領(lǐng)域相關(guān)知識(shí)。而這一問(wèn)題對(duì)不斷發(fā)展的新興學(xué)科更為嚴(yán)重。

    目前,學(xué)科領(lǐng)域的文本劃分多利用基于規(guī)則或統(tǒng)計(jì)的方式,在特定領(lǐng)域進(jìn)行實(shí)現(xiàn)[2],缺乏系統(tǒng)性視角以及對(duì)語(yǔ)義之間的相互作用的整體性考慮。注意到學(xué)科概念與概念描述文本主題存在一定的相關(guān)度,而這種相關(guān)程度不能僅由文本相似度的絕對(duì)值大小來(lái)決定,還與概念間的聯(lián)系程度、重要概念間關(guān)聯(lián)程度等很多關(guān)聯(lián)因素有關(guān)。這些因素都影響著一個(gè)概念是否可以被劃入一個(gè)學(xué)科領(lǐng)域中。并且,實(shí)際中,一個(gè)詞條可能屬于多個(gè)領(lǐng)域。該現(xiàn)象與復(fù)雜網(wǎng)絡(luò)中的重疊社團(tuán)相對(duì)應(yīng)。

    因此,本研究嘗試從復(fù)雜網(wǎng)絡(luò)的視角探索領(lǐng)域詞條劃分問(wèn)題。具體來(lái)說(shuō),本研究將通過(guò)分析詞條間由相似度產(chǎn)生的語(yǔ)義相互作用,獲取學(xué)科領(lǐng)域邊界。首先,本研究將利用隱含狄利克雷分布(Latent Dirichlet Allocation,簡(jiǎn)稱LDA)主題模型構(gòu)建語(yǔ)義相似度網(wǎng)絡(luò)。然后,針對(duì)語(yǔ)義相似度網(wǎng)絡(luò)的特征,對(duì)復(fù)雜網(wǎng)絡(luò)中的標(biāo)簽傳播算法進(jìn)行改進(jìn)。最后,利用所提出的改進(jìn)算法,實(shí)現(xiàn)學(xué)科邊界的劃分。

    本研究提出的方法具有理論和實(shí)際意義。在理論領(lǐng)域方面,本研究提出了改進(jìn)標(biāo)簽傳播算法,為將復(fù)雜網(wǎng)絡(luò)算法引入文本劃分領(lǐng)域做出了探索。在實(shí)際應(yīng)用方面,學(xué)科領(lǐng)域邊界的劃分可以提高用戶查詢效率,為建立相應(yīng)學(xué)科本體構(gòu)建基礎(chǔ)語(yǔ)料庫(kù),幫助初學(xué)者更好地組織網(wǎng)絡(luò)百科全書中的大量信息和了解學(xué)科領(lǐng)域包含的內(nèi)容。

    2 文獻(xiàn)綜述

    2.1 多標(biāo)簽文本劃分

    按照每個(gè)文本單元具有的標(biāo)簽數(shù),從分類結(jié)果角度,文本分類可以分為單標(biāo)簽劃分和多標(biāo)簽劃分。多標(biāo)簽文本劃分算法在推薦系統(tǒng)、本體構(gòu)建以及評(píng)論挖掘等方面都有廣泛應(yīng)用。

    LILLEBERG 等提出了基于詞向量和支持向量機(jī)的文本標(biāo)簽劃分[3]。PAVLINEK 提出了利用LDA 主題模型和半監(jiān)督學(xué)習(xí)方法展開(kāi)多標(biāo)簽文本劃分[4]。鄧三鴻利用多個(gè)二元分類器以深度學(xué)習(xí)的方法實(shí)現(xiàn)了中文圖書的多標(biāo)簽分類[5]。劉晉宏提出了利用圖結(jié)構(gòu)上的隨機(jī)游走算法確定標(biāo)簽分布概率,從而實(shí)現(xiàn)多標(biāo)簽分類的算法[6]。劉心惠等綜合神經(jīng)網(wǎng)絡(luò)、主題模型等提出了基于聯(lián)合模型的多標(biāo)簽文本分類方法[7]。

    上述方法在精確率和召回率方法取得了較好的結(jié)果。但是這些算法大都將文本視為獨(dú)立個(gè)體或者均以整體進(jìn)行詞頻和概率展開(kāi)分析,沒(méi)有充分利用詞條相似性的結(jié)構(gòu)性信息。本研究的展開(kāi)是建立在詞條網(wǎng)絡(luò)上的,通過(guò)探索詞條間由相似度構(gòu)建的語(yǔ)義相互作用,獲取更大范圍和具有實(shí)踐意義的學(xué)科領(lǐng)域邊界。

    本研究以復(fù)雜網(wǎng)絡(luò)的視角,立足詞條的具體語(yǔ)義,對(duì)大量的詞條及其它們之間的相互關(guān)系進(jìn)行網(wǎng)絡(luò)化的建模和結(jié)構(gòu)分析。復(fù)雜網(wǎng)絡(luò)作為系統(tǒng)科學(xué)研究的重要內(nèi)容,已經(jīng)廣泛應(yīng)用于電力系統(tǒng)[8]、社交網(wǎng)絡(luò)[9]、城市交通[10]、經(jīng)濟(jì)預(yù)測(cè)[11]、網(wǎng)絡(luò)劃分[12]等重要領(lǐng)域。近年來(lái),學(xué)者嘗試將復(fù)雜網(wǎng)絡(luò)相關(guān)概念和算法引入文本劃分領(lǐng)域。趙輝等提出利用復(fù)雜網(wǎng)絡(luò)理論中的節(jié)點(diǎn)加權(quán)度、加權(quán)聚集系數(shù)、節(jié)點(diǎn)介數(shù)等指標(biāo)進(jìn)行文本特征選擇的分類算法[13]。尹麗英以最大公共子圖文本語(yǔ)義相似度計(jì)算方法為基礎(chǔ)來(lái)提取特征文本,從而構(gòu)建訓(xùn)練文本集的語(yǔ)義復(fù)雜網(wǎng)絡(luò),并利用K 最近鄰算法進(jìn)行社團(tuán)劃分[14]。這些研究發(fā)現(xiàn)文本和實(shí)物同樣具有網(wǎng)絡(luò)結(jié)構(gòu),而其網(wǎng)絡(luò)結(jié)構(gòu)表現(xiàn)了文本之間的連接緊密的局部關(guān)系。

    在這些研究中,盡管詞條網(wǎng)絡(luò)和文本網(wǎng)絡(luò)逐漸進(jìn)入研究視野,但是其語(yǔ)義分類尚未與復(fù)雜網(wǎng)絡(luò)聯(lián)系起來(lái)。而注意到學(xué)科領(lǐng)域內(nèi)詞條連接通常較明顯地強(qiáng)于領(lǐng)域外的連接。因此,本研究將文本間的關(guān)聯(lián)引申到學(xué)科領(lǐng)域,以實(shí)現(xiàn)學(xué)科詞條劃分。

    2.2 詞條語(yǔ)義相似度

    在自然語(yǔ)言處理領(lǐng)域,研究人員圍繞文本相似度的定義進(jìn)行了多方面的研究。一方面,基于詞頻的文本相似度往往常利用“詞頻-逆文檔頻率”的方法將文本轉(zhuǎn)化為詞頻加權(quán)向量,之后利用余弦相似度及類似方法計(jì)算相似度。在此基礎(chǔ)上,許多經(jīng)典研究希望可以挖掘詞語(yǔ)本身的相互關(guān)系。為此,經(jīng)典的研究利用字典來(lái)計(jì)算詞語(yǔ)間的相似性。另一方面,從文本的生成結(jié)構(gòu)的角度出發(fā),研究人員構(gòu)建了生成概率模型。其中,潛在語(yǔ)義(Latent Semantic Analysis,簡(jiǎn)稱LSA)分析構(gòu)建了“單詞-文檔”矩陣[15],概率潛在語(yǔ)義分析(Probabilistic Latent Semantic Analysis,簡(jiǎn)稱PLSA)在LSA 的基礎(chǔ)上構(gòu)建了“話題-文檔-單詞”三級(jí)概率模型[16]。為了解決上述兩種方法的參數(shù)隨文本增加問(wèn)題,BLEI 等引入了參數(shù)的先驗(yàn)分布模型,提出了LDA 主題模型,解決潛在導(dǎo)致的過(guò)擬合問(wèn)題[17]。LDA 是一種經(jīng)典的概率模型。在該模型中,文本被看作概率生成過(guò)程的結(jié)果。生成過(guò)程定義了觀測(cè)隨機(jī)變量和隱藏隨機(jī)變量的聯(lián)合概率分布。通過(guò)使用聯(lián)合分布,計(jì)算在給定觀測(cè)變量下隱藏變量的條件分布,并展開(kāi)數(shù)據(jù)分析。在LDA 中,觀測(cè)變量是文檔中的詞,而隱藏變量就是主題結(jié)構(gòu)。LDA 主題模型將從文檔中推測(cè)隱藏的主題結(jié)構(gòu)的問(wèn)題轉(zhuǎn)化為計(jì)算在給定文檔下隱藏變量的后驗(yàn)分布問(wèn)題。

    本研究將利用LDA 主題模型獲取詞條相似度,為后續(xù)的處理構(gòu)建詞條相似度網(wǎng)絡(luò)。

    2.3 社團(tuán)劃分算法

    復(fù)雜網(wǎng)絡(luò)中的社團(tuán)劃分算法從研究思路上可以分為基于圖論的算法,如隨機(jī)游走算法[18]等,基于層次聚類和連邊性質(zhì)的算法,如Newman 快速算法等[19],基于網(wǎng)絡(luò)性質(zhì)或網(wǎng)絡(luò)動(dòng)力學(xué)的算法[20]等。

    以標(biāo)簽傳播類算法為代表的系列算法計(jì)算速度較快,可以適用于大規(guī)模語(yǔ)料庫(kù)。KOTHARI 等第一次提出標(biāo)簽傳播的算法思想[21]。RAGHAVAN 等提出了接近于線性的快速標(biāo)簽傳播社團(tuán)劃分算法[22]。在此基礎(chǔ)上,GREGORY 首次將標(biāo)簽傳播算法由非重疊社團(tuán)劃分拓展到重疊社團(tuán)劃分的領(lǐng)域,提出了Community Overlap PRopagation Algorithm(COPRA)算法,允許一個(gè)節(jié)點(diǎn)屬于多個(gè)社團(tuán)[23]。根據(jù)COPRA 算法,文獻(xiàn)[22]中提出的快速標(biāo)簽傳播社團(tuán)劃分算法可以看作將每個(gè)節(jié)點(diǎn)所屬的最大社團(tuán)數(shù)為1 的特殊情況。此外,還有學(xué)者對(duì)COPRA 算法做出改進(jìn)。例如,饒仁杰等利用LeaderRank 算法減少了COPRA 算法隨機(jī)性,加強(qiáng)了算法的魯棒性[24],而杜長(zhǎng)江等則利用“K-核分解算法”決定了標(biāo)簽傳播的順序[25]。

    除了適用于大規(guī)模網(wǎng)絡(luò)外之外,標(biāo)簽傳播算法中的“以周圍節(jié)點(diǎn)定義自身”的運(yùn)行邏輯與本研究預(yù)構(gòu)建的語(yǔ)義相似度網(wǎng)絡(luò)基本思想相符:在學(xué)科領(lǐng)域的語(yǔ)義相似度網(wǎng)絡(luò)中,概念與概念之間具有互相定義和解釋能力。另外,與實(shí)物網(wǎng)絡(luò)相比,語(yǔ)義相似度網(wǎng)絡(luò)的節(jié)點(diǎn)數(shù)目更多,連邊密度更大,各個(gè)節(jié)點(diǎn)的權(quán)重相近。因此,在節(jié)點(diǎn)選擇時(shí),COPRA 算法及不少基于COPRA 的改進(jìn)算法將面臨多個(gè)權(quán)責(zé)差別較小的節(jié)點(diǎn)。該情況使得節(jié)點(diǎn)的選擇具有較大隨機(jī)性,這將影響算法整體性能。為降低節(jié)點(diǎn)選擇的隨機(jī)性,本研究將進(jìn)一步對(duì)COPRA 算法做出改進(jìn),以適用于文本領(lǐng)域的概念劃分。

    3 研究思路

    3.1 研究目的

    本文的研究問(wèn)題是在獲取目標(biāo)學(xué)科或者領(lǐng)域中的詞條的基礎(chǔ)上,提出智能算法,高效地實(shí)現(xiàn)學(xué)科領(lǐng)域地劃分,從而幫助查詢者提高信息獲取效率。本文的研究目標(biāo)是分析相互關(guān)聯(lián)的概念所屬的目標(biāo)領(lǐng)域,從而劃定目標(biāo)學(xué)科的領(lǐng)域邊界,以幫助確定與學(xué)科領(lǐng)域相關(guān)的概念。

    為此,在指定領(lǐng)域內(nèi)的給定詞條情況下,本研究將以Wikipedia 為例對(duì)網(wǎng)絡(luò)知識(shí)庫(kù)中的概念展開(kāi)分析,明確與指定詞條相關(guān)的領(lǐng)域內(nèi)容。

    3.2 研究框架

    本研究的整體思路分為詞條的語(yǔ)義網(wǎng)絡(luò)構(gòu)建及基于改進(jìn)COPRA 算法的詞條社團(tuán)劃分兩個(gè)部分。研究框架如圖1 所示。原始數(shù)據(jù)來(lái)自于Wikipedia 的詞條及其百科說(shuō)明文本。在數(shù)據(jù)預(yù)處理步驟中,本研究主要對(duì)未知分類的詞條文本和目標(biāo)領(lǐng)域中人工篩選的已知文本做出小寫化、刪去標(biāo)點(diǎn)符號(hào)及停用詞、刪去無(wú)關(guān)鏈接等預(yù)處理,以得到初始文本。

    在構(gòu)建詞條網(wǎng)絡(luò)步驟中,研究將以每一個(gè)詞條及其百科說(shuō)明文本作為研究個(gè)體,并使用LDA 主題模型訓(xùn)練初始文本中的詞條,以得到每個(gè)詞條的代表向量。在此基礎(chǔ)上,以余弦相似度的大小衡量節(jié)點(diǎn)間的連邊重要性,并去掉閾值以下的部分,得到初始網(wǎng)絡(luò)。

    在劃分領(lǐng)域步驟中,本研究提出了改進(jìn)標(biāo)簽傳播算法。該算法將與給定領(lǐng)域的詞條屬于同一領(lǐng)域的詞條作為目標(biāo)領(lǐng)域的劃分結(jié)果,實(shí)現(xiàn)文本網(wǎng)絡(luò)的劃分。

    3.3 詞條網(wǎng)絡(luò)的建立

    為了有效地描述概念和概念之間的關(guān)系,本部分將Wikipedia 的詞條以及詞條之間的相似度映射到了詞條網(wǎng)絡(luò)上。本研究將建立以詞條作為網(wǎng)絡(luò)節(jié)點(diǎn),以詞條相似度作為網(wǎng)絡(luò)連邊權(quán)重的詞條文本網(wǎng)絡(luò)。在該網(wǎng)絡(luò)中,節(jié)點(diǎn)用來(lái)描述概念本身的獨(dú)立性,連邊表現(xiàn)概念與概念之間的相互作用。

    圖1 研究框架圖Fig.1 Research framework

    在計(jì)算詞條相似度階段,本部分分別嘗試了Doc2vec 以及LDA 主題生成模型。經(jīng)過(guò)多組試驗(yàn)分析,由于Wikipedia 的詞條書寫較為自由,而Doc2vec 對(duì)于語(yǔ)言表達(dá)用詞的依賴性相對(duì)較強(qiáng)。這使得利用Doc2Vec 計(jì)算得出的詞條相似度與學(xué)科概念本身相似度差異較大。所以,本部分選擇使用LDA 主題生成模型對(duì)文本進(jìn)行向量化。利用LDA 主題模型,本研究可以得到指定主題數(shù)條件下的文本分布向量。

    根據(jù)LDA 主題模型的結(jié)果,以詞條作為網(wǎng)絡(luò)節(jié)點(diǎn),以詞條之間的余弦相似度作為連邊的權(quán)重,即可得到所有詞條的全連接網(wǎng)絡(luò)。然后,刪去相似度小于所設(shè)定的閾值的連邊即可得到文本的語(yǔ)義網(wǎng)絡(luò)。

    3.4 COPRA 算法及其改進(jìn)

    3.4.1 COPRA 算法

    重疊社團(tuán)標(biāo)簽傳播算法(Community Overlap PRopagation Algorithm,COPRA 算 法)是2002 年KOTHARI 提出的[21]。該算法將經(jīng)典標(biāo)簽傳播算法由非重疊社團(tuán)劃分拓展到重疊社團(tuán)劃分的社團(tuán)劃分算法。算法具體說(shuō)明如下:

    與經(jīng)典的標(biāo)簽傳播算法一樣,COPRA 的核心思想是一個(gè)節(jié)點(diǎn)由其周圍相連的節(jié)點(diǎn)定義。假設(shè)第i個(gè)節(jié)點(diǎn)的標(biāo)簽是b。每個(gè)節(jié)點(diǎn)都由節(jié)點(diǎn)標(biāo)號(hào)x 和標(biāo)簽b 表示,即{xi:b}。在COPRA 算法中,每個(gè)節(jié)點(diǎn)可以由多個(gè)標(biāo)簽表示,而各個(gè)標(biāo)簽在對(duì)該節(jié)點(diǎn)的表示中的不同貢獻(xiàn)用不同的權(quán)重表示{xi0:bi0,xi1:b11,…}。并且,權(quán)重需要做歸一化計(jì)算。例如,一個(gè)節(jié)點(diǎn)a 可以由1/2 的e,1/3 的c 和1/6 的d 表示,那么a 在算法中表示為{a:1/2,e:1/3,d:1/6}。另外,COPRA 算法設(shè)定了每個(gè)節(jié)點(diǎn)可以屬于的最多社團(tuán)數(shù)v。在傳播結(jié)果中,刪去隸屬度小于1/v 的標(biāo)簽,以控制節(jié)點(diǎn)的所屬社團(tuán)小于等于v。

    在算法的初始階段,每個(gè)節(jié)點(diǎn)的標(biāo)簽是自己本身。標(biāo)簽傳播開(kāi)始后,每一步每個(gè)節(jié)點(diǎn)的標(biāo)簽由與之相連的節(jié)點(diǎn)的標(biāo)簽決定。相同標(biāo)簽則累加其權(quán)重。之后,通過(guò)刪去標(biāo)準(zhǔn)化后權(quán)重小于1/v 的標(biāo)簽,控制每個(gè)節(jié)點(diǎn)所屬的社團(tuán)數(shù)。迭代到節(jié)點(diǎn)標(biāo)簽不變或社團(tuán)總數(shù)不變時(shí),算法停止。此時(shí),網(wǎng)絡(luò)中含有同一標(biāo)簽的節(jié)點(diǎn)屬于同一個(gè)社團(tuán)。圖2 描述了利用COPRA 算法實(shí)現(xiàn)4個(gè)節(jié)點(diǎn)且社團(tuán)數(shù)為2 的標(biāo)簽更新流程。

    圖2 標(biāo)簽傳播算法說(shuō)明(最多社團(tuán)數(shù)v=2)Fig.2 A diagram of label propagation algorithm(Maximum number of communities v=2)

    3.4.2 COPRA 算法的改進(jìn)

    通過(guò)對(duì)經(jīng)典標(biāo)簽傳播算法的分析和實(shí)驗(yàn),本研究發(fā)現(xiàn)在語(yǔ)義相似網(wǎng)絡(luò)中,因?yàn)楦拍钤~條兩兩之間計(jì)算了相似度,而相似度本身的取值在[0,1]之間,所以網(wǎng)絡(luò)的連邊密集并且各個(gè)連邊的權(quán)重都差距較小。這種特殊性使經(jīng)典的標(biāo)簽傳播算法在根據(jù)周圍節(jié)點(diǎn)確定節(jié)點(diǎn)標(biāo)簽時(shí)存在很嚴(yán)重的“過(guò)度篩選,隨機(jī)選擇”的問(wèn)題:因?yàn)楸姸噜従庸?jié)點(diǎn)的標(biāo)簽在定義節(jié)點(diǎn)自身時(shí)很難具有大于1/v 的權(quán)重,且權(quán)重常常相似。這使得常常會(huì)出現(xiàn)過(guò)度篩選掉了所有鄰居標(biāo)簽,從而使得可能在鄰居節(jié)點(diǎn)中任取一個(gè)社區(qū)標(biāo)簽的作為該節(jié)點(diǎn)的標(biāo)簽。這種情況會(huì)導(dǎo)致節(jié)點(diǎn)所屬社團(tuán)脫離實(shí)際,節(jié)點(diǎn)只屬于某一個(gè)社團(tuán)且算法過(guò)早收斂,無(wú)法達(dá)到學(xué)科領(lǐng)域劃分的預(yù)期效果。例如,在圖3 中,A、B、C 的標(biāo)簽均因?yàn)樾∮?/2,可能導(dǎo)致標(biāo)簽選擇的隨機(jī)性很高。

    圖3 原標(biāo)簽傳播算法的過(guò)度收斂問(wèn)題(最多社團(tuán)數(shù)v=2)Fig.3 Overconvergence of the original label propagation algorithm(Maximum number of communities v=2)

    為了提高算法的準(zhǔn)確度,本研究對(duì)于算法進(jìn)行了改進(jìn)。對(duì)于節(jié)點(diǎn)的所有標(biāo)簽隸屬度小于1/v,但是其含有多個(gè)隸屬度相同的標(biāo)簽時(shí),本研究提出了“one more chance”的思路:給予在所有標(biāo)簽中權(quán)重最大的標(biāo)簽更多一次的機(jī)會(huì),讓它們多一次不被過(guò)度篩選的機(jī)會(huì)。具體的說(shuō),在標(biāo)簽篩選階段,如果存在某些節(jié)點(diǎn)權(quán)重大于其他標(biāo)簽,但該節(jié)點(diǎn)權(quán)重小于1/v,那么刪去其他節(jié)點(diǎn)。對(duì)于這些節(jié)點(diǎn)的標(biāo)簽進(jìn)行重新的整合和歸一化,再次根據(jù)1/v 的原則進(jìn)行篩選。該改動(dòng)減少了算法的隨機(jī)性,加強(qiáng)了算法的穩(wěn)定性,以充分挖掘網(wǎng)絡(luò)信息。COPRA 算法和改進(jìn)COPRA 算法的對(duì)比如表1 所示。

    在改進(jìn)算法中,節(jié)點(diǎn)更新示例如圖4 所示。按照規(guī)則更新后,若某一標(biāo)簽權(quán)重大于閾值,則選擇保留該標(biāo)簽,以減少由于過(guò)度篩選引入的潛在的誤差。

    圖4 改進(jìn)算法說(shuō)明(最多社團(tuán)數(shù)v=2)Fig.4 The improved algorithm(Maximum number of communities v=2)

    4 實(shí) 驗(yàn)

    4.1 數(shù)據(jù)及預(yù)處理

    本實(shí)驗(yàn)以計(jì)算機(jī)、文學(xué)、數(shù)學(xué)、體育、情報(bào)學(xué)和音樂(lè)等6個(gè)領(lǐng)域?yàn)槔?,?duì)所提出的算法做出驗(yàn)證分析。這些領(lǐng)域是較為常見(jiàn)的且具有一定關(guān)注度,而對(duì)這些領(lǐng)域詞條的自動(dòng)歸檔將幫助初學(xué)者快速了解本學(xué)科的關(guān)注點(diǎn)。具體來(lái)說(shuō),首先,對(duì)于一個(gè)領(lǐng)域,本研究首先人工選擇五個(gè)核心詞條作為種子。然后,在種子詞條的維基百科頁(yè)面中,本研究提取了“See Also”部分中展示出的相關(guān)詞條,將這些詞條作為與核心詞條相連接的詞條。在此基礎(chǔ)上,本研究根據(jù)這種方法逐層擴(kuò)展,以得到更多詞條。接著,對(duì)于一個(gè)領(lǐng)域,本研究從獲取的這些詞條中人工選取50個(gè)詞條,以構(gòu)建基礎(chǔ)數(shù)據(jù)集。例如,在計(jì)算機(jī)領(lǐng)域,本研究選取了“Computer science”“Database”“Algorithms”“Distributed computing”“Machine Learning”等6個(gè)詞條作為核心詞條,并以此擴(kuò)展為50個(gè)領(lǐng)域概念詞條。為此,本研究獲取了來(lái)自6個(gè)不同的領(lǐng)域的共計(jì)300個(gè)Wikipedia 的英文詞條文本作為實(shí)驗(yàn)的基礎(chǔ)數(shù)據(jù)。為了提高處理效率,減少冗余數(shù)據(jù)的影響,實(shí)驗(yàn)對(duì)這些詞條做出如圖1 所示的數(shù)據(jù)預(yù)處理步驟中去除標(biāo)點(diǎn)、停用詞等操作。

    表1 改進(jìn)標(biāo)簽傳播算法與原算法的對(duì)比Table 1 Comparison of the improved label propagation algorithm and the original one

    4.2 評(píng)價(jià)標(biāo)準(zhǔn)

    由于學(xué)科之間存在交叉,而Wikipedia 中沒(méi)有說(shuō)明。所以,除300個(gè)詞條的已知分類,實(shí)驗(yàn)對(duì)于詞條的交叉分類進(jìn)行了人工標(biāo)注,并將這些人工分類得到結(jié)果作為基礎(chǔ)評(píng)價(jià)網(wǎng)絡(luò)。具體評(píng)價(jià)指標(biāo)如下。

    (1)調(diào)整后的模塊度。為了衡量重疊社團(tuán)的緊密程度,本研究采用如公式(1)所示的拓展的集聚系數(shù)。

    其中,ki,kj指的是節(jié)點(diǎn)i,j的度,m是邊的總數(shù),Aij是鄰接矩陣,βic是i 對(duì)于社團(tuán)c 的隸屬度,kic指的是節(jié)點(diǎn)在社團(tuán)c 內(nèi)的連接總權(quán)重。

    (2)精確率。假設(shè)C1是實(shí)際社團(tuán),C2是估計(jì)社團(tuán)。精確率描述估計(jì)的劃分結(jié)果中屬于實(shí)際社團(tuán)的比例。計(jì)算如公式(2)所示。

    (3)召回率。假設(shè)C1是實(shí)際社團(tuán),C2是估計(jì)社團(tuán)。召回率描述估計(jì)的劃分結(jié)果中屬于實(shí)際社團(tuán)節(jié)點(diǎn)數(shù)占實(shí)際社團(tuán)節(jié)點(diǎn)數(shù)的比例。計(jì)算如公式(3)所示。

    (4)F1-score。查全率和查準(zhǔn)率不能綜合說(shuō)明算法的有效性。實(shí)驗(yàn)將采用在節(jié)點(diǎn)層次的F1-score 對(duì)結(jié)果進(jìn)行評(píng)估。F1-score 是介于0~1 之間的用于衡量節(jié)點(diǎn)水平準(zhǔn)確度的一種指標(biāo)。假設(shè)C1是實(shí)際社團(tuán),C2是估計(jì)社團(tuán)。F1(C1,C2)衡量重疊集合C1,C2的查全率和精確率的調(diào)和平均值。計(jì)算方法如公式(4)所示。

    4.3 構(gòu)建文本網(wǎng)絡(luò)

    首先,實(shí)驗(yàn)對(duì)文本進(jìn)行LDA 主題模型訓(xùn)練,獲取每個(gè)詞條的向量化表達(dá)。其次,通過(guò)詞條文本之間的余弦度計(jì)算,實(shí)驗(yàn)得到了初始的全連接文本網(wǎng)絡(luò)。本實(shí)驗(yàn)假設(shè)余弦相似度在0.05 以下的詞條主題語(yǔ)義相似度可忽略。因此,在實(shí)驗(yàn)數(shù)據(jù)集構(gòu)建的網(wǎng)絡(luò)中,刪去對(duì)應(yīng)連邊,最終得到基礎(chǔ)實(shí)驗(yàn)初始網(wǎng)絡(luò):含有300個(gè)詞條節(jié)點(diǎn),9 900 條連邊的加權(quán)網(wǎng)絡(luò)。初始網(wǎng)絡(luò)中文本的主題相似度分布圖5 所示。

    圖5 實(shí)驗(yàn)數(shù)據(jù)分布說(shuō)明Fig.5 Distribution of experimental data

    為了驗(yàn)證取樣的代表性,本實(shí)驗(yàn)對(duì)Wikipedia 所有詞條進(jìn)行隨機(jī)抽樣,得到3個(gè)抽樣數(shù)據(jù)集。3個(gè)抽樣數(shù)據(jù)集的詞條量及主題相似度統(tǒng)計(jì)特征如表2 所示。從表2 可以看出,實(shí)驗(yàn)數(shù)據(jù)集與兩組基于抽樣數(shù)據(jù)集構(gòu)造的網(wǎng)絡(luò)的節(jié)點(diǎn)相似度分布差異不大。因此,本研究假設(shè)在實(shí)驗(yàn)數(shù)據(jù)集得到的測(cè)試結(jié)果可以很好反映出不同算法的性能。

    表2 實(shí)驗(yàn)數(shù)據(jù)詞條量及主題相似度統(tǒng)計(jì)特征Table 2 Entry numbers of experimental data and statistics of topic similarity features

    4.4 社團(tuán)劃分結(jié)果

    在實(shí)際應(yīng)用中,初始階段,實(shí)驗(yàn)需要給定一個(gè)主題,提供屬于該主題的一個(gè)或一定數(shù)量的種子詞條。在社團(tuán)劃分結(jié)果中,所有的詞條都被劃入了不同的社團(tuán)。本研究選取與初始階段提供的種子詞條屬于一個(gè)社團(tuán)的詞條的并集作為劃分結(jié)果。該詞條的集合被認(rèn)為屬于給定主題的學(xué)科領(lǐng)域。實(shí)驗(yàn)選用了每個(gè)學(xué)科領(lǐng)域名稱的詞條作為種子詞條。例如5 號(hào)計(jì)算機(jī)社團(tuán)選用Computer Science,則與該詞條在劃分結(jié)果中處于同一社團(tuán)的詞條均被劃入該主題,即使得這些詞條被劃入計(jì)算機(jī)領(lǐng)域。

    在模型參數(shù)設(shè)置時(shí),本次實(shí)驗(yàn)選定最大社團(tuán)數(shù)v為9。根據(jù)構(gòu)建的詞條網(wǎng)絡(luò),實(shí)驗(yàn)利用改進(jìn)COPRA 算法,并選取集聚系數(shù)Q 值最大時(shí)的詞條劃分結(jié)果。集聚系數(shù)的最大保證其結(jié)果是當(dāng)前算法下社團(tuán)內(nèi)部的連接是最緊密的。劃分結(jié)果如圖6 所示。其中,圖6 中橫坐標(biāo)為標(biāo)簽,縱坐標(biāo)為含有該標(biāo)簽的節(jié)點(diǎn)。橫坐標(biāo)相同的點(diǎn)被劃分為同一社團(tuán)。在實(shí)驗(yàn)中,橫坐標(biāo)標(biāo)簽0~49、50~99、100~149、150~199、200~249、250~299分別是已知核心分類為音樂(lè)、體育、數(shù)學(xué)、情報(bào)學(xué)、文學(xué)、計(jì)算機(jī)的詞條。例如,圖6 中紅色和藍(lán)色的色塊交接處為與體育相關(guān)的核心詞條。

    圖6 文本劃分結(jié)果Fig.6 Results of text classification

    4.5 結(jié)果評(píng)價(jià)及說(shuō)明

    4.5.1 基礎(chǔ)結(jié)果說(shuō)明

    表3 和表4 分別列出了改進(jìn)的COPRA 算法和COPRA 算法在情報(bào)學(xué)領(lǐng)域及數(shù)學(xué)領(lǐng)域所獲取有關(guān)詞條劃分的部分結(jié)果。從結(jié)果可以看出,相比COPRA 算法,改進(jìn)COPRA 算法可以獲得更好的結(jié)果。

    表3 改進(jìn)COPRA 算法及COPRA 算法在情報(bào)學(xué)領(lǐng)域獲取的部分詞條對(duì)比Table 3 Comparison of some entries obtained by the improved COPRA algorithm and the original one in theInformation Science field

    圖7、圖8 和圖9 呈現(xiàn)了改進(jìn)COPRA 算法和COPRA 算法在6個(gè)不同領(lǐng)域上有關(guān)詞條社團(tuán)劃分的精確度、召回率和F1 值比較分析。如圖7 至圖9 所示,對(duì)于音樂(lè)、體育、計(jì)算機(jī)領(lǐng)域的詞條的社團(tuán)劃分,相比于COPRA 算法,改進(jìn)后的算法在精確度、召回率和F1 值都得到明顯改善,對(duì)文學(xué)領(lǐng)域詞條的劃分結(jié)果沒(méi)有明顯改善,但對(duì)情報(bào)學(xué)和數(shù)學(xué)領(lǐng)域的劃分結(jié)果略有下降。

    改進(jìn)后的算法使得情報(bào)學(xué)和數(shù)學(xué)領(lǐng)域詞條的社團(tuán)劃分的精確率和F1 值偏低。其原因在于該算法的領(lǐng)域劃分結(jié)果比常用的領(lǐng)域定義相對(duì)較廣。例如,在數(shù)據(jù)集中,數(shù)學(xué)、計(jì)算機(jī)和情報(bào)學(xué)領(lǐng)域存在較大程度交叉。即部分計(jì)算機(jī)領(lǐng)域詞條被劃入情報(bào)學(xué)和數(shù)學(xué)領(lǐng)域,如Computer Science、Virtual Education、SQL、Data ControlLanguage 等被劃入情報(bào)學(xué)領(lǐng)域,而Atmospheric_Wave被劃入數(shù)學(xué)領(lǐng)域。而對(duì)于文學(xué)領(lǐng)域的詞條,改進(jìn)后的算法的劃分結(jié)果的F1 值沒(méi)有明顯的提高。這種情況表示,在所選數(shù)據(jù)集中,給予對(duì)應(yīng)領(lǐng)域的詞條增加“one more chance”的篩選過(guò)程并沒(méi)有對(duì)劃分結(jié)果有明顯的影響。即在詞條劃分中,某些領(lǐng)域標(biāo)簽已被賦予較大權(quán)重,則不需要在較小的權(quán)重的領(lǐng)域標(biāo)簽內(nèi)進(jìn)行二次選擇。此外,從6個(gè)領(lǐng)域的劃分結(jié)果中可以發(fā)現(xiàn),除文學(xué)和體育領(lǐng)域外,其他領(lǐng)域的劃分結(jié)果均達(dá)到了較高的水平。這可能與文學(xué)、體育領(lǐng)域概念相對(duì)較為分散,相似度相對(duì)較低有關(guān)。

    表4 改進(jìn)COPRA 算法及COPRA 算法在數(shù)學(xué)領(lǐng)域獲取的部分詞條對(duì)比Table 4 Comparison of some entries obtained by improved COPRA algorithm and original one in Mathematics

    圖7 改進(jìn)算法精確率的對(duì)比Fig.7 Comparison of precision of the improved algorithm

    圖8 改進(jìn)算法召回率度對(duì)比Fig.8 Comparison of recall of the improved algorithm

    圖9 改進(jìn)算法F1 的對(duì)比Fig.9 Comparison of F1 of the improved algorithm

    改進(jìn)后的算法對(duì)于領(lǐng)域劃分結(jié)果的集聚系數(shù)有明顯提高,如圖10 所示。從劃分結(jié)果來(lái)看,改進(jìn)算法解決了原算法過(guò)快收斂的問(wèn)題,可以得到合理的劃分結(jié)果,而不是大量的單節(jié)點(diǎn)社團(tuán),提升了分類器的性能。除了劃分結(jié)果與學(xué)科的特異性有關(guān)之外,整體劃分結(jié)果表現(xiàn)出學(xué)科領(lǐng)域的形態(tài)是基礎(chǔ)學(xué)科范圍擴(kuò)張以及交叉學(xué)科內(nèi)部聚合。例如,從劃分結(jié)果中可以看出,盡管部分情報(bào)學(xué)的詞條同時(shí)屬于計(jì)算機(jī)科學(xué)和數(shù)學(xué),但是依然存在大量概念是獨(dú)立屬于情報(bào)學(xué)的。此現(xiàn)象說(shuō)明,在原有學(xué)科概念拓展和交叉的基礎(chǔ)上,某些交叉學(xué)科具有一定的獨(dú)立性。而在其發(fā)展過(guò)程中,此類交叉學(xué)科也會(huì)演化出自身的概念,并不僅僅是簡(jiǎn)單的對(duì)來(lái)自不同領(lǐng)域?qū)W科概念的融合。

    圖10 改進(jìn)算法集聚系數(shù)的對(duì)比Fig.10 Comparison of clustering coefficient of the Improved algorithm

    4.5.2 參數(shù)敏感性分析

    本章節(jié)在下面實(shí)驗(yàn)探討最大社團(tuán)v 和初始種子詞條數(shù)等參數(shù)對(duì)結(jié)果的影響。

    (1)最大所屬社團(tuán)v。改進(jìn)的算法要預(yù)設(shè)每個(gè)節(jié)點(diǎn)所屬的最大社團(tuán)數(shù)v。利用6個(gè)領(lǐng)域的詞條數(shù)據(jù),實(shí)驗(yàn)分析了不同最大社團(tuán)數(shù)對(duì)劃分結(jié)果的影響。圖11 表示了6個(gè)領(lǐng)域中不同的v 值對(duì)精確度和F1 值的影響。從圖11 可以看出,隨著最大社團(tuán)數(shù)v 的增加,精確率和F1 沒(méi)有明顯的正相關(guān)關(guān)系。即是該參數(shù)的調(diào)整對(duì)結(jié)果沒(méi)有顯著影響。

    (2)初始種子詞條。本組實(shí)驗(yàn)將以情報(bào)學(xué)領(lǐng)域概念為例,分析初始種子詞條數(shù)對(duì)結(jié)果的影響。圖12 表示了不同初始種子詞條數(shù)對(duì)領(lǐng)域劃分的精確率、召回率、F1 的影響。

    從圖12 可以看出,初始詞條的數(shù)量對(duì)領(lǐng)域詞條的劃分結(jié)果產(chǎn)生顯著的影響。精確率和F1 值隨種子詞條數(shù)量的增加呈明顯的上升趨勢(shì),但是召回率沒(méi)有明顯的正向變化。本實(shí)驗(yàn)將學(xué)科的核心的、具有代表性的、內(nèi)容詳盡的詞條文本作為種子詞條、增加詞條數(shù)都可以提高算法的有效性。但增加詞條數(shù)量的同時(shí),新加入的詞條本身可能屬于不同的學(xué)科社團(tuán),降低了算法的召回率。

    5 總結(jié)與展望

    圖11 不同最大所屬社團(tuán)數(shù)v 對(duì)各領(lǐng)域劃分結(jié)果精確率和F1 的影響Fig.11 The influence of distinct maximum number of communities v on precision and F1 of divided results in different areas

    圖12 初始種子詞條數(shù)對(duì)結(jié)果精確率、召回率、F1 的影響Fig.12 The influence of original seed entries on the precision,recall and F1 of the results

    本研究從復(fù)雜網(wǎng)絡(luò)中社團(tuán)劃分的視角挖掘了詞條相似度的相互作用。本研究通過(guò)構(gòu)建主題文本網(wǎng)絡(luò)和改進(jìn)重疊社區(qū)標(biāo)簽傳播算法,實(shí)現(xiàn)了學(xué)科領(lǐng)域的邊界劃分。其重點(diǎn)在于以網(wǎng)絡(luò)的形式表現(xiàn)概念的內(nèi)容和概念之間的相互作用,以網(wǎng)絡(luò)的視角觀察概念之間的結(jié)構(gòu),并最終以網(wǎng)絡(luò)的方法劃分海量概念的學(xué)科結(jié)構(gòu)。本研究將復(fù)雜網(wǎng)絡(luò)中相關(guān)算法的整體性、系統(tǒng)性引入文本語(yǔ)義分析中。這為文本的語(yǔ)義的分析引入新的方法。另外,本研究挖掘了詞條網(wǎng)絡(luò)的社團(tuán)結(jié)構(gòu)以及復(fù)雜性,以高效快速地在海量信息中獲取與領(lǐng)域相關(guān)的概念,為構(gòu)建相關(guān)學(xué)科知識(shí)庫(kù)、自動(dòng)化構(gòu)建語(yǔ)料庫(kù)等工作提供了有效的方法和思路。

    在未來(lái)的工作中,相關(guān)研究可以將已有的基于各種特征的文本分析方法加入網(wǎng)絡(luò)分析的框架中。這會(huì)為文本分析領(lǐng)域注入新的視角,以提升學(xué)科領(lǐng)域的劃分性能。例如,本研究的工作重點(diǎn)在于利用網(wǎng)絡(luò)分析方法對(duì)相同層級(jí)的學(xué)科詞條做出劃分。然而,各個(gè)學(xué)科領(lǐng)域是具有多個(gè)層級(jí)的。在標(biāo)簽傳播等網(wǎng)絡(luò)分析方法的基礎(chǔ)上,如何結(jié)合文本分析方法并融入文本特征,實(shí)現(xiàn)詞條的多層級(jí)自動(dòng)分類、分析詞條間潛在的拓?fù)潢P(guān)系等將幫助對(duì)知識(shí)文本的高效歸檔。同時(shí),本研究對(duì)于算法的改進(jìn)說(shuō)明語(yǔ)義相似網(wǎng)絡(luò)是具有其特異性的,不能直接搬用復(fù)雜網(wǎng)絡(luò)的方法展開(kāi)分析。如何有效地、合理地改進(jìn)相關(guān)方法,使其適應(yīng)于語(yǔ)義網(wǎng)絡(luò)也是研究人員需要進(jìn)一步分析探討的。

    猜你喜歡
    詞條社團(tuán)標(biāo)簽
    繽紛社團(tuán)
    無(wú)懼標(biāo)簽 Alfa Romeo Giulia 200HP
    車迷(2018年11期)2018-08-30 03:20:32
    不害怕撕掉標(biāo)簽的人,都活出了真正的漂亮
    海峽姐妹(2018年3期)2018-05-09 08:21:02
    最棒的健美操社團(tuán)
    軍事文摘(2017年16期)2018-01-19 05:10:15
    K-BOT拼插社團(tuán)
    2016年4月中國(guó)直銷網(wǎng)絡(luò)熱門詞條榜
    2016年3月中國(guó)直銷網(wǎng)絡(luò)熱門詞條榜
    標(biāo)簽化傷害了誰(shuí)
    2016年9月中國(guó)直銷網(wǎng)絡(luò)熱門詞條榜
    基于多進(jìn)制查詢樹(shù)的多標(biāo)簽識(shí)別方法
    国产视频内射| 在线免费观看不下载黄p国产| 久久精品综合一区二区三区| 精品一区二区免费观看| 最近最新中文字幕免费大全7| 国产视频首页在线观看| 一区二区三区四区激情视频| 日韩av在线大香蕉| 观看美女的网站| 欧美激情在线99| 春色校园在线视频观看| 久久久久性生活片| 国产中年淑女户外野战色| 日韩 亚洲 欧美在线| 2021少妇久久久久久久久久久| 久久久色成人| 超碰97精品在线观看| 免费黄网站久久成人精品| 久久这里有精品视频免费| h日本视频在线播放| 日韩欧美 国产精品| 男女下面进入的视频免费午夜| 国产精品国产三级国产av玫瑰| 舔av片在线| av卡一久久| 水蜜桃什么品种好| 18禁动态无遮挡网站| 啦啦啦观看免费观看视频高清| 国产成人午夜福利电影在线观看| 国产免费男女视频| 亚洲在久久综合| 亚洲成人av在线免费| .国产精品久久| 看免费成人av毛片| 夜夜看夜夜爽夜夜摸| 亚洲电影在线观看av| 汤姆久久久久久久影院中文字幕 | 国产一区二区在线观看日韩| 国产精品久久久久久av不卡| 99久久成人亚洲精品观看| 免费无遮挡裸体视频| 日韩中字成人| 国模一区二区三区四区视频| 亚洲av成人精品一区久久| 欧美区成人在线视频| 日韩精品有码人妻一区| 亚洲高清免费不卡视频| 亚洲在线自拍视频| 国产女主播在线喷水免费视频网站 | 国产极品天堂在线| 国产亚洲午夜精品一区二区久久 | 校园人妻丝袜中文字幕| 又爽又黄无遮挡网站| 亚洲av中文字字幕乱码综合| 成人毛片a级毛片在线播放| 国产一区亚洲一区在线观看| 简卡轻食公司| 色5月婷婷丁香| 欧美日本亚洲视频在线播放| 欧美一区二区亚洲| 久久久国产成人精品二区| 中国美白少妇内射xxxbb| 亚洲真实伦在线观看| 舔av片在线| 建设人人有责人人尽责人人享有的 | av.在线天堂| 国产精品国产三级国产av玫瑰| 最近手机中文字幕大全| 青春草视频在线免费观看| 国产精品一区二区性色av| 亚洲18禁久久av| 午夜精品在线福利| 99热精品在线国产| 午夜福利高清视频| 久久婷婷人人爽人人干人人爱| 国产精品日韩av在线免费观看| a级毛片免费高清观看在线播放| 日本av手机在线免费观看| 亚洲av一区综合| 免费观看性生交大片5| 91久久精品国产一区二区成人| 麻豆成人午夜福利视频| 非洲黑人性xxxx精品又粗又长| 国产69精品久久久久777片| 99久久人妻综合| 大又大粗又爽又黄少妇毛片口| 欧美97在线视频| 国产激情偷乱视频一区二区| 久久久久久久久久成人| 亚洲成人av在线免费| 精品人妻偷拍中文字幕| 日韩精品有码人妻一区| 九九热线精品视视频播放| 午夜精品在线福利| 一卡2卡三卡四卡精品乱码亚洲| 亚洲丝袜综合中文字幕| 亚洲成人av在线免费| 亚洲精品久久久久久婷婷小说 | 亚洲av电影在线观看一区二区三区 | 国产精品国产三级国产专区5o | 国产大屁股一区二区在线视频| 国产精品麻豆人妻色哟哟久久 | 国产精品不卡视频一区二区| 一个人看的www免费观看视频| 中文亚洲av片在线观看爽| 欧美精品一区二区大全| 97人妻精品一区二区三区麻豆| 国产精品国产三级国产av玫瑰| 国产高清国产精品国产三级 | 色视频www国产| 中文字幕亚洲精品专区| 高清在线视频一区二区三区 | 久久久午夜欧美精品| 日本与韩国留学比较| 国产一区亚洲一区在线观看| 天天躁日日操中文字幕| 啦啦啦观看免费观看视频高清| 国产爱豆传媒在线观看| 成人午夜高清在线视频| 亚洲三级黄色毛片| 精品人妻视频免费看| 久久99热这里只频精品6学生 | 日韩精品青青久久久久久| 欧美性猛交╳xxx乱大交人| 亚洲精品456在线播放app| 国产黄片美女视频| 精品久久国产蜜桃| 91精品国产九色| 一个人看的www免费观看视频| 国产精品久久久久久精品电影| 两个人视频免费观看高清| 亚洲av成人精品一二三区| .国产精品久久| 热99在线观看视频| 国产亚洲午夜精品一区二区久久 | 别揉我奶头 嗯啊视频| 黄色配什么色好看| 亚洲真实伦在线观看| 少妇的逼好多水| 毛片女人毛片| 久久精品久久久久久久性| 中文在线观看免费www的网站| 精品少妇黑人巨大在线播放 | 1024手机看黄色片| 精品久久久久久久久久久久久| 久久久久国产网址| 国产亚洲5aaaaa淫片| 热99在线观看视频| 亚洲婷婷狠狠爱综合网| 国产久久久一区二区三区| 日日摸夜夜添夜夜添av毛片| 午夜日本视频在线| 亚洲av免费在线观看| 国产精品久久久久久av不卡| 日韩欧美国产在线观看| 久久久久久久久久久免费av| av免费观看日本| 91在线精品国自产拍蜜月| 少妇熟女欧美另类| 18禁动态无遮挡网站| 黄色日韩在线| av国产免费在线观看| 欧美性感艳星| 国产视频内射| 亚洲精华国产精华液的使用体验| 永久网站在线| 成年女人永久免费观看视频| 国产精品熟女久久久久浪| 欧美另类亚洲清纯唯美| 久久亚洲国产成人精品v| 久久久午夜欧美精品| 日韩成人av中文字幕在线观看| 久99久视频精品免费| 国产乱人偷精品视频| 两性午夜刺激爽爽歪歪视频在线观看| 国产三级在线视频| 丰满乱子伦码专区| 国产成人aa在线观看| 天堂av国产一区二区熟女人妻| 亚洲国产精品合色在线| 午夜福利网站1000一区二区三区| 天堂√8在线中文| 老司机影院成人| 中文字幕人妻熟人妻熟丝袜美| 欧美激情国产日韩精品一区| 日本与韩国留学比较| 亚洲国产欧洲综合997久久,| 自拍偷自拍亚洲精品老妇| 人体艺术视频欧美日本| 在线观看一区二区三区| 免费搜索国产男女视频| 国产在线一区二区三区精 | 永久网站在线| 亚洲18禁久久av| 亚洲国产色片| 久久久欧美国产精品| 2021天堂中文幕一二区在线观| 午夜亚洲福利在线播放| 九九爱精品视频在线观看| 三级经典国产精品| 高清日韩中文字幕在线| 老司机影院成人| 国产精品人妻久久久久久| 又粗又爽又猛毛片免费看| 丰满乱子伦码专区| 免费看av在线观看网站| 国产毛片a区久久久久| 热99在线观看视频| 99久国产av精品国产电影| 国产大屁股一区二区在线视频| 一级黄色大片毛片| 久久这里只有精品中国| 午夜免费激情av| 国产在视频线在精品| 中文亚洲av片在线观看爽| 日日撸夜夜添| 久久精品国产99精品国产亚洲性色| 国产伦精品一区二区三区四那| ponron亚洲| 亚洲人成网站高清观看| 久久久久免费精品人妻一区二区| 日韩av不卡免费在线播放| 国产精品久久久久久精品电影| 亚洲高清免费不卡视频| 亚洲人成网站在线播| 欧美丝袜亚洲另类| 亚洲在线观看片| 天堂中文最新版在线下载 | 免费看美女性在线毛片视频| 日韩一区二区三区影片| 欧美人与善性xxx| 久久久久久久久久黄片| 嘟嘟电影网在线观看| 成人毛片60女人毛片免费| 色播亚洲综合网| 亚洲av中文字字幕乱码综合| 国产精品,欧美在线| 成年免费大片在线观看| 久久精品91蜜桃| 日本av手机在线免费观看| 成人综合一区亚洲| 国产精品一及| 成年av动漫网址| 亚洲精品乱码久久久久久按摩| 亚洲国产最新在线播放| 免费看光身美女| 麻豆国产97在线/欧美| 成年av动漫网址| 久久欧美精品欧美久久欧美| av女优亚洲男人天堂| 99久久九九国产精品国产免费| 成年女人永久免费观看视频| 国产 一区 欧美 日韩| av播播在线观看一区| 97热精品久久久久久| 伦精品一区二区三区| 黑人高潮一二区| 亚洲av不卡在线观看| 久久久久久九九精品二区国产| 欧美xxxx黑人xx丫x性爽| 国产午夜精品论理片| av又黄又爽大尺度在线免费看 | 亚洲激情五月婷婷啪啪| 国产精品嫩草影院av在线观看| 国产探花极品一区二区| www.色视频.com| 国产精华一区二区三区| 老女人水多毛片| 在线观看66精品国产| 中文精品一卡2卡3卡4更新| 中文乱码字字幕精品一区二区三区 | 国产一区二区在线av高清观看| 国产亚洲av嫩草精品影院| 色尼玛亚洲综合影院| 老司机影院毛片| 日日撸夜夜添| 一级毛片我不卡| 中文字幕亚洲精品专区| 99久久九九国产精品国产免费| 精品国产三级普通话版| 岛国在线免费视频观看| 最近最新中文字幕大全电影3| 亚洲精品乱码久久久久久按摩| 视频中文字幕在线观看| 一卡2卡三卡四卡精品乱码亚洲| 国产女主播在线喷水免费视频网站 | 久久午夜福利片| 国产免费男女视频| 免费观看人在逋| 小蜜桃在线观看免费完整版高清| 男女边吃奶边做爰视频| 国产淫语在线视频| 99在线人妻在线中文字幕| 久久久久久久久久久丰满| www日本黄色视频网| 99热这里只有是精品在线观看| 我的老师免费观看完整版| 最后的刺客免费高清国语| 国产精品一区二区三区四区免费观看| 狠狠狠狠99中文字幕| 亚洲国产日韩欧美精品在线观看| 色综合站精品国产| 国产精品野战在线观看| 国产亚洲午夜精品一区二区久久 | 99热这里只有精品一区| 看非洲黑人一级黄片| 啦啦啦啦在线视频资源| 亚洲欧美精品专区久久| 午夜激情欧美在线| 亚洲精品自拍成人| 午夜激情福利司机影院| 久久热精品热| 人妻少妇偷人精品九色| 欧美精品一区二区大全| 99久国产av精品国产电影| 老司机影院毛片| 亚洲av熟女| 国产伦一二天堂av在线观看| 99九九线精品视频在线观看视频| 看片在线看免费视频| 亚洲国产欧美在线一区| 国产免费又黄又爽又色| 亚洲怡红院男人天堂| 久久精品国产99精品国产亚洲性色| 午夜日本视频在线| 韩国av在线不卡| 精品人妻偷拍中文字幕| 1024手机看黄色片| 国产女主播在线喷水免费视频网站 | 国产成人91sexporn| 搡老妇女老女人老熟妇| 大香蕉97超碰在线| 淫秽高清视频在线观看| 99热这里只有是精品50| 男女下面进入的视频免费午夜| 人妻系列 视频| 午夜福利在线观看免费完整高清在| 日本爱情动作片www.在线观看| 可以在线观看毛片的网站| 三级男女做爰猛烈吃奶摸视频| 男女国产视频网站| 丝袜喷水一区| 欧美日本亚洲视频在线播放| 毛片女人毛片| 黄色日韩在线| 精品第一国产精品| av线在线观看网站| 国产永久视频网站| av天堂久久9| 国产无遮挡羞羞视频在线观看| videosex国产| 久久久久久伊人网av| 热99国产精品久久久久久7| 国产精品不卡视频一区二区| 国产av一区二区精品久久| 香蕉国产在线看| 丝袜美足系列| 青春草视频在线免费观看| 男女啪啪激烈高潮av片| 国产一区亚洲一区在线观看| 国产在视频线精品| 国产爽快片一区二区三区| 成年人免费黄色播放视频| 男人操女人黄网站| av在线播放精品| 成年女人在线观看亚洲视频| 街头女战士在线观看网站| av国产久精品久网站免费入址| 亚洲国产日韩一区二区| 在线观看免费高清a一片| 女人久久www免费人成看片| 久久 成人 亚洲| 国产在线免费精品| 毛片一级片免费看久久久久| 国产男女超爽视频在线观看| 咕卡用的链子| 熟女电影av网| 99久久精品国产国产毛片| 香蕉丝袜av| 最近手机中文字幕大全| 热99久久久久精品小说推荐| 我的女老师完整版在线观看| 99热这里只有是精品在线观看| 大陆偷拍与自拍| 久久久久视频综合| 最近的中文字幕免费完整| 波野结衣二区三区在线| 国产激情久久老熟女| 婷婷色av中文字幕| 亚洲第一区二区三区不卡| 黑人欧美特级aaaaaa片| 亚洲欧美色中文字幕在线| 婷婷色综合大香蕉| 日韩 亚洲 欧美在线| 国产高清不卡午夜福利| 搡老乐熟女国产| 伊人久久国产一区二区| 亚洲精品,欧美精品| 国产精品熟女久久久久浪| www.av在线官网国产| 有码 亚洲区| 精品人妻一区二区三区麻豆| 波多野结衣一区麻豆| 老司机亚洲免费影院| 深夜精品福利| 国产国拍精品亚洲av在线观看| 久久久久久人妻| 欧美精品一区二区大全| 国产精品久久久久久av不卡| 久久久久久久亚洲中文字幕| 精品一区二区三区四区五区乱码 | 免费大片黄手机在线观看| 久久青草综合色| 少妇高潮的动态图| av电影中文网址| 精品国产一区二区三区久久久樱花| 夜夜骑夜夜射夜夜干| 肉色欧美久久久久久久蜜桃| 国产精品久久久久久精品电影小说| 久久免费观看电影| 天堂俺去俺来也www色官网| 波多野结衣一区麻豆| 婷婷成人精品国产| 精品国产一区二区久久| 在线观看人妻少妇| √禁漫天堂资源中文www| 欧美老熟妇乱子伦牲交| 中文字幕最新亚洲高清| 免费大片黄手机在线观看| 国产成人免费无遮挡视频| 成人亚洲欧美一区二区av| 亚洲四区av| 一级,二级,三级黄色视频| 国产乱来视频区| 日韩中字成人| 狂野欧美激情性bbbbbb| 久久人妻熟女aⅴ| 黑人欧美特级aaaaaa片| 大片免费播放器 马上看| 熟女人妻精品中文字幕| 岛国毛片在线播放| 国产一区亚洲一区在线观看| 亚洲伊人色综图| 精品国产乱码久久久久久小说| 亚洲成人一二三区av| 高清黄色对白视频在线免费看| av不卡在线播放| 精品国产露脸久久av麻豆| 午夜91福利影院| 人人妻人人澡人人爽人人夜夜| 亚洲色图综合在线观看| 不卡视频在线观看欧美| 欧美精品av麻豆av| 久久精品熟女亚洲av麻豆精品| 国产又爽黄色视频| 久久久久久久久久久久大奶| 亚洲av免费高清在线观看| 欧美最新免费一区二区三区| 美女内射精品一级片tv| 伦理电影大哥的女人| av在线播放精品| 成人免费观看视频高清| 国产日韩一区二区三区精品不卡| 欧美变态另类bdsm刘玥| 午夜激情久久久久久久| 男女无遮挡免费网站观看| 国产亚洲欧美精品永久| 精品视频人人做人人爽| 一级片'在线观看视频| 午夜精品国产一区二区电影| 狠狠婷婷综合久久久久久88av| av国产精品久久久久影院| 亚洲国产精品999| av天堂久久9| 久久精品熟女亚洲av麻豆精品| xxx大片免费视频| 久久狼人影院| 黑人猛操日本美女一级片| 精品人妻在线不人妻| 久久久国产一区二区| 夜夜爽夜夜爽视频| 亚洲av.av天堂| 老女人水多毛片| 国产成人免费观看mmmm| 女的被弄到高潮叫床怎么办| 国产精品偷伦视频观看了| 国产黄色视频一区二区在线观看| 全区人妻精品视频| 女性被躁到高潮视频| 在线观看免费日韩欧美大片| 国产日韩欧美亚洲二区| 搡老乐熟女国产| 久久久国产精品麻豆| 在现免费观看毛片| 制服诱惑二区| 久久久a久久爽久久v久久| 中文字幕最新亚洲高清| 老司机影院毛片| 欧美xxxx性猛交bbbb| 国产一区二区在线观看日韩| 亚洲国产看品久久| av国产精品久久久久影院| 成年美女黄网站色视频大全免费| 久久久精品区二区三区| 成人国语在线视频| 亚洲性久久影院| av电影中文网址| 蜜臀久久99精品久久宅男| av线在线观看网站| 狂野欧美激情性xxxx在线观看| videosex国产| 97精品久久久久久久久久精品| 成人国产麻豆网| 日韩一区二区视频免费看| 亚洲色图综合在线观看| 老司机影院毛片| 我要看黄色一级片免费的| 最近最新中文字幕大全免费视频 | 中文字幕av电影在线播放| 午夜福利,免费看| 久久影院123| 一区二区日韩欧美中文字幕 | videos熟女内射| 日产精品乱码卡一卡2卡三| 美女视频免费永久观看网站| 中文精品一卡2卡3卡4更新| 亚洲在久久综合| 2021少妇久久久久久久久久久| 欧美精品一区二区免费开放| 少妇精品久久久久久久| 校园人妻丝袜中文字幕| 久久99一区二区三区| 亚洲国产欧美日韩在线播放| 一级片'在线观看视频| 亚洲精品美女久久av网站| 亚洲精品日本国产第一区| 哪个播放器可以免费观看大片| 国产又爽黄色视频| 亚洲精品av麻豆狂野| 午夜福利网站1000一区二区三区| 亚洲国产成人一精品久久久| 精品久久国产蜜桃| 90打野战视频偷拍视频| 侵犯人妻中文字幕一二三四区| 亚洲国产av影院在线观看| 久久久欧美国产精品| videossex国产| 超色免费av| 国产色爽女视频免费观看| 国产综合精华液| 国产免费福利视频在线观看| 中文字幕制服av| 久久久久视频综合| 午夜福利乱码中文字幕| 精品一区在线观看国产| 国产成人午夜福利电影在线观看| 一级毛片电影观看| 日韩成人伦理影院| 在线观看国产h片| 精品酒店卫生间| 99久国产av精品国产电影| 这个男人来自地球电影免费观看 | 有码 亚洲区| 欧美老熟妇乱子伦牲交| 免费观看性生交大片5| 久久精品人人爽人人爽视色| 婷婷色综合www| 天堂中文最新版在线下载| 五月天丁香电影| 交换朋友夫妻互换小说| www日本在线高清视频| 99精国产麻豆久久婷婷| 亚洲成人手机| 成人亚洲精品一区在线观看| 最近中文字幕高清免费大全6| 在线天堂中文资源库| 午夜免费鲁丝| 久久久久精品人妻al黑| 男男h啪啪无遮挡| 亚洲第一区二区三区不卡| 久久精品久久久久久久性| 午夜激情久久久久久久| 色94色欧美一区二区| 青春草国产在线视频| 亚洲av福利一区| 久久精品人人爽人人爽视色| 建设人人有责人人尽责人人享有的| 国产精品人妻久久久影院| 精品酒店卫生间| 秋霞在线观看毛片| 国产精品人妻久久久影院| 五月开心婷婷网| 麻豆精品久久久久久蜜桃| 五月玫瑰六月丁香| 五月开心婷婷网| 99热这里只有是精品在线观看| 在线观看三级黄色| 亚洲成色77777| 啦啦啦啦在线视频资源| 国产激情久久老熟女| 欧美日韩综合久久久久久| 丝袜在线中文字幕| 久久久精品94久久精品| 日本免费在线观看一区| 狠狠精品人妻久久久久久综合| 中文字幕最新亚洲高清| 在线看a的网站| 亚洲av在线观看美女高潮| 黑人欧美特级aaaaaa片| 边亲边吃奶的免费视频| 新久久久久国产一级毛片| 啦啦啦中文免费视频观看日本| 亚洲一区二区三区欧美精品| 国产一区有黄有色的免费视频| 在线观看免费高清a一片|