• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    知識(shí)圖譜復(fù)雜網(wǎng)絡(luò)特性的實(shí)證研究與分析*

    2019-06-29 08:24:36丁連紅孫斌時(shí)鵬
    物理學(xué)報(bào) 2019年12期
    關(guān)鍵詞:度值子網(wǎng)實(shí)例

    丁連紅 孫斌 時(shí)鵬

    1)(北京物資學(xué)院信息學(xué)院,北京 101149)

    2)(北京科技大學(xué)國(guó)家材料服役安全科學(xué)中心,北京 100083)

    1 引 言

    復(fù)雜網(wǎng)絡(luò)理論興起于20世紀(jì)90年代,是對(duì)復(fù)雜系統(tǒng)的一種抽象和描述方式.復(fù)雜網(wǎng)絡(luò)由節(jié)點(diǎn)和邊組成,節(jié)點(diǎn)表示元素,邊表示元素之間的互相作用.復(fù)雜網(wǎng)絡(luò)普遍存在于現(xiàn)實(shí)世界,如生物分子網(wǎng)、互聯(lián)網(wǎng)、交通網(wǎng)、電力網(wǎng)等.

    知識(shí)圖譜由Google公司于2012年提出后,就在搜索引擎與人工智能領(lǐng)域備受關(guān)注.知識(shí)圖譜旨在通過(guò)語(yǔ)義知識(shí)的結(jié)構(gòu)化儲(chǔ)備實(shí)現(xiàn)智能檢索、自動(dòng)問答等應(yīng)用,相關(guān)研究主要圍繞著知識(shí)圖譜的知識(shí)提取、知識(shí)融合以及知識(shí)推理等進(jìn)行.知識(shí)圖譜描述知識(shí)之間的語(yǔ)義關(guān)聯(lián),同樣可以網(wǎng)絡(luò)化.網(wǎng)絡(luò)化的知識(shí)圖譜是否符合復(fù)雜網(wǎng)絡(luò)模型?知識(shí)間的關(guān)系是否可以通過(guò)復(fù)雜網(wǎng)絡(luò)理論進(jìn)行分析?目前尚沒有明確的結(jié)論.微軟概念圖譜(Microsoft concept graph)是微軟研究院于2016年發(fā)布的一個(gè)知識(shí)圖譜,其形式為概念(concept)、實(shí)例(instance)和關(guān)系(relation)的三元組,描述實(shí)例與概念之間的IsA關(guān)系,用于實(shí)現(xiàn)實(shí)例的概念化推理[1].例如三元組(sport,basketball,6423)表示basketball與sport之間存在IsA關(guān)系,即basketball是一種sport.其中basketball (籃球)是實(shí)例,sport (運(yùn)動(dòng))是概念,6423是從微軟bing搜索日志中抽取到的basketball和sport之間的IsA關(guān)系的次數(shù),以下稱為共現(xiàn)次數(shù).概念和實(shí)例是對(duì)事物的描述,概念較抽象,通常描述事物的類別,例如fruit (水果);實(shí)例描述較為具體,一般為具體事物的名稱或標(biāo)識(shí),例如orange (橙子).概念圖譜正是通過(guò)這些由用戶搜索記錄提取到的實(shí)例、概念以及它們之間的IsA關(guān)系反映人們對(duì)實(shí)物的認(rèn)知和理解.

    本文以微軟概念圖譜為研究對(duì)象,構(gòu)建描述概念與實(shí)例之間概念化關(guān)系的概念圖譜網(wǎng)絡(luò),進(jìn)而研究概念詞與實(shí)例詞之間的關(guān)聯(lián)關(guān)系.選取該研究對(duì)象的優(yōu)勢(shì)在于:1)圖譜數(shù)據(jù)來(lái)源于bing搜索日志中數(shù)以億計(jì)的用戶搜索記錄,反映了用戶對(duì)事物的真實(shí)看法;2)圖譜中的共現(xiàn)次數(shù)反映了IsA關(guān)系的可信度,可據(jù)此調(diào)整網(wǎng)絡(luò)規(guī)模;3)微軟概念圖譜只有IsA一種關(guān)系,在構(gòu)造網(wǎng)絡(luò)時(shí)不需要對(duì)關(guān)系進(jìn)行區(qū)分,簡(jiǎn)化了網(wǎng)絡(luò)模型的構(gòu)建.

    首先采用NetworkX工具計(jì)算相關(guān)統(tǒng)計(jì)特征[2],但由于概念圖譜網(wǎng)絡(luò)的節(jié)點(diǎn)數(shù)量巨大,導(dǎo)致計(jì)算時(shí)間過(guò)長(zhǎng),因此本文提出一種適用于概念圖譜的子網(wǎng)提取算法,用來(lái)獲取最大連通子網(wǎng),在時(shí)間和空間效率上都有顯著提高,并對(duì)最大子網(wǎng)的復(fù)雜網(wǎng)絡(luò)特征進(jìn)行了分析.在計(jì)算網(wǎng)絡(luò)的最短平均路徑長(zhǎng)度時(shí),本文提出了一種計(jì)算概念圖譜網(wǎng)絡(luò)近似平均最短路徑的方法,并對(duì)算法準(zhǔn)確性進(jìn)行了驗(yàn)證.對(duì)于聚類系數(shù)的計(jì)算,本文根據(jù)節(jié)點(diǎn)度值給出了不同的聚類系數(shù)求解方法,并采用Map/Reduce模式進(jìn)行了計(jì)算提速.

    2 相關(guān)工作

    復(fù)雜網(wǎng)絡(luò)理論起步于Erdos和Renyi的隨機(jī)圖論(ER圖),而后隨著Watts和Strogatz[3]提出的小世界網(wǎng)絡(luò)、Barabási和Albert[4]提出的無(wú)標(biāo)度網(wǎng)絡(luò)逐漸興起,復(fù)雜網(wǎng)絡(luò)理論為復(fù)雜系統(tǒng)的特征分析提供了重要的理論依據(jù),已被廣泛應(yīng)用于社會(huì)網(wǎng)絡(luò)分析[5]、城市建設(shè)用地布局[6]、國(guó)際貿(mào)易交流分析[7]、交通運(yùn)輸分析[8]等.其中交通運(yùn)輸領(lǐng)域的應(yīng)用又包括公路交通[9]、軌道交通[10]、鐵路[11]、航運(yùn)[12]、航空[13]等.通過(guò)求解網(wǎng)絡(luò)特征,如網(wǎng)絡(luò)節(jié)點(diǎn)的度分布、平均路徑長(zhǎng)度、聚集特性以及介數(shù)中心性等,分析復(fù)雜系統(tǒng)中各因子之間的關(guān)系和整體穩(wěn)定性[14].以上文獻(xiàn)中復(fù)雜網(wǎng)絡(luò)系統(tǒng)的節(jié)點(diǎn)以交通站點(diǎn)、城市、國(guó)家等為主,邊以交通線路、城市區(qū)域間道路、國(guó)家關(guān)系等為主,系統(tǒng)中節(jié)點(diǎn)和邊的數(shù)量較少,且多為連通網(wǎng)絡(luò),因此分析其統(tǒng)計(jì)特性時(shí)資源消耗不大.

    在研究如萬(wàn)維網(wǎng)[15,16]、電話呼叫網(wǎng)[17,18]這類超大規(guī)模網(wǎng)絡(luò)時(shí),由于很難得到描述整個(gè)網(wǎng)絡(luò)結(jié)構(gòu)的全部信息,通常的方法是先分析局部實(shí)際數(shù)據(jù)的特性,根據(jù)這些特性建立實(shí)際網(wǎng)絡(luò)的數(shù)學(xué)模型,再由數(shù)學(xué)模型推算整個(gè)網(wǎng)絡(luò)的相關(guān)特性.Albert等[16]先從萬(wàn)維網(wǎng)抓取了部分實(shí)際數(shù)據(jù),得到其局部結(jié)構(gòu),據(jù)此分析出節(jié)點(diǎn)的度分布符合冪律分布,并根據(jù)擬合結(jié)果對(duì)局部網(wǎng)絡(luò)進(jìn)行擴(kuò)展得到較大規(guī)模的拓?fù)浣Y(jié)構(gòu);據(jù)此分析萬(wàn)維網(wǎng)的拓?fù)浣Y(jié)構(gòu)和連接特性,得到網(wǎng)絡(luò)半徑與節(jié)點(diǎn)數(shù)量之間的函數(shù)關(guān)系;最后,將萬(wàn)維網(wǎng)節(jié)點(diǎn)實(shí)際數(shù)量代入該函數(shù)推測(cè)出萬(wàn)維網(wǎng)的網(wǎng)絡(luò)直徑.Aiello等[17,18]也通過(guò)類似的方法對(duì)電話呼叫網(wǎng)進(jìn)行了拓?fù)浣:脱莼芯?目前較快的串行最短路徑算法的時(shí)間復(fù)雜度也只能降低到O(n2.376)[19],n為網(wǎng)絡(luò)節(jié)點(diǎn)的數(shù)量.

    隨著時(shí)間的發(fā)展,萬(wàn)維網(wǎng)的節(jié)點(diǎn)數(shù)量早已超過(guò)數(shù)十億數(shù)量級(jí),邊的數(shù)量更是不計(jì)其數(shù);電話呼叫網(wǎng)絡(luò)根據(jù)已存在的電話線路之間的關(guān)系進(jìn)行建立,包括約47000000個(gè)節(jié)點(diǎn),80000000條邊.對(duì)于規(guī)模如此巨大的網(wǎng)絡(luò)直接計(jì)算其直徑(節(jié)點(diǎn)間最短路徑的平均值)和聚類系數(shù)幾乎是不可行的.這可能是相關(guān)文獻(xiàn)均未給出具體的網(wǎng)絡(luò)聚類系數(shù)值,對(duì)于網(wǎng)絡(luò)直徑也只給出由網(wǎng)絡(luò)模型計(jì)算得到的推測(cè)值的原因[15,17,18].

    因此有學(xué)者開展了網(wǎng)絡(luò)精簡(jiǎn)、評(píng)估方法改進(jìn)、網(wǎng)絡(luò)結(jié)構(gòu)優(yōu)化等研究.網(wǎng)絡(luò)精簡(jiǎn)通過(guò)閾值網(wǎng)絡(luò)[20]、最小生成樹[21]、差分網(wǎng)絡(luò)[22]等方法減小網(wǎng)絡(luò)的規(guī)模.孫延風(fēng)和王朝勇[23]采用互信息表示金融網(wǎng)絡(luò)中節(jié)點(diǎn)間的關(guān)系,并用閾值網(wǎng)絡(luò)和最小生成樹對(duì)網(wǎng)絡(luò)進(jìn)行精簡(jiǎn),最后驗(yàn)證了網(wǎng)絡(luò)模型的有效性.

    評(píng)估方法改進(jìn)包括基于度中心性的評(píng)估方法[24]、k-shell分解[25]和基于PageRank的評(píng)估方法[26]等.Ruan等[27]將約束系數(shù)引入節(jié)點(diǎn)核心性的度量,提出了一種綜合節(jié)點(diǎn)鄰居節(jié)點(diǎn)的k-shell值和鄰居節(jié)點(diǎn)間拓?fù)浣Y(jié)構(gòu)的核心性度量方法,該方法能更準(zhǔn)確地評(píng)估節(jié)點(diǎn)的傳播能力.孔江濤等[28]利用復(fù)雜網(wǎng)絡(luò)動(dòng)力學(xué)模型描述復(fù)雜網(wǎng)絡(luò)中節(jié)點(diǎn)間的相互影響活動(dòng),建立了基于偏離均值與偏離均值的方差的兩級(jí)節(jié)點(diǎn)重要性評(píng)估標(biāo)準(zhǔn),并通過(guò)擾動(dòng)測(cè)試和破壞測(cè)試驗(yàn)證了標(biāo)準(zhǔn)的有效性.

    網(wǎng)絡(luò)結(jié)構(gòu)優(yōu)化主要以實(shí)際應(yīng)用為目的,如韓定定等[29]結(jié)合時(shí)變特征和網(wǎng)絡(luò)客流分布,對(duì)航空網(wǎng)進(jìn)行優(yōu)化,提出了一種快速推算航線網(wǎng)絡(luò)最優(yōu)拓?fù)浼跋鄳?yīng)航班頻率分布的方法.Niu和Pan[30]通過(guò)自組織優(yōu)化機(jī)制對(duì)運(yùn)輸網(wǎng)絡(luò)進(jìn)行優(yōu)化,證明了無(wú)標(biāo)度網(wǎng)絡(luò)在gradient-driven運(yùn)輸模式下可以有效地通過(guò)自組織優(yōu)化機(jī)制提高運(yùn)輸能力.Jiang等[31]以中國(guó)航空運(yùn)輸網(wǎng)(CNTA)為例研究多層網(wǎng)絡(luò)融合過(guò)程的本質(zhì),通過(guò)一系列拓?fù)鋵傩钥坍嫸鄬泳W(wǎng)絡(luò)的融合過(guò)程,發(fā)現(xiàn)CNTA在融合過(guò)程中發(fā)生了明顯的結(jié)構(gòu)轉(zhuǎn)換,為中國(guó)航空運(yùn)輸系統(tǒng)的網(wǎng)絡(luò)結(jié)構(gòu)優(yōu)化和管理提供了啟示.

    而知識(shí)圖譜作為智能化的語(yǔ)義知識(shí)儲(chǔ)備,其規(guī)模也會(huì)隨著時(shí)間而不斷積累擴(kuò)大,節(jié)點(diǎn)數(shù)量往往突破千萬(wàn)數(shù)量級(jí),對(duì)這類大規(guī)模網(wǎng)絡(luò)的特征計(jì)算也必然十分復(fù)雜與耗時(shí).NetworkX是一款用Python語(yǔ)言開發(fā)的復(fù)雜網(wǎng)絡(luò)構(gòu)建與分析軟件工具包,是復(fù)雜網(wǎng)絡(luò)建模與分析的有力工具[2].由于知識(shí)圖譜的規(guī)模巨大,使用NetworkX僅是構(gòu)建出整個(gè)網(wǎng)絡(luò)便需要消耗近40 GB的內(nèi)存.萬(wàn)維網(wǎng)可以通過(guò)網(wǎng)絡(luò)中的路由設(shè)備找到通往各個(gè)網(wǎng)站節(jié)點(diǎn)需要跳轉(zhuǎn)的次數(shù),即平均最短路徑長(zhǎng)度,而知識(shí)圖譜與萬(wàn)維網(wǎng)不同,知識(shí)間的拓?fù)渚嚯x無(wú)法如此計(jì)算.為了解決大規(guī)模復(fù)雜網(wǎng)絡(luò)分析的問題,有學(xué)者設(shè)計(jì)了近似算法以計(jì)算復(fù)雜網(wǎng)絡(luò)的平均距離.Rattigan等[19]通過(guò)引入網(wǎng)絡(luò)結(jié)構(gòu)索引(network structure index,NSI)計(jì)算節(jié)點(diǎn)間路徑,從而降低計(jì)算網(wǎng)絡(luò)平均路徑長(zhǎng)度這樣的基于節(jié)點(diǎn)間路徑應(yīng)用的搜索復(fù)雜度.NSI由各個(gè)節(jié)點(diǎn)的標(biāo)記和根據(jù)節(jié)點(diǎn)標(biāo)記估算節(jié)點(diǎn)對(duì)間距離的函數(shù)構(gòu)成.唐晉韜等[32]提出了基于區(qū)域中心點(diǎn)距離(centers distance of zone,CDZ)的復(fù)雜網(wǎng)絡(luò)最短路徑計(jì)算的近似方法,根據(jù)網(wǎng)絡(luò)特征將網(wǎng)絡(luò)分成多個(gè)區(qū)域,每個(gè)區(qū)域都設(shè)置一個(gè)中心點(diǎn),將兩節(jié)點(diǎn)之間的距離轉(zhuǎn)換為節(jié)點(diǎn)到中心點(diǎn)以及中心點(diǎn)間的距離之和,實(shí)現(xiàn)近似計(jì)算.受CDZ思想的啟發(fā)本文提出了一種根據(jù)節(jié)點(diǎn)所在網(wǎng)絡(luò)層與中心節(jié)點(diǎn)的距離及不同網(wǎng)絡(luò)層之間的距離計(jì)算概念圖譜網(wǎng)絡(luò)近似平均最短路徑的方法.

    3 概念圖譜網(wǎng)絡(luò)構(gòu)建及最大連通子網(wǎng)抽取

    3.1 概念圖譜網(wǎng)絡(luò)構(gòu)建

    微軟官方提供的概念圖譜的數(shù)據(jù)文件是一個(gè)純文本文件,構(gòu)成該文件的元數(shù)據(jù)是描述實(shí)例與概念之間IsA關(guān)系的三元組.通過(guò)對(duì)該數(shù)據(jù)文件的遍歷發(fā)現(xiàn),有些詞既作為概念(Concept)出現(xiàn),也作為實(shí)例(Instance)出現(xiàn),本文將這部分詞稱為子概念詞(subConcept).為了構(gòu)建描述實(shí)例與概念之間的實(shí)例關(guān)系的復(fù)雜網(wǎng)絡(luò),將概念、子概念和實(shí)例作為網(wǎng)絡(luò)的節(jié)點(diǎn),在存在IsA關(guān)系的兩個(gè)節(jié)點(diǎn)之間添加一無(wú)向條邊,表示它們之間的實(shí)例關(guān)聯(lián),從而構(gòu)建出如圖1所示的描述概念、子概念、實(shí)例之間的實(shí)例關(guān)聯(lián)的概念圖譜網(wǎng)絡(luò).

    圖1 概念圖譜網(wǎng)絡(luò)示意圖Fig.1.Network of concept graph.

    建立的概念圖譜網(wǎng)絡(luò)是一種無(wú)向非加權(quán)網(wǎng),具有如下特征:1)網(wǎng)絡(luò)規(guī)模巨大,包括16936670個(gè)節(jié)點(diǎn)和33354328條邊,因此建立非加權(quán)網(wǎng)絡(luò)以減少計(jì)算復(fù)雜度,便于特征分析;2)只描述概念和實(shí)例間的IsA關(guān)聯(lián)及關(guān)聯(lián)間的跳轉(zhuǎn)層次,忽略關(guān)系的方向;3)共現(xiàn)次數(shù)描述節(jié)點(diǎn)間關(guān)系的可信度,旨在通過(guò)閾值設(shè)置得到不同較小規(guī)模的概念圖譜網(wǎng)絡(luò)以進(jìn)行深入的比較分析.

    表1列出了在整體概念圖譜網(wǎng)絡(luò)中,概念詞、實(shí)例詞以及子概念詞的度值分布.在概念圖譜網(wǎng)絡(luò)中,概念節(jié)點(diǎn)的度表示有多少個(gè)實(shí)例或子概念與該概念存在IsA關(guān)系.實(shí)例節(jié)點(diǎn)的度表示該實(shí)例與多少個(gè)概念或子概念具有IsA關(guān)系.首先,因?yàn)楦拍顖D譜的基本數(shù)據(jù)是由概念、實(shí)例和它們之間的IsA關(guān)聯(lián)構(gòu)成的三元組,因此,每個(gè)概念至少與一個(gè)實(shí)例相關(guān),一個(gè)實(shí)例也至少與一個(gè)概念相關(guān),因此所構(gòu)建的概念圖譜網(wǎng)絡(luò)中不應(yīng)有孤立節(jié)點(diǎn),即不存在度為0的節(jié)點(diǎn),這與表1的統(tǒng)計(jì)數(shù)據(jù)一致.其次,由于子概念既可以處在概念的位置,也可以處在實(shí)例的位置,所以子概念的度都應(yīng)大于等于2.但由表1可知概念圖譜網(wǎng)絡(luò)中有18個(gè)子概念節(jié)點(diǎn)的度為1.為探究該現(xiàn)象,在概念圖譜的數(shù)據(jù)文件中對(duì)度為1的子概念節(jié)點(diǎn)進(jìn)行了檢索和分析,發(fā)現(xiàn)存在類似于(small business issuer,company,4)和(company,small business issuer,1)這樣的兩個(gè)節(jié)點(diǎn)互為對(duì)方的概念與實(shí)例的情況.同時(shí),因?yàn)檫@兩個(gè)節(jié)點(diǎn)都未出現(xiàn)在其他三元組中,所以它們的度都為1.這些度為1的子概念節(jié)點(diǎn)也揭示了所構(gòu)建的概念圖譜網(wǎng)絡(luò)并非一個(gè)連通網(wǎng)絡(luò).因此,為了真實(shí)描述其網(wǎng)絡(luò)特性,必須抽取該網(wǎng)絡(luò)的最大連通子網(wǎng),并將其作為后續(xù)研究對(duì)象分析概念圖譜網(wǎng)絡(luò)的復(fù)雜網(wǎng)絡(luò)特性.

    表1 概念圖譜網(wǎng)絡(luò)的節(jié)點(diǎn)度分布Table 1.Degree distribution of the concept graph network.

    3.2 子網(wǎng)抽取算法

    由于概念圖譜網(wǎng)絡(luò)不是連通網(wǎng)絡(luò),無(wú)法計(jì)算節(jié)點(diǎn)間的平均距離,所以需要計(jì)算出概念圖譜網(wǎng)絡(luò)的最大連通子網(wǎng).我們按照廣度優(yōu)先思想,實(shí)現(xiàn)了基于廣度優(yōu)先的子網(wǎng)提取算法(SubNet Extraction based on Breadth-first,SNEBF).

    算法1基于廣度優(yōu)先的子網(wǎng)提取算法(SNEBF)

    輸入:概念圖譜數(shù)據(jù)文件Graph

    輸出:最大連通子網(wǎng)節(jié)點(diǎn)集合MaxSubNet

    1)從Graph中抽取一個(gè)三元組,該三元組包含的兩個(gè)節(jié)點(diǎn)的度之和最大,將該三元組中的概念和實(shí)例作為兩個(gè)初始節(jié)點(diǎn),構(gòu)成初始節(jié)點(diǎn)集合InitialSet,并將這兩個(gè)節(jié)點(diǎn)加入MaxSubNet.

    2)對(duì)InitialSet中的每一個(gè)節(jié)點(diǎn)node

    {a.遍歷Graph中的三元組(概念(con),實(shí)例(ins),關(guān)系(rel))信息,如果其con或ins等于node,則將該三元組中相應(yīng)的ins或con加入節(jié)點(diǎn)node的鄰居節(jié)點(diǎn)集合NeighborSet.

    b.判斷NeighborSet中是否還有未加入MaxSubNet的節(jié)點(diǎn),如果有,將這些節(jié)點(diǎn)加入MaxSubNet,將NeighborSet集合與MaxSubNet的差集并入InitialSet.}.

    3)返回MaxSubNet.

    類似于廣度優(yōu)先的按層掃描,對(duì)于InitialSet中的每一節(jié)點(diǎn)node算法1總是找出其全部相鄰節(jié)點(diǎn)并據(jù)此對(duì)最大子網(wǎng)進(jìn)行擴(kuò)展,對(duì)找出的相鄰節(jié)點(diǎn)重復(fù)相同的操作.但在實(shí)際運(yùn)行時(shí),由于網(wǎng)絡(luò)中的節(jié)點(diǎn)之間關(guān)系復(fù)雜,不同節(jié)點(diǎn)的鄰居節(jié)點(diǎn)集合可能相互包含了許多相同的節(jié)點(diǎn).如在圖2所示的概念圖譜網(wǎng)絡(luò)中,Concept1的鄰居節(jié)點(diǎn)集合包括4個(gè)節(jié)點(diǎn):Instance2,Instance3,Instance4和Instance5.Concept2也有4個(gè)鄰居節(jié)點(diǎn):Instance1,Instance2,Instance3和Instance4.其中Instance2,Instance3和Instance4是Concept1的鄰居節(jié)點(diǎn)也是Concept2的鄰居節(jié)點(diǎn).

    圖2 導(dǎo)致節(jié)點(diǎn)的鄰居節(jié)點(diǎn)集合冗余的網(wǎng)絡(luò)結(jié)構(gòu)Fig.2.Network structure leading to the overlap of neighbor node sets.

    這些相同的節(jié)點(diǎn)在處理Concept1的鄰居節(jié)點(diǎn)和Concept2的鄰居節(jié)點(diǎn)時(shí)會(huì)被重復(fù)進(jìn)行遞歸檢索處理.這不但會(huì)增加大量的冗余存儲(chǔ)空間而且需要多次重復(fù)檢索圖譜數(shù)據(jù).同時(shí)由于算法中循環(huán)嵌套了循環(huán),所以在進(jìn)行遍歷時(shí)十分耗時(shí).因此我們引入集合運(yùn)算,從而得到基于集合運(yùn)算的子網(wǎng)抽取算法(SubNet Extraction based on Set Operation,SNESO).

    算法2基于集合運(yùn)算的子網(wǎng)抽取算法(SNESO)

    輸入:概念圖譜數(shù)據(jù)文件Graph

    輸出:最大連通子網(wǎng)節(jié)點(diǎn)集合MaxSubNet

    1)從Graph中抽取一條包含度值最大節(jié)點(diǎn)的三元組信息,將該三元組中的概念和實(shí)例作為中心節(jié)點(diǎn)構(gòu)成最大連通子網(wǎng)的中心層SubNeti(此時(shí)i=1),并將其加入MaxSubNet.

    2)尋找SubNeti集合的鄰居節(jié)點(diǎn),即遍歷Graph中的(con,ins,rel)信息,判斷其con或ins是否屬于SubNeti集合,若存在,則表示對(duì)應(yīng)的ins或con是集合SubNeti的鄰居節(jié)點(diǎn),將這些節(jié)點(diǎn)加入SubNeti的鄰居節(jié)點(diǎn)集合NeighborsSeti.

    3)判斷NeighborsSeti中是否還有新的未在MaxSubNet中的節(jié)點(diǎn),如果有,則將NeighborsSeti并入MaxSubNet,將SubNeti替換為NeighborsSeti與MaxSubNet的差集,i=i+1.然后跳轉(zhuǎn)至步驟2;若無(wú),則繼續(xù)步驟4.

    4)返回MaxSubNet.

    算法1和算法2的關(guān)鍵操作是對(duì)Graph三元組信息的遍歷.由中心層出發(fā),每掃描一次Graph,算法1獲得一個(gè)節(jié)點(diǎn)的鄰接節(jié)點(diǎn),算法2獲得一層節(jié)點(diǎn)的全部鄰接節(jié)點(diǎn),因此算法2能顯著減少對(duì)Graph的掃描次數(shù).由于度值大的節(jié)點(diǎn)在最大連通子網(wǎng)的概率較高,為了保證可以找到最大子網(wǎng),我們從度值最大的節(jié)點(diǎn)以及與最大節(jié)點(diǎn)相連的度值較大的節(jié)點(diǎn)開始進(jìn)行搜索.在實(shí)際運(yùn)行中,運(yùn)算時(shí)間和空間復(fù)雜度確實(shí)有所降低,具體的復(fù)雜度分析見3.3節(jié).

    先由算法2得到最大連通子網(wǎng)的節(jié)點(diǎn)集合MaxSubNet;再根據(jù)MaxSubNet從概念圖譜數(shù)據(jù)文件Graph中提取出最大子網(wǎng)的邊的集合,其中的每條邊依然采用Graph中的三元組形式并存儲(chǔ)在文本文件GraphLink中;最后由MaxSubNet和GraphLink生成如圖3所示結(jié)構(gòu)的最大連通子網(wǎng).其中,中心層(Central Layer)由兩個(gè)節(jié)點(diǎn)構(gòu)成,這兩個(gè)節(jié)點(diǎn)是各三元組對(duì)應(yīng)的節(jié)點(diǎn)對(duì)中度值和最大的節(jié)點(diǎn)對(duì);第二層(Layer-2)為中心層各節(jié)點(diǎn)的鄰居節(jié)點(diǎn)的集合;第三層(Layer-3)為第二層的各節(jié)點(diǎn)的鄰居節(jié)點(diǎn)的集合.以此類推,直到網(wǎng)絡(luò)的最外層(Outermost Layer).

    圖3 最大連通子網(wǎng)的分層邏輯結(jié)構(gòu)Fig.3.Hierarchical logical structure of the largest connected subnet.

    3.3 算法復(fù)雜度分析

    根據(jù)算法1我們實(shí)現(xiàn)了函數(shù)GetNeighbor(Node,Graph),該函數(shù)遍歷Graph中的邊(三元組)信息,判斷Node是否為當(dāng)前邊的端點(diǎn).由于一條邊有兩個(gè)端點(diǎn),完成一條邊的掃描需要兩次判斷操作.將1個(gè)端點(diǎn)的判斷操作定義為1次基本操作,Graph的邊數(shù)為n,則GetNeighbor(Node,Graph)的時(shí)間復(fù)雜度為2n.由算法1可知,每當(dāng)最大連通子網(wǎng)中有一個(gè)新的節(jié)點(diǎn),就要調(diào)用一次GetNeighbor(Node,Graph).設(shè)最大連通子網(wǎng)的節(jié)點(diǎn)數(shù)為m,則算法1的時(shí)間復(fù)雜度為m×2n.由后面3.4節(jié)的實(shí)際計(jì)算結(jié)果可知,m近似為n/2,所以算法1的時(shí)間復(fù)雜度為O(n2).

    算法2在算法1的基礎(chǔ)上引入了集合運(yùn)算,兩者的區(qū)別在于:算法1每遍歷一次Graph可以找出一個(gè)節(jié)點(diǎn)的鄰居節(jié)點(diǎn);算法2每遍歷一次Graph可以找出一層節(jié)點(diǎn)的全部鄰居節(jié)點(diǎn),只要將函數(shù)GetNeighbor的參數(shù)由Node改為NodeSet即可.該函數(shù)遍歷Graph中的邊信息,判斷邊端點(diǎn)是否在集合NodeSet中.由于GetNeighbor(Node,Graph)的時(shí)間復(fù)雜度為2n,由3.4節(jié)的實(shí)驗(yàn)可知GetNeighbor(NodeSet,Graph)的平均運(yùn)算時(shí)間約為算法1中GetNeighbor(Node,Graph)運(yùn)行時(shí)間的1.6倍,所以GetNeighbor(NodeSet,Graph)的時(shí)間復(fù)雜度為1.6×2n=3.2n.由算法2可知,對(duì)最大子網(wǎng)的每一子網(wǎng)層需調(diào)用一次GetNeighbor(NodeSet,Graph),設(shè)構(gòu)建最大連通子網(wǎng)過(guò)程中,子網(wǎng)層數(shù)為nl,則運(yùn)行GetNeighbor(NodeSet,Graph)的次數(shù)為nl次,所以算法2的時(shí)間復(fù)雜度為nl×3.2n.通過(guò)3.4節(jié)的最大子網(wǎng)抽取實(shí)驗(yàn)發(fā)現(xiàn),nl的實(shí)際值為12,由于nl遠(yuǎn)小于n(33377320),所以算法2的時(shí)間復(fù)雜度近似為O(n).

    3.4 最大子網(wǎng)抽取實(shí)驗(yàn)與對(duì)比

    分別采用NetwrokX和算法1(SNEBF)、算法2(SNESO)對(duì)所構(gòu)建的概念圖譜網(wǎng)絡(luò)進(jìn)行了最大連通子網(wǎng)的抽取實(shí)驗(yàn),具體的實(shí)驗(yàn)環(huán)境為64位Win7系統(tǒng),16 GB內(nèi)存,Anacodna集成Python開發(fā)環(huán)境,其時(shí)間復(fù)雜度和實(shí)際運(yùn)算時(shí)間見表2.

    表2 最大子網(wǎng)提取算法時(shí)間復(fù)雜度對(duì)比表Table 2.Time complexity of the subset extraction algorithms.

    其中采用NetworkX以及SNEBF求解最大子網(wǎng)時(shí)程序并未運(yùn)行出結(jié)果,在實(shí)際運(yùn)行時(shí)間為15 d時(shí)終止了這兩個(gè)程序,由此可以得出NetworkX構(gòu)建最大子網(wǎng)時(shí)間大于15 d的結(jié)論.實(shí)驗(yàn)過(guò)程中SNEBF中的GetNeighbor (Node,Graph)運(yùn)算時(shí)間約為10.9 s,SNESO中的GetNeighbor (NodeSet,Graph)的平均運(yùn)算時(shí)間為17.6 s,約為GetNeighbor(Node,Graph)的1.6倍.因?yàn)镾NEBF的時(shí)間復(fù)雜度為(m×2n),而2n,即GetNeighbor(Node,Graph)的平均運(yùn)行時(shí)間為10.9 s,所以可以推算出SNEBF的運(yùn)行時(shí)間約為m×2n=15114834×10.9 s=5.22 a.由GetNeighbor(NodeSet,Graph)的平均計(jì)算時(shí)間和nl=12,得到SNESO的運(yùn)行時(shí)間為3.49 min,而該算法的實(shí)際運(yùn)行時(shí)間為3.80 min.所以,SNESO時(shí)間復(fù)雜度最小,計(jì)算速度最快,運(yùn)算時(shí)間在可接受范圍內(nèi),遠(yuǎn)小于SNEBF的運(yùn)行時(shí)間.

    使用NetworkX抽取最大子網(wǎng),首先通過(guò)其內(nèi)部函數(shù)connected_component_subgraphs(Graph)求解所有子網(wǎng)[33],再?gòu)闹姓业焦?jié)點(diǎn)數(shù)量最多的子網(wǎng),即為最大連通子網(wǎng).connected_component_subgraphs(Graph)的輸入是一個(gè)無(wú)向NetworkX圖G,輸出是G的所有連通子網(wǎng)的列表.該函數(shù)是一個(gè)由兩行代碼構(gòu)成的for循環(huán):

    forcin connected_components(G):

    yieldG.subgraph(c).copy()

    其中connected_components(G)返回各個(gè)連通子網(wǎng)的全部節(jié)點(diǎn)c的列表,G.subgraph(c).copy()將節(jié)點(diǎn)列表c轉(zhuǎn)換成圖G的一個(gè)連通子圖.以下是connected_components(G)的定義:

    ① seen={};

    ② forvinG:/*對(duì)G中的每個(gè)節(jié)點(diǎn)v*/

    ③ ifvnot in seen:/*如果沒有遍歷過(guò)節(jié)點(diǎn)v*/

    ④c=sp_length(G,v);/*計(jì)算點(diǎn)v到所有可以連通節(jié)點(diǎn)的距離字典c*/

    ⑤ yield list(c);/*將獲得的c轉(zhuǎn)換為列表返回*/

    表3 算法空間復(fù)雜度和實(shí)際內(nèi)存消耗對(duì)比表Table 3.Space complexity of the algorithms.

    ⑥ seen.update(c);/*更新seen的值以確保不會(huì)尋找重復(fù)節(jié)點(diǎn)*/

    ⑦ end if

    ⑧ end for;

    NetworkX求解最大子網(wǎng)的關(guān)鍵操作是sp_length(G,v)函數(shù),具體的時(shí)間復(fù)雜度分析在第4節(jié)中采用事后統(tǒng)計(jì)法給出.

    表3列出了NetworkX與算法2運(yùn)行時(shí)的實(shí)際內(nèi)存消耗.實(shí)驗(yàn)中NetworkX抽取概念圖譜最大連通子網(wǎng)至少需要40 GB內(nèi)存.采用SNESO求解最大子網(wǎng)時(shí),占用內(nèi)存的變量為SubNeti,NeighborsSet,MaxSubNet,數(shù)值與最大子網(wǎng)的節(jié)點(diǎn)數(shù)、子網(wǎng)某層的節(jié)點(diǎn)數(shù)相關(guān),實(shí)際占用內(nèi)存為5.23 GB.

    由算法2根據(jù)概念圖譜的數(shù)據(jù)文件生成的最大子網(wǎng)包含15114834個(gè)節(jié)點(diǎn)和32274081條邊,分別占整個(gè)概念圖譜網(wǎng)絡(luò)節(jié)點(diǎn)和邊的89.24%和96.69%.可知該子網(wǎng)覆蓋了概念圖譜網(wǎng)絡(luò)絕大部分的節(jié)點(diǎn)與邊,其網(wǎng)絡(luò)特性可以較好地反映出整個(gè)網(wǎng)絡(luò)的特征,后續(xù)對(duì)概念圖譜復(fù)雜網(wǎng)絡(luò)特性的分析都基于此最大連通子網(wǎng).

    4 概念圖譜網(wǎng)絡(luò)的復(fù)雜網(wǎng)絡(luò)特性分析

    復(fù)雜網(wǎng)絡(luò)的統(tǒng)計(jì)特征主要包括度分布、kshell核心性、平均路徑、聚類系數(shù)和度相關(guān)性等.

    1)度分布p(k):度分布可以用來(lái)表征網(wǎng)絡(luò)最基本的拓?fù)涮匦?圖4是最大連通子網(wǎng)的節(jié)點(diǎn)累積度分布,節(jié)點(diǎn)度呈冪律分布,符合無(wú)標(biāo)度網(wǎng)絡(luò)特性.

    表4統(tǒng)計(jì)了三類節(jié)點(diǎn)中度值為1—13的節(jié)點(diǎn)數(shù)量與比例:82%的實(shí)例節(jié)點(diǎn)度值為1,即82%的實(shí)例只與一個(gè)概念相關(guān).度值為1的節(jié)點(diǎn),實(shí)例占85.5%,概念占14.5%.由此判斷在自然語(yǔ)言處理過(guò)程中使用實(shí)例詞比使用概念詞更不易因一詞多義而引起文本描述的歧義.82%的概念度值在1—3之間,表明絕多數(shù)概念只有1—3個(gè)含義.在度值相同的節(jié)點(diǎn)中,子概念的比例隨度值的增大而增加,表明子概念通常作為連接多個(gè)節(jié)點(diǎn)的核心節(jié)點(diǎn).

    圖4 概念圖譜最大連通子網(wǎng)累積度分布Fig.4.Cumulative degree distribution of the largest connected subnet.

    2)k-shell核心性:思想是處于網(wǎng)絡(luò)核心位置的節(jié)點(diǎn),即使度很小,對(duì)網(wǎng)絡(luò)的影響力也可以很大.k-shell分解把網(wǎng)絡(luò)由邊緣至中心劃分成若干層,能夠有效識(shí)別網(wǎng)絡(luò)核心.

    概念圖譜最大子網(wǎng)經(jīng)k-shell分解為185層,圖5是各層節(jié)點(diǎn)的度分布及平均度值,可見節(jié)點(diǎn)度越大其k-shell分層越高,越靠近中心層,說(shuō)明大度值節(jié)點(diǎn)位于靠近概念圖譜網(wǎng)絡(luò)中心的位置,而不是邊緣位置.如圖5所示,度高于10000的節(jié)點(diǎn)大都劃分到了核心層,只有極少數(shù)k-shell值很低.我們發(fā)現(xiàn)這些節(jié)點(diǎn)的多數(shù)鄰居節(jié)點(diǎn)的度很低.如劃分到13-shell層的節(jié)點(diǎn)“common search term”和“connected tool”的度高達(dá)102033和31963,但這兩個(gè)節(jié)點(diǎn)的鄰居節(jié)點(diǎn)中度為1的分別多達(dá)101892個(gè)和31942個(gè).

    核心層(185-shell)包括786個(gè)節(jié)點(diǎn),其中子概念782個(gè),概念和實(shí)例各2個(gè).核心層節(jié)點(diǎn)間有119162條邊,構(gòu)成了一個(gè)稠密圖,網(wǎng)絡(luò)密度0.386,遠(yuǎn)高于最大子網(wǎng)的2.825×10—7.表5是核心層中度值最高的20個(gè)節(jié)點(diǎn)及其度值.

    雖然子概念只占最大子網(wǎng)節(jié)點(diǎn)的6.2%,卻占核心層的99.5%.說(shuō)明子概念在概念圖譜中起著重要的連接作用.其根源在于子概念既可以作為比其描述能力抽象的詞的實(shí)例,也可以作為比其描述具體的詞的概念,如topic作為概念時(shí)包括cultural,political,physica等實(shí)例,這些實(shí)例都可以說(shuō)是某一種具體的topic (話題),都與topic具有IsA關(guān)系.作為實(shí)例時(shí),topic又是多個(gè)概念的實(shí)例,如concept,document,information等.

    表4 概念圖譜最大子網(wǎng)度分布分析Table 4.Degree distribution analysis of the largest connected subnet.

    圖5 節(jié)點(diǎn)度與k-shell分解中心性關(guān)系Fig.5.Relationship between degree andk-shell.

    3)平均路徑:網(wǎng)絡(luò)的平均路徑avg(l)是所有節(jié)點(diǎn)對(duì)之間距離的平均值,它描述了網(wǎng)絡(luò)中節(jié)點(diǎn)間的分離程度.目前最快的串行最短路徑算法只能將計(jì)算的時(shí)間復(fù)雜度降到O(n2.376)[19].概念圖譜網(wǎng)絡(luò)的節(jié)點(diǎn)數(shù)為15114834,要精確計(jì)算平均最短路徑,需要計(jì)算114229095866361個(gè)節(jié)點(diǎn)對(duì)之間的最短路徑,計(jì)算量巨大;同時(shí)計(jì)算過(guò)程中每條路徑上需要存儲(chǔ)多個(gè)節(jié)點(diǎn)信息,存儲(chǔ)消耗也很大.

    表5 核心層中度值最高的20個(gè)節(jié)點(diǎn)Table 5.Top 20 nodes with the highest degree in core.

    首先嘗試用NetworkX計(jì)算最大子網(wǎng)的avg(l),運(yùn)行了30 d沒有輸出結(jié)果.為了探究其時(shí)間復(fù)雜度,需要對(duì)較小規(guī)模的概念圖譜網(wǎng)絡(luò)進(jìn)行計(jì)算.為此將共現(xiàn)次數(shù)作為閾值限制邊的數(shù)量從而形成不同較小規(guī)模的網(wǎng)絡(luò),如表6所列.其中t為閾值,n為節(jié)點(diǎn)數(shù),e為邊數(shù).

    圖6展示了NetworkX計(jì)算表6中各網(wǎng)絡(luò)平均路徑的實(shí)際運(yùn)算時(shí)間time(s)與網(wǎng)絡(luò)規(guī)模(節(jié)點(diǎn)數(shù)n),經(jīng)過(guò)擬合可知存在函數(shù)關(guān)系:time(n)=5.121×10—7×n2.236.當(dāng)t=10時(shí),NetworkX實(shí)際運(yùn)行了1868428.416 s,約22 d.將最大子網(wǎng)節(jié)點(diǎn)數(shù)代入該函數(shù)可知NetworkX需要計(jì)算184 a,這也是計(jì)算30 d沒有輸出結(jié)果的原因.

    表6 部分閾值網(wǎng)絡(luò)及節(jié)點(diǎn)數(shù)Table 6.Threshold networks and the number of nodes.

    圖6 NetworkX計(jì)算平均路徑所需時(shí)間Fig.6.Time cost of NetworkX for avg(l).

    隨后,嘗試用唐晉韜等[32]提出的CDZ方法進(jìn)行計(jì)算.該方法首先根據(jù)局部中心性尋找區(qū)域中心點(diǎn)并據(jù)此對(duì)網(wǎng)絡(luò)進(jìn)行區(qū)域劃分;之后用區(qū)域中心點(diǎn)的距離表示區(qū)域間節(jié)點(diǎn)的路徑長(zhǎng)度,此時(shí)節(jié)點(diǎn)間路徑近似等于區(qū)域中心點(diǎn)的路徑與區(qū)域內(nèi)路徑的和.其時(shí)間復(fù)雜函數(shù)為O(nlogn+e+d3),n是節(jié)點(diǎn)數(shù),e是邊數(shù),d是中心點(diǎn)數(shù)量[32].相對(duì)于隨機(jī)網(wǎng)絡(luò),CDZ更適合具有無(wú)標(biāo)度特征的復(fù)雜網(wǎng)絡(luò).CDZ計(jì)算無(wú)標(biāo)度網(wǎng)絡(luò)Cora平均路徑的時(shí)間為20余秒.Cora的n=30751,e=134450,按照文獻(xiàn)所述方法計(jì)算得到的d為46,因此時(shí)間復(fù)雜度函數(shù)值為369792.對(duì)于概念圖譜最大子網(wǎng)而言,n=15114834,e=32274081,d=130109,因此時(shí)間復(fù)雜度函數(shù)值為2202531075674600,是Cora的5956132434倍.按照CDZ計(jì)算Cora平均路徑用時(shí)為20 s計(jì)算,CDZ計(jì)算概念圖譜的最大子網(wǎng)平均路徑需要3777 a.

    為此我們提出了一種概念圖譜網(wǎng)絡(luò)最短路徑長(zhǎng)度的近似計(jì)算方法,該算法區(qū)別于CDZ的是用網(wǎng)絡(luò)層代替區(qū)域,且忽略同層內(nèi)節(jié)點(diǎn)的具體距離.根據(jù)圖3所示的最大連通子網(wǎng)的層次結(jié)構(gòu),用層與層之間的距離近似代替點(diǎn)與點(diǎn)之間的距離,計(jì)算網(wǎng)絡(luò)的近似平均最短路徑長(zhǎng)度:

    其中AppAvg(l)表示網(wǎng)絡(luò)的近似平均最短路徑長(zhǎng)度,minavg(l)表示可能存在的近似平均最短路徑長(zhǎng)度的最小值,maxavg(l)表示可能存在的近似平均路徑長(zhǎng)度的最大值.

    其中l(wèi)min_ij表示節(jié)點(diǎn)i到節(jié)點(diǎn)j可能的最小路徑長(zhǎng)度,lmax_ij表示節(jié)點(diǎn)i到節(jié)點(diǎn)j可能的最大路徑長(zhǎng)度.

    由于網(wǎng)絡(luò)的層級(jí)關(guān)系,節(jié)點(diǎn)i到節(jié)點(diǎn)j之間必定存在一條路徑為(節(jié)點(diǎn)i,中心節(jié)點(diǎn),節(jié)點(diǎn)j),此路徑為可能存在的最大的近似路徑,其距離公式為

    其中l(wèi)iCenter和lCenterj分別表示節(jié)點(diǎn)i到中心節(jié)點(diǎn)(Center)的距離和Center到節(jié)點(diǎn)j的路徑長(zhǎng)度.根據(jù)對(duì)稱性,節(jié)點(diǎn)i到節(jié)點(diǎn)j與節(jié)點(diǎn)j到節(jié)點(diǎn)i的路徑長(zhǎng)度相同.

    其中floor(i)表示節(jié)點(diǎn)i所在的層數(shù).由于中心層包括兩個(gè)節(jié)點(diǎn),所以在計(jì)算時(shí)統(tǒng)一為節(jié)點(diǎn)所在的層數(shù)減去1再加1.減1表示節(jié)點(diǎn)所在層數(shù)到中心層的路徑長(zhǎng)度,加1表示中心層兩個(gè)節(jié)點(diǎn)之間的路徑長(zhǎng)度.

    表7為經(jīng)過(guò)算法2的運(yùn)行結(jié)果后統(tǒng)計(jì)的網(wǎng)絡(luò)層數(shù)及各層包含的節(jié)點(diǎn)數(shù)量.根據(jù)(4),(5)式以及表7計(jì)算得到子網(wǎng)中各節(jié)點(diǎn)之間的最大距離的和為770350922065817,代入(3)式maxavg(l)=6.74.

    表7 子網(wǎng)結(jié)構(gòu)與節(jié)點(diǎn)數(shù)量Table 7.Subnet structure and quantity of nodes.

    假設(shè)每層節(jié)點(diǎn)到其他各層節(jié)點(diǎn)的最短距離為層數(shù)相減的絕對(duì)值,此時(shí),節(jié)點(diǎn)對(duì)之間的路徑長(zhǎng)度最短,有

    根據(jù)(6)式及表7中的數(shù)據(jù)可以求得子網(wǎng)節(jié)點(diǎn)間最小距離的和為125617583016439,將其代入(2)式可知最小近似平均最短路徑長(zhǎng)度minavg(l)為1.10.所以子網(wǎng)的實(shí)際平均最短路徑長(zhǎng)度處于(1.10,6.74)的開區(qū)間內(nèi),根據(jù)(1)式可計(jì)算得到網(wǎng)絡(luò)的近似平均最短路徑長(zhǎng)度為3.92,表明知識(shí)圖譜網(wǎng)絡(luò)中的實(shí)體平均經(jīng)過(guò)3.92個(gè)實(shí)體就可以到達(dá)任意實(shí)體的位置,概念圖譜網(wǎng)絡(luò)具有小世界的特性.相對(duì)于逐條匹配而言,以基于網(wǎng)狀拓?fù)浣Y(jié)構(gòu)進(jìn)行的知識(shí)搜索更為迅速.

    圖7是由NetworkX和本文方法計(jì)算的不同規(guī)模網(wǎng)絡(luò)的實(shí)際平均路徑RealAvg(l)和近似平均路徑AppAvg(l),n為節(jié)點(diǎn)數(shù)量.AppAvg(l)與RealAvg(l)變化趨勢(shì)相同,且隨網(wǎng)絡(luò)規(guī)模增加而減小,并穩(wěn)定在一個(gè)4左右的定值.我們計(jì)算了各規(guī)模網(wǎng)絡(luò)平均路徑的真實(shí)值與近似值比值的平均值,有RealAvg(l)≈ 1.1×AppAvg(l).

    圖7 平均路徑精確值、近似值與節(jié)點(diǎn)數(shù)的關(guān)系Fig.7.Relationships of RealAvg(l)and AppAvg(l)ton.

    根據(jù)隨機(jī)網(wǎng)絡(luò)平均最短路徑長(zhǎng)度的估算公式計(jì)算相同規(guī)模隨機(jī)網(wǎng)絡(luò)的平均最短路徑為L(zhǎng)random~ ln(N)/ln(k)=11.38,其中N是最大子網(wǎng)的節(jié)點(diǎn)數(shù),k=4.274是節(jié)點(diǎn)的平均度值,根據(jù)互聯(lián)網(wǎng)平均最短路徑長(zhǎng)度[16]公式,可以計(jì)算得〈i〉~0.35 +2.06×lgN=15.14,可知概念圖譜網(wǎng)絡(luò)的節(jié)點(diǎn)間的聯(lián)系比同等規(guī)模的隨機(jī)網(wǎng)絡(luò)和萬(wàn)維網(wǎng)節(jié)點(diǎn)間的聯(lián)系更緊密.此外,不同于互聯(lián)網(wǎng)平均最短路徑隨網(wǎng)絡(luò)規(guī)模的增大而增大,概念圖譜網(wǎng)絡(luò)的平均路徑隨網(wǎng)絡(luò)規(guī)模的增大反而減小,并最終趨近于一個(gè)4左右的定值.這一現(xiàn)象可能與概念圖譜的結(jié)構(gòu)有關(guān),為解釋此現(xiàn)象,對(duì)由算法2計(jì)算各閾值網(wǎng)絡(luò)最大子網(wǎng)時(shí)得到的網(wǎng)絡(luò)層次結(jié)構(gòu)進(jìn)行了統(tǒng)計(jì).表8是各閾值網(wǎng)絡(luò)由中心層擴(kuò)展時(shí)形成的層次結(jié)構(gòu)及各層包含的節(jié)點(diǎn)數(shù).

    從表8可以看出,這些閾值網(wǎng)絡(luò)與概念圖譜最大子網(wǎng)在結(jié)構(gòu)上十分相似,都形成了類似“菱形”結(jié)構(gòu):大量節(jié)點(diǎn)集中在中間靠前的網(wǎng)絡(luò)層,少量節(jié)點(diǎn)處于兩端的“邊緣”層.隨著網(wǎng)絡(luò)規(guī)模的增加,大量的節(jié)點(diǎn)更是集中在了前4層,表明大部分節(jié)點(diǎn)間經(jīng)由中心層節(jié)點(diǎn)經(jīng)過(guò)不超過(guò)4步就可到達(dá)彼此,可以一定程度地解釋概念圖譜網(wǎng)絡(luò)平均最短路徑隨著網(wǎng)絡(luò)規(guī)模增加而趨近于4左右這個(gè)定值的原因.概念圖譜反映的是知識(shí)間的聯(lián)系,可以將其看作人擁有的知識(shí).通常一個(gè)人掌握的知識(shí)越多,其由一個(gè)知識(shí)推理或搜索到另外一個(gè)知識(shí)的速度也就越快.

    4)聚類系數(shù):聚類系數(shù)C是所有節(jié)點(diǎn)聚類系數(shù)的平均值,描述網(wǎng)絡(luò)中節(jié)點(diǎn)的聚集情況,即網(wǎng)絡(luò)緊密性.

    對(duì)于度為1的節(jié)點(diǎn),計(jì)算其聚類系數(shù)沒有實(shí)際意義,為此在計(jì)算網(wǎng)絡(luò)的聚類系數(shù)前首先要剔除度值為1的節(jié)點(diǎn).在剔除度為1的節(jié)點(diǎn)后,最大子網(wǎng)還有5010477個(gè)節(jié)點(diǎn).由于我們只有記錄最大子網(wǎng)邊信息的三元組的文本文件GraphLink,如果對(duì)每個(gè)節(jié)點(diǎn)直接計(jì)算其聚類系數(shù),首先需要遍歷最大子網(wǎng)邊集合GraphLink得到該節(jié)點(diǎn)的鄰居節(jié)點(diǎn)集合,為此需調(diào)用3.3節(jié)中的GetNeighbor(Node,Graph)函數(shù),并將參數(shù)Graph替換為GraphLink;之后再次遍歷GraphLink得到鄰居節(jié)點(diǎn)集合中存在的邊的數(shù)量,為此需再次調(diào)用GetNeighbor(Node,Graph),此處也應(yīng)將Graph替換為GraphLink.參照3.4節(jié)中時(shí)間復(fù)雜度的分析,可知計(jì)算一個(gè)節(jié)點(diǎn)聚類系數(shù)的時(shí)間復(fù)雜度為以上兩個(gè)函數(shù)的時(shí)間復(fù)雜度之和,即2n+ 3.2n=5.2n,此處的n為GraphLink包含的邊數(shù)(32274033).由于需要計(jì)算聚類系數(shù)的節(jié)點(diǎn)數(shù)量為5010477,約為邊數(shù)的1/6,所以計(jì)算網(wǎng)絡(luò)的聚類系數(shù)的時(shí)間復(fù)雜度為5.2n×n×1/6 ≈ 0.867n2,時(shí)間復(fù)雜度仍較高,所以我們采用分段式計(jì)算方法.

    表8 不同閾值網(wǎng)絡(luò)的層次結(jié)構(gòu)及各層的節(jié)點(diǎn)數(shù)Table 8.Layer structure and node number in each layer.

    Nodeki表示度值為ki的節(jié)點(diǎn)的集合.根據(jù)度分布可知,度值越小,對(duì)應(yīng)的節(jié)點(diǎn)數(shù)量越大,設(shè)定閾值θ=100.

    對(duì)于度值大于θ的節(jié)點(diǎn)的集合Nodeki(ki=θ+1,θ+2,···,kmax,其中kmax表示節(jié)點(diǎn)的最大度值):先根據(jù)最大連通子網(wǎng)的邊集合GraphLink尋找到每個(gè)節(jié)點(diǎn)Nodej∈Nodeki的鄰居節(jié)點(diǎn)的集合Neighborjki然后遍歷GraphLink中的每一條邊,對(duì)Nodeki中的每個(gè)Nodej,判斷該邊的兩個(gè)端點(diǎn)是否都屬于Neighborjki,若是,則表示該邊是連接Nodej的兩個(gè)鄰居節(jié)點(diǎn)的邊.度值為ki的各個(gè)節(jié)點(diǎn)的鄰居節(jié)點(diǎn)間的邊數(shù)構(gòu)成邊數(shù)集合Edgeki,其存儲(chǔ)形式為k-value形式,如Edgeki={{Node1:edge1},{Node2:edge2},···,{Nodej:edgej}},其 中edgej為節(jié)點(diǎn)Nodej的鄰居節(jié)點(diǎn)間的邊數(shù).節(jié)點(diǎn)Nodej的聚類系數(shù)計(jì)算公式如下:

    其中Edgeki(Nodej)表示Edgeki中與Nodej對(duì)應(yīng)的edgej.

    對(duì)于度值小于等于θ的節(jié)點(diǎn)集合Nodeki(ki=1,2,···,θ):首先同上得到與度值ki對(duì)應(yīng)的Nodeki及Neighborjki(j=1,2,···,length(Nodeki)),其中l(wèi)ength(Nodeki)表示Nodeki中節(jié)點(diǎn)的數(shù)量;然后根據(jù)(Nodeki∪Neighborjki,j=1,2,···,length(Nodeki))從GraphLink中篩選與這些節(jié)點(diǎn)相關(guān)的邊,組成部分邊集合PartOfGraphki;再對(duì)PartOfGraphki中的每一條邊,對(duì)Nodeki的每個(gè)Nodej,判斷邊的兩個(gè)端點(diǎn)是否屬于Neighborjki,若是,則表示該邊是連接Nodej的兩個(gè)鄰居節(jié)點(diǎn)間的邊.得到度值ki對(duì)應(yīng)的Nodeki中各個(gè)節(jié)點(diǎn)Nodej的鄰居節(jié)點(diǎn)間的邊數(shù)構(gòu)成集合Edgeki,然后根據(jù)(7)式計(jì)算該集合中每個(gè)節(jié)點(diǎn)的聚類系數(shù).

    由于度值越小,節(jié)點(diǎn)數(shù)量越多,聚類系數(shù)就越難計(jì)算.在實(shí)驗(yàn)中,度值在2—10范圍內(nèi)的節(jié)點(diǎn)數(shù)占所有可計(jì)算聚類系數(shù)節(jié)點(diǎn)的89.66%,所以我們?cè)诙戎敌∮陂撝禃r(shí)引入Map/Reduce模式,將大型計(jì)算任務(wù)分解為多個(gè)小計(jì)算量任務(wù),然后同時(shí)進(jìn)行計(jì)算.對(duì)于度值相同的節(jié)點(diǎn)統(tǒng)一計(jì)算其聚類系數(shù),在計(jì)算時(shí)分別計(jì)算分子,分母只需要計(jì)算一次(分母是相同的).并且,此種計(jì)算模式在分析度-平均聚類系數(shù)時(shí)也十分方便.

    最大連通子網(wǎng)中聚類系數(shù)不為0的節(jié)點(diǎn)為1837431個(gè),占12.16%,由全部節(jié)點(diǎn)聚類系數(shù)計(jì)算得到的網(wǎng)絡(luò)聚類系數(shù)為0.0468;剔除度值為1的節(jié)點(diǎn)后計(jì)算得到的網(wǎng)絡(luò)聚類系數(shù)為0.1410.為了判斷網(wǎng)絡(luò)的小世界特性,計(jì)算了相同規(guī)模(節(jié)點(diǎn)數(shù)量和平均度相同)的隨機(jī)網(wǎng)絡(luò)的聚類系數(shù)Crandom~k/N=2.83×10—7,其中N=15114834為節(jié)點(diǎn)數(shù),k=4.274是網(wǎng)絡(luò)的平均度值[3].顯然概念圖譜網(wǎng)絡(luò)的聚類系數(shù)遠(yuǎn)大于Crandom,可知概念圖譜網(wǎng)絡(luò)中節(jié)點(diǎn)聚群現(xiàn)象比較明顯.圖8是度值與平均聚類系數(shù)的關(guān)系,可知低度值節(jié)點(diǎn)的聚類系數(shù)較大,高度值節(jié)點(diǎn)的聚類系數(shù)普遍較小.

    5)度相關(guān)性:度相關(guān)性描述的是節(jié)點(diǎn)之間根據(jù)度值作為相互之間連接的選擇偏好性,如度值為k的節(jié)點(diǎn)的鄰點(diǎn)平均度knn(k)隨k增加,表示度大的節(jié)點(diǎn)偏好連接其他度大的節(jié)點(diǎn),則網(wǎng)絡(luò)是正相關(guān)的;反之,如果knn(k)隨k而減小,表示度大的節(jié)點(diǎn)偏好連接度小的節(jié)點(diǎn),則網(wǎng)絡(luò)是負(fù)相關(guān)的.

    表9列出了部分度值和該度值對(duì)應(yīng)的所有節(jié)點(diǎn)的鄰點(diǎn)平均度,可知值最低的5個(gè)度其所有節(jié)點(diǎn)的鄰點(diǎn)平均度非常大,而值最高的5個(gè)度其所有節(jié)點(diǎn)的鄰點(diǎn)平均度相對(duì)而言卻非常小.

    將度值k和與度為k的所有節(jié)點(diǎn)的鄰點(diǎn)平均度knn的關(guān)系繪制成圖9,可以看出,knn隨著k的增大而減小,呈現(xiàn)負(fù)相關(guān)性,表明概念圖譜網(wǎng)中與高度值節(jié)點(diǎn)相連接的節(jié)點(diǎn)的度值偏低,與低度值節(jié)點(diǎn)相連接的節(jié)點(diǎn)的度值偏高.

    Newman[34]還給出了一種通過(guò)網(wǎng)絡(luò)節(jié)點(diǎn)度的Pearson相關(guān)系數(shù)r來(lái)判斷網(wǎng)絡(luò)相關(guān)性的量化方法,具體公式如下:

    其中M表示網(wǎng)絡(luò)的邊數(shù),ji和ki分別是第i條邊(i=1,2,···,M)的兩個(gè)端點(diǎn)的度值,r(—1≤r≤1)表示網(wǎng)絡(luò)相關(guān)性.經(jīng)計(jì)算可知概念圖譜最大連通子網(wǎng)的相關(guān)性為—0.067,網(wǎng)絡(luò)是負(fù)相關(guān)的,與度值的鄰點(diǎn)平均度分析結(jié)論相同.同時(shí),網(wǎng)絡(luò)的負(fù)相關(guān)性也保證了低度值節(jié)點(diǎn)可以與高度值節(jié)點(diǎn)相連,由于高度值節(jié)點(diǎn)可以連接到很多其他節(jié)點(diǎn),所以在應(yīng)用中可以實(shí)現(xiàn)推理過(guò)程.

    6)知識(shí)丟失對(duì)概念圖譜完整性的影響:用節(jié)點(diǎn)刪除模擬知識(shí)丟失,通過(guò)隨機(jī)刪除和定向刪除(度值由高到低)分別測(cè)試了不同閾值下較小規(guī)模概念圖譜網(wǎng)絡(luò)的完整性.圖10(a)是閾值為500的實(shí)驗(yàn)結(jié)果,x軸是節(jié)點(diǎn)刪除比,y軸是最大子網(wǎng)節(jié)點(diǎn)比例S,能夠一定程度上描述概念圖譜的完整性.隨機(jī)刪除對(duì)S影響很小,刪除80%以上的節(jié)點(diǎn)時(shí)S才接近0;定向刪除對(duì)S影響顯著,僅減少0.5%左右的節(jié)點(diǎn)時(shí)S就減少到了0.定向刪除下S的下降規(guī)律與computer network十分相似,快于同是無(wú)尺度網(wǎng)的BA網(wǎng)和科學(xué)合作網(wǎng)[35].

    表9 部分度的節(jié)點(diǎn)數(shù)與該度值的所有節(jié)點(diǎn)的鄰點(diǎn)平均度Table 9.Part ofNkandknn(k).

    圖9 度-鄰點(diǎn)平均度相關(guān)性分析Fig.9.Analysis of degree and average degree of neighbor nodes.

    圖10 知識(shí)丟失對(duì)概念圖譜完整性的影響Fig.10.Size of the giant component when nodes are removed.

    還測(cè)試了概念、實(shí)例、子概念丟失對(duì)概念圖譜完整性的影響,圖10(b)是隨機(jī)刪除1—140個(gè)三類節(jié)點(diǎn)時(shí)S的變化,可見子概念的丟失對(duì)圖譜完整性影響最大,其次是概念,最后是實(shí)例.為了分析以上現(xiàn)象,由度分布計(jì)算了各類節(jié)點(diǎn)的度期望值:概念節(jié)點(diǎn)的度期望為2.911,實(shí)例為1.899,子概念為36.214.也就是說(shuō)隨機(jī)刪除1個(gè)概念同時(shí)丟失約3條邊(知識(shí)之間的聯(lián)系);隨機(jī)刪除1個(gè)實(shí)例同時(shí)丟失不到2條邊,隨機(jī)刪除1個(gè)子概念,平均會(huì)減少約36條邊,因此子概念的丟失對(duì)網(wǎng)絡(luò)完整性影響最大.

    概念圖譜來(lái)源于數(shù)億用戶的搜索記錄,是反映人類對(duì)事物認(rèn)知的知識(shí)庫(kù).盡管每個(gè)人擁有的知識(shí)只是其中的一部分,但卻有類似的結(jié)構(gòu)特征.即最具體的實(shí)例對(duì)于掌握知識(shí)而言重要性最低,而抽象的概念或子概念更重要.現(xiàn)實(shí)世界中,若忘記了某個(gè)實(shí)例,比如忘記了3是prime number (素?cái)?shù)),只要掌握了prime number的概念,就可以推斷出3是prime number.但如果忘記的是概念或者子概念,如prime number,由3推理出prime number或其他素?cái)?shù)就非常困難.

    5 結(jié) 論

    本文運(yùn)用復(fù)雜網(wǎng)絡(luò)理論對(duì)由微軟概念圖譜所構(gòu)建的概念圖譜網(wǎng)絡(luò)進(jìn)行了分析.由于概念圖譜網(wǎng)絡(luò)中包含多個(gè)子網(wǎng)結(jié)構(gòu),提出了一種適合概念圖譜的最大子網(wǎng)抽取算法,實(shí)驗(yàn)表明對(duì)于節(jié)點(diǎn)數(shù)量龐大的概念圖譜網(wǎng)絡(luò),該算法在時(shí)間和空間上都優(yōu)于NetworkX.在進(jìn)行節(jié)點(diǎn)度分布分析時(shí)不但發(fā)現(xiàn)最大連通子網(wǎng)具有無(wú)標(biāo)度特性,還發(fā)現(xiàn)子概念在概念圖譜中扮演著連接其他節(jié)點(diǎn)的角色.82%的實(shí)例節(jié)點(diǎn)只與一個(gè)概念存在IsA關(guān)聯(lián),向我們揭示了實(shí)例詞在文本分析中通常不會(huì)因?yàn)橐辉~多義的原因?qū)е吕斫馍系钠缌x.為解決網(wǎng)絡(luò)規(guī)模巨大導(dǎo)致的計(jì)算困難,提出了一種近似網(wǎng)絡(luò)平均距離的計(jì)算方法,對(duì)比NetworkX和CDZ具有明顯優(yōu)勢(shì).分析表明概念圖譜網(wǎng)絡(luò)具有小世界特性,平均路徑隨網(wǎng)絡(luò)規(guī)模增加而減小并趨于定值4;概念圖譜網(wǎng)絡(luò)的“菱形”結(jié)構(gòu)揭示了平均路徑趨于定值4的根源;平均路徑隨網(wǎng)絡(luò)規(guī)模增加而減小這一現(xiàn)象與人類認(rèn)知和推理能力隨知識(shí)增加而提升這一現(xiàn)象一致.網(wǎng)絡(luò)聚類系數(shù)較大,網(wǎng)絡(luò)中節(jié)點(diǎn)的群聚現(xiàn)象較為明顯.根據(jù)度相關(guān)性的分析,可知網(wǎng)絡(luò)中與高度值節(jié)點(diǎn)相連接的節(jié)點(diǎn)的度值偏低,與低度值節(jié)點(diǎn)相連接的節(jié)點(diǎn)的度值偏高,度-平均度呈現(xiàn)負(fù)相關(guān),有利于實(shí)現(xiàn)概念圖譜中的知識(shí)推理;概念圖譜完整性對(duì)知識(shí)的隨機(jī)缺失不敏感且子概念對(duì)概念圖譜完整性的影響明顯高于概念和實(shí)例.

    考慮到概念圖譜的海量數(shù)據(jù),以上對(duì)全網(wǎng)特性的分析都沒有考慮關(guān)系的方向和關(guān)系的緊密程度(邊的長(zhǎng)度),在以后的工作中可以將關(guān)系的方向和邊長(zhǎng)引入概念圖譜網(wǎng)絡(luò)模型的構(gòu)建中,在此基礎(chǔ)上利用局部拓?fù)涮匦赃M(jìn)行概念圖譜的自動(dòng)補(bǔ)全研究.

    猜你喜歡
    度值子網(wǎng)實(shí)例
    一種簡(jiǎn)單子網(wǎng)劃分方法及教學(xué)案例*
    探討公路項(xiàng)目路基連續(xù)壓實(shí)質(zhì)量檢測(cè)技術(shù)
    子網(wǎng)劃分問題研究及應(yīng)用
    子網(wǎng)劃分的簡(jiǎn)易方法
    無(wú)線傳輸中短碼長(zhǎng)噴泉碼的度分布優(yōu)化算法*
    微博網(wǎng)絡(luò)較大度值用戶特征分析
    科技傳播(2016年17期)2016-10-10 01:46:58
    完形填空Ⅱ
    完形填空Ⅰ
    基于安全協(xié)議的虛擬專用子網(wǎng)研究
    河南科技(2014年16期)2014-02-27 14:13:04
    回轉(zhuǎn)類零件快速成本估算方法
    欧美在线一区亚洲| 一级毛片黄色毛片免费观看视频| 精品亚洲成国产av| 亚洲国产精品成人久久小说| 欧美少妇被猛烈插入视频| 国产精品成人在线| 久久国产精品大桥未久av| 国产一区有黄有色的免费视频| 水蜜桃什么品种好| 欧美精品av麻豆av| 操出白浆在线播放| 久久久久久亚洲精品国产蜜桃av| 亚洲国产av影院在线观看| 最新的欧美精品一区二区| 最新的欧美精品一区二区| 亚洲精品日韩在线中文字幕| 人妻一区二区av| 久久精品国产a三级三级三级| 成年人午夜在线观看视频| 国产人伦9x9x在线观看| 最黄视频免费看| 亚洲欧美精品自产自拍| a级片在线免费高清观看视频| 中文字幕制服av| 亚洲精品日本国产第一区| 黄色a级毛片大全视频| 桃花免费在线播放| 麻豆av在线久日| 成人免费观看视频高清| 日韩 欧美 亚洲 中文字幕| 妹子高潮喷水视频| 人妻人人澡人人爽人人| svipshipincom国产片| 日韩伦理黄色片| 高清黄色对白视频在线免费看| 男女床上黄色一级片免费看| 精品亚洲成国产av| 久久精品久久久久久久性| 丰满少妇做爰视频| 国产人伦9x9x在线观看| av片东京热男人的天堂| 又大又爽又粗| 如日韩欧美国产精品一区二区三区| 亚洲av日韩精品久久久久久密 | 制服诱惑二区| 最新在线观看一区二区三区 | 国产精品99久久99久久久不卡| 丰满饥渴人妻一区二区三| 国产一级毛片在线| 亚洲少妇的诱惑av| 在线观看免费视频网站a站| 岛国毛片在线播放| cao死你这个sao货| 操出白浆在线播放| 久久久国产一区二区| 50天的宝宝边吃奶边哭怎么回事| 一级毛片女人18水好多 | 日韩精品免费视频一区二区三区| 人妻一区二区av| 黑丝袜美女国产一区| 超色免费av| 亚洲av成人精品一二三区| 国产精品三级大全| 男男h啪啪无遮挡| 一二三四在线观看免费中文在| 欧美精品亚洲一区二区| 乱人伦中国视频| 久久av网站| 国产男女超爽视频在线观看| 天堂中文最新版在线下载| 91国产中文字幕| 国产成人欧美在线观看 | svipshipincom国产片| 脱女人内裤的视频| 国语对白做爰xxxⅹ性视频网站| 国产精品久久久久成人av| 欧美成人精品欧美一级黄| 成人午夜精彩视频在线观看| 欧美日韩亚洲综合一区二区三区_| 免费人妻精品一区二区三区视频| 自拍欧美九色日韩亚洲蝌蚪91| 成年人午夜在线观看视频| 欧美精品啪啪一区二区三区 | 精品久久久精品久久久| 黄色 视频免费看| 精品国产一区二区三区四区第35| 一二三四社区在线视频社区8| 你懂的网址亚洲精品在线观看| 99热国产这里只有精品6| 欧美久久黑人一区二区| 夜夜骑夜夜射夜夜干| 亚洲成人免费电影在线观看 | 只有这里有精品99| 国产成人av教育| 熟女少妇亚洲综合色aaa.| 黄片播放在线免费| 亚洲精品久久午夜乱码| 久久国产亚洲av麻豆专区| 好男人视频免费观看在线| 中文字幕av电影在线播放| 国产av国产精品国产| 无限看片的www在线观看| 亚洲欧美日韩另类电影网站| 久久久久久久国产电影| 新久久久久国产一级毛片| 青春草视频在线免费观看| 少妇精品久久久久久久| 久热这里只有精品99| 自线自在国产av| 天天躁夜夜躁狠狠躁躁| 国产亚洲av片在线观看秒播厂| 亚洲第一av免费看| 国产av一区二区精品久久| 国产一区二区激情短视频 | 热99久久久久精品小说推荐| 成人午夜精彩视频在线观看| 久热这里只有精品99| 18禁国产床啪视频网站| 人妻一区二区av| 男女免费视频国产| 国产成人精品久久二区二区91| 99香蕉大伊视频| 亚洲国产精品一区三区| 超碰成人久久| www.自偷自拍.com| 男女无遮挡免费网站观看| 成年人免费黄色播放视频| 少妇裸体淫交视频免费看高清 | 国产有黄有色有爽视频| 亚洲人成电影观看| 日韩大片免费观看网站| 久久99热这里只频精品6学生| 老司机亚洲免费影院| 丝袜在线中文字幕| 精品视频人人做人人爽| 99国产综合亚洲精品| 别揉我奶头~嗯~啊~动态视频 | 国产精品人妻久久久影院| 亚洲av片天天在线观看| 少妇粗大呻吟视频| 国产又色又爽无遮挡免| 亚洲av日韩在线播放| 超色免费av| 18禁裸乳无遮挡动漫免费视频| 欧美大码av| 国产精品久久久久成人av| 老司机在亚洲福利影院| 纯流量卡能插随身wifi吗| 男人添女人高潮全过程视频| 亚洲精品美女久久久久99蜜臀 | 丝袜脚勾引网站| 性色av一级| 国产欧美日韩一区二区三区在线| 伊人久久大香线蕉亚洲五| 男人添女人高潮全过程视频| 永久免费av网站大全| 日本vs欧美在线观看视频| 亚洲精品久久午夜乱码| 亚洲国产成人一精品久久久| 国产精品.久久久| 亚洲美女黄色视频免费看| 成人影院久久| 一边摸一边做爽爽视频免费| 赤兔流量卡办理| 天天躁夜夜躁狠狠久久av| 首页视频小说图片口味搜索 | 成人午夜精彩视频在线观看| 伊人亚洲综合成人网| 极品人妻少妇av视频| 免费一级毛片在线播放高清视频 | 免费看不卡的av| 永久免费av网站大全| 国产精品亚洲av一区麻豆| 99国产精品99久久久久| 老汉色∧v一级毛片| 国产91精品成人一区二区三区 | 丁香六月天网| 夫妻性生交免费视频一级片| 婷婷色综合大香蕉| 久久热在线av| 韩国高清视频一区二区三区| 国产精品国产av在线观看| 日本av手机在线免费观看| 少妇粗大呻吟视频| 视频在线观看一区二区三区| 一本综合久久免费| 国产精品国产av在线观看| 亚洲欧洲国产日韩| 国产精品99久久99久久久不卡| 黄色视频不卡| 国产高清videossex| 纯流量卡能插随身wifi吗| 亚洲欧美一区二区三区黑人| 高清不卡的av网站| 国产精品久久久人人做人人爽| 亚洲精品久久久久久婷婷小说| 日日摸夜夜添夜夜爱| 国产免费又黄又爽又色| 国产麻豆69| 国产黄色视频一区二区在线观看| 岛国毛片在线播放| 一边亲一边摸免费视频| 黑人巨大精品欧美一区二区蜜桃| 成人手机av| 最近手机中文字幕大全| 欧美日本中文国产一区发布| 啦啦啦在线观看免费高清www| 亚洲av综合色区一区| 久久人妻福利社区极品人妻图片 | 国产三级黄色录像| 午夜激情久久久久久久| av线在线观看网站| 亚洲美女黄色视频免费看| 无限看片的www在线观看| 亚洲,欧美,日韩| 成人国产av品久久久| 人人妻人人添人人爽欧美一区卜| 男人添女人高潮全过程视频| av片东京热男人的天堂| 国产高清视频在线播放一区 | 国产麻豆69| 99九九在线精品视频| 激情视频va一区二区三区| 一区二区日韩欧美中文字幕| 日韩人妻精品一区2区三区| 国产片内射在线| 韩国高清视频一区二区三区| 99国产精品免费福利视频| 久久免费观看电影| av又黄又爽大尺度在线免费看| 91精品伊人久久大香线蕉| 在线亚洲精品国产二区图片欧美| www.999成人在线观看| 亚洲五月婷婷丁香| 两个人看的免费小视频| 精品国产超薄肉色丝袜足j| 精品人妻在线不人妻| 男女下面插进去视频免费观看| 日韩制服骚丝袜av| 在线观看免费高清a一片| 国产成人系列免费观看| 别揉我奶头~嗯~啊~动态视频 | 国产精品麻豆人妻色哟哟久久| 欧美日韩视频精品一区| 国产日韩欧美视频二区| 交换朋友夫妻互换小说| 欧美性长视频在线观看| 看十八女毛片水多多多| 啦啦啦中文免费视频观看日本| 日韩精品免费视频一区二区三区| 少妇的丰满在线观看| 老司机靠b影院| 人成视频在线观看免费观看| 精品久久久精品久久久| 午夜福利免费观看在线| 亚洲精品av麻豆狂野| 亚洲精品久久成人aⅴ小说| 国产国语露脸激情在线看| 少妇 在线观看| 免费观看av网站的网址| 色播在线永久视频| 美女高潮到喷水免费观看| 久久久久精品国产欧美久久久 | 蜜桃在线观看..| 精品久久蜜臀av无| 国产亚洲av片在线观看秒播厂| 麻豆国产av国片精品| 一边摸一边抽搐一进一出视频| 国产三级黄色录像| 国产99久久九九免费精品| 80岁老熟妇乱子伦牲交| av网站在线播放免费| 亚洲伊人色综图| 成年人黄色毛片网站| 老司机在亚洲福利影院| 你懂的网址亚洲精品在线观看| 亚洲精品av麻豆狂野| 国产一卡二卡三卡精品| 男女边吃奶边做爰视频| 一区福利在线观看| 大码成人一级视频| 日韩制服丝袜自拍偷拍| 久9热在线精品视频| 少妇 在线观看| 国产成人精品久久久久久| 啦啦啦视频在线资源免费观看| 久久毛片免费看一区二区三区| 久久久久国产一级毛片高清牌| 18禁观看日本| av福利片在线| 欧美日韩亚洲高清精品| 波多野结衣一区麻豆| 久久国产精品影院| 国产成人精品无人区| 天天躁日日躁夜夜躁夜夜| 黄色视频不卡| 亚洲精品av麻豆狂野| 欧美激情 高清一区二区三区| 婷婷丁香在线五月| 国产日韩欧美在线精品| 欧美黄色淫秽网站| 亚洲国产精品国产精品| 亚洲国产av新网站| 亚洲av在线观看美女高潮| 婷婷色综合大香蕉| 久久久久久人人人人人| 国产熟女午夜一区二区三区| 国产无遮挡羞羞视频在线观看| 亚洲精品自拍成人| 国产亚洲av高清不卡| cao死你这个sao货| 亚洲精品日本国产第一区| 国产熟女欧美一区二区| 一本综合久久免费| 肉色欧美久久久久久久蜜桃| 超碰成人久久| 满18在线观看网站| 国产精品熟女久久久久浪| 波野结衣二区三区在线| 99九九在线精品视频| 大香蕉久久网| 日日夜夜操网爽| 99re6热这里在线精品视频| 欧美大码av| 精品人妻在线不人妻| 又粗又硬又长又爽又黄的视频| 丝袜喷水一区| 亚洲精品乱久久久久久| 国产又爽黄色视频| 高清av免费在线| 新久久久久国产一级毛片| 久久久精品国产亚洲av高清涩受| av线在线观看网站| 操美女的视频在线观看| 伊人久久大香线蕉亚洲五| 99精品久久久久人妻精品| 亚洲熟女毛片儿| 男女边摸边吃奶| 亚洲欧美中文字幕日韩二区| 精品福利永久在线观看| 午夜激情av网站| 国产精品久久久久久人妻精品电影 | 亚洲精品日韩在线中文字幕| 国产日韩欧美视频二区| 亚洲专区国产一区二区| 国产精品 国内视频| a级毛片黄视频| 在线看a的网站| 夜夜骑夜夜射夜夜干| 亚洲九九香蕉| 亚洲自偷自拍图片 自拍| 丝袜美腿诱惑在线| 老司机深夜福利视频在线观看 | 狂野欧美激情性xxxx| 十八禁高潮呻吟视频| 国产欧美日韩综合在线一区二区| 黑人巨大精品欧美一区二区蜜桃| 欧美精品一区二区免费开放| 少妇粗大呻吟视频| 亚洲av成人精品一二三区| 久久人人97超碰香蕉20202| 久久精品久久久久久噜噜老黄| 纯流量卡能插随身wifi吗| 最黄视频免费看| 999精品在线视频| 亚洲色图 男人天堂 中文字幕| 激情视频va一区二区三区| 亚洲五月婷婷丁香| 每晚都被弄得嗷嗷叫到高潮| 操出白浆在线播放| 日本五十路高清| av片东京热男人的天堂| 午夜影院在线不卡| 国产成人啪精品午夜网站| 国产淫语在线视频| 国产视频首页在线观看| 国产伦理片在线播放av一区| 人人妻人人添人人爽欧美一区卜| 人妻一区二区av| 人人澡人人妻人| 欧美黑人欧美精品刺激| 久久青草综合色| 亚洲精品一二三| 欧美久久黑人一区二区| 日本黄色日本黄色录像| 精品高清国产在线一区| 少妇裸体淫交视频免费看高清 | 建设人人有责人人尽责人人享有的| 视频在线观看一区二区三区| 国产精品一二三区在线看| 久久人妻熟女aⅴ| 男女国产视频网站| 少妇 在线观看| 啦啦啦 在线观看视频| 国产精品秋霞免费鲁丝片| 99久久99久久久精品蜜桃| 极品少妇高潮喷水抽搐| 欧美日韩成人在线一区二区| 无限看片的www在线观看| 久久久久精品人妻al黑| 欧美精品av麻豆av| 999久久久国产精品视频| 大型av网站在线播放| 亚洲 欧美一区二区三区| 久久人人97超碰香蕉20202| 成年人免费黄色播放视频| 少妇人妻久久综合中文| 老司机亚洲免费影院| 久久精品国产亚洲av涩爱| 免费不卡黄色视频| 久热爱精品视频在线9| 日韩av不卡免费在线播放| 国产日韩欧美视频二区| 99精品久久久久人妻精品| 欧美+亚洲+日韩+国产| e午夜精品久久久久久久| 搡老岳熟女国产| www.精华液| 宅男免费午夜| 久久青草综合色| 久久久国产精品麻豆| 亚洲国产欧美网| 免费观看av网站的网址| 狂野欧美激情性bbbbbb| 成人黄色视频免费在线看| 伊人久久大香线蕉亚洲五| 女人精品久久久久毛片| 国产主播在线观看一区二区 | 国产又色又爽无遮挡免| 亚洲色图综合在线观看| 香蕉丝袜av| 亚洲国产精品成人久久小说| 欧美亚洲 丝袜 人妻 在线| 久久精品久久久久久久性| 久9热在线精品视频| 久久精品国产a三级三级三级| 国产成人欧美在线观看 | 高清不卡的av网站| 你懂的网址亚洲精品在线观看| 亚洲午夜精品一区,二区,三区| 这个男人来自地球电影免费观看| 午夜视频精品福利| 欧美黄色淫秽网站| 国产午夜精品一二区理论片| 看免费av毛片| 少妇裸体淫交视频免费看高清 | 国产深夜福利视频在线观看| 自拍欧美九色日韩亚洲蝌蚪91| 久久毛片免费看一区二区三区| 日本av手机在线免费观看| 90打野战视频偷拍视频| 中文乱码字字幕精品一区二区三区| 老鸭窝网址在线观看| 一边摸一边抽搐一进一出视频| 又大又爽又粗| 亚洲专区中文字幕在线| 狂野欧美激情性xxxx| 亚洲人成网站在线观看播放| 国产99久久九九免费精品| 精品国产一区二区三区久久久樱花| 国产精品久久久久成人av| 1024视频免费在线观看| 午夜精品国产一区二区电影| 精品久久蜜臀av无| 国产伦理片在线播放av一区| 王馨瑶露胸无遮挡在线观看| 老鸭窝网址在线观看| 欧美日韩黄片免| 性少妇av在线| 80岁老熟妇乱子伦牲交| 中文字幕av电影在线播放| 国产亚洲精品久久久久5区| 少妇 在线观看| 别揉我奶头~嗯~啊~动态视频 | 大话2 男鬼变身卡| 一边摸一边做爽爽视频免费| 亚洲欧洲国产日韩| 国产精品香港三级国产av潘金莲 | 亚洲九九香蕉| 亚洲欧美日韩另类电影网站| 亚洲欧美成人综合另类久久久| 国产精品久久久av美女十八| 欧美久久黑人一区二区| 最近中文字幕2019免费版| 手机成人av网站| 午夜av观看不卡| 国产野战对白在线观看| 搡老乐熟女国产| 大香蕉久久网| 国产精品久久久久久精品电影小说| 欧美成狂野欧美在线观看| 亚洲av在线观看美女高潮| 国产激情久久老熟女| 国产在线视频一区二区| 老司机深夜福利视频在线观看 | 精品一区二区三区av网在线观看 | 亚洲欧美色中文字幕在线| 中国国产av一级| 国产精品一区二区在线观看99| 欧美国产精品va在线观看不卡| 亚洲人成电影观看| 十八禁高潮呻吟视频| 免费av中文字幕在线| 欧美日本中文国产一区发布| 欧美精品啪啪一区二区三区 | av片东京热男人的天堂| 午夜免费男女啪啪视频观看| 亚洲中文日韩欧美视频| 国产精品久久久久久人妻精品电影 | 亚洲情色 制服丝袜| 国产成人精品在线电影| 国产精品免费视频内射| 日韩伦理黄色片| 久久狼人影院| 啦啦啦视频在线资源免费观看| 亚洲一码二码三码区别大吗| 麻豆国产av国片精品| 国产精品麻豆人妻色哟哟久久| 搡老乐熟女国产| 国产男女超爽视频在线观看| 国产亚洲av高清不卡| 精品久久久久久电影网| 亚洲人成网站在线观看播放| 王馨瑶露胸无遮挡在线观看| 日韩大码丰满熟妇| 国产深夜福利视频在线观看| 男女国产视频网站| 国产男女超爽视频在线观看| 日韩一区二区三区影片| 成人国产av品久久久| 欧美+亚洲+日韩+国产| 午夜久久久在线观看| 国产欧美亚洲国产| 曰老女人黄片| 欧美日韩一级在线毛片| 午夜福利乱码中文字幕| 50天的宝宝边吃奶边哭怎么回事| 亚洲欧美一区二区三区黑人| 免费在线观看影片大全网站 | 极品少妇高潮喷水抽搐| 久久影院123| 99国产综合亚洲精品| 亚洲三区欧美一区| 一本色道久久久久久精品综合| 考比视频在线观看| 精品国产国语对白av| 最新的欧美精品一区二区| 精品人妻1区二区| 制服人妻中文乱码| 中文字幕人妻丝袜制服| 婷婷成人精品国产| 高清av免费在线| 看十八女毛片水多多多| 亚洲精品成人av观看孕妇| 两人在一起打扑克的视频| 国产伦理片在线播放av一区| 2021少妇久久久久久久久久久| 制服诱惑二区| 亚洲国产看品久久| 国产成人a∨麻豆精品| 男女边摸边吃奶| 亚洲少妇的诱惑av| 久久人人爽av亚洲精品天堂| 日本a在线网址| 午夜视频精品福利| 国产精品 欧美亚洲| videosex国产| 又紧又爽又黄一区二区| av片东京热男人的天堂| 在线精品无人区一区二区三| 国产精品熟女久久久久浪| 亚洲人成电影免费在线| 少妇被粗大的猛进出69影院| 丰满少妇做爰视频| 午夜av观看不卡| 精品一品国产午夜福利视频| 少妇猛男粗大的猛烈进出视频| 亚洲一区二区三区欧美精品| 韩国精品一区二区三区| 中国国产av一级| 成年美女黄网站色视频大全免费| 国产高清视频在线播放一区 | 真人做人爱边吃奶动态| 纵有疾风起免费观看全集完整版| 国产亚洲av高清不卡| 日韩伦理黄色片| 少妇精品久久久久久久| 国产成人啪精品午夜网站| av欧美777| 国产高清国产精品国产三级| 宅男免费午夜| 久久99热这里只频精品6学生| 五月开心婷婷网| 中文字幕精品免费在线观看视频| 你懂的网址亚洲精品在线观看| 老司机在亚洲福利影院| 亚洲色图 男人天堂 中文字幕| 狠狠精品人妻久久久久久综合| 99热网站在线观看| 午夜福利乱码中文字幕| 亚洲精品久久午夜乱码| 视频区欧美日本亚洲| 在现免费观看毛片| 亚洲激情五月婷婷啪啪| 999精品在线视频| 两人在一起打扑克的视频| 久久狼人影院| 青青草视频在线视频观看| 国产亚洲欧美在线一区二区| 高清欧美精品videossex| 一级片免费观看大全| 欧美日韩亚洲高清精品| 国产亚洲欧美精品永久| 国产在线视频一区二区| 久久久久网色|