• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于社會(huì)化問答社區(qū)涌現(xiàn)模式分析的領(lǐng)域熱點(diǎn)識(shí)別研究

    2021-03-15 07:53:30
    情報(bào)學(xué)報(bào) 2021年2期
    關(guān)鍵詞:分析方法研究

    于 晶

    (華東師范大學(xué)政治學(xué)系,上海 200241)

    1 引 言

    學(xué)科的前沿?zé)狳c(diǎn)代表著科技領(lǐng)域的關(guān)鍵核心問題和發(fā)展趨勢(shì)。科技發(fā)達(dá)國(guó)家對(duì)前沿?zé)狳c(diǎn)的研究都非常重視,我國(guó)政府也制定了鼓勵(lì)能夠引領(lǐng)未來發(fā)展的高技術(shù)領(lǐng)域的政策,并提出了建設(shè)世界一流大學(xué)和一流學(xué)科的教育發(fā)展戰(zhàn)略。因此,領(lǐng)域熱點(diǎn)的識(shí)別對(duì)于大到國(guó)家的科技發(fā)展戰(zhàn)略、突破技術(shù)封鎖、提升綜合競(jìng)爭(zhēng)力,小到科研工作者研究方向和研究問題的選擇,均具有重要的研究意義和應(yīng)用價(jià)值。

    領(lǐng)域熱點(diǎn)識(shí)別和趨勢(shì)分析是科技情報(bào)和文獻(xiàn)計(jì)量學(xué)領(lǐng)域的重要問題之一,得到了學(xué)者廣泛的關(guān)注?,F(xiàn)有研究主要基于正式發(fā)表的學(xué)術(shù)文獻(xiàn)數(shù)據(jù),利用文獻(xiàn)計(jì)量的方法進(jìn)行研究。黃曉斌等[1]將這類方法劃分為三種:基于引用關(guān)系的方法、基于文本內(nèi)容的方法和基于復(fù)合關(guān)系的方法。其中,基于引用關(guān)系的方法利用了文獻(xiàn)引用頻次或引文網(wǎng)絡(luò)展開研究[2-3];基于文本內(nèi)容的方法則使用了關(guān)鍵詞、摘要文本或者文獻(xiàn)全文,主要方法包括詞頻分析和文本主題分析等方法[4-6];更多領(lǐng)域熱點(diǎn)識(shí)別研究采用了將上述兩種方法相結(jié)合的復(fù)合關(guān)系方法[7-10]。除此之外,還有一些研究關(guān)注領(lǐng)域熱點(diǎn)分析相關(guān)的其他問題:文獻(xiàn)[3,10]側(cè)重于利用可視化的方法分析領(lǐng)域的趨勢(shì);文獻(xiàn)[11-12]則更關(guān)注領(lǐng)域發(fā)展趨勢(shì)的預(yù)測(cè),分別利用決策樹和回歸分析的方法來預(yù)測(cè)領(lǐng)域熱點(diǎn)的發(fā)展趨勢(shì)。

    基于文獻(xiàn)計(jì)量的方法能夠有效識(shí)別研究領(lǐng)域的前沿研究和熱點(diǎn),但是大多數(shù)研究?jī)H引用了正式發(fā)表的文獻(xiàn)數(shù)據(jù)。在科學(xué)研究過程之中,研究人員之間會(huì)通過多種途徑進(jìn)行交流。當(dāng)前,各種基于社交媒介的應(yīng)用層出不窮,這也成為研究人員進(jìn)行交流的重要方式。在所有的交流方式中,社會(huì)化問答社區(qū)由于其特殊的機(jī)制成為學(xué)術(shù)與技術(shù)人員集中交流的平臺(tái)。與基于文獻(xiàn)計(jì)量的方法相比,利用交流方式中產(chǎn)生的大規(guī)模交互與交流數(shù)據(jù)來識(shí)別領(lǐng)域研究的熱點(diǎn)和發(fā)展趨勢(shì),更容易檢測(cè)到研究人員的動(dòng)向和趨勢(shì),因而具有潛在的優(yōu)勢(shì)互補(bǔ)作用。現(xiàn)有研究中,盡管已經(jīng)有一些相關(guān)的探索,如文獻(xiàn)[13],但就整體而言還處于嘗試階段,缺乏更加深入的識(shí)別方法和有效性驗(yàn)證方法的研究。

    為了利用社會(huì)化問答社區(qū)中豐富的用戶交流數(shù)據(jù),本文提出一種基于涌現(xiàn)模式挖掘(emerging pattern mining)的研究領(lǐng)域熱點(diǎn)識(shí)別框架。該框架利用領(lǐng)域關(guān)鍵詞的組合(稱為模式)來表示研究的子域或子問題,利用涌現(xiàn)模式挖掘方法來分析熱點(diǎn)模式,從而識(shí)別出領(lǐng)域熱點(diǎn)并分析其發(fā)展趨勢(shì)。本文的主要貢獻(xiàn)包括三個(gè)方面。第一,提出利用在線問答社區(qū)中的用戶交互數(shù)據(jù)來識(shí)別領(lǐng)域中研究熱點(diǎn),并整合現(xiàn)有的Web 文本分析、涌現(xiàn)模式挖掘等方法給出一種具有較高可行性的解決方案;第二,針對(duì)領(lǐng)域熱點(diǎn)識(shí)別問題的獨(dú)特之處,提出利用模式聚類的方法將大量無意義低頻模式排除,較好地解決涌現(xiàn)模式挖掘中計(jì)算量大且結(jié)果中可能包含大量無意義模式的問題;第三,基于知乎社區(qū)(zhihu.com)的真實(shí)數(shù)據(jù)集進(jìn)行實(shí)驗(yàn),將實(shí)驗(yàn)結(jié)果與前沿研究相對(duì)比,從而驗(yàn)證了所提出的領(lǐng)域熱點(diǎn)識(shí)別框架的有效性。

    2 相關(guān)研究

    2.1 領(lǐng)域熱點(diǎn)識(shí)別

    傳統(tǒng)上,研究領(lǐng)域的熱點(diǎn)識(shí)別方法主要基于文獻(xiàn)計(jì)量學(xué)方法。結(jié)合文獻(xiàn)[1]的研究,本文將基于文獻(xiàn)計(jì)量的方法分為三種類型:基于引文分析的方法、基于文本的分析方法和基于語(yǔ)義的方法。

    基于引文分析的方法可分為:基于同被引分析的方法和基于引文網(wǎng)絡(luò)分析的方法?;谕灰治龅姆椒ㄖ饕梦墨I(xiàn)之間的同被引關(guān)系及被引頻次構(gòu)建評(píng)價(jià)指標(biāo),并結(jié)合聚類的方法來識(shí)別領(lǐng)域熱點(diǎn)或前沿研究問題。例如,Schiebel[3]利用來自地理學(xué)的二維或三維可視化方法來處理共被引網(wǎng)絡(luò)數(shù)據(jù),通過可視化的方法來識(shí)別領(lǐng)域熱點(diǎn)。基于引文網(wǎng)絡(luò)分析的方法根據(jù)文獻(xiàn)之間的引用關(guān)系構(gòu)建網(wǎng)絡(luò)結(jié)構(gòu),并進(jìn)一步結(jié)合網(wǎng)絡(luò)科學(xué)的分析方法來識(shí)別領(lǐng)域研究熱點(diǎn)。例如,Shibata 等[2]利用復(fù)雜網(wǎng)絡(luò)方法的多種網(wǎng)絡(luò)衡量指標(biāo),結(jié)合網(wǎng)絡(luò)節(jié)點(diǎn)聚類方法,對(duì)兩個(gè)領(lǐng)域的熱點(diǎn)識(shí)別進(jìn)行比較研究,認(rèn)為基于網(wǎng)絡(luò)拓?fù)涞姆治龇椒軌虻玫礁玫男Ч?/p>

    由于領(lǐng)域熱點(diǎn)識(shí)別不可避免地需要提取出表示領(lǐng)域的關(guān)鍵詞或主題詞,因此純粹使用基于引文分析方法的研究較少,更多的研究采用了詞頻分析或關(guān)鍵詞共現(xiàn)分析等基于文本分析的方法或者兩種方法的結(jié)合。Liao 等[4]利用2008—2017 年運(yùn)籌學(xué)和管理科學(xué)領(lǐng)域發(fā)表的ESI(Essential Science Indicators)高被引論文數(shù)據(jù)集,通過分析被引量最大的論文的關(guān)鍵詞來識(shí)別領(lǐng)域熱點(diǎn)。Xie[9]分別從國(guó)家、機(jī)構(gòu)、作者、期刊、文獻(xiàn)的角度,利用引文和共詞分析方法來識(shí)別重要的機(jī)構(gòu)、作者和文獻(xiàn),進(jìn)一步分析抗癌藥物領(lǐng)域的研究熱點(diǎn)。楊穎等[8]首先構(gòu)造關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)并進(jìn)行聚類,然后通過對(duì)高頻主題詞匯以及各類別中具有代表性文獻(xiàn)的解讀來識(shí)別領(lǐng)域研究熱點(diǎn)。

    基于文本的分析方法僅考慮關(guān)鍵詞的詞頻,而基于語(yǔ)義的方法則使用了基于機(jī)器學(xué)習(xí)的方法來挖掘文本內(nèi)容中的語(yǔ)義信息。例如,高盈盈等[12]使用了LDA(latent Dirichlet allocation)主題模型來識(shí)別領(lǐng)域關(guān)鍵詞。近年來,深度學(xué)習(xí)在自然語(yǔ)言處理領(lǐng)域迅速發(fā)展,其研究結(jié)果也被用于領(lǐng)域識(shí)別的研究之中。例如,阮光冊(cè)等[14]利用doc2vec[15]方法生成文檔向量進(jìn)行相似度計(jì)算,再通過聚類算法和主題詞提取算法識(shí)別領(lǐng)域熱點(diǎn);Asatani 等[16]利用網(wǎng)絡(luò)表示學(xué)習(xí)方法學(xué)習(xí)節(jié)點(diǎn)的表征信息,以及其隨著網(wǎng)絡(luò)變化的趨勢(shì),提出一個(gè)稱為IPY(intrinsic publica‐tion year)的指標(biāo),該指標(biāo)與文獻(xiàn)被引頻次之間存在著相關(guān)性,因此基于該指標(biāo)來檢測(cè)研究熱點(diǎn)及發(fā)展趨勢(shì)[17]。

    上述現(xiàn)有研究都僅利用了正式發(fā)表的學(xué)術(shù)文獻(xiàn)數(shù)據(jù)。本文與其最大的區(qū)別在于使用了社會(huì)化問答社區(qū)中科技工作者的交互數(shù)據(jù)來識(shí)別領(lǐng)域熱點(diǎn),并對(duì)其發(fā)展趨勢(shì)進(jìn)行量化分析。

    2.2 社會(huì)化問答社區(qū)

    根據(jù)關(guān)注的研究對(duì)象,可將社會(huì)化問答社區(qū)的相關(guān)研究分為平臺(tái)、用戶和信息三種類型。關(guān)于平臺(tái)方面的研究,主要關(guān)注社會(huì)化問答社區(qū)的管理與發(fā)展策略。例如,Srba 等[18]以Stack Overflow 為例,探究了社區(qū)的問題失敗率(被刪除或未回答的問題在所有新問題中所占的比例)上升的原因,并證實(shí)這一現(xiàn)象與越來越多的低質(zhì)量?jī)?nèi)容和社區(qū)中不受歡迎的用戶群體密切相關(guān)。關(guān)于用戶的研究則主要關(guān)注用戶的行為。例如,張寶生等[19]從知識(shí)共享的角度出發(fā),運(yùn)用經(jīng)典扎根理論研究用戶知識(shí)貢獻(xiàn)行為意向的影響因素;張穎等[20]探索了付費(fèi)問答社區(qū)中影響提問者問題選擇行為的因素,發(fā)現(xiàn)回答者的專業(yè)性、知名度以及信息服務(wù)質(zhì)量對(duì)提問者選擇行為有正向影響。關(guān)于信息方面的研究主要包括問答質(zhì)量評(píng)價(jià)[21]和用戶個(gè)性化信息推薦[22],或者對(duì)社區(qū)中的新問題進(jìn)行專家推薦[23]等方面的研究。

    現(xiàn)有在線社區(qū)的研究中也有一些關(guān)于熱點(diǎn)話題檢測(cè)的工作。利用已有信息預(yù)測(cè)社區(qū)的熱點(diǎn)話題、熱門趨勢(shì),這不僅利于平臺(tái)自身的管理決策,而且能夠?yàn)槠髽I(yè)帶來巨大的經(jīng)濟(jì)價(jià)值。Zhang 等[24]提出了一種熱點(diǎn)話題檢測(cè)方法,用于分析雅虎問答平臺(tái)的數(shù)據(jù)。該方法首先提取關(guān)鍵詞,然后對(duì)問答內(nèi)容進(jìn)行聚類,通過分析問題類型的頻次來對(duì)熱點(diǎn)趨勢(shì)進(jìn)行描述。Lu 等[25]也利用了聚類的方法來檢測(cè)在線社區(qū)中與健康相關(guān)的熱點(diǎn)話題。這些研究與本文研究有相似之處,均依賴于文本信息的提取;區(qū)別在于本文引入了涌現(xiàn)模式挖掘的方法,能夠從領(lǐng)域模式的角度識(shí)別領(lǐng)域熱點(diǎn)并對(duì)熱點(diǎn)趨勢(shì)進(jìn)行量化的分析。

    2.3 涌現(xiàn)模式挖掘

    涌現(xiàn)模式挖掘是一種數(shù)據(jù)挖掘任務(wù),其目標(biāo)是找到不同數(shù)據(jù)集中分布存在顯著差異的模式[26]。所挖掘的模式能夠通過可理解的形式來描述數(shù)據(jù)集之間關(guān)于模式相關(guān)屬性的新趨勢(shì)。涌現(xiàn)模式挖掘的方法主要有基于邊界的方法和基于樹的方法。如Dong 等[27]利用邊界的概念以無損的方式描述大量的EP 使得邊界僅由集合中的最小和最大EPS 組成,為挖掘結(jié)果提供了良好的結(jié)構(gòu),并減少挖掘結(jié)果集的大小?;跇涞乃惴ㄒ詷錉罱Y(jié)構(gòu)表示訓(xùn)練數(shù)據(jù),與基于邊界的方法相比,基于樹的算法效率較高?;跊Q策樹的方法允許直接處理數(shù)值屬性而不需要先前的離散化階段,如García-Borroto 等[28]從一組不同的決策樹中提取規(guī)律并進(jìn)行歸納。該方法可以獲得更少的判別規(guī)則,從而獲得更高的分類精度。

    涌現(xiàn)模式還可以進(jìn)一步分為跳躍涌現(xiàn)模式(jumping emerging patterns,JEP)、最小涌現(xiàn)模式(minimal emerging patterns,MinEP)、最大涌現(xiàn)模式(maximal emerging patterns, MaxEP) 等 多 種 類型[29]。MinEP 是最普遍的涌現(xiàn)模式,每個(gè)涌現(xiàn)模式的子模式不再是涌現(xiàn)模式;MaxEP 則相反,每個(gè)涌現(xiàn)模式的父模式不再是涌現(xiàn)模式。Kane 等[30]提出了最小跳躍涌現(xiàn)模式挖掘方法,能夠計(jì)算基本JEP 和top-kMinEP。Wang 等[31]提出了一種基于“重疊”或“交叉”的機(jī)制來利用MaxEP 特性,這種方法結(jié)合了貝葉斯方法和基于EP 的分類器的優(yōu)點(diǎn),具有更好的整體分類精度。

    涌現(xiàn)模式挖掘方法能夠衡量不同數(shù)據(jù)集中模式的差異,并識(shí)別出其中差異性比較顯著的模式。但是,其計(jì)算量都比較大,而且結(jié)果中容易現(xiàn)較多無意義的模式。本文從候選模式的構(gòu)建入手,首先利用關(guān)鍵詞的共現(xiàn)性進(jìn)行聚類,然后在聚類結(jié)果的基礎(chǔ)之上構(gòu)建候選模式集合。不但使計(jì)算量大大減小,而且能夠有效減少結(jié)果中的無意義模式。

    3 方 法

    3.1 領(lǐng)域熱點(diǎn)識(shí)別框架

    本文提出利用社會(huì)化問答社區(qū)中的用戶交互數(shù)據(jù),在不依賴文獻(xiàn)計(jì)量分析的情況下來識(shí)別領(lǐng)域研究熱點(diǎn)。解決該問題的思路主要依賴涌現(xiàn)模式分析方法對(duì)用戶的問答文本進(jìn)行挖掘,整體框架主要包含四個(gè)關(guān)鍵步驟:首先,需要從問答內(nèi)容中提取出與領(lǐng)域熱點(diǎn)相關(guān)的關(guān)鍵詞;其次,根據(jù)提取出的關(guān)鍵詞集合構(gòu)建潛在模式集合;再次,根據(jù)關(guān)鍵詞出現(xiàn)頻率及共現(xiàn)性識(shí)別涌現(xiàn)模式,從而識(shí)別領(lǐng)域的研究熱點(diǎn)及趨勢(shì);最后,需要對(duì)識(shí)別的效果進(jìn)行檢驗(yàn)或驗(yàn)證。

    本文提出的領(lǐng)域熱點(diǎn)識(shí)別框架如圖1 所示,下文中將對(duì)框架的各組成部分進(jìn)行詳細(xì)描述。

    圖1 領(lǐng)域熱點(diǎn)識(shí)別框架

    3.2 問答文本處理

    問答文本處理的核問題,是將文本內(nèi)容處理為結(jié)構(gòu)化的形式,并提取文本內(nèi)容中的領(lǐng)域關(guān)鍵詞。具體來說,需要將每條問答文本表示為領(lǐng)域關(guān)鍵詞的集合。其中,為第i條問答中的第j個(gè)領(lǐng)域關(guān)鍵詞;K為領(lǐng)域關(guān)鍵詞的集合。

    3.2.1 分 詞

    本研究中使用的分詞工具為pkuseg[32]。pkuseg是一個(gè)開源的多領(lǐng)域中文分詞工具包,支持細(xì)分領(lǐng)域分詞,從而有效提升了分詞的準(zhǔn)確度。此外,pkuseg 還可以很方便地使用自定義詞匯表。分詞工具所用的分詞模型通?;诖笠?guī)模文本數(shù)據(jù)集訓(xùn)練得到,一般情況下能夠得到較好的分詞效果。但是在各個(gè)科研領(lǐng)域中都存在大量的學(xué)術(shù)術(shù)語(yǔ),這些術(shù)語(yǔ)可能由多個(gè)詞所組成,分詞工具難以對(duì)其進(jìn)行準(zhǔn)確的切分。例如,術(shù)語(yǔ)“機(jī)器學(xué)習(xí)”,在領(lǐng)域熱點(diǎn)識(shí)別研究中需要將其識(shí)別為一個(gè)詞匯,但實(shí)際上絕大多數(shù)分詞工具將其切分為“機(jī)器”和“學(xué)習(xí)”兩個(gè)詞匯,失去了該術(shù)語(yǔ)所表達(dá)的含義。本研究基于領(lǐng)域的常用術(shù)語(yǔ)構(gòu)造領(lǐng)域詞典,將領(lǐng)域詞典作為自定義詞匯表,從而使得分詞工具能夠很好地識(shí)別這些術(shù)語(yǔ)。

    此外,社會(huì)化問答社區(qū)中的問答內(nèi)容中廣泛存在著多語(yǔ)言混合使用的現(xiàn)象。例如,在知乎中,問答內(nèi)容可能包含英文語(yǔ)句或段落,或者更普遍的情況是回答者直接在內(nèi)容中使用了英文的術(shù)語(yǔ)或縮寫。為了將這些術(shù)語(yǔ)包含在內(nèi),本文在構(gòu)建領(lǐng)域詞典的同時(shí)也給出了每個(gè)術(shù)語(yǔ)對(duì)應(yīng)的常見英文翻譯。在數(shù)據(jù)分析的過程中,將每個(gè)術(shù)語(yǔ)以及其對(duì)應(yīng)的一個(gè)或多個(gè)常見英文翻譯處理為同一個(gè)關(guān)鍵詞。

    3.2.2 領(lǐng)域關(guān)鍵詞提取

    經(jīng)過分詞的問答內(nèi)容,需要進(jìn)一步提取其中的領(lǐng)域關(guān)鍵詞。本文使用基于TF-IDF(term frequencyinverse document frequency)與支持度相結(jié)合的方法來提取領(lǐng)域關(guān)鍵詞。

    TF-IDF 是一種衡量詞匯在文檔集合中重要程度的方法。一般情況下,一個(gè)詞在一個(gè)文檔中出現(xiàn)的次數(shù)越多,該詞的重要性就越高。同時(shí),如果文檔集中出現(xiàn)該詞的文檔數(shù)量越多,就越說明該詞不包含特殊的信息,即重要性越低。

    對(duì)于文檔集D,出現(xiàn)在文檔中的所有詞匯構(gòu)成一個(gè)詞匯表L?;贚可以將任意文檔表示為長(zhǎng)度為|L|的向量,該向量的第j個(gè)元素表示詞匯表L中的第j個(gè)詞在該文檔中出現(xiàn)的次數(shù)。將給定詞匯j在文檔i中出現(xiàn)的次數(shù)與文檔總詞匯量的比值稱為詞頻(term frequency,TF),記為

    其中,IDFj表示詞匯j在文檔集中的逆文檔頻率。

    于是,文檔i中的詞匯j的TF-IDF 值為

    社會(huì)化問答社區(qū)中,領(lǐng)域關(guān)鍵詞的提取可以通過設(shè)定一個(gè)閾值δtf-idf,將每個(gè)文檔中的詞作為該文檔中的領(lǐng)域關(guān)鍵詞。實(shí)驗(yàn)表明,得到的領(lǐng)域關(guān)鍵詞集中包含了很多的相關(guān)性較低的詞匯。為了剔除這些詞匯,數(shù)據(jù)分析中需要進(jìn)一步剔除在文檔集中支持度較低的詞匯(即suppj>δw-supp),詞匯j的支持度定義為

    3.3 涌現(xiàn)模式識(shí)別

    社會(huì)化問答社區(qū)的文本內(nèi)容中包含了大量的領(lǐng)域關(guān)鍵詞,本研究的目的是根據(jù)這些領(lǐng)域關(guān)鍵詞的變化趨勢(shì)來識(shí)別領(lǐng)域識(shí)的熱點(diǎn)。研究中將每個(gè)領(lǐng)域關(guān)鍵詞看作一個(gè)項(xiàng)(item),多個(gè)領(lǐng)域關(guān)鍵詞構(gòu)成一個(gè)項(xiàng)集(item set)。一個(gè)項(xiàng)集可以被看作相應(yīng)研究領(lǐng)域中的一種模式,通過分析不同時(shí)間段內(nèi)模式的變化情況,可以識(shí)別其中的涌現(xiàn)模式[26],從而識(shí)別出該領(lǐng)域中的研究熱點(diǎn)。

    3.3.1 涌現(xiàn)模式的識(shí)別

    令F={f1,f2,…,fk}為領(lǐng)域關(guān)鍵詞的集合(或稱為項(xiàng)集)。其子集X?F稱為k項(xiàng)集,k=|X|。給定一組按時(shí)間順序排列的數(shù)據(jù)集D1,D2,…,一個(gè)項(xiàng)集X在文檔集Dt上的支度為

    表示模式X在該數(shù)據(jù)集中出現(xiàn)的頻率。X在Dt到Dt+1中支持度的變化情況用增長(zhǎng)率來衡量:

    如果模式X滿足則稱X為一個(gè)上升涌現(xiàn)模式(或上升模式);如果,則稱X為一個(gè)下降涌現(xiàn)模式(或下降模式),其中δe>1 為閾值。當(dāng)GrowthRage(X,Dt+1,Dt)= ∞時(shí),稱X為一個(gè)跳躍涌現(xiàn)模式(jumping emerging pattern),或跳躍模式[29]。上升模式或跳躍模式表示被關(guān)注越來越多的模式;下降模式則表示被關(guān)注越來越少的模式。社會(huì)化問答社區(qū)中領(lǐng)域熱點(diǎn)的識(shí)別,就是要找出問答內(nèi)容中的上升模式或跳躍模式。

    涌現(xiàn)模式挖掘算法的難點(diǎn),在于要從數(shù)量巨大的候選模式中,識(shí)別出滿足條件的涌現(xiàn)模式。假設(shè)要考慮的項(xiàng)(item)的數(shù)量為n,則理論上候選模式的數(shù)量為。以社會(huì)化問答社區(qū)領(lǐng)域熱點(diǎn)識(shí)別為例,若領(lǐng)域關(guān)鍵詞為20,則候選模式的數(shù)量高達(dá)1048555;而實(shí)際上,領(lǐng)域關(guān)鍵詞的數(shù)量遠(yuǎn)不止20,因此通過直接計(jì)算的方法識(shí)別涌現(xiàn)模式是不可行的。

    總之,現(xiàn)有的涌現(xiàn)模式挖掘算法都存在著計(jì)算復(fù)雜度高的問題。更重要的是,由于大規(guī)模問答數(shù)據(jù)集中存在的個(gè)性化表達(dá)、數(shù)據(jù)質(zhì)量參差不齊等因素,使得這類算法得到的涌現(xiàn)模式數(shù)量較大,而且其中相當(dāng)一部分是沒有意義或無法解釋的。因此,本文提出一種基于聚類的涌現(xiàn)模式識(shí)別方法:首先,利用關(guān)鍵詞在問答文檔中的共現(xiàn)性對(duì)關(guān)鍵詞進(jìn)行聚類;其次,在聚類結(jié)果的基礎(chǔ)之上,構(gòu)建候選模式。候選模式僅在每個(gè)類別內(nèi)部構(gòu)建。這樣,一方面排除了大量偶然出現(xiàn)的、無意義的候選模式;另一方面,使得候選模式的數(shù)量大大下降,甚至使得直接計(jì)算的方式就能夠有效的識(shí)別涌現(xiàn)模式。

    3.3.2 模式聚類

    領(lǐng)域熱點(diǎn)識(shí)別與普通的涌現(xiàn)模式挖掘問題存在著顯著的差異。首先,模式用于描述一個(gè)研究領(lǐng)域中較小的子領(lǐng)域或研究問題,在細(xì)粒度的層面上不需要很高的精確度。例如,模式{機(jī)器學(xué)習(xí), 深度學(xué)習(xí), 人工智能}與模式{深度學(xué)習(xí), 人工智能}在細(xì)粒度層面上是不同的模式,但是兩者所描述的子領(lǐng)域并沒有太大的差異。其次,一個(gè)研究領(lǐng)域中的關(guān)鍵詞數(shù)量較為龐大,但是子領(lǐng)域或研究問題的數(shù)量要少得多。最后,屬于同一個(gè)子領(lǐng)域的關(guān)鍵詞往往具有較高的語(yǔ)義相似度,而不同子領(lǐng)域中,使用的關(guān)鍵詞往往有著較大的差異?;陬I(lǐng)域熱點(diǎn)識(shí)別與普通的涌現(xiàn)模式挖掘問題的區(qū)別,就可以得到一個(gè)合理的推測(cè),即如果一個(gè)模式中出現(xiàn)了語(yǔ)義距離相距甚遠(yuǎn)的關(guān)鍵詞,那么就可以認(rèn)為該模式不是一個(gè)有意義的模式,因而也不會(huì)是涌現(xiàn)模式。本文利用模式聚類來實(shí)現(xiàn)這種思路,從而大大降低涌現(xiàn)模式識(shí)別的計(jì)算量。

    模式聚類的目的是根據(jù)關(guān)鍵詞在數(shù)集D=D1∪D2…中的共現(xiàn)性進(jìn)行聚類,將包含了不屬于同一類別的關(guān)鍵詞的模式排除在候選模式之外,從而使候選模式的數(shù)量顯著降低。

    關(guān)鍵詞集合F={f1,f2,…,fk}的共現(xiàn)矩陣表示為

    其 中, 第i行 第j列 元 素eij= |d:fi∈d∧fj∈d∧d∈D|表示關(guān)鍵詞fi和fk共同出現(xiàn)在數(shù)據(jù)集D中同一文檔的次數(shù)。

    直接將共現(xiàn)矩陣作為屬性矩陣對(duì)關(guān)鍵詞進(jìn)行聚類是不恰當(dāng)?shù)?,因?yàn)槔藐P(guān)鍵詞與其他關(guān)鍵詞的共現(xiàn)向量不能準(zhǔn)確的計(jì)算一對(duì)關(guān)鍵詞之間的距離[33]。由于兩個(gè)關(guān)鍵詞共現(xiàn)的次數(shù)越多兩者之間的距離越近,故可以將共現(xiàn)矩陣式(5)轉(zhuǎn)化為相似性矩陣:

    當(dāng)eij= 0 時(shí),sij= 0;當(dāng)eij≠0 時(shí),sij= 1/eij。

    相似性矩陣S是一個(gè)對(duì)稱矩陣,因此可以表示以關(guān)鍵詞為節(jié)點(diǎn)、以成對(duì)關(guān)鍵詞之間的相似性為權(quán)值所形成的無向加權(quán)網(wǎng)絡(luò)?;谠摼W(wǎng)絡(luò),容易利用最短路徑算法計(jì)算兩個(gè)節(jié)點(diǎn)之間的距離,從而得到任意兩個(gè)關(guān)鍵詞之間的距離所構(gòu)成的矩陣:

    其中,dij為關(guān)鍵詞fi與fj之間的距離。

    基于距離矩陣(7)可以利用層次聚類算法,以及類間距離的閾值δd將關(guān)鍵詞集合F聚類為

    其中,Ci={fi1,fi2,…}為第i個(gè)類別;fij表示第i個(gè)類別中的第j個(gè)關(guān)鍵詞。

    3.3.3 候選模式生成

    由于屬于不同類別的關(guān)鍵詞不太可能會(huì)出現(xiàn)在同一涌現(xiàn)模式之中,因此候選模式由屬于同一類別的關(guān)鍵詞組成:

    其中,Com(Ci)為第i個(gè)類別中任意一個(gè)或多個(gè)元素的組合(即候選模式)所構(gòu)成的集合。

    基于模式聚類所形成的候選模式數(shù)量大大下降,假設(shè)關(guān)鍵詞的數(shù)量為20,聚類得到4 個(gè)類別,則候選模式的數(shù)量由1048555 降為最優(yōu)情況下的104個(gè)。因此,可以認(rèn)為模式聚類是一種高效的剪枝方法。需要注意的是,這種方法的有效性需要滿足一定的條件,在其他涌現(xiàn)模式挖掘問題中的有效性要根據(jù)具體問題進(jìn)行分析。

    3.4 有效性驗(yàn)證

    本文利用卡方檢驗(yàn)和實(shí)際數(shù)據(jù)對(duì)比,對(duì)領(lǐng)域熱點(diǎn)識(shí)別框架的有效性進(jìn)行驗(yàn)證??ǚ綑z驗(yàn)用于對(duì)識(shí)別出的涌現(xiàn)模式,在不同時(shí)間段數(shù)據(jù)集Dt中,差異的顯著性進(jìn)行檢驗(yàn)。在實(shí)際數(shù)據(jù)對(duì)比中,將相關(guān)領(lǐng)域頂級(jí)國(guó)際會(huì)議上所發(fā)表的論文的主題與涌現(xiàn)模式識(shí)別結(jié)果進(jìn)行對(duì)比,以驗(yàn)證其有效性。

    4 實(shí) 驗(yàn)

    4.1 數(shù)據(jù)收集與處理

    本研究利用知乎社區(qū)中的問答內(nèi)容來驗(yàn)證上述領(lǐng)域熱點(diǎn)識(shí)別框架的有效性。為了便于對(duì)比分析,研究中選擇了知乎社區(qū)中的“機(jī)器學(xué)習(xí)”話題(https://www.zhihu.com/topic/19559450/hot),抓取了該話題下的“討論”和“精華”版塊的全部問答內(nèi)容。知乎社區(qū)是按照“話題—子話題”所構(gòu)成的樹狀結(jié)構(gòu)來組織問答內(nèi)容的。這些話題并非一成不變的,會(huì)隨著當(dāng)前研究熱點(diǎn)的變化而做出一定的改變,與領(lǐng)域內(nèi)容相關(guān)的工具、軟件、競(jìng)賽等話題也會(huì)不斷更新。其中,部分子話題可能會(huì)在多個(gè)父話題中重復(fù)出現(xiàn)。盡管子話題的劃分可能會(huì)變化,但隸屬于該話題的問答內(nèi)容有足夠的穩(wěn)定性,能夠滿足本文所提出的方法的需要。

    在本研究進(jìn)行期間,“機(jī)器學(xué)習(xí)”的子話題結(jié)構(gòu)樹中共有327 個(gè)子話題。經(jīng)過抓取后,去除重復(fù)問答內(nèi)容后,共得到2011 年2 月—2019 年11 月的4507 個(gè)提問及20669 個(gè)回答。由于提問內(nèi)容通常都非常短(平均長(zhǎng)度為25 個(gè)字符),下文的分析中將其排除在外,僅使用了回答的文本數(shù)據(jù)。這些數(shù)據(jù)在時(shí)間上的分布如圖2a 所示。本研究所獲取的數(shù)據(jù)截至2019 年11 月25 日,因此將2019 年數(shù)據(jù)用虛線表示。從圖2 中可知,知乎社區(qū)發(fā)展的早期(知乎于2010 年12 月上線)問答數(shù)量較少;自2014 年起“機(jī)器學(xué)習(xí)”話題中問答的數(shù)量快速增長(zhǎng)。因此,由于2011—2014 年數(shù)量過少,基于涌現(xiàn)模式的熱點(diǎn)識(shí)別主要針對(duì)2015—2019 年數(shù)據(jù)。

    在分析之前,還需要對(duì)數(shù)據(jù)加以清理,以避免冗余或無用數(shù)據(jù)對(duì)結(jié)果造成的影響。主要的清理內(nèi)容包括文本中所包含的HTML 文本以及無意義的符號(hào),如連續(xù)重復(fù)多次的“-”“_”“.”“=”“+”等符號(hào)。此外,過短的回答內(nèi)容中包含的信息量不足,因而也需要將其去除,下文的分析中除去了長(zhǎng)度小于50 的回答。清理后的數(shù)據(jù)量分布如圖2b 所示。

    圖2 數(shù)據(jù)量分布

    4.2 實(shí)驗(yàn)結(jié)果與分析

    4.2.1 領(lǐng)域關(guān)鍵詞提取結(jié)果

    基于公式(1)和公式(2)所示的方法,處理知乎社區(qū)“機(jī)器學(xué)習(xí)”話題中的回答內(nèi)容得到542 個(gè)領(lǐng)域關(guān)鍵詞(δtf-idf=0.25,δw-supp=10),經(jīng)過篩選后最終得到378 個(gè)領(lǐng)域關(guān)鍵詞。知乎問答內(nèi)容屬于用戶生成內(nèi)容(user generated content,UGC)的一種,而用戶生成內(nèi)容的特點(diǎn)就是語(yǔ)言使用靈活、不規(guī)則用法較多。特別地,在“機(jī)器學(xué)習(xí)”話題中大量出現(xiàn)中英文術(shù)語(yǔ)混合使用的情況。為了應(yīng)對(duì)這種情況,在分析中將重要的英文領(lǐng)域關(guān)鍵詞考慮在內(nèi)。例如,“卷積神經(jīng)網(wǎng)絡(luò)”的英文術(shù)語(yǔ)可以為“Convolu‐tional Neural Network”“Convolutional Networks”“CNN”等。這些不同形式的術(shù)語(yǔ)(包括中文術(shù)語(yǔ))具有相同的含義。為了避免數(shù)據(jù)稀疏性,需要將這些術(shù)語(yǔ)進(jìn)行分組處理。例如,將“卷積神經(jīng)網(wǎng)絡(luò)”“卷積網(wǎng)絡(luò)”“Convolutional Neural Network”“Con‐volutional Networks”“CNN”分為一個(gè)領(lǐng)域關(guān)鍵詞組。每個(gè)分組分配一個(gè)ID,同一分組中的關(guān)鍵詞具有相同的含義。

    知乎問答數(shù)據(jù)經(jīng)過處理后,本研究得到了230個(gè)領(lǐng)域關(guān)鍵詞組。接下來,將回答內(nèi)容中的已識(shí)別領(lǐng)域關(guān)鍵詞替換為其所屬的關(guān)鍵詞組的ID。基于領(lǐng)域關(guān)鍵詞組及替換后的數(shù)據(jù)集容易統(tǒng)計(jì)得到公式(5)的共現(xiàn)矩陣,進(jìn)一步處理得到公式(6)所示的230 ×230 的相似矩陣。

    相似矩陣表示以領(lǐng)域關(guān)鍵詞組為節(jié)點(diǎn),以相應(yīng)節(jié)點(diǎn)間的相似性為邊的網(wǎng)絡(luò)。其中,180 個(gè)節(jié)點(diǎn)是相互連通的構(gòu)成了整個(gè)網(wǎng)絡(luò)的最大連通子圖,如圖3 所示。其余50 個(gè)為孤立節(jié)點(diǎn),在后續(xù)分析中被作為獨(dú)立的候選模式。圖3 中,節(jié)點(diǎn)的大小與節(jié)點(diǎn)的度正相關(guān),即對(duì)應(yīng)的關(guān)鍵詞組共現(xiàn)的關(guān)鍵詞組數(shù)量;邊的寬度與對(duì)應(yīng)關(guān)鍵詞組對(duì)的共現(xiàn)頻次正相關(guān)。該圖同時(shí)也描述了關(guān)鍵詞組對(duì)之間的相似性,共現(xiàn)頻次大關(guān)鍵詞組對(duì)相似度越高,見公式(6)?;陉P(guān)鍵詞組對(duì)之間的相似性,在最大連通子圖上,利用最短路徑算法可得到任意兩個(gè)領(lǐng)域關(guān)鍵詞組之間的距離,構(gòu)成了如公式(7)所示的距離矩陣。該矩陣進(jìn)一步被用于對(duì)領(lǐng)域關(guān)鍵詞組進(jìn)行聚類。

    圖3 關(guān)鍵詞組共現(xiàn)網(wǎng)絡(luò)

    4.2.2 候選模式識(shí)別結(jié)果

    研究中使用層次聚類算法基于距離矩陣對(duì)關(guān)鍵詞組進(jìn)行聚類,實(shí)際上,相當(dāng)于依據(jù)關(guān)鍵詞對(duì)的相似性對(duì)圖3 所示的關(guān)鍵詞組共現(xiàn)網(wǎng)絡(luò)的節(jié)點(diǎn)進(jìn)行聚類。類間距的計(jì)算采用了ward 方法,即兩個(gè)聚類之間的距離定義為合并兩者造成的總離差平方和的減小數(shù)量[34]。影響聚類結(jié)果最關(guān)鍵的參數(shù)為下層聚類合并為上層聚類的類間距閾值δdist。本研究通過類間距閾值δdist與候選模式數(shù)量的關(guān)系來確定δdist的取值。如圖4a 所示,當(dāng)δdist>0.015 時(shí)候選模式的數(shù)量隨著δdist的增加急劇上升。將類間距閾值確定為δdist= 0.015,得到的候選模式數(shù)量為8411。

    候選模式集合中的絕大多數(shù)模式是無意義的模式,這些模式通常在問答內(nèi)容中極少出現(xiàn)。為了將這些無意義的模式排除在外以降低涌現(xiàn)模式識(shí)別的計(jì)算量,本研究進(jìn)一步將問答數(shù)據(jù)中出現(xiàn)頻率較低的模式排除在外,僅保留頻繁模式以供后續(xù)分析。模式頻率就是該模式在數(shù)據(jù)集上的支持度,見公式(3)。將模式支持度的閾值表示為δp-supp,頻繁模式是那些支持度高于該域值的模式。如圖4b 所示,隨著模式支持度域值δfreq的增加,頻繁模式數(shù)量迅速減少(除了2011—2013 年由于數(shù)據(jù)量太少而變化較?。?。而且,隨著δfreq的增加,頻繁模式數(shù)量減少的速度也快速降低。當(dāng)δfreq較小時(shí),各年度問答數(shù)據(jù)中頻繁模式數(shù)量差異較大;當(dāng)δfreq較大時(shí),頻繁模式數(shù)量差異較小。這說明頻繁模式對(duì)閾值δfreq的大小并不敏感,而非頻繁模式則對(duì)δfreq比較敏感。因此,可以合理的推測(cè),那些有意義的模式會(huì)被包含在頻繁模式之中,而無意義的模式由于出現(xiàn)頻率較低而被剔除。為了保留較多的頻繁模式用于涌現(xiàn)模式識(shí)別,本研究將頻率閾值設(shè)定為δfreq= 0.01。

    4.2.3 領(lǐng)域熱點(diǎn)識(shí)別結(jié)果

    基于頻繁模式的分析結(jié)果,利用公式(3)和公式(4)所示的涌現(xiàn)模式識(shí)別方法進(jìn)行領(lǐng)域熱點(diǎn)識(shí)別。公式(4)中的增長(zhǎng)率閾值定義為δe= 2,即一個(gè)頻繁模式在數(shù)據(jù)Db中支持度大于在數(shù)據(jù)Da中支持度的2倍或小于1/2 時(shí),則認(rèn)為該模式為涌現(xiàn)模式。由于涌現(xiàn)模式識(shí)別結(jié)果基于頻繁模式進(jìn)行分析,而頻繁模式數(shù)量已經(jīng)大大減少,所以涌現(xiàn)模式分析結(jié)果對(duì)δe不敏感。

    圖4 類間距閾值對(duì)候選模式數(shù)量的影響

    表1 所示的結(jié)果為2019 年問答數(shù)據(jù)與2015 年問答數(shù)據(jù)的分析結(jié)果,共包含表示領(lǐng)域熱點(diǎn)的模式18個(gè)。其中,上升模式11 個(gè),跳躍模式5 個(gè),下降模式2 個(gè)。從結(jié)果中可看出,機(jī)器學(xué)習(xí)領(lǐng)域的熱點(diǎn)幾乎都集中在深度學(xué)習(xí)相關(guān)的問題或方法之上。而以支持向量集為代表的傳統(tǒng)機(jī)器學(xué)習(xí)方法的關(guān)注度下降明顯,是一個(gè)顯著的下降模式??ǚ綑z驗(yàn)的結(jié)果也驗(yàn)證了在兩個(gè)數(shù)據(jù)集中這些領(lǐng)域?qū)?yīng)的模式具有顯著的差異。

    僅基于2015 年和2019 年數(shù)據(jù)無法判斷這些領(lǐng)域熱點(diǎn)發(fā)展過程中的趨勢(shì)變化情況。因此,本文利用2015—2019 年的全部數(shù)據(jù),對(duì)這些領(lǐng)域熱點(diǎn)的趨勢(shì)進(jìn)行了分析,結(jié)果如表2 所示。其中,增長(zhǎng)率大于1 表明上升趨勢(shì),小于1 則表明下降趨勢(shì)(見第3.3 節(jié))。大部分的領(lǐng)域熱點(diǎn)的熱度并非一直持續(xù)上漲,而是有所變化的。但是總體來看,所有的上升模式和跳躍模式都有著明顯的上升趨勢(shì),而下降模式則有著明顯的下降趨勢(shì)??ǚ綑z驗(yàn)結(jié)果也表明這些領(lǐng)域熱點(diǎn)模式的變化是顯著的。此外,領(lǐng)域熱點(diǎn)的趨勢(shì)也能夠表明方法的有效性。以“Bert”和“Transformer”為 例,“Transformer”是2017 年 由Google 提出的一種用于機(jī)器翻譯的模型;“Bert”是2018 年提出的一種基于“Transformer”的詞向量學(xué)習(xí)模型。這些都是基于深度學(xué)習(xí)的自然語(yǔ)言處理領(lǐng)域近幾年的突破性進(jìn)展。而表2 的趨勢(shì)分析中可以看出其分別在2017/2018 和2018/2019 數(shù)據(jù)中開始具有很大的增長(zhǎng)率,這表明知乎社區(qū)的“機(jī)器學(xué)習(xí)”話題能夠緊跟領(lǐng)域發(fā)展的趨勢(shì),而且這些趨勢(shì)能夠被基于涌現(xiàn)模式的方法所捕獲。

    為了進(jìn)一步驗(yàn)證熱點(diǎn)模式識(shí)別結(jié)果的有效性,本文還分析了相關(guān)領(lǐng)域重要會(huì)議上所發(fā)表的論文中這些熱點(diǎn)領(lǐng)域的變化情況。鑒于所識(shí)別出的熱點(diǎn)模式幾乎都來自深度學(xué)習(xí)相關(guān)領(lǐng)域(與實(shí)際情況一致),因此,本研究選擇該領(lǐng)域的頂級(jí)會(huì)議ICLR(International Conference on Learning Representations)作為分析對(duì)象。所用數(shù)據(jù)來自O(shè)penReview(https://openreview.net/)。2017—2018 年ICLR 會(huì)議接收的論文中,頻次最高的關(guān)鍵詞如表3 所示。這些關(guān)鍵詞與表1 和表2 所示的基于知乎社區(qū)的領(lǐng)域熱點(diǎn)識(shí)別結(jié)果高度重合,進(jìn)一步說明了本文提出的領(lǐng)域熱點(diǎn)識(shí)別框架的有效性。

    表1 2015/2019年領(lǐng)域熱點(diǎn)識(shí)別結(jié)果

    表2 2015—2019年領(lǐng)域熱點(diǎn)趨勢(shì)

    表3 ICLR高頻關(guān)鍵詞

    5 結(jié) 論

    本文提出了一種利用社會(huì)化問答社區(qū)中的用戶交互數(shù)據(jù)進(jìn)行研究領(lǐng)域熱點(diǎn)識(shí)別的框架。該框架將領(lǐng)域熱點(diǎn)看作由領(lǐng)域關(guān)鍵詞組成的模式利用涌現(xiàn)模式挖掘(emerging pattern mining)方法來識(shí)別領(lǐng)域熱點(diǎn),主要包括領(lǐng)域關(guān)鍵詞提取、關(guān)鍵詞聚類、候選模式構(gòu)建以及領(lǐng)域熱點(diǎn)模式識(shí)別等關(guān)鍵步驟。為了解決涌現(xiàn)模式挖掘方法計(jì)算量大、結(jié)果中容易出現(xiàn)較多無意義模式的問題,本文提出在領(lǐng)域關(guān)鍵詞聚類的基礎(chǔ)之上構(gòu)建候選模式。由于排除了大量包含了屬于不同類別的關(guān)鍵詞的低頻模式,從而大大降低了計(jì)算量和無意義模式出現(xiàn)的可能性。該框架能夠利用社會(huì)化問答社區(qū)中研究者的交互內(nèi)容來識(shí)別領(lǐng)域研究熱點(diǎn),因而相對(duì)于基于文獻(xiàn)計(jì)量的方法具有更好的時(shí)效性,對(duì)領(lǐng)域熱點(diǎn)趨勢(shì)的變化更加敏感。此外,該框架整合了已有的文本分析、涌現(xiàn)模式識(shí)別、網(wǎng)絡(luò)節(jié)點(diǎn)聚類等方法,易于拓展至其他類型的社交媒體熱點(diǎn)識(shí)別的應(yīng)用中。本文基于2011—2019 年知乎社區(qū)“機(jī)器學(xué)習(xí)”話題中用戶的問答內(nèi)容進(jìn)行實(shí)驗(yàn),驗(yàn)證了領(lǐng)域熱點(diǎn)識(shí)別框架的有效性。本文提出的分析框架不僅能用于識(shí)別領(lǐng)域研究熱點(diǎn),還能夠用于社交媒體中的勢(shì)點(diǎn)識(shí)別和趨勢(shì)分析、突發(fā)事件中的輿情走勢(shì)和討論熱點(diǎn)識(shí)別等問題,具有較廣泛的應(yīng)用價(jià)值。今后將繼續(xù)對(duì)本文提出的方法在這些相關(guān)問題中的適應(yīng)性展開研究。

    該分析框架還有一些不足之處:在關(guān)鍵詞提取階段為了提高關(guān)鍵詞提取質(zhì)量需要人工介入,增加了分析的工作量,并且引入了一定程度的不確定性。在后續(xù)研究中,將考慮利用基于深度學(xué)習(xí)的序列標(biāo)注方法來提取關(guān)鍵詞對(duì)該研究框架進(jìn)行完善。

    猜你喜歡
    分析方法研究
    FMS與YBT相關(guān)性的實(shí)證研究
    遼代千人邑研究述論
    隱蔽失效適航要求符合性驗(yàn)證分析
    視錯(cuò)覺在平面設(shè)計(jì)中的應(yīng)用與研究
    科技傳播(2019年22期)2020-01-14 03:06:54
    EMA伺服控制系統(tǒng)研究
    電力系統(tǒng)不平衡分析
    電子制作(2018年18期)2018-11-14 01:48:24
    電力系統(tǒng)及其自動(dòng)化發(fā)展趨勢(shì)分析
    可能是方法不對(duì)
    用對(duì)方法才能瘦
    Coco薇(2016年2期)2016-03-22 02:42:52
    四大方法 教你不再“坐以待病”!
    Coco薇(2015年1期)2015-08-13 02:47:34
    cao死你这个sao货| 婷婷六月久久综合丁香| 亚洲专区中文字幕在线| 好男人电影高清在线观看| 欧美又色又爽又黄视频| 丁香欧美五月| 国产伦精品一区二区三区视频9 | 亚洲激情在线av| 欧美zozozo另类| 成年免费大片在线观看| 国产精品99久久久久久久久| 美女大奶头视频| 嫩草影院精品99| 亚洲人成电影免费在线| 精品国内亚洲2022精品成人| 国产精品综合久久久久久久免费| 一二三四社区在线视频社区8| 这个男人来自地球电影免费观看| 久久国产精品人妻蜜桃| 亚洲成人免费电影在线观看| 亚洲熟妇中文字幕五十中出| 国产真实乱freesex| 久久午夜综合久久蜜桃| 日本黄大片高清| 宅男免费午夜| 男人和女人高潮做爰伦理| 人妻久久中文字幕网| 亚洲自偷自拍图片 自拍| 神马国产精品三级电影在线观看| 我要搜黄色片| 欧美中文综合在线视频| 亚洲中文字幕日韩| 波多野结衣高清作品| 国产成人影院久久av| 久久久久国产一级毛片高清牌| 亚洲中文日韩欧美视频| 亚洲乱码一区二区免费版| 国产精品爽爽va在线观看网站| 国产精品美女特级片免费视频播放器 | 亚洲精品在线美女| 国产午夜精品久久久久久| 麻豆成人午夜福利视频| 欧美最黄视频在线播放免费| 久久欧美精品欧美久久欧美| 亚洲av日韩精品久久久久久密| av女优亚洲男人天堂 | 成在线人永久免费视频| 国产精品亚洲av一区麻豆| 亚洲国产日韩欧美精品在线观看 | 久久中文字幕一级| 中出人妻视频一区二区| 天天一区二区日本电影三级| 丰满的人妻完整版| 香蕉国产在线看| 国产成人精品无人区| 禁无遮挡网站| 亚洲av成人精品一区久久| 午夜两性在线视频| 黄片小视频在线播放| 国产亚洲精品久久久com| 亚洲精品乱码久久久v下载方式 | 亚洲精品色激情综合| a在线观看视频网站| 伦理电影免费视频| 身体一侧抽搐| 叶爱在线成人免费视频播放| 亚洲av电影不卡..在线观看| 不卡av一区二区三区| 91av网一区二区| 亚洲欧美一区二区三区黑人| 国产精品 欧美亚洲| 网址你懂的国产日韩在线| 国内揄拍国产精品人妻在线| 亚洲成av人片免费观看| 欧美高清成人免费视频www| 最好的美女福利视频网| 久久亚洲真实| 日日夜夜操网爽| 国产爱豆传媒在线观看| 国产精品女同一区二区软件 | 亚洲,欧美精品.| 亚洲欧美日韩高清专用| 91在线观看av| 亚洲国产精品999在线| 嫩草影院精品99| 欧美丝袜亚洲另类 | 毛片女人毛片| 国产成人精品久久二区二区免费| 国产精品久久久av美女十八| 最近最新中文字幕大全免费视频| 日本一本二区三区精品| 神马国产精品三级电影在线观看| 色播亚洲综合网| 久久伊人香网站| av福利片在线观看| 女生性感内裤真人,穿戴方法视频| 亚洲人与动物交配视频| 久久久久国产精品人妻aⅴ院| avwww免费| 在线观看午夜福利视频| 国产激情欧美一区二区| 97人妻精品一区二区三区麻豆| 九九热线精品视视频播放| 青草久久国产| 欧美成狂野欧美在线观看| 亚洲avbb在线观看| 99久久成人亚洲精品观看| 亚洲专区字幕在线| 欧美三级亚洲精品| 91av网一区二区| 欧美黑人欧美精品刺激| a级毛片在线看网站| 麻豆成人午夜福利视频| 精品99又大又爽又粗少妇毛片 | 亚洲avbb在线观看| 成人精品一区二区免费| 三级男女做爰猛烈吃奶摸视频| 大型黄色视频在线免费观看| 美女午夜性视频免费| 欧美日韩中文字幕国产精品一区二区三区| 亚洲黑人精品在线| 午夜激情福利司机影院| 观看免费一级毛片| 手机成人av网站| 亚洲自拍偷在线| 听说在线观看完整版免费高清| 麻豆成人午夜福利视频| 可以在线观看的亚洲视频| 91字幕亚洲| 91av网一区二区| 久久久久久国产a免费观看| 免费观看的影片在线观看| 久久久久久久久免费视频了| 国产精品99久久久久久久久| 成人三级黄色视频| 亚洲av电影在线进入| 久99久视频精品免费| 高清在线国产一区| 在线a可以看的网站| 97碰自拍视频| 18禁国产床啪视频网站| 91久久精品国产一区二区成人 | 国产精品女同一区二区软件 | bbb黄色大片| 日日夜夜操网爽| 九九在线视频观看精品| 国产一区在线观看成人免费| 国产私拍福利视频在线观看| 精品国产美女av久久久久小说| 日韩欧美在线二视频| 国产97色在线日韩免费| 午夜日韩欧美国产| 欧美激情久久久久久爽电影| 亚洲 欧美 日韩 在线 免费| 五月伊人婷婷丁香| 亚洲av日韩精品久久久久久密| 久久九九热精品免费| 久久久国产成人精品二区| 天堂影院成人在线观看| 欧美日韩瑟瑟在线播放| av中文乱码字幕在线| 久久久久久国产a免费观看| 成年人黄色毛片网站| 黄色丝袜av网址大全| 老司机在亚洲福利影院| 国产不卡一卡二| 久久中文字幕人妻熟女| 午夜激情福利司机影院| 窝窝影院91人妻| 999精品在线视频| 香蕉av资源在线| 中国美女看黄片| 国产av一区在线观看免费| 欧美日韩精品网址| 99re在线观看精品视频| 嫩草影院入口| 国产精品亚洲美女久久久| 免费av毛片视频| 美女 人体艺术 gogo| 欧美日韩瑟瑟在线播放| 老汉色av国产亚洲站长工具| 欧美中文综合在线视频| 国产三级在线视频| 又大又爽又粗| 久久精品亚洲精品国产色婷小说| 一二三四社区在线视频社区8| 又爽又黄无遮挡网站| 黑人巨大精品欧美一区二区mp4| 欧美日韩中文字幕国产精品一区二区三区| 日韩欧美国产在线观看| 五月伊人婷婷丁香| 亚洲人与动物交配视频| 国产精品一区二区精品视频观看| 国产一区二区三区在线臀色熟女| 91老司机精品| 亚洲成人中文字幕在线播放| 亚洲色图 男人天堂 中文字幕| 好看av亚洲va欧美ⅴa在| 久久婷婷人人爽人人干人人爱| 亚洲国产色片| 国产精品亚洲一级av第二区| 日日干狠狠操夜夜爽| 啦啦啦观看免费观看视频高清| 亚洲乱码一区二区免费版| 男人的好看免费观看在线视频| 91九色精品人成在线观看| 久久精品国产清高在天天线| 色综合欧美亚洲国产小说| 精品国产超薄肉色丝袜足j| 嫩草影院精品99| 久久国产精品人妻蜜桃| 一区福利在线观看| 国内精品久久久久久久电影| 悠悠久久av| 男女之事视频高清在线观看| 亚洲av片天天在线观看| 国产av不卡久久| 成人亚洲精品av一区二区| 久久久久久人人人人人| 国产成人影院久久av| 国产熟女xx| 久久婷婷人人爽人人干人人爱| 精品无人区乱码1区二区| 黑人巨大精品欧美一区二区mp4| 舔av片在线| 国产 一区 欧美 日韩| 亚洲美女黄片视频| 无人区码免费观看不卡| 999精品在线视频| 日韩av在线大香蕉| 好看av亚洲va欧美ⅴa在| 岛国视频午夜一区免费看| 久久草成人影院| 12—13女人毛片做爰片一| 99国产精品一区二区蜜桃av| 国产精品亚洲美女久久久| 国产高清视频在线观看网站| 91麻豆av在线| 国产男靠女视频免费网站| 嫁个100分男人电影在线观看| 国产精品亚洲美女久久久| 一二三四社区在线视频社区8| 老司机午夜福利在线观看视频| 悠悠久久av| 狠狠狠狠99中文字幕| 国产激情欧美一区二区| 99久久精品热视频| 色综合欧美亚洲国产小说| 久久精品人妻少妇| 99在线视频只有这里精品首页| 成年版毛片免费区| 搡老妇女老女人老熟妇| 欧美日本视频| 国产一区二区在线av高清观看| 美女扒开内裤让男人捅视频| 一级a爱片免费观看的视频| 日韩有码中文字幕| 麻豆久久精品国产亚洲av| 99久久无色码亚洲精品果冻| 亚洲va日本ⅴa欧美va伊人久久| 亚洲av成人av| 观看免费一级毛片| avwww免费| 国产视频内射| 欧美又色又爽又黄视频| 女警被强在线播放| 人妻夜夜爽99麻豆av| 精品久久久久久久末码| 曰老女人黄片| 国产伦人伦偷精品视频| 一区二区三区国产精品乱码| АⅤ资源中文在线天堂| 淫妇啪啪啪对白视频| 久久这里只有精品中国| 91麻豆av在线| 搡老岳熟女国产| 国产成人av教育| 欧美三级亚洲精品| 麻豆av在线久日| 国产精品亚洲美女久久久| 女生性感内裤真人,穿戴方法视频| 日韩欧美国产在线观看| 在线永久观看黄色视频| 久久精品国产99精品国产亚洲性色| 不卡一级毛片| 18美女黄网站色大片免费观看| 又黄又粗又硬又大视频| 噜噜噜噜噜久久久久久91| 黑人欧美特级aaaaaa片| 精品国产美女av久久久久小说| www国产在线视频色| 国产乱人视频| 亚洲欧美日韩高清专用| 精品国产亚洲在线| 国产亚洲精品久久久com| 婷婷亚洲欧美| 亚洲黑人精品在线| 亚洲色图av天堂| 偷拍熟女少妇极品色| 人妻丰满熟妇av一区二区三区| 在线永久观看黄色视频| 伦理电影免费视频| 一进一出好大好爽视频| 国产精品永久免费网站| 男女做爰动态图高潮gif福利片| 欧美黄色淫秽网站| 国产野战对白在线观看| 国产69精品久久久久777片 | 国产亚洲欧美98| 亚洲 国产 在线| 变态另类丝袜制服| 天堂网av新在线| 久久天堂一区二区三区四区| 黄色丝袜av网址大全| avwww免费| 成年女人毛片免费观看观看9| av天堂在线播放| bbb黄色大片| 99久久久亚洲精品蜜臀av| 久久性视频一级片| 国产一区二区三区视频了| a级毛片在线看网站| 色老头精品视频在线观看| 欧美日韩乱码在线| 免费在线观看视频国产中文字幕亚洲| 国产伦人伦偷精品视频| 亚洲欧美日韩东京热| 俄罗斯特黄特色一大片| 又黄又粗又硬又大视频| 一个人免费在线观看电影 | 亚洲精华国产精华精| 岛国在线观看网站| 色播亚洲综合网| 亚洲国产精品合色在线| 欧美成人性av电影在线观看| 一本综合久久免费| 国内毛片毛片毛片毛片毛片| 亚洲自偷自拍图片 自拍| 俄罗斯特黄特色一大片| 久久久久久久久中文| 亚洲精品美女久久av网站| 精品一区二区三区av网在线观看| 国产精品一区二区三区四区久久| 天堂网av新在线| 欧美黑人欧美精品刺激| 欧美最黄视频在线播放免费| 日韩三级视频一区二区三区| 免费一级毛片在线播放高清视频| a级毛片a级免费在线| 亚洲 欧美一区二区三区| 中文字幕人妻丝袜一区二区| 成人一区二区视频在线观看| 麻豆国产97在线/欧美| 精品国内亚洲2022精品成人| 国产欧美日韩精品亚洲av| 两个人看的免费小视频| 天堂动漫精品| 成人一区二区视频在线观看| 国产欧美日韩精品亚洲av| 亚洲欧美日韩高清在线视频| 亚洲精品粉嫩美女一区| 国产精品电影一区二区三区| 90打野战视频偷拍视频| 国产精品亚洲美女久久久| 国产精品av久久久久免费| 9191精品国产免费久久| 91av网站免费观看| 亚洲自偷自拍图片 自拍| 黄频高清免费视频| 757午夜福利合集在线观看| 91在线精品国自产拍蜜月 | 亚洲国产看品久久| 国产精品永久免费网站| 美女高潮喷水抽搐中文字幕| 成人欧美大片| 舔av片在线| 欧美日韩国产亚洲二区| 欧美激情在线99| 欧美日韩精品网址| 桃红色精品国产亚洲av| 日韩欧美 国产精品| 国产淫片久久久久久久久 | 在线观看舔阴道视频| 嫩草影院精品99| 欧美日韩国产亚洲二区| 欧美在线一区亚洲| 亚洲熟女毛片儿| 毛片女人毛片| 男人舔女人的私密视频| 在线看三级毛片| 精品久久久久久,| 亚洲精品456在线播放app | 国产欧美日韩精品一区二区| 最近视频中文字幕2019在线8| 亚洲午夜理论影院| 日日干狠狠操夜夜爽| 亚洲色图av天堂| 一边摸一边抽搐一进一小说| 老汉色∧v一级毛片| 久99久视频精品免费| 此物有八面人人有两片| 日本黄色片子视频| 亚洲片人在线观看| 九色国产91popny在线| 亚洲熟妇中文字幕五十中出| 人人妻人人看人人澡| 国内毛片毛片毛片毛片毛片| 成年版毛片免费区| 久久性视频一级片| 成人国产一区最新在线观看| 又爽又黄无遮挡网站| 国产不卡一卡二| 黄色丝袜av网址大全| 美女高潮喷水抽搐中文字幕| 中文字幕高清在线视频| 制服丝袜大香蕉在线| 亚洲国产精品合色在线| 国模一区二区三区四区视频 | 国内精品久久久久久久电影| 亚洲成人精品中文字幕电影| 午夜成年电影在线免费观看| 中文字幕人妻丝袜一区二区| 亚洲av片天天在线观看| 最近最新中文字幕大全免费视频| 国产视频一区二区在线看| 亚洲成av人片免费观看| 波多野结衣高清无吗| 亚洲一区高清亚洲精品| 草草在线视频免费看| 制服人妻中文乱码| 日韩三级视频一区二区三区| 欧美日韩国产亚洲二区| 亚洲五月天丁香| 国产午夜福利久久久久久| 国产精品美女特级片免费视频播放器 | 国产不卡一卡二| 欧美国产日韩亚洲一区| 亚洲,欧美精品.| 丁香六月欧美| 精品免费久久久久久久清纯| 国产亚洲av高清不卡| 好男人在线观看高清免费视频| 97碰自拍视频| 精品日产1卡2卡| 国产精品一及| 中文字幕高清在线视频| 亚洲欧美日韩卡通动漫| 精品一区二区三区视频在线观看免费| 精品一区二区三区四区五区乱码| 午夜福利欧美成人| 国产aⅴ精品一区二区三区波| 19禁男女啪啪无遮挡网站| 国产亚洲精品一区二区www| 亚洲七黄色美女视频| 黑人巨大精品欧美一区二区mp4| 精品欧美国产一区二区三| 欧美又色又爽又黄视频| 亚洲国产中文字幕在线视频| 88av欧美| 好看av亚洲va欧美ⅴa在| 色播亚洲综合网| 欧美日韩黄片免| 午夜激情欧美在线| 啦啦啦免费观看视频1| 中文字幕最新亚洲高清| 国产精品日韩av在线免费观看| 欧美xxxx黑人xx丫x性爽| www日本在线高清视频| 在线观看午夜福利视频| 国产乱人视频| 成人亚洲精品av一区二区| 丰满人妻一区二区三区视频av | 免费在线观看视频国产中文字幕亚洲| www.www免费av| 一区二区三区高清视频在线| 国产69精品久久久久777片 | 欧美高清成人免费视频www| 国产成人精品久久二区二区91| 成人特级黄色片久久久久久久| 一进一出抽搐动态| 在线观看一区二区三区| 看免费av毛片| а√天堂www在线а√下载| 亚洲中文字幕日韩| 国产精品美女特级片免费视频播放器 | 久久久色成人| 亚洲精品一区av在线观看| 国产激情久久老熟女| 亚洲av成人av| 国产免费男女视频| 久久性视频一级片| 色在线成人网| 两个人看的免费小视频| 亚洲性夜色夜夜综合| 又黄又爽又免费观看的视频| 午夜福利视频1000在线观看| 国产三级在线视频| www.精华液| 亚洲精品粉嫩美女一区| 搞女人的毛片| 禁无遮挡网站| 亚洲avbb在线观看| 免费高清视频大片| 又黄又粗又硬又大视频| 嫁个100分男人电影在线观看| 日韩欧美国产一区二区入口| 国内久久婷婷六月综合欲色啪| АⅤ资源中文在线天堂| 757午夜福利合集在线观看| 免费观看的影片在线观看| 人人妻人人澡欧美一区二区| 伦理电影免费视频| 露出奶头的视频| 一二三四在线观看免费中文在| 18禁黄网站禁片午夜丰满| 国产精品久久久av美女十八| 精品一区二区三区av网在线观看| 免费大片18禁| 国产99白浆流出| 国产69精品久久久久777片 | 人人妻人人看人人澡| 天天躁日日操中文字幕| 精品电影一区二区在线| 一卡2卡三卡四卡精品乱码亚洲| 亚洲精品色激情综合| 国产成+人综合+亚洲专区| 男插女下体视频免费在线播放| 免费看a级黄色片| 久久午夜综合久久蜜桃| 国内毛片毛片毛片毛片毛片| 成年女人看的毛片在线观看| 国产97色在线日韩免费| 美女高潮喷水抽搐中文字幕| 超碰成人久久| av女优亚洲男人天堂 | xxx96com| 观看美女的网站| 999久久久精品免费观看国产| 色视频www国产| 99热只有精品国产| 久久久久久久久中文| 精品久久久久久久末码| 精品人妻1区二区| 午夜成年电影在线免费观看| 90打野战视频偷拍视频| 小说图片视频综合网站| 日本黄色片子视频| 国产精品一区二区三区四区久久| 757午夜福利合集在线观看| 99精品久久久久人妻精品| av欧美777| 中文字幕高清在线视频| 18禁裸乳无遮挡免费网站照片| 国产精品影院久久| 最新美女视频免费是黄的| 在线观看美女被高潮喷水网站 | 精品国内亚洲2022精品成人| 免费搜索国产男女视频| 国产精品久久久久久亚洲av鲁大| 制服人妻中文乱码| 性色av乱码一区二区三区2| 1000部很黄的大片| 日本三级黄在线观看| 最近视频中文字幕2019在线8| 亚洲中文字幕日韩| 中出人妻视频一区二区| 亚洲精品粉嫩美女一区| av福利片在线观看| 夜夜夜夜夜久久久久| 国产成年人精品一区二区| 欧美日韩瑟瑟在线播放| 国产麻豆成人av免费视频| 色综合亚洲欧美另类图片| 欧美日韩国产亚洲二区| 国产淫片久久久久久久久 | 熟女电影av网| 中出人妻视频一区二区| 国产精品日韩av在线免费观看| 又紧又爽又黄一区二区| 国产成人欧美在线观看| 女生性感内裤真人,穿戴方法视频| 免费av不卡在线播放| av片东京热男人的天堂| 国产欧美日韩精品亚洲av| h日本视频在线播放| 精品无人区乱码1区二区| 99热只有精品国产| 色老头精品视频在线观看| 中文字幕精品亚洲无线码一区| 黄片小视频在线播放| 亚洲国产精品合色在线| 精品无人区乱码1区二区| 美女高潮喷水抽搐中文字幕| 手机成人av网站| av片东京热男人的天堂| 亚洲精品美女久久av网站| 久久国产精品影院| www国产在线视频色| 久久久久久久午夜电影| 成人特级黄色片久久久久久久| 成熟少妇高潮喷水视频| 精品久久久久久久毛片微露脸| 国产极品精品免费视频能看的| 蜜桃久久精品国产亚洲av| 亚洲九九香蕉| 两个人的视频大全免费| 国产成人啪精品午夜网站| 久久中文字幕一级| 黄色 视频免费看| 伦理电影免费视频| 狠狠狠狠99中文字幕| 久久久久亚洲av毛片大全| 午夜精品一区二区三区免费看| 色精品久久人妻99蜜桃| 91av网一区二区|