• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    科學(xué)論文全文語(yǔ)步自動(dòng)識(shí)別研究

    2021-11-03 01:54:24歐石燕陳嘉文
    現(xiàn)代情報(bào) 2021年11期
    關(guān)鍵詞:機(jī)器學(xué)習(xí)深度學(xué)習(xí)

    歐石燕 陳嘉文

    關(guān)鍵詞:科學(xué)論文;語(yǔ)步識(shí)別;機(jī)器學(xué)習(xí);深度學(xué)習(xí)

    科學(xué)論文是科研人員分享研究成果、學(xué)習(xí)他人經(jīng)驗(yàn)的重要媒介。近年來(lái),隨著科學(xué)研究的飛速發(fā)展以及數(shù)字出版的普及,科學(xué)論文數(shù)量急劇增長(zhǎng)。與此同時(shí),科研人員的信息需求也變得越來(lái)越多元化和精細(xì)化。但是科學(xué)論文傳統(tǒng)的線性組織模式并不利于讀者快速理解論文的整體結(jié)構(gòu)和精準(zhǔn)定位論文中的特定信息,降低了讀者的閱讀效率,難以應(yīng)對(duì)海量科學(xué)論文的“轟炸”。在此背景下,一些學(xué)者開(kāi)始對(duì)科學(xué)論文的篇章結(jié)構(gòu)進(jìn)行研究,通過(guò)使用文本信息處理技術(shù)自動(dòng)識(shí)別出論文內(nèi)容的不同功能組成部分,以幫助讀者定位特定信息。但這些研究往往以章節(jié)或段落為單位[1-4],劃分粒度較粗,不能滿足讀者愈發(fā)精細(xì)的信息需求。

    1981年,密歇根大學(xué)的著名語(yǔ)言學(xué)家SwalesJM提出了語(yǔ)步分析法,其核心是通過(guò)分析文本局部的交際目的或修辭策略劃分文本的功能層次,并將具有特定交際功能和目的的文本片段稱作語(yǔ)步(Move),將實(shí)現(xiàn)語(yǔ)步的方法稱為步驟(Step)[5]。語(yǔ)步分析法從論文的交際意圖出發(fā)對(duì)科學(xué)論文進(jìn)行拆解,分析得到的語(yǔ)步結(jié)構(gòu)為理解科學(xué)論文的內(nèi)容提供了新的視角,具有提供細(xì)粒度文獻(xiàn)信息服務(wù)的潛能。然而語(yǔ)言學(xué)者們進(jìn)行的語(yǔ)步分析是一個(gè)費(fèi)時(shí)費(fèi)力的手動(dòng)過(guò)程,這限制了語(yǔ)步結(jié)構(gòu)更廣泛、深入的應(yīng)用。

    近年來(lái),隨著機(jī)器學(xué)習(xí)尤其是深度學(xué)習(xí)技術(shù)的不斷發(fā)展與突破,為以句子為單位的科學(xué)論文語(yǔ)步自動(dòng)識(shí)別提供了可能。因此,本文將在前人研究基礎(chǔ)上對(duì)科學(xué)論文正文的語(yǔ)步自動(dòng)識(shí)別方法進(jìn)行探索,采用傳統(tǒng)機(jī)器學(xué)習(xí)與深度學(xué)習(xí)技術(shù)構(gòu)建多種語(yǔ)步自動(dòng)識(shí)別模型并進(jìn)行比較分析,從而發(fā)現(xiàn)有效的語(yǔ)步自動(dòng)識(shí)別方法,并在此基礎(chǔ)上探索語(yǔ)步信息在文獻(xiàn)信息服務(wù)中的應(yīng)用模式。

    1相關(guān)研究

    科學(xué)論文的價(jià)值主要體現(xiàn)在其正文內(nèi)容上,因此對(duì)論文的內(nèi)容結(jié)構(gòu)進(jìn)行識(shí)別可有助于讀者快速理解論文內(nèi)容,并為進(jìn)一步的知識(shí)抽取及情報(bào)分析做準(zhǔn)備。早期對(duì)論文結(jié)構(gòu)的研究主要側(cè)重于識(shí)別粗粒度的結(jié)構(gòu)功能,即區(qū)分論文主要包含哪幾個(gè)部分,每部分都有著怎樣的語(yǔ)義功能。采用的識(shí)別方法多基于文本分類技術(shù),主要從章節(jié)標(biāo)題、段落結(jié)構(gòu)和文本內(nèi)容3個(gè)角度設(shè)計(jì)分類特征,使用支持向量機(jī)、條件隨機(jī)場(chǎng)等傳統(tǒng)機(jī)器學(xué)習(xí)算法來(lái)實(shí)現(xiàn),如陸偉等[1]、TeufelS等[6]的研究。近年來(lái)隨著深度學(xué)習(xí)的興起,有研究者開(kāi)始嘗試采用深度學(xué)習(xí)技術(shù)進(jìn)行論文結(jié)構(gòu)功能的自動(dòng)識(shí)別。譬如,王東波等采用雙向長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò)模型(Bi-LSTM)進(jìn)行識(shí)別,但可能因?yàn)閿?shù)據(jù)量不足,效果反而弱于傳統(tǒng)的機(jī)器學(xué)習(xí)技術(shù)[7];王佳敏等使用卷積神經(jīng)網(wǎng)絡(luò)模型(CNN)并結(jié)合章節(jié)標(biāo)題、章節(jié)段落和章節(jié)內(nèi)容等信息進(jìn)行識(shí)別,獲得了較好的識(shí)別效果[8]??茖W(xué)論文的結(jié)構(gòu)功能與語(yǔ)步在目的上有一定的共通之處,都是從語(yǔ)義角度對(duì)論文的內(nèi)容進(jìn)行劃分,但結(jié)構(gòu)功能關(guān)注的主要是論文的宏觀篇章結(jié)構(gòu),結(jié)構(gòu)簡(jiǎn)單且劃分粒度較粗。而且多數(shù)論文的結(jié)構(gòu)功能都是以段落為單位連續(xù)出現(xiàn),不同結(jié)構(gòu)功能極少存在交錯(cuò)出現(xiàn)的現(xiàn)象。相對(duì)而言,科學(xué)論文的語(yǔ)步結(jié)構(gòu)劃分粒度更細(xì)且更為復(fù)雜,語(yǔ)步的循環(huán)與交錯(cuò)在科學(xué)論文寫(xiě)作中經(jīng)常出現(xiàn)。

    對(duì)科學(xué)論文語(yǔ)步結(jié)構(gòu)進(jìn)行自動(dòng)識(shí)別的研究相對(duì)較少,且多數(shù)研究都只是針對(duì)論文摘要或者論文正文的引言部分。譬如,WuJC等[9]、SoonklangT[10]、王立非等[11]分別采用馬爾科夫模型、樸素貝葉斯、條件隨機(jī)場(chǎng)等傳統(tǒng)機(jī)器學(xué)習(xí)算法,張智雄等[12]采用全連接神經(jīng)網(wǎng)絡(luò)等深度學(xué)習(xí)算法,對(duì)論文摘要進(jìn)行了語(yǔ)步識(shí)別,取得了良好的識(shí)別效果。相對(duì)于結(jié)構(gòu)簡(jiǎn)單、篇幅短小的論文摘要,對(duì)論文正文進(jìn)行語(yǔ)步識(shí)別則更加困難。有部分學(xué)者首先對(duì)論文引言部分的語(yǔ)步結(jié)構(gòu)進(jìn)行了識(shí)別。譬如,AnthonyL等采用樸素貝葉斯算法識(shí)別出電氣和電子工程學(xué)科論文引言部分的3個(gè)語(yǔ)步[13],PendarN等[14]和CotosE等[15]采用支持向量機(jī)算法識(shí)別多個(gè)學(xué)科領(lǐng)域論文引言部分的語(yǔ)步,識(shí)別結(jié)果的宏平均F1值均達(dá)到65%以上。與摘要和引言這類概括性描述科學(xué)研究過(guò)程的文本相比,科學(xué)論文的全文蘊(yùn)含著更加詳細(xì)的科學(xué)研究信息,語(yǔ)步結(jié)構(gòu)也更加復(fù)雜,不同語(yǔ)步的交錯(cuò)和重復(fù)現(xiàn)象非常明顯。因此,在摘要和引言上效果較好的語(yǔ)步識(shí)別方法在全文中是否適用需要進(jìn)一步地探索。

    目前,對(duì)科學(xué)論文的整篇正文進(jìn)行語(yǔ)步識(shí)別的研究還非常少見(jiàn),在國(guó)內(nèi)僅有王末等采用深度學(xué)習(xí)中的BERT模型對(duì)科學(xué)論文中的11種科學(xué)核心概念(即類別)進(jìn)行了識(shí)別[16]。雖然科學(xué)核心概念(CoreScientificConcepts,簡(jiǎn)稱CoreSCs)模型與語(yǔ)步結(jié)構(gòu)有些類似,但并不能完全反映科學(xué)論文的交際功能。因此,科學(xué)論文正文的語(yǔ)步自動(dòng)識(shí)別還有待進(jìn)一步探索。

    2科學(xué)論文語(yǔ)步分類框架

    為了實(shí)現(xiàn)科學(xué)論文語(yǔ)步結(jié)構(gòu)的自動(dòng)識(shí)別,首先需要確立語(yǔ)步分類框架。鑒于不同學(xué)科領(lǐng)域的論文在語(yǔ)步結(jié)構(gòu)上存在較大差異,本研究只選取化學(xué)領(lǐng)域的英文科學(xué)論文作為語(yǔ)步識(shí)別對(duì)象。作為典型的以實(shí)驗(yàn)為基礎(chǔ)的學(xué)科領(lǐng)域,化學(xué)領(lǐng)域科學(xué)論文的寫(xiě)作通常比較規(guī)范,探索得到的語(yǔ)步自動(dòng)識(shí)別方法對(duì)其他學(xué)科領(lǐng)域?qū)嶒?yàn)型科學(xué)論文也具有較好的參考價(jià)值。

    為了確立化學(xué)領(lǐng)域科學(xué)論文的語(yǔ)步分類框架,首先從“英國(guó)皇家化學(xué)學(xué)會(huì)數(shù)據(jù)庫(kù)(TheRoyalSo?cietyofChemistry)”中隨機(jī)選取30篇科學(xué)論文,其中15篇論文作為分析樣本,通過(guò)對(duì)其正文內(nèi)容進(jìn)行歸納分析建立初始的語(yǔ)步分類框架,剩余的15篇論文作為驗(yàn)證樣本,通過(guò)標(biāo)注實(shí)驗(yàn)檢驗(yàn)初始分類框架的可靠性和全面性。在進(jìn)行樣本分析時(shí),嚴(yán)格采用SwalesJM提出的語(yǔ)步分析法[17]并參考了語(yǔ)言學(xué)者們?cè)谙嚓P(guān)領(lǐng)域科學(xué)論文中的語(yǔ)步分析結(jié)果[18],歸納出化學(xué)領(lǐng)域科學(xué)論文的初始語(yǔ)步分類框架。標(biāo)注實(shí)驗(yàn)則由兩名具有化學(xué)專業(yè)背景的編碼人員基于初始的語(yǔ)步分類框架對(duì)另外15篇論文中的每個(gè)句子進(jìn)行語(yǔ)步類別標(biāo)注。標(biāo)注結(jié)果的編碼一致性采用Kappa值衡量,該值達(dá)到0??81,說(shuō)明初始的語(yǔ)步分類框架具有較高的可靠性。此外,兩名標(biāo)注者在標(biāo)注過(guò)程中均沒(méi)有發(fā)現(xiàn)新的類別,說(shuō)明該分類框架較為全面。最終,確立了化學(xué)領(lǐng)域科學(xué)論文的語(yǔ)步分類框架,包含7個(gè)語(yǔ)步,如表1所示。

    3科學(xué)論文語(yǔ)步自動(dòng)識(shí)別方法

    為了實(shí)現(xiàn)科學(xué)論文語(yǔ)步的自動(dòng)識(shí)別,本研究從兩個(gè)角度來(lái)解決該問(wèn)題:一種是將語(yǔ)步識(shí)別看作是一個(gè)文本分類任務(wù),給論文中的每個(gè)句子賦予一個(gè)語(yǔ)步類別標(biāo)簽;第二種是將語(yǔ)步識(shí)別看作是一個(gè)序列標(biāo)注任務(wù),根據(jù)科學(xué)論文中語(yǔ)步出現(xiàn)的順序性,確定每個(gè)句子的語(yǔ)步類別標(biāo)簽。針對(duì)文本分類,分別采用傳統(tǒng)機(jī)器學(xué)習(xí)技術(shù)和深度學(xué)習(xí)技術(shù)來(lái)實(shí)現(xiàn);針對(duì)序列標(biāo)注,則主要采用條件隨機(jī)場(chǎng)(CRF)和雙向長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)(Bi-LSTM)相結(jié)合的方式來(lái)實(shí)現(xiàn)。

    3.1基于傳統(tǒng)機(jī)器學(xué)習(xí)的語(yǔ)步自動(dòng)識(shí)別

    基于傳統(tǒng)機(jī)器學(xué)習(xí)的分類算法首先需要將待分類文本(此處指句子)進(jìn)行向量化表示,通?;谙蛄靠臻g模型(VSM)將非結(jié)構(gòu)化的文本字符串轉(zhuǎn)換為結(jié)構(gòu)化的特征向量,這一過(guò)程涉及特征提取和特征選擇,被稱作特征工程。

    3.1.1特征提取

    在本研究中,根據(jù)語(yǔ)步分類的特點(diǎn),主要探索了詞匯、詞法、句法、位置這4類特征,此外也包括了句子中的引文標(biāo)記、句子所在章節(jié)的標(biāo)題等其他特征。

    1)詞匯特征:詞匯特征是指基于N-gram詞袋模型統(tǒng)計(jì)連續(xù)N個(gè)單詞在句子中出現(xiàn)的頻次。在本研究中,將N設(shè)為1~3,統(tǒng)計(jì)了Unigram、Bigram、Trigram3種詞頻。由于采用這種方式抽取的詞匯特征數(shù)量過(guò)多,因此只保留各自詞頻排名前2000的N-gram作為特征。

    2)詞法特征:詞法特征是指詞匯的詞性特征以及時(shí)態(tài)和語(yǔ)態(tài)特征,如動(dòng)詞的過(guò)去時(shí)態(tài)、進(jìn)行時(shí)態(tài)和被動(dòng)語(yǔ)態(tài),形容詞和副詞的比較級(jí)和最高級(jí)形式,人稱代詞,情態(tài)動(dòng)詞等。每種詞法特征均采用在句子中的出現(xiàn)頻次來(lái)表示。

    3)句法特征:句法特征是指詞與詞之間的依存關(guān)系特征。依存關(guān)系是一個(gè)句子中詞匯之間具有方向性的支配關(guān)系,如主謂關(guān)系、動(dòng)賓關(guān)系等,處于支配地位的詞被稱為核心詞,被支配的詞被稱為依存詞。詞匯之間不同類型依存關(guān)系在句子中出現(xiàn)的頻次可作為句法特征用于語(yǔ)步分類。

    4)位置特征:位置特征是指一個(gè)句子在科學(xué)論文中出現(xiàn)的位置,共包括3種:一種是句子在全文中的位置,直接以句子的序數(shù)除以正文中的句子數(shù)來(lái)表示;第二種是句子所屬段落在正文中的位置,以段落的序數(shù)除以正文中的段落數(shù)來(lái)表示;最后一種是句子在段落中的位置,以句子在段落中的序數(shù)除以段落中的句子總數(shù)來(lái)表示。

    5)其他補(bǔ)充特征:此外,句子中出現(xiàn)的引用標(biāo)記、圖說(shuō)明詞匯、表說(shuō)明詞匯、句子所屬章節(jié)的標(biāo)題詞匯也被作為補(bǔ)充特征。

    上述特征共有6089個(gè),全部采用獨(dú)熱編碼表示,基于向量空間模型表示為句子的特征向量,其中的各種頻次特征均通過(guò)TF-IDF算法進(jìn)行加權(quán)處理,從而更精確地反映其在句子和論文中的重要性。

    3.1.2特征選擇

    通過(guò)上述方法構(gòu)造的句子特征向量擁有較高的維度,甚至有可能包含噪音,會(huì)影響分類器的訓(xùn)練速度以及分類效果,因此需要對(duì)特征進(jìn)行篩選,對(duì)特征向量做降維處理。在本研究中,使用隨機(jī)森林模型來(lái)發(fā)現(xiàn)特征與類別之間的非線性關(guān)系,從而對(duì)特征重要性進(jìn)行排序[19],以此篩選出重要性較高的特征。其原理如下:采用隨機(jī)森林模型在訓(xùn)練多棵決策樹(shù)期間,針對(duì)每一棵樹(shù)會(huì)進(jìn)行一個(gè)數(shù)據(jù)抽樣,將抽樣的數(shù)據(jù)用于訓(xùn)練,而沒(méi)有被用于訓(xùn)練的數(shù)據(jù)則被稱為袋外數(shù)據(jù)(OutofBag,OOB);然后,對(duì)訓(xùn)練出的每一棵樹(shù)都選取它的袋外數(shù)據(jù)進(jìn)行分類預(yù)測(cè),并計(jì)算產(chǎn)生的數(shù)據(jù)誤差(記為errorOOB1);最后,將袋外數(shù)據(jù)的某一特征X加入決策樹(shù)進(jìn)行干擾,再次計(jì)算袋外數(shù)據(jù)誤差(記為errorOOB2),兩次的數(shù)據(jù)誤差即反映了特征X的重要性,如式(1)所示。

    3.1.3傳統(tǒng)機(jī)器學(xué)習(xí)分類算法

    在傳統(tǒng)機(jī)器學(xué)習(xí)分類算法中,選擇采用支持向量機(jī)與深度森林兩種算法來(lái)進(jìn)行語(yǔ)步自動(dòng)識(shí)別。支持向量機(jī)是一種在分類任務(wù)中經(jīng)常被使用的算法[20],其主要思想是通過(guò)在數(shù)據(jù)空間中尋找一個(gè)最優(yōu)超平面,使其不僅能將兩類數(shù)據(jù)分開(kāi),而且能使兩類數(shù)據(jù)中距離該超平面最近的點(diǎn)到超平面的距離最大化。深度森林算法是由南京大學(xué)ZhouZH等于2019年提出的一種集成學(xué)習(xí)算法[21],通過(guò)訓(xùn)練出多個(gè)弱分類器(即一系列隨機(jī)森林)并將它們進(jìn)行組合,進(jìn)而獲得一個(gè)更好、更全面的強(qiáng)分類器。

    3.2基于深度學(xué)習(xí)的語(yǔ)步自動(dòng)識(shí)別

    近年來(lái),隨著深度學(xué)習(xí)技術(shù)的發(fā)展,其被廣泛應(yīng)用于文本分類任務(wù)。深度學(xué)習(xí)復(fù)雜的網(wǎng)絡(luò)模型可以更好的表示文本隱含的語(yǔ)義信息,且省略了繁瑣的特征工程步驟,能夠?qū)崿F(xiàn)更高效、精確的文本分類。

    3.2.1文本向量化表示

    無(wú)論是傳統(tǒng)機(jī)器學(xué)習(xí)算法還是深度學(xué)習(xí)算法,都需要對(duì)文本進(jìn)行向量化表示。在傳統(tǒng)機(jī)器學(xué)習(xí)中,文本表示通常是基于詞的獨(dú)熱編碼,這種編碼方式有著明顯的缺點(diǎn):一方面,特征維度過(guò)高,向量矩陣太稀疏,不利于分類器的訓(xùn)練;另一方面,難以體現(xiàn)單詞之間的語(yǔ)義相關(guān)性,因此不能精確表示文本的語(yǔ)義。在深度學(xué)習(xí)中,通常采用詞的分布式表示,即將詞表示成一個(gè)定長(zhǎng)的、連續(xù)的稠密向量(即詞向量)。典型的詞向量訓(xùn)練方法是根據(jù)一個(gè)單詞出現(xiàn)的語(yǔ)境(即單詞的上下文)學(xué)習(xí)出該單詞的出現(xiàn)概率。在本研究中,使用Word2vec算法來(lái)訓(xùn)練針對(duì)化學(xué)領(lǐng)域科學(xué)論文的詞向量[22],然后將預(yù)處理后句子中的所有單詞的詞向量進(jìn)行拼接后作為句子的向量表示。

    3.2.2深度學(xué)習(xí)分類模型

    本研究中,采用3種深度學(xué)習(xí)模型來(lái)實(shí)現(xiàn)語(yǔ)步自動(dòng)識(shí)別,包括卷積神經(jīng)網(wǎng)絡(luò)(CNN)、長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)(LSTM)和BERT模型。這3種深度學(xué)習(xí)模型在文本分類任務(wù)中被公認(rèn)具有較好的效果。CNN的核心思想是通過(guò)卷積核來(lái)識(shí)別數(shù)據(jù)在空間上的局部特征,通過(guò)對(duì)多個(gè)局部特征的總結(jié)來(lái)認(rèn)識(shí)數(shù)據(jù)[23]。對(duì)于文本數(shù)據(jù),連續(xù)的單詞便是認(rèn)識(shí)文本的重要局部特征,CNN能夠?qū)@些局部特征進(jìn)行組合和篩選,獲得更深層次的語(yǔ)義信息。但是CNN的局部特征采樣過(guò)程忽略了文本的結(jié)構(gòu)位置信息,而循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)能夠以序列模式處理文本,從而更好地利用這些信息。LSTM是一種特殊結(jié)構(gòu)的RNN,相較于普通RNN可以解決長(zhǎng)期依賴關(guān)系[24]。但是,普通的LSTM只能捕捉由前到后的語(yǔ)義依賴關(guān)系,雙向長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)(Bi-LSTM)則通過(guò)將兩個(gè)方向相反的LSTM拼接,可以同時(shí)捕捉雙向的語(yǔ)義依賴關(guān)系。BERT模型是谷歌公司于2018年提出的多用途預(yù)訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型,可以在大規(guī)模語(yǔ)料上同時(shí)對(duì)詞間關(guān)系和句間關(guān)系進(jìn)行學(xué)習(xí),得到的模型具有高效表征語(yǔ)言語(yǔ)義的能力,可用于復(fù)雜的自然語(yǔ)言處理任務(wù)[25]。

    3.3基于混合模型的語(yǔ)步自動(dòng)識(shí)別

    深度學(xué)習(xí)模型使用復(fù)雜的網(wǎng)絡(luò)結(jié)構(gòu)自動(dòng)對(duì)文本內(nèi)容進(jìn)行特征抽取,較傳統(tǒng)機(jī)器學(xué)習(xí)中手工識(shí)別出的分類特征有著更好的語(yǔ)義表征能力。在語(yǔ)步識(shí)別任務(wù)中,除了句子本身的內(nèi)容外,其在論文中的位置、包含的引用標(biāo)簽、所在的章節(jié)標(biāo)題等特征也對(duì)語(yǔ)步識(shí)別有著重要價(jià)值,但這類結(jié)構(gòu)特征通常通過(guò)深度學(xué)習(xí)模型無(wú)法自動(dòng)獲得。因此嘗試將深度學(xué)習(xí)模型與傳統(tǒng)機(jī)器學(xué)習(xí)方法相結(jié)合,提出一個(gè)混合識(shí)別模型,如圖1所示。該模型采用深度學(xué)習(xí)方法獲得句子的深層語(yǔ)義特征,然后將其與傳統(tǒng)機(jī)器學(xué)習(xí)中手工識(shí)別出的句子結(jié)構(gòu)特征進(jìn)行拼接,以此獲得句子新的向量表示,最后采用傳統(tǒng)機(jī)器學(xué)習(xí)分類算法進(jìn)行語(yǔ)步分類。

    3.4基于序列標(biāo)注的語(yǔ)步自動(dòng)識(shí)別

    通過(guò)手工標(biāo)注,發(fā)現(xiàn)不同語(yǔ)步在一篇科學(xué)論文中的出現(xiàn)具有一定的順序,譬如M1(引出本文研究)語(yǔ)步通常出現(xiàn)在論文的開(kāi)始,M7(重塑研究空間)語(yǔ)步則往往出現(xiàn)在論文結(jié)尾。因此,也可以將語(yǔ)步識(shí)別看作是一個(gè)序列標(biāo)注任務(wù),在整篇科學(xué)論文中以句子為時(shí)間步進(jìn)行序列標(biāo)注。

    在本研究中,使用Bi-LSTM+CRF模型來(lái)實(shí)現(xiàn)科學(xué)論文的語(yǔ)步序列標(biāo)注,這是一種在序列標(biāo)注任務(wù)中被廣泛使用的模型。在前述的文本分類模式中,雖然也使用了Bi-LSTM模型,但關(guān)注的是句子中詞間的序列關(guān)系,每一個(gè)時(shí)間步的輸入是句子中每個(gè)詞匯的詞向量;在此處的序列標(biāo)注模式中,Bi-LSTM模型關(guān)注的是論文中句子間的序列關(guān)系,每個(gè)時(shí)間步的輸入是一篇論文中每個(gè)句子的向量表示。條件隨機(jī)場(chǎng)(CRF)是一種判別式概率模型[26],常用于分析序列數(shù)據(jù),主要關(guān)注相鄰數(shù)據(jù)之間的標(biāo)簽信息。通過(guò)在Bi-LSTM模型后連接一個(gè)CRF模型,可以既考慮本句文本與歷史文本信息,也考慮歷史語(yǔ)步信息。

    4實(shí)驗(yàn)與結(jié)果分析

    4.1數(shù)據(jù)準(zhǔn)備

    本研究的實(shí)驗(yàn)數(shù)據(jù)以開(kāi)源的ART數(shù)據(jù)集為來(lái)源[27],基于表1所示的語(yǔ)步分類框架重新進(jìn)行手工標(biāo)注后形成。ART數(shù)據(jù)集是由LiakataM等于2008年構(gòu)建的科學(xué)論文數(shù)據(jù)集,包含了225篇化學(xué)領(lǐng)域的研究性科學(xué)論文,均來(lái)自“英國(guó)皇家化學(xué)學(xué)會(huì)”出版的期刊,每篇論文均以句子為單位,采用科學(xué)核心概念(CoreSCs)模型進(jìn)行了標(biāo)注。Co?reSCs是由英國(guó)威爾士大學(xué)的LiakataM等于2012年提出的一個(gè)針對(duì)科學(xué)論文的篇章結(jié)構(gòu)模型[28],共包含11個(gè)科學(xué)核心概念數(shù)據(jù)(即類別),分別為背景、假設(shè)、模型、動(dòng)機(jī)、目的、對(duì)象、方法、實(shí)驗(yàn)、觀察、結(jié)果和結(jié)論。雖然CoreSCs模型和語(yǔ)步分類框架均是對(duì)科學(xué)論文的篇章結(jié)構(gòu)進(jìn)行劃分,但前者主要是從科學(xué)實(shí)驗(yàn)過(guò)程的角度進(jìn)行劃分,而后者主要是從交際意圖角度進(jìn)行劃分,兩個(gè)模型雖有一定區(qū)別,但兩者的類別在很大程度上存在著映射關(guān)系。因此,根據(jù)CoreSCs模型的標(biāo)注結(jié)果可以大大減輕語(yǔ)步標(biāo)注的難度。本研究邀請(qǐng)兩名編碼人員基于表1所示的語(yǔ)步分類框架對(duì)ART數(shù)據(jù)集重新進(jìn)行了標(biāo)注,在225篇論文的共33057個(gè)句子上獲得了0??86的Kappa值,說(shuō)明標(biāo)注結(jié)果具有很好的可靠性。對(duì)于標(biāo)注結(jié)果中的少量差異,則通過(guò)協(xié)商討論予以校正。最終標(biāo)注數(shù)據(jù)中不同語(yǔ)步的數(shù)量分布如表2所示。

    重新進(jìn)行語(yǔ)步標(biāo)注后的ART數(shù)據(jù)集中的句子按照82%∶8%∶10%的比例被劃分為訓(xùn)練集、驗(yàn)證集和測(cè)試集。訓(xùn)練集的數(shù)據(jù)主要用于分類器的訓(xùn)練;驗(yàn)證集的數(shù)據(jù)用于不同超參數(shù)條件下分類模型效果的比較;測(cè)試集的數(shù)據(jù)用于衡量語(yǔ)步識(shí)別模型最終的識(shí)別效果。

    4.2基于傳統(tǒng)機(jī)器學(xué)習(xí)的語(yǔ)步自動(dòng)識(shí)別實(shí)驗(yàn)結(jié)果

    在傳統(tǒng)機(jī)器學(xué)習(xí)中,首先需要進(jìn)行特征選擇來(lái)降低句子特征向量的維度。因此,使用基于Python語(yǔ)言的機(jī)器學(xué)習(xí)工具包Scikit-learn來(lái)實(shí)現(xiàn)隨機(jī)森林模型的訓(xùn)練,并基于該模型的結(jié)果對(duì)特征的重要性進(jìn)行排序。圖2展示了重要性排名前30的特征。

    由圖2可以看出,句子的相對(duì)位置、章節(jié)標(biāo)題詞匯、特定的詞法與語(yǔ)法組合、引用標(biāo)簽、句子中詞匯的依存關(guān)系等特征對(duì)于分類效果有較大貢獻(xiàn)。此外,一些單詞或短語(yǔ)也是識(shí)別語(yǔ)步的重要特征。

    接下來(lái),分別采用深度森林和支持向量機(jī)這兩個(gè)分類算法來(lái)訓(xùn)練語(yǔ)步識(shí)別分類器。深度森林算法采用開(kāi)源工具DeepForest來(lái)實(shí)現(xiàn),支持向量機(jī)算法則仍使用Scikit-learn工具包來(lái)實(shí)現(xiàn)。為了獲得最佳的特征數(shù)量,根據(jù)上述所得的特征重要性排序,以100為單位在句子向量表示中逐漸添加特征。分類效果的測(cè)試則采用常用的查準(zhǔn)率(Precision)、召回率(Recall)和F1值3個(gè)指標(biāo),并以宏平均作為7個(gè)類別(即語(yǔ)步)的整體識(shí)別效果。深度森林算法的超參數(shù)不需要過(guò)多設(shè)置,支持向量機(jī)算法主要調(diào)整的超參數(shù)則包括核函數(shù)、核函數(shù)參數(shù)及懲罰系數(shù)。兩種分類算法在不同特征數(shù)量下的分類效果如圖3所示。

    通過(guò)圖3可以看出,當(dāng)特征數(shù)量為100時(shí),兩種分類算法的效果相差不多,宏平均F1值均在59%左右;當(dāng)特征數(shù)量增加到200時(shí),兩個(gè)分類算法的效果都有了相應(yīng)的提高,但深度森林算法的效果此時(shí)已經(jīng)明顯優(yōu)于支持向量機(jī)算法;隨著特征數(shù)量的繼續(xù)增加,支持向量機(jī)算法的分類效果趨于穩(wěn)定,宏平均F1值約為59%,新特征的加入對(duì)于分類效果影響甚微;而深度森林算法的分類效果隨著特征數(shù)增加仍在進(jìn)一步提升,在特征數(shù)量為600左右時(shí),分類效果出現(xiàn)了一些波動(dòng),當(dāng)特征數(shù)量為1100時(shí)效果最好,宏平均F1值約為66%。由此可以看出,深度森林算法的整體分類效果始終優(yōu)于支持向量機(jī)算法,說(shuō)明這種集成學(xué)習(xí)算法在處理高維數(shù)據(jù)時(shí)具有明顯優(yōu)勢(shì)。

    4.3基于深度學(xué)習(xí)的語(yǔ)步自動(dòng)識(shí)別實(shí)驗(yàn)結(jié)果

    在本研究中,采用Word2vec算法中的Skipgram模型在ART數(shù)據(jù)集中的全部225篇論文上訓(xùn)練詞向量,Word2vec算法使用自然語(yǔ)言處理Py?thon工具包Gensim來(lái)實(shí)現(xiàn),訓(xùn)練時(shí)上下文窗口大小設(shè)置為10,詞向量維度設(shè)置為200。CNN模型則具體使用KimY于2014年提出的專門針對(duì)文本的卷積神經(jīng)網(wǎng)絡(luò)TextCNN模型[29]。TextCNN模型和Bi-LSTM模型均基于神經(jīng)網(wǎng)絡(luò)計(jì)算框架Pytorch來(lái)實(shí)現(xiàn)。BERT模型則使用專為科學(xué)論文訓(xùn)練的SciBERT模型[30],但在語(yǔ)步分類時(shí)需要對(duì)最后幾層網(wǎng)絡(luò)的參數(shù)進(jìn)行重新調(diào)整。3種深度學(xué)習(xí)算法在測(cè)試集上的語(yǔ)步識(shí)別結(jié)果如表3所示。

    根據(jù)表3中的實(shí)驗(yàn)結(jié)果可以看出,BERT模型的語(yǔ)步識(shí)別效果最好,宏平均F1值達(dá)到了66%,Bi-LSTM模型次之,宏平均F1值為62%,CNN模型的識(shí)別效果最差,只有59%。

    4.4基于混合模型的語(yǔ)步識(shí)別實(shí)驗(yàn)結(jié)果

    經(jīng)過(guò)上文實(shí)驗(yàn)發(fā)現(xiàn),在傳統(tǒng)機(jī)器學(xué)習(xí)算法中深度森林模型的識(shí)別效果最好;在深度學(xué)習(xí)算法中BERT模型效果最好。因此,將BERT模型和深度森林算法進(jìn)行融合,利用文本分類模式進(jìn)行語(yǔ)步自動(dòng)識(shí)別。首先,利用BERT模型預(yù)訓(xùn)練得到每個(gè)句子的深層語(yǔ)義特征,然后將其與人工識(shí)別的1100個(gè)分類特征拼接在一起,最后利用深度森林算法進(jìn)行語(yǔ)步分類。該混合模型在7個(gè)語(yǔ)步類別上的分類結(jié)果如表4所示。

    根據(jù)表4所示,M1和M3語(yǔ)步的識(shí)別效果最好,F(xiàn)1值達(dá)到90%以上;而M2和M6語(yǔ)步的效果最差,F(xiàn)1值均低于60%;全部7個(gè)語(yǔ)步識(shí)別效果的宏平均F1值為73%。

    4.5基于序列標(biāo)注的語(yǔ)步自動(dòng)識(shí)別實(shí)驗(yàn)結(jié)果

    在使用序列標(biāo)注模式進(jìn)行語(yǔ)步識(shí)別時(shí),需要以單篇論文為單位作為輸入。因此,隨機(jī)選取ART數(shù)據(jù)集中的203篇論文作為訓(xùn)練數(shù)據(jù),剩余的22篇論文作為測(cè)試數(shù)據(jù)。為了與文本分類模式的識(shí)別效果相比較,在評(píng)價(jià)時(shí)仍以句子為單位衡量識(shí)別效果。每個(gè)時(shí)間步輸入的句子向量由該句所有單詞的詞向量的算數(shù)平均值表示,進(jìn)入Bi-LSTM+CRF網(wǎng)絡(luò)結(jié)構(gòu)后便可結(jié)合序列信息輸出當(dāng)前句子所對(duì)應(yīng)的語(yǔ)步類別。使用序列標(biāo)注模式的語(yǔ)步識(shí)別結(jié)果如表5所示。從該表可以看出,與文本分類模式類似,采用序列標(biāo)注模式時(shí)也是M1和M3語(yǔ)步的識(shí)別效果較好,而M2和M6語(yǔ)步的識(shí)別效果較差,7個(gè)語(yǔ)步的宏平均F1值只有56%。

    4.6各模型識(shí)別結(jié)果比較

    針對(duì)科學(xué)論文的語(yǔ)步識(shí)別,本研究共采用了文本分類和序列標(biāo)注兩種任務(wù)模式,采用了傳統(tǒng)機(jī)器學(xué)習(xí)和深度學(xué)習(xí)兩類技術(shù),共構(gòu)建了7個(gè)語(yǔ)步自動(dòng)識(shí)別模型。這7個(gè)模型在測(cè)試集上的測(cè)試結(jié)果如表6所示。

    根據(jù)表6中的實(shí)驗(yàn)結(jié)果可以看出,采用文本分類模式進(jìn)行語(yǔ)步自動(dòng)識(shí)別的效果要優(yōu)于序列標(biāo)注模式。其可能的原因在于:一方面,科學(xué)論文中的語(yǔ)步雖然具有一定的順序性,但語(yǔ)步交錯(cuò)和循環(huán)現(xiàn)象也非常普遍,且由于科學(xué)論文中的句子數(shù)量較多,形成的序列結(jié)構(gòu)過(guò)長(zhǎng),導(dǎo)致語(yǔ)步序列規(guī)律并不十分明顯;另一方面,在序列標(biāo)注時(shí),當(dāng)前句的識(shí)別會(huì)使用前面句子的歷史識(shí)別結(jié)果作為參考信息,但在結(jié)構(gòu)復(fù)雜的論文正文中容易出現(xiàn)錯(cuò)誤累積,從而降低序列標(biāo)注模型的性能。

    在文本分類模式下,傳統(tǒng)機(jī)器學(xué)習(xí)算法與深度學(xué)習(xí)算法各有優(yōu)勢(shì),兩者中各自最優(yōu)模型的效果差距不大,一個(gè)的F1值是64%(深度森林算法);另一個(gè)也只有66%(BERT模型)。在3種深度學(xué)習(xí)識(shí)別模型中,BERT的效果最好,Bi-LSTM模型次之,而TextCNN的效果最差,這主要是因?yàn)門extC?NN模型在處理文本時(shí)使用的方法與N元語(yǔ)法類似,只能通過(guò)連續(xù)的單詞組合來(lái)學(xué)習(xí)特征,而在語(yǔ)步識(shí)別任務(wù)中需要的深層次語(yǔ)義信息,TextCNN模型則無(wú)法獲得。Bi-LSTM模型雖然能夠?qū)W習(xí)較遠(yuǎn)距離單詞之間的依賴關(guān)系,但對(duì)所有單詞同等對(duì)待,因此會(huì)忽視掉文本中的一些關(guān)鍵信息(如線索詞)。BERT模型使用超大的預(yù)訓(xùn)練語(yǔ)料與超大的模型參數(shù)來(lái)抽取文本中的隱含特征,而且可以根據(jù)注意力機(jī)制動(dòng)態(tài)調(diào)整不同詞匯的權(quán)重,這樣學(xué)習(xí)出的文本特征具有較好的語(yǔ)義區(qū)分能力,從而具有較好的語(yǔ)步識(shí)別效果。

    在本研究中,提出的BERT預(yù)訓(xùn)練模型與深度森林分類算法相結(jié)合的混合模型獲得了最佳的語(yǔ)步識(shí)別效果,F(xiàn)1值達(dá)到73%。該模型不但使用了基于大規(guī)模預(yù)訓(xùn)練和復(fù)雜深層神經(jīng)網(wǎng)絡(luò)模型得到的句子隱含語(yǔ)義特征,也使用了人工識(shí)別出的句子結(jié)構(gòu)特征。此外,深度森林分類算法多層次的集成學(xué)習(xí)結(jié)構(gòu)也使其能夠有效學(xué)習(xí)高維數(shù)據(jù)中隱藏的規(guī)律。

    5結(jié)論

    當(dāng)前對(duì)科學(xué)論文語(yǔ)步結(jié)構(gòu)自動(dòng)識(shí)別的研究主要聚集于論文摘要部分或者引言部分,針對(duì)論文全文的研究還非常少。本文以化學(xué)領(lǐng)域的科學(xué)論文為研究對(duì)象,探索采用文本分類和序列標(biāo)注兩種模式對(duì)科學(xué)論文全文的語(yǔ)步結(jié)構(gòu)進(jìn)行自動(dòng)識(shí)別,采用傳統(tǒng)機(jī)器學(xué)習(xí)技術(shù)與深度學(xué)習(xí)技術(shù)構(gòu)建了多種語(yǔ)步自動(dòng)識(shí)別模型,并對(duì)其效果進(jìn)行了實(shí)驗(yàn)測(cè)評(píng)。實(shí)驗(yàn)結(jié)果表明,采用文本分類模式進(jìn)行語(yǔ)步識(shí)別的效果要優(yōu)于序列標(biāo)注模式,尤其是將深度學(xué)習(xí)BERT預(yù)訓(xùn)練模型與傳統(tǒng)機(jī)器學(xué)習(xí)深度森林分類算法相結(jié)合的混合模型,既利用了人工識(shí)別出的句子位置與結(jié)構(gòu)特征,又利用了深度學(xué)習(xí)自動(dòng)識(shí)別出的文本深層語(yǔ)義特征,因此獲得了最佳的識(shí)別效果,在7個(gè)語(yǔ)步上的宏平均F1值達(dá)到73%。

    本文只是對(duì)化學(xué)領(lǐng)域英文科學(xué)論文的語(yǔ)步自動(dòng)識(shí)別方法進(jìn)行了探索,但該方法是否適用于其他領(lǐng)域的科學(xué)論文或者中文科學(xué)論文尚未進(jìn)行驗(yàn)證,這將是今后研究的一個(gè)重要方向。此外,科學(xué)論文的語(yǔ)步結(jié)構(gòu)對(duì)于讀者理解科學(xué)論文的主旨大意、快速定位所需信息具有重要的參考價(jià)值,在下一步的研究中,還將探索如何利用識(shí)別出的語(yǔ)步信息更好地為讀者提供文獻(xiàn)信息服務(wù)。

    猜你喜歡
    機(jī)器學(xué)習(xí)深度學(xué)習(xí)
    基于詞典與機(jī)器學(xué)習(xí)的中文微博情感分析
    有體驗(yàn)的學(xué)習(xí)才是有意義的學(xué)習(xí)
    電子商務(wù)中基于深度學(xué)習(xí)的虛假交易識(shí)別研究
    MOOC與翻轉(zhuǎn)課堂融合的深度學(xué)習(xí)場(chǎng)域建構(gòu)
    基于機(jī)器學(xué)習(xí)的圖像特征提取技術(shù)在圖像版權(quán)保護(hù)中的應(yīng)用
    大數(shù)據(jù)技術(shù)在反恐怖主義中的應(yīng)用展望
    基于網(wǎng)絡(luò)搜索數(shù)據(jù)的平遙旅游客流量預(yù)測(cè)分析
    前綴字母為特征在維吾爾語(yǔ)文本情感分類中的研究
    深度學(xué)習(xí)算法應(yīng)用于巖石圖像處理的可行性研究
    基于深度卷積網(wǎng)絡(luò)的人臉年齡分析算法與實(shí)現(xiàn)
    軟件工程(2016年8期)2016-10-25 15:47:34
    国产成人精品久久久久久| 日韩强制内射视频| 精华霜和精华液先用哪个| 久久久久久久久久成人| 亚洲第一av免费看| 国产深夜福利视频在线观看| 最近的中文字幕免费完整| 狂野欧美激情性xxxx在线观看| 少妇的逼好多水| 国产一区二区三区综合在线观看 | 男人添女人高潮全过程视频| a 毛片基地| 观看av在线不卡| 波野结衣二区三区在线| 伊人久久精品亚洲午夜| 久热这里只有精品99| 国产日韩一区二区三区精品不卡 | 国产精品伦人一区二区| 国精品久久久久久国模美| 亚洲精品久久久久久婷婷小说| 亚洲国产成人一精品久久久| 精品少妇内射三级| 久久久久久久久大av| 国产精品久久久久久久电影| 成人综合一区亚洲| 下体分泌物呈黄色| 丰满乱子伦码专区| 日韩av不卡免费在线播放| av视频免费观看在线观看| 极品教师在线视频| 美女cb高潮喷水在线观看| 国产男女内射视频| 日本av免费视频播放| 人人妻人人看人人澡| 久久99热6这里只有精品| 视频中文字幕在线观看| 看非洲黑人一级黄片| 亚洲经典国产精华液单| 又黄又爽又刺激的免费视频.| 能在线免费看毛片的网站| 国国产精品蜜臀av免费| 亚洲一区二区三区欧美精品| 黑丝袜美女国产一区| 国产又色又爽无遮挡免| 乱码一卡2卡4卡精品| 久久久久久久国产电影| 91精品国产九色| 亚洲av综合色区一区| 少妇猛男粗大的猛烈进出视频| 多毛熟女@视频| 极品人妻少妇av视频| 日韩欧美 国产精品| av.在线天堂| 日韩熟女老妇一区二区性免费视频| 国产男女超爽视频在线观看| 亚洲欧美精品自产自拍| 欧美日韩在线观看h| 丰满人妻一区二区三区视频av| av又黄又爽大尺度在线免费看| 国产男人的电影天堂91| 国产精品女同一区二区软件| 高清不卡的av网站| 亚洲综合精品二区| 久久精品夜色国产| 亚洲av不卡在线观看| 国产乱人偷精品视频| 久久精品熟女亚洲av麻豆精品| 亚洲精品一二三| 五月开心婷婷网| 高清黄色对白视频在线免费看 | 国产亚洲精品久久久com| 最近2019中文字幕mv第一页| 亚洲人成网站在线播| 国产成人精品一,二区| 日日摸夜夜添夜夜添av毛片| 色网站视频免费| 这个男人来自地球电影免费观看 | 久久久久久久久大av| 日韩欧美精品免费久久| 男人添女人高潮全过程视频| 日产精品乱码卡一卡2卡三| 久久久久人妻精品一区果冻| 香蕉精品网在线| 国产一区二区三区综合在线观看 | 久久天躁狠狠躁夜夜2o2o| 多毛熟女@视频| 97精品久久久久久久久久精品| 另类亚洲欧美激情| 亚洲精品久久久久久婷婷小说| 制服人妻中文乱码| 久久久精品区二区三区| 欧美日本中文国产一区发布| 操美女的视频在线观看| 免费在线观看视频国产中文字幕亚洲 | 十八禁网站网址无遮挡| 后天国语完整版免费观看| 淫妇啪啪啪对白视频 | 日韩人妻精品一区2区三区| 欧美另类一区| 一边摸一边做爽爽视频免费| 亚洲精品国产精品久久久不卡| 18禁黄网站禁片午夜丰满| 久久国产亚洲av麻豆专区| 午夜精品国产一区二区电影| 日韩欧美免费精品| 高清av免费在线| 欧美日韩av久久| videos熟女内射| 叶爱在线成人免费视频播放| 丰满人妻熟妇乱又伦精品不卡| 国产亚洲av高清不卡| 午夜福利一区二区在线看| av超薄肉色丝袜交足视频| 久久ye,这里只有精品| 久久久精品区二区三区| 在线天堂中文资源库| 99热国产这里只有精品6| 精品少妇内射三级| 91成人精品电影| 狠狠婷婷综合久久久久久88av| 亚洲国产欧美在线一区| 国产老妇伦熟女老妇高清| 考比视频在线观看| 国产色视频综合| 高潮久久久久久久久久久不卡| 激情视频va一区二区三区| 中文字幕人妻丝袜一区二区| 青草久久国产| 王馨瑶露胸无遮挡在线观看| 欧美黑人精品巨大| 亚洲黑人精品在线| 国产高清videossex| 亚洲精品在线美女| 女性生殖器流出的白浆| 色婷婷av一区二区三区视频| 免费日韩欧美在线观看| 国产欧美日韩一区二区三 | 九色亚洲精品在线播放| 亚洲国产精品999| 久久香蕉激情| 久久久久网色| 男女床上黄色一级片免费看| 十分钟在线观看高清视频www| 成年人午夜在线观看视频| 两个人免费观看高清视频| 免费高清在线观看视频在线观看| 在线观看舔阴道视频| 亚洲欧美色中文字幕在线| 母亲3免费完整高清在线观看| 久久ye,这里只有精品| 飞空精品影院首页| 国产av精品麻豆| 亚洲国产欧美在线一区| 国产日韩欧美视频二区| 19禁男女啪啪无遮挡网站| 桃花免费在线播放| 9热在线视频观看99| 国产不卡av网站在线观看| 国产欧美日韩一区二区精品| 久久久久网色| 19禁男女啪啪无遮挡网站| 亚洲免费av在线视频| 男人爽女人下面视频在线观看| 久久天堂一区二区三区四区| 桃花免费在线播放| 又紧又爽又黄一区二区| 在线精品无人区一区二区三| 老司机午夜十八禁免费视频| 精品少妇一区二区三区视频日本电影| 人人妻人人澡人人爽人人夜夜| 中文精品一卡2卡3卡4更新| 97人妻天天添夜夜摸| 黄片小视频在线播放| 国产极品粉嫩免费观看在线| 国产精品一区二区精品视频观看| 亚洲久久久国产精品| 日韩制服骚丝袜av| 曰老女人黄片| 亚洲精品国产精品久久久不卡| 首页视频小说图片口味搜索| 蜜桃国产av成人99| 欧美激情高清一区二区三区| 一级毛片女人18水好多| 十八禁高潮呻吟视频| 精品福利永久在线观看| 丰满迷人的少妇在线观看| 日韩欧美国产一区二区入口| 亚洲精品久久久久久婷婷小说| 啦啦啦视频在线资源免费观看| 一个人免费看片子| 亚洲精品日韩在线中文字幕| 9191精品国产免费久久| 久热这里只有精品99| 午夜精品久久久久久毛片777| 亚洲精品国产av成人精品| 国产欧美日韩一区二区三 | 精品国产超薄肉色丝袜足j| 视频区欧美日本亚洲| 久久久国产一区二区| 久久久精品区二区三区| 黑丝袜美女国产一区| 一级毛片电影观看| 91字幕亚洲| 欧美在线一区亚洲| 窝窝影院91人妻| 欧美在线黄色| 久久久国产成人免费| 免费日韩欧美在线观看| 亚洲成av片中文字幕在线观看| 99热网站在线观看| 亚洲中文字幕日韩| 肉色欧美久久久久久久蜜桃| 淫妇啪啪啪对白视频 | 免费在线观看黄色视频的| 老司机深夜福利视频在线观看 | 国产免费一区二区三区四区乱码| 亚洲,欧美精品.| 99久久精品国产亚洲精品| 黄色视频在线播放观看不卡| 天天添夜夜摸| 国产99久久九九免费精品| 波多野结衣av一区二区av| 国产黄频视频在线观看| 91九色精品人成在线观看| 1024香蕉在线观看| av片东京热男人的天堂| 激情视频va一区二区三区| 免费观看人在逋| 两个人看的免费小视频| 国产在线观看jvid| 成人黄色视频免费在线看| 一区二区三区乱码不卡18| 国产欧美日韩一区二区三 | 一区二区三区四区激情视频| 热99久久久久精品小说推荐| 91麻豆av在线| av在线app专区| 久久精品亚洲av国产电影网| 亚洲精品一卡2卡三卡4卡5卡 | 50天的宝宝边吃奶边哭怎么回事| 精品国产一区二区三区四区第35| 国产成人免费观看mmmm| 不卡一级毛片| 亚洲精品久久久久久婷婷小说| 精品久久久精品久久久| 十八禁网站网址无遮挡| 日本猛色少妇xxxxx猛交久久| 欧美+亚洲+日韩+国产| 久久天躁狠狠躁夜夜2o2o| 欧美日韩国产mv在线观看视频| 久久中文看片网| 久久久久国产一级毛片高清牌| 午夜视频精品福利| 最近最新免费中文字幕在线| 欧美日韩国产mv在线观看视频| 午夜福利,免费看| 精品欧美一区二区三区在线| av在线app专区| 香蕉国产在线看| 国产精品久久久久久精品电影小说| 日韩熟女老妇一区二区性免费视频| 亚洲精品国产色婷婷电影| 国产日韩欧美亚洲二区| 成人黄色视频免费在线看| 国产精品久久久久久精品电影小说| 成人亚洲精品一区在线观看| av国产精品久久久久影院| 午夜免费观看性视频| 日本vs欧美在线观看视频| 亚洲中文字幕日韩| 亚洲黑人精品在线| 精品久久久精品久久久| 19禁男女啪啪无遮挡网站| 精品一区在线观看国产| tube8黄色片| 精品熟女少妇八av免费久了| 交换朋友夫妻互换小说| 少妇猛男粗大的猛烈进出视频| 国产欧美日韩一区二区三 | 伊人久久大香线蕉亚洲五| 视频在线观看一区二区三区| 国产精品熟女久久久久浪| 日韩熟女老妇一区二区性免费视频| av天堂久久9| 亚洲第一av免费看| 色婷婷av一区二区三区视频| 欧美+亚洲+日韩+国产| 久久精品亚洲av国产电影网| 欧美日韩av久久| 久久中文字幕一级| 久久 成人 亚洲| 宅男免费午夜| 国产片内射在线| 日本欧美视频一区| 精品一区二区三区四区五区乱码| 亚洲精品国产av蜜桃| 十八禁人妻一区二区| 一本大道久久a久久精品| 国产一区二区激情短视频 | 性高湖久久久久久久久免费观看| 中文精品一卡2卡3卡4更新| 日韩 亚洲 欧美在线| 久久av网站| 午夜精品久久久久久毛片777| 色播在线永久视频| 日韩 欧美 亚洲 中文字幕| 午夜福利在线观看吧| 国产成人av激情在线播放| 亚洲国产成人一精品久久久| 在线看a的网站| www.熟女人妻精品国产| 亚洲国产成人一精品久久久| 亚洲欧美精品自产自拍| 青春草亚洲视频在线观看| 午夜视频精品福利| 91av网站免费观看| 免费av中文字幕在线| 久热爱精品视频在线9| www.999成人在线观看| 老司机午夜十八禁免费视频| 99热全是精品| 欧美日韩亚洲综合一区二区三区_| 欧美少妇被猛烈插入视频| 精品一区二区三卡| 狂野欧美激情性xxxx| av在线app专区| 久久这里只有精品19| 中文字幕制服av| 91国产中文字幕| 又紧又爽又黄一区二区| 男女边摸边吃奶| 岛国在线观看网站| 国产成人精品无人区| 中文字幕精品免费在线观看视频| 精品免费久久久久久久清纯 | 嫁个100分男人电影在线观看| 亚洲国产欧美网| 19禁男女啪啪无遮挡网站| 色视频在线一区二区三区| 宅男免费午夜| 黄片播放在线免费| 亚洲第一青青草原| 黑人欧美特级aaaaaa片| 国产91精品成人一区二区三区 | 日韩中文字幕欧美一区二区| 成人手机av| 日韩中文字幕欧美一区二区| 久久性视频一级片| 热re99久久精品国产66热6| 免费高清在线观看视频在线观看| 99热全是精品| 日本av免费视频播放| 丰满饥渴人妻一区二区三| a在线观看视频网站| 亚洲欧美日韩另类电影网站| 欧美日韩成人在线一区二区| 精品国产超薄肉色丝袜足j| 桃红色精品国产亚洲av| 激情视频va一区二区三区| 黄片大片在线免费观看| 亚洲精品成人av观看孕妇| 午夜福利在线观看吧| 亚洲欧美精品综合一区二区三区| 亚洲人成电影观看| 天堂俺去俺来也www色官网| 欧美日韩成人在线一区二区| 蜜桃国产av成人99| 波多野结衣一区麻豆| 激情视频va一区二区三区| 在线观看免费日韩欧美大片| 不卡一级毛片| 99热国产这里只有精品6| 狠狠精品人妻久久久久久综合| 麻豆国产av国片精品| 欧美亚洲日本最大视频资源| 成人黄色视频免费在线看| 丝袜在线中文字幕| 欧美人与性动交α欧美精品济南到| 丝袜在线中文字幕| 女警被强在线播放| 国产精品影院久久| 久久久久视频综合| 男女无遮挡免费网站观看| 亚洲国产欧美在线一区| 美女中出高潮动态图| 中文精品一卡2卡3卡4更新| 日韩 欧美 亚洲 中文字幕| 2018国产大陆天天弄谢| 他把我摸到了高潮在线观看 | 动漫黄色视频在线观看| 别揉我奶头~嗯~啊~动态视频 | 久久久国产一区二区| avwww免费| 一级毛片电影观看| 国产91精品成人一区二区三区 | 老汉色∧v一级毛片| 欧美人与性动交α欧美精品济南到| 欧美日韩亚洲高清精品| 精品久久久久久电影网| 午夜影院在线不卡| 亚洲avbb在线观看| 在线永久观看黄色视频| 中文字幕最新亚洲高清| 99国产精品免费福利视频| 精品少妇久久久久久888优播| 日本黄色日本黄色录像| 窝窝影院91人妻| 成人亚洲精品一区在线观看| 又黄又粗又硬又大视频| 电影成人av| 久久久久国产精品人妻一区二区| 青草久久国产| 自线自在国产av| 女人精品久久久久毛片| 一区福利在线观看| 欧美久久黑人一区二区| 19禁男女啪啪无遮挡网站| 大片免费播放器 马上看| 免费高清在线观看日韩| 欧美 亚洲 国产 日韩一| 亚洲av日韩在线播放| 国产精品99久久99久久久不卡| 汤姆久久久久久久影院中文字幕| 999精品在线视频| 一进一出抽搐动态| 亚洲成人免费av在线播放| 中文字幕色久视频| 亚洲精品久久成人aⅴ小说| 欧美大码av| 日韩,欧美,国产一区二区三区| 精品少妇内射三级| 国产亚洲精品久久久久5区| 亚洲午夜精品一区,二区,三区| 久久免费观看电影| 欧美日韩黄片免| 欧美日韩福利视频一区二区| 97在线人人人人妻| 高清av免费在线| 欧美变态另类bdsm刘玥| 脱女人内裤的视频| 99国产综合亚洲精品| 久久久久网色| 两性夫妻黄色片| 国产欧美日韩一区二区三区在线| 一本—道久久a久久精品蜜桃钙片| 亚洲第一av免费看| 欧美精品av麻豆av| 亚洲中文av在线| 夜夜骑夜夜射夜夜干| 日本91视频免费播放| 成人国产av品久久久| 国产91精品成人一区二区三区 | 亚洲专区中文字幕在线| 日韩中文字幕视频在线看片| 欧美变态另类bdsm刘玥| av国产精品久久久久影院| 天天添夜夜摸| av免费在线观看网站| tocl精华| 丁香六月天网| 丰满人妻熟妇乱又伦精品不卡| 亚洲精品美女久久久久99蜜臀| 国产免费视频播放在线视频| 国产伦人伦偷精品视频| 秋霞在线观看毛片| 麻豆av在线久日| 欧美日韩精品网址| 国产成人影院久久av| 国产精品99久久99久久久不卡| 亚洲国产精品一区二区三区在线| 不卡av一区二区三区| 老鸭窝网址在线观看| 激情视频va一区二区三区| 午夜老司机福利片| 精品国产一区二区三区四区第35| 国产成人av激情在线播放| 亚洲人成77777在线视频| 男人爽女人下面视频在线观看| 国产黄频视频在线观看| 日本五十路高清| 午夜成年电影在线免费观看| 国产在线视频一区二区| 亚洲自偷自拍图片 自拍| 亚洲精品日韩在线中文字幕| www.自偷自拍.com| 亚洲avbb在线观看| 在线天堂中文资源库| 高清欧美精品videossex| 亚洲欧美精品自产自拍| 啦啦啦在线免费观看视频4| www.999成人在线观看| 一区二区三区四区激情视频| 国产一区二区三区在线臀色熟女 | 亚洲一卡2卡3卡4卡5卡精品中文| 欧美精品高潮呻吟av久久| 91大片在线观看| 久久女婷五月综合色啪小说| 午夜激情av网站| 最黄视频免费看| 国产又爽黄色视频| 久久久久久久精品精品| 男女之事视频高清在线观看| 久久国产精品影院| 亚洲欧美成人综合另类久久久| 久久狼人影院| 亚洲精品av麻豆狂野| 亚洲欧美一区二区三区黑人| 久久久精品区二区三区| 日韩大片免费观看网站| 亚洲av美国av| 中文字幕精品免费在线观看视频| 久久精品亚洲av国产电影网| 日本91视频免费播放| 中国国产av一级| 天天添夜夜摸| 国产日韩欧美视频二区| 两人在一起打扑克的视频| 亚洲视频免费观看视频| 亚洲国产欧美网| 午夜福利在线观看吧| 韩国精品一区二区三区| 免费av中文字幕在线| 女人久久www免费人成看片| 手机成人av网站| 精品熟女少妇八av免费久了| 日韩电影二区| 国产成人免费无遮挡视频| 欧美精品一区二区大全| 欧美日韩亚洲高清精品| 美女扒开内裤让男人捅视频| 国产三级黄色录像| 日韩 亚洲 欧美在线| 亚洲欧美成人综合另类久久久| 午夜福利乱码中文字幕| 中文字幕高清在线视频| a级毛片在线看网站| 狠狠精品人妻久久久久久综合| 欧美另类亚洲清纯唯美| 欧美日韩中文字幕国产精品一区二区三区 | 国产成人a∨麻豆精品| 99国产精品一区二区蜜桃av | 激情视频va一区二区三区| 最新在线观看一区二区三区| 亚洲av美国av| 在线十欧美十亚洲十日本专区| 欧美人与性动交α欧美精品济南到| 日韩视频在线欧美| 国产99久久九九免费精品| 69av精品久久久久久 | 午夜福利在线免费观看网站| 99热全是精品| 成人国语在线视频| 国产欧美日韩精品亚洲av| 亚洲一区中文字幕在线| 国产极品粉嫩免费观看在线| 日韩欧美一区二区三区在线观看 | 成人国产av品久久久| 啪啪无遮挡十八禁网站| 国产欧美日韩一区二区三区在线| 黑人猛操日本美女一级片| 亚洲人成77777在线视频| 日韩一区二区三区影片| 中文字幕色久视频| 黄色视频不卡| 黄色视频在线播放观看不卡| 日韩一卡2卡3卡4卡2021年| 亚洲第一青青草原| 久久精品亚洲熟妇少妇任你| 在线观看免费午夜福利视频| 国产主播在线观看一区二区| 亚洲av片天天在线观看| 久久精品亚洲av国产电影网| 日韩视频在线欧美| 亚洲成人手机| 汤姆久久久久久久影院中文字幕| 国产一区有黄有色的免费视频| 免费在线观看日本一区| 亚洲精华国产精华精| av在线app专区| 亚洲欧美日韩高清在线视频 | 男女高潮啪啪啪动态图| 久久国产精品大桥未久av| 动漫黄色视频在线观看| 大片电影免费在线观看免费| 五月开心婷婷网| 麻豆乱淫一区二区| 亚洲精品乱久久久久久| 精品人妻熟女毛片av久久网站| 欧美日韩国产mv在线观看视频| 69av精品久久久久久 | 国产日韩欧美亚洲二区| 日本猛色少妇xxxxx猛交久久| 欧美黑人欧美精品刺激| 在线观看舔阴道视频| 美女大奶头黄色视频| 悠悠久久av| 成年女人毛片免费观看观看9 | 国产亚洲午夜精品一区二区久久| 人人妻人人澡人人爽人人夜夜| 国产精品一二三区在线看| 午夜激情久久久久久久| 一个人免费在线观看的高清视频 | 中亚洲国语对白在线视频| 在线观看人妻少妇| 一级毛片精品| 嫁个100分男人电影在线观看| 精品一区二区三卡| 黑人操中国人逼视频| 久9热在线精品视频| 考比视频在线观看| av不卡在线播放| 亚洲国产av新网站| 一二三四社区在线视频社区8| 老司机在亚洲福利影院| 十分钟在线观看高清视频www|