• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    學(xué)術(shù)論斷句標(biāo)注與識別方法探索

    2022-07-30 01:20:02郭語凡喻雪寒黃雨馨楊婷婷王唯一
    情報學(xué)報 2022年7期
    關(guān)鍵詞:全文層面長度

    徐 健,郭語凡,喻雪寒,黃雨馨,楊婷婷,王唯一,劉 政

    (1. 南京農(nóng)業(yè)大學(xué)信息管理學(xué)院,南京 210095;2. 南京農(nóng)業(yè)大學(xué)經(jīng)濟管理學(xué)院農(nóng)林經(jīng)濟管理博士后流動站,南京 210095)

    1 引 言

    隨著數(shù)字學(xué)術(shù)出版物數(shù)量的爆發(fā)式增長,信息爆炸與知識匱乏的矛盾日益突出。在學(xué)術(shù)大數(shù)據(jù)的背景下,如何利用機器學(xué)習(xí)、自然語言處理等技術(shù)對學(xué)術(shù)文獻中的文本進行自動化、細粒度地組織,挖掘其中蘊藏的理論與知識,是擺在科技情報領(lǐng)域?qū)W者面前的一個重要且富有挑戰(zhàn)性的科學(xué)問題。學(xué)術(shù)觀點,或稱學(xué)者觀點(論點),是指學(xué)者對于研究問題的看法、發(fā)現(xiàn)、見解或主張,是學(xué)者開展學(xué)術(shù)研究對學(xué)界形成的主要貢獻,也是學(xué)術(shù)信息交流的主要內(nèi)容和形式。1644 年,約翰·彌爾頓在其著作《論出版自由》中,首次提出觀點的自由市場理論,認為真理是通過各種意見的自由辯論和競爭獲得的,并非權(quán)力賜予。以“太陽與地球運動關(guān)系”這一問題為例,不同歷史時期學(xué)者提出、豐富和發(fā)展了地心說、日心說和宇宙大爆炸等學(xué)術(shù)論斷,如圖1 所示??梢钥闯觯聦W(xué)術(shù)論斷對原有論斷的質(zhì)疑、證偽、修正或推翻可視為科學(xué)研究進步的表現(xiàn)。同時,不同學(xué)派、學(xué)者學(xué)術(shù)觀點或論斷的交鋒、爭辯、相互補充和借鑒形成了學(xué)術(shù)研究進步的內(nèi)在動力。與知識被廣泛接受不同,學(xué)術(shù)論斷(或觀點)具有主觀性的特點,主要是由于不同學(xué)者在研究視角、立場、知識結(jié)構(gòu)、價值觀等方面存在差異。同時,學(xué)術(shù)論斷的正確性還需在實踐中經(jīng)過同行學(xué)者和專家的進一步檢驗。

    圖1 學(xué)術(shù)論斷在推動知識更新與科學(xué)進步中作用示意圖

    學(xué)術(shù)觀點(或論點)通常以學(xué)術(shù)文本中的論斷性句子(claim sentences)的形式出現(xiàn)。目前,對領(lǐng)域?qū)W術(shù)觀點的梳理和歸納通常通過人工閱讀和整理,繁重的閱讀任務(wù)擠占了學(xué)者思考和實驗的時間,降低了其研究效率?;诖?,本文探索學(xué)術(shù)論斷句的自動識別方法,選擇信息資源管理領(lǐng)域499篇論文摘要和249 篇論文全文作為研究樣本,標(biāo)注其中論斷句和非論斷句,利用傳統(tǒng)機器學(xué)習(xí)和深度方法對此類句子進行識別。本文關(guān)注的研究問題包括:①學(xué)術(shù)論斷句的判定標(biāo)準(zhǔn)有哪些?②何種分類器對學(xué)術(shù)論斷句的識別效果較好?③學(xué)術(shù)論斷句和非學(xué)術(shù)論斷句在長度、位置、TextRank 權(quán)重等方面的特征存在什么差異,能否被用于識別學(xué)術(shù)論斷句?通過探究上述問題,在明確學(xué)術(shù)論斷句概念基礎(chǔ)上,通過非結(jié)構(gòu)化的外在語言表現(xiàn)形式將學(xué)術(shù)觀點句與非學(xué)術(shù)觀點句區(qū)分開來,形成初具規(guī)模的標(biāo)注語料和標(biāo)注平臺,為其他功能類型語句標(biāo)注、識別提供思路與工具上的參考。同時,通過對比不同類型特征對于學(xué)術(shù)論斷句識別的有用性和各類識別方法的準(zhǔn)確性,為后續(xù)學(xué)術(shù)論斷句的進一步分類、組織與語義關(guān)聯(lián)奠定基礎(chǔ)。同時,本文的研究內(nèi)容還可以進一步豐富觀點挖掘研究場景,完善學(xué)術(shù)文本處理方法,通過對學(xué)術(shù)文本中的論斷進行識別可以提高讀者閱讀效率。相關(guān)過程對學(xué)術(shù)信息資源利用效率、知識服務(wù)水平和知識交流效率的提高具有重要價值。

    本文組織結(jié)構(gòu)如下:第2 節(jié)從論辯挖掘、學(xué)術(shù)文本處理兩個角度梳理相關(guān)研究,指出現(xiàn)有研究不足;第3 節(jié)介紹數(shù)據(jù)集和標(biāo)注過程,明確標(biāo)注標(biāo)準(zhǔn),對標(biāo)注結(jié)果進行描述;第4 節(jié)介紹了所使用模型與基準(zhǔn)模型原理、評價指標(biāo),開展識別實驗,分析實驗結(jié)果,對比論斷句和非論斷句文本特征,探索各類特征對識別效果的影響;最后,總結(jié)本文的研究結(jié)論,討論研究的局限性和創(chuàng)新性,并對未來研究進行展望。

    2 相關(guān)工作

    2.1 論辯挖掘

    論辯挖掘(argument minging)研究可視為觀點挖掘(opinion mining)的延續(xù),所分析的文本類型涵蓋新聞、政治演講、學(xué)術(shù)論文、法院判例等內(nèi)容。相關(guān)研究旨在對非結(jié)構(gòu)化文本進行分析,抽取其中的論辯結(jié)構(gòu),其理論來源于哲學(xué)中的邏輯學(xué)。早在20 世紀50 年代,圖爾敏模型[1](Toulmin model)就已被提出,包括主張、依據(jù)、正當(dāng)理由、支援、模態(tài)限定詞、反駁等元素。弗里曼(J. B. Freeman)將反駁分為消解反駁(undercutting defeater)和直接反駁(rebutting defeater),進一步豐富了圖爾敏模型[2]。

    現(xiàn)有論辯挖掘研究在方法層面重點關(guān)注論辯部件(argument component)和論辯結(jié)構(gòu)(argument structure)的識別與抽取。其中,論辯部件可視為論辯結(jié)構(gòu)的基本元素,也稱為argumentative discourse unit(ADU)或argument unit,具有判斷性(declar‐ative)、可證偽性(falsifiability)的特征。Walton[3]將論辯結(jié)構(gòu)定義為若干前提與結(jié)論間組成的支持或攻擊關(guān)系。論辯關(guān)系中的前件(premise) 和結(jié)論(conclusion)均可被稱為論辯部件。目前,對論辯部件的識別包括非監(jiān)督學(xué)習(xí)和監(jiān)督學(xué)習(xí)兩種方法:①在非監(jiān)督學(xué)習(xí)方法方面,Petasis 等[4]在帖子和議論文數(shù)據(jù)上驗證了基于TextRank 的抽取式摘要算法有助于論辯部件的識別。Levy 等[5]通過觀察提出一種在語料庫層面的查詢表達式,并據(jù)此進行論斷句識別。②在監(jiān)督學(xué)習(xí)方法方面,Mochales-Palau等[6]、Palau 等[7]、Moens 等[8]在Araucaria 數(shù)據(jù)集上使用二元分類的方法進行論辯性句子的識別,并對各類特征與分類器效果進行了對比。此外,Habernal等[9]發(fā)現(xiàn)論辯部件與句子并非一一對應(yīng),還可能存在一句內(nèi)包含多個論辯部件或者一個論辯部件由多句組成的現(xiàn)象。針對一句對應(yīng)多個論辯部件的情況,目前多數(shù)研究通過序列標(biāo)注的方式對句內(nèi)詞匯角色進行標(biāo)注,通過識別論辯部件邊界詞進行論辯部件的抽取,代表性研究如Park 等[10]、Sardianos等[11]、Petasis[12]等。

    論辯結(jié)構(gòu)主要是指論辯部件間關(guān)系,包括微觀和宏觀兩個層面:①微觀關(guān)系旨在分析論辯部件(argumentative components)間的推理關(guān)系,主要應(yīng)用在獨白型文本或篇幅較短的評論信息中。Trevisan等[13]通過詞性標(biāo)注的方式歸納了英文中表示論點和結(jié)論間推理關(guān)系的提示詞(conclusiva)。Carstens等[14]通過對句子對之間的關(guān)系進行分類,實現(xiàn)了論辯性句子的識別。Stab 等[15]在使用多類分類器對論辯部件類別進行判定的基礎(chǔ)上,進一步采用分類的算法對論辯部件二元對是否存在支持關(guān)系進行分類。Lawrence 等[16]從語料庫中抽取關(guān)聯(lián)陳述,使用矩陣表示主題不同方面間的關(guān)聯(lián)與推理關(guān)系。②論辯性文本間宏觀關(guān)系多出現(xiàn)在對白型文本或多文檔分析中。例如,Palau 等[7]使用語法分析的方法對法律文本中論斷間的關(guān)系進行判斷,Boltu?i? 等[17]采用文本蘊含分析(text entailment analysis)的方法對論壇中不同帖子之間的語義關(guān)系進行判定。受ACL、EMNLP 等國際會議推動,目前該領(lǐng)域方法已經(jīng)在教育、法律、社交媒體、辯論等類型文本上開展了廣泛的實驗,涌現(xiàn)出了較多的領(lǐng)域語料庫。

    論辯挖掘在學(xué)術(shù)場景下主要有如下三個方面的應(yīng)用:①對學(xué)生撰寫的議論文論辯結(jié)構(gòu)進行識別并對其質(zhì)量進行評估。例如,Ong 等[18]使用基于規(guī)則的方法對來自匹茲堡心理學(xué)本科生撰寫的議論文中的句子類型進行識別并對文章質(zhì)量進行評分,發(fā)現(xiàn)其與專家對文章的評分存在相關(guān)性;Song 等[19]對學(xué)生撰寫論文的論證策略(argument schema)進行標(biāo)注,并分析其與專家評分之間的相關(guān)關(guān)系;Beig‐man Klebanov 等[20]研究發(fā)現(xiàn)論證結(jié)構(gòu)可以比文章內(nèi)容本身更準(zhǔn)確地預(yù)測文章質(zhì)量。②學(xué)術(shù)文本中論辯結(jié)構(gòu)表示方法。Green[21]研究了醫(yī)學(xué)診斷報告中的論辯修辭結(jié)構(gòu)的表示方法。Accuosto 等[22]以計算機語言學(xué)(computational linguistics,CL)和生物醫(yī)學(xué)(biomedicine,BIO)領(lǐng)域為例,提出一種摘要層面論辯單元和關(guān)系的標(biāo)注方案,并利用轉(zhuǎn)移學(xué)習(xí)方法預(yù)測文本論辯結(jié)構(gòu)[23]。③論斷句識別方法方面。Graves 等[24]發(fā)現(xiàn)實驗性論文標(biāo)題中的動詞出現(xiàn)頻次隨時間增長,這有助于知識的傳播。Park 等[25]探索了利用語義、句法等特征識別學(xué)術(shù)論文中的比較型論斷句。從整體上來看,學(xué)術(shù)場景的論辯挖掘研究相對較少;而且,國外相關(guān)研究熱度較大,國內(nèi)開展的研究還比較少,以中文為對象的論辯挖掘則更加少見。相關(guān)研究還存在判斷標(biāo)準(zhǔn)缺失、語料標(biāo)注不規(guī)范的問題。本文著重關(guān)注中文學(xué)術(shù)文本中論斷句的標(biāo)注與抽取工作,形成標(biāo)注語料,并探索其自動化識別方法。未來還將就學(xué)術(shù)論斷的進一步分類、關(guān)聯(lián)和組織開展研究。

    2.2 學(xué)術(shù)文本信息分類

    學(xué)術(shù)文本是學(xué)者發(fā)表自己觀點與思想、研究發(fā)現(xiàn)的一種重要手段,通過閱讀學(xué)術(shù)文本可以與同領(lǐng)域?qū)W者進行跨時間和空間地信息交流,對學(xué)者增長見識、把握前沿、獲得啟發(fā)等具有重要作用。學(xué)術(shù)文本數(shù)量的增長促進了各類學(xué)術(shù)文本分析與處理工具的產(chǎn)生與發(fā)展。相關(guān)研究涉及計算機語言學(xué)、自然語言處理和語義出版等學(xué)科領(lǐng)域。其中,對學(xué)術(shù)文本按照一定的方式進行分類可以滿足用戶更細粒度的檢索需求,學(xué)術(shù)文本分類主要關(guān)注論文中各個片段功能的識別,按照粒度可以分為句子層面和篇章層面。

    句子層面主要關(guān)注定義句[26]、創(chuàng)新句[27]、未來工作句[28]、研究方法句[29]等類型句子的識別方法,其潛在應(yīng)用主要在于為用戶提供更細粒度的檢索結(jié)果。在此基礎(chǔ)上,部分學(xué)者對特定類型的句子進行了更細粒度的劃分。例如,張穎怡等[29]將研究方法句進一步分為使用研究方法和引用研究方法,并對其分布情況做了對比。溫浩[30]將創(chuàng)新句分為問題、方法、結(jié)果等6 種類型,并研究其自動識別的方法。學(xué)術(shù)文本中的句子功能在語法、語義和語用各個層面均有不同的分類標(biāo)準(zhǔn)和方式,各個類別之間的重合和覆蓋關(guān)系也需要進一步探討。同時,在漢語和學(xué)術(shù)環(huán)境下句子往往比較長,可以視為復(fù)句,還需要進一步拆分為具有單一功能類型的子句才可以開展學(xué)術(shù)評價、知識挖掘等類型的應(yīng)用。

    學(xué)術(shù)文本結(jié)構(gòu)主要關(guān)注學(xué)術(shù)論文中各篇章的功能,目前各學(xué)者主要關(guān)注功能的識別。Ma 等[31]構(gòu)建了一個數(shù)據(jù)標(biāo)注平臺,旨在解決語料標(biāo)注過程中的數(shù)據(jù)管理與規(guī)范問題。在識別方法上,Ma 等[32]、陸偉等[33]、黃永等[34]探索了利用章節(jié)內(nèi)容、位置、標(biāo)題及段落內(nèi)容識別學(xué)術(shù)文本結(jié)構(gòu)功能的方法。在應(yīng)用上,方龍等[35]提出將學(xué)術(shù)文本結(jié)構(gòu)功能特征應(yīng)用于關(guān)鍵詞抽取,在ScienceDirect 數(shù)據(jù)庫上取得了較好的效果。本文的研究內(nèi)容可以視為論辯挖掘和學(xué)術(shù)文本信息分類的交叉領(lǐng)域,其概念的界定和相關(guān)理論主要來自前者,而所用的方法與技術(shù)則更多地借鑒了學(xué)術(shù)文本信息分類方面的方法。在研究中,重點關(guān)注學(xué)術(shù)文本中的論斷句的判斷標(biāo)準(zhǔn),并探索現(xiàn)有學(xué)術(shù)文本處理技術(shù)在論斷句識別過程中的效果,為后續(xù)論斷句結(jié)構(gòu)化知識建模和關(guān)系判斷奠定基礎(chǔ)。

    3 學(xué)術(shù)論斷句標(biāo)注過程

    本文立足圖書情報領(lǐng)域,從摘要和全文兩個層面研究學(xué)術(shù)文本論斷句標(biāo)注過程和自動化識別方法。本文選擇信息資源管理領(lǐng)域部分學(xué)術(shù)文本文獻,搜集和處理文獻題錄信息,尋找全文內(nèi)容,構(gòu)建數(shù)據(jù)集。在此基礎(chǔ)上組建數(shù)據(jù)標(biāo)注小組,在標(biāo)注過程中探討標(biāo)注論斷句的判斷標(biāo)準(zhǔn),對論斷句和非論斷句進行標(biāo)注,形成語料集,為下文探索學(xué)術(shù)論文句識別方法提供訓(xùn)練與測試數(shù)據(jù)集(圖2)。

    圖2 學(xué)術(shù)文本中論斷句標(biāo)注過程

    3.1 數(shù)據(jù)處理過程

    本研究選擇《中文社會科學(xué)引文索引》(Chi‐nese Social Sciences Citation Index,CSSCI) 作 為 數(shù)據(jù)源,以“關(guān)鍵詞=信息資源管理”為檢索式,共獲得1998—2018 年這21 年發(fā)表的499 篇文獻,檢索日期為2019 年5 月31 日。之所以將語料限定在該主題內(nèi),主要是基于標(biāo)注團隊的學(xué)科和專業(yè)背景,且數(shù)據(jù)規(guī)模適中。下載這些題錄數(shù)據(jù),并使用Java程序?qū)@些數(shù)據(jù)進行解析,存儲在MySQL 數(shù)據(jù)庫中。在中國知網(wǎng)中對這些數(shù)據(jù)進行逐一查詢,發(fā)現(xiàn)部分文獻由于數(shù)據(jù)庫記錄錯誤,或者由于文獻較早并未找到數(shù)據(jù)來源。在這499 篇文獻中,有463 篇找到了摘要,249篇有HTML 格式正文。對摘要中數(shù)據(jù)按照正則表達式[!?。???]進行分句;對于全文數(shù)據(jù),先按照正則表達式[0123346789 零一二三四五六七八九][^.)](.)*[^.,?!。,?!]識別一級標(biāo)題,然后按照摘要分句的方式對一級標(biāo)題下的各個段落進行分句,對句子文內(nèi)和段內(nèi)位置順序進行記錄。對句子中出現(xiàn)的亂碼進行識別,對句子錯分和非正文短句進行剔除。

    最終,從摘要和全文中分別得到853 個和24401個句子,形成本文的研究數(shù)據(jù)。在摘要層面,平均每篇文獻包含1.85 個摘要句,句均長度為65.1 個字;在全文層面,平均每篇文獻包含98.0 個全文句,句均長度為60.6 個字。招募5 名標(biāo)注人員,以文檔為單元分配標(biāo)注任務(wù),任務(wù)分配過程要確保各摘要和全文被3 位人員標(biāo)注,以便對爭議性標(biāo)注結(jié)果進行最終決策。

    3.2 學(xué)術(shù)文本中論斷句數(shù)據(jù)標(biāo)注標(biāo)準(zhǔn)

    在預(yù)標(biāo)注階段,針對標(biāo)注過程中存在的分歧進行討論,形成論斷句的6 個判定標(biāo)準(zhǔn),包括3 個必要條件和3 個充分條件。必要條件可從反面排除非論斷句,充分條件可從正面確定論斷句。具體而言,必要條件是指論斷句一定具有的特征,若不符合則為非論斷句,包括:①信念感。主要排除那些作者尚未形成確定判斷的語句,包括疑問句和假設(shè)階段的判斷句;②對象和判斷完備。主要對未形成完整命題的短文本,包括短標(biāo)題、不完整的句子進行剔除。③可證偽。這個判斷標(biāo)準(zhǔn)主要是指存在與該論斷相對立或者競爭關(guān)系的其他論斷,此處主要排除對事實的描述和對現(xiàn)有方法、工具的介紹,此類句子在句前添加“我認為”后,句子會變得不通順。充分條件是指滿足此類條件的一定是論斷句,但論斷句并不一定滿足該標(biāo)準(zhǔn),包括:①預(yù)測性。對未來發(fā)展進行預(yù)測,預(yù)測結(jié)果需要未來發(fā)展進行驗證。②個人理解。對一些抽象概念的定義和理解,學(xué)術(shù)應(yīng)允許存在對同一概念的不同理解。③包含一定價值判斷和主張傾向的句子。建立在價值觀基礎(chǔ)上,是一種應(yīng)然性判斷。需要說明的是,本研究并未區(qū)分作者本人的論斷和引用他人的論斷,也未區(qū)分個人觀點和公認的觀點;同時,在標(biāo)注過程中并未考慮論斷句間的論辯關(guān)系。因此,本研究識別的論斷句既包括論點句,也可能包括論斷性的論據(jù)句,相關(guān)例句如表1所示。

    表1 論斷句標(biāo)注標(biāo)準(zhǔn)和反面例句

    3.3 數(shù)據(jù)標(biāo)注界面

    本節(jié)對學(xué)術(shù)觀點句的標(biāo)注可以分為摘要層面和全文層面。標(biāo)注人員采用如圖3 所示的界面對文獻摘要中的句子進行標(biāo)注。單擊句子,可將該句標(biāo)注為論斷句(句子底線變?yōu)楹谏珜嵕€),再次點擊后可以標(biāo)記為非論斷句(句子底線變?yōu)楹谏摼€),第三次點擊刪除其論斷句標(biāo)注結(jié)果(刪除底線)。在左上角分別有標(biāo)注完成和清除標(biāo)注結(jié)果兩個按鈕,分別可以提交標(biāo)注任務(wù)和取消標(biāo)注結(jié)果。文獻《重視發(fā)展二級學(xué)科,科學(xué)定名一級學(xué)科——再論本學(xué)科建設(shè)問題》的摘要共包含3 句話。第一句話是對圖書館學(xué)教育萎縮的原因進行解讀,第二句話介紹了該研究的任務(wù),最后一句話表達了作者的建議。將第一句和第三句標(biāo)注為論斷句,通過異步的方式完成存儲。

    圖3 摘要層面論斷句/非論斷句標(biāo)注

    在全文層面,本研究選擇了與論文整體研究主題契合程度比較高的句子進行標(biāo)注。學(xué)術(shù)論文的關(guān)鍵詞、摘要、標(biāo)題等集中反映了學(xué)術(shù)論文的研究主題與研究對象,因此,主要從這三個部分中識別論文的研究主題詞。遍歷整個文檔庫,計算各個詞匯的逆文檔頻率和重要性??紤]各個詞匯的位置與數(shù)量,計算各詞匯對其所在論文主題的揭示程度,其計算過程為

    其中,wi,j表示第j篇文獻中的詞匯wi的重要性;context 可以取值為關(guān)鍵詞、標(biāo)題與摘要,本研究分別設(shè)置其權(quán)重分別為1、0.5 和0.1,對于未出現(xiàn)在三個主題區(qū)的詞匯,其權(quán)重設(shè)定為0.01。對于每一個句子,其重要性記為各個詞匯形成的向量與論文重要性詞匯形成的向量之間的余弦夾角。計算完成后,從中抽取出主題相似性排在前20%的句子。圖4 給出了全文標(biāo)注的樣例界面,背景為灰色的句子是被選出的主題相似性比較高的句子,其余標(biāo)注過程與摘要相同。

    圖4 全文層面論斷句和非論斷句標(biāo)注

    3.4 標(biāo)注一致性分析

    由于標(biāo)注過程中有多位標(biāo)注人員參與,本研究選擇kappa 指標(biāo)[36]來評估標(biāo)注人員之間的一致性程度,該指標(biāo)取值為[0,1.0]。通常情況下,該指標(biāo)小于0.2,說明一致性程度較低;該指標(biāo)位于[0.2,0.4),說明標(biāo)注的一致性程度一般;該指標(biāo)位于[0.4,0.6),說明一致性程度中等;該指標(biāo)位于[0.6,0.8),說明兩者標(biāo)注一致性程度較強;該指標(biāo)位于[0.8,1.0],說明一致性程度很強。例如,Ai和Aj是不同的兩個標(biāo)注者,計算標(biāo)注者Ai和Aj對于共同待標(biāo)注句子的標(biāo)注矩陣Mi,k和Mj,k,通過計算Mi,k的轉(zhuǎn)置和Mj,k矩陣相乘的乘積形成混淆矩陣,最后計算該混淆矩陣的kappa 值。此外,本研究將所有可標(biāo)注文獻隨機分給5 位標(biāo)注者(分別記作A1~A5),確保每篇文獻的摘要和全文至少分配給3 名標(biāo)注者。將學(xué)術(shù)文獻摘要和全文賦予5 位標(biāo)注者進行標(biāo)注,形成20 個kappa 數(shù)值,任務(wù)分配與標(biāo)注一致性如表2 所示。

    表2 學(xué)術(shù)觀點句識別標(biāo)注一致性結(jié)果

    從表2 可以看出,標(biāo)注者A1和A2一致性高達93.95%,可認為其標(biāo)注近乎完全一致。剩余各標(biāo)注二元組的一致性也都大于70%,可認為是高度一致。對于每一篇論文的摘要和全文的標(biāo)注結(jié)果進行合并。為保障數(shù)據(jù)的準(zhǔn)確性,對標(biāo)注者標(biāo)注存在不一致的句子召集標(biāo)注者進行最終決策,采取多數(shù)裁定原則。最終,共形成2884 句論斷句,2479 句非論斷句,具體標(biāo)注數(shù)據(jù)如表3 所示。

    表3 論斷句標(biāo)注結(jié)果

    4 學(xué)術(shù)文本中論斷句識別方法探索

    在生成論斷句標(biāo)注數(shù)據(jù)的基礎(chǔ)上,本文將學(xué)術(shù)文本中論斷句的識別轉(zhuǎn)化為論斷句與非論斷句的二元分類問題。選擇部分文本用傳統(tǒng)機器學(xué)習(xí)方法與深度學(xué)習(xí)方法進行訓(xùn)練,評估各算法識別效果。在此基礎(chǔ)上,對比論斷句和非論斷句在長度、位置、TextRank 特征上分布的差異,分析不同特征對識別算法效果是否存在提升作用。

    4.1 模型選擇與參數(shù)設(shè)置

    本文使用WEKA 和PyTorch 中提供的分類器模型進行論斷句識別實驗,前者主要包含傳統(tǒng)機器學(xué)習(xí)算法,后者則主要提供一些深度學(xué)習(xí)算法的實現(xiàn)。

    本文選擇傳統(tǒng)的機器學(xué)習(xí)算法包括:方法①k近鄰(k-nearest neighbor,kNN)[37]:該方法是最簡單的文本分類方法之一,尋找與待分類節(jié)點最相近的k個節(jié)點,然后將其類別設(shè)定為這k個節(jié)點中數(shù)目最多的類別;方法②樸素貝葉斯(naive Bayesian,NB)[38]:該方法采用貝葉斯推理過程將文本類別判定轉(zhuǎn)化為詞匯類別判定問題,假設(shè)文本中的詞匯特征之間相互獨立;方法③決策樹算法:對待分類數(shù)據(jù)特征進行分析構(gòu)建決策樹,可視為一系列分類特征,本文選擇C4.5 算法[39]進行模型訓(xùn)練;方法④支持向量機(support vector machine,SVM)[40]:該方法使用代數(shù)運算的方法計算分類的邊界,核心技術(shù)包括最大間隔、對偶、核技巧,比較適合二元分類問題;方法⑤最小序列優(yōu)化(sequential minimal optimization,SMO)[41]:該方法是一種解決支持向量機訓(xùn)練過程中所產(chǎn)生優(yōu)化問題的算法。

    BERT (bidirectional encoder representation from transformers)[42]由谷歌提出,近年來在文本挖掘領(lǐng)域獲得了廣泛的應(yīng)用。本文選擇的深度學(xué)習(xí)方法包括:方法⑥BERT+FC、方法⑦BERT+BiLSTM(bi‐directional long short-term memory)兩個模型。前者使用BERT 對句子進行表示,使用全連接層(fully connection layer)進行分類學(xué)習(xí);后者在BERT 層對句子進行表示的基礎(chǔ)上,加入雙向長短時記憶網(wǎng)絡(luò),輸出預(yù)測結(jié)果。在模型運行過程中,隱藏層設(shè)置為768,開啟BERT 的fine-turning 微調(diào)模式,Epoch設(shè)置為10,Batch 為32,學(xué)習(xí)率設(shè)置為2e-5。

    4.2 論斷句識別評價指標(biāo)

    本文將學(xué)術(shù)文本中論斷句的識別轉(zhuǎn)化為一個句子二元分類問題。嘗試使用傳統(tǒng)機器學(xué)習(xí)分類和深度學(xué)習(xí)算法對學(xué)術(shù)論斷句進行識別。表4 為識別方法結(jié)果鄰接表。

    表4 識別方法的結(jié)果鄰接表

    使用準(zhǔn)確率(p)與召回率(r)、F_1 值三種指標(biāo)對模型識別的效果進行評價。計算公式為

    4.3 識別效果分析

    為避免過適應(yīng)性,使用10 折交叉檢驗的方式進行模型效果的評估。也就是將數(shù)據(jù)集盡可能平均地分為10 份,訓(xùn)練10 次,每輪選擇1 份數(shù)據(jù)作為測試集,其中,方法①~方法⑤使用剩余9 份作為訓(xùn)練集,方法⑥和方法⑦則將這9 份中的8 份作為訓(xùn)練集,1 份作為驗證集。各分類方法在論斷句識別任務(wù)中的效果如表5 所示。

    從表5 可以看出,深度學(xué)習(xí)方法整體上要顯著優(yōu)于傳統(tǒng)機器學(xué)習(xí)算法的識別效果。其中,BERT+BiLSTM 在摘要和全文層面均取得論斷句識別效果最優(yōu)的效果。SVM 方法在摘要層面表現(xiàn)最差,訓(xùn)練出的模型將所有數(shù)據(jù)都預(yù)測為非論斷句,導(dǎo)致論斷句識別的準(zhǔn)確率和召回率均為0。結(jié)合上文訓(xùn)練數(shù)據(jù)判斷,該方法在預(yù)測時會更多地將未知數(shù)據(jù)標(biāo)注為多數(shù)類別。此外,各類方法在摘要層面的識別綜合效果F_1 值均不如在全文層面,說明在摘要識別方面還存在比較大的提升空間,數(shù)據(jù)規(guī)模、正負例比例是影響模型識別效果的主要原因。同時,本文是對整句進行標(biāo)注的,那些既包含論斷性子句又包含非論斷性子句的長句,加大了論斷句的識別難度。

    表5 各分類方法識別效果對比分析 %

    4.4 論斷句文本特征分析

    為進一步改善識別效果,本文對標(biāo)注的摘要和全文中的論斷句和非論斷句的文本特征進行對比,包括長度、位置、TextRank 等,并將其融入識別模型中,以期提升傳統(tǒng)機器學(xué)習(xí)方法識別論斷句的效果。

    1)長度特征對比分析

    在摘要層面,共有463 篇858 個句子,其中390句被標(biāo)注為論斷句,468 句被標(biāo)注為非論斷句。摘要層面,論斷句長度平均為184.2 個字,非論斷句平均長度為187.5 個字,圖5 為摘要中論斷句/非論斷句長度頻率分布折線圖。將句子長度以10 為組距分組,計算各組句子數(shù)目及頻次占比,將多于300 個字的句子作為最后一組單獨呈現(xiàn)。

    從圖5 可以看出,論斷句在50~190 個字長度區(qū)間的頻次要顯著高于非論斷句。在全文層面,標(biāo)注全文中的論斷句長度平均為191.6 個字,非論斷句長度平均為139.2個字,其長度頻率分布折線如圖6所示。

    圖5 摘要中論斷句與非論斷句長度頻率分布折線圖

    從圖6 可以看出,論斷句與非論斷句長度的頻率分布存在顯著差異。在低于80 個字的句子中,非論斷句占比較高,論斷句占比較低,說明長度特征可能有助于學(xué)術(shù)文本中論斷句的識別。這可能是由于在標(biāo)注過程中,一些較短的句子如標(biāo)題、過渡句等并未包含完整的命題信息,更多地被標(biāo)注為非論斷句。

    圖6 全文中論斷句與非論斷句長度頻率分布折線圖

    2)位置特征對比分析

    為揭示摘要中論斷句和非論斷句位置分布差異,本文對不同句數(shù)摘要中論斷句出現(xiàn)位置頻次進行統(tǒng)計。在標(biāo)注的463 篇摘要中,數(shù)量最多的為9句,大部分文獻(97.2%) 摘要句數(shù)在5 句以內(nèi)。為分析摘要中各位置論斷句占比,本文繪制了5 句內(nèi)摘要各位置論斷句概率圖,每列表示相應(yīng)句數(shù)摘要的情況,括號內(nèi)數(shù)字表示對應(yīng)該摘要句數(shù)的文獻數(shù)目,黑色部分面積表示該位置論斷句占比,如圖7 所示。

    圖7 摘要中論斷句出現(xiàn)位置頻次分布

    從圖7 可以看出,在僅包含1 個句子的摘要(223篇)中,包含論斷句的情況比較少(20.1%),大多是對研究過程的客觀論述。在包含2 個句子的摘要中(150 篇)中,首句為論斷句的占比要大于第2 句為論斷句的占比。在包含2~5 個句子的摘要中,位置越靠前,論斷句出現(xiàn)概率就越高。在全文層面,本文從段內(nèi)位置和文內(nèi)位置兩個方面對論斷句出現(xiàn)位置進行分析。共有249 篇文獻擁有全文數(shù)據(jù),共標(biāo)記出論斷句2513 句,非論斷句1992 句。僅有1 句的段落中,僅20.2%的句子被標(biāo)注為論斷句,這要遠低于整體上55.8%的論斷句占比。單句段落通常為過渡句,多被標(biāo)注為非論斷句。在包含2 個句子的段落(69.5%)中,首句標(biāo)注為論斷句的概率要高于第2 句(56.5%)。在3句及3句以上段落中,統(tǒng)計段首句、段中句和段尾句標(biāo)注為論斷句的概率分布如圖8所示。

    圖8 3句及3句以上段落中論斷句出現(xiàn)位置概率分布

    從圖8 可以看出,在3 句及3 句以上的段落中,段落首尾處被標(biāo)注為論斷句的概率要比段中句高,且段首句要略低于段尾句。這符合寫作過程中,在首句或尾句給出論斷的習(xí)慣。本文使用文內(nèi)相對位置來表示論斷句與非論斷句在全文中的位置,即對論文中各個句子按照出現(xiàn)次序進行編號,句子文內(nèi)相對位置定義為其編號與全文句子數(shù)目的比值。將句子文內(nèi)相對位置按照0.05 的組距分為20 組(左開右閉),論斷句在文內(nèi)相對位置的概率分布折線如圖9 所示。

    從圖9 可以看出,論斷句在論文開頭和結(jié)尾兩處出現(xiàn)的概率較大,整體呈U 形分布。具體來說,論斷句在文內(nèi)相對位置前5%和后15%出現(xiàn)的概率要高于非論斷句,其他位置非論斷句出現(xiàn)的概率要高于論斷句。這可能是因為在寫作過程中,多數(shù)學(xué)者會在論文最前面直接拋出論點或者在論文末尾總結(jié)性地給出結(jié)論。

    圖9 論斷句和非論斷句在文內(nèi)相對位置的概率分布折線圖

    3)TextRank 特征對比分析

    在文摘研究領(lǐng)域,TextRank 算法[43]常被用于抽取文本中比較重要的詞與句子,其核心思想是用隨機游走的方式對句子權(quán)重進行計算。使用HanLP 工具[44]計算各文獻句子初始TextRank 權(quán)重,并對該數(shù)值采用均值歸一化的方式形成最終取值介于0~1 的文內(nèi)相對權(quán)重。對歸一化后的TextRank 數(shù)值按0.05的組距進行分組操作,共得到20 組(左開右閉),圖10 給出了全文層面標(biāo)注論斷句、非論斷句和所有句子的頻率分布對比。

    圖10 論斷句和非論斷句TextRank權(quán)重頻率分布折線圖

    整體來看,所有句子的文內(nèi)相對TextRank 權(quán)重呈現(xiàn)倒U 形分布,而本文標(biāo)注的論斷句和非論斷句分布頻率卻隨著TextRank 數(shù)值的升高呈上升趨勢,這是由于本文在選擇標(biāo)注數(shù)據(jù)時就選擇了和全文主題比較契合的句子。從標(biāo)注結(jié)果來看,非論斷句和論斷句頻率分布曲線在TextRank 取值為0.55 處存在交點,在大于該值的組內(nèi),論斷句分布頻率要略高于非論斷句。非論斷句TextRank 均值為0.520,而論斷句TextRank 均值略高,為0.538。

    4.5 特征擴充識別實驗

    根據(jù)上文論斷句和非論斷句文本特征對比分析的結(jié)果,考慮在摘要和全文層面將部分特征融入識別模型以提升效果。這些特征包括:

    (1)長度特征集。包括31 個特征。將句子長度以10 為組距,分成31 組,多于300 個字的歸為第31 組,將句長所屬組對應(yīng)特征賦值為1,其余賦值為0。

    (2)段內(nèi)句數(shù)與位置。共包括6 個特征:獨段句和兩句段落分別將para_single 和para_dual 特征賦值為1,其余特征賦值為0。三句(含)以上段落將para_multi 特征賦值為1,para_first、para_middle和para_last 分別表示是否為段首、段中和段尾句。

    (3)文內(nèi)相對位置。包括20 個特征項。將句子文內(nèi)相對位置以0.05 為組距,分成20 組,將句子文內(nèi)相對位置所屬組對應(yīng)特征賦值為1,其余賦值為0。

    (4)TextRank。將句子TextRank 值以0.05 為組距分成20 組,所屬組對應(yīng)特征項賦值為1,其余賦值為0。

    上述特征中,(1)和(2)是摘要和全文層面共有的特征,而(3)和(4)則是全文層面數(shù)據(jù)所獨有的特征。按照4.3 節(jié)的分析結(jié)果,在摘要和全文層面分別選擇傳統(tǒng)機器學(xué)習(xí)模型中表現(xiàn)最優(yōu)的SMO 和SVM 進行特征擴充實驗。表6 列出了加入這些特征后,模型識別效果變化情況。

    表6 特征擴充識別效果分析

    從表6 可以看出,在摘要數(shù)據(jù)上,僅加入長度特征后模型識別效果有較小提升,而段內(nèi)位置特征加入后,識別效果幾乎沒有變化;結(jié)果顯示,將長度特征加入綜合特征后,準(zhǔn)確率、召回率、F_1 值均小幅度提升0.5%。在全文數(shù)據(jù)上,長度、段內(nèi)位置和文內(nèi)相對位置特征有助于識別效果的提升;TextRank 特征加入后,論斷句識別效果幾乎沒有變化;最終,將有助于提升識別效果的三個特征全部加入特征集,識別準(zhǔn)確率提升2.9%,召回率提升0.1%,F(xiàn)_1 值提升2.0%。

    5 結(jié) 語

    在現(xiàn)代科學(xué)研究中,系統(tǒng)地掌握、及時地了解各領(lǐng)域、學(xué)派、學(xué)者最新的研究發(fā)現(xiàn)和學(xué)術(shù)主張對學(xué)者開展研究工作起著越來越重要的作用。本文在對前人研究進行歸納的基礎(chǔ)上,提出學(xué)術(shù)論斷句的6 個判定標(biāo)準(zhǔn),必要性標(biāo)準(zhǔn)可用于排除非論斷句,包括信念感、完備性、可證偽,充分性標(biāo)準(zhǔn)包括預(yù)測、個人理解和價值判斷三個標(biāo)準(zhǔn)。選擇信息資源管理領(lǐng)域部分論文數(shù)據(jù)開展摘要和全文層面的標(biāo)注實驗,在此基礎(chǔ)上實現(xiàn)論斷句自動化識別。對論斷句和非論斷句文本特征進行分析,研究發(fā)現(xiàn):①使用本文提出的判斷標(biāo)準(zhǔn),標(biāo)注者在摘要和全文層面對學(xué)術(shù)文本中論斷句和非論斷句標(biāo)注的一致性較高。②基于BERT+BiLSTM 論斷句識別方法取得了最優(yōu)的性能。③論斷句和非論斷句的長度在全文中的分布差異要大于在摘要中的差異;論斷句出現(xiàn)在文內(nèi)開頭和結(jié)尾的概率要高于非論斷句,段首和段尾句被標(biāo)注為論斷句的概率高于段中句;學(xué)術(shù)論文中論斷句TextRank 特征取值顯著高于非論斷句。在摘要層面,加入長度特征后,論斷句識別效果在F_1值上提升了0.5%。在全文層面,加入長度、段內(nèi)相對位置、文內(nèi)相對位置特征后,分類器識別效果在F_1 值上取得了2%的提升效果。

    本文不足之處在于:①僅選取了信息資源管理領(lǐng)域的部分數(shù)據(jù),數(shù)據(jù)量較少,范圍局限于人文社科領(lǐng)域,對自然科學(xué)領(lǐng)域的數(shù)據(jù)并未涉及,相關(guān)識別方法和結(jié)論的普適性還需進一步驗證,未來應(yīng)在此方面加以補充;②在論斷句語料標(biāo)注過程中,雖然不同標(biāo)注人員在一定判定原則的前提下取得了較高的一致性,但數(shù)據(jù)規(guī)模較小,未來應(yīng)對提出的判斷標(biāo)準(zhǔn)進行進一步完善;同時,論文不同區(qū)域的論斷句重要性并不相同,未來應(yīng)考慮論斷句權(quán)重計算問題;③當(dāng)前學(xué)術(shù)文本中論斷句識別已經(jīng)取得較好的效果,但使用的方法、選擇的特征相對有限,準(zhǔn)確率與召回率仍然存在一定提升空間,未來應(yīng)著重挖掘文本的功能結(jié)構(gòu)和推理結(jié)構(gòu),探索詞匯特征、句法特征、位置和長度特征的融合,提高論斷句或?qū)W術(shù)觀點句的識別效果。

    此外,在本文的研究基礎(chǔ)上未來還應(yīng)開展如下方向的研究:①本文從整句層面對論斷句進行了識別,未區(qū)分整句中的論斷性和非論斷性成分;未來,應(yīng)從詞匯層面精確地識別邊界,從主題、研究對象和判斷類型等多維視角構(gòu)建學(xué)術(shù)論斷的分類體系,并使用知識抽取的方式對各類論斷句進行細粒度地結(jié)構(gòu)化表示;②論斷句僅是學(xué)術(shù)觀點或論點的必要條件,未來應(yīng)從論斷句與上下文的修辭、邏輯關(guān)系入手對學(xué)術(shù)文本中的核心學(xué)術(shù)論點進行識別;同時,應(yīng)從歸納和演繹的視角對各個論斷的論證方式和論據(jù)進行識別、匹配和分析,在此基礎(chǔ)上對論點進行權(quán)重評估,從論點間關(guān)系間角度識別文獻核心論點及其之間的語義關(guān)系,全面揭示學(xué)術(shù)論文論證結(jié)構(gòu);③在對單篇學(xué)術(shù)論文論證結(jié)構(gòu)進行識別的基礎(chǔ)上,對同主題多文檔論證結(jié)構(gòu)進行聚類、對齊、比較和歸納,發(fā)現(xiàn)研究者在觀點上的分歧,綜合不同研究視角的觀點對研究對象和問題形成整體性和更全面的認知。相關(guān)技術(shù)與方法在學(xué)術(shù)觀點的查重、創(chuàng)新性評估、自動識別學(xué)派上有著廣泛的應(yīng)用前景。

    猜你喜歡
    全文層面長度
    江陰市三個層面構(gòu)建一體化治理重大事故隱患機制
    全文中文摘要
    1米的長度
    全文中文摘要
    愛的長度
    怎樣比較簡單的長度
    青年再造
    健康到底是什么層面的問題
    高三化學(xué)復(fù)習(xí)的四個“層面”
    不同長度
    讀寫算(上)(2015年6期)2015-11-07 07:17:55
    国产三级在线视频| 日韩欧美国产一区二区入口| 国产不卡一卡二| 亚洲av日韩精品久久久久久密| 天天躁日日操中文字幕| av片东京热男人的天堂| 啦啦啦观看免费观看视频高清| 麻豆成人av在线观看| 精品人妻1区二区| 精品乱码久久久久久99久播| 国产成人精品久久二区二区91| 国产美女午夜福利| 国产精品一区二区免费欧美| 国产视频一区二区在线看| 国产男靠女视频免费网站| 亚洲精品粉嫩美女一区| 久久九九热精品免费| 欧美中文综合在线视频| 亚洲国产日韩欧美精品在线观看 | 小说图片视频综合网站| 日韩 欧美 亚洲 中文字幕| 俄罗斯特黄特色一大片| 18禁黄网站禁片午夜丰满| 国产精品一区二区免费欧美| 熟女电影av网| 亚洲美女视频黄频| cao死你这个sao货| 特大巨黑吊av在线直播| 91九色精品人成在线观看| 999久久久国产精品视频| 天堂动漫精品| 国产亚洲av嫩草精品影院| 色尼玛亚洲综合影院| 欧美不卡视频在线免费观看| 久久欧美精品欧美久久欧美| 淫秽高清视频在线观看| 国产成人aa在线观看| 国产成人av激情在线播放| 小说图片视频综合网站| 国产精品久久久久久精品电影| 最近最新中文字幕大全免费视频| 国产精品亚洲av一区麻豆| 看黄色毛片网站| 好男人电影高清在线观看| 长腿黑丝高跟| 给我免费播放毛片高清在线观看| 国产人伦9x9x在线观看| 亚洲专区国产一区二区| 国产蜜桃级精品一区二区三区| 成人午夜高清在线视频| 91麻豆av在线| 757午夜福利合集在线观看| 日本与韩国留学比较| a级毛片a级免费在线| 成人性生交大片免费视频hd| 成人欧美大片| 午夜福利高清视频| 国产精品九九99| 1024手机看黄色片| 免费在线观看日本一区| 黄色 视频免费看| 免费电影在线观看免费观看| 日韩高清综合在线| 亚洲av电影不卡..在线观看| 国产毛片a区久久久久| 亚洲成人中文字幕在线播放| 久久久久久久精品吃奶| 国产精品久久电影中文字幕| 国产黄片美女视频| 久久精品国产亚洲av香蕉五月| 黄片小视频在线播放| 我要搜黄色片| 最新在线观看一区二区三区| 中文资源天堂在线| 婷婷精品国产亚洲av在线| 国产亚洲欧美在线一区二区| 99久久国产精品久久久| 国产1区2区3区精品| 国产高潮美女av| 国产欧美日韩精品亚洲av| 久久午夜亚洲精品久久| 国产探花在线观看一区二区| 99久久久亚洲精品蜜臀av| 老汉色av国产亚洲站长工具| 久99久视频精品免费| 99精品在免费线老司机午夜| 久久久久久九九精品二区国产| 久久久水蜜桃国产精品网| 可以在线观看的亚洲视频| 国产精品电影一区二区三区| 午夜福利在线在线| 日韩欧美免费精品| 人妻久久中文字幕网| 国内精品一区二区在线观看| 国内揄拍国产精品人妻在线| 免费搜索国产男女视频| 欧美中文综合在线视频| 夜夜看夜夜爽夜夜摸| 亚洲av美国av| 一级作爱视频免费观看| 99国产精品99久久久久| 免费看a级黄色片| 国产黄色小视频在线观看| 久久草成人影院| 亚洲最大成人中文| av欧美777| 久久亚洲真实| 国产aⅴ精品一区二区三区波| 熟女电影av网| 麻豆国产97在线/欧美| 女警被强在线播放| 国产熟女xx| 亚洲成人精品中文字幕电影| 欧美成人性av电影在线观看| 亚洲精品乱码久久久v下载方式 | 久久精品aⅴ一区二区三区四区| 国产精品 国内视频| 国产av一区在线观看免费| 国产亚洲av高清不卡| 精品乱码久久久久久99久播| 欧美日韩福利视频一区二区| 黑人操中国人逼视频| 久久人人精品亚洲av| 日本a在线网址| 亚洲avbb在线观看| 熟女电影av网| 视频区欧美日本亚洲| 成年免费大片在线观看| 日韩精品中文字幕看吧| 在线永久观看黄色视频| 精品一区二区三区视频在线 | 男人舔奶头视频| 99国产综合亚洲精品| 成年女人毛片免费观看观看9| 少妇熟女aⅴ在线视频| 国产主播在线观看一区二区| 国产精华一区二区三区| 国产av麻豆久久久久久久| 97碰自拍视频| 51午夜福利影视在线观看| 成人18禁在线播放| 99久久久亚洲精品蜜臀av| 国产精品自产拍在线观看55亚洲| 成人三级做爰电影| 国产亚洲精品久久久久久毛片| 99精品欧美一区二区三区四区| 狂野欧美白嫩少妇大欣赏| 91九色精品人成在线观看| 最新中文字幕久久久久 | 亚洲va日本ⅴa欧美va伊人久久| 男女下面进入的视频免费午夜| 久久久久九九精品影院| 国产精品野战在线观看| 精品久久久久久,| 欧美黑人巨大hd| 精品久久久久久久久久免费视频| 日韩精品青青久久久久久| 偷拍熟女少妇极品色| 成人三级做爰电影| 日本黄大片高清| 极品教师在线免费播放| 色尼玛亚洲综合影院| 两个人的视频大全免费| 免费看美女性在线毛片视频| 成人18禁在线播放| 国产乱人视频| 欧美激情在线99| 国产又黄又爽又无遮挡在线| 国产精品综合久久久久久久免费| 最近最新中文字幕大全免费视频| 欧美一级a爱片免费观看看| 嫩草影视91久久| 一夜夜www| 日韩欧美国产在线观看| www.自偷自拍.com| 日韩av在线大香蕉| 人妻丰满熟妇av一区二区三区| 99国产极品粉嫩在线观看| av视频在线观看入口| 国产又黄又爽又无遮挡在线| 99国产极品粉嫩在线观看| 欧美在线一区亚洲| 91老司机精品| 村上凉子中文字幕在线| 这个男人来自地球电影免费观看| 看黄色毛片网站| avwww免费| 麻豆国产av国片精品| 亚洲国产日韩欧美精品在线观看 | 老鸭窝网址在线观看| 亚洲人成网站高清观看| 欧美av亚洲av综合av国产av| 又大又爽又粗| 看黄色毛片网站| 久久这里只有精品中国| 久99久视频精品免费| 久久久久国产精品人妻aⅴ院| 免费电影在线观看免费观看| 首页视频小说图片口味搜索| 精品一区二区三区视频在线观看免费| 我要搜黄色片| 欧美一级a爱片免费观看看| 午夜影院日韩av| 国模一区二区三区四区视频 | 亚洲国产精品成人综合色| 日本一本二区三区精品| 搡老岳熟女国产| 欧美乱妇无乱码| 欧美乱色亚洲激情| 亚洲av免费在线观看| 18禁黄网站禁片午夜丰满| 欧美不卡视频在线免费观看| 在线观看美女被高潮喷水网站 | 国产精品av久久久久免费| 在线播放国产精品三级| av中文乱码字幕在线| cao死你这个sao货| 看黄色毛片网站| 色综合亚洲欧美另类图片| 成人av在线播放网站| 国产精品一区二区三区四区免费观看 | 国产午夜福利久久久久久| 一区二区三区激情视频| av国产免费在线观看| 久久久国产欧美日韩av| 亚洲成人中文字幕在线播放| 欧美黄色片欧美黄色片| 免费电影在线观看免费观看| 亚洲av美国av| www.www免费av| 婷婷丁香在线五月| 欧美日韩国产亚洲二区| 日本免费一区二区三区高清不卡| 88av欧美| 男女视频在线观看网站免费| 夜夜夜夜夜久久久久| 欧美一级a爱片免费观看看| 999久久久精品免费观看国产| 97超视频在线观看视频| 色精品久久人妻99蜜桃| 一本精品99久久精品77| 国产精品1区2区在线观看.| www日本黄色视频网| 久久久久久久精品吃奶| 国产高清videossex| 日本五十路高清| 久久久久国内视频| 欧美乱码精品一区二区三区| 国产欧美日韩精品亚洲av| 校园春色视频在线观看| 欧美+亚洲+日韩+国产| 老鸭窝网址在线观看| 在线国产一区二区在线| 97超视频在线观看视频| www.精华液| 婷婷精品国产亚洲av在线| 男人的好看免费观看在线视频| 综合色av麻豆| 高清毛片免费观看视频网站| 国产亚洲精品一区二区www| 国产精品免费一区二区三区在线| 国产成人欧美在线观看| 欧美+亚洲+日韩+国产| a在线观看视频网站| 亚洲成av人片在线播放无| 香蕉av资源在线| 少妇的丰满在线观看| 国产一区二区三区视频了| 亚洲七黄色美女视频| 日日夜夜操网爽| 久久久成人免费电影| 日本撒尿小便嘘嘘汇集6| 日韩中文字幕欧美一区二区| 成人午夜高清在线视频| 亚洲无线观看免费| 欧美性猛交黑人性爽| www国产在线视频色| 又紧又爽又黄一区二区| 国产黄色小视频在线观看| 国产黄色小视频在线观看| 国产日本99.免费观看| 国产精品永久免费网站| 99精品在免费线老司机午夜| 精品国产亚洲在线| 成人国产一区最新在线观看| 宅男免费午夜| 51午夜福利影视在线观看| 欧美日韩福利视频一区二区| 免费在线观看日本一区| 亚洲av美国av| 亚洲av日韩精品久久久久久密| 久久久久久九九精品二区国产| www日本在线高清视频| 三级国产精品欧美在线观看 | 中文在线观看免费www的网站| 高潮久久久久久久久久久不卡| 又黄又粗又硬又大视频| 亚洲成人久久性| 色在线成人网| 床上黄色一级片| 国产精品久久视频播放| 校园春色视频在线观看| 欧美乱码精品一区二区三区| 动漫黄色视频在线观看| 亚洲激情在线av| 国产高清有码在线观看视频| 夜夜夜夜夜久久久久| 老司机福利观看| 中文字幕久久专区| 国产伦一二天堂av在线观看| 欧美日韩瑟瑟在线播放| 亚洲片人在线观看| 亚洲九九香蕉| 成人性生交大片免费视频hd| 夜夜躁狠狠躁天天躁| 亚洲专区国产一区二区| 久久久国产欧美日韩av| 九色成人免费人妻av| 久久久久性生活片| 欧美高清成人免费视频www| 97碰自拍视频| 免费高清视频大片| 亚洲七黄色美女视频| 久久天躁狠狠躁夜夜2o2o| 麻豆av在线久日| 国产成人福利小说| 亚洲av日韩精品久久久久久密| 狠狠狠狠99中文字幕| 欧美乱妇无乱码| 色综合欧美亚洲国产小说| 亚洲av中文字字幕乱码综合| 精品不卡国产一区二区三区| 国产野战对白在线观看| 色吧在线观看| 欧美激情在线99| 欧美色欧美亚洲另类二区| 99久久精品一区二区三区| 国产午夜福利久久久久久| 少妇丰满av| 久久中文字幕一级| 国产麻豆成人av免费视频| xxx96com| 女同久久另类99精品国产91| 五月伊人婷婷丁香| 亚洲aⅴ乱码一区二区在线播放| 国产69精品久久久久777片 | 国产乱人视频| 国产成人系列免费观看| 亚洲av日韩精品久久久久久密| 在线观看日韩欧美| 免费在线观看日本一区| 日本黄大片高清| 十八禁网站免费在线| 国产精华一区二区三区| 国产综合懂色| 成人特级黄色片久久久久久久| 久久精品aⅴ一区二区三区四区| 欧美激情在线99| 法律面前人人平等表现在哪些方面| 国产精品一区二区三区四区免费观看 | 亚洲欧美精品综合一区二区三区| av国产免费在线观看| 亚洲av熟女| 国产成人啪精品午夜网站| 老熟妇乱子伦视频在线观看| 亚洲片人在线观看| 啪啪无遮挡十八禁网站| 精品久久久久久久久久久久久| 久久国产精品影院| 香蕉av资源在线| 国产亚洲av嫩草精品影院| 午夜久久久久精精品| 12—13女人毛片做爰片一| 国产三级黄色录像| 老司机午夜十八禁免费视频| 亚洲av片天天在线观看| 午夜福利欧美成人| 久久亚洲真实| 亚洲欧洲精品一区二区精品久久久| 国产高清视频在线播放一区| 久久中文字幕人妻熟女| 欧洲精品卡2卡3卡4卡5卡区| 亚洲精品在线美女| 欧美一区二区国产精品久久精品| xxxwww97欧美| 又黄又爽又免费观看的视频| 国产精品,欧美在线| 国产精品美女特级片免费视频播放器 | 国产黄片美女视频| 久久久久久久久久黄片| 99热6这里只有精品| 婷婷亚洲欧美| 长腿黑丝高跟| 免费看日本二区| 欧美精品啪啪一区二区三区| 香蕉av资源在线| 一级作爱视频免费观看| 精品久久久久久久久久免费视频| 国产爱豆传媒在线观看| 性色av乱码一区二区三区2| 精品久久久久久久久久久久久| 亚洲av成人不卡在线观看播放网| av视频在线观看入口| 制服人妻中文乱码| 久久精品人妻少妇| av视频在线观看入口| 淫妇啪啪啪对白视频| 国产野战对白在线观看| 一本久久中文字幕| 国产伦一二天堂av在线观看| 99热只有精品国产| 日本撒尿小便嘘嘘汇集6| h日本视频在线播放| 女生性感内裤真人,穿戴方法视频| 成人三级做爰电影| 亚洲 欧美 日韩 在线 免费| 琪琪午夜伦伦电影理论片6080| 国产亚洲欧美98| 免费无遮挡裸体视频| 长腿黑丝高跟| 欧美成人免费av一区二区三区| 亚洲av五月六月丁香网| 国产精品一区二区三区四区久久| 国产69精品久久久久777片 | 一夜夜www| 在线播放国产精品三级| 91字幕亚洲| 成人午夜高清在线视频| 男女那种视频在线观看| 婷婷精品国产亚洲av在线| 日本 欧美在线| 脱女人内裤的视频| 亚洲成人中文字幕在线播放| 国产成人影院久久av| 亚洲av成人一区二区三| 精品国产美女av久久久久小说| 1024手机看黄色片| 黑人操中国人逼视频| 国产精品香港三级国产av潘金莲| 麻豆国产av国片精品| 一个人看视频在线观看www免费 | 搡老岳熟女国产| 99久久无色码亚洲精品果冻| 天堂网av新在线| 丁香欧美五月| 国产亚洲av嫩草精品影院| 国产伦在线观看视频一区| 国产成年人精品一区二区| av天堂中文字幕网| 一区福利在线观看| 可以在线观看的亚洲视频| 国语自产精品视频在线第100页| 国产av不卡久久| 欧美成人免费av一区二区三区| 12—13女人毛片做爰片一| 天天躁日日操中文字幕| 搡老熟女国产l中国老女人| 亚洲av免费在线观看| 色av中文字幕| 欧美+亚洲+日韩+国产| 欧美乱妇无乱码| 国语自产精品视频在线第100页| 欧美性猛交黑人性爽| 99久久成人亚洲精品观看| 亚洲av成人不卡在线观看播放网| 色精品久久人妻99蜜桃| 无限看片的www在线观看| 1024香蕉在线观看| 久久久久性生活片| 国产视频一区二区在线看| 免费看美女性在线毛片视频| 久久人妻av系列| 少妇丰满av| 亚洲人与动物交配视频| 日本成人三级电影网站| 国产三级黄色录像| 99热这里只有精品一区 | 香蕉av资源在线| 久久久国产成人精品二区| av在线蜜桃| 日韩av在线大香蕉| 在线国产一区二区在线| 国产成年人精品一区二区| www.精华液| av国产免费在线观看| 美女 人体艺术 gogo| 婷婷精品国产亚洲av| 亚洲av电影在线进入| 久久久久精品国产欧美久久久| 日本五十路高清| 十八禁人妻一区二区| 岛国在线观看网站| 亚洲狠狠婷婷综合久久图片| 中文字幕久久专区| 久久精品国产亚洲av香蕉五月| 亚洲一区高清亚洲精品| 成年女人看的毛片在线观看| 日本 欧美在线| 亚洲va日本ⅴa欧美va伊人久久| 欧美一区二区国产精品久久精品| 日韩大尺度精品在线看网址| 宅男免费午夜| 色综合欧美亚洲国产小说| 又粗又爽又猛毛片免费看| 亚洲精品久久国产高清桃花| 国产午夜精品论理片| 久久香蕉国产精品| 成人18禁在线播放| 午夜影院日韩av| 亚洲成人久久爱视频| 精品一区二区三区视频在线观看免费| 一夜夜www| 99久久99久久久精品蜜桃| 国产成年人精品一区二区| 国产成人啪精品午夜网站| 五月伊人婷婷丁香| 桃色一区二区三区在线观看| 久久久久久人人人人人| 色精品久久人妻99蜜桃| 久久久久国产精品人妻aⅴ院| 听说在线观看完整版免费高清| 成人一区二区视频在线观看| 国产伦精品一区二区三区视频9 | 亚洲精品国产精品久久久不卡| 精品日产1卡2卡| 午夜福利在线在线| 国产淫片久久久久久久久 | 长腿黑丝高跟| 国产 一区 欧美 日韩| 99久久精品热视频| 法律面前人人平等表现在哪些方面| 啦啦啦免费观看视频1| e午夜精品久久久久久久| 老熟妇仑乱视频hdxx| 99在线视频只有这里精品首页| 1000部很黄的大片| 午夜福利视频1000在线观看| 激情在线观看视频在线高清| 国产精品av久久久久免费| 亚洲av成人一区二区三| 19禁男女啪啪无遮挡网站| 看免费av毛片| 欧美黑人欧美精品刺激| 国产在线精品亚洲第一网站| 十八禁网站免费在线| 一级毛片女人18水好多| 亚洲av美国av| 久久午夜综合久久蜜桃| 欧美午夜高清在线| 美女扒开内裤让男人捅视频| 99re在线观看精品视频| 狂野欧美激情性xxxx| 村上凉子中文字幕在线| 精品无人区乱码1区二区| 国产精品影院久久| 国产麻豆成人av免费视频| 国产乱人视频| 热99re8久久精品国产| 国产高清视频在线播放一区| 精品熟女少妇八av免费久了| 我的老师免费观看完整版| 禁无遮挡网站| 国产一区二区三区视频了| 男人和女人高潮做爰伦理| 亚洲电影在线观看av| 嫁个100分男人电影在线观看| 免费av不卡在线播放| 国产精品 国内视频| 欧美日韩精品网址| 久久天躁狠狠躁夜夜2o2o| 久久国产精品影院| 性色avwww在线观看| 白带黄色成豆腐渣| cao死你这个sao货| 国产精品一区二区三区四区免费观看 | 午夜福利视频1000在线观看| 婷婷精品国产亚洲av| 麻豆av在线久日| 国产精品久久久久久久电影 | 午夜亚洲福利在线播放| 国产免费男女视频| 国产高清有码在线观看视频| av天堂中文字幕网| 桃红色精品国产亚洲av| 欧美三级亚洲精品| 亚洲成av人片免费观看| 三级男女做爰猛烈吃奶摸视频| 久久天躁狠狠躁夜夜2o2o| 三级男女做爰猛烈吃奶摸视频| 狠狠狠狠99中文字幕| 日韩国内少妇激情av| 观看美女的网站| 日本熟妇午夜| 一个人免费在线观看的高清视频| 国产成人精品久久二区二区免费| 男女床上黄色一级片免费看| 真实男女啪啪啪动态图| 国产精品久久久久久精品电影| 国产高清videossex| 一进一出好大好爽视频| 亚洲天堂国产精品一区在线| 久久久久久久久久黄片| 久久久久久久久免费视频了| 欧美午夜高清在线| xxx96com| 亚洲精品美女久久久久99蜜臀| 亚洲人成网站高清观看| 国产av不卡久久| 小蜜桃在线观看免费完整版高清| 视频区欧美日本亚洲| 少妇的逼水好多| 俄罗斯特黄特色一大片| 天天一区二区日本电影三级| 母亲3免费完整高清在线观看| 亚洲专区国产一区二区|