• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于條件隨機(jī)場(chǎng)和詞向量的能源政策領(lǐng)域新詞發(fā)現(xiàn)

    2021-03-09 02:39:34張一帆張軍蓮汪鳴泉黃永健顧倩榮
    關(guān)鍵詞:新詞分詞語(yǔ)料

    張一帆,張軍蓮,汪鳴泉,呂 正,黃永健,顧倩榮

    (1.中國(guó)科學(xué)院上海高等研究院 碳數(shù)據(jù)與碳評(píng)估研究中心,上海 201210;2.中國(guó)科學(xué)院大學(xué),北京 100049;3.中國(guó)科學(xué)院上海高等研究院 中科院低碳轉(zhuǎn)化科學(xué)與工程重點(diǎn)試驗(yàn)室,上海 201210)

    近幾十年,中國(guó)的能源生產(chǎn)與消費(fèi)快速增長(zhǎng),能源事業(yè)取得長(zhǎng)足發(fā)展。同時(shí),全球氣候變化正成為全人類(lèi)共同的挑戰(zhàn)。為了不斷完善我國(guó)的能源體制機(jī)制,一大批相關(guān)法律、法規(guī)、規(guī)劃和條例等能源政策文件相繼出臺(tái)。這些文本文件往往精準(zhǔn)且深刻地反映著我國(guó)能源的發(fā)展歷史、現(xiàn)狀以及未來(lái)趨勢(shì),因此,如何從大量政策文件中提取出準(zhǔn)確有效的信息具有非常重要的現(xiàn)實(shí)意義,而要實(shí)現(xiàn)上述目的,首先需要對(duì)政策文本進(jìn)行分詞處理?,F(xiàn)有的分詞技術(shù)存在很多問(wèn)題,尤其是在面向具體領(lǐng)域時(shí),大量領(lǐng)域內(nèi)專(zhuān)業(yè)新詞的存在,使得分詞模型的準(zhǔn)確率受到嚴(yán)重影響,而這些專(zhuān)業(yè)詞匯往往對(duì)于文本的結(jié)構(gòu)化分析[1]、數(shù)據(jù)挖掘[2]以及信息檢索[3]等應(yīng)用具有重要影響。因此,領(lǐng)域新詞的發(fā)現(xiàn)識(shí)別至關(guān)重要。

    針對(duì)新詞發(fā)現(xiàn)問(wèn)題,主流的有基于規(guī)則、基于無(wú)監(jiān)督統(tǒng)計(jì)、基于機(jī)器學(xué)習(xí)和深度學(xué)習(xí)等幾類(lèi)方法。其中,文獻(xiàn)[4]基于漢語(yǔ)構(gòu)詞法,通過(guò)互斥性和構(gòu)詞規(guī)則對(duì)結(jié)果進(jìn)行篩選和拼接,在網(wǎng)絡(luò)語(yǔ)料上進(jìn)行新詞發(fā)現(xiàn),取得了較好的效果。但規(guī)則庫(kù)的構(gòu)建非常繁瑣復(fù)雜,同時(shí)不同領(lǐng)域的規(guī)則差異也較大,這意味著需要高昂的人工成本來(lái)適應(yīng)不同的領(lǐng)域語(yǔ)料。文獻(xiàn)[5]將逐點(diǎn)互信息(Pointwise mutual information,PMI)與鄰接熵(Branch entropy,BE)相結(jié)合,在大規(guī)模語(yǔ)料上進(jìn)行新詞發(fā)現(xiàn)。這種基于無(wú)監(jiān)督統(tǒng)計(jì)的方法有著較強(qiáng)的領(lǐng)域靈活性,但是數(shù)據(jù)稀疏的問(wèn)題使得新詞發(fā)現(xiàn)的準(zhǔn)確率不高。文獻(xiàn)[6]使用隱馬爾科夫模型并結(jié)合領(lǐng)域詞典的方法,來(lái)動(dòng)態(tài)識(shí)別和擴(kuò)充詞典。文獻(xiàn)[7]和文獻(xiàn)[8]整理出多種區(qū)分詞邊界的統(tǒng)計(jì)特征,并通過(guò)條件隨機(jī)場(chǎng)(Conditional random field,CRF)充分利用這些特征,在未標(biāo)注語(yǔ)料集中進(jìn)行新詞的發(fā)現(xiàn)試驗(yàn)。相較于基于無(wú)監(jiān)督統(tǒng)計(jì)的方法,機(jī)器學(xué)習(xí)的方法能夠有效提高新詞發(fā)現(xiàn)的表現(xiàn)。同時(shí),隨著深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)的研究,一些新的技術(shù)和模型被提出,如詞向量(Word embedding)和長(zhǎng)短記憶(Long short term memory,LSTM)神經(jīng)網(wǎng)絡(luò),使得新詞發(fā)現(xiàn)的性能有了進(jìn)一步的提高。文獻(xiàn)[9]首先提取語(yǔ)料中頻繁出現(xiàn)的n-gram片段,隨后利用詞向量之間的得分來(lái)衡量候選詞之間的聯(lián)系,從綜合語(yǔ)料中提取新詞。文獻(xiàn)[10]利用雙向長(zhǎng)短記憶(Bi-directional long short term memory,Bi-LSTM)神經(jīng)網(wǎng)絡(luò)模型,進(jìn)行古漢語(yǔ)語(yǔ)料的新詞發(fā)現(xiàn),試驗(yàn)結(jié)果證明了其有效性。但是基于機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的方法往往是有監(jiān)督的,其對(duì)于訓(xùn)練集的規(guī)模和質(zhì)量較為依賴(lài),人工成本過(guò)高,而對(duì)于包括能源政策在內(nèi)的眾多細(xì)分領(lǐng)域來(lái)說(shuō),常常很難有一個(gè)較高質(zhì)量的大規(guī)模標(biāo)注訓(xùn)練集。

    總的來(lái)說(shuō),現(xiàn)有新詞發(fā)現(xiàn)方法存在的缺陷,使得對(duì)于能源政策文本的結(jié)構(gòu)化分析效果不夠理想。本文通過(guò)改進(jìn)新詞發(fā)現(xiàn)方法,提高中文分詞的表現(xiàn),使其更適用于能源政策文本。針對(duì)能源政策領(lǐng)域新詞發(fā)現(xiàn)問(wèn)題,本文提出了一種新的基于條件隨機(jī)場(chǎng)CRF與詞向量的識(shí)別方法,結(jié)合所提出的領(lǐng)域種子詞典的概念,探索在無(wú)需手工標(biāo)注訓(xùn)練集的較低人工成本的前提下,進(jìn)行領(lǐng)域內(nèi)的新詞發(fā)現(xiàn),并通過(guò)在真實(shí)能源政策文件上的試驗(yàn)結(jié)果證明了所提方法的有效性。

    1 能源政策新詞定義

    中文新詞發(fā)現(xiàn),又稱(chēng)未登錄詞(Out of vocabulary)識(shí)別,其主要目的就是不斷完善現(xiàn)有詞典的詞匯庫(kù),從而更好地進(jìn)行后續(xù)的中文信息處理任務(wù)。傳統(tǒng)的新詞發(fā)現(xiàn)有兩種主要的定義:文獻(xiàn)[11]將新詞發(fā)現(xiàn)定義為補(bǔ)充現(xiàn)有分詞系統(tǒng)或者分詞詞典中尚不存在的詞匯;文獻(xiàn)[12]在此基礎(chǔ)上,將具有新意義的已存在詞匯也定義為新詞。而本文定義的新詞,除了包括以上兩點(diǎn)之外,還有以下兩點(diǎn)不同:

    (1)本文聚焦于能源政策領(lǐng)域這一特定交叉領(lǐng)域,因而從數(shù)據(jù)集中發(fā)現(xiàn)的新詞類(lèi)型可以分為能源新詞We、政策新詞Wp以及能源政策新詞Wep3類(lèi),即新詞集合WN此3者的并集。

    (2)新詞經(jīng)常被現(xiàn)有分詞器錯(cuò)誤地拆分為若干個(gè)字詞,因此本文所指的領(lǐng)域新詞,既有可能是一個(gè)詞匯,也有可能是一個(gè)由多個(gè)字詞組成的詞組。在能源政策領(lǐng)域,由多個(gè)字詞組成的新詞往往能夠包含更多的信息,更加準(zhǔn)確地反映能源行業(yè)的政策變遷、政府舉措和行業(yè)大勢(shì)等。

    表1列出了從能源政策文本中挑選出的4個(gè)例句。例句s1、s2、s3和s4分別來(lái)自我國(guó)的能源產(chǎn)業(yè)發(fā)展實(shí)施方案、電力發(fā)展規(guī)劃以及十三五能源發(fā)展規(guī)劃。

    表1 能源政策新詞示例

    其中“可再生能源”為一種能源種類(lèi),屬于能源新詞We;“西電東送”反映的是我國(guó)西部大開(kāi)發(fā)戰(zhàn)略中的能源部分,屬于能源政策新詞Wep;“加快轉(zhuǎn)型升級(jí)”為“加快”、“轉(zhuǎn)型”、“升級(jí)”3個(gè)詞語(yǔ)組成的詞組,表述我國(guó)能源發(fā)展面臨的形勢(shì)以及政府施行的舉措;“脫貧攻堅(jiān)”是我國(guó)發(fā)展的一個(gè)重大目標(biāo),后兩者均屬于政策新詞Wp。

    綜上所述,本文的新詞發(fā)現(xiàn)可形式化定義為:針對(duì)能源政策領(lǐng)域D,通過(guò)新詞發(fā)現(xiàn)技術(shù)F,識(shí)別在某一時(shí)刻t0之后收集的文本集合T∈D,獲取新詞集合WN={We,Wp,Wep}。

    2 能源政策領(lǐng)域新詞發(fā)現(xiàn)設(shè)計(jì)

    2.1 總體框架

    本文提出的能源政策領(lǐng)域新詞發(fā)現(xiàn)方法由數(shù)據(jù)集自動(dòng)擴(kuò)充與標(biāo)注、CRF模型訓(xùn)練和識(shí)別、領(lǐng)域種子詞典建立與候選新詞收集、詞向量篩選新詞等部分組成。新詞發(fā)現(xiàn)的過(guò)程如圖1所示。

    圖1 新詞發(fā)現(xiàn)流程

    首先,針對(duì)能源政策領(lǐng)域不存在大規(guī)模標(biāo)注數(shù)據(jù)集的情況,利用無(wú)監(jiān)督統(tǒng)計(jì)量對(duì)訓(xùn)練集進(jìn)行領(lǐng)域語(yǔ)料的自動(dòng)擴(kuò)充與標(biāo)注,以提高CRF模型在特定領(lǐng)域的性能;然后,通過(guò)分析能源政策文本的特點(diǎn),提出并構(gòu)建領(lǐng)域種子詞典,并將其與CRF模型標(biāo)注后的結(jié)果相結(jié)合,得到候選新詞集合;最終,通過(guò)詞向量之間的評(píng)分來(lái)對(duì)候選新詞進(jìn)行篩選,從而得到能源政策新詞。

    2.2 數(shù)據(jù)集擴(kuò)充與標(biāo)注

    目前,在部分領(lǐng)域已經(jīng)存在一些人工標(biāo)注數(shù)據(jù)集,例如人民日?qǐng)?bào)RFP(People’s Daily Corpus)數(shù)據(jù)集、MSRA(Microsoft Research Asia)數(shù)據(jù)集等。這些語(yǔ)料被公認(rèn)符合黃金標(biāo)準(zhǔn)(Golden standard),經(jīng)常被用作模型的訓(xùn)練集和測(cè)試集。但在實(shí)際應(yīng)用中,針對(duì)特定領(lǐng)域的機(jī)器學(xué)習(xí)模型,通常需要添加該領(lǐng)域的訓(xùn)練集來(lái)獲得性能上的提升。但人工標(biāo)注數(shù)據(jù)集是一項(xiàng)耗時(shí)耗力的工作,因此本文使用無(wú)監(jiān)督算法在現(xiàn)有標(biāo)注數(shù)據(jù)集的基礎(chǔ)上進(jìn)行訓(xùn)練集的自動(dòng)擴(kuò)充。逐點(diǎn)關(guān)聯(lián)時(shí)間信息(Pointwise association times information,PATI)[13]作為一種無(wú)監(jiān)督統(tǒng)計(jì)量,用于衡量字符串內(nèi)部聯(lián)系的緊密程度。相較于共現(xiàn)頻次(Co-occurrence frequency)和PMI等經(jīng)典指標(biāo),PATI利用了更多來(lái)自文本的統(tǒng)計(jì)信息,因而能夠挖掘出更多含有實(shí)際意義的合理n-gram片段。

    對(duì)于一個(gè)字符總數(shù)為N的能源政策文本集C,存在一個(gè)長(zhǎng)度固定為s的n-gram片段g,字符串a(chǎn),b是n-gram片段g的任意左、右兩部分,即g=concat(a,b),其對(duì)應(yīng)的頻率分別為fa、fb和fg,則g的PATI計(jì)算如下

    PATIg=fg×MP×AT

    (1)

    MP和AT的定義分別如下

    (2)

    即給定一個(gè)n-gram片段g,總會(huì)存在一組特定的左右組合(am,bm)能夠取得最小化,從而滿(mǎn)足MP。

    (3)

    rate和AC的公式如下

    (3)

    (5)

    式中:fam*和f*bm分別是以am作為左半部分的n-gram片段集合{am,*}和以bm作為右半部分的n-gram片段集合{*,bm}內(nèi)的元素頻率之和,sizeof代表集合內(nèi)n-gram元素的個(gè)數(shù)。

    在計(jì)算得到n-gram片段的PATI值后,按照大小進(jìn)行降序排列,并在固定最大長(zhǎng)度范圍的基礎(chǔ)上,抽出一定數(shù)量的排名靠前的2-gram,3-gram,…,n-gram片段,由于這些被抽取的n-gram片段均有著較高的PATI值,即意味著其中有許多是具有實(shí)際意義的能源政策字符片段。最后將這些片段作為新增數(shù)據(jù)添加到CRF的訓(xùn)練集中。雖然基于無(wú)監(jiān)督的方法抽取出的n-gram片段會(huì)含有一些噪音,但是能在很大程度上豐富模型在特定領(lǐng)域的數(shù)據(jù),同時(shí)由于后續(xù)還有進(jìn)一步的識(shí)別和篩選,所以該方法能夠在總體上提高CRF分詞模型在特定領(lǐng)域的表現(xiàn)。

    本文所采用的是6-tag標(biāo)注方式,相較于常用的4-tag標(biāo)注,6-tag包含了詞中順序等更多的信息,文獻(xiàn)[14]證明其在CRF模型中有更好的效果。此外,除了詞本身,還引入了詞性作為分詞特征,本文的詞性標(biāo)注參照RFP標(biāo)注規(guī)則,包括基本詞類(lèi)標(biāo)記、專(zhuān)有名詞標(biāo)記以及語(yǔ)言學(xué)標(biāo)記等,總計(jì)40多個(gè)標(biāo)記。

    2.3 CRF模型訓(xùn)練和識(shí)別

    CRF[15]是一種判別式的概率圖模型,能夠充分利用多種具有交疊性的內(nèi)外部特征。相較于隱馬爾科夫和最大熵模型等,CRF能夠擺脫局部性的缺陷,具有表達(dá)長(zhǎng)距離依賴(lài)的能力,并且能夠?qū)⑻卣鬟M(jìn)行全局歸一化,進(jìn)而達(dá)到全局最優(yōu)的目的,較好地解決標(biāo)注偏置的問(wèn)題。

    CRF模型的訓(xùn)練基于標(biāo)注語(yǔ)料集,通過(guò)充分利用上下文信息和內(nèi)外部特征信息,學(xué)習(xí)得到模型的參數(shù)。文獻(xiàn)[16]發(fā)現(xiàn),與基于詞相比,基于字符的CRF模型在表現(xiàn)上均有明顯提升。因此,本文采用帶有詞性的字符序列作為模型的訓(xùn)練輸入。在本文中,模型輸入數(shù)據(jù)的觀察序列為x={x1,x2,…,xn},其對(duì)應(yīng)的狀態(tài)序列為y={y1,y2,…,yn}。此時(shí)能源政策領(lǐng)域新詞發(fā)現(xiàn)問(wèn)題可定義為:在觀察序列x已知的情況下,求解狀態(tài)序列y的條件概率p(y|x)最大時(shí)的狀態(tài)序列,p(y|x)計(jì)算方法如下所示

    (6)

    式中:f為特征函數(shù),其取值只有兩種,若序列符合該特征,則f輸出為1;若不符合,則為0。θ為函數(shù)f的權(quán)重參數(shù);yt為文本當(dāng)前的輸出狀態(tài),yt-1為上一步輸出狀態(tài);xt為當(dāng)前的輸入序列;Z(x)為全局歸一化因子,其計(jì)算方法為

    (7)

    在訓(xùn)練得到CRF分詞模型之后,在獨(dú)立的新詞發(fā)現(xiàn)試驗(yàn)語(yǔ)料集上進(jìn)行序列標(biāo)注,通過(guò)解碼算法輸出一個(gè)最優(yōu)的帶有6-tag標(biāo)注的字符序列組合。

    2.4 領(lǐng)域種子詞典與候選新詞收集

    雖然新詞的種類(lèi)和數(shù)量紛繁復(fù)雜,但是每個(gè)細(xì)分領(lǐng)域的新詞都有其特點(diǎn)。通過(guò)對(duì)能源政策領(lǐng)域的文本進(jìn)行分析,發(fā)現(xiàn)該領(lǐng)域的文本表述較為正式,絕大多數(shù)的新詞在組成上都可以由能源詞匯或政策詞匯在句子中前后擴(kuò)展得來(lái),而這些詞匯基本為常見(jiàn)的一字詞和二字詞,易于收集和整理。因此,本文提出“能源政策領(lǐng)域種子詞典”的概念。首先使用TextRank[17]算法對(duì)能源政策文本進(jìn)行關(guān)鍵詞提取,將提取的一字詞和二字詞作為候選種子,隨后對(duì)這些候選詞匯是否屬于能源或政策范圍進(jìn)行判斷,并輔以人工補(bǔ)充和完善,最終形成能源政策領(lǐng)域種子詞典。部分種子詞匯及其對(duì)應(yīng)新詞示例如表2所示。

    表2 種子詞典及對(duì)應(yīng)新詞示例

    在領(lǐng)域種子詞典構(gòu)建之后,將其與CRF模型序列標(biāo)注的結(jié)果結(jié)合,結(jié)合的方式有兩種:(1)若分詞結(jié)果屬于領(lǐng)域種子詞典,則以此詞匯為基礎(chǔ),對(duì)其所在的句子進(jìn)行前向和后向擴(kuò)展,擴(kuò)展的長(zhǎng)度為預(yù)設(shè)的窗口大小,擴(kuò)展后形成的詞匯組合即可加入到候選新詞集合;(2)若分詞結(jié)果的子字符串屬于領(lǐng)域種子詞典,則不進(jìn)行擴(kuò)展,直接將該詞加入到候選新詞集中。

    2.5 詞向量新詞篩選

    詞向量通常有兩種表示方式:離散表示(One-hot representation)和分布式表示(Distributed representation)。離散表示由于不能表達(dá)詞語(yǔ)詞之間的關(guān)系以及維度爆炸的缺陷,逐漸被分布式表示所取代。文獻(xiàn)[18]通過(guò)訓(xùn)練連續(xù)詞袋模型(Continuous bag-of-word model,CBOW)和Skip-gram模型,得到對(duì)文本字詞的分布式表示,能夠有效地捕捉詞語(yǔ)豐富的語(yǔ)義含義。其中,CBOW通過(guò)輸入固定窗口大小的詞的前后上下文,來(lái)預(yù)測(cè)目標(biāo)詞語(yǔ)出現(xiàn)的概率,進(jìn)而得到詞向量。而Skip-gram的訓(xùn)練目標(biāo)則是通過(guò)輸入單個(gè)詞,來(lái)預(yù)測(cè)該詞的上下文。

    由于2.4節(jié)生成的候選新詞集合有著固定的窗口大小,因而詞組中會(huì)存在一定的噪音詞匯,需要進(jìn)一步的篩選。候選新詞集合中的一個(gè)詞組如果能成為一個(gè)新詞,那么這個(gè)詞組中的詞匯通常會(huì)出現(xiàn)在相似的上下文環(huán)境中,即這些詞匯之間存在著較為緊密的語(yǔ)義關(guān)系。而詞向量已經(jīng)被證明能夠捕捉隱藏于語(yǔ)料中的信息,因此通過(guò)計(jì)算詞向量之間的評(píng)分,能夠得到詞匯之間的聯(lián)系強(qiáng)弱判斷。例如,對(duì)于能源政策候選新詞集合中的一個(gè)詞組{自主,創(chuàng)新,取得,重大},“自主”與“創(chuàng)新”對(duì)應(yīng)的詞向量之間的余弦相似度為0.54,而“創(chuàng)新”與“取得”之間為0.13,“取得”與“重大”之間為0.12。這表明“自主創(chuàng)新”相較于“自主創(chuàng)新取得”、“自主創(chuàng)新取得重大”等組合,更有可能成為一個(gè)合理的能源政策新詞。對(duì)于候選新詞集,基于詞向量的候選新詞篩選具體算法如下:

    3 試驗(yàn)及分析

    3.1 試驗(yàn)數(shù)據(jù)

    本文的試驗(yàn)數(shù)據(jù)集可以分為兩類(lèi),第一類(lèi)是現(xiàn)在已有的人工標(biāo)注數(shù)據(jù)集,本文選擇使用1998年版人民日?qǐng)?bào)RFP數(shù)據(jù)作為CRF訓(xùn)練的基礎(chǔ)數(shù)據(jù)集,約180萬(wàn)字;第二類(lèi)是由爬蟲(chóng)程序從某能源信息網(wǎng)站抓取得到,范圍是21世紀(jì)以來(lái)全國(guó)各地的能源政策公開(kāi)文件,包括政策規(guī)劃、實(shí)施細(xì)則、通知批復(fù)、政策解讀等。將第二類(lèi)數(shù)據(jù)分為4部分,首先隨機(jī)抽出部分政策文件作為模型驗(yàn)證集、新詞發(fā)現(xiàn)測(cè)試集、分詞效果測(cè)試集,以上3部分?jǐn)?shù)據(jù)之間不存在重疊,然后將其余文件作為CRF訓(xùn)練集擴(kuò)充來(lái)源、種子詞典生成數(shù)據(jù)集以及詞向量訓(xùn)練數(shù)據(jù)集。對(duì)于新詞發(fā)現(xiàn)試驗(yàn)數(shù)據(jù)集進(jìn)行細(xì)致的6-tag人工標(biāo)注和檢查,將標(biāo)注結(jié)果與jieba詞典進(jìn)行比照,將人工標(biāo)注新詞作為試驗(yàn)的黃金標(biāo)準(zhǔn)。

    3.2 試驗(yàn)設(shè)計(jì)

    為了證明本文所提方法的有效性,本文進(jìn)行了如下3個(gè)部分試驗(yàn)。

    (1)驗(yàn)證通過(guò)無(wú)監(jiān)督統(tǒng)計(jì)量擴(kuò)充訓(xùn)練集,對(duì)CRF模型性能的提升。如2.2節(jié)所述,首先計(jì)算PATI統(tǒng)計(jì)量并排序,然后抽取排名靠前的n-gram片段作為新增CRF訓(xùn)練集。隨后使用訓(xùn)練得到的CRF模型在驗(yàn)證集上進(jìn)行分詞,并將結(jié)果與第三方分詞器jieba、Thulac作對(duì)比。為了試驗(yàn)不同規(guī)模的數(shù)據(jù)擴(kuò)充產(chǎn)生的影響,本部分試驗(yàn)通過(guò)采取逐步擴(kuò)大訓(xùn)練集的方式,進(jìn)行了多次試驗(yàn),當(dāng)試驗(yàn)結(jié)果的F值浮動(dòng)率不超過(guò)1%時(shí),即認(rèn)為模型趨于穩(wěn)定。

    (2)能源政策新詞發(fā)現(xiàn)試驗(yàn)。在訓(xùn)練得到CRF模型之后,首先使用jieba分詞工具對(duì)語(yǔ)料集進(jìn)行分詞,隨后計(jì)算TextRank統(tǒng)計(jì)量,設(shè)定固定的閾值,并結(jié)合少量人工篩選和補(bǔ)充的方式,構(gòu)建能源政策領(lǐng)域種子詞典。然后根據(jù)種子詞典收集候選新詞,并使用word2vec進(jìn)行詞向量的訓(xùn)練。最后對(duì)候選新詞中的詞組進(jìn)行詞向量的余弦相似度評(píng)分篩選,從而得到能源政策新詞。由于詞向量模型與生成向量的維度以及評(píng)分的閾值是新詞發(fā)現(xiàn)中兩個(gè)較為重要的變量,該部分試驗(yàn)將首先在驗(yàn)證集上分析這兩個(gè)因素對(duì)于新詞發(fā)現(xiàn)的影響。隨后在新詞發(fā)現(xiàn)測(cè)試集上采用準(zhǔn)確率Precision、召回率Recall以及F1值作為結(jié)果評(píng)價(jià)指標(biāo)。

    (3)新詞發(fā)現(xiàn)結(jié)果對(duì)于分詞性能的提升對(duì)比試驗(yàn)。由于本工作的背景是通過(guò)新詞發(fā)現(xiàn)來(lái)改進(jìn)對(duì)能源政策文本分詞的表現(xiàn),故分別將第二部分試驗(yàn)以及其他新詞發(fā)現(xiàn)baselines方法的新詞發(fā)現(xiàn)結(jié)果添加到分詞工具中,并在分詞效果測(cè)試集上進(jìn)行評(píng)估和對(duì)比。

    3.3 試驗(yàn)結(jié)果與分析

    (1)CRF模型的訓(xùn)練。

    由于PATI統(tǒng)計(jì)量可以用來(lái)篩選任意長(zhǎng)度的n-gram片段,因此在本文試驗(yàn)中,首先需要設(shè)定n-gram的最大長(zhǎng)度。通過(guò)結(jié)合文獻(xiàn)[19]以及對(duì)能源政策文本的分析,將n-gram的最大長(zhǎng)度設(shè)定為6。對(duì)于不同長(zhǎng)度的n-gram片段,按照表3的數(shù)量比例,進(jìn)行抽取。

    隨后,根據(jù)RFP詞性標(biāo)注規(guī)則,進(jìn)行自動(dòng)化標(biāo)注,然后作為新增訓(xùn)練集加入到CRF模型基礎(chǔ)訓(xùn)練集中,增加的方式為逐步遞增。將訓(xùn)練得到的CRF模型在新詞發(fā)現(xiàn)數(shù)據(jù)集進(jìn)行分詞試驗(yàn),并將分詞結(jié)果與第三方分詞器jieba、Thulac作對(duì)比,使用分詞的精確率、召回率和F1值3個(gè)指標(biāo)來(lái)衡量模型分詞的性能,具體結(jié)果如表4所示。

    表3 n-gram片段抽取數(shù)量比例

    可以看出,在未擴(kuò)充的基礎(chǔ)數(shù)據(jù)集上訓(xùn)練得到的CRF模型(CRF-0),在能源政策語(yǔ)料上的分詞效果與第三方分詞器相比,差距較大。主要原因是基礎(chǔ)訓(xùn)練集主要是新聞?wù)Z料,規(guī)模有限,在此基礎(chǔ)上訓(xùn)練的模型無(wú)法很好地識(shí)別能源政策文本中的詞匯,尤其是能源政策新詞。第三方分詞器由于其本身的訓(xùn)練語(yǔ)料的規(guī)模較大,領(lǐng)域覆蓋面更廣,尤其對(duì)于通用詞匯的識(shí)別效果較好,因而有著相對(duì)較高的F1值。例如Thulac基礎(chǔ)版的分詞模型的訓(xùn)練集規(guī)模約為1 200萬(wàn)字,更復(fù)雜的聯(lián)合標(biāo)注模型的人工標(biāo)注訓(xùn)練集約則為5 800萬(wàn)字。而將PATI值較高的n-gram片段作為訓(xùn)練集加入到CRF的基礎(chǔ)訓(xùn)練集之后,模型的分詞性能有了較明顯的提升,這主要是由于新模型的領(lǐng)域適應(yīng)性得到了增強(qiáng),從而能夠發(fā)現(xiàn)許多無(wú)法被現(xiàn)有分詞系統(tǒng)識(shí)別出的能源政策領(lǐng)域新詞。在新增訓(xùn)練集規(guī)模達(dá)到105 000后,模型(CRF-105000)F1值達(dá)到0.689,此后當(dāng)訓(xùn)練集繼續(xù)擴(kuò)大,模型的性能基本趨于穩(wěn)定,整體表現(xiàn)也與第三方分詞器相差不大。而當(dāng)新增數(shù)據(jù)集規(guī)模達(dá)到210 000時(shí),模型(CRF-210000)的性能較之前有了一定的下降,這是由于新增數(shù)據(jù)中出現(xiàn)了較多沒(méi)有實(shí)際意義的噪音片段,對(duì)于模型的訓(xùn)練造成了影響。同時(shí),為了在CRF模型性能和統(tǒng)計(jì)量計(jì)算效率之間達(dá)到平衡,本文在后續(xù)試驗(yàn)中,將新增數(shù)據(jù)集規(guī)模固定為105 000。

    (2)新詞發(fā)現(xiàn)試驗(yàn)。

    在訓(xùn)練得到CRF模型之后,需要生成能源政策領(lǐng)域種子詞典。首先將種子詞典生成數(shù)據(jù)集劃分為20個(gè)部分,將種子詞匯的最大長(zhǎng)度固定為2,通過(guò)計(jì)算TextRank,從每部分?jǐn)?shù)據(jù)中抽出50個(gè)評(píng)分靠前的詞匯,通過(guò)去重操作后,得到270個(gè)不重復(fù)的關(guān)鍵詞,隨后通過(guò)人工對(duì)于這些詞匯是否屬于能源政策領(lǐng)域進(jìn)行篩選,并補(bǔ)充部分政策常用術(shù)語(yǔ)和能源種類(lèi)術(shù)語(yǔ),最終形成能源政策領(lǐng)域的種子詞典,總計(jì)253個(gè)單字詞和二字詞。然后將種子詞典與CRF模型的識(shí)別結(jié)果按照2.4節(jié)所述的方式進(jìn)行結(jié)合,設(shè)定窗口大小為5,以含有種子詞典的詞匯為窗口中心,收集候選新詞集合。候選新詞收集完成之后,使用word2vec模型在分詞后的語(yǔ)料集上進(jìn)行詞向量訓(xùn)練。最后通過(guò)計(jì)算詞匯之間的評(píng)分,來(lái)篩選候選新詞。在設(shè)定相同閾值的情況下,詞向量模型的選擇以及詞向量的維數(shù)在驗(yàn)證集上,對(duì)新詞發(fā)現(xiàn)試驗(yàn)的影響如圖2所示。

    圖2 不同詞向量模型與維數(shù)時(shí)的新詞識(shí)別性能

    可以看出,在本試驗(yàn)中,基于CBOW模型的能源政策新詞發(fā)現(xiàn)性能整體稍好于Skip-gram模型,并且在詞向量維數(shù)從25增長(zhǎng)到200再到300的變化過(guò)程中,新詞發(fā)現(xiàn)試驗(yàn)的F1值均大致呈現(xiàn)出先上升,后保持平穩(wěn)甚至下降的趨勢(shì)。這主要是因?yàn)樵~向量的維度代表了詞語(yǔ)的特征,前期詞向量維數(shù)的增加,能夠更豐富地表示詞語(yǔ)的語(yǔ)義信息,從而更好地實(shí)現(xiàn)詞語(yǔ)的區(qū)分,后續(xù)的詞向量評(píng)分也能更好統(tǒng)計(jì)出具有緊密聯(lián)系的詞語(yǔ)集合。但詞向量的維度如果過(guò)高,也會(huì)使得詞語(yǔ)之間的關(guān)系被過(guò)分淡化。除此之外,由于本文試驗(yàn)中的詞向量訓(xùn)練數(shù)據(jù)集屬于能源政策這一細(xì)分領(lǐng)域,規(guī)模有限,過(guò)高的詞向量維度也會(huì)導(dǎo)致過(guò)擬合。因此,在后續(xù)試驗(yàn)中,選擇CBOW模型作為詞向量訓(xùn)練模型,將詞向量的維度固定為200維。

    在確定了詞向量模型及其維度之后,不同的相似度閾值對(duì)于能源政策新詞發(fā)現(xiàn)的試驗(yàn)結(jié)果的影響如表5所示。

    表5 新詞發(fā)現(xiàn)結(jié)果

    從表5可以看出,閾值的選擇對(duì)于新詞識(shí)別的效果有著一定的影響。隨著閾值的增大,識(shí)別的準(zhǔn)確率持續(xù)上升,上升速度由快到緩,而召回率卻經(jīng)歷了先平穩(wěn)上升,后又快速下降的過(guò)程,模型的整體效果在閾值θ=0.4時(shí)取得最優(yōu),達(dá)到0.686。

    (3)分詞對(duì)比試驗(yàn)。

    為了進(jìn)一步驗(yàn)證和對(duì)比所提方法的有效性,本文將文獻(xiàn)[5]以及2.3節(jié)的方法作為baselines,將3種新詞發(fā)現(xiàn)方法的結(jié)果加入到j(luò)ieba、Thulac分詞工具中,在分詞效果測(cè)試集上進(jìn)行評(píng)估,采用準(zhǔn)確率、召回率和F1值作為評(píng)價(jià)指標(biāo),結(jié)果如表6所示。其中jieba、Thulac為未添加新詞的原始分詞工具,PMI+BE+jieba、PMI+BE+Thulac為文獻(xiàn)[5]方法與jieba、Thulac相結(jié)合的分詞模型,PATI+CRF+jieba、PATI+CRF+Thulac為2.3節(jié)方法與分詞工具相結(jié)合的分詞模型,CEPWD+jieba、CEPWD+Thulac為本文所提新詞發(fā)現(xiàn)方法與分詞工具相結(jié)合的分詞模型。

    表6 各分詞模型對(duì)比

    從表中可以看出,本文所提的方法CEPWD在分詞效果提升方面最為顯著,相較于jieba和Thulac,F1值分別提高了11.2%和10.8%,這是由于該方法相對(duì)于PMI+BE這種完全依靠無(wú)監(jiān)督統(tǒng)計(jì)的方法,能夠在新詞發(fā)現(xiàn)上能夠取得更高的準(zhǔn)確率。而相較于PATI+CRF來(lái)說(shuō),CEPWD增加了詞向量篩選候選新詞這一環(huán)節(jié),因而能夠取得更高的新詞發(fā)現(xiàn)表現(xiàn),進(jìn)而提升能源政策文本的分詞效果。

    4 結(jié)束語(yǔ)

    本文針對(duì)能源政策領(lǐng)域新詞識(shí)別問(wèn)題,提出一種基于條件隨機(jī)場(chǎng)和詞向量的發(fā)現(xiàn)方法,通過(guò)無(wú)監(jiān)督算法PATI擴(kuò)充CRF模型的訓(xùn)練集,避免了耗時(shí)耗力的人工標(biāo)注步驟并改善了CRF模型在特定領(lǐng)域的表現(xiàn),充分考慮了數(shù)據(jù)集的領(lǐng)域特性和語(yǔ)義特性,提出了領(lǐng)域種子詞典的概念,在少量人工成本的情況下,利用詞向量的評(píng)分篩選,實(shí)現(xiàn)了新詞的有效識(shí)別。試驗(yàn)結(jié)果表明,該方法能夠取得良好的新詞識(shí)別效果,在模型整體性能與人工成本之間達(dá)到了有效平衡,相對(duì)于其他新詞發(fā)現(xiàn)baselines方法,能夠更加顯著地提高中文分詞在能源政策文本上的表現(xiàn)。同時(shí),試驗(yàn)發(fā)現(xiàn)數(shù)據(jù)集擴(kuò)充規(guī)模、詞向量模型以及詞向量評(píng)分閾值也會(huì)對(duì)新詞識(shí)別的結(jié)果有一定影響。最近幾年,基于注意力機(jī)制的深度學(xué)習(xí)模型,例如GPT-2、BERT等,在自然語(yǔ)言處理的多項(xiàng)任務(wù)上取得了相當(dāng)好的效果。將預(yù)訓(xùn)練模型和遷移學(xué)習(xí)技術(shù)結(jié)合起來(lái),通過(guò)主動(dòng)學(xué)習(xí)和不完全學(xué)習(xí)等弱監(jiān)督的方式,充分利用本研究的新詞發(fā)現(xiàn)結(jié)果,在盡可能低的人工成本下,提高模型在專(zhuān)業(yè)領(lǐng)域的新詞發(fā)現(xiàn)性能,將會(huì)是下一步需要解決的問(wèn)題。

    猜你喜歡
    新詞分詞語(yǔ)料
    結(jié)巴分詞在詞云中的應(yīng)用
    《微群新詞》選刊之十四
    基于語(yǔ)料調(diào)查的“連……都(也)……”出現(xiàn)的語(yǔ)義背景分析
    值得重視的分詞的特殊用法
    華語(yǔ)電影作為真實(shí)語(yǔ)料在翻譯教學(xué)中的應(yīng)用
    《苗防備覽》中的湘西語(yǔ)料
    國(guó)內(nèi)外語(yǔ)用學(xué)實(shí)證研究比較:語(yǔ)料類(lèi)型與收集方法
    小議網(wǎng)絡(luò)新詞“周邊”
    高考分詞作狀語(yǔ)考點(diǎn)歸納與疑難解析
    外教新詞堂
    国产区一区二久久| 亚洲av成人不卡在线观看播放网| 亚洲,欧美精品.| 欧美性猛交╳xxx乱大交人| 又大又爽又粗| 午夜久久久在线观看| 人人妻人人看人人澡| 欧美成人午夜精品| 丁香欧美五月| 在线观看日韩欧美| 人妻丰满熟妇av一区二区三区| 成年版毛片免费区| 国产野战对白在线观看| 亚洲av电影在线进入| 精品久久久久久久末码| 亚洲国产精品久久男人天堂| 手机成人av网站| 久久人人精品亚洲av| 欧美黄色片欧美黄色片| 午夜福利视频1000在线观看| 一卡2卡三卡四卡精品乱码亚洲| 国产亚洲精品综合一区在线观看 | 激情在线观看视频在线高清| 亚洲五月色婷婷综合| 国产一级毛片七仙女欲春2 | 青草久久国产| 三级毛片av免费| 国产成人啪精品午夜网站| 国产精品野战在线观看| 91九色精品人成在线观看| 曰老女人黄片| 国产蜜桃级精品一区二区三区| cao死你这个sao货| 级片在线观看| 国产精品98久久久久久宅男小说| avwww免费| 最近最新中文字幕大全免费视频| 欧美一级毛片孕妇| 黄色成人免费大全| 国产成年人精品一区二区| 国产成人影院久久av| svipshipincom国产片| 女性被躁到高潮视频| 国产精品久久久av美女十八| 老鸭窝网址在线观看| 成熟少妇高潮喷水视频| 日本成人三级电影网站| 国产av一区二区精品久久| 亚洲国产精品成人综合色| 欧美一级毛片孕妇| 国产视频一区二区在线看| 少妇被粗大的猛进出69影院| 一本久久中文字幕| 一级毛片精品| 无遮挡黄片免费观看| 日韩欧美免费精品| 美女扒开内裤让男人捅视频| 国产一区二区激情短视频| av福利片在线| 男男h啪啪无遮挡| 男人舔女人的私密视频| 中文字幕另类日韩欧美亚洲嫩草| 欧美日韩福利视频一区二区| x7x7x7水蜜桃| 国产日本99.免费观看| 首页视频小说图片口味搜索| 成熟少妇高潮喷水视频| 人妻丰满熟妇av一区二区三区| 真人做人爱边吃奶动态| 国产精品乱码一区二三区的特点| 婷婷亚洲欧美| 久久久久久人人人人人| 在线视频色国产色| 久久婷婷人人爽人人干人人爱| 啦啦啦 在线观看视频| a级毛片在线看网站| 国产精品 欧美亚洲| 国产精品亚洲一级av第二区| 亚洲精品粉嫩美女一区| 亚洲成a人片在线一区二区| 亚洲国产日韩欧美精品在线观看 | 美女高潮喷水抽搐中文字幕| 免费高清在线观看日韩| 亚洲av电影不卡..在线观看| 亚洲 欧美 日韩 在线 免费| 90打野战视频偷拍视频| 欧美一级毛片孕妇| 精品一区二区三区视频在线观看免费| 成人亚洲精品一区在线观看| 欧美中文日本在线观看视频| 国产精品1区2区在线观看.| 色综合亚洲欧美另类图片| 亚洲五月天丁香| 正在播放国产对白刺激| 99久久久亚洲精品蜜臀av| 欧美日韩中文字幕国产精品一区二区三区| 免费看日本二区| 国产精品国产高清国产av| 久热这里只有精品99| 嫁个100分男人电影在线观看| 黄片播放在线免费| 国产成人欧美| 91av网站免费观看| 正在播放国产对白刺激| 男人舔奶头视频| 久久中文字幕一级| 黄色丝袜av网址大全| 一区二区三区激情视频| 亚洲av电影在线进入| 欧美丝袜亚洲另类 | 日日爽夜夜爽网站| 自线自在国产av| 一进一出好大好爽视频| 亚洲五月婷婷丁香| 黑人操中国人逼视频| 亚洲精品在线观看二区| 免费在线观看完整版高清| 一夜夜www| 99热6这里只有精品| 好看av亚洲va欧美ⅴa在| 99re在线观看精品视频| 午夜精品在线福利| 热re99久久国产66热| 波多野结衣av一区二区av| 亚洲黑人精品在线| 丁香六月欧美| 久久狼人影院| 在线观看免费日韩欧美大片| 久久精品国产综合久久久| 欧美av亚洲av综合av国产av| 午夜免费激情av| 精品国内亚洲2022精品成人| www.熟女人妻精品国产| 国产一区二区三区视频了| 成人亚洲精品一区在线观看| 亚洲国产精品久久男人天堂| 18禁观看日本| 欧美成人性av电影在线观看| 人妻丰满熟妇av一区二区三区| 波多野结衣高清无吗| 欧美激情高清一区二区三区| 黄色丝袜av网址大全| 亚洲成人久久性| 欧美黑人精品巨大| 麻豆av在线久日| 国产成人啪精品午夜网站| 男男h啪啪无遮挡| 亚洲国产精品999在线| 久久亚洲真实| 夜夜躁狠狠躁天天躁| 男人舔奶头视频| 狠狠狠狠99中文字幕| 一本精品99久久精品77| 亚洲成人久久性| 欧美日韩亚洲综合一区二区三区_| 成人亚洲精品av一区二区| 国产亚洲精品久久久久久毛片| 亚洲av成人av| 特大巨黑吊av在线直播 | 久久香蕉激情| 成年版毛片免费区| 国产精品爽爽va在线观看网站 | 波多野结衣高清无吗| 亚洲一码二码三码区别大吗| 一级毛片精品| 国产主播在线观看一区二区| 免费在线观看亚洲国产| 久热爱精品视频在线9| 欧美激情极品国产一区二区三区| 午夜成年电影在线免费观看| 精品人妻1区二区| 人成视频在线观看免费观看| 亚洲av中文字字幕乱码综合 | 观看免费一级毛片| 无遮挡黄片免费观看| 丝袜人妻中文字幕| 香蕉久久夜色| 亚洲熟妇中文字幕五十中出| 国产激情久久老熟女| 久久婷婷成人综合色麻豆| 国产精品av久久久久免费| √禁漫天堂资源中文www| 国产高清视频在线播放一区| 亚洲国产精品成人综合色| 精品国产乱子伦一区二区三区| 2021天堂中文幕一二区在线观 | 国产高清视频在线播放一区| 久久天躁狠狠躁夜夜2o2o| 亚洲精品av麻豆狂野| 一级a爱片免费观看的视频| 亚洲五月婷婷丁香| 日韩精品中文字幕看吧| 19禁男女啪啪无遮挡网站| 色综合欧美亚洲国产小说| 亚洲中文字幕一区二区三区有码在线看 | 欧美黄色淫秽网站| 脱女人内裤的视频| 精品国产超薄肉色丝袜足j| 午夜福利一区二区在线看| 久久天躁狠狠躁夜夜2o2o| 法律面前人人平等表现在哪些方面| 日韩大尺度精品在线看网址| 国产亚洲精品久久久久久毛片| 国内揄拍国产精品人妻在线 | 可以免费在线观看a视频的电影网站| 色播在线永久视频| 成人av一区二区三区在线看| 亚洲成av片中文字幕在线观看| 日韩大码丰满熟妇| 中文在线观看免费www的网站 | 黄色 视频免费看| 国产欧美日韩一区二区三| 色精品久久人妻99蜜桃| 精品日产1卡2卡| 亚洲最大成人中文| 十八禁网站免费在线| 亚洲一区高清亚洲精品| 伊人久久大香线蕉亚洲五| 亚洲五月天丁香| 午夜日韩欧美国产| www.999成人在线观看| 国产单亲对白刺激| 波多野结衣高清无吗| 欧美成人一区二区免费高清观看 | 人妻丰满熟妇av一区二区三区| 国产成人系列免费观看| 中文字幕精品亚洲无线码一区 | 精品免费久久久久久久清纯| 国产亚洲精品综合一区在线观看 | 青草久久国产| 亚洲色图av天堂| 国产一区二区激情短视频| 日本在线视频免费播放| 2021天堂中文幕一二区在线观 | 午夜福利18| 禁无遮挡网站| 一二三四在线观看免费中文在| 精品久久久久久久毛片微露脸| 国产片内射在线| 国产亚洲精品第一综合不卡| 国产成人av教育| 精品福利观看| 日本a在线网址| 可以在线观看毛片的网站| 一区二区日韩欧美中文字幕| 狂野欧美激情性xxxx| 免费在线观看影片大全网站| 久久久久九九精品影院| 欧美精品亚洲一区二区| 搡老妇女老女人老熟妇| 窝窝影院91人妻| 久久精品国产亚洲av香蕉五月| 午夜精品在线福利| 国产成人啪精品午夜网站| 欧美日韩福利视频一区二区| 久久 成人 亚洲| 在线视频色国产色| 久久午夜亚洲精品久久| 成人永久免费在线观看视频| 日韩欧美一区视频在线观看| 色精品久久人妻99蜜桃| 天堂影院成人在线观看| 黑人巨大精品欧美一区二区mp4| 国产欧美日韩一区二区三| 又大又爽又粗| 久久国产精品人妻蜜桃| 99久久久亚洲精品蜜臀av| 啦啦啦 在线观看视频| 桃色一区二区三区在线观看| 久久香蕉精品热| 欧美激情极品国产一区二区三区| e午夜精品久久久久久久| 国产主播在线观看一区二区| 黄片大片在线免费观看| 人人妻人人看人人澡| 国产野战对白在线观看| 日韩欧美免费精品| 97超级碰碰碰精品色视频在线观看| 99精品在免费线老司机午夜| 999久久久国产精品视频| 国产三级黄色录像| av片东京热男人的天堂| 在线观看舔阴道视频| 成人三级黄色视频| 一夜夜www| 中文字幕最新亚洲高清| 中文亚洲av片在线观看爽| АⅤ资源中文在线天堂| 精品一区二区三区四区五区乱码| 99国产精品一区二区三区| 午夜福利一区二区在线看| 亚洲一卡2卡3卡4卡5卡精品中文| 国产精品亚洲美女久久久| 久久99热这里只有精品18| 麻豆成人午夜福利视频| 久久久久久免费高清国产稀缺| 久久久久久久精品吃奶| 久久久久国产精品人妻aⅴ院| 听说在线观看完整版免费高清| 亚洲欧美日韩高清在线视频| 少妇被粗大的猛进出69影院| 亚洲第一电影网av| 日韩欧美一区二区三区在线观看| 午夜久久久在线观看| 日韩成人在线观看一区二区三区| av片东京热男人的天堂| 最好的美女福利视频网| 成年免费大片在线观看| 午夜影院日韩av| 国产麻豆成人av免费视频| 麻豆久久精品国产亚洲av| 日韩大码丰满熟妇| 国产精品亚洲一级av第二区| a在线观看视频网站| 成年版毛片免费区| 母亲3免费完整高清在线观看| 国产伦在线观看视频一区| 淫秽高清视频在线观看| 在线国产一区二区在线| 天天添夜夜摸| 亚洲午夜理论影院| 国产精品自产拍在线观看55亚洲| 波多野结衣巨乳人妻| 亚洲av成人av| 国产激情欧美一区二区| 黄色视频不卡| 日日爽夜夜爽网站| 亚洲中文av在线| 久久青草综合色| 岛国视频午夜一区免费看| 黄色丝袜av网址大全| 日本 av在线| 成人三级做爰电影| 精品国产一区二区三区四区第35| 精品日产1卡2卡| 国产精品久久久av美女十八| 精品午夜福利视频在线观看一区| 巨乳人妻的诱惑在线观看| 十分钟在线观看高清视频www| 午夜福利在线在线| e午夜精品久久久久久久| 国产精品久久久久久亚洲av鲁大| 精品无人区乱码1区二区| 好男人电影高清在线观看| 一级作爱视频免费观看| 久久精品人妻少妇| 国产日本99.免费观看| 日韩国内少妇激情av| 国产亚洲精品第一综合不卡| 身体一侧抽搐| 国产av不卡久久| 国内精品久久久久久久电影| 激情在线观看视频在线高清| 99热只有精品国产| 欧美中文日本在线观看视频| 亚洲中文字幕一区二区三区有码在线看 | 久久九九热精品免费| 在线观看舔阴道视频| 国产私拍福利视频在线观看| 免费在线观看成人毛片| 亚洲五月色婷婷综合| 极品教师在线免费播放| xxx96com| 国产在线观看jvid| 午夜精品在线福利| 国产精品国产高清国产av| 视频区欧美日本亚洲| 日韩欧美国产在线观看| 亚洲成人精品中文字幕电影| 精品欧美国产一区二区三| 亚洲中文字幕日韩| 久9热在线精品视频| 老司机靠b影院| 久久香蕉激情| 久久欧美精品欧美久久欧美| 三级毛片av免费| 波多野结衣高清无吗| 免费在线观看亚洲国产| 国产成人系列免费观看| 亚洲国产中文字幕在线视频| 久久天堂一区二区三区四区| 夜夜躁狠狠躁天天躁| 久久精品影院6| 欧美最黄视频在线播放免费| 久久久国产精品麻豆| 精品高清国产在线一区| av在线天堂中文字幕| 香蕉久久夜色| 欧美在线一区亚洲| 久久香蕉精品热| 青草久久国产| 精品电影一区二区在线| 亚洲欧美激情综合另类| 巨乳人妻的诱惑在线观看| 一卡2卡三卡四卡精品乱码亚洲| avwww免费| 黄色丝袜av网址大全| 精品乱码久久久久久99久播| 成人欧美大片| 欧美日韩亚洲综合一区二区三区_| 中文字幕精品免费在线观看视频| 99久久无色码亚洲精品果冻| 午夜两性在线视频| 亚洲人成电影免费在线| 免费看a级黄色片| 国产单亲对白刺激| 久久精品国产亚洲av香蕉五月| 中文字幕最新亚洲高清| 哪里可以看免费的av片| 亚洲国产日韩欧美精品在线观看 | 亚洲成人免费电影在线观看| 中文字幕人妻熟女乱码| 午夜影院日韩av| 精品午夜福利视频在线观看一区| 日韩欧美一区二区三区在线观看| 精品国产乱子伦一区二区三区| 久久香蕉国产精品| 久久精品亚洲精品国产色婷小说| 久久亚洲真实| 国产一级毛片七仙女欲春2 | 日韩欧美一区视频在线观看| 亚洲人成网站高清观看| 午夜福利免费观看在线| 国产精品乱码一区二三区的特点| 一边摸一边抽搐一进一小说| 国产高清视频在线播放一区| 久久久久久亚洲精品国产蜜桃av| 午夜a级毛片| 级片在线观看| 国产一区二区在线av高清观看| 亚洲午夜理论影院| 欧美在线一区亚洲| 精品国产超薄肉色丝袜足j| 亚洲人成电影免费在线| 天天躁狠狠躁夜夜躁狠狠躁| 亚洲国产精品久久男人天堂| 免费高清视频大片| 国产亚洲精品一区二区www| 满18在线观看网站| 亚洲成人免费电影在线观看| 国产极品粉嫩免费观看在线| 欧美av亚洲av综合av国产av| 天堂影院成人在线观看| 亚洲中文av在线| 国产精品亚洲美女久久久| 亚洲国产精品成人综合色| 亚洲三区欧美一区| bbb黄色大片| 色在线成人网| 国产高清videossex| 亚洲久久久国产精品| 人人妻人人看人人澡| 精品国产乱码久久久久久男人| 亚洲激情在线av| 久久久久精品国产欧美久久久| 亚洲精品色激情综合| 精品高清国产在线一区| 两个人视频免费观看高清| 少妇 在线观看| 精品欧美国产一区二区三| 神马国产精品三级电影在线观看 | 99国产精品一区二区三区| 日韩av在线大香蕉| 精品福利观看| 亚洲aⅴ乱码一区二区在线播放 | 亚洲五月色婷婷综合| 国产精品久久视频播放| ponron亚洲| 久久久久久亚洲精品国产蜜桃av| 日韩欧美一区二区三区在线观看| 丁香六月欧美| 亚洲av熟女| 精品国产亚洲在线| 亚洲成a人片在线一区二区| 久久精品夜夜夜夜夜久久蜜豆 | 国产伦在线观看视频一区| 欧美黑人巨大hd| 妹子高潮喷水视频| 日本撒尿小便嘘嘘汇集6| 男女下面进入的视频免费午夜 | 两个人免费观看高清视频| 亚洲在线自拍视频| 欧美日韩亚洲综合一区二区三区_| 国产黄片美女视频| 国产真实乱freesex| 欧美av亚洲av综合av国产av| 久久国产精品人妻蜜桃| 国产精品精品国产色婷婷| 国产精品99久久99久久久不卡| 国产熟女午夜一区二区三区| 成人三级黄色视频| 精品久久久久久久久久免费视频| 叶爱在线成人免费视频播放| 久热爱精品视频在线9| 99精品久久久久人妻精品| 亚洲美女黄片视频| 正在播放国产对白刺激| 露出奶头的视频| 国产黄片美女视频| 日本一区二区免费在线视频| 久久狼人影院| 可以在线观看毛片的网站| 亚洲av第一区精品v没综合| 中文亚洲av片在线观看爽| 国内精品久久久久久久电影| 国产精品久久久人人做人人爽| 久久国产亚洲av麻豆专区| 国产成人精品久久二区二区91| 亚洲一区二区三区色噜噜| 亚洲一区高清亚洲精品| 欧美激情 高清一区二区三区| 9191精品国产免费久久| 欧美黑人巨大hd| 亚洲全国av大片| 欧美日韩亚洲国产一区二区在线观看| 波多野结衣高清作品| 熟妇人妻久久中文字幕3abv| 大香蕉久久成人网| 无遮挡黄片免费观看| 两个人看的免费小视频| 99国产综合亚洲精品| 日本成人三级电影网站| 精品一区二区三区四区五区乱码| 国产精品久久久久久精品电影 | 欧美zozozo另类| 不卡一级毛片| 婷婷丁香在线五月| 啦啦啦 在线观看视频| 日韩精品中文字幕看吧| 操出白浆在线播放| 欧美黑人精品巨大| 久久久久久久久中文| 国产精品久久视频播放| 人人妻,人人澡人人爽秒播| 国产av一区在线观看免费| 成人亚洲精品一区在线观看| 又紧又爽又黄一区二区| 99热6这里只有精品| 丰满的人妻完整版| 亚洲国产日韩欧美精品在线观看 | 国产99白浆流出| 欧美日韩一级在线毛片| 国产精品综合久久久久久久免费| 别揉我奶头~嗯~啊~动态视频| 精品一区二区三区视频在线观看免费| 国产精华一区二区三区| 麻豆久久精品国产亚洲av| 亚洲成人久久爱视频| 人人妻,人人澡人人爽秒播| 在线av久久热| 巨乳人妻的诱惑在线观看| 国产成人啪精品午夜网站| 午夜免费观看网址| 日韩大尺度精品在线看网址| 亚洲无线在线观看| 一本综合久久免费| 亚洲aⅴ乱码一区二区在线播放 | 每晚都被弄得嗷嗷叫到高潮| 女警被强在线播放| 午夜影院日韩av| 国产亚洲欧美精品永久| 草草在线视频免费看| 男女那种视频在线观看| 久久香蕉国产精品| 91九色精品人成在线观看| 国产黄色小视频在线观看| 手机成人av网站| 亚洲五月婷婷丁香| 日韩免费av在线播放| 桃色一区二区三区在线观看| 日韩 欧美 亚洲 中文字幕| 日本在线视频免费播放| 国产成年人精品一区二区| 色婷婷久久久亚洲欧美| 日本一区二区免费在线视频| 久久天堂一区二区三区四区| 无限看片的www在线观看| 久久久国产成人免费| 日韩欧美一区视频在线观看| 91在线观看av| 午夜精品在线福利| 久久精品夜夜夜夜夜久久蜜豆 | 欧美精品亚洲一区二区| 在线看三级毛片| 国产精品一区二区三区四区久久 | av在线天堂中文字幕| 妹子高潮喷水视频| 精品久久久久久成人av| 免费高清在线观看日韩| 久久久久久免费高清国产稀缺| 午夜福利成人在线免费观看| 淫秽高清视频在线观看| 精品一区二区三区视频在线观看免费| 色av中文字幕| 久久久久久大精品| 在线观看www视频免费| 欧美日韩亚洲国产一区二区在线观看| 久久久久久大精品| 在线观看www视频免费| 熟女少妇亚洲综合色aaa.| 成人亚洲精品一区在线观看| 亚洲国产高清在线一区二区三 | 午夜影院日韩av| 欧美最黄视频在线播放免费| 18美女黄网站色大片免费观看| 亚洲自拍偷在线| 日日摸夜夜添夜夜添小说| a在线观看视频网站| www日本黄色视频网| 波多野结衣巨乳人妻| 国产色视频综合| av在线播放免费不卡| 久久久久免费精品人妻一区二区 | 又紧又爽又黄一区二区| 少妇的丰满在线观看|