• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于Active Learning的中文分詞領域自適應

    2015-04-21 10:51:33許華婷張玉潔楊曉暉徐金安陳鈺楓
    中文信息學報 2015年5期
    關鍵詞:科技領域評測分詞

    許華婷,張玉潔,楊曉暉,單 華,徐金安,陳鈺楓

    (北京交通大學 計算機與信息技術學院,北京 100044)

    ?

    基于Active Learning的中文分詞領域自適應

    許華婷,張玉潔,楊曉暉,單 華,徐金安,陳鈺楓

    (北京交通大學 計算機與信息技術學院,北京 100044)

    在新聞領域標注語料上訓練的中文分詞系統在跨領域時性能會有明顯下降。針對目標領域的大規(guī)模標注語料難以獲取的問題,該文提出Active learning算法與n-gram統計特征相結合的領域自適應方法。該方法通過對目標領域文本與已有標注語料的差異進行統計分析,選擇含有最多未標記過的語言現象的小規(guī)模語料優(yōu)先進行人工標注,然后再結合大規(guī)模文本中的n-gram統計特征訓練目標領域的分詞系統。該文采用了CRF訓練模型,并在100萬句的科技文獻領域上,驗證了所提方法的有效性,評測數據為人工標注的300句科技文獻語料。實驗結果顯示,在科技文獻測試語料上,基于Active Learning訓練的分詞系統在各項評測指標上均有提高。

    中文分詞;領域自適應;主動學習

    1 引言

    傳統的中文分詞方法是基于詞典的方法,主要有正向最大匹配算法、逆向最大匹配算法、N-最短路徑分詞算法等。隨著標注語料庫的建立和統計機器學習的發(fā)展,基于統計的中文分詞方法成為主流方法。常用的統計機器方法包括:基于隱馬爾可夫模型(Hidden Markov Model,HMM)的中文分詞方法[1]、基于最大熵模型(Maximum Entropy, ME)的中文分詞方法[2]和基于條件隨機場模型(Conditional Random Fields, CRF)的中文分詞方法[3]等。

    當中文分詞任務的領域發(fā)生變化時,未登錄詞的比例會上升,導致中文分詞系統的精度大幅下降。為了解決分詞系統領域自適應的問題,近些年來,研究者提出了很多方法,主要有數據加權算法和半監(jiān)督學習算法。張梅山等采用了領域詞典與統計方法相結合的方法,分詞系統針對不同領域的文本進行分詞時,通過加載相關領域的詞典輔助分詞系統進行分詞[4]。但是以上這些方法都受到了標注語料或特定詞典的限制,相關資源不易獲得。針對這一問題,有研究者提出可以通過從大規(guī)模生語料中抽取n-gram統計特征的方法改善由于領域變化導致的分詞性能下降問題[5]。但是這種僅利用計算機的統計方法未考慮到領域專有詞也具有一定的中文構詞規(guī)律,造成了在一些專有詞上分詞不準確,影響了分詞精度。為了進一步提高領域變化后中文分詞系統的分詞精度,有研究者提出在利用n-gram統計特征的基礎上,增加平行語料語言知識,一般來講是中英文平行語料,通過英文單詞的邊界輔助對應的中文字符串劃定詞語界線[6]。但是,對于大多數中文語料來講,并不是都有對應的英文譯文,所以這種方法不適合推廣。但是它為中文分詞提供了一個新的思路,也就是利用不同資源的疊加來提高分詞精度。在對比前人研究結果的基礎上,我們考慮利用大規(guī)模生語料中的統計特征與少量人工標注相結合的方法,以提高中文分詞領域自適應能力。

    本文的工作圍繞中文分詞領域自適應的問題,針對大規(guī)模人工分詞標注語料難以獲取的現狀,提出基于Active learning的中文分詞領域自適應方法。該方法通過對目標領域文本與已有標注語料之間差異性的統計分析,選擇出小規(guī)模的包含目標領域中特有語言現象的語句,進行人工標注;然后結合大規(guī)模生語料中的n-gram統計特征調整已有分詞模型的領域適應性,從而達到通過標注少量語料,改善分詞精度的目的。

    2 Active learning算法介紹

    Active learning算法由耶魯大學Angluin教授提出[7]。它選擇部分未標記樣例進行標記,然后把它們放入之前已有的標記樣例集合,重新訓練分類器,利用分類器再次選擇未標記樣例。通過有選擇地擴大有標記樣例集合和循環(huán)訓練,使得分類器逐步獲得更強的泛化能力。與以往的算法相比,它具有模擬人的學習過程的特點,因此受到廣泛關注,近年來被大量地應用于信息檢索和文本分類等自然語言處理領域,成為機器學習領域中最重要的方向之一。

    為了更加直觀地展示Active learning算法的有效性和它對分類器訓練精度的提高程度,下面用一個對二維空間中的點進行分類的問題為例來介紹Active learning[8]。假設有一個布滿紅綠兩種共400個點的平面,欲找到紅綠兩種點的分界線。已知紅綠兩種點在坐標x=0附近產生分界。下面分別利用被動學習和主動學習兩種方法,各自選擇和標記30個點,并利用標記的點找到分界線。常規(guī)的被動學習的方法,隨機選擇并標記點,通常它標記的點比較分散,只有很少的點分布在x=0附近,這樣很難找到正確的分界線。用這種方法分類的精度較低,據統計結果顯示正確率只有70%。而Activelearning方法是通過選擇運算,最終選擇紅綠兩種點混合分布比較緊密的位置,也就是位于x=0附近的點進行標記,這就為找到正確的分界線提供了有效的信息。利用這種方法訓練得到的分類器的精度較高,據統計結果顯示正確率可達到90%。這個例子充分說明,Activelearning選擇的樣本點比盲目選擇的樣本點更有利于高精度分類器的訓練,在同等的標注代價下能夠得到更多的區(qū)分信息,有利于提高分類模型的精確度。

    3 基于Active Learning的中文分詞領域自適應方法

    假設我們有一個在分詞標注語料(原領域)上訓練得到的中文分詞模型,現在需要對一個不同領域(目標領域)的文本進行分詞處理,為此需要將中文分詞模型從原領域調整到目標領域。

    為了更好地處理領域內專有名詞及特殊句式的分詞問題,本文提出基于Activelearning的中文分詞領域自適應方法,借助Activelearning算法,選擇目標領域中最具有領域特點的小規(guī)模語句進行人工標注,再與該領域大規(guī)模生語料n-gram統計特征相融合,從而實現分詞精度更高的領域自適應的中文分詞系統。系統的總體框圖如圖1所示,虛線框部分表示實現領域自適應的核心部分。

    相對于原領域的詞語分布,目標領域的詞語分布中出現的漢字以及構詞模式會有很大差異。如果將含有差異多的句子篩選出來進行人工標注,將為分詞模型的重新訓練優(yōu)先提供目標領域特有的訓練語料,使得分詞模型可以快速獲取目標領域特有的分詞知識,從而有效提高在目標領域的分詞精度。因此,如何篩選出這樣含有差異多的句子成為關鍵。

    為了從大規(guī)模目標領域的生語料中抽取在構詞規(guī)律和詞匯分布上具有目標領域特征的語句進行人工標注,本文采用基于n-gram加權統計的方法來計算每個句子相對于原領域在n-gram上的分布差異性,具體計算如公式(1)所示。

    (1)

    圖 1 基于Active learning中文分詞領域自適應的整體框架

    利用上述方法對目標領域生語料的所有語句進行評分計算后,按評分對語句進行排序。根據在人工標注上的投入預算或者需要達到的精度要求,選擇小規(guī)模的高位語句,按照目標領域分詞標注標準進行人工標注。標注好的語料與原領域的標注語料構成新的訓練語料,然后采用CRF模型在新的語料進行訓練,構建適應目標領域的分詞模型。

    4 領域自適應方法在科技領域的應用

    本節(jié)以科技領域為例,利用上面提出的方法,對如何構建科技領域上的中文分詞自適應系統做詳細介紹。

    4.1 科技領域分詞系統的建立

    已有的中文分詞模型是在賓州中文樹庫 (PennChineseTreebank,CTB)上訓練獲得的,原領域為新聞領域。目標領域的語料是NTCIR-10中的1 000 000句中文科技文獻語句。我們從中隨機選出一部分語句作為測試數據。

    為了獲取科技領域的分詞特征,一方面利用語言模型對科技領域生語料的所有語句進行評分排序,篩選出一小部分得分高的語句,依據科技領域分詞標注標準進行人工分詞??萍碱I域分詞標注標準的建立將在第4.2節(jié)做詳細介紹。標注結果將加入新聞領域的標注語料形成新的訓練數據;另一方面,從科技領域的大規(guī)模生語料中抽取n-gram統計特征生成特征文件。然后采用CRF模型在這兩方面生成的訓練數據和特征文件上進行訓練,得到適用于科技領域的中文分詞模型?;贏ctivelearning實現中文分詞在科技領域上適應的總體框圖如圖2所示。

    圖2 基于Active learning中文分詞方法在科技領域上的應用框架圖

    4.2 科技領域分詞標注標準的制定

    “詞是什么(詞的抽象定義)”,“什么是詞(詞的具體界定)”,這兩個基本問題有點飄忽不定,至今都沒有一個公認的、具有權威性的定義。同時,對于中文“詞”的認定,普通人的標準和語言學家的標準在認定上也有比較大的差異。有關專家的調查結果表明,在母語是中文的被測試者之間,對中文文本中出現的詞語的認同率大約只有70%。研究人員曾做過一個實驗[9],一共邀請了258名文理科大學生對同一篇約300字的短文進行手工分詞。結果表明,在其中的45個中文雙音節(jié)和三音節(jié)結構的詞語上,分詞的結果與專家給出的標準分詞結果相同的人甚少。1992年國家標準局頒布了作為國家標準的《信息處理用現代漢語分詞規(guī)范》[10]。在這個規(guī)范中,大部分都是通過舉例和定性描述來定義分詞規(guī)范的。例如,規(guī)范4.2規(guī)定:“二字或三字詞,以及結合緊密、使用穩(wěn)定的二字或三字詞組,一律為分詞單位。”但是,沒有明確定義如何判斷“緊密”以及如何判斷“穩(wěn)定”,這樣的形容在很多規(guī)定中都有出現。這樣規(guī)定的判斷準則極易受到主觀因素的影響,具體判斷起來非常困難,因此,建立一個易于操作能夠保證標注者之間較高一致性的分詞標注標準遠沒有想象中的容易。

    目前具有廣泛影響的中文分詞標注標準中,有

    CTB的中文分詞規(guī)范[11]和北京大學的中文分詞規(guī)范[12]。前者是針對新聞領域的分詞規(guī)范,后者是面對一般領域的分詞規(guī)范,它們對科技領域的專業(yè)詞匯并沒有十分明確詳細的標注標準。實際上,科技文本中的詞語和構詞的漢字與新聞或一般領域有很大不同。面對這一特點,本文制定了面向科技領域的中文分詞標注標準,其中,一般詞匯的分詞標準與CTB中文分詞規(guī)范保持一致。針對專業(yè)詞語,我們分析了CTB中文分詞規(guī)范中各種類別的漢字構成詞語的模式,制定相應的標注標準。我們以化學、藥物的中文文本為例,對增添的分詞標注規(guī)則舉例說明,規(guī)則在表1中顯示。其中,“+”表示“任何非空漢字字符串”,“*”表示“任何漢字字符串,包括空串”,“|”表示“或者”,“”表示“詞語的邊界”。下面對化學類詞匯的標注規(guī)則進行解釋:

    (1) 當遇到“+基*酸*酯”時,規(guī)定切分為“+基*酸*酯”;當遇到“+酸*酯”時,規(guī)定切分為“+酸*酯”;

    (2) 當遇到“+菌霉”時,如果“+”中是形容詞的時候,規(guī)定切分成“+菌霉”,否則切分為“+菌霉”;

    (3) 當遇到“+劑”時,如果“+”只是一個漢字,且“+劑”是出現在新聞領域的詞語,規(guī)定“+劑”當作一個詞語來切分;如果“+”是兩個或以上的漢字,那么規(guī)定切分為“+劑”。

    表1 科技領域人工分詞標注標準舉例

    4.3 科技領域n-gram統計特征

    n-gram是指文本中連續(xù)出現的n個連續(xù)漢字組成的串。從形式上看,詞是穩(wěn)定的字串,即組成詞的字之間凝固度較高。當訓練語料足夠豐富時,詞的出現次數一般高于不成詞的n元字串。從直觀的角度考慮,詞一般是高頻n元字串,但是高頻n元字串并非一定是詞。例如,“巧克力”在未標注的語料中出現了m次,那么“巧克”出現的次數一定不小于m,但“巧克”并不是一個詞。一個完整的詞單元應能適應多樣的上下文,如“吃巧克力”、“黑/白巧克力”、“巧克力糖”、“精致的巧克力鍵盤”等等,“巧克力”作為詞單元有豐富的上下文,而“巧克”在多數情況下與“力”搭配,它的下文環(huán)境單一??梢灾庇^地認為成詞(包括未登錄詞)的字串應當同時具備出現次數多和上下文環(huán)境豐富的特點。

    在不同領域的語料中,字與字連在一起構成詞的情況是不一樣的。我們希望通過統計大規(guī)模生語料中n元字串的一些特征供統計模型學習,以達到分詞系統領域自適應的目的。基于詞單元在未標注語料中所體現的特性,所采用的統計特征包括: n-gram頻度特征和n-gram AV特征。

    n-gram頻度特征

    n-gram的頻度值即n元字串在語料中的出現次數。本文統計了目標領域生語料中所有2元、3元、4元和5元字串的頻度,其中頻度小于5的字串被過濾。由于n元字串的頻度值取值范圍從5到幾千甚至幾萬,為了避免數據稀疏影響CRF學習的效果,本文采用離散化的方法將n元字串的頻度歸為三類: 高頻(H)、中頻(M)、低頻(L): n元字串按照頻度值從高到低排序,前5%的n元字串歸為高頻,表示為H;排名低于5%但高于20%的n元字串歸為中頻,表示為M;最后80%的n元字串的頻度值歸為低頻,用L表示。

    字串的特征只有轉化為字的特征才能供CRF模型學習。在給定句子中的當前漢字產生n-gram頻度特征時,依次考察句子中包含當前漢字的所有候選詞。該字在詞中的位置信息在前,頻度信息在后,用“-”把它們連接起來。最后,按照當前漢字所處候選詞中的位置從前到后的順序——即B, B1, B2, M, E的順序——把前面記錄的信息用“|”連接起來作為當前漢字最終的n-gram頻度特征。

    n-gram AV特征

    AV (Accessor Variety)是從生語料中提取詞語判斷一個字串是否是詞的統計標準。與n-gram頻度值不同的是,n-gram AV值對頻度值進行了篩選。AV的主要思想是: 若一個字串在多種語境下出現,那么該字串成為詞的可能性就高。AV的定義如式(2)所示。

    (2)

    Lav(s)和Rav(s)分別表示字串s的不同前驅和后繼的數量。

    與n-gram頻度特征的使用類似,首先統計目標領域生語料中的所有2元串、3元串、4元串和5元串的AV值,同樣過濾掉AV值小于5的n元字串;然后采用與n-gram頻度值相同的分類標準,將n元字串按照其AV值分成三類: H、M和L三個頻檔;最后將字串的特征轉化為字的特征供CRF訓練和解碼。

    5 實驗評測與分析

    為了評測上節(jié)介紹的在科技領域上適應的中文分詞模型的性能,驗證本文所提方法的有效性,我們在NTCIR-10的英中科技專利數據上設計了一組實驗。通過對其中的大規(guī)模中文語料的分詞處理,從中文分詞精度方面進行評測,并分析人工標注數據規(guī)模對基于Active learning的中文分詞系統的影響。

    5.1 實驗數據

    NTCIR-10英中科技專利數據包括1 000 000句中文語句,我們把這個語料作為科技領域的大規(guī)模生語料。為了制作測試集(TS),我們隨機選出300句,利用第4.2節(jié)制定的科技領域分詞標注標準進行人工分詞標注,作為原領域的標注語料利用新聞領域上CTB5.0中的第1~270篇、400~931篇和1 001~1 151篇的標注數據。

    從除去TS語料中,利用第4.1節(jié)描述的方法對所有語句計算與原領域的標注語料的差異性,并進行評分排序,選出高位的前300個句子(AS),并根據第4.2節(jié)制定的分詞標注標準進行人工標注。為了考察標注語料的規(guī)模對分詞系統的影響,我們按如下方式構成四個標注語料集: 前50句記作AS1、前100句記作AS2、前200句記作AS3、前300句記作AS4。

    另外,為了對比基于Active learning的語句篩選方法,我們在除去TS與AS的語料中,隨機抽取300句(RS),同樣地進行人工分詞標注,并以同樣方式構建四個標注語料集,分別記為RS1、RS2、RS3、RS4。

    5.2 實驗設置

    首先為了驗證本文所提方法的有效性,我們利用基于Active learning方法制作小規(guī)模標注語料,并從科技領域的大規(guī)模生語料中抽取n-gram統計特征,將科技領域小規(guī)模標注語料與抽取的n-gram特征加入原有新聞領域的標注語料,訓練出科技領域上的中文分詞模型;然后利用該模型在測試集上進行評測。該系統記為Our(Active learning +n-gram+原領域語料)。為了考察目標領域上標注語料的規(guī)模對分詞系統的影響,我們利用四個語料集AS1、AS2、AS3、AS4,分別進行模型訓練和評測,評測結果顯示在表2中。

    為了考察基于Active learning的中文分詞系統的優(yōu)越性,我們進行了與上述相同的實驗和評測,但加入的小規(guī)模標注語料是隨機選取的RS1、RS2、RS3、RS4。該系統記為Baseline(隨機+n-gram+原領域語料)。同樣,評測結果也顯示在表2中。

    為了與其他領域自適應方法進行對比,我們重現了Su的方法[6]并訓練了中文分詞模型,其中同樣利用了生語料的n-gram特征和原有新聞領域的標注語料,另外利用了NTCIR英中專利平行語料中的英文部分和英中對齊處理抽取了新的特征。該系統記為Su(英文+n-gram+原領域語料)。相同測試集上的測試結果顯示在表2中。

    為了對比沒有進行領域自適應的分詞系統,我們選取了利用原有新聞領域的標注語料訓練的分詞模型,該系統記為無領域自適應分詞模型(原有新聞領域),并進行了相同測試集上的實驗和評測,評測結果顯示在表2中。

    最后,我們還利用了公開的斯坦福中文分詞系統在相同的測試集上進行了評測,該系統記為無領域自適應分詞模型(斯坦福),評測結果顯示在表2中。

    評測實驗采用準確率(P)、召回率(R)、綜合性能指標(F1值)對中文分詞系統進行測評。各個系統的評測結果如表2所示。

    5.3 結果與分析

    表2 不同分詞系統的評價結果

    通過對比表2中的評測結果,我們分析如下:

    (1) 通過對比表中雙線以上的有領域自適應的三個分詞系統和雙線以下的無領域自適應的兩個分詞系統的評測結果,我們可以看出,有領域自適應的分詞系統的各項評測結果均高于無領域自適應的分詞系統,說明了領域自適應對改進中文分詞系統性能的重要性。

    (2) 在領域自適應的三個分詞系統中,通過對比加入目標領域的300句標注語料的分詞系統和未加入標注語料的Su的分詞系統的評測結果,我們可以看出,前者的各項評測結果均高于后者。說明了目標領域人工標注語料對分詞模型領域自適應有重要幫助,少量的300句語料就有明顯效果。

    (3) 在加入人工標注的領域自適應的兩個分詞系統中,通過對比利用Active learning方法篩選語料的分詞系統和隨機篩選語料的分詞系統,我們可以看出,在加入數量相同的標注語料的前提下,前者的各項指標的評測結果均高于后者,甚至前者添加100句標注語料得到的分詞系統的評測結果高于后者添加300句標注語料得到的分詞系統。由此,我們可以看出,本文提出的基于Active learning的中文領域自適應方法具有明顯效果。

    (4) 在我們的系統(Our)中,通過對比在不同規(guī)模的標注語料上的分詞模型的評測結果,可以看出,隨著標注語料的增大,系統的分詞精度一直有所提升,300句的標注語料還未達到飽和狀態(tài),我們預測隨著經過篩選的標注語料的加入,系統的性能還有提升空間。

    6 結語

    本文工作圍繞中文分詞領域自適應方法的探索,針對大規(guī)模人工分詞訓練語料難以獲取的問題,提出了基于Active learning的中文分詞領域自適應方法,并應用于科技領域自適應的任務中,制定了科技領域的人工標注標準,進行了小規(guī)模的人工標注。在NTCIR-10的專利數據上,充分驗證了該方法可以快速獲取領域特有的分詞知識,有效提高分詞系統的領域適應性能。

    綜上所述,本文針對中文分詞領域自適應的任務,做出了一些探索,并取得了初步的研究成果。然而,中文分詞還面臨很多問題,例如,在面對不同領域時,分詞粒度的確定問題。今后我們將選取其他代表性的領域,對中文分詞領域適應方法進行更深入的探索。

    [1] Rabiner L, Juang B. An introduction to hidden Markov models[J]. ASSP Magazine, 1986: 4-16.

    [2] Adam L B, Della P V J, Della P S A. A maximum entropy approach to natural language processing[J]. Computational linguistics, 1996,22(1): 39-71.

    [3] John L, Andrew M, et al. Conditional random fields: Probabilistic models for segmenting and labeling sequence data[C]//Proceedings of the ICML, 2001: 45-54.

    [4] 張梅山,鄧知龍,車萬翔,等.統計與詞典相結合的領域自適應中文分詞[J].中文信息學報,2012,26(2): 8-12.

    [5] Guo Z, Zhang Y, Su C, et al. Exploration of n-gram Features for the Domain Adaptation of Chinese Word Segmentation[J]. Nature Language Processing and Chinese Computing. Springer Berlin Heidelberg, 2012: 121-131.

    [6] 蘇晨, 張玉潔, 郭振, 等. 適用于特定領域機器翻譯的漢語分詞方法[J]. 中文信息學報, 2013, 27(5): 184-190.

    [7] Angluin D. Queries and concept learning[J]. Machine Learning, 1988, 2(4):319-342.

    [8] Burr S. Active Learning Literature Survey[J]. University of Wisconsinmadison, 2009, 39(2): 127-131.

    [9] 宗成慶.統計自然語言處理[M].北京: 清華大學出版社,2008.

    [10] GB/T 13715-1992.信息處理用現代漢語分詞規(guī)范[S].北京:中國標準出版社,1992:

    [11] Xia F. The Segmentation Guidelines for the Penn Chinese Treebank (3.0)[J]. 2000.

    [12] 段慧明,松井久人於,徐國偉,等.大規(guī)模漢語標注語料庫的制作與使用[J]. 語言文字應用,2000,(2):72-77.

    Active Learning Based Domain Adaptation for Chinese Word Segmentation

    XU Huating, ZHANG Yujie, YANG Xiaohui, SHAN Hua, XU Jin’an, CHEN Yufeng

    (School of Computer and Information Technology, Beijing Jiaotong University, Beijing 100044, China)

    Chinese word segmentation systems trained on annotated corpus of newspaper would drop in performance when faced with a new domain. Since there is no large scale annotated corpus on the target domain, this paper describes a domain adaptation of Chinese word segmentation by active learning. The idea is to select a small amount of data for annotation to bridge the gap from the target domain to the News. The word segmentation model is re-trained by inlduing the newly annotated data. We use the CRF model for the training and a raw corpus of one million sentences on patent description as the target domain. For test data, 300 sentences are randomly selected and manually annotated. The experimental results show that the performances of the Chinese word segmentation system based on our approach are improved on each evaluation metrics.

    Chinese word segmentation; domain adaptation; active learning

    許華婷(1991—),助理實驗師,主要研究領域為自然語言處理。E-mail:xuhuating91@163.com張玉潔(1961—),通信作者,教授,主要研究領域為自然語言處理。E-mail:yjzhang@bjtu.edu.cn楊曉暉(1962—),副教授,主要研究領域為計算機應用。E-mail:xhyang@bjtu.edu.cn

    1003-0077(2015)05-0055-08

    2015-08-15 定稿日期: 2015-10-09

    國家國際科技合作專項資助(2014DFA11350);國家自然科學基金(61370130)

    TP391

    A

    猜你喜歡
    科技領域評測分詞
    次時代主機微軟XSX全方位評測(下)
    次時代主機微軟XSX全方位評測(上)
    結巴分詞在詞云中的應用
    智富時代(2019年6期)2019-07-24 10:33:16
    Why there is few women succeeding in STEM
    攻坡新利器,TOKEN VENTOUS評測
    Canyon Ultimate CF SLX 8.0 DI2評測
    中國自行車(2017年1期)2017-04-16 02:54:06
    值得重視的分詞的特殊用法
    我國納米科技領域論文數和專利量世界第一
    高考分詞作狀語考點歸納與疑難解析
    論英語不定式和-ing分詞的語義傳承
    外語學刊(2011年3期)2011-01-22 03:42:20
    久久综合国产亚洲精品| 在线观看国产h片| av在线蜜桃| 男女边摸边吃奶| av国产免费在线观看| 黄片无遮挡物在线观看| 亚洲精品乱码久久久久久按摩| av天堂中文字幕网| 国产免费一级a男人的天堂| 这个男人来自地球电影免费观看 | 成人特级av手机在线观看| 日本爱情动作片www.在线观看| 97热精品久久久久久| 欧美xxxx性猛交bbbb| 99热这里只有是精品在线观看| 午夜免费观看性视频| 亚洲第一区二区三区不卡| 美女国产视频在线观看| av国产久精品久网站免费入址| 国产91av在线免费观看| 国产精品一区二区三区四区免费观看| av免费观看日本| 观看美女的网站| 美女高潮的动态| 亚洲精品一二三| 亚洲av中文av极速乱| 97在线视频观看| 乱系列少妇在线播放| 日韩电影二区| 中文字幕av成人在线电影| 亚洲欧洲日产国产| 国产美女午夜福利| 99热这里只有是精品50| 国产成人精品久久久久久| 一本色道久久久久久精品综合| 亚洲国产最新在线播放| 国产大屁股一区二区在线视频| 大陆偷拍与自拍| 交换朋友夫妻互换小说| 中文字幕av成人在线电影| 国产黄片美女视频| 日韩视频在线欧美| 久久久久久久久久成人| 久久精品人妻少妇| 色吧在线观看| 欧美成人a在线观看| 日本欧美国产在线视频| 欧美日韩亚洲高清精品| 97超碰精品成人国产| 免费观看在线日韩| 久久精品国产自在天天线| 久久ye,这里只有精品| 久久 成人 亚洲| 丝袜脚勾引网站| 99热这里只有精品一区| 99热这里只有是精品50| 精品酒店卫生间| 精品人妻偷拍中文字幕| 国产精品无大码| 国国产精品蜜臀av免费| 久久 成人 亚洲| 性色av一级| av在线app专区| 国产成人freesex在线| 国产av精品麻豆| 国产午夜精品久久久久久一区二区三区| 日韩人妻高清精品专区| 五月开心婷婷网| 亚洲欧美精品自产自拍| 精品一区二区三卡| 成人综合一区亚洲| 青春草视频在线免费观看| 亚洲久久久国产精品| 国产av精品麻豆| 美女中出高潮动态图| 熟女av电影| 新久久久久国产一级毛片| 在线观看一区二区三区激情| 国产成人一区二区在线| 人人妻人人澡人人爽人人夜夜| 久久精品人妻少妇| freevideosex欧美| 少妇人妻 视频| 青春草亚洲视频在线观看| 国产免费一区二区三区四区乱码| 下体分泌物呈黄色| 老熟女久久久| 欧美人与善性xxx| 日韩欧美 国产精品| 一区二区三区精品91| 欧美日韩在线观看h| 亚洲怡红院男人天堂| 一本—道久久a久久精品蜜桃钙片| 久久久久久伊人网av| 日韩制服骚丝袜av| 亚州av有码| 国精品久久久久久国模美| 下体分泌物呈黄色| 欧美高清性xxxxhd video| 中国美白少妇内射xxxbb| 亚洲欧美一区二区三区黑人 | 欧美变态另类bdsm刘玥| .国产精品久久| 日本av免费视频播放| 国产亚洲午夜精品一区二区久久| 在线免费十八禁| 18+在线观看网站| 久久国产乱子免费精品| 18禁在线无遮挡免费观看视频| 免费黄频网站在线观看国产| 欧美精品人与动牲交sv欧美| 高清不卡的av网站| 精品亚洲成a人片在线观看 | 国产v大片淫在线免费观看| h日本视频在线播放| 99热网站在线观看| 亚洲欧美中文字幕日韩二区| 欧美老熟妇乱子伦牲交| 久久精品久久久久久噜噜老黄| 性色avwww在线观看| 成人综合一区亚洲| 免费人妻精品一区二区三区视频| 美女福利国产在线 | 国产 一区精品| 啦啦啦视频在线资源免费观看| 亚洲av在线观看美女高潮| 欧美xxⅹ黑人| 综合色丁香网| 久久久a久久爽久久v久久| 国产女主播在线喷水免费视频网站| 国产视频首页在线观看| 韩国av在线不卡| 人人妻人人爽人人添夜夜欢视频 | 高清av免费在线| 秋霞在线观看毛片| 精品酒店卫生间| 97超视频在线观看视频| 99热全是精品| 美女脱内裤让男人舔精品视频| 日韩av免费高清视频| 国产视频内射| 精品国产露脸久久av麻豆| 免费久久久久久久精品成人欧美视频 | 亚洲人与动物交配视频| 看免费成人av毛片| 日韩中文字幕视频在线看片 | 国内揄拍国产精品人妻在线| 国产黄色视频一区二区在线观看| www.av在线官网国产| 最新中文字幕久久久久| 毛片女人毛片| 欧美人与善性xxx| 少妇人妻久久综合中文| 最近2019中文字幕mv第一页| 亚洲av二区三区四区| 国产精品国产三级国产av玫瑰| 狂野欧美白嫩少妇大欣赏| 人妻制服诱惑在线中文字幕| 日本猛色少妇xxxxx猛交久久| 国产69精品久久久久777片| 成人亚洲精品一区在线观看 | 亚洲美女搞黄在线观看| 91久久精品电影网| 久久99热这里只频精品6学生| 精品亚洲成a人片在线观看 | 99热这里只有是精品50| 日本与韩国留学比较| 久久韩国三级中文字幕| av专区在线播放| 精华霜和精华液先用哪个| 高清欧美精品videossex| 国产欧美日韩精品一区二区| 日韩制服骚丝袜av| 97精品久久久久久久久久精品| 国产在线免费精品| 九色成人免费人妻av| 免费在线观看成人毛片| 女性生殖器流出的白浆| 又粗又硬又长又爽又黄的视频| 妹子高潮喷水视频| 亚洲第一区二区三区不卡| 亚洲av电影在线观看一区二区三区| 国产在线一区二区三区精| 日韩人妻高清精品专区| 天天躁日日操中文字幕| 赤兔流量卡办理| 日韩不卡一区二区三区视频在线| 国产精品国产三级国产专区5o| 波野结衣二区三区在线| 91久久精品国产一区二区三区| 亚洲国产成人一精品久久久| 久久久午夜欧美精品| 亚洲婷婷狠狠爱综合网| 蜜桃在线观看..| 亚洲av成人精品一二三区| 下体分泌物呈黄色| 看十八女毛片水多多多| 国产亚洲最大av| 国产免费视频播放在线视频| 欧美日本视频| 少妇的逼好多水| 亚洲精品中文字幕在线视频 | 午夜福利网站1000一区二区三区| 国产高清有码在线观看视频| 国产成人午夜福利电影在线观看| 久久久成人免费电影| 亚洲欧美日韩另类电影网站 | 啦啦啦中文免费视频观看日本| 丝袜喷水一区| 搡女人真爽免费视频火全软件| 男人爽女人下面视频在线观看| 亚洲国产日韩一区二区| 最近最新中文字幕免费大全7| 秋霞在线观看毛片| 国产精品久久久久久久电影| 91精品国产国语对白视频| 久热这里只有精品99| 亚洲欧美成人综合另类久久久| 精品一区二区三区视频在线| 精品国产露脸久久av麻豆| 夫妻午夜视频| 亚洲人成网站高清观看| 3wmmmm亚洲av在线观看| 最近的中文字幕免费完整| 国产精品.久久久| 丰满乱子伦码专区| 国产亚洲av片在线观看秒播厂| av播播在线观看一区| 亚洲四区av| 高清视频免费观看一区二区| 精品一区在线观看国产| 97在线人人人人妻| 亚洲熟女精品中文字幕| 国产精品99久久99久久久不卡 | 黄色一级大片看看| 91久久精品国产一区二区三区| 极品少妇高潮喷水抽搐| 哪个播放器可以免费观看大片| 中文乱码字字幕精品一区二区三区| 大香蕉久久网| 久久久久久久久大av| 亚洲精品久久午夜乱码| 人妻 亚洲 视频| 搡女人真爽免费视频火全软件| 韩国av在线不卡| 日本免费在线观看一区| 亚洲aⅴ乱码一区二区在线播放| 亚洲丝袜综合中文字幕| 99热网站在线观看| 如何舔出高潮| av在线观看视频网站免费| 大香蕉97超碰在线| 色综合色国产| 免费观看性生交大片5| 亚洲av中文字字幕乱码综合| 国产男人的电影天堂91| 亚洲国产精品国产精品| 日本与韩国留学比较| 国产老妇伦熟女老妇高清| 黄色日韩在线| 卡戴珊不雅视频在线播放| 国产精品不卡视频一区二区| 成人特级av手机在线观看| 国产 一区 欧美 日韩| 婷婷色综合大香蕉| 建设人人有责人人尽责人人享有的 | 日韩大片免费观看网站| 成人二区视频| 街头女战士在线观看网站| 在线免费十八禁| 精品国产一区二区三区久久久樱花 | 国产乱来视频区| 夫妻性生交免费视频一级片| 午夜福利视频精品| 久久这里有精品视频免费| 亚洲熟女精品中文字幕| 婷婷色综合www| 亚洲欧美日韩卡通动漫| 国产精品精品国产色婷婷| 国产精品熟女久久久久浪| av在线app专区| 日韩欧美 国产精品| 欧美国产精品一级二级三级 | 亚州av有码| a 毛片基地| 午夜免费观看性视频| 欧美bdsm另类| 99久久综合免费| 女的被弄到高潮叫床怎么办| 人人妻人人澡人人爽人人夜夜| av免费在线看不卡| 日韩 亚洲 欧美在线| 国产欧美亚洲国产| 成人国产av品久久久| 热99国产精品久久久久久7| 联通29元200g的流量卡| 黄片无遮挡物在线观看| 91精品伊人久久大香线蕉| 少妇精品久久久久久久| 男的添女的下面高潮视频| 亚洲精品久久午夜乱码| 国产亚洲av片在线观看秒播厂| 男人舔奶头视频| 色视频在线一区二区三区| 97在线人人人人妻| 男人舔奶头视频| 久久久久网色| 91久久精品电影网| 日韩亚洲欧美综合| 天堂中文最新版在线下载| 精品久久久久久久末码| www.av在线官网国产| 超碰av人人做人人爽久久| 久久毛片免费看一区二区三区| 久久人人爽人人爽人人片va| 久久精品熟女亚洲av麻豆精品| 久久久成人免费电影| 欧美极品一区二区三区四区| 欧美日韩视频精品一区| 一级黄片播放器| 在线观看av片永久免费下载| 亚洲四区av| 国产熟女欧美一区二区| 国语对白做爰xxxⅹ性视频网站| 日韩,欧美,国产一区二区三区| 一级毛片电影观看| 午夜视频国产福利| 18禁裸乳无遮挡动漫免费视频| 亚洲国产精品国产精品| 精品国产乱码久久久久久小说| 国产精品久久久久久精品古装| 国内少妇人妻偷人精品xxx网站| 美女cb高潮喷水在线观看| 国产精品.久久久| 我要看日韩黄色一级片| 九九爱精品视频在线观看| 日韩av在线免费看完整版不卡| 国产黄片视频在线免费观看| 国产精品麻豆人妻色哟哟久久| av播播在线观看一区| 一本一本综合久久| 久久久久久久久久成人| www.色视频.com| 黄片wwwwww| 天天躁日日操中文字幕| av专区在线播放| 最新中文字幕久久久久| 黄色视频在线播放观看不卡| 精品酒店卫生间| 国产亚洲午夜精品一区二区久久| 成年av动漫网址| 天天躁夜夜躁狠狠久久av| 国产免费视频播放在线视频| 秋霞伦理黄片| 亚洲欧美成人综合另类久久久| 国产成人aa在线观看| 欧美激情国产日韩精品一区| 大码成人一级视频| 特大巨黑吊av在线直播| 91久久精品电影网| 国产精品久久久久久av不卡| 赤兔流量卡办理| 国产成人免费观看mmmm| 国产69精品久久久久777片| 身体一侧抽搐| 久久 成人 亚洲| 蜜桃在线观看..| 日日撸夜夜添| 美女高潮的动态| 伊人久久精品亚洲午夜| 性高湖久久久久久久久免费观看| 亚洲怡红院男人天堂| 男人爽女人下面视频在线观看| 一级毛片黄色毛片免费观看视频| 国国产精品蜜臀av免费| 直男gayav资源| 精品熟女少妇av免费看| 美女xxoo啪啪120秒动态图| 久久精品国产a三级三级三级| 成人毛片a级毛片在线播放| 91久久精品国产一区二区成人| 国产精品不卡视频一区二区| xxx大片免费视频| 国产乱人偷精品视频| 欧美日韩视频精品一区| 五月天丁香电影| av福利片在线观看| 91久久精品国产一区二区成人| 日日啪夜夜爽| 日产精品乱码卡一卡2卡三| 婷婷色综合www| 大香蕉久久网| 天堂8中文在线网| 联通29元200g的流量卡| 国产精品人妻久久久影院| 18禁动态无遮挡网站| 国产精品.久久久| 久久97久久精品| 国产精品不卡视频一区二区| 国产精品免费大片| 国产久久久一区二区三区| 亚洲av国产av综合av卡| 国产在视频线精品| 美女中出高潮动态图| 男女边摸边吃奶| 婷婷色综合www| 美女中出高潮动态图| 国产乱人视频| 亚洲欧美清纯卡通| 国产在线免费精品| 欧美性感艳星| 欧美97在线视频| 亚洲国产av新网站| 国产精品一二三区在线看| 高清黄色对白视频在线免费看 | 久久99热这里只频精品6学生| 青春草视频在线免费观看| 最近最新中文字幕免费大全7| 成人美女网站在线观看视频| 国产亚洲最大av| 18+在线观看网站| 亚洲国产精品一区三区| 色综合色国产| 国产亚洲精品久久久com| 国产精品久久久久久久电影| 少妇猛男粗大的猛烈进出视频| 极品少妇高潮喷水抽搐| 一级av片app| 日本黄色日本黄色录像| 免费不卡的大黄色大毛片视频在线观看| 免费看av在线观看网站| 久久久亚洲精品成人影院| 2021少妇久久久久久久久久久| 少妇高潮的动态图| 91久久精品国产一区二区三区| 国产色婷婷99| 国产伦精品一区二区三区视频9| 国产精品久久久久久精品古装| 久久热精品热| 国产精品熟女久久久久浪| 大陆偷拍与自拍| 国产成人a∨麻豆精品| 看免费成人av毛片| 久久人人爽av亚洲精品天堂 | 国产精品无大码| 最近2019中文字幕mv第一页| 高清黄色对白视频在线免费看 | 熟女人妻精品中文字幕| 网址你懂的国产日韩在线| 国产高清有码在线观看视频| 伦精品一区二区三区| 18禁在线播放成人免费| 成人午夜精彩视频在线观看| 免费久久久久久久精品成人欧美视频 | 日韩欧美精品免费久久| 网址你懂的国产日韩在线| 精品少妇久久久久久888优播| 18+在线观看网站| 日本猛色少妇xxxxx猛交久久| 伊人久久国产一区二区| 五月伊人婷婷丁香| 51国产日韩欧美| 寂寞人妻少妇视频99o| 99久久精品国产国产毛片| 一级毛片黄色毛片免费观看视频| 插阴视频在线观看视频| 日韩,欧美,国产一区二区三区| 成人18禁高潮啪啪吃奶动态图 | 国产精品麻豆人妻色哟哟久久| 各种免费的搞黄视频| 亚洲人成网站在线观看播放| 欧美zozozo另类| 亚洲国产高清在线一区二区三| 狂野欧美白嫩少妇大欣赏| 亚洲成人中文字幕在线播放| 国产色爽女视频免费观看| 欧美另类一区| 女人久久www免费人成看片| 国内精品宾馆在线| 久久99蜜桃精品久久| 亚洲av在线观看美女高潮| 少妇的逼好多水| 欧美激情国产日韩精品一区| 一区二区三区乱码不卡18| 久久久亚洲精品成人影院| 国产v大片淫在线免费观看| 丰满人妻一区二区三区视频av| 秋霞伦理黄片| 欧美zozozo另类| 男女免费视频国产| 麻豆精品久久久久久蜜桃| 国产精品av视频在线免费观看| 大又大粗又爽又黄少妇毛片口| 青青草视频在线视频观看| 网址你懂的国产日韩在线| 精品一区二区三区视频在线| 哪个播放器可以免费观看大片| 精品亚洲成国产av| 日韩av在线免费看完整版不卡| 18禁动态无遮挡网站| 大码成人一级视频| 内射极品少妇av片p| 午夜福利影视在线免费观看| 日韩av在线免费看完整版不卡| 国产91av在线免费观看| 一边亲一边摸免费视频| 免费大片黄手机在线观看| 99久国产av精品国产电影| 久久久午夜欧美精品| 国产深夜福利视频在线观看| 一级毛片电影观看| 亚洲经典国产精华液单| 狂野欧美白嫩少妇大欣赏| 男女下面进入的视频免费午夜| 大又大粗又爽又黄少妇毛片口| 久久久久久久精品精品| 日本黄大片高清| 亚洲av综合色区一区| 97超视频在线观看视频| 伦精品一区二区三区| 夜夜骑夜夜射夜夜干| av在线观看视频网站免费| 日日啪夜夜爽| 成人18禁高潮啪啪吃奶动态图 | 国产91av在线免费观看| 有码 亚洲区| 国产成人精品福利久久| 精品人妻熟女av久视频| 日韩不卡一区二区三区视频在线| 80岁老熟妇乱子伦牲交| 18禁在线无遮挡免费观看视频| 亚洲激情五月婷婷啪啪| 久久精品国产a三级三级三级| 久久久精品94久久精品| 女人久久www免费人成看片| 国产人妻一区二区三区在| 在线观看一区二区三区| 免费人成在线观看视频色| 欧美zozozo另类| 欧美精品人与动牲交sv欧美| 亚洲不卡免费看| 男女边吃奶边做爰视频| 一个人看的www免费观看视频| 欧美xxxx性猛交bbbb| 九九久久精品国产亚洲av麻豆| 国产精品国产av在线观看| 毛片一级片免费看久久久久| 亚洲一区二区三区欧美精品| 97在线人人人人妻| 偷拍熟女少妇极品色| 亚洲第一区二区三区不卡| 免费看日本二区| 午夜激情久久久久久久| 亚洲欧美日韩东京热| 国产精品久久久久久精品电影小说 | 亚洲国产色片| 日韩不卡一区二区三区视频在线| 人人妻人人看人人澡| 18禁裸乳无遮挡免费网站照片| av播播在线观看一区| 免费少妇av软件| 欧美zozozo另类| 91午夜精品亚洲一区二区三区| 高清在线视频一区二区三区| 久久人人爽av亚洲精品天堂 | 干丝袜人妻中文字幕| 97超视频在线观看视频| 日本黄色日本黄色录像| 水蜜桃什么品种好| 日本vs欧美在线观看视频 | 亚洲精品日韩av片在线观看| 精品视频人人做人人爽| 嫩草影院入口| 国产精品偷伦视频观看了| 亚洲第一av免费看| 亚洲aⅴ乱码一区二区在线播放| 亚洲激情五月婷婷啪啪| 老女人水多毛片| 日本爱情动作片www.在线观看| 亚洲av欧美aⅴ国产| 内地一区二区视频在线| 亚洲av电影在线观看一区二区三区| 免费观看av网站的网址| 亚洲国产成人一精品久久久| av一本久久久久| 欧美日韩一区二区视频在线观看视频在线| 性色av一级| 高清av免费在线| 久久国产精品大桥未久av | 99国产精品免费福利视频| 男人和女人高潮做爰伦理| 欧美日韩精品成人综合77777| 国产在线男女| 春色校园在线视频观看| 欧美bdsm另类| 国产精品不卡视频一区二区| 在现免费观看毛片| 一区二区av电影网| 麻豆成人av视频| 下体分泌物呈黄色| 日本vs欧美在线观看视频 | 久久精品久久久久久噜噜老黄| 人人妻人人看人人澡| 亚洲四区av| 一区二区av电影网| 亚洲,欧美,日韩| 日韩 亚洲 欧美在线| 一本—道久久a久久精品蜜桃钙片| 国产欧美亚洲国产| 韩国av在线不卡| 国产亚洲欧美精品永久| 黑丝袜美女国产一区| 如何舔出高潮| 我要看日韩黄色一级片| 我的老师免费观看完整版|