• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于詞典信息的先秦漢語全文詞義標注方法研究

    2012-06-29 03:54:16張穎杰陳家駿陳小荷
    中文信息學(xué)報 2012年3期
    關(guān)鍵詞:大詞典古漢語義項

    張穎杰,李 斌,,陳家駿,陳小荷

    (1. 南京大學(xué) 計算機軟件新技術(shù)國家重點實驗室,江蘇 南京 210093;2. 南京師范大學(xué) 語言信息科技研究中心,江蘇 南京 210097)

    1 引言

    詞義消歧(Word Sense Disambiguation, WSD)是在特定的上下文中為指定的詞自動選擇合適詞義的過程,也稱為自動詞義標注。在主流的詞義消歧方法中,有指導(dǎo)方法的效果最好[1],但需要較大的人工標注數(shù)據(jù)集,并且其結(jié)果對訓(xùn)練數(shù)據(jù)集有很強的依賴性,泛化能力較差。相對而言,基于知識的方法,將詞語在詞典中的義項數(shù)作為類別數(shù),將詞典對詞語的解釋和例句作為義項出現(xiàn)的語境信息,雖然受限于詞典規(guī)模,其效果通常不如有指導(dǎo)的方法,但是在一定程度上減少了對人工標記數(shù)據(jù)的依賴性,義項標注的覆蓋率較高,在缺乏人工標注數(shù)據(jù)集的情況下,可以提供初始的自動標注結(jié)果。

    目前,古漢語的詞義自動標注工作還處于起步階段,在資源和技術(shù)上都呈稀缺狀態(tài)。對于經(jīng)典傳世之作,雖有歷代學(xué)者的大量注疏,但這些注疏并不是在同一個釋義詞典或語義體系的基礎(chǔ)上進行的。目前較為實用的、能夠服務(wù)于古漢語文獻詞義標注的詞典是《漢語大詞典2.0》(后文簡稱為《大詞典》)[2]。該詞典收詞目30余萬條,給出了詞語的古今義項和最早用例,是一本質(zhì)量高、釋義豐富的大型語文詞典。文獻[3]介紹了采用《大詞典》為主要的釋義詞典,人工逐詞標注古籍義項以構(gòu)建中古漢語研究型語料庫的工作,工作量特別巨大。因此,研究古漢語義項的自動標注方法,已經(jīng)成為了中國古典文學(xué)和文獻研究的重要而迫切的需求。

    對于缺乏訓(xùn)練數(shù)據(jù)的古漢語的詞義標注來說,有指導(dǎo)的方法難以直接使用。在本文中,我們利用詞典信息作為知識來源,采用了基于半指導(dǎo)方法的全文詞義標注方法,對《左傳》進行了標注實驗,人工抽樣的統(tǒng)計結(jié)果顯示,該方法的平均準確率遠高于系統(tǒng)基線,能夠在古漢語全文詞義標注的起步階段提供初始結(jié)果,為人工標注詞語義項提供良好的數(shù)據(jù)底本。

    本文后續(xù)部分結(jié)構(gòu)如下,第二節(jié)介紹了古漢語詞義標注的相關(guān)研究;第三節(jié)介紹了本文使用的全文詞義標注方法;第四節(jié)說明了實驗的設(shè)計和結(jié)果分析;第五節(jié)給出了我們的結(jié)論及后續(xù)的研究工作。

    2 相關(guān)研究

    目前在古漢語的義項標注方面研究較少。文獻[4]首先分析了古漢語詞義義項的分布情況與特點,考察了詞義消歧的難點。然后在現(xiàn)有的詞義消歧理論和方法的基礎(chǔ)上,基于條件隨機場,選擇上下文的詞及其詞性的復(fù)合特征,并加入其他語言學(xué)特征,設(shè)計6個不同的模板,對“將”、“如”等7個古漢語高頻詞進行了詞義消歧實驗,平均F值達到了83.04%。不過,該方法使用的詞典是《春秋左傳詞典》,不適用于其他先秦語料的詞義標注,缺乏一般性。因為文獻[4]采用的是有指導(dǎo)方法,需要預(yù)標注大量訓(xùn)練樣本,代價太高,泛化能力有限。

    對于任意語言的詞義標注,最簡單的基于詞典的方法是通過計算目標詞的定義及其所在的上下文之間重疊的詞數(shù)來確定詞義[5]。

    scoreLeskVar(S)=|context(w)∩gloss(S)|

    S表示某個特定的詞義,w為待標注的詞,context(w)表示w所在的上下文,gloss(S)為詞義的定義。這種方法主要局限在于詞典中的定義通常比較簡潔,未必能包含足夠的能標識當前詞義的詞匯[6]。

    隨著包含分類和語義關(guān)系的本體詞典的廣泛使用(如WordNet),基于詞典的WSD研究中也出現(xiàn)了依賴于這些詞典中結(jié)構(gòu)化信息的結(jié)構(gòu)化方法,主要有基于相似度計算的方法[7]和基于圖的方法[8-9]兩類。基于相似度計算的方法比較目標詞的各個詞義與文本中其他詞之間的語義相似度,從中選擇使得下式結(jié)果最高的詞義。

    基于圖的方法通常把全文表示成一個以詞義為結(jié)點、語義關(guān)系為邊的圖結(jié)構(gòu),通過隨機游走等方法確定節(jié)點的得分,從而得到最終的詞義。近年來針對英語或現(xiàn)代漢語的全文標注主要就用了這一類的方法。

    然而,對于古漢語這一特殊的應(yīng)用領(lǐng)域,很難使用結(jié)構(gòu)化方法。首先,古漢語的結(jié)構(gòu)化詞典資源缺乏。在漢語中運用廣泛的《同義詞詞林》和HowNet中的概念描寫和分類主要針對現(xiàn)代漢語,由于古今異義等原因,無法直接用來計算古漢語詞語間的相似度。其次,結(jié)構(gòu)化方法通常嚴格的遵守一個前提,即“一段一義”[9],用來構(gòu)成圖的段落中相同的詞最后將會被標注上同一個詞義。但是古漢語詞類活用現(xiàn)象比較頻繁,同樣的詞在同一段落中表現(xiàn)出多種不同的詞義是常見的現(xiàn)象,一般來講很難滿足這樣的前提。

    考慮到以上問題,本文利用現(xiàn)有的古漢語詞典資源,采用了一種半指導(dǎo)方法,對大量的古漢語語料實現(xiàn)了全文詞義標注,對其性能進行抽樣驗證和分析。

    3 半指導(dǎo)的WSD方法

    本文的半指導(dǎo)方法沿用了文獻[9]提出的一種通過極少量人工標注語料來進行大量詞義標注的方法,并根據(jù)古漢語特點和《大詞典》釋義方式進行了調(diào)整和優(yōu)化。

    3.1 Yarowsky的方法

    在Yarowsky的研究要求每個詞只有兩個義項[10]。該方法首先對每一個需要標注詞義的二義詞建立上下文列表U。其次,對該詞的每個可能詞義,手動標記一個包含典型搭配信息的可信小訓(xùn)練集seed,根據(jù)“一個搭配一種含義”的先決條件給出表示搭配信息的決策表。該可信小訓(xùn)練集對于每個含義只包含了一種搭配情況。再次,在seed上訓(xùn)練決策表分類模型,并將其用于待標注集的分類,將所有概率超過既定閾值的結(jié)果增加到seed中,同時根據(jù)“一段一義”的約束條件擴充seed,剩余用例仍作為待標注集用于下一次的迭代。重復(fù)此過程至結(jié)果收斂,即所有未標注用例的分類結(jié)果概率均在閾值以下。最后,為剩余用例標注結(jié)果。

    具體流程可表示如圖1。

    圖1 Yarowsky方法的流程圖

    3.2 改進的半指導(dǎo)詞義標注方法

    在本文中針對古漢語全文詞義標注需要考慮的下述多個方面,對Yarowsky的方法作出一定的改進,使之適用于古漢語這一特殊應(yīng)用對象和《大詞典》的釋義方式。

    (1) 詞義粒度。本文中待標注詞的詞義不只兩項,而是根據(jù)詞典中的義項來確定。詞典中凡是具有來自先秦文獻的例句的義項,均被用來作為詞義集合的一個元素。

    (2) 特征選擇。這里不止采用一種搭配信息,而是選取了詞形、詞性的一元特征和兩者搭配的二元特征,如表1所示。有研究表明,二元特征窗口增大反而降低詞性標注結(jié)果的準確性[4],因此對于二元特征,僅使用前后大小為1的窗口。

    表1:特征選擇

    由于“一段一義”的約束條件并不完全適用于古漢語,尤其對一些義項較多、應(yīng)用情況靈活的高頻詞。因此,本文降低其強制性,僅將待標注詞所在的段落編號作為一個特征進行考慮。

    (3) 可信小訓(xùn)練集的選取。本文中不使用手動標注的方式,而是根據(jù)詞典信息自動得到。由于古漢語詞典中的釋義通常用現(xiàn)代漢語表示,兩者的上下文在形式和內(nèi)容上差別較大,不能直接使用。而詞典中除了釋義外通常還包含一些例句,這些例句一般都具有典型性,且能保證其與詞義對應(yīng)的準確性,故而我們通過這些例句得到標注之初所需的seed。

    (4) 迭代過程。在Yarowsky的方法中每次迭代的過程都將所有高于閾值的分類結(jié)果加入seed中。而本文在每一輪分類結(jié)束后僅加入概率最大且大于閾值的結(jié)果用于下一輪分類。對于迭代過程的終止條件則分別考察設(shè)閾值和不設(shè)閾值(即閾值為0)兩種情況對結(jié)果的影響。

    (5) 方法選擇。由于本文中所用的特征不再是單一的搭配信息,故而也不再使用簡單的決策表,而改用了SVM的方法,其核函數(shù)使用了默認的線性核[11]。

    4 實驗4.1 數(shù)據(jù)來源

    本文將人工完成了分詞和詞性標注的18萬字《左傳》作為實驗語料[12],對其中的4 671個實詞共11萬個詞例進行了詞義標注。這些實詞中有635個多音詞,占待標注詞的13.6%。

    知識來源采用了《大詞典》,該詞典對詞的釋義中涵蓋了從古至今所出現(xiàn)過的幾乎所有詞義,并給出了詞典編纂者認定的詞義最早的文獻出處及例句。

    以“忘”為例,其在詞典中第一個讀音的釋義如圖2所示。

    忘1 [wànɡ ㄨㄤˋ]

    [《廣韻》巫放切,去漾,微。]

    1.忘記;不記得?!对姟ば⊙拧ぺ羯!罚骸爸行牟刂?,何日忘之?!薄端抉R法·仁本》:“天下雖安,忘戰(zhàn)必危。” 宋 曾鞏 《尚書都官員外郎陳君墓志銘》:“ 泉州 歲兇,君築室止窮民,飢者給食,病者給醫(yī),人忘其窮。” 周恩來 《致柯棣華大夫家屬的慰問信》:“我們受惠于他的極多,使我們永不能忘?!?.指健忘癥?!读凶印ぶ苣峦酢罚骸?宋 陽里華子 中年病忘?!?.遺棄;不顧念?!对姟で仫L(fēng)·晨風(fēng)》:“如何,如何!忘我實多?!?馬瑞辰 通釋:“忘我實多,猶云棄我實甚?!薄肚f子·山木》:“覩一蟬,方得美蔭而忘其身;螳蜋執(zhí)翳而搏之,見得而忘其形?!薄夺釢h書·宋弘傳》:“貧賤之知不可忘?!?.玩忽,怠忽。《史記·孔子世家》:“昔 武王 克 商 ,道通九夷百蠻,使各以其方賄來貢,無使忘職業(yè)。” 唐 韓愈 《潮州祭神文》之四:“惟神之恩,夙夜不敢忘怠?!?.無?!妒酚洝っ蠂L君列傳》:“日暮之後,過市朝者掉臂而不顧。非好朝而惡暮,所期物忘其中?!?司馬貞 索隱:“忘者,無也。其中,市朝之中。言日暮物盡,故掉臂不顧也。”《史記·平津侯主父列傳》:“ 高皇帝 蓋悔之甚,乃使 劉敬 往結(jié)和親之約,然後天下忘干戈之事?!?.通“ 妄 ”。《老子》:“不知常,忘作,兇?!?朱謙之 校釋:“忘、妄古通?!薄俄n非子·解老》:“前識者,無緣而忘意度也?!?王先慎 集解:“忘與妄通?!?/p>

    注:下劃線的內(nèi)容表示出處,根據(jù)出處就可以得到例句出現(xiàn)的年代

    圖2 “忘”的第一個讀音在《大詞典》中的釋義表示

    4.2 實驗預(yù)處理

    (1) 根據(jù)年代篩選義項。由于《大詞典》收錄的義項非常豐富,每個詞語的義項往往多達數(shù)十條,這對于詞義自動消歧是非常困難的,因此需要對義項和例句進行年代的篩選??紤]到先秦時代時期較長、詞義也無法完全由《大詞典》的《左傳》出處涵蓋。我們根據(jù)60多種先秦文獻的名稱(如《左傳》、《論語》等)對義項進行時代篩選,保證了用于標注的義項均有可能出現(xiàn)在先秦文獻中,剔除了大部分不可能出現(xiàn)的詞義。篩選后的義項被稱為該詞的先秦義項。如圖2所示:“忘1”的第四個釋義“玩忽”和第五個釋義“無”最初都是在漢代的《史記》中出現(xiàn)的,故這兩個義項不包含在我們要分類的義項列表中。而第一個釋義“忘記”的例句除了來自于先秦文獻《詩經(jīng)》和《司馬法》以外,還有的選自宋代和現(xiàn)代的文章,本文中所用的上下文信息僅從前兩者中提取。

    (2) 詞典例句的詞性標注。為了得到最初的種子訓(xùn)練集,實驗利用南京師范大學(xué)開發(fā)的先秦古漢語的詞性標注工具[3]對這些例句進行分詞和詞性標注,該工具在左傳上的分詞和詞性標注F值均超過90%。然后通過詞典中給出的拼音和釋義信息,得到用于訓(xùn)練的上下文特征。由于這些上下文特征來自于詞典中的例句,因而此種子訓(xùn)練集的標注結(jié)果是可信的,其特征也具有典型性,保證了它對詞義標注的指示作用。

    4.3 詞義標注

    漢語中包含了很多的多音詞,同一個詞的不同讀音含義差別較大,甚至有時可以看作兩個不同的詞來處理。因此本文在標注過程中針對多音詞分別使用“直接標注詞義”和“先標音再標義”兩種標注方法,來考察區(qū)分讀音對古漢語詞義自動標注效果的影響。

    (1) 直接標注詞義(Tag Sense Straightly, TSS)

    根據(jù)詞典得到待標注詞的詞義列表{senseik},i=1,2,…,n,k=1,2,…,ni,N=∑ni,n為拼音的數(shù)目,ni為拼音i下的義項數(shù)目,N為待標注詞的總義項數(shù)。執(zhí)行圖3的過程,最終為中的所有條目標上詞義。

    (2) 先標音再標義(Tag Pinyin before Sense, TPBS)

    首先自動標注讀音。根據(jù)詞典得到待標注詞的讀音列表{Pi},i=1,2,…,n,n為讀音的數(shù)目。執(zhí)行圖3的過程,為S中的所有條目標上拼音Pi。

    然后根據(jù)讀音的標注結(jié)果將原待標注集S分塊成為S1,S2,…,Sn,n表示該目標詞拼音的數(shù)目,同一個分塊Si中的目標詞都具有相同的讀音。同樣原可信訓(xùn)練集seed也根據(jù)讀音分類成為seed1,seed2,…,seedn。

    最后自動標注詞義。針對每個Si,根據(jù)seedi再次執(zhí)行圖3的過程,得到最終的詞義標注結(jié)果senseik,i=1,2,…,n,k=1,2,…,ni,n為讀音的數(shù)目,ni為讀音Pi中義項的數(shù)目。

    圖3 本文中半指導(dǎo)學(xué)習(xí)的流程圖

    4.4 實驗基線的設(shè)定(baseline)

    本文中設(shè)定了兩條基線用于對比實驗結(jié)果。由于《大詞典》中是將常用的讀音排在前面,而第一個釋義通常是該詞的本意或常用義,因此本文將目標詞根據(jù)年代篩選釋義后的第一個讀音的第一個詞義和第二個詞義分別作為標注結(jié)果的baseline1和baseline2。

    4.5 實驗結(jié)果及分析

    自動標注完成后,由于標注數(shù)據(jù)量大,且對于這些數(shù)據(jù)原先并不存在已知的正確結(jié)果,故而我們根據(jù)標注數(shù)據(jù)在原文中的詞頻及其在詞典中的詞義數(shù)量分布從4 671個待標注詞中抽取了22個樣本,人工檢查其結(jié)果進行評測。表2給出了測試樣本在《大詞典》中的詞典義項數(shù)、讀音數(shù)、先秦義項數(shù)、《左傳》中的詞頻,并按照先秦義項數(shù)降序排列。這些詞在《左傳》中的詞頻從1到1 124不等,義項數(shù)最少為2,最多有13種,其中包含了5個多音詞。表3則給出了這些詞語的評測結(jié)果。

    表2 評測抽樣詞語信息

    根據(jù)表3,我們發(fā)現(xiàn)不關(guān)注讀音直接標注詞義在平均值上取得了最好的效果,其宏平均和微平均[13]準確率分別達到了67.15%和49.09%。分析實驗結(jié)果我們討論以下幾個方面。

    表3 抽樣標注結(jié)果準確率[0,1],t表示設(shè)定了閾值

    (1) 低頻詞的詞義標注。對于《左傳》中的低頻詞,如果在大詞典包含了出自《左傳》的例句,即使義項數(shù)較多,也可以得到較好的結(jié)果。而當其在詞典中的義項數(shù)目多且相應(yīng)的例句出處并非《左傳》或者語言與《左傳》差別較大時,該詞的釋義很難被準確標出。

    例如,“缶”、“拊”、“區(qū)”、“繩”、“饘”和“珍”等詞雖然在《左傳》中只出現(xiàn)了一到兩次,但由于詞典中用于說明其釋義的例句正是由《左傳》而來,故而我們根據(jù)例句得到的上下文對于這些詞的自動詞義標注具有很強的指示性,使得結(jié)果的準確率比較高。同樣作為低頻詞的“負”在本次的抽樣結(jié)果中標注效果很差?!柏摗痹凇蹲髠鳌分械脑~頻僅有一次,使得它在自動標注時從客觀情況上無法進行迭代的過程,只能通過例句給出的上下文來判斷。而在詞典中“負”的先秦義項有13項之多,且其中沒有出現(xiàn)出自《左傳》的例句,尤其是標示其正確釋義的例句出自與《左傳》語言差別很大的《詩經(jīng)》,由此得到的種子上下文難以為該詞的詞義標注做出正確的指引。

    (2) 詞典中義項區(qū)分度對結(jié)果的影響。對于詞典中不同的義項間用法、語義或詞性區(qū)分度高的待標注詞,不論其在《左傳》中詞頻高低,均能取得較好的標注效果。例如,“對”、“戰(zhàn)”和“竹”,它們的詞頻有高有低,詞典中的義項數(shù)有多有少,但這些義項間均存在明顯的區(qū)別,因此,這3個詞的詞義標注結(jié)果也取得了較好的效果。同樣作為高頻詞的“叛”,由于它的兩個釋義在詞性上有很明顯的區(qū)分,因此標注的準確率達到了100%。

    而當詞典中存在釋義間的“不平等”關(guān)系或義項粒度過細時,則會導(dǎo)致詞義的錯誤標注。這時閾值的加入可以防止迭代過程中錯誤分類的蔓延,提高結(jié)果的準確率。例如,“戕”在詞典中的第三個釋義為“他國之臣殺本國君主”,要判斷這一點需要有一些外在的先驗知識,僅從局部上下文是很難分出該詞義與釋義一“殘害,殺害”的區(qū)別,甚至可以認為釋義三是釋義一的一種特例,這也是導(dǎo)致了“戕”唯一的一個錯標。又如“災(zāi)”有兩個義項分別為“特指火災(zāi)”和“泛指災(zāi)害”,在自動標注時難以將“泛指”從“特指”中區(qū)分開來,但在設(shè)定閾值的情況下準確率有了顯著的提高。

    (3) 詞典中例句的分布對結(jié)果的影響?!洞笤~典》中對于一個詞的每個義項給出的例句數(shù)量比較隨意,并沒有給予常用義更高的“權(quán)重”。這在詞義粒度細、區(qū)分度不高的情況下,為詞義的自動標注帶來了很大的困難,導(dǎo)致了結(jié)果的低準確率。例如,“逆”和“告”,義項數(shù)目均在十個以上,而表示其常用義的例句都只有一句,反而是有些不常用的釋義被用了更多的例句來說明,最終的標注準確率都降到了baseline1以下。

    (4) 讀音對多音詞詞義標注的影響。對于義項數(shù)目分布不平均的多音詞,先區(qū)分拼音后區(qū)分詞義的過程對提高詞義標注的準確率的意義不大,甚至可能起到反作用。例如,“告”,由于seed中表示第一種拼音的例句遠比第二種拼音多,使得分類結(jié)果更偏向于標注為第一種讀音,以至于沒有能正確的把拼音二區(qū)分開來,從而對最終的標義的準確性起了反作用。

    綜上所述,在利用《大詞典》進行古漢語的詞義自動標注時,對于詞頻低且在詞典中包含了所標文獻的例句時,即使釋義的條目較多,也可能得到較好的結(jié)果。對于釋義間有明確的詞性差別的待標注詞也能給出比較正確的結(jié)果。對于是多音詞的待標注詞而言,只有當其不同的讀音間釋義數(shù)目分布平均時,先標讀音后標詞義的兩步過程才更有意義。對于終止迭代過程的條件中所使用的閾值問題,當待標注詞含義豐富,且詞頻較高時,加入閾值可以在一定程度上減少誤標。另外,我們也從實驗中發(fā)現(xiàn)了《大詞典》本身的釋義粒度有時過細或者兩個釋義存在“泛指”和“特指”的關(guān)系,這為我們的自動標注詞義過程帶來了很大的困難。

    5 結(jié)論與未來工作

    本文針對先秦古漢語這一特殊的文本對象,將WSD的過程分為先區(qū)分讀音后區(qū)分具體詞義這兩個步驟。實驗過程使用了《大詞典》為知識來源,《左傳》作為測試語料,采用了基于支持向量機(SVM)的半指導(dǎo)方法。微平均和宏平均正確率分別達到49.09%和67.15%。對于義項區(qū)分度較大、用例相近的詞語,自動標注的效果可以達到95%以上。對于義項區(qū)分度低、《大詞典》用例差異大的詞語,效果還不太理想。在我們同時開發(fā)的人機交互式義項標注平臺的輔助下,可以作為人工標注的良好初始結(jié)果,服務(wù)于古漢語詞義標注語料庫的建設(shè)。

    在今后的工作中我們考慮從以下幾方面對本文的工作進行改進:(1)加入更多語言信息,如句法結(jié)構(gòu)、語義角色、依存分析等,并加入特征選擇的過程,進一步提高詞義標注的效果; (2)利用較為豐富的歷代注疏文獻和驗證指導(dǎo)學(xué)習(xí)方法的自動標注結(jié)果,同時提高全詞標注的效果; (3)將詞義列表根據(jù)待標注詞在不同釋義上的詞性不同分類,來減小自動標注的難度。

    [1] Pradhan, S., Loper, E., Dligach, D., et al. Semeval-2007 task-17: English lexical sample srl and all words[C]// Proceedings of SemEval-2007, ACL, 2007, 87-92.

    [2] 漢語大詞典2.0[CD]. 商務(wù)印書館(香港). 2005.

    [3] 董志翹.為中古漢語研究夯實基礎(chǔ)[J].燕山大學(xué)學(xué)報(哲學(xué)社會科學(xué)版),2011,12(1):1-6.

    [4] 于麗麗,丁德鑫,曲維光,等. 基于條件隨機場的古漢語詞義消歧研究[J].微電子學(xué)與計算機,2009,10: 45-48.

    [5] Lesk. M. Automatic sense disambiguation using machine readable dictionaries: how to tell a pinecone from an ice cream cone[C]// Proceedings of the 5th annual international conference on Systems documentation, 1986:24-26.

    [6] Patwardhan, S., Banerjee, S., Pedersen, T. Using measures of Semantic Relatedness for Word Sense Disambiguation[C]// Proceedings of CICLing, 2003:241-257.

    [7] Pedersen, T., Banerjee, S., Patwardhan, S. Maximizing semantic relatedness to perform word sense disambiguation[R]. Minneaplis: University of Minnesota Supercomputing Institute, Res. rep: UMSI 2005/25, 2005.

    [8] Sinha, R., Mihalcea, R. Unsupervised graph-based word sense disambiguation using measures of word semantic similarity[C]// Proceedings of the IEEE International Conference on Semantic Computing, 2007:363-369.

    [9] Agirre E., Soroa A. Personalizing PageRank for word sense disambiguation[C]// Proceedings of the 12th Conference of the European Chapter of the Association for Computational Linguistics, 2009:33-41.

    [10] Yarowsky D. Unsupervised Word-Sense Disambiguation Rival Supervised Methods[C]// Proceeding of the 33rd Annual Meeting of the Association for Computational Linguistics, 1995:189-196.

    [11] Jin P. Li F., Zhu D., et al. Exploiting External Knowledge Sources to Improve Kernel-based Word Sense Disambiguation[C]// Proceedings of IEEE International Conference on Natural Language Processing and Knowledge Engineering, 2008:222-227.

    [12] 石民,李斌,陳小荷. 基于CRF的先秦漢語分詞標注一體化研究[J],中文信息學(xué)報,2010,2: 39-45.

    [13] Manning C, Raghavan P, Schütze H. An introduction to Information Retrieval[M]. Cambridge, England: Cambridge University Press, 2007: 210-211.

    猜你喜歡
    大詞典古漢語義項
    “玄”“懸”二字含義不同
    鄉(xiāng)音(2024年12期)2024-12-31 00:00:00
    古漢語疑問句末“為”字補證
    《漢語大詞典》“籀”釋義辨證
    上古漢語“施”字音義考
    小心兩用成語中的冷義項
    關(guān)于《突厥語大詞典》漢字譯寫偏誤研究
    語言與翻譯(2015年3期)2015-07-18 11:11:07
    兩用成語中的冷義項
    知識窗(2015年1期)2015-05-14 09:08:17
    談?wù)劰艥h語的翻譯
    語言與翻譯(2014年1期)2014-07-10 13:06:11
    古漢語中表反問的一組能愿動詞
    語文知識(2014年3期)2014-02-28 21:59:31
    《漢語大詞典》漏收宋代筆記詞目補釋
    国产99白浆流出| 日韩有码中文字幕| 母亲3免费完整高清在线观看| 99精品欧美一区二区三区四区| 亚洲国产高清在线一区二区三 | 午夜福利免费观看在线| av在线播放免费不卡| 久久人人精品亚洲av| 女人被躁到高潮嗷嗷叫费观| 侵犯人妻中文字幕一二三四区| 欧美精品啪啪一区二区三区| 亚洲自偷自拍图片 自拍| netflix在线观看网站| 中文字幕久久专区| 精品午夜福利视频在线观看一区| 在线av久久热| 精品熟女少妇八av免费久了| 国产亚洲av嫩草精品影院| 久久久久九九精品影院| 午夜福利视频1000在线观看 | 国产精品电影一区二区三区| 淫妇啪啪啪对白视频| 真人做人爱边吃奶动态| 看黄色毛片网站| 日日夜夜操网爽| 国产精品一区二区免费欧美| 国内久久婷婷六月综合欲色啪| 免费看十八禁软件| 午夜福利在线观看吧| 国产成人啪精品午夜网站| 欧美日韩一级在线毛片| 亚洲一卡2卡3卡4卡5卡精品中文| 青草久久国产| 后天国语完整版免费观看| 亚洲一卡2卡3卡4卡5卡精品中文| 99香蕉大伊视频| 精品国产一区二区久久| 欧美日韩福利视频一区二区| 嫁个100分男人电影在线观看| www.www免费av| 免费人成视频x8x8入口观看| 最近最新免费中文字幕在线| 欧美日韩乱码在线| 满18在线观看网站| 丝袜美腿诱惑在线| 久久久精品欧美日韩精品| 久久精品人人爽人人爽视色| 久久精品影院6| 黄色视频不卡| 99国产综合亚洲精品| 亚洲性夜色夜夜综合| 制服丝袜大香蕉在线| 香蕉丝袜av| 99国产精品一区二区蜜桃av| 亚洲精华国产精华精| 国产精品 国内视频| 一级,二级,三级黄色视频| 这个男人来自地球电影免费观看| 高清毛片免费观看视频网站| 日日干狠狠操夜夜爽| 老鸭窝网址在线观看| 丝袜人妻中文字幕| 亚洲人成电影免费在线| 日本一区二区免费在线视频| 国产极品粉嫩免费观看在线| 欧美乱妇无乱码| 看黄色毛片网站| 中文字幕色久视频| 欧美中文日本在线观看视频| 天堂影院成人在线观看| 啦啦啦韩国在线观看视频| 一级毛片精品| 欧美 亚洲 国产 日韩一| 在线观看66精品国产| 在线观看66精品国产| 不卡一级毛片| 国产三级在线视频| 日韩欧美一区视频在线观看| 他把我摸到了高潮在线观看| 色综合亚洲欧美另类图片| 长腿黑丝高跟| 十八禁网站免费在线| 国产一区二区在线av高清观看| 久久久久久久午夜电影| 免费高清在线观看日韩| 国产亚洲精品久久久久5区| 精品免费久久久久久久清纯| 一级片免费观看大全| 啪啪无遮挡十八禁网站| 国产精华一区二区三区| 夜夜夜夜夜久久久久| 中文字幕色久视频| 国产人伦9x9x在线观看| 免费观看精品视频网站| 午夜日韩欧美国产| 色老头精品视频在线观看| 久久婷婷成人综合色麻豆| 亚洲专区中文字幕在线| 巨乳人妻的诱惑在线观看| 久久国产乱子伦精品免费另类| 丁香欧美五月| 两个人免费观看高清视频| 国产av一区二区精品久久| 久久精品aⅴ一区二区三区四区| 美女高潮喷水抽搐中文字幕| 亚洲av电影在线进入| 电影成人av| 日韩有码中文字幕| 成人三级做爰电影| 脱女人内裤的视频| 国产精品国产高清国产av| 97碰自拍视频| 精品国产美女av久久久久小说| 亚洲av成人av| 国内毛片毛片毛片毛片毛片| 免费人成视频x8x8入口观看| 后天国语完整版免费观看| 国产熟女午夜一区二区三区| 夜夜夜夜夜久久久久| www.精华液| 午夜免费鲁丝| 熟妇人妻久久中文字幕3abv| 久久国产精品影院| 亚洲少妇的诱惑av| 久热这里只有精品99| 女性生殖器流出的白浆| 午夜亚洲福利在线播放| 欧美日韩乱码在线| 午夜精品在线福利| 女人被狂操c到高潮| 国产在线精品亚洲第一网站| 亚洲精品一卡2卡三卡4卡5卡| 国产在线精品亚洲第一网站| 国产精品亚洲美女久久久| 精品国产亚洲在线| 久久亚洲精品不卡| 91av网站免费观看| e午夜精品久久久久久久| 看片在线看免费视频| 亚洲美女黄片视频| 久久久久九九精品影院| 欧美乱码精品一区二区三区| 美女免费视频网站| 真人一进一出gif抽搐免费| 国产1区2区3区精品| 免费看a级黄色片| 亚洲国产精品成人综合色| 久久人妻av系列| 午夜福利高清视频| 男女下面插进去视频免费观看| 日韩欧美国产在线观看| 国产av在哪里看| 大型av网站在线播放| av天堂久久9| 亚洲专区中文字幕在线| 欧美成人一区二区免费高清观看 | 男人舔女人下体高潮全视频| 后天国语完整版免费观看| 亚洲精品中文字幕一二三四区| 久久这里只有精品19| 女性被躁到高潮视频| 一进一出好大好爽视频| 日本撒尿小便嘘嘘汇集6| 岛国在线观看网站| 亚洲精品粉嫩美女一区| 校园春色视频在线观看| 纯流量卡能插随身wifi吗| 精品国产乱码久久久久久男人| 校园春色视频在线观看| 自线自在国产av| 两个人视频免费观看高清| 国产精品一区二区在线不卡| 午夜影院日韩av| 一级,二级,三级黄色视频| 亚洲色图综合在线观看| 两个人免费观看高清视频| 99精品久久久久人妻精品| 亚洲国产日韩欧美精品在线观看 | 免费搜索国产男女视频| 亚洲国产欧美网| 国产精品香港三级国产av潘金莲| 亚洲一卡2卡3卡4卡5卡精品中文| 国产精品99久久99久久久不卡| 久久久水蜜桃国产精品网| 女人精品久久久久毛片| 国产亚洲精品久久久久久毛片| 亚洲精品粉嫩美女一区| 亚洲第一欧美日韩一区二区三区| 老熟妇仑乱视频hdxx| 狠狠狠狠99中文字幕| 九色国产91popny在线| 久久久久亚洲av毛片大全| 亚洲国产欧美一区二区综合| 99久久99久久久精品蜜桃| 在线观看免费视频网站a站| 别揉我奶头~嗯~啊~动态视频| 一本大道久久a久久精品| 18禁国产床啪视频网站| 精品久久蜜臀av无| 自线自在国产av| 母亲3免费完整高清在线观看| 成人欧美大片| 国产xxxxx性猛交| 久久久久久久精品吃奶| 一进一出抽搐动态| 色综合站精品国产| 国产麻豆69| 好看av亚洲va欧美ⅴa在| 97碰自拍视频| 久久久国产精品麻豆| 操美女的视频在线观看| 国产精品野战在线观看| 在线观看www视频免费| 国产精品久久久久久精品电影 | 久久香蕉国产精品| 在线观看日韩欧美| 中文字幕久久专区| 中文亚洲av片在线观看爽| 免费av毛片视频| 男女之事视频高清在线观看| 久久草成人影院| 妹子高潮喷水视频| 啪啪无遮挡十八禁网站| 亚洲中文日韩欧美视频| 欧美老熟妇乱子伦牲交| 人妻久久中文字幕网| ponron亚洲| 两个人视频免费观看高清| 淫妇啪啪啪对白视频| 波多野结衣av一区二区av| 在线观看免费日韩欧美大片| 女性被躁到高潮视频| 日韩三级视频一区二区三区| 中文字幕最新亚洲高清| 亚洲精品在线观看二区| 香蕉国产在线看| 午夜福利影视在线免费观看| 久久精品人人爽人人爽视色| 国产精品永久免费网站| 欧美日本亚洲视频在线播放| 黄色片一级片一级黄色片| 黄色成人免费大全| 亚洲av熟女| 久久 成人 亚洲| 国产精品久久久久久精品电影 | 国产伦一二天堂av在线观看| 国产一区二区激情短视频| 国产成人啪精品午夜网站| 韩国精品一区二区三区| 99在线视频只有这里精品首页| 免费无遮挡裸体视频| 琪琪午夜伦伦电影理论片6080| 午夜福利成人在线免费观看| 涩涩av久久男人的天堂| 女警被强在线播放| 夜夜看夜夜爽夜夜摸| 黄频高清免费视频| 99国产精品99久久久久| 亚洲熟妇熟女久久| 成人18禁高潮啪啪吃奶动态图| 国产在线观看jvid| 亚洲免费av在线视频| 亚洲一区二区三区色噜噜| 99国产精品一区二区蜜桃av| 超碰成人久久| 叶爱在线成人免费视频播放| 人妻丰满熟妇av一区二区三区| 久久狼人影院| 狂野欧美激情性xxxx| 日本免费一区二区三区高清不卡 | 男人舔女人的私密视频| 亚洲少妇的诱惑av| 欧美日韩中文字幕国产精品一区二区三区 | 国产一区二区激情短视频| 在线观看免费午夜福利视频| 中文字幕av电影在线播放| 精品电影一区二区在线| 午夜亚洲福利在线播放| 高清在线国产一区| 18禁观看日本| 国产精品av久久久久免费| 99久久国产精品久久久| 成人永久免费在线观看视频| 亚洲国产精品999在线| 亚洲aⅴ乱码一区二区在线播放 | 黄频高清免费视频| 久久伊人香网站| 国产精品99久久99久久久不卡| 精品人妻在线不人妻| 亚洲国产精品成人综合色| 丰满人妻熟妇乱又伦精品不卡| 国产亚洲av高清不卡| 日本精品一区二区三区蜜桃| 一进一出抽搐动态| 超碰成人久久| 老汉色av国产亚洲站长工具| 久久人人爽av亚洲精品天堂| 久久天堂一区二区三区四区| 法律面前人人平等表现在哪些方面| 精品人妻1区二区| 一区在线观看完整版| 国产精品免费视频内射| 亚洲国产欧美一区二区综合| 亚洲av五月六月丁香网| 99国产精品一区二区蜜桃av| 欧美国产精品va在线观看不卡| 久久久久久国产a免费观看| 91大片在线观看| 啦啦啦免费观看视频1| 欧美日韩福利视频一区二区| 悠悠久久av| 高清毛片免费观看视频网站| 一边摸一边做爽爽视频免费| 日韩高清综合在线| 亚洲五月色婷婷综合| 国产成人精品无人区| 国产熟女xx| 女性生殖器流出的白浆| 黄色毛片三级朝国网站| 日本精品一区二区三区蜜桃| 亚洲在线自拍视频| 亚洲成av片中文字幕在线观看| 久久久久精品国产欧美久久久| 日本欧美视频一区| 久久久久国产一级毛片高清牌| 午夜免费成人在线视频| 国产成人一区二区三区免费视频网站| 伊人久久大香线蕉亚洲五| 香蕉国产在线看| 一边摸一边做爽爽视频免费| 亚洲五月天丁香| 欧美国产精品va在线观看不卡| av在线天堂中文字幕| 男男h啪啪无遮挡| 99国产精品免费福利视频| 在线播放国产精品三级| 色综合亚洲欧美另类图片| 一卡2卡三卡四卡精品乱码亚洲| 人人妻人人澡欧美一区二区 | 国产又爽黄色视频| 女人被狂操c到高潮| 日本五十路高清| 真人一进一出gif抽搐免费| 亚洲熟女毛片儿| 日日干狠狠操夜夜爽| 亚洲国产日韩欧美精品在线观看 | 麻豆国产av国片精品| 日韩国内少妇激情av| 亚洲视频免费观看视频| 欧美成狂野欧美在线观看| 咕卡用的链子| 精品久久久久久,| av网站免费在线观看视频| 亚洲精品国产色婷婷电影| 久久久久久人人人人人| 国产精品自产拍在线观看55亚洲| 欧美一级毛片孕妇| 一边摸一边做爽爽视频免费| 露出奶头的视频| 免费久久久久久久精品成人欧美视频| 亚洲国产高清在线一区二区三 | 好男人电影高清在线观看| 久久亚洲真实| 窝窝影院91人妻| 亚洲国产看品久久| 亚洲色图 男人天堂 中文字幕| 在线国产一区二区在线| 亚洲性夜色夜夜综合| 国产精品一区二区免费欧美| 国产成年人精品一区二区| 中文字幕最新亚洲高清| 国产私拍福利视频在线观看| 国产人伦9x9x在线观看| 亚洲成人国产一区在线观看| av天堂久久9| 国产私拍福利视频在线观看| 久久国产精品人妻蜜桃| 亚洲成av片中文字幕在线观看| 亚洲在线自拍视频| 欧美日本中文国产一区发布| 麻豆一二三区av精品| 国产一区二区在线av高清观看| 成人欧美大片| 嫩草影院精品99| 欧美另类亚洲清纯唯美| 韩国精品一区二区三区| 最新在线观看一区二区三区| 亚洲成人精品中文字幕电影| 亚洲av电影不卡..在线观看| 黄色女人牲交| 精品第一国产精品| 十八禁网站免费在线| 黄片播放在线免费| 国产三级黄色录像| 搡老熟女国产l中国老女人| 极品教师在线免费播放| 亚洲自偷自拍图片 自拍| av在线天堂中文字幕| 黑人操中国人逼视频| 国产亚洲欧美在线一区二区| 丁香六月欧美| 国产精品自产拍在线观看55亚洲| 国产精品亚洲美女久久久| 国产伦人伦偷精品视频| 成人国产综合亚洲| 国产精品 国内视频| 精品少妇一区二区三区视频日本电影| 一区二区三区精品91| 国产视频一区二区在线看| 18美女黄网站色大片免费观看| 韩国av一区二区三区四区| 国产精品久久久久久精品电影 | 高清黄色对白视频在线免费看| 精品一区二区三区av网在线观看| 午夜a级毛片| 老司机午夜十八禁免费视频| 亚洲精品中文字幕在线视频| 涩涩av久久男人的天堂| 这个男人来自地球电影免费观看| 色播在线永久视频| 在线观看免费视频网站a站| 精品一区二区三区四区五区乱码| 丝袜在线中文字幕| 夜夜爽天天搞| 久久精品亚洲熟妇少妇任你| 国产精品自产拍在线观看55亚洲| 一级毛片精品| 一二三四社区在线视频社区8| 亚洲欧美日韩高清在线视频| 嫩草影院精品99| 两性午夜刺激爽爽歪歪视频在线观看 | 亚洲成人精品中文字幕电影| 一区福利在线观看| 欧美一级毛片孕妇| 久久天堂一区二区三区四区| 久久青草综合色| 国产精品日韩av在线免费观看 | 母亲3免费完整高清在线观看| 国产视频一区二区在线看| 午夜精品在线福利| 国产精品久久久久久亚洲av鲁大| 精品日产1卡2卡| 欧美午夜高清在线| 免费一级毛片在线播放高清视频 | 麻豆成人av在线观看| 成年人黄色毛片网站| 亚洲一区二区三区色噜噜| 三级毛片av免费| 色在线成人网| 伦理电影免费视频| 欧美激情极品国产一区二区三区| 亚洲专区字幕在线| 亚洲精华国产精华精| 亚洲中文字幕一区二区三区有码在线看 | 曰老女人黄片| 午夜福利视频1000在线观看 | 成人亚洲精品av一区二区| 久久精品国产清高在天天线| 国产成人免费无遮挡视频| 欧美激情高清一区二区三区| 欧美日韩精品网址| 男人操女人黄网站| 婷婷精品国产亚洲av在线| 成人亚洲精品av一区二区| 欧美老熟妇乱子伦牲交| 亚洲中文日韩欧美视频| 欧美在线一区亚洲| 老汉色∧v一级毛片| 亚洲人成伊人成综合网2020| 一区福利在线观看| 中文字幕久久专区| 欧美日韩乱码在线| 亚洲成人免费电影在线观看| 国产成人一区二区三区免费视频网站| 99re在线观看精品视频| 国产成人av激情在线播放| or卡值多少钱| 亚洲色图av天堂| 给我免费播放毛片高清在线观看| 女人高潮潮喷娇喘18禁视频| 亚洲第一电影网av| 国产精品日韩av在线免费观看 | 国产亚洲av嫩草精品影院| 此物有八面人人有两片| 一卡2卡三卡四卡精品乱码亚洲| 午夜福利,免费看| 波多野结衣巨乳人妻| а√天堂www在线а√下载| 亚洲成人免费电影在线观看| 亚洲人成伊人成综合网2020| 婷婷六月久久综合丁香| 一级毛片精品| 大型av网站在线播放| 妹子高潮喷水视频| 亚洲一区高清亚洲精品| 免费av毛片视频| 窝窝影院91人妻| 男女之事视频高清在线观看| 国产午夜福利久久久久久| 97超级碰碰碰精品色视频在线观看| 一a级毛片在线观看| 亚洲欧美日韩高清在线视频| 欧美日韩乱码在线| 动漫黄色视频在线观看| 十分钟在线观看高清视频www| 国产免费av片在线观看野外av| 脱女人内裤的视频| 性色av乱码一区二区三区2| 亚洲人成网站在线播放欧美日韩| 99久久国产精品久久久| 国产高清激情床上av| 国产精品电影一区二区三区| 亚洲精品中文字幕一二三四区| 激情视频va一区二区三区| 日本vs欧美在线观看视频| 国产蜜桃级精品一区二区三区| 亚洲 欧美一区二区三区| 黄频高清免费视频| 不卡一级毛片| 大码成人一级视频| 99国产精品免费福利视频| 无限看片的www在线观看| 午夜免费激情av| 免费看a级黄色片| 日韩欧美国产在线观看| 亚洲性夜色夜夜综合| 黑人巨大精品欧美一区二区mp4| 国产成人一区二区三区免费视频网站| 婷婷六月久久综合丁香| 国产成人精品久久二区二区免费| 午夜福利在线观看吧| 久久人人97超碰香蕉20202| 一卡2卡三卡四卡精品乱码亚洲| 欧美日本中文国产一区发布| 日韩精品中文字幕看吧| 免费在线观看黄色视频的| 亚洲国产看品久久| 中文字幕av电影在线播放| 亚洲国产精品成人综合色| 老熟妇仑乱视频hdxx| 熟女少妇亚洲综合色aaa.| 国产午夜精品久久久久久| 老熟妇乱子伦视频在线观看| 一进一出抽搐动态| 日韩欧美一区二区三区在线观看| 中文字幕高清在线视频| 亚洲五月天丁香| 波多野结衣高清无吗| 久久伊人香网站| 露出奶头的视频| 国产视频一区二区在线看| e午夜精品久久久久久久| 99热只有精品国产| 国产精品乱码一区二三区的特点 | 成人三级黄色视频| 啦啦啦观看免费观看视频高清 | 999久久久精品免费观看国产| 中文字幕色久视频| 在线天堂中文资源库| 欧美激情久久久久久爽电影 | 国产又色又爽无遮挡免费看| 久久 成人 亚洲| 久久精品91无色码中文字幕| av天堂在线播放| 9色porny在线观看| 最近最新中文字幕大全免费视频| 国产欧美日韩一区二区三区在线| 日本在线视频免费播放| 国产av精品麻豆| 国产一级毛片七仙女欲春2 | 免费无遮挡裸体视频| 美女 人体艺术 gogo| 在线永久观看黄色视频| 9191精品国产免费久久| 一区二区三区精品91| 亚洲自拍偷在线| 久久青草综合色| 电影成人av| 免费看a级黄色片| 欧美一级a爱片免费观看看 | 国产亚洲欧美在线一区二区| 亚洲欧美日韩另类电影网站| 久久久国产成人免费| 两个人免费观看高清视频| 咕卡用的链子| 真人一进一出gif抽搐免费| 精品国产一区二区三区四区第35| 一级毛片精品| 日韩av在线大香蕉| 自线自在国产av| 国产成人欧美在线观看| 在线天堂中文资源库| 少妇 在线观看| 十分钟在线观看高清视频www| АⅤ资源中文在线天堂| 国产精品免费视频内射| 亚洲成国产人片在线观看| 亚洲精品粉嫩美女一区| 国产精品亚洲一级av第二区| 亚洲成a人片在线一区二区| 午夜福利,免费看| 亚洲最大成人中文| 精品国产一区二区久久| 亚洲成人国产一区在线观看| 欧美精品啪啪一区二区三区| 操出白浆在线播放| 国产精品久久久人人做人人爽| 咕卡用的链子| 国产熟女午夜一区二区三区| 在线观看一区二区三区| 久久 成人 亚洲| 午夜福利视频1000在线观看 | 色av中文字幕| 99国产精品免费福利视频| 女人爽到高潮嗷嗷叫在线视频|