• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    SegT:一個(gè)實(shí)用的藏文分詞系統(tǒng)

    2012-06-28 08:25:38劉匯丹諾明花趙維納賀也平
    中文信息學(xué)報(bào) 2012年1期
    關(guān)鍵詞:方法

    劉匯丹,諾明花,趙維納,吳 健,賀也平

    (1.中國(guó)科學(xué)院 軟件研究所,北京 100190;2.中國(guó)科學(xué)院 研究生院,北京 100190;3.北京語(yǔ)言大學(xué),北京 100083;4.青海師范大學(xué), 青海 西寧 810008)

    1 引言

    藏文各音節(jié)之間由音節(jié)點(diǎn)分隔,但是詞與詞之間卻沒(méi)有分隔標(biāo)記,同漢語(yǔ)類似,分詞是藏文信息處理的基礎(chǔ)。藏文分詞的應(yīng)用涉及藏文信息檢索、文語(yǔ)轉(zhuǎn)換、文本校正、機(jī)器翻譯、文本分類、自動(dòng)摘要等多個(gè)領(lǐng)域。本文首先回顧藏文分詞的研究歷史,然后在分析現(xiàn)有藏文分詞方法和分詞系統(tǒng)的基礎(chǔ)上,設(shè)計(jì)實(shí)現(xiàn)一個(gè)藏文分詞系統(tǒng)SegT,介紹其中的各主要模塊的核心功能和實(shí)現(xiàn)方法,然后通過(guò)實(shí)驗(yàn)對(duì)系統(tǒng)進(jìn)行了測(cè)試,并對(duì)結(jié)果進(jìn)行了分析。

    2 相關(guān)工作

    1999年,扎西次仁在分析藏文分詞中詞表的不確定性、未登錄詞、切分歧義等問(wèn)題的基礎(chǔ)上,設(shè)計(jì)了一個(gè)采用最大匹配算法的人機(jī)互助藏文分詞和登錄新詞的系統(tǒng)[1],由人監(jiān)控機(jī)器分詞的過(guò)程,糾正機(jī)器犯下的少量錯(cuò)誤,但是“該系統(tǒng)尚不具備實(shí)用分詞的功能”[2]。與此同時(shí),羅秉芬等在500萬(wàn)字藏語(yǔ)真實(shí)文本語(yǔ)料分詞的實(shí)踐中歸納出藏文計(jì)算機(jī)自動(dòng)分詞的36條基本規(guī)則[3],首次對(duì)藏文的分詞規(guī)范進(jìn)行了研究。2003年,江荻以現(xiàn)代藏語(yǔ)形式語(yǔ)法為基礎(chǔ)提出了藏語(yǔ)組塊分析和塊內(nèi)分詞的方法與過(guò)程[4]。同年,陳玉忠等在提出了一個(gè)基于格助詞和接續(xù)特征分塊的書(shū)面藏文分詞方案,綜合運(yùn)用藏文字、詞、句等各類形態(tài)特征,在藏文格助詞、接續(xù)特征、字性知識(shí)庫(kù)以及詞典的支持下,采用逐級(jí)定位的確定性算法實(shí)現(xiàn)藏文的自動(dòng)分詞?;诖朔桨笇?shí)現(xiàn)的分詞系統(tǒng)在500句的測(cè)試集上的初步測(cè)試結(jié)果表明系統(tǒng)分詞正確率在97%以上,且有不受領(lǐng)域限制、通用性強(qiáng)的特點(diǎn)[5-7]。2006年,祁坤鈺在研究藏語(yǔ)形式邏輯格、語(yǔ)義邏輯格、音勢(shì)論等語(yǔ)法理論的基礎(chǔ)上,充分利用藏語(yǔ)上下文語(yǔ)境,在不同藏語(yǔ)句子層面采用不同的處理方法,格切分用于句子結(jié)構(gòu)層面,邊界符判定用于短語(yǔ)切分,模式匹配用于詞塊切分,提出了切分與格框架、標(biāo)注一體化的藏語(yǔ)三級(jí)切分體系[8]。2009年,才智杰設(shè)計(jì)了“班智達(dá)藏文分詞系統(tǒng)”,該系統(tǒng)首先使用四個(gè)屬格助詞和四個(gè)作格(又稱具格)助詞共八個(gè)“特殊格助詞”對(duì)藏文進(jìn)行分塊處理,然后使用采用最大匹配方法進(jìn)行分詞,并采用“還原法”識(shí)別藏文中的緊縮詞[9-10]。同年,孫媛等也在使用格助詞分塊方法的基礎(chǔ)上設(shè)計(jì)并實(shí)現(xiàn)了藏文分詞系統(tǒng),該系統(tǒng)采用雙向掃描的方法檢測(cè)交集型歧義字段,并利用詞頻信息進(jìn)行消歧[11-14]。江荻、陳玉忠、才讓加、扎西加、關(guān)白、多拉等還對(duì)藏文詞語(yǔ)分類體系和標(biāo)注集進(jìn)行了研究,總體上推進(jìn)了藏文分詞以及文本分析研究的進(jìn)展,不再贅述。

    總的來(lái)說(shuō),除了考慮藏文語(yǔ)言文字本身的特性以外,藏文分詞仍然主要采用基于詞典的最大匹配方法,應(yīng)用于漢語(yǔ)分詞的隱馬爾科夫、最大熵、條件隨機(jī)場(chǎng)等模型在藏文分詞中還未能得以應(yīng)用,究其原因,主要是因?yàn)槟壳斑€沒(méi)有形成規(guī)模的藏文分詞語(yǔ)料可用,無(wú)法對(duì)這些模型進(jìn)行訓(xùn)練。

    3 我們的系統(tǒng)

    前述藏文分詞的各種方法,主要有以下特點(diǎn):一是使用了格助詞及接續(xù)特征進(jìn)行分塊;二是核心算法大多采用基于詞典的最大匹配方法;三是在最大匹配的過(guò)程中考慮緊縮詞的識(shí)別。這三點(diǎn)是現(xiàn)有藏文分詞系統(tǒng)共同的特點(diǎn),只不過(guò)各個(gè)系統(tǒng)的側(cè)重點(diǎn)有所不同。除此之外,已有系統(tǒng)開(kāi)始考慮歧義字段的識(shí)別和消歧。

    我們以上述方法為基礎(chǔ),構(gòu)建一個(gè)藏文分詞系統(tǒng),并重點(diǎn)做到以下幾個(gè)方面:一是增加分詞詞典的詞匯量并提高詞典的質(zhì)量;二是提高格助詞分塊過(guò)程中臨界詞識(shí)別算法的效率;三是在緊縮詞識(shí)別中采用音節(jié)分析技術(shù),充分利用藏文特性提高緊縮詞識(shí)別的正確率;四是檢測(cè)交集型歧義字段,并根據(jù)大規(guī)模詞頻統(tǒng)計(jì)結(jié)果進(jìn)行消歧。

    下面首先介紹整個(gè)系統(tǒng)的流程,然后針對(duì)其中的關(guān)鍵問(wèn)題介紹我們的方法。

    3.1 系統(tǒng)流程

    整個(gè)系統(tǒng)的流程如圖1所示。系統(tǒng)首先對(duì)輸入文本進(jìn)行預(yù)處理,然后分句,再對(duì)每一句藏文使用格助詞進(jìn)行分塊,并在分塊過(guò)程中進(jìn)行臨界詞的識(shí)別,在塊內(nèi)使用最大匹配方法進(jìn)行分詞,并同時(shí)進(jìn)行藏文緊縮詞的識(shí)別。分詞可以按照正向最大匹配、逆向最大匹配、雙向最大匹配等三種方式進(jìn)行,在進(jìn)行雙向最大匹配之后,檢測(cè)兩種分詞結(jié)果的歧義,并進(jìn)行消歧,最后輸出分詞結(jié)果。

    圖1 分詞流程圖

    3.2 分詞詞典整理

    我們從《藏漢大辭典》、《漢藏對(duì)照詞典》、《藏漢對(duì)照拉薩口語(yǔ)詞典》等多部詞典中提取藏文詞條,并收集整理了普通詞典未收錄但在分詞中應(yīng)該作為一個(gè)分詞單位的藏文語(yǔ)言成分,具體請(qǐng)參考藏文分詞規(guī)范相關(guān)的文獻(xiàn)。為了保證分詞詞典的質(zhì)量,我們投入了大量時(shí)間進(jìn)行人工篩選校對(duì),最終形成分詞用藏文詞典,共包含近22萬(wàn)藏文詞條。

    3.3 詞頻統(tǒng)計(jì)

    在進(jìn)行分詞消歧的過(guò)程中需要使用詞頻信息,所以如果沒(méi)有詞頻信息就不能保證正確分詞;然而,如果沒(méi)有正確切分的藏文語(yǔ)料就不能準(zhǔn)確統(tǒng)計(jì)藏文詞頻。我們采用迭代訓(xùn)練的方法進(jìn)行詞頻統(tǒng)計(jì)來(lái)解決此問(wèn)題。該方法不依賴于所用藏文語(yǔ)料的所屬領(lǐng)域、主題、來(lái)源等因素,具有通用性。

    圖2 詞頻統(tǒng)計(jì)方法與過(guò)程圖

    如圖2所示,首先對(duì)全部藏文語(yǔ)料分別進(jìn)行正向最大匹配分詞和逆向最大匹配分詞,并分別對(duì)分詞結(jié)果進(jìn)行詞頻統(tǒng)計(jì),然后將兩種方法統(tǒng)計(jì)的詞頻(頻次)累加作為初始詞頻。將初始詞頻作為第一輪迭代詞頻,使用雙向最大匹配分詞,檢測(cè)切分歧義并利用迭代詞頻進(jìn)行消歧,這樣對(duì)全部藏文語(yǔ)料進(jìn)行切分,形成第一次切分語(yǔ)料,再對(duì)切分語(yǔ)料進(jìn)行詞頻統(tǒng)計(jì),得到第二輪迭代詞頻。如此循環(huán),直到本輪迭代詞頻與上一輪迭代詞頻的差異小于閾值。最后一輪迭代得到的詞頻信息在經(jīng)過(guò)人工校對(duì)之后可以近似認(rèn)為是真實(shí)文本的詞頻。

    詞頻統(tǒng)計(jì)中用到的藏文語(yǔ)料主要包括《鄧小平文選》第二卷、《江澤民文選》第一、二、三卷、《中辦通訊》、《西藏政報(bào)》、《西藏通訊》、國(guó)家歷年法律法規(guī)、西藏自治區(qū)地方法規(guī)、部分其他書(shū)籍以及從部分藏文網(wǎng)站上抓取的網(wǎng)頁(yè)。語(yǔ)料總規(guī)模達(dá)到35.6M,共計(jì)23萬(wàn)藏文句子,累計(jì)詞頻2 850 322。經(jīng)過(guò)統(tǒng)計(jì),我們發(fā)現(xiàn)對(duì)于詞頻統(tǒng)計(jì)所用語(yǔ)料來(lái)說(shuō),分詞詞典中只有45 740個(gè)詞條是有效的(詞頻>0),只占分詞詞典的21%。因在詞頻統(tǒng)計(jì)過(guò)程中暫未全面考慮語(yǔ)料所用藏文文本的代表性和平衡性等因素,該詞頻數(shù)據(jù)只在一定范圍內(nèi)有效。但我們保證了所有詞的頻次是在對(duì)相同規(guī)模的語(yǔ)料進(jìn)行統(tǒng)計(jì)的基礎(chǔ)上得到的,避免使用不同來(lái)源的詞頻數(shù)據(jù)帶來(lái)的問(wèn)題。

    3.4 預(yù)處理和分句

    由于文字處理軟件對(duì)藏文的斷行規(guī)則支持不完善,為了符合藏文排版的特性,編輯人員經(jīng)常在每行的行尾人工插入回車換行符。為了不影響分詞結(jié)果,需要將這些多余字符刪除。

    3.5 臨界詞的快速識(shí)別方法

    在格助詞分塊的過(guò)程中,我們采用了文獻(xiàn)[10]中的方法,以八個(gè)“特殊格助詞”為標(biāo)志進(jìn)行分塊。由于部分藏文詞本身就包含了“特殊格助詞”作為子串(文獻(xiàn)[10]中將這些詞稱為“臨界詞”),為了不致錯(cuò)誤切分,必須識(shí)別這些臨界詞。在我們的分詞詞典中,包含臨界詞共計(jì)13 936條。采用格助詞分塊的初衷是利用格助詞是藏文天然的詞邊界這一特性,提高了分詞的效率和準(zhǔn)確率;而識(shí)別臨界詞是為了避免在格助詞分塊過(guò)程中錯(cuò)誤地將詞典中包含的詞切斷。在臨界詞識(shí)別過(guò)程中如果采用與最大匹配類似的算法,則將違背其初衷。下面介紹我們的方法。

    記“特殊格助詞”的集合為:

    假設(shè)包含“特殊格助詞”的藏文句子S由n個(gè)音節(jié)構(gòu)成,其中第i個(gè)音節(jié)是“特殊格助詞”,即

    若臨界詞最大長(zhǎng)度為m個(gè)音節(jié)(假設(shè)n≥2m-1),則臨界詞可能的左邊界和右邊界均有m個(gè),需要查詞典共計(jì)(1+2+…+m)=m(m+1)/2次,即使詞典查詢算法的時(shí)間復(fù)雜度是O(1)的,整個(gè)臨界詞識(shí)別算法的時(shí)間復(fù)雜度也要達(dá)到O(m2),這將與最大匹配方法的時(shí)間復(fù)雜度相同,則整個(gè)系統(tǒng)的分詞速度與不使用格助詞分塊直接應(yīng)用最大匹配方法相比將不可能有明顯提高。

    我們使用Trie樹(shù)來(lái)降低臨界詞識(shí)別算法的時(shí)間復(fù)雜度。假設(shè)臨界詞W由n個(gè)音節(jié)構(gòu)成,其中第i個(gè)音節(jié)是“特殊格助詞”,即:

    則其含格助詞前綴是:

    含格助詞逆序前綴(下稱“逆序前綴”)是*嚴(yán)格地講,藏文音節(jié)有多個(gè)字符構(gòu)成,單個(gè)音節(jié)的逆序與其自身并不相同,方便起見(jiàn),此處忽略其差異。:

    其含格助詞后綴(下稱“后綴”)是:

    3.6 緊縮詞的識(shí)別

    3.7 切分歧義檢測(cè)

    對(duì)于任意由n個(gè)音節(jié)構(gòu)成的藏文句子S:

    若正向最大匹配和逆向最大匹配分別給出了不同的分詞結(jié)果WA和WB,分別切分出了n和m個(gè)詞(m≠n),即:

    則存在k使得Wak≠Wbk,而對(duì)于任意的i

    圖3 交集型歧義檢測(cè)示意圖

    記D(i,j)=Len(Wi)+Len(Wi+1)+…+Len(Wj),i

    其中Len(Wi)指藏文詞Wi的長(zhǎng)度(字符數(shù))。這樣D(i,j)就是從第i個(gè)詞到第j個(gè)詞的總長(zhǎng)度,從k向后掃描,必存在i和j,使得D(k,i)=D(k,j),但對(duì)于任意的i′

    3.8 分詞消歧

    在漢語(yǔ)分詞中,分詞消歧一般采用最大概率分詞方法,該方法計(jì)算對(duì)歧義字段的每種切分方法切分出來(lái)的詞串的概率,并取概率值最大的詞串作為切分結(jié)果。但是最大概率分詞算法需要對(duì)詞頻統(tǒng)計(jì)結(jié)果進(jìn)行歸一化和數(shù)據(jù)平滑處理。我們借鑒最大概率分詞的思想,設(shè)計(jì)了更便于實(shí)現(xiàn)的方法。

    對(duì)于藏文詞典G中的詞條W,記freq(W)為W的詞頻(頻次),定義消歧能力函數(shù)如下:

    F(W)=

    我們認(rèn)為,對(duì)于藏文來(lái)說(shuō),22萬(wàn)詞條的詞典規(guī)模是相當(dāng)大的,在消歧過(guò)程中應(yīng)該將詞典中不存在的詞(應(yīng)用最大匹配方法此時(shí)都是單個(gè)音節(jié))和詞頻為零的詞區(qū)別對(duì)待,所以在消歧能力函數(shù)中對(duì)這兩類詞分別取不同的值。而對(duì)于詞頻大于零的詞,我們認(rèn)為詞頻分別為2 000和1 999的兩個(gè)詞的消歧能力差異要小于詞頻分別為20和19的兩個(gè)詞的消歧能力差異,為此,我們?cè)谙缒芰瘮?shù)中使用關(guān)于詞頻的對(duì)數(shù)函數(shù)衡量消歧能力。

    對(duì)于歧義字段的每個(gè)候選切分結(jié)果來(lái)說(shuō),整個(gè)詞串的消歧能力F是其每個(gè)詞Wi的消歧能力的累加F=∑F(Wi),并取使F最大的切分結(jié)果作為消歧結(jié)果。

    4 實(shí)驗(yàn)方法與結(jié)果

    下面,我們通過(guò)兩個(gè)實(shí)驗(yàn)分別考察格助詞分塊對(duì)分詞系統(tǒng)的效率影響,以及正向、逆向、雙向匹配消歧等方法的分詞效果。

    4.1 格助詞分塊的效率

    我們從語(yǔ)料中選擇了包含藏文詞數(shù)最多的六份藏文語(yǔ)料,共包含藏文78 421句,近90萬(wàn)詞。對(duì)每份語(yǔ)料,我們分別直接按正向最大匹配、逆向最大匹配、雙向匹配消歧三種方法進(jìn)行分詞,并分別啟用格助詞分塊功能,與啟用之前作比較。表1列出了統(tǒng)計(jì)結(jié)果,在啟用格助詞分塊功能之前,三種方法對(duì)六份語(yǔ)料的分詞過(guò)程分別耗時(shí)19 500ms、19 516ms、29 829ms,在啟用之后,耗時(shí)分別降為16 580ms、16 673ms、24 578ms,分詞速度比之前分別提高了14.97%、14.57%和17.60%。對(duì)單個(gè)文件的分詞,最多節(jié)省時(shí)間達(dá)到了26.72%。圖4顯示了格助詞分塊對(duì)分詞效率的提高效果。這樣的測(cè)試結(jié)果表明,我們?cè)O(shè)計(jì)的格助詞分塊和臨界詞識(shí)別方法對(duì)于分詞效率的提高是十分明顯的。

    表1 啟用格助詞分塊前后的分詞時(shí)間消耗對(duì)比

    圖4 格助詞分塊對(duì)分詞效率的提高

    4.2 分詞正確性評(píng)測(cè)

    在系統(tǒng)的開(kāi)發(fā)期間,我們從語(yǔ)料庫(kù)中選擇了部分文章作為開(kāi)發(fā)集,進(jìn)行了較大規(guī)模的測(cè)試,檢查系統(tǒng)中存在的問(wèn)題,并對(duì)所使用的規(guī)則和詞典進(jìn)行了初步修正。然后,我們從23萬(wàn)句的藏文語(yǔ)料中隨機(jī)抽取了4 000個(gè)藏文句子。其中的3 000句作為訓(xùn)練集,使用本系統(tǒng)切分,由人工檢查其中存在的問(wèn)題,然后對(duì)規(guī)則和詞典進(jìn)行了進(jìn)一步修正。另外1 000句作為測(cè)試集,由系統(tǒng)初步切分,然后經(jīng)過(guò)反復(fù)數(shù)次的人工校對(duì),形成標(biāo)準(zhǔn)文本,用于系統(tǒng)評(píng)測(cè)。

    我們將采用正確率(P)、召回率(R)、F值三個(gè)指標(biāo)對(duì)系統(tǒng)進(jìn)行分詞正確性評(píng)測(cè)。這三個(gè)指標(biāo)的計(jì)算方法如下:

    測(cè)試數(shù)據(jù)如表2所示,系統(tǒng)正確率(P)最高達(dá)到了96.987 5%,召回率(R)最高達(dá)到了96.911 2%,F(xiàn)值最高達(dá)到了96.949 3%。圖5對(duì)正向最大匹配、逆向最大匹配、雙向匹配消歧三種方法的分詞效果作了對(duì)比,其中逆向最大匹配方法的效果最差,相比之下,正向最大匹配方法的效果提高了約1.8個(gè)百分點(diǎn),雙向匹配消歧的效果最好,比正向最大匹配方法提高了約1.5個(gè)百分點(diǎn),說(shuō)明我們的歧義檢測(cè)和消歧方法是有效的。

    表2 分詞正確性測(cè)試數(shù)據(jù)

    圖5 三種方法的分詞正確性對(duì)比

    圖6 使用格助詞分塊前后的切分正確率對(duì)比

    在測(cè)試中,使用雙向匹配消歧方法共有421個(gè)詞切分錯(cuò)誤。其中有306個(gè)由交集型歧義引起,占72.68%,有71個(gè)由組合型歧義引起,占16.86%,有28個(gè)由未登錄詞引起,占6.65%,另有少部分錯(cuò)誤由其它因素引起。在統(tǒng)計(jì)分詞錯(cuò)誤的過(guò)程中我們發(fā)現(xiàn),如果繼續(xù)對(duì)詞典進(jìn)行修正,系統(tǒng)的正確率還有進(jìn)一步提高的可能。

    5 結(jié)束語(yǔ)

    在分析現(xiàn)有藏文分詞方法的基礎(chǔ)上,我們?cè)O(shè)計(jì)實(shí)現(xiàn)了一個(gè)藏文分詞系統(tǒng)SegT,該系統(tǒng)使用格助詞分塊和最大匹配方法進(jìn)行分詞,采用雙向切分檢測(cè)分詞歧義并使用預(yù)先統(tǒng)計(jì)的詞頻信息進(jìn)行消歧。實(shí)驗(yàn)數(shù)據(jù)顯示,本文所設(shè)計(jì)的格助詞分塊和快速臨界詞識(shí)別方法可以將分詞速度提高15%左右。

    由于最大匹配分詞方法對(duì)詞典的依賴性非常大,我們?cè)诜衷~詞典整理工作上投入了大量的時(shí)間。最終在1 000句的測(cè)試集上進(jìn)行了系統(tǒng)評(píng)測(cè),系統(tǒng)的分詞正確率為96.98%,基本達(dá)到了實(shí)用水平。我們同時(shí)測(cè)試了格助詞分塊對(duì)于分詞結(jié)果的影響,測(cè)試數(shù)據(jù)表明,格助詞分塊對(duì)于分詞正確率沒(méi)有明顯提高或者降低。

    致謝

    本文所用分詞詞典和測(cè)試語(yǔ)料由西藏大學(xué)工學(xué)院楊毛卓瑪、官卻多杰、索南扎西人工校對(duì),作者在此表示衷心的感謝!

    [1]扎西次仁.一個(gè)人機(jī)互助的藏文分詞和詞登錄系統(tǒng)的設(shè)計(jì)[C]//中國(guó)少數(shù)民族語(yǔ)言文字現(xiàn)代化文集,北京:民族出版社,1999.

    [2]江荻.藏語(yǔ)文本信息處理的歷程與進(jìn)展[C]//中文信息處理前沿進(jìn)展——中國(guó)中文信息學(xué)會(huì)二十五周年學(xué)術(shù)會(huì)議論文集.北京:清華大學(xué)出版社,2006:83-97.

    [3]羅秉芬,江荻.藏文計(jì)算機(jī)自動(dòng)分詞的基本規(guī)則[C]//中國(guó)少數(shù)民族語(yǔ)言文字現(xiàn)代化文集,北京:民族出版社,1999.

    [4]江荻.現(xiàn)代藏語(yǔ)組塊分詞的方法與過(guò)程[J].民族語(yǔ)文,2003,(4):31-39.

    [5]陳玉忠,俞士汶.藏文信息處理技術(shù)的研究現(xiàn)狀與展望[J].中國(guó)藏學(xué),2003,(4):97-107.

    [6]陳玉忠,李保利,俞士汶,等.基于格助詞和接續(xù)特征的藏文自動(dòng)分詞方案[J].語(yǔ)言文字應(yīng)用,2003,(1):75-82.

    [7]陳玉忠,李保利,俞士汶.藏文自動(dòng)分詞系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].中文信息學(xué)報(bào),2003,17(3):15-20.

    [8]祁坤鈺.信息處理用藏文自動(dòng)分詞研究[J].西北民族大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版),2006,(4):92-97.

    [9]才智杰.班智達(dá)藏文自動(dòng)分詞系統(tǒng)的設(shè)計(jì)[C]//中國(guó)少數(shù)民族語(yǔ)言文字信息處理研究與進(jìn)展——第十二屆中國(guó)少數(shù)民族語(yǔ)言文字信息處理學(xué)術(shù)研討會(huì)論文集,2009.

    [10]才智杰.藏文自動(dòng)分詞系統(tǒng)中緊縮詞的識(shí)別[J].中文信息學(xué)報(bào),2009,23(1):35-37.

    [11]孫媛,羅桑強(qiáng)巴,楊銳,等.藏語(yǔ)自動(dòng)分詞方案的設(shè)計(jì)[C]//中國(guó)少數(shù)民族語(yǔ)言文字信息處理研究與進(jìn)展——第十二屆中國(guó)少數(shù)民族語(yǔ)言文字信息處理學(xué)術(shù)研討會(huì)論文集,2009.

    [12]Yuan Sun,Zhijuan Wang,Xiaobing Zhao,et al.Design of a Tibetan Automatic Word Segmentation Scheme[C]//Proceedings of 2009 1st IEEE International Conference on Information Engineering and Computer Science,2009:1-6.

    [13]孫媛,羅桑強(qiáng)巴,楊銳,等.藏語(yǔ)交集型歧義字段切分方法研究[C]//中國(guó)少數(shù)民族語(yǔ)言文字信息處理研究與進(jìn)展——第十二屆中國(guó)少數(shù)民族語(yǔ)言文字信息處理學(xué)術(shù)研討會(huì)論文集,2009.

    [14]Yuan Sun,Xiaodong Yan,Xiaobing Zhao,et al.A resolution of overlapping ambiguity in Tibetan word segmentation[C]//Proceedings of 2010 3rd International Conference on Computer Science and Information Technology,2010.222-225.

    [15]胡書(shū)津.簡(jiǎn)明藏文文法[M].昆明:云南民族出版社,2000.

    猜你喜歡
    方法
    中醫(yī)特有的急救方法
    中老年保健(2021年9期)2021-08-24 03:52:04
    高中數(shù)學(xué)教學(xué)改革的方法
    化學(xué)反應(yīng)多變幻 “虛擬”方法幫大忙
    變快的方法
    兒童繪本(2020年5期)2020-04-07 17:46:30
    學(xué)習(xí)方法
    可能是方法不對(duì)
    用對(duì)方法才能瘦
    Coco薇(2016年2期)2016-03-22 02:42:52
    最有效的簡(jiǎn)單方法
    山東青年(2016年1期)2016-02-28 14:25:23
    四大方法 教你不再“坐以待病”!
    Coco薇(2015年1期)2015-08-13 02:47:34
    賺錢方法
    看片在线看免费视频| 成人欧美大片| 午夜精品国产一区二区电影 | 久久这里只有精品中国| 69av精品久久久久久| 韩国av在线不卡| 日本在线视频免费播放| 国产免费男女视频| 美女免费视频网站| 岛国在线免费视频观看| 麻豆av噜噜一区二区三区| 免费人成在线观看视频色| 九九在线视频观看精品| 国产精品免费一区二区三区在线| 男女之事视频高清在线观看| 欧美色欧美亚洲另类二区| 黄色欧美视频在线观看| 日韩人妻高清精品专区| 国产精品人妻久久久影院| 夜夜爽天天搞| 精品日产1卡2卡| 久久亚洲国产成人精品v| ponron亚洲| 亚洲熟妇中文字幕五十中出| 成人性生交大片免费视频hd| 麻豆一二三区av精品| 国产老妇女一区| avwww免费| 嫩草影院新地址| 亚洲成a人片在线一区二区| a级一级毛片免费在线观看| 不卡一级毛片| 97超视频在线观看视频| 好男人在线观看高清免费视频| 国产片特级美女逼逼视频| 又爽又黄a免费视频| 免费无遮挡裸体视频| 亚洲真实伦在线观看| or卡值多少钱| 国产中年淑女户外野战色| 一级毛片aaaaaa免费看小| 亚洲第一区二区三区不卡| 久久精品国产清高在天天线| 亚洲欧美清纯卡通| 欧美最黄视频在线播放免费| 国产高清视频在线播放一区| 99九九线精品视频在线观看视频| 乱系列少妇在线播放| 亚洲三级黄色毛片| 亚洲精品亚洲一区二区| 亚洲最大成人av| 少妇人妻精品综合一区二区 | 看片在线看免费视频| 免费在线观看影片大全网站| 成人特级av手机在线观看| 午夜爱爱视频在线播放| 国产伦精品一区二区三区四那| 内射极品少妇av片p| 国产精品久久久久久久电影| 国产一区亚洲一区在线观看| 狂野欧美白嫩少妇大欣赏| 国产精品电影一区二区三区| 国产精品综合久久久久久久免费| 少妇的逼好多水| 1024手机看黄色片| 99热精品在线国产| 老熟妇仑乱视频hdxx| 少妇的逼好多水| 国产成人aa在线观看| 亚洲成a人片在线一区二区| 尾随美女入室| 久久精品久久久久久噜噜老黄 | 日韩欧美三级三区| 一本久久中文字幕| 成人欧美大片| 国产真实伦视频高清在线观看| av中文乱码字幕在线| 国产亚洲91精品色在线| 99热6这里只有精品| 久久久久久久久中文| 日本免费一区二区三区高清不卡| 日韩三级伦理在线观看| 国产黄色视频一区二区在线观看 | 极品教师在线视频| 91狼人影院| 亚洲自拍偷在线| 18禁在线播放成人免费| 欧美高清性xxxxhd video| 波野结衣二区三区在线| 国产精品一区二区三区四区久久| 亚洲最大成人手机在线| 国产探花在线观看一区二区| av天堂在线播放| 国产精品三级大全| 国产精品一二三区在线看| 国产午夜精品论理片| 亚洲自拍偷在线| 成人午夜高清在线视频| 日本在线视频免费播放| 亚洲成人久久性| 91久久精品国产一区二区三区| 在线免费十八禁| 国产在线男女| 五月伊人婷婷丁香| 男插女下体视频免费在线播放| 亚洲国产精品国产精品| 日本黄色视频三级网站网址| 亚洲熟妇中文字幕五十中出| 久久久国产成人精品二区| 国产成人freesex在线 | 精品久久久久久久久久免费视频| 欧美日韩一区二区视频在线观看视频在线 | 搡老熟女国产l中国老女人| 免费看a级黄色片| 国产精品女同一区二区软件| 日本在线视频免费播放| 日韩人妻高清精品专区| 亚洲国产精品成人综合色| 别揉我奶头 嗯啊视频| 国产精品亚洲一级av第二区| 欧美性猛交黑人性爽| 性欧美人与动物交配| 国产午夜精品论理片| 国产午夜福利久久久久久| 亚洲av电影不卡..在线观看| 97在线视频观看| 亚州av有码| 国产伦精品一区二区三区视频9| 欧美一区二区精品小视频在线| 日产精品乱码卡一卡2卡三| 国产蜜桃级精品一区二区三区| 亚洲av成人av| 一级毛片电影观看 | 亚洲av电影不卡..在线观看| 国产 一区 欧美 日韩| 欧美激情国产日韩精品一区| 国产午夜福利久久久久久| 精品国产三级普通话版| 欧美精品国产亚洲| 免费人成视频x8x8入口观看| 好男人在线观看高清免费视频| 国产69精品久久久久777片| 日韩欧美在线乱码| 亚洲精品成人久久久久久| 免费观看人在逋| 成年av动漫网址| 久久久久国产精品人妻aⅴ院| 午夜福利18| 亚洲婷婷狠狠爱综合网| 日日摸夜夜添夜夜添小说| 国内少妇人妻偷人精品xxx网站| 久久久精品94久久精品| 成人性生交大片免费视频hd| 少妇熟女aⅴ在线视频| 国产精品久久久久久精品电影| 综合色丁香网| 国产又黄又爽又无遮挡在线| 国产精品无大码| 97热精品久久久久久| 欧美潮喷喷水| 精品一区二区三区人妻视频| 欧美日韩在线观看h| 床上黄色一级片| 给我免费播放毛片高清在线观看| 久久久精品大字幕| 精华霜和精华液先用哪个| 一级毛片我不卡| 日韩一区二区视频免费看| 亚洲成人精品中文字幕电影| 亚洲四区av| 成人综合一区亚洲| 亚洲精品日韩av片在线观看| 亚洲欧美日韩高清专用| 午夜日韩欧美国产| 久久精品国产清高在天天线| 一进一出抽搐动态| 网址你懂的国产日韩在线| 国产高清视频在线观看网站| 国产精品久久电影中文字幕| 国产三级中文精品| 一级毛片我不卡| 欧美潮喷喷水| 男女下面进入的视频免费午夜| 卡戴珊不雅视频在线播放| 精品一区二区三区av网在线观看| 悠悠久久av| 一个人免费在线观看电影| 中文在线观看免费www的网站| 你懂的网址亚洲精品在线观看 | 又粗又爽又猛毛片免费看| 一个人免费在线观看电影| 国产色爽女视频免费观看| 亚洲精品在线观看二区| 高清毛片免费观看视频网站| 内射极品少妇av片p| 美女黄网站色视频| 国产精品电影一区二区三区| 又粗又爽又猛毛片免费看| av在线天堂中文字幕| 蜜桃久久精品国产亚洲av| 久久精品91蜜桃| 久久综合国产亚洲精品| 级片在线观看| 精华霜和精华液先用哪个| 久久久色成人| 三级经典国产精品| 国产精品女同一区二区软件| av黄色大香蕉| 婷婷色综合大香蕉| 久久久色成人| 99久久九九国产精品国产免费| 久久久久久久久久黄片| 欧美3d第一页| 欧美一区二区精品小视频在线| 超碰av人人做人人爽久久| 久久人妻av系列| 亚洲真实伦在线观看| 久久久久国内视频| 日韩国内少妇激情av| 天堂动漫精品| 欧美国产日韩亚洲一区| 久久人人精品亚洲av| 99riav亚洲国产免费| 日韩在线高清观看一区二区三区| 日韩制服骚丝袜av| 欧美xxxx性猛交bbbb| 一个人看的www免费观看视频| 天堂√8在线中文| 极品教师在线视频| 国产男靠女视频免费网站| 插阴视频在线观看视频| 国产探花极品一区二区| 我要看日韩黄色一级片| 大又大粗又爽又黄少妇毛片口| av天堂在线播放| 男人的好看免费观看在线视频| 亚洲av中文字字幕乱码综合| 97超视频在线观看视频| 午夜福利成人在线免费观看| 亚洲自拍偷在线| 1024手机看黄色片| 熟女电影av网| 嫩草影院新地址| 成人欧美大片| 精品国产三级普通话版| 少妇人妻精品综合一区二区 | 精品一区二区三区视频在线观看免费| 乱人视频在线观看| 亚洲欧美日韩高清在线视频| 美女免费视频网站| 色视频www国产| 寂寞人妻少妇视频99o| 日本a在线网址| 99热精品在线国产| 国产成年人精品一区二区| 亚洲av不卡在线观看| 午夜福利高清视频| 久久天躁狠狠躁夜夜2o2o| 中文资源天堂在线| 国国产精品蜜臀av免费| 亚洲三级黄色毛片| 国产一区亚洲一区在线观看| 中文字幕人妻熟人妻熟丝袜美| 我的老师免费观看完整版| 久久6这里有精品| 青春草视频在线免费观看| 在线观看一区二区三区| 亚洲精品456在线播放app| 亚洲成人久久性| 一区二区三区免费毛片| 色综合色国产| а√天堂www在线а√下载| 可以在线观看毛片的网站| 国产成人91sexporn| 日本黄色片子视频| 久久欧美精品欧美久久欧美| 国产精品美女特级片免费视频播放器| .国产精品久久| 精品免费久久久久久久清纯| av专区在线播放| 久久精品国产亚洲av香蕉五月| 久久精品夜色国产| 一进一出抽搐gif免费好疼| 国产成人影院久久av| 看免费成人av毛片| 最近中文字幕高清免费大全6| 精品国内亚洲2022精品成人| 我的女老师完整版在线观看| 亚洲第一电影网av| 国产伦精品一区二区三区视频9| 久久人人爽人人片av| 麻豆久久精品国产亚洲av| 一边摸一边抽搐一进一小说| 少妇高潮的动态图| 一区二区三区四区激情视频 | 久久久久久九九精品二区国产| 偷拍熟女少妇极品色| 联通29元200g的流量卡| 亚洲一级一片aⅴ在线观看| 又爽又黄无遮挡网站| 亚洲av中文av极速乱| 久久午夜亚洲精品久久| 在线a可以看的网站| 日本爱情动作片www.在线观看 | 女人十人毛片免费观看3o分钟| 国产乱人偷精品视频| 婷婷色综合大香蕉| 色av中文字幕| 最新中文字幕久久久久| 欧美成人精品欧美一级黄| 午夜福利在线在线| 少妇人妻精品综合一区二区 | 国产男靠女视频免费网站| 久久久国产成人免费| 夜夜看夜夜爽夜夜摸| 18禁在线无遮挡免费观看视频 | 亚洲av熟女| 赤兔流量卡办理| 波多野结衣高清作品| 别揉我奶头 嗯啊视频| 看非洲黑人一级黄片| 性欧美人与动物交配| 蜜臀久久99精品久久宅男| 老司机影院成人| 在线天堂最新版资源| 精品久久久久久久末码| av天堂中文字幕网| 欧美在线一区亚洲| 亚洲色图av天堂| 一个人免费在线观看电影| 欧美日本视频| 欧美性感艳星| 国产精品99久久久久久久久| 日本免费a在线| 国产亚洲精品av在线| 久久精品综合一区二区三区| 日日摸夜夜添夜夜添小说| 亚洲av成人av| 日日摸夜夜添夜夜添小说| АⅤ资源中文在线天堂| 免费人成在线观看视频色| 十八禁网站免费在线| 亚洲av成人精品一区久久| 我的女老师完整版在线观看| 久久久久久久亚洲中文字幕| 国产欧美日韩精品亚洲av| 又黄又爽又刺激的免费视频.| 自拍偷自拍亚洲精品老妇| 99热6这里只有精品| 久久精品人妻少妇| aaaaa片日本免费| 精品一区二区三区人妻视频| 给我免费播放毛片高清在线观看| 日本熟妇午夜| 免费人成视频x8x8入口观看| 网址你懂的国产日韩在线| 日韩av在线大香蕉| 看十八女毛片水多多多| 一个人观看的视频www高清免费观看| 亚洲精华国产精华液的使用体验 | 久久久久九九精品影院| 国产亚洲精品久久久久久毛片| 嫩草影院新地址| 国产成人freesex在线 | 色综合色国产| 日本成人三级电影网站| 欧美在线一区亚洲| 日本成人三级电影网站| 久久国内精品自在自线图片| 99视频精品全部免费 在线| videossex国产| av福利片在线观看| 午夜免费激情av| 国产精品亚洲一级av第二区| 一本一本综合久久| 悠悠久久av| 午夜爱爱视频在线播放| 国产av在哪里看| 美女高潮的动态| 亚洲乱码一区二区免费版| 99热全是精品| 美女免费视频网站| 欧美国产日韩亚洲一区| 99热只有精品国产| 啦啦啦观看免费观看视频高清| 日日撸夜夜添| 亚洲人成网站高清观看| 国产国拍精品亚洲av在线观看| 国产精品一区二区免费欧美| 亚洲熟妇中文字幕五十中出| 国产探花在线观看一区二区| 露出奶头的视频| 久久亚洲国产成人精品v| 国产精品女同一区二区软件| 国产毛片a区久久久久| 欧美在线一区亚洲| 熟女电影av网| 国产人妻一区二区三区在| 老熟妇仑乱视频hdxx| 热99re8久久精品国产| 亚洲精品在线观看二区| 99久国产av精品| 看非洲黑人一级黄片| 日本三级黄在线观看| 丰满的人妻完整版| 黄色欧美视频在线观看| 日韩强制内射视频| 日韩,欧美,国产一区二区三区 | 日本熟妇午夜| 久久精品国产亚洲av天美| 国内久久婷婷六月综合欲色啪| 久久久久久九九精品二区国产| 精品人妻视频免费看| 非洲黑人性xxxx精品又粗又长| 天天一区二区日本电影三级| 亚洲无线在线观看| 蜜桃亚洲精品一区二区三区| 我的老师免费观看完整版| 女人十人毛片免费观看3o分钟| 干丝袜人妻中文字幕| 亚洲性久久影院| 天天躁夜夜躁狠狠久久av| 亚洲精品国产av成人精品 | 欧美bdsm另类| 欧美色欧美亚洲另类二区| 在线天堂最新版资源| 亚洲熟妇中文字幕五十中出| 极品教师在线视频| 日本黄大片高清| 久久精品影院6| 亚洲天堂国产精品一区在线| 亚洲熟妇熟女久久| 亚洲国产日韩欧美精品在线观看| av在线天堂中文字幕| 人妻制服诱惑在线中文字幕| 欧美成人一区二区免费高清观看| 熟女电影av网| 欧美xxxx性猛交bbbb| 国产av在哪里看| 晚上一个人看的免费电影| 久久久成人免费电影| 国产高清三级在线| 噜噜噜噜噜久久久久久91| 日韩国内少妇激情av| 一区二区三区免费毛片| 成人毛片a级毛片在线播放| 国产精品一二三区在线看| 久久精品国产自在天天线| 中文在线观看免费www的网站| 亚洲av美国av| 亚洲人成网站在线观看播放| 天美传媒精品一区二区| 九九在线视频观看精品| 最近的中文字幕免费完整| 色在线成人网| 国产乱人偷精品视频| АⅤ资源中文在线天堂| 欧美激情国产日韩精品一区| 日韩高清综合在线| 91午夜精品亚洲一区二区三区| 日本撒尿小便嘘嘘汇集6| 男人和女人高潮做爰伦理| 在线观看免费视频日本深夜| 国产黄色视频一区二区在线观看 | 美女高潮的动态| 日日啪夜夜撸| 最近的中文字幕免费完整| 中文字幕av成人在线电影| 欧美+亚洲+日韩+国产| 久久精品夜夜夜夜夜久久蜜豆| 国产中年淑女户外野战色| av天堂在线播放| 国产黄色视频一区二区在线观看 | 嫩草影院入口| 国产精品亚洲美女久久久| 久久精品综合一区二区三区| 精品国内亚洲2022精品成人| 精品午夜福利在线看| 青春草视频在线免费观看| 九九热线精品视视频播放| 亚洲av中文字字幕乱码综合| 国产私拍福利视频在线观看| 国产综合懂色| 国产成人91sexporn| 亚洲图色成人| 少妇人妻一区二区三区视频| 麻豆精品久久久久久蜜桃| 亚洲精品日韩在线中文字幕 | 在现免费观看毛片| 亚洲经典国产精华液单| 国产高清有码在线观看视频| 欧美日本视频| 欧美一区二区亚洲| 欧美中文日本在线观看视频| 婷婷色综合大香蕉| 人妻久久中文字幕网| 国产一级毛片七仙女欲春2| 欧美性猛交╳xxx乱大交人| 日日摸夜夜添夜夜添av毛片| 欧美性猛交黑人性爽| 欧美日本视频| 亚洲七黄色美女视频| 亚洲av二区三区四区| 欧美成人一区二区免费高清观看| 国产免费男女视频| 日韩av在线大香蕉| 欧美最黄视频在线播放免费| 国产一区二区亚洲精品在线观看| 大又大粗又爽又黄少妇毛片口| 久久中文看片网| 亚洲在线自拍视频| 国产精品,欧美在线| 欧美高清性xxxxhd video| 美女黄网站色视频| 成人一区二区视频在线观看| 长腿黑丝高跟| 中文字幕av在线有码专区| 我要看日韩黄色一级片| 日韩成人伦理影院| 深爱激情五月婷婷| 欧美激情国产日韩精品一区| 欧美激情在线99| 人人妻人人澡人人爽人人夜夜 | 黄片wwwwww| 桃色一区二区三区在线观看| 亚洲真实伦在线观看| 午夜激情欧美在线| 男人舔奶头视频| 97超级碰碰碰精品色视频在线观看| 老熟妇仑乱视频hdxx| 狂野欧美白嫩少妇大欣赏| 男女啪啪激烈高潮av片| 热99re8久久精品国产| 亚洲欧美日韩无卡精品| 亚洲不卡免费看| 亚洲一级一片aⅴ在线观看| 久久久久久久亚洲中文字幕| 天堂√8在线中文| 波多野结衣巨乳人妻| av在线天堂中文字幕| 国内精品久久久久精免费| a级毛片免费高清观看在线播放| 成人美女网站在线观看视频| 精品久久久久久久久av| 99久久精品一区二区三区| 成人精品一区二区免费| 美女xxoo啪啪120秒动态图| 日本熟妇午夜| 精品久久久久久久末码| 日韩欧美 国产精品| 美女xxoo啪啪120秒动态图| 国产免费男女视频| 色播亚洲综合网| 亚洲专区国产一区二区| 99久国产av精品国产电影| 成人av一区二区三区在线看| 少妇人妻精品综合一区二区 | 最近最新中文字幕大全电影3| 波多野结衣高清无吗| 狂野欧美白嫩少妇大欣赏| 亚洲成人久久性| 国产精品美女特级片免费视频播放器| 中文字幕av成人在线电影| 女的被弄到高潮叫床怎么办| 婷婷六月久久综合丁香| 亚洲精品456在线播放app| 少妇被粗大猛烈的视频| 精品人妻一区二区三区麻豆 | 1024手机看黄色片| 久久久午夜欧美精品| 中文字幕免费在线视频6| 高清日韩中文字幕在线| 亚洲在线自拍视频| 国产av不卡久久| 久久久欧美国产精品| 嫩草影院精品99| 日本熟妇午夜| 亚洲av免费高清在线观看| 人人妻,人人澡人人爽秒播| 九九爱精品视频在线观看| 国产精品免费一区二区三区在线| 国产在线精品亚洲第一网站| 亚洲精品国产成人久久av| 欧美不卡视频在线免费观看| 亚洲婷婷狠狠爱综合网| 国产精品亚洲一级av第二区| 在线免费十八禁| 欧美又色又爽又黄视频| 人妻久久中文字幕网| 久久久久久久久大av| 免费av观看视频| 日日干狠狠操夜夜爽| 国产白丝娇喘喷水9色精品| 一级毛片我不卡| 成人毛片a级毛片在线播放| 欧美色欧美亚洲另类二区| 精华霜和精华液先用哪个| 久久久久精品国产欧美久久久| 22中文网久久字幕| 日韩 亚洲 欧美在线| 最好的美女福利视频网| 精品久久久久久成人av| 99久久中文字幕三级久久日本| 在线播放国产精品三级| 看非洲黑人一级黄片| 观看免费一级毛片| 露出奶头的视频| 日日摸夜夜添夜夜添小说| 亚洲性夜色夜夜综合| 老熟妇乱子伦视频在线观看| 好男人在线观看高清免费视频| 免费无遮挡裸体视频| 最近手机中文字幕大全| 亚洲成人久久性| 欧美色欧美亚洲另类二区|