• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    字符級的維吾爾語形態(tài)協(xié)同分析方法

    2019-01-29 05:48:32吐爾洪吾司曼楊雅婷艾孜孜吐爾遜程力
    關(guān)鍵詞:詞干音變詞素

    吐爾洪·吾司曼 楊雅婷 艾孜孜·吐爾遜 程力,?

    1.中國科學(xué)院新疆理化技術(shù)研究所, 烏魯木齊 830011; 2.中國科學(xué)院大學(xué), 北京 100049; 3.新疆民族語音語言信息處理實(shí)驗(yàn)室,烏魯木齊 830011; 4.和田師范專科學(xué)校數(shù)學(xué)與信息學(xué)院, 和田 848000; ? 通信作者, E-mail: chengli@ms.xjb.ac.cn

    在自然語言處理中, 語法結(jié)構(gòu)的分析離不開對詞匯形態(tài)學(xué)的分析, 句子語義的分析也離不開對詞匯語義的分析, 因此形態(tài)分析是自然語言處理中的基礎(chǔ)性問題, 在機(jī)器翻譯、信息檢索和問答系統(tǒng)等領(lǐng)域具有廣泛的應(yīng)用前景[1]。維吾爾語是一種黏著性語言, 豐富的構(gòu)形詞綴連接詞干, 表示數(shù)、格、時(shí)態(tài)等語法功能, 例如, 詞干“(夏天)作為名詞時(shí), 連接屬格綴“得到(夏天的), 連接時(shí)位格綴“”得到“(在夏天);(寫)作為動(dòng)詞時(shí),連接過去式形動(dòng)態(tài)綴得到(寫的), 嵌套連接能源體綴、否定綴、現(xiàn)在-將來時(shí)綴及代詞綴“, 得到(我不會(huì)寫)。因此, 維吾爾語單詞通過構(gòu)形方式衍生出新詞。

    自然語言形態(tài)分析研究始于1955年, Harris[2]進(jìn)行英語詞素邊界識別方面的研究, 1970年, Harris[3]進(jìn)行英語詞素邊界識別方面的研究, 并提出基于前文的詞素邊界識別思想; 1994年, Merialdo[4]利用隱馬爾可夫模型(HMM)進(jìn)行基于無監(jiān)督訓(xùn)練的英語詞性標(biāo)注研究。2001年, Goldsmith[5]提出最小描述長度準(zhǔn)則(minimum description length)的形態(tài)分析方法, 在最小描述長度的啟發(fā)式算法中, 較短的字符串更可能被選中為詞干。2005年, Creutz等[6]提出最大自然估計(jì)算法的形態(tài)分析工具M(jìn)orfessor, 并于2007年用最大后驗(yàn)估計(jì)算法對它進(jìn)行改進(jìn), 得到在英語、芬蘭語、土耳其語和阿拉伯語語料上的準(zhǔn)確率分別為66.2%, 66.4%, 70.7%和68.1%[7]。2013年, Ruokolainen等[8]基于條件隨機(jī)場(CRF)算法, 進(jìn)行少量標(biāo)注語料的有監(jiān)督形態(tài)切分研究, 實(shí)驗(yàn)結(jié)果顯示有監(jiān)督訓(xùn)練的效果明顯高于無監(jiān)督訓(xùn)練。

    針對維吾爾語的形態(tài)分析研究始于1997年, 玉素甫·艾白都拉等[9]首次進(jìn)行維吾爾語詞法分析的研究。2006年, 阿依克孜·卡德爾等[10]進(jìn)行維吾爾語名詞及詞綴進(jìn)行語法形態(tài)學(xué)方面的分析。艾山·吾買爾[11]2008年做了有限狀態(tài)自動(dòng)機(jī)與詞典相結(jié)合的維吾爾語名詞詞干切分研究, 測試的準(zhǔn)確率為91%; 2009年采用有限狀態(tài)自動(dòng)機(jī)和最大熵模型(MEM)的混合模型, 來解決詞干切分中的歧義問題[12]。2011年, 薛化建等[13]在詞綴庫的基礎(chǔ)上, 提出一種無監(jiān)督維吾爾語詞切分方法, 該方法在測試集上的準(zhǔn)確率達(dá)到80.4%。

    以上研究主要采用基于規(guī)則的方法, 這類方法最大的缺點(diǎn)在于收集到的規(guī)則無法涵蓋所有的語言現(xiàn)象, 積累規(guī)則需要較高的語言學(xué)方面的知識。因此, 在后來的研究中基于統(tǒng)計(jì)的方法成為主流方向。麥熱哈巴·艾力等[14]提出維吾爾語詞法分析有向圖模型, 將有向圖的節(jié)點(diǎn)作為詞干和詞綴, 圖邊表示節(jié)點(diǎn)之間的轉(zhuǎn)移概率, 針對維吾爾語的音變現(xiàn)象, 提出詞內(nèi)字符對齊算法的自動(dòng)還原模型, 并用統(tǒng)計(jì)的方法解決詞內(nèi)音變現(xiàn)象, 實(shí)驗(yàn)結(jié)果顯示最終詞干提取正確率為94.7%。張海波等[15]將音變還原問題結(jié)合在形態(tài)切分過程中, 有效地避免了串行模型中音變還原對形態(tài)切分的錯(cuò)誤傳播問題。米爾阿迪力江·麥麥提[16]用Morfessor模型在大規(guī)模網(wǎng)絡(luò)文本上做實(shí)驗(yàn), 詞干提取準(zhǔn)確率可以達(dá)到86.08%。Tursun等[17]結(jié)合詞典及規(guī)則進(jìn)行形態(tài)切分, 得到維吾爾語形態(tài)標(biāo)記馬爾科夫模型。哈里旦木·阿布都克里木等[18]采用雙向門限遞歸單元神經(jīng)網(wǎng)絡(luò), 進(jìn)行維吾爾語的形態(tài)切分研究, 通過門限遞歸單元, 有效地處理長距離依賴問題。Maimaiti等[19]用BILSTM-CRF模型進(jìn)行詞性標(biāo)注實(shí)驗(yàn), 并在實(shí)驗(yàn)中論證特征對標(biāo)注模型的重要性。

    維吾爾語形態(tài)分析的目標(biāo)是詞干、詞綴切分以及為它們的語法功能進(jìn)行自動(dòng)標(biāo)注, 這是維吾爾語自然語言處理研究的首要任務(wù)。一方面, 作為形態(tài)復(fù)雜的黏著性語言, 維吾爾語具有眾多的構(gòu)形詞綴、豐富的構(gòu)形規(guī)則、歧義的邊界及詞性以及復(fù)雜的音變現(xiàn)象等特點(diǎn), 使維吾爾語形態(tài)分析成為具有挑戰(zhàn)性的研究。另一方面, 作為語料資源相對缺乏的語言, 沒有相應(yīng)的開源標(biāo)注語料庫, 制約了相關(guān)研究的進(jìn)一步深入。本文在文獻(xiàn)[15]的基礎(chǔ)上, 提出基于字符層面的協(xié)同分析方法, 將形態(tài)切分、形態(tài)標(biāo)注及音變還原任務(wù)統(tǒng)一定義為字符序列的標(biāo)注任務(wù), 從而有效地降低數(shù)據(jù)稀疏和數(shù)據(jù)量少等問題對形態(tài)分析的影響。

    1 維吾爾語形態(tài)分析

    維吾爾語的詞綴有構(gòu)詞詞綴和構(gòu)形詞綴兩種,構(gòu)詞詞綴的數(shù)量較少, 且構(gòu)詞規(guī)則相對固定, 衍生出的新單詞一般在詞典里可以查到, 因此構(gòu)詞詞綴不在本文的研究范圍內(nèi)。構(gòu)形詞綴數(shù)量眾多, 以不同的組合方式連接到詞干, 可以產(chǎn)生多種形態(tài)變化,衍生新的單詞, 使詞匯量劇增, 并在組合過程中發(fā)生音變現(xiàn)象。當(dāng)不同的構(gòu)形詞綴嵌套組合時(shí), 表達(dá)的意思更復(fù)雜。表 1 給出維吾爾語形態(tài)切分的例子。

    目前維吾爾語形態(tài)分析研究面臨的具挑戰(zhàn)性的問題如下。

    1)維吾爾語詞綴眾多, 構(gòu)形方式豐富。維吾爾語是形態(tài)復(fù)雜的語言, 共有300多個(gè)構(gòu)形詞綴, 分為17個(gè)大類, 如人稱、格、比較級和時(shí)態(tài)等, 每一類表達(dá)的語法意義各不相同, 構(gòu)形規(guī)則也不同。

    2)詞素有歧義。維吾爾語單詞的詞性有歧義,這種現(xiàn)象在形容詞和副詞中較常見, 如單詞“”表示“多”的意思, 修飾名詞時(shí)具有形容詞特性, 而修飾動(dòng)作時(shí)具有副詞特性。同樣, 詞綴“當(dāng)動(dòng)名詞綴時(shí)構(gòu)形的動(dòng)詞具有名詞性質(zhì), 而當(dāng)共同態(tài)綴時(shí)表示動(dòng)作共同完成。

    4)切分有歧義。有時(shí)不同的單詞經(jīng)過構(gòu)形后,派生的單詞在書寫形式上是一樣的, 如“(給)和(去)由狀態(tài)副動(dòng)詞綴構(gòu)形后變成此時(shí)很難用規(guī)則判斷其詞干。

    表1 維吾爾語形態(tài)切分例子Table 1 Example of Uyghur morphology

    5)音變現(xiàn)象。維吾爾語在構(gòu)形過程中要遵循語音和諧規(guī)則, 當(dāng)詞干與詞綴、詞綴與詞綴相互連接時(shí), 有可能發(fā)生脫離、弱化以及增音等音變現(xiàn)象(表 2)。

    通過以上分析可以發(fā)現(xiàn), 一個(gè)維吾爾語詞干以不同的構(gòu)形方式派生出不同的新單詞, 派生過程中人稱、數(shù)以及時(shí)態(tài)等語法信息以詞綴的形式表達(dá),這種現(xiàn)象導(dǎo)致機(jī)器翻譯系統(tǒng)中詞對齊效率的降低,增加未登錄詞的數(shù)量, 從而影響譯文質(zhì)量[20-21]。在信息檢索過程中對內(nèi)容進(jìn)行形態(tài)切分, 可以壓縮倒排表的大小, 并且檢索結(jié)果可以覆蓋擁有相同詞干的所有單詞, 因此在縮短系統(tǒng)運(yùn)行時(shí)間的同時(shí), 還可以得到較高的查全率[22]。圖1為維-漢統(tǒng)計(jì)機(jī)器翻譯中詞干切分之前(a)和詞干切分之后(b)雙語句子的對齊結(jié)果, 圖1(a)中中文單詞“加強(qiáng)”與它對應(yīng)的維吾爾文單詞沒有對齊, 而把維吾爾文單詞錯(cuò)誤地與中文單詞“金融業(yè)”對齊。詞干提取之后解決了圖1(a)中的對齊錯(cuò)誤, 如圖1(b)所示。

    表2 維吾爾語音變現(xiàn)象Table 2 Example of phonetic change in Uyghur morphology

    圖1 統(tǒng)計(jì)機(jī)器翻譯中的詞對齊Fig.1 Word alignment in statistical machine translation

    維吾爾語形態(tài)分析的目的包括形態(tài)切分、形態(tài)標(biāo)注及音變還原, 這是進(jìn)行句法分析研究的前提,可對有效地辨別短語結(jié)構(gòu)提供幫助。例如, 名詞和代詞與格詞綴組成格短語(kasus phrase, KP), 動(dòng)詞與時(shí)態(tài)詞綴組成時(shí)態(tài)短語(tense phrase, TP)。圖2顯示例句(他在困難面前沒有害怕。)從詞法分析到句法分析的過程: 第1層是原句的分詞狀態(tài), 第2層是句子中各單詞的詞素切分狀態(tài), 第3層是各詞素的詞性標(biāo)注, 第 4 層是其短語結(jié)構(gòu)。

    2 形態(tài)協(xié)同分析方法

    2.1 任務(wù)定義

    假設(shè)維吾爾語單詞由字符序列c=(c1,c2,c3, …,cn)組成, 其中n為單詞的長度。l=(l1,l2,l3, …,ln)表示c的形態(tài)特征序列, 其中l(wèi)i表示字符ci的形態(tài)特征信息, 包括所在詞素的邊界信息、詞性信息以及所在位置的音變現(xiàn)象信息, 可由li的上下文信息預(yù)測得到。因此, 本文將單詞的形態(tài)分析任務(wù)定義為字符序列的標(biāo)注問題, 即通過觀察序列c, 得到其形態(tài)特征序列l(wèi)。

    Lafferty等[23]提出將線性鏈條件隨機(jī)場(linear chain)應(yīng)用于標(biāo)注問題的思路。條件隨機(jī)場是一種概率無向圖模型, 由無向圖表示聯(lián)合概率分布, 當(dāng)給定隨機(jī)變量X的條件下, 預(yù)測隨機(jī)變量Y。本文將單詞劃為若干個(gè)字符組成的字符序列, 其條件隨機(jī)場模型定義為

    2.2 模型描述

    從維吾爾語單詞詞素邊界識別的角度考慮, 可以簡單地設(shè)置為{B, I}標(biāo)記。其中, B 代表詞素的起始位置, I 代表詞素的非起始位置。為了達(dá)到維吾爾語形態(tài)協(xié)同分析的目的, 本文擴(kuò)充{B, I}標(biāo)記方式。具體地, 把只有形態(tài)切分功能的標(biāo)記擴(kuò)充為同時(shí)包含形態(tài)切分、形態(tài)標(biāo)記以及音變還原功能的標(biāo)記。

    詞素切分由{B, I}標(biāo)記表示。形態(tài)標(biāo)記由詞素的詞性(POS)表示, 例如, “N”表示名詞, “V”表示動(dòng)詞, “CASE”表示格詞綴, 等等。音變現(xiàn)象分別由{N, I, R, S}標(biāo)記表示。N(none)表示沒有發(fā)生音變現(xiàn)象。I(insert)為增音標(biāo)記, 表示當(dāng)前字符在構(gòu)形過程中被增加的字符。R(remove)為脫落標(biāo)記, 表示當(dāng)前和下一個(gè)字符之間發(fā)生字符脫落的現(xiàn)象。R標(biāo)記連帶一個(gè)字符位, 表示被脫落的字符, 如“R表示字符發(fā)生脫落現(xiàn)象。S(substitute)為弱化標(biāo)記, 表示當(dāng)前字符在組合過程中被弱化。S標(biāo)記同樣連帶一個(gè)字符位, 表示被弱化的原始字符, 如表示字符被弱化成當(dāng)前字符。下面以單詞(他們沒有說)為例, 具體處理流程如下。

    圖2 詞法和句法分析過程Fig.2 Process of morphological analysis and syntactic parsing

    1)語料庫中所有單詞進(jìn)行人工切分得到對應(yīng)的詞素序列。單詞的詞素切分形式為

    3)通過字符對齊方法識別詞素內(nèi)的音變現(xiàn)象,得到對應(yīng)的音變還原標(biāo)記序列。音變還原過程由式(2)表示, 其中i為原單詞c的當(dāng)前字符索引,j為詞素序列m的當(dāng)前字符索引。

    字符對齊形式如圖3所示, 各個(gè)詞素的起始位置分別在1, 4, 6, 8和9位。從圖3可以發(fā)現(xiàn), 單詞的第2和第7字符分別弱化成字符和得到“S”標(biāo)記, 第3個(gè)字符為增音字符, 得到“I”標(biāo)記。

    4)根據(jù)詞素的形態(tài)標(biāo)注信息、字母對齊信息以及音變還原信息, 最終得到如表 3 所示的協(xié)同標(biāo)記序列。

    2.3 特征選取

    圖3 字符對齊示意圖Fig.3 Letter alignment in Uyghur wordmorpheme segmentation

    表3 維吾爾語形態(tài)標(biāo)注符合標(biāo)記Table 3 Compound labels used in Uyghur morpheme segmentation

    在訓(xùn)練和解碼過程中, 序列標(biāo)注模型需要加入特征元素, 并且特征的優(yōu)劣直接影響模型的預(yù)測能力。在字符序列中, 上下文關(guān)系是最重要的特征信息, 因此本文在上下文中分別取 1 個(gè)字符、2 個(gè)字符和3個(gè)字符作為模型的特征。表 4 給出本文選取的特征模板, 其中i為觀察窗口的半徑, 并且列舉當(dāng)前字符為單詞的第 5 個(gè)字符, 觀察窗口半徑為 4 時(shí)的特征例子。

    3 實(shí)驗(yàn)

    3.1 實(shí)驗(yàn)數(shù)據(jù)

    本文實(shí)驗(yàn)所用語料是人工進(jìn)行形態(tài)標(biāo)注的 3533條句子, 包含政務(wù)新聞、法律法規(guī)以及文學(xué)類內(nèi)容,其中的 54039 條維吾爾語單詞(詞項(xiàng) 12700 條)中有7116 條單詞發(fā)生音變。表 5 給出語料中各種音變現(xiàn)象的統(tǒng)計(jì)數(shù)據(jù)。從語料中抽取 90%的句子作為訓(xùn)練數(shù)據(jù)(3180 條句子, 包含 48663 條單詞), 其余的 10%作為測試數(shù)據(jù)(353 條句子, 包含 5376 條單詞)。

    表4 特征模板Table 4 Feature template

    表5 語料庫中音變現(xiàn)象的統(tǒng)計(jì)情況Table 5 Statistics of phonetic changes in the dataset

    3.2 實(shí)驗(yàn)結(jié)果

    本文使用 CRFsuite (http://www.chokkan.org/soft ware/crfsuite/)作為訓(xùn)練和解碼工具。為了確定最優(yōu)特征模板的窗口半徑, 在窗口半徑為 2~10 的范圍內(nèi)進(jìn)行9次實(shí)驗(yàn)。本實(shí)驗(yàn)除使用準(zhǔn)確率(Accuracy)外, 還使用詞素邊界識別率(MBIAccuracy)、詞干提取識別率(SSAccuracy, 定義形態(tài)切分中得到的第1個(gè)詞素為該單詞的詞干)、形態(tài)標(biāo)注準(zhǔn)確率(MAAccuracy)以及音變還原準(zhǔn)確率(PRAccuracy)等作為評價(jià)指標(biāo)。表6列出各個(gè)評價(jià)指標(biāo)的定義, 表 7 給出窗口半徑取值不同時(shí)的實(shí)驗(yàn)結(jié)果。

    在同樣的訓(xùn)練集以及測試集上, 用Morfessor(http://morpho.aalto.fi/projects/morpho/)、HMM (http://www.nltk.org/_modules/nltk/tag/hmm.html)以及最大熵 (MEM, http://homepages.inf.ed.ac.uk/lzhang10/max ent.html)模型分別做3次實(shí)驗(yàn), 表8列出CRF, Morfessor, HMM 及 MEM 模型下的最好實(shí)驗(yàn)結(jié)果。

    3.3 實(shí)驗(yàn)分析

    3.3.1 協(xié)同形態(tài)分析實(shí)驗(yàn)

    從表 7 可以看出, 當(dāng)特征模板的窗口半徑設(shè)置為 2 時(shí), 實(shí)驗(yàn)結(jié)果得分最低。隨著窗口半徑增大,實(shí)驗(yàn)結(jié)果得分也明顯提高, 當(dāng)窗口半徑設(shè)置為5時(shí),實(shí)驗(yàn)結(jié)果得分最高。當(dāng)窗口半徑超過 5 以后, 實(shí)驗(yàn)結(jié)果得分幾乎持平, 并有輕微的下降。通過對實(shí)驗(yàn)數(shù)據(jù)進(jìn)行分析, 對該現(xiàn)象的解釋如下。

    1)過擬合。特征模板的窗口半徑超過 5 以后,系統(tǒng)對未登錄詞的預(yù)測能力開始下降, 說明系統(tǒng)中存在過擬合現(xiàn)象, 只能有效地預(yù)測訓(xùn)練集中出現(xiàn)的字符序列, 而對訓(xùn)練集中沒有出現(xiàn)的字符序列的處理能力下降。

    2)兼類詞歧義。當(dāng)兼類詞構(gòu)形時(shí), 詞綴作為上下文特征, 在判斷詞性時(shí)發(fā)揮重要作用。如果兼類詞沒有發(fā)生構(gòu)形, 此時(shí)沒有詞綴可以作為其特征信息, 因此系統(tǒng)將該詞概率最大的詞性作為它的詞性返回。例如, 單詞(其他, 下次)在訓(xùn)練集中出現(xiàn)69次, 其中作為形容詞出現(xiàn)37次, 作為副詞出現(xiàn)7次, 作為語氣詞出現(xiàn)25次, 因此在測試集中作為副詞出現(xiàn)時(shí), 模型錯(cuò)誤的預(yù)測成形容詞。

    3)切分歧義。當(dāng)不同的詞干構(gòu)形之后得到相同的單詞時(shí), 將出現(xiàn)頻率最高的切分形式作為預(yù)測值。如 副 動(dòng) 詞的 切 分 形 式 有去)和給), 第一種切分形式在訓(xùn)練集中出現(xiàn)9次,第二種切分形式出現(xiàn)28次, 因此將測試集中出現(xiàn)的所有切分成第二種形式。

    4)音變還原歧義。構(gòu)形過程中發(fā)生音變現(xiàn)象的詞綴還原時(shí), 還原成同一類詞綴的另一種形式。例如, 測試集中單詞在事業(yè)當(dāng)中)的正確切分形式為但測試結(jié)果中的切分形式為沒能正確地還原時(shí)位格綴上發(fā)生的弱化現(xiàn)象。雖然在訓(xùn)練集中位格綴和發(fā)生弱化次數(shù)同樣為3次, 但是字符發(fā)生267次弱化, 明顯小于字符弱化的次數(shù)(313), 因此模型沒能正確地還原這種音變現(xiàn)象。

    針對第一種情況, 需要合理設(shè)置特種模板的窗口半徑。針對其他3種情況, 通過單詞間的上下文關(guān)系, 可以緩解歧義現(xiàn)象。本文只考慮詞內(nèi)字符間的上下文關(guān)系, 如果將單詞間的上下文關(guān)系作為特征信息參與訓(xùn)練和測試, 可以降低歧義造成的誤判率。

    3.3.2 對比實(shí)驗(yàn)

    對比 4 組實(shí)驗(yàn)結(jié)果(表 8)可以發(fā)現(xiàn), 實(shí)驗(yàn)1的結(jié)果最好, 實(shí)驗(yàn) 2 和 3 的結(jié)果明顯差于實(shí)驗(yàn) 1, 實(shí)驗(yàn) 4的結(jié)果接近于實(shí)驗(yàn) 1。分析原因如下。

    表6 評價(jià)指標(biāo)Table 6 Evaluating indicators

    表7 不同觀察窗口半徑取值情況下的實(shí)驗(yàn)結(jié)果(%)Table 7 Experimental results based on different half window size (%)

    表8 CRF、Morfessor、HMM 和 MEM 模型的結(jié)果對比(%)Table 8 Experimental results on CRF, Morfessor, HMM and MEM (%)

    1)實(shí)驗(yàn) 2 中的Morfessor模型訓(xùn)練時(shí)需要大量的語料, 而我們的訓(xùn)練語料的規(guī)模不大。實(shí)驗(yàn)2的結(jié)果中發(fā)現(xiàn)過度切分現(xiàn)象, 如詞干(職業(yè))被錯(cuò)誤地切分成的形式, 是因?yàn)樵谡Z料庫中出現(xiàn)由詞根切)構(gòu)詞的不同單詞。由 于Morfessor模型不具備標(biāo)注能力, 因此實(shí)驗(yàn)中沒有形態(tài)標(biāo)注和音變還原結(jié)果。

    2)實(shí)驗(yàn) 3 中詞素切分和詞干提取的結(jié)果不理想,是因?yàn)镠MM模型假設(shè)當(dāng)前狀態(tài)只與前一個(gè)狀態(tài)有關(guān), 因此沒有充分利用字符序列中的上下文信息。

    3)實(shí)驗(yàn) 4 中 MEM 模型采用局部最優(yōu)化訓(xùn)練模式, 而實(shí)驗(yàn) 1 中 CRF 模型采用全局最優(yōu)的訓(xùn)練模式,因此MEM對訓(xùn)練集中未出現(xiàn)情況的處理能力比CRF 模型差。圖 4 給出當(dāng)觀察窗口半徑取值不同時(shí),CRF 和 MEM 模型未處理未登錄詞數(shù)量的區(qū)別。

    4 結(jié)論

    圖4 未登錄詞數(shù)Fig.4 Count of unregistered words

    本文提出基于字符級別的有監(jiān)督維吾爾語形態(tài)協(xié)同分析方法。該方法結(jié)合維吾爾語的黏著性特點(diǎn), 將詞素邊界識別、形態(tài)標(biāo)注及音變還原等形態(tài)分析任務(wù)定義為字符序列的標(biāo)注問題, 采用序列標(biāo)注方法, 實(shí)現(xiàn)用一個(gè)模型完成復(fù)雜形態(tài)分析的任務(wù)。實(shí)驗(yàn)結(jié)果證明, 我們提出的模型在維吾爾語的形態(tài)分析任務(wù)中得到較好的效果, 并且根據(jù)不同的應(yīng)用場景, 從結(jié)果中可以得到詞干、詞性標(biāo)注等不同的分析數(shù)據(jù)。該模型在相似語種之間具有一定的通用性, 因此還可以用于與維吾爾語形態(tài)特征相似的哈薩克語、柯爾克孜語等語種的形態(tài)分析任務(wù)。針對實(shí)驗(yàn)過程中發(fā)現(xiàn)的問題, 在后續(xù)工作中, 我們將以單詞間的上下文關(guān)系作為特征進(jìn)行模型優(yōu)化,從而有效地降低歧義導(dǎo)致的誤判率, 進(jìn)一步提高形態(tài)分析的正確率。

    猜你喜歡
    詞干音變詞素
    論柯爾克孜語詞干提取方法
    維吾爾語詞綴變體搭配規(guī)則研究及算法實(shí)現(xiàn)
    詞素配價(jià)理論與應(yīng)用
    亞太教育(2018年5期)2018-12-01 04:58:23
    從詞素來源看現(xiàn)代漢語詞素同一性問題
    辭書研究(2017年3期)2017-05-22 14:04:16
    “分”的音變構(gòu)詞及其句法語義特征
    詞素溶合與溶合詞素
    漢語單數(shù)人稱代詞音變式的功能演變及性質(zhì)
    語言研究(2015年4期)2015-05-28 12:21:30
    融合多策略的維吾爾語詞干提取方法
    基于維吾爾語詞干詞綴粒度的漢維機(jī)器翻譯
    青海貴德縣劉屯話的兒化音變
    少妇猛男粗大的猛烈进出视频 | 国产黄a三级三级三级人| 99热网站在线观看| 天美传媒精品一区二区| 国产淫片久久久久久久久| 别揉我奶头 嗯啊视频| 亚洲人成网站在线观看播放| 小说图片视频综合网站| 精品人妻视频免费看| 国产一区二区亚洲精品在线观看| 免费观看的影片在线观看| 成人二区视频| 欧美日本视频| av在线观看视频网站免费| 一区福利在线观看| 欧美一区二区亚洲| 国产视频内射| 日韩成人伦理影院| 神马国产精品三级电影在线观看| 欧美一区二区国产精品久久精品| 能在线免费观看的黄片| 可以在线观看毛片的网站| 人体艺术视频欧美日本| 26uuu在线亚洲综合色| 美女xxoo啪啪120秒动态图| 午夜爱爱视频在线播放| 成人欧美大片| 永久网站在线| 丰满人妻一区二区三区视频av| 一个人观看的视频www高清免费观看| 麻豆av噜噜一区二区三区| 免费一级毛片在线播放高清视频| 欧美精品一区二区大全| 天堂√8在线中文| 成人无遮挡网站| 中文字幕制服av| 国产伦理片在线播放av一区 | 欧美xxxx黑人xx丫x性爽| 亚洲欧美精品综合久久99| 国产精品不卡视频一区二区| 日产精品乱码卡一卡2卡三| 亚洲自偷自拍三级| 男人和女人高潮做爰伦理| 国产乱人偷精品视频| 国产精品.久久久| 欧美日韩精品成人综合77777| 99九九线精品视频在线观看视频| 亚洲成a人片在线一区二区| 麻豆一二三区av精品| av在线蜜桃| 97超视频在线观看视频| 一本一本综合久久| 青春草视频在线免费观看| 国产午夜福利久久久久久| 亚洲av男天堂| 最近手机中文字幕大全| 丝袜喷水一区| 寂寞人妻少妇视频99o| 免费电影在线观看免费观看| 春色校园在线视频观看| 国产成人精品一,二区 | 麻豆精品久久久久久蜜桃| 少妇的逼水好多| 男的添女的下面高潮视频| 国产高清视频在线观看网站| 1024手机看黄色片| 欧美潮喷喷水| 国产三级中文精品| 久久综合国产亚洲精品| 国产一级毛片在线| 少妇熟女aⅴ在线视频| 亚洲自拍偷在线| 舔av片在线| 三级毛片av免费| 日韩一区二区视频免费看| 麻豆久久精品国产亚洲av| 国产成年人精品一区二区| 插阴视频在线观看视频| av在线老鸭窝| 熟女电影av网| 爱豆传媒免费全集在线观看| 在线免费十八禁| 欧美潮喷喷水| 亚洲精品亚洲一区二区| 超碰av人人做人人爽久久| 亚洲成a人片在线一区二区| 成人欧美大片| 久久99蜜桃精品久久| 国产精品精品国产色婷婷| 久久精品国产亚洲网站| 中文资源天堂在线| avwww免费| 卡戴珊不雅视频在线播放| 欧美成人免费av一区二区三区| 搞女人的毛片| 婷婷六月久久综合丁香| 亚洲高清免费不卡视频| 国产成人精品一,二区 | 中出人妻视频一区二区| 亚洲最大成人中文| 九九久久精品国产亚洲av麻豆| 26uuu在线亚洲综合色| 99国产精品一区二区蜜桃av| 又爽又黄a免费视频| 日本熟妇午夜| 日本-黄色视频高清免费观看| 夜夜看夜夜爽夜夜摸| 日本-黄色视频高清免费观看| 亚洲美女视频黄频| 欧美xxxx黑人xx丫x性爽| 久久久久久久久久久丰满| 黄色一级大片看看| 婷婷六月久久综合丁香| 国产老妇伦熟女老妇高清| 蜜桃久久精品国产亚洲av| 人人妻人人澡人人爽人人夜夜 | 国产亚洲精品av在线| 亚洲精品乱码久久久久久按摩| 国产视频首页在线观看| 极品教师在线视频| 国产高清不卡午夜福利| 麻豆国产97在线/欧美| 久久人人爽人人片av| 中国美白少妇内射xxxbb| 国产精品无大码| 成人午夜高清在线视频| 亚洲国产精品国产精品| 边亲边吃奶的免费视频| 美女xxoo啪啪120秒动态图| 国产精品蜜桃在线观看 | av在线天堂中文字幕| 中出人妻视频一区二区| 夜夜看夜夜爽夜夜摸| АⅤ资源中文在线天堂| 国产精品一二三区在线看| 日韩国内少妇激情av| 日韩中字成人| 欧美zozozo另类| 别揉我奶头 嗯啊视频| 午夜福利在线观看免费完整高清在 | 国产精品女同一区二区软件| 亚洲久久久久久中文字幕| 成人亚洲欧美一区二区av| 99热只有精品国产| 日韩一区二区三区影片| 伦理电影大哥的女人| 久久久久久久久大av| 给我免费播放毛片高清在线观看| 国产精品电影一区二区三区| av在线观看视频网站免费| 欧美在线一区亚洲| 免费人成在线观看视频色| 亚洲精品日韩在线中文字幕 | 国产精品久久久久久久电影| or卡值多少钱| 亚洲不卡免费看| 成人特级黄色片久久久久久久| 国产av不卡久久| 51国产日韩欧美| 国产伦在线观看视频一区| 久久精品国产自在天天线| 一边摸一边抽搐一进一小说| 久久久欧美国产精品| 精华霜和精华液先用哪个| 最后的刺客免费高清国语| 青春草视频在线免费观看| 国产av在哪里看| 成人午夜高清在线视频| av在线老鸭窝| 亚洲乱码一区二区免费版| 日日摸夜夜添夜夜爱| 一本精品99久久精品77| 天天躁夜夜躁狠狠久久av| 在线观看美女被高潮喷水网站| 欧洲精品卡2卡3卡4卡5卡区| 在线观看av片永久免费下载| 嫩草影院新地址| 中文在线观看免费www的网站| 国内精品美女久久久久久| 国产一区二区在线av高清观看| 免费在线观看成人毛片| 三级男女做爰猛烈吃奶摸视频| 丰满人妻一区二区三区视频av| 51国产日韩欧美| 人妻制服诱惑在线中文字幕| 97超视频在线观看视频| 免费在线观看成人毛片| 国产老妇女一区| 深夜精品福利| 婷婷色av中文字幕| 中文亚洲av片在线观看爽| 亚洲国产欧美人成| 色尼玛亚洲综合影院| 一进一出抽搐gif免费好疼| 成人漫画全彩无遮挡| 99热这里只有精品一区| 国产乱人视频| 欧美成人一区二区免费高清观看| 日韩在线高清观看一区二区三区| 菩萨蛮人人尽说江南好唐韦庄 | 亚洲精品456在线播放app| 九九在线视频观看精品| 欧美日韩乱码在线| 日韩大尺度精品在线看网址| 欧美bdsm另类| 国产中年淑女户外野战色| 黄色配什么色好看| 国产精品一区二区三区四区久久| 极品教师在线视频| 日韩一本色道免费dvd| 日韩av在线大香蕉| 老师上课跳d突然被开到最大视频| 国产av在哪里看| 精品久久久久久久末码| 亚洲欧美成人精品一区二区| 久久久久久伊人网av| 亚洲精品影视一区二区三区av| 级片在线观看| av天堂在线播放| 国产精品爽爽va在线观看网站| 干丝袜人妻中文字幕| 天堂中文最新版在线下载 | 免费av观看视频| 精品一区二区免费观看| 欧美成人精品欧美一级黄| 亚洲一区二区三区色噜噜| 国产高清有码在线观看视频| 亚洲欧美成人精品一区二区| 变态另类丝袜制服| 国产 一区 欧美 日韩| 午夜福利在线在线| 日本一二三区视频观看| 国内精品一区二区在线观看| 欧美性猛交╳xxx乱大交人| 国产高清三级在线| 久久这里只有精品中国| 麻豆精品久久久久久蜜桃| 亚洲第一区二区三区不卡| 精品免费久久久久久久清纯| 久久这里有精品视频免费| 亚洲美女视频黄频| 美女国产视频在线观看| 国产精品久久久久久久久免| 欧美精品一区二区大全| 亚洲精品久久国产高清桃花| 少妇熟女aⅴ在线视频| 久久久久久国产a免费观看| 特大巨黑吊av在线直播| 午夜免费男女啪啪视频观看| 日本黄色视频三级网站网址| av国产免费在线观看| 综合色av麻豆| 在线免费观看不下载黄p国产| 久久久久久久久久成人| 日韩欧美精品v在线| 最近中文字幕高清免费大全6| 特大巨黑吊av在线直播| 国语自产精品视频在线第100页| 在线免费观看的www视频| 日本一二三区视频观看| 午夜精品一区二区三区免费看| 亚洲一区二区三区色噜噜| 精品久久国产蜜桃| 国产亚洲欧美98| 岛国毛片在线播放| 99热只有精品国产| 亚洲人与动物交配视频| kizo精华| 国内揄拍国产精品人妻在线| 毛片女人毛片| 国产伦精品一区二区三区四那| 日本免费一区二区三区高清不卡| 欧美成人a在线观看| 91精品一卡2卡3卡4卡| 久久中文看片网| 午夜精品国产一区二区电影 | 亚洲一区二区三区色噜噜| 一级毛片久久久久久久久女| 亚洲av第一区精品v没综合| 日韩欧美精品免费久久| 色综合色国产| 免费观看人在逋| 中文字幕人妻熟人妻熟丝袜美| 国产午夜精品久久久久久一区二区三区| 日日干狠狠操夜夜爽| 久久人妻av系列| 久久久久久九九精品二区国产| 中国美女看黄片| 国产乱人偷精品视频| 久久99精品国语久久久| 国产美女午夜福利| 一级黄色大片毛片| av卡一久久| 简卡轻食公司| 国产午夜福利久久久久久| 亚洲国产精品成人综合色| 久久久精品大字幕| 国产成年人精品一区二区| 久久久色成人| 亚洲中文字幕一区二区三区有码在线看| 亚洲精品影视一区二区三区av| 久久久a久久爽久久v久久| 搡女人真爽免费视频火全软件| 一进一出抽搐动态| 在线观看66精品国产| 天美传媒精品一区二区| 99热精品在线国产| 久久人人爽人人爽人人片va| 乱码一卡2卡4卡精品| 久久久久久九九精品二区国产| 久久国内精品自在自线图片| 日韩在线高清观看一区二区三区| 嫩草影院精品99| 如何舔出高潮| 97人妻精品一区二区三区麻豆| 18禁在线播放成人免费| 级片在线观看| 亚洲精品日韩av片在线观看| 亚洲最大成人手机在线| 夜夜看夜夜爽夜夜摸| 国产精品爽爽va在线观看网站| 99久久人妻综合| 男的添女的下面高潮视频| 亚洲五月天丁香| 亚洲在线观看片| 高清日韩中文字幕在线| 啦啦啦啦在线视频资源| 22中文网久久字幕| 亚洲最大成人av| 成人一区二区视频在线观看| 一本—道久久a久久精品蜜桃钙片 精品乱码久久久久久99久播 | 中文字幕免费在线视频6| 国产黄片美女视频| 菩萨蛮人人尽说江南好唐韦庄 | 久久韩国三级中文字幕| 九草在线视频观看| 精品久久久久久久久av| 赤兔流量卡办理| 日韩欧美精品v在线| 韩国av在线不卡| 国产免费男女视频| 国产精品女同一区二区软件| 尾随美女入室| 久久人人爽人人爽人人片va| 国产av麻豆久久久久久久| 美女大奶头视频| 美女 人体艺术 gogo| 99热精品在线国产| 97在线视频观看| 国产伦精品一区二区三区四那| 国产不卡一卡二| 99热全是精品| 寂寞人妻少妇视频99o| 午夜免费激情av| 国产精品一区二区在线观看99 | 国产伦理片在线播放av一区 | 淫秽高清视频在线观看| 欧美成人精品欧美一级黄| 日本色播在线视频| 欧美成人精品欧美一级黄| 色哟哟哟哟哟哟| 在现免费观看毛片| 91狼人影院| av免费在线看不卡| 午夜激情欧美在线| 只有这里有精品99| 一夜夜www| 久久这里有精品视频免费| 麻豆久久精品国产亚洲av| 午夜福利视频1000在线观看| 久久久久久久亚洲中文字幕| av天堂在线播放| 秋霞在线观看毛片| 国产精品一区二区性色av| 99在线视频只有这里精品首页| 大香蕉久久网| 亚洲va在线va天堂va国产| 成人午夜精彩视频在线观看| 国产精品爽爽va在线观看网站| 欧美变态另类bdsm刘玥| 久久久久久久久久黄片| 可以在线观看毛片的网站| 少妇丰满av| 欧洲精品卡2卡3卡4卡5卡区| 欧美又色又爽又黄视频| 成人二区视频| 男人舔女人下体高潮全视频| 国产亚洲欧美98| 久久国产乱子免费精品| 在线免费观看不下载黄p国产| 2022亚洲国产成人精品| 免费大片18禁| 亚洲国产精品合色在线| 国产精品人妻久久久影院| 久久精品国产99精品国产亚洲性色| 成人三级黄色视频| 午夜福利视频1000在线观看| 12—13女人毛片做爰片一| 午夜老司机福利剧场| 99热精品在线国产| 日韩精品有码人妻一区| 最近中文字幕高清免费大全6| 美女被艹到高潮喷水动态| 男女做爰动态图高潮gif福利片| 欧美极品一区二区三区四区| 国产av在哪里看| 蜜桃亚洲精品一区二区三区| 三级国产精品欧美在线观看| 国产精品嫩草影院av在线观看| 日本黄大片高清| 国产精品久久久久久av不卡| 国产午夜福利久久久久久| 18禁在线播放成人免费| 白带黄色成豆腐渣| 高清毛片免费观看视频网站| 黄色一级大片看看| 日韩高清综合在线| 尾随美女入室| 亚洲av熟女| 亚洲经典国产精华液单| 成人漫画全彩无遮挡| 免费看光身美女| 亚洲精品国产成人久久av| av在线亚洲专区| 床上黄色一级片| 午夜久久久久精精品| 色吧在线观看| 欧美另类亚洲清纯唯美| 国产精品一及| 国产中年淑女户外野战色| 国产午夜精品久久久久久一区二区三区| 晚上一个人看的免费电影| 精品人妻偷拍中文字幕| 一级av片app| 又粗又爽又猛毛片免费看| 久久99热6这里只有精品| 色哟哟哟哟哟哟| 久久久久网色| 久久99蜜桃精品久久| 人妻少妇偷人精品九色| 自拍偷自拍亚洲精品老妇| 欧美成人a在线观看| 99视频精品全部免费 在线| 日韩亚洲欧美综合| 变态另类成人亚洲欧美熟女| 麻豆国产av国片精品| 国语自产精品视频在线第100页| 亚洲高清免费不卡视频| 波野结衣二区三区在线| av卡一久久| 亚洲中文字幕一区二区三区有码在线看| 亚洲欧美日韩卡通动漫| 国产午夜福利久久久久久| 麻豆成人午夜福利视频| 全区人妻精品视频| 久久人人爽人人片av| 1000部很黄的大片| 性欧美人与动物交配| 婷婷六月久久综合丁香| 国产精品蜜桃在线观看 | 欧美zozozo另类| 国产精品一区二区在线观看99 | 亚洲国产色片| .国产精品久久| 免费av毛片视频| 中文字幕免费在线视频6| 免费不卡的大黄色大毛片视频在线观看 | av天堂中文字幕网| 久久九九热精品免费| 九草在线视频观看| 男人和女人高潮做爰伦理| 看黄色毛片网站| 18禁黄网站禁片免费观看直播| 麻豆乱淫一区二区| 亚洲欧美精品专区久久| 蜜桃久久精品国产亚洲av| 国产精品一区二区三区四区久久| 国产伦在线观看视频一区| 国产精品久久视频播放| 两个人的视频大全免费| 嘟嘟电影网在线观看| 亚洲欧美成人综合另类久久久 | 久久久午夜欧美精品| 一个人免费在线观看电影| 欧美一区二区亚洲| 国产亚洲av片在线观看秒播厂 | 给我免费播放毛片高清在线观看| 国产精品1区2区在线观看.| 国模一区二区三区四区视频| 女同久久另类99精品国产91| 成人性生交大片免费视频hd| 国产三级在线视频| 天堂影院成人在线观看| or卡值多少钱| 变态另类成人亚洲欧美熟女| 给我免费播放毛片高清在线观看| 国产午夜精品久久久久久一区二区三区| 亚洲欧美精品综合久久99| 91麻豆精品激情在线观看国产| 欧美变态另类bdsm刘玥| 日日干狠狠操夜夜爽| 亚洲第一区二区三区不卡| 国产亚洲av嫩草精品影院| 国产亚洲5aaaaa淫片| 精品久久久久久成人av| 麻豆国产97在线/欧美| 内射极品少妇av片p| av视频在线观看入口| 日本黄色视频三级网站网址| 欧美丝袜亚洲另类| 亚洲激情五月婷婷啪啪| 午夜精品国产一区二区电影 | 国产又黄又爽又无遮挡在线| 一级毛片电影观看 | 国产爱豆传媒在线观看| 91精品国产九色| 亚洲av免费在线观看| 欧美日韩国产亚洲二区| 免费观看的影片在线观看| 男女啪啪激烈高潮av片| 成年av动漫网址| 在线免费观看的www视频| 中文资源天堂在线| 最近手机中文字幕大全| 国产极品天堂在线| 夜夜夜夜夜久久久久| 国产真实伦视频高清在线观看| 一卡2卡三卡四卡精品乱码亚洲| 亚洲国产欧洲综合997久久,| 国产成人午夜福利电影在线观看| 深爱激情五月婷婷| a级一级毛片免费在线观看| 欧美在线一区亚洲| 边亲边吃奶的免费视频| 亚洲欧美精品综合久久99| 亚洲av免费在线观看| 欧美激情国产日韩精品一区| 99久国产av精品国产电影| 色综合色国产| 午夜爱爱视频在线播放| 日韩av不卡免费在线播放| 亚洲国产精品成人久久小说 | www.av在线官网国产| 在线免费十八禁| 男女下面进入的视频免费午夜| 国产av麻豆久久久久久久| 日日干狠狠操夜夜爽| 边亲边吃奶的免费视频| 亚洲av不卡在线观看| 长腿黑丝高跟| 18+在线观看网站| 黄色视频,在线免费观看| 伦理电影大哥的女人| 简卡轻食公司| 菩萨蛮人人尽说江南好唐韦庄 | 在线播放国产精品三级| 在线a可以看的网站| 国内揄拍国产精品人妻在线| 1024手机看黄色片| 久久久久久九九精品二区国产| 国产成人影院久久av| 12—13女人毛片做爰片一| 一本一本综合久久| 成人亚洲欧美一区二区av| 天美传媒精品一区二区| 国产在线男女| 精品久久久久久久久av| 色尼玛亚洲综合影院| 亚洲精品色激情综合| 欧美另类亚洲清纯唯美| 国内揄拍国产精品人妻在线| 级片在线观看| 日韩制服骚丝袜av| 女的被弄到高潮叫床怎么办| 菩萨蛮人人尽说江南好唐韦庄 | 欧美成人精品欧美一级黄| 亚洲自拍偷在线| 国产久久久一区二区三区| 狂野欧美激情性xxxx在线观看| 女同久久另类99精品国产91| 午夜精品在线福利| 久久亚洲精品不卡| 色尼玛亚洲综合影院| 偷拍熟女少妇极品色| 免费一级毛片在线播放高清视频| 亚洲国产精品成人综合色| 国产精品一区二区在线观看99 | 美女内射精品一级片tv| 日韩精品青青久久久久久| 老师上课跳d突然被开到最大视频| 国产黄色小视频在线观看| 国产精品不卡视频一区二区| 两个人视频免费观看高清| 成人午夜精彩视频在线观看| 乱人视频在线观看| 插阴视频在线观看视频| 日本三级黄在线观看| 久久精品91蜜桃| 午夜福利在线观看吧| 插逼视频在线观看| 午夜亚洲福利在线播放| 成人一区二区视频在线观看| 亚洲av.av天堂| 日韩视频在线欧美| 亚洲熟妇中文字幕五十中出| 欧洲精品卡2卡3卡4卡5卡区| 看非洲黑人一级黄片| 91精品国产九色| 亚洲综合色惰| 国产乱人偷精品视频| 又粗又硬又长又爽又黄的视频 | 久久精品综合一区二区三区| 91精品一卡2卡3卡4卡| 床上黄色一级片| 国产精品久久久久久久久免|