• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    藏文語義詞典建設(shè)中語義關(guān)系抽取方法的研究

    2021-03-24 11:26:41曲塔吉安見才讓
    計算機時代 2021年2期
    關(guān)鍵詞:自然語言處理語義

    曲塔吉 安見才讓

    摘? 要: 研究語義是當(dāng)前人工智能、語義網(wǎng)、語義詞典等研究領(lǐng)域的熱點,它可以有效支持機器翻譯和自然語言處理等技術(shù)。文章根據(jù)藏文獨特的文法特性,運用藏文邏輯格和計算語言學(xué)知識,在保留藏文原有特點的基礎(chǔ)上,為藏文語義關(guān)系抽取方法建立較完整的語義場,以此為藏文語義詞典建設(shè)提供了基礎(chǔ)性構(gòu)建方法。

    關(guān)鍵詞: 語義; 藏文格助詞; 語義關(guān)系抽取; 自然語言處理

    中圖分類號:TP391.1? ? ? ? ? 文獻標(biāo)識碼:A? ? ?文章編號:1006-8228(2021)02-46-03

    Abstract: Semantic research is a hot topic in artificial intelligence, semantic web, semantic dictionary and other research fields. It can effectively support machine translation and natural language processing. According to the unique grammatical characteristics of Tibetan, this paper utilizes the knowledge of Tibetan logic case and computational linguistics, and on the basis of retaining the original characteristics of Tibetan, establishes a relatively complete semantic field for Tibetan semantic relationship extraction method, so as to provide a basic construction method for the construction of Tibetan semantic dictionary.

    Key words: semantics; Tibetan case particle; semantic relation extraction; natural language processing

    0 引言

    近年來,自然語言處理技術(shù)為具有傳承價值的民族文字提供了很多優(yōu)質(zhì)的推廣平臺。現(xiàn)有相關(guān)算法有效解決了藏民族在自然語言處理技術(shù)方面遇到的各種問題,尤其是在藏文字的輸入與處理、機器翻譯等領(lǐng)域有了不少研究性成果,并在民族地區(qū)有了廣泛的應(yīng)用,很多網(wǎng)站都添加了藏文字顯示的功能。

    但是,藏文語義詞典建設(shè)中語義關(guān)系的抽取方法還值得進一步研究。因此,本文在藏文語義關(guān)系抽取方法當(dāng)中深入分析了藏文語義關(guān)系的各種性質(zhì)和特征;還將藏文字文法知識當(dāng)中的格助詞應(yīng)用于其中,因為在藏文語義關(guān)系抽取過程當(dāng)中[1],藏文句子單詞與單詞的結(jié)合、單詞與短語的結(jié)合要添加很多具有各種應(yīng)用表達作用的格助詞,才能有效的把句子與句末的動詞相結(jié)合,然后根據(jù)句子結(jié)構(gòu)當(dāng)中語法的多變性,將句子結(jié)構(gòu)的復(fù)雜性通過語法的方式表達出句子更多不同的含義。

    1 相關(guān)工作

    通過了解語義及語義關(guān)系相關(guān)的含義、特征以及關(guān)系分析,可以系統(tǒng)的分析一個詞或一個句子的意思,對藏文語義關(guān)系抽取提供有力的語料庫標(biāo)注參考價值。

    1.1 含義

    語義[1]在藏語中稱為“????????”,即語言的意義。是詞生成句子后,通過不同的表達形式完善語言的意義。語義關(guān)系是指在句法結(jié)構(gòu)、文法結(jié)構(gòu)當(dāng)中由某個詞語或句子的語義范疇所建立起來的關(guān)系,既能聯(lián)系整個句子的邏輯關(guān)系也能表達其中的語義關(guān)系。

    1.2 特征

    語義的特征[2]能將詞語中符合組合選擇的、有區(qū)別性特征的最小語義成分分析出來;能幫助整理詞類序列相同、內(nèi)部構(gòu)造層次相同的語義類;可以對產(chǎn)生歧義的詞語語義類進行再細分,凸顯同一語義類的不同詞語之間的差異等,如表1所示。

    語義特征分析能有效的描述語言的結(jié)構(gòu)規(guī)則,最大限度分析出句子當(dāng)中語義結(jié)構(gòu)間錯綜復(fù)雜的關(guān)系,從而讓句子的內(nèi)容變得簡單易懂、更好的解釋語言現(xiàn)象。

    1.3 藏文格助詞

    藏文格助詞[1]能通過藏文句子自身的特點對藏文字獨有的結(jié)構(gòu)規(guī)則和特征進行分析,按照給定的語法規(guī)則推導(dǎo)出藏文句子的結(jié)構(gòu)規(guī)律;還能根據(jù)其結(jié)構(gòu)規(guī)律將句子的句法單位與它們之間的關(guān)系聯(lián)系在一起,再把最小的語義成分組成更大的語義成分,更細致的分析有名詞、代詞的句子當(dāng)中發(fā)生的各種結(jié)構(gòu)關(guān)系,對藏文語義關(guān)系抽取方法的研究起到了語料庫標(biāo)注的參考價值。

    2 句法關(guān)系分析和語義關(guān)系分析

    句法關(guān)系分析[3]是對某個句子當(dāng)中的主謂賓、動賓等進行結(jié)構(gòu)性的分析;語義關(guān)系分析[3]是對句子的意思進行意義和語法分析,將句子里包括的格助詞(施事、受事、時間、處所等)做進一步分析,以此達到句法關(guān)系與語義關(guān)系抽取的最佳效果。

    藏文單詞在進入句子以后,詞語與詞語之間會形成一種詞匯意義之外的關(guān)系。這種關(guān)系是要通過一定的結(jié)構(gòu)形式來表現(xiàn)的,是單詞在語句結(jié)構(gòu)中體現(xiàn)出來的意義。它不同于詞匯意義,也不同于句法意義,但又屬于語法意義。因此,語義的相關(guān)知識細化句法知識,句法知識概括了語義知識,也加強了語義關(guān)系的解釋力。如表2所示。

    3 基于藏文詞典建設(shè)的語義關(guān)系抽取方法

    研究是藏文語義關(guān)系抽取[3]首先要建立藏語詞典和規(guī)則庫,字典中存放藏文詞性標(biāo)注和藏文角色標(biāo)注,在規(guī)則庫中存放藏文的相關(guān)語法規(guī)則,由于藏文、漢語、英語的句法規(guī)則有很大的區(qū)別,例如漢語一般是主謂賓結(jié)構(gòu),但藏文一般是主賓謂結(jié)構(gòu),所研究藏文語義關(guān)系抽取可采用以下三種方法。

    ⑴ 建立語義場

    建立語義場[4],就是要對語義特征進行系統(tǒng)化表述。比如建立上下位關(guān)系、整體與部分關(guān)系、反義/同義關(guān)系等等??梢约毞指鞣N各樣的關(guān)系,可以將同一個環(huán)境當(dāng)中的事物聯(lián)系在一起,也可以用意義同類的組織詞匯原則的方式進行同類歸類。如圖1所示。

    ⑵ 依賴語義知識進行詞義消歧

    語義知識消歧,是為了在抽取語義關(guān)系時提高句子意義的準(zhǔn)確率和識別率[5]。如表3所示。

    ⑶ 語言篩選

    語言篩選是選用語義篩選和句法篩選兩種方法,以此來判斷一個詞或者整個句子的句法語義關(guān)系。

    語義角色篩選[6] 語義篩選利用藏文文法當(dāng)中的處所、動作、結(jié)果等語義角色篩選描述語言用處的成分,但不篩選句子當(dāng)中存在的格助詞。如表4所示。

    詞性篩選 詞性篩選利用藏文的詞性分析將整個句子的名詞、動詞、形容詞等放在語義關(guān)系識別的語言范疇內(nèi)。如表5所示。

    4 總結(jié)與展望

    基于藏文語義詞典建設(shè)中的語義關(guān)系抽取是分析句法語義的一種手段。在參考英語、漢語的語義關(guān)系抽取知識后,可以采用學(xué)習(xí)英語、漢語對詞義進行義素分析或格分析的方法進行進一步研究,加強對藏文語義關(guān)系抽取方法的語義知識體系的把握。但是,在此基礎(chǔ)上分析的藏文語義關(guān)系抽取方法在進行篩選和排除時[3],存在著相當(dāng)大的難處,尤其句子形式與意義的非一一對應(yīng)性的句子(比如:一個形式多個意義的詞性多義詞、一個意義多個形式的句子同義結(jié)構(gòu)的句子)需要花大量的人工進行再三分析標(biāo)注,越復(fù)雜的隱含句子,越容易產(chǎn)生錯誤意義,會導(dǎo)致結(jié)果的抽取識別率下降。

    下一步將分析研究計算機語義理論和方法研究的結(jié)合,來獲取藏文語義信息處理所需的技術(shù)和方法,以提高藏文字詞匯分析和句子結(jié)構(gòu)分析的準(zhǔn)確性,提高藏語言信息處理的理解性,為監(jiān)控和檢索藏語信息處理水平提供理論支撐和實用參考。

    參考文獻(References):

    [1] 格桑居冕.實用藏文文法教程修訂版[M].四川民族出版社,2011.

    [2] 安見才讓.藏文信息處理原理與技術(shù)實現(xiàn)[M].青海民族出版社,2017.

    [3] 東主才讓.語言學(xué)概論[M].青海民族出版社,2013.

    [4] 俞士汶.計算語言學(xué)[M].北京商務(wù)印書館,2003.

    [5] 何晗.自然語言處理入門[M].人民郵電出版社,2019.

    [6] 龍從軍.基于多策略的藏語語義角色標(biāo)注研究[J].中文信息學(xué)報,2014.

    猜你喜歡
    自然語言處理語義
    語言與語義
    基于組合分類算法的源代碼注釋質(zhì)量評估方法
    面向機器人導(dǎo)航的漢語路徑自然語言組塊分析方法研究
    “上”與“下”語義的不對稱性及其認知闡釋
    詞向量的語義學(xué)規(guī)范化
    漢哈機器翻譯中的文字轉(zhuǎn)換技術(shù)研究
    HowNet在自然語言處理領(lǐng)域的研究現(xiàn)狀與分析
    科技視界(2016年5期)2016-02-22 11:41:39
    基于.NET的維哈柯多語種網(wǎng)上數(shù)據(jù)采集系統(tǒng)的設(shè)計與實現(xiàn)
    認知范疇模糊與語義模糊
    “深+N季”組配的認知語義分析
    东山县| 武胜县| 灯塔市| 赣州市| 蓬安县| 治县。| 瑞金市| 忻州市| 交口县| 永济市| 河东区| 凉城县| 怀柔区| 马关县| 阜城县| 奎屯市| 色达县| 乌鲁木齐县| 罗江县| 西吉县| 通河县| 庄浪县| 大兴区| 孝昌县| 黄浦区| 灵寿县| 成都市| 凯里市| 剑川县| 兴义市| 盐源县| 揭东县| 赤壁市| 定兴县| 西充县| 班戈县| 彭山县| 广东省| 佛坪县| 深圳市| 榆林市|