• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于領(lǐng)域本體的自動(dòng)應(yīng)答系統(tǒng)典型問(wèn)句分析*

      2016-10-26 01:08:32
      辦公自動(dòng)化 2016年16期
      關(guān)鍵詞:代詞常州景點(diǎn)

      唐 勇

      (常州紡織服裝職業(yè)技術(shù)學(xué)院常州213164)

      基于領(lǐng)域本體的自動(dòng)應(yīng)答系統(tǒng)典型問(wèn)句分析*

      唐勇

      (常州紡織服裝職業(yè)技術(shù)學(xué)院常州213164)

      基于領(lǐng)域本體來(lái)研究自動(dòng)問(wèn)答系統(tǒng)中用戶問(wèn)句的分析與處理方法。通過(guò)構(gòu)建旅游領(lǐng)域的本體知識(shí)庫(kù),梳理了旅游電商領(lǐng)域各種概念之間的關(guān)聯(lián)。通過(guò)在本體知識(shí)庫(kù)中加入程度形容詞類和疑問(wèn)詞類,定義這些詞語(yǔ)與本體中概念類的修飾和指代關(guān)系。分析了如何利用本體知識(shí)庫(kù)對(duì)用戶的四種典型問(wèn)句進(jìn)行處理,為后續(xù)問(wèn)句的答案處理提供了技術(shù)準(zhǔn)備。

      領(lǐng)域本體 自動(dòng)應(yīng)答 問(wèn)句分析

      一、引言

      隨著電子商務(wù)的普及和發(fā)展,越來(lái)越多的企業(yè)需要構(gòu)建自動(dòng)應(yīng)答系統(tǒng)為用戶提供實(shí)時(shí)的業(yè)務(wù)咨詢和問(wèn)題解決方案,在此過(guò)程中如何理解用戶提出的問(wèn)題并返回準(zhǔn)確的答案,即問(wèn)句的分析與匹配是自動(dòng)應(yīng)答系統(tǒng)的實(shí)現(xiàn)基礎(chǔ)。

      中文問(wèn)句分析與匹配的主要方法有:基于關(guān)鍵詞匹配的分析、基于概念的分析、基于模式匹配的分析和基于語(yǔ)義理解的分析[1]。其中,基于關(guān)鍵詞匹配的分析依據(jù)向量空間模型計(jì)算關(guān)鍵詞在常見(jiàn)問(wèn)題集合中出現(xiàn)的頻率,選擇匹配值高的問(wèn)題作為答案[2],其缺點(diǎn)是割裂了關(guān)鍵詞之間語(yǔ)義關(guān)系;基于語(yǔ)義理解的分析考慮了問(wèn)句中關(guān)鍵詞之間的依存關(guān)系,包括內(nèi)在聯(lián)系和修飾關(guān)系[3],常利用知網(wǎng)或同義詞詞林對(duì)問(wèn)句中的關(guān)鍵詞進(jìn)行詞語(yǔ)相似度計(jì)算[5]。然而,知網(wǎng)和同義詞詞林給出的是詞與詞之間的普遍意義,沒(méi)有結(jié)合特定領(lǐng)域的知識(shí)。

      本文以旅游電子商務(wù)中用戶在線咨詢?yōu)閼?yīng)用場(chǎng)景,構(gòu)建面向旅游電子商務(wù)的知識(shí)本體,分析該領(lǐng)域用戶咨詢的特點(diǎn),分析問(wèn)句的問(wèn)點(diǎn)、對(duì)象和疑問(wèn)詞等關(guān)鍵特征,然后在本體知識(shí)庫(kù)中匹配問(wèn)句、抽取問(wèn)題答案。

      二、本體的構(gòu)建

      本體被定義為“共享概念模型的明確的形式化規(guī)范說(shuō)明”,它以計(jì)算機(jī)可讀的方式為現(xiàn)實(shí)世界中各種事物或現(xiàn)象做了概念定義,并描述了這些概念之間的相互關(guān)系,使得知識(shí)的重用和共享成為可能。領(lǐng)域本體是指特定領(lǐng)域中概念與概念之間的相互關(guān)系,提供了該領(lǐng)域的相關(guān)詞匯和概念。

      Protege軟件是斯坦福大學(xué)開(kāi)發(fā)的本體編輯和知識(shí)獲取工具,能夠快速的進(jìn)行本體建模。針對(duì)旅游電子商務(wù)領(lǐng)域涉及到的相關(guān)概念,根據(jù)Gruber提出本體構(gòu)建的五個(gè)準(zhǔn)則,使用protege軟件構(gòu)建旅游電子商務(wù)的本體,如圖1所示。該本體中主要涉及到人、景點(diǎn)、交通工具、組織機(jī)構(gòu)、地理位置、線路和票據(jù)等類,這些類又可以進(jìn)一步劃分為若干子類,比如人可以分為客戶和導(dǎo)游;組織機(jī)構(gòu)分為:景點(diǎn)管理機(jī)構(gòu)、旅行社、酒店和保險(xiǎn)公司等;景點(diǎn)可以劃分為人文景點(diǎn)和自然景點(diǎn);票據(jù)包括門(mén)票、車(chē)票和住宿發(fā)票等。

      本體中的類具有數(shù)據(jù)屬性和對(duì)象屬性。其中,數(shù)據(jù)屬性表明類具有的某種狀態(tài),比如景點(diǎn)類具有開(kāi)放時(shí)間、關(guān)閉時(shí)間、面積大小等屬性;車(chē)票類具有價(jià)格、發(fā)車(chē)時(shí)間等屬性。對(duì)象屬性表明多個(gè)實(shí)體類之間的相互關(guān)聯(lián),例如:預(yù)定屬性表示客戶和酒店之間的“預(yù)定”關(guān)系,其定義域?yàn)榭蛻?,值域?yàn)榫频辏唤煌üぞ吆途包c(diǎn)之間具有“到達(dá)”的屬性關(guān)系等。

      三、典型問(wèn)句類型分析

      中文問(wèn)句的類型大致可以劃分為是非問(wèn)句、正反問(wèn)句、選擇型問(wèn)句和特指問(wèn)句,如表1所示。

      表1 中文問(wèn)句類型及結(jié)構(gòu)分析

      1、“是非問(wèn)句”一般以疑問(wèn)詞結(jié)尾。通過(guò)定義一個(gè)“是非疑問(wèn)詞”列表來(lái)檢測(cè),若問(wèn)句中含有是非疑問(wèn)詞,則進(jìn)一步判斷問(wèn)句結(jié)構(gòu)是否為“名詞+形容詞+疑問(wèn)代詞”,若是,那么問(wèn)點(diǎn)應(yīng)是名詞的某種屬性,而該屬性可能被多種形容詞修飾。

      例如,“恐龍園貴嗎?”這句話實(shí)際上是想詢問(wèn)恐龍園門(mén)票的價(jià)格。修飾價(jià)格的形容詞除了“貴”之外還可能是“高、低、便宜”等。在本體中添加“程度類”與“屬性類”,其中“程度類”包含了“高、低、遠(yuǎn)、近、大、小、多、少、貴、便宜”等形容詞語(yǔ)?!皩傩灶悺卑恕皟r(jià)格、距離、面積、價(jià)格,等級(jí)”等的名詞。定義價(jià)格屬性的值域?yàn)椤案?、低、貴、便宜”等,面積屬性的值域?yàn)椤按?、小”等。如圖2中紅色虛線所示。當(dāng)在本體中查詢形容詞“貴”的修飾關(guān)系時(shí)可以得到價(jià)格屬性,進(jìn)而發(fā)現(xiàn)價(jià)格屬性的擁有者是門(mén)票類,問(wèn)句被轉(zhuǎn)化為“恐龍園+門(mén)票+價(jià)格”。進(jìn)一步挖掘可以回溯到景點(diǎn)管理機(jī)構(gòu)、景點(diǎn)和位置信息。類似的,“恐龍園大嗎?”則通過(guò)形容詞“大”和“恐龍園”景點(diǎn)推出其修飾的是“面積”,因此返回“恐龍園+面積”的相關(guān)信息。

      “是非問(wèn)句”還有可能是“主語(yǔ)+謂語(yǔ)+賓語(yǔ)+疑問(wèn)代詞”或“主語(yǔ)+介詞+賓語(yǔ)+疑問(wèn)代詞”的結(jié)構(gòu)。對(duì)此類型可以直接在本體中查詢主語(yǔ)和賓語(yǔ)的關(guān)聯(lián)關(guān)系。例如“常州有地鐵嗎?”提取出“常州”和“地鐵”,通過(guò)本體查詢可以獲取“常州”是位置類的實(shí)例,“地鐵”是交通工具類的實(shí)例,在本體模型中位置和交通工具之間為“擁有”關(guān)系。例如“恐龍園在常州嗎?”提取出“常州”和“恐龍園”,通過(guò)本體查詢可知“恐龍園”是景點(diǎn)類的實(shí)例,它與位置類的實(shí)例“常州”之間是“位于”的關(guān)系。

      部分“特指問(wèn)句”具有“多+程度形容詞”的結(jié)構(gòu)。例如“市區(qū)到恐龍園有多遠(yuǎn)?”可以提取程度形容詞,按照“是非問(wèn)句”的分析方式進(jìn)行處理。

      2、“正反問(wèn)句”含有“肯定否定組合詞”。例如“可不可以”、“能不能”、“是否”等,可以將其轉(zhuǎn)換為是非問(wèn)句。例如“恐龍園門(mén)票貴不貴”被轉(zhuǎn)換為“恐龍園門(mén)票貴嗎”,“常州有沒(méi)有地鐵嗎?”被轉(zhuǎn)化為“常州有地鐵嗎?”。然后按照“是非問(wèn)句”的方法進(jìn)行處理。

      3、“選擇問(wèn)句”含有“是……還是”的選擇項(xiàng)??梢愿鶕?jù)此特征將問(wèn)句劃分為兩個(gè)“是非問(wèn)句”。例如“去常州是坐汽車(chē)快還是坐火車(chē)快?”被轉(zhuǎn)化為“去常州做汽車(chē)快嗎?”和“去常州做火車(chē)快嗎?”兩個(gè)是非問(wèn)句。在本體中的關(guān)系如圖3所示。汽車(chē)和火車(chē)都是交通工具類的子類,而常州是位置類的實(shí)例。在本體模型中路線類具有時(shí)間,時(shí)間類又被程度詞“快、慢、長(zhǎng)、短”等修飾,而路線和位置是到達(dá)關(guān)系。通過(guò)在本體中查找程度詞“快”并結(jié)合位置類和交通工具類可以返回有關(guān)路線的信息。

      4、“特指問(wèn)句”通常用疑問(wèn)詞代替未知的部分,這些疑問(wèn)詞包括“怎么、什么、哪里”等。例如“常州恐龍園在哪里?”。在旅游電商領(lǐng)域特指問(wèn)句的問(wèn)點(diǎn)一般集中在時(shí)間、位置、路線、交通等方面。將疑問(wèn)詞分為位置疑問(wèn)詞,例如“哪兒、哪里、哪個(gè)”等;方式疑問(wèn)詞,例如“如何、怎么”等;針對(duì)物的疑問(wèn)代詞包括“哪些、哪個(gè)、什么”等。在本體中建立“疑問(wèn)代詞”類,并設(shè)置與位置、路線、交通、景點(diǎn)等類之間具有“疑問(wèn)指代”的關(guān)聯(lián)關(guān)系。以路線和位置類為例,它們和“疑問(wèn)代詞”類之間具有圖3所示的關(guān)聯(lián)關(guān)系。

      借助哈工大語(yǔ)言云系統(tǒng)的分析可以得出圖4所示的語(yǔ)句依存關(guān)系。若疑問(wèn)代詞在語(yǔ)句中的成分是賓語(yǔ)(POB或VOB),那么提取出主語(yǔ)(SVB);若疑問(wèn)代詞為主語(yǔ)(SVB),則提取出賓語(yǔ)部分;進(jìn)一步在本體中查詢疑問(wèn)詞的修飾的對(duì)象是位置、方式還是事物。若疑問(wèn)詞在句子中作為修飾成分ATT或ADV,那么提取出句子的主語(yǔ)和賓語(yǔ)部分,結(jié)合疑問(wèn)詞在本體中可以修飾對(duì)象進(jìn)行本體查詢。

      四、問(wèn)句的查詢

      根據(jù)對(duì)問(wèn)句的分析將“選擇問(wèn)句”、“正反問(wèn)句”、帶有“多+形容詞”的特指問(wèn)句轉(zhuǎn)換為“是非問(wèn)句”。其流程處理為提取問(wèn)句的主語(yǔ)、賓語(yǔ)等實(shí)體名詞;在本體中查找被“程度詞”修飾的類;結(jié)合這些修飾類和主語(yǔ)名詞在本體中進(jìn)行匹配。對(duì)于“特指問(wèn)句”則在本體中查找疑問(wèn)代詞的指代類,結(jié)合這個(gè)類和語(yǔ)句中的實(shí)體名詞在本體中進(jìn)行三元組的匹配。

      基于Protege構(gòu)建的本體可以被保存為xml格式的文檔。本體的查詢可以使用SparQL技術(shù),SparQL是W3C組織推薦的標(biāo)準(zhǔn)本體查詢語(yǔ)言,其語(yǔ)法結(jié)構(gòu)類似數(shù)據(jù)查詢語(yǔ)言SQL。例如在旅游本體中查詢“到達(dá)常州的旅行線路”可以采用以下的語(yǔ)句。

      PREFIXtour:

      SELECT?rout

      FROM

      WHERE{?site tour:location"changzhou".

      ?rout tour:weblog?site.}

      五、結(jié)束語(yǔ)

      本文介紹了領(lǐng)域本體的概念并使用Protege工具構(gòu)建了旅游領(lǐng)域本體;根據(jù)旅游電商自動(dòng)問(wèn)答系統(tǒng)的需求,分析了該領(lǐng)域內(nèi)常用的四種典型問(wèn)句:是非問(wèn)句、選擇問(wèn)句、正反問(wèn)句和特指問(wèn)句。通過(guò)在本體中加入程度形容詞、疑問(wèn)代詞,將典型問(wèn)句中常用的疑問(wèn)詞與旅游本體的類通過(guò)對(duì)象屬性有效關(guān)聯(lián)起來(lái);詳細(xì)闡述了如何利用本體識(shí)別典型問(wèn)句的潛在含義,從而為自動(dòng)應(yīng)答系統(tǒng)的答案抽取提供了技術(shù)準(zhǔn)備。

      [1]王恒.中文問(wèn)答系統(tǒng)的研究與實(shí)現(xiàn)[D].哈爾濱工業(yè)大學(xué).2008:23-25.

      [2]秦兵,劉挺等.基于常問(wèn)問(wèn)題集的中文問(wèn)答系統(tǒng)研究[J].哈爾濱工業(yè)大學(xué)學(xué)報(bào).2003(35):10.

      [3]強(qiáng)繼朋.FAQ系統(tǒng)中的問(wèn)句相似度研究[D].合肥工業(yè)大學(xué).2013:12-14.

      [4]郭艷華,周昌樂(lè).一種漢語(yǔ)語(yǔ)句依存關(guān)系網(wǎng)協(xié)動(dòng)生成方法研究[J].杭州電子工業(yè)學(xué)院學(xué)報(bào),2000,20(4):24-32

      [5]田久樂(lè),趙蔚.基于同義詞詞林的詞語(yǔ)相似度計(jì)算方法[J].吉林大學(xué)學(xué)報(bào).2010(06):605.

      Analysis on the Typical Question of Auto-answering System Based on Domain Ontology

      TangYong
      (Changzhou Textile and Garment InstituteChangzhou213164)

      To research the method of question analysis and processing in auto-answering system based on domain ontology.This paper sorted out the the relationship between different concepts in the field of tourism e-commerce by building the domain ontology knowledge base.Defined the modified and referential relationships between the domain concepts and classes of adjective words and interrogative words which are adding to the domain ontology knowledge base.Analyzed how to use the domain ontology knowledge base to process the four typical question in the tourism e-commerce field,which will give the technical preparation for the following answers processing in auto-answering system.

      Domain ontologyAuto-answeringQuestion analysis

      TP391.12

      A

      160801-7352

      常州紡織服裝職業(yè)技術(shù)學(xué)院應(yīng)用技術(shù)類課題(編號(hào):CFK201512)

      唐勇(1982~),男(漢族),安徽滁州人,碩士,講師。研究領(lǐng)域:電子商務(wù)。

      猜你喜歡
      代詞常州景點(diǎn)
      復(fù)合不定代詞點(diǎn)撥
      常州的早晨
      小讀者之友(2022年4期)2022-05-20 13:19:36
      代詞(一)
      代詞(二)
      常州非遺 燦爛多彩
      打卡名校景點(diǎn)——那些必去朝圣的大學(xué)景點(diǎn)
      這樣將代詞考分收入囊中
      英格蘭十大怪異景點(diǎn)
      海外星云(2016年7期)2016-12-01 04:18:07
      沒(méi)有景點(diǎn) 只是生活
      Coco薇(2015年11期)2015-11-09 13:19:52
      景點(diǎn)個(gè)股表現(xiàn)
      漯河市| 康乐县| 卢龙县| 潢川县| 东乌珠穆沁旗| 涿鹿县| 乌苏市| 凤阳县| 滦平县| 闻喜县| 光泽县| 汝城县| 大洼县| 栖霞市| 正阳县| 南宁市| 丹棱县| 鄂尔多斯市| 南平市| 遂昌县| 台北县| 陇南市| 金沙县| 化州市| 临沭县| 辽源市| 怀柔区| 临泽县| 湖北省| 平和县| 定襄县| 晋城| 富民县| 新邵县| 杭锦后旗| 保亭| 璧山县| 沾化县| 宕昌县| 琼结县| 齐齐哈尔市|