• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    從Web獲取部分整體關(guān)系語料的方法

    2011-10-15 01:36:58曹馨宇曹存根
    中文信息學(xué)報 2011年5期
    關(guān)鍵詞:概念方法

    曹馨宇,曹存根

    (1.中國科學(xué)院計算技術(shù)研究所智能信息處理重點(diǎn)實(shí)驗(yàn)室,北京100190;2.中國科學(xué)院研究生院,北京100190)

    1 引言

    語義關(guān)系的獲取是知識發(fā)現(xiàn)中的一個重要問題。目前語義關(guān)系半自動/自動獲取方法主要有兩種[1]:一種是基于規(guī)則的方法,該方法主要利用語言學(xué)和自然語言處理技術(shù),通過詞法分析和語法分析獲取語義關(guān)系模式,然后利用模式匹配發(fā)現(xiàn)語義關(guān)系,利用規(guī)則驗(yàn)證獲取的語義關(guān)系;另一種是基于統(tǒng)計的語義關(guān)系獲取方法,該方法利用模式匹配發(fā)現(xiàn)語義關(guān)系,基于語料庫和統(tǒng)計語言模型驗(yàn)證獲取的語義關(guān)系。部分整體關(guān)系作為一種重要的語義關(guān)系,表述了實(shí)體和其部分之間一種特殊的關(guān)聯(lián),如輪胎是汽車的一部分,表示了輪胎與汽車之間存在部分整體關(guān)系。Winston等[2]認(rèn)為,如果概念 p和概念w可以用形如“p是w的一部分”或其他相似的自然語言形式表示,則可以認(rèn)為概念p和概念w之間存在部分整體關(guān)系。即假設(shè)不知道內(nèi)存與計算機(jī)之間的關(guān)系,但如果可以獲取語句“內(nèi)存是計算機(jī)中最重要的部件之一”、“計算機(jī)由內(nèi)存、中央處理器和硬盤等組成”等,則可以認(rèn)為內(nèi)存和計算機(jī)之間存在部分整體關(guān)系。

    傳統(tǒng)的部分整體關(guān)系獲取大都是基于語料庫的,隨著互聯(lián)網(wǎng)的迅猛發(fā)展,大量的信息以電子文檔的形式出現(xiàn)在人們面前,Web已經(jīng)成為了一種非常重要的信息資源,人們所需的知識幾乎都可以在Web中檢索到。因此,研究從Web中獲取部分整體知識的方法越來越有必要。

    要從浩瀚的Web網(wǎng)頁中獲取知識,搜索引擎是一種有效的途徑。目前,諸如Google、百度等搜索引擎已經(jīng)成為用戶瀏覽和查找Web中信息不可或缺的工具。這些搜索引擎的工作原理一般是,用戶輸入查詢關(guān)鍵字提出查詢請求,然后搜索引擎根據(jù)用戶的查詢請求在網(wǎng)頁索引庫中進(jìn)行檢索,最后以一定的算法將檢索結(jié)果排序輸出,其核心是關(guān)鍵詞匹配。由于Web信息的異構(gòu)性、海量性,這種查詢機(jī)制使得搜索引擎只能檢索數(shù)據(jù),而無法提供知識[3]。然而,已有工作表明,在不對檢索對象本身作出改變的情況下,可以通過改變檢索串,使基于語義的搜索在語言學(xué)上具有可行性[4]。例如,我們想要獲取關(guān)于汽車的部分整體關(guān)系,就可以構(gòu)造一些特定的查詢,如“汽車的部件”、“汽車由”、“組成”等,以得到包含更多部分整體關(guān)系的網(wǎng)頁,從而進(jìn)一步進(jìn)行部分整體關(guān)系的獲取。這些特定的查詢需要具備兩個特點(diǎn),一是能索引到盡可能多的富含部分整體關(guān)系的語料;二是能夠指導(dǎo)進(jìn)一步的部分整體關(guān)系的獲取。這些特定查詢的構(gòu)造是獲取部分整體關(guān)系語料的重要步驟。

    本文提出了一種基于意圖構(gòu)造查詢的方法,用于從Web獲取部分整體關(guān)系語料。該方法通過在查詢中加入與部分整體關(guān)系相關(guān)的語境詞,利用新的查詢從Web中獲取部分整體關(guān)系語料。通過與人工構(gòu)造查詢方法和基于語料庫構(gòu)造查詢方法對比,本文方法所獲取的部分整體關(guān)系語料在部分整體關(guān)系的含量和獲取難易程度兩個方面都有著明顯的優(yōu)勢。

    本論文的結(jié)構(gòu)如下:第2節(jié)介紹了部分整體關(guān)系獲取的研究現(xiàn)狀;第3節(jié)給出了意圖查詢的構(gòu)造方法;第4節(jié)詳細(xì)介紹了實(shí)驗(yàn)對比;第5節(jié)是結(jié)論。

    2 相關(guān)工作

    目前對于部分整體關(guān)系獲取,主要有手工獲取和半自動/自動獲取兩種方式。

    手工獲取部分整體關(guān)系的研究工作包括Word-Net[5]、HowNet[6]等。WordNet是一部手工建立的、基于認(rèn)知語言學(xué)的、包含語義信息的英語詞典。其中描述了名詞概念的層次,包括同義、反義、上下位和部分整體等關(guān)系。知網(wǎng)(HowNet)是手工編纂的中文詞匯的結(jié)構(gòu)化信息庫,是一個以漢語和英語的詞語所代表的概念為描述對象,以揭示概念與概念之間以及概念所具有的屬性之間的關(guān)系為基本內(nèi)容的常識知識庫。

    在自動部分整體關(guān)系獲取方面,目前對于部分整體關(guān)系自動獲取的研究還是主要基于模式和語料庫,即從語料庫中使用模式的方法獲取部分整體關(guān)系。自然語言中,我們通常使用一些固定的語法結(jié)構(gòu)表示某種關(guān)系[1],稱這些固定的語法結(jié)構(gòu)為模式。這種方法通常首先是利用模式從語料庫中匹配可能包含部分整體關(guān)系的半結(jié)構(gòu)化文本,再從半結(jié)構(gòu)化文本中抽取部分整體關(guān)系。這些半結(jié)構(gòu)化文本即本文所指部分整體關(guān)系語料。Berland等[7]利用給定的整體概念和獲取到的模式,從NANC語料庫中得到部分整體關(guān)系語料,使用統(tǒng)計方法,從語料中獲取給定整體概念的部分整體關(guān)系。但由于Berland等選取的模式數(shù)量和給定的整體概念較少,故此算法得到的部分整體關(guān)系語料中部分整體關(guān)系的數(shù)量較少,因此只得到了很少的部分整體關(guān)系實(shí)例,且準(zhǔn)確率較低。Girju等[8]給出了一種監(jiān)督的,領(lǐng)域獨(dú)立的自動發(fā)現(xiàn)文本中部分整體關(guān)系的方法。算法受Hearst方法啟發(fā),手工總結(jié)表示部分整體關(guān)系的模式,然后從語料庫中獲取部分整體關(guān)系語料,從語料中抽取潛在的蘊(yùn)含部分整體關(guān)系的概念對,進(jìn)而應(yīng)用統(tǒng)計方法從中確定真正蘊(yùn)含部分整體關(guān)系的概念對。以上都是針對英文的部分整體關(guān)系獲取。Cao等[9]在2008年給出了一種領(lǐng)域獨(dú)立的,從語料庫中獲取中文部分整體關(guān)系的方法。該方法依然使用模式的方法首先從語料庫中獲取部分整體關(guān)系語料,從語料中獲取可能蘊(yùn)含部分整體關(guān)系的候選概念對,利用啟發(fā)式規(guī)則,最終得到真正蘊(yùn)含部分整體關(guān)系的概念對。但由于模式的語義限制,使得獲取的部分整體關(guān)系語料受限,很難獲取一般概念之間的部分整體關(guān)系。從以上方法中可以看出,部分整體關(guān)系語料的獲取是部分整體關(guān)系自動獲取中的首要步驟,部分整體關(guān)系語料中如果含有較少的部分整體關(guān)系,則最終的獲取結(jié)果就會不理想。

    互聯(lián)網(wǎng)的迅猛發(fā)展使得大量的信息以電子文檔的形式出現(xiàn),人們所需的知識幾乎都可以在Web中檢索到,因此從Web中進(jìn)行知識獲取成為近來知識獲取的研究重點(diǎn)之一。Hage等[10]在2006年提出一種基于模式的從Web中獲取關(guān)于給定概念的部分整體關(guān)系的方法。該方法沿用從語料庫中獲取部分整體關(guān)系的方法,用 Web替代語料庫,利用Google搜索引擎從Web中獲取表示部分整體關(guān)系的模式,使用獲取的模式和人工編纂的詞典,再次利用Google搜索引擎從Web中獲取部分整體關(guān)系語料,再從語料中獲取給定概念的部分概念。Hage方法由于利用的詞典是關(guān)于食品方面的,所以只獲取了關(guān)于食品領(lǐng)域的給定概念的部分整體關(guān)系知識,且此種方法非常依賴于詞典,不能擴(kuò)展到獨(dú)立領(lǐng)域的部分整體關(guān)系的獲取。從后面的實(shí)驗(yàn)可以看出,Hage方法中獲取的查詢串對于從Web中獲取部分整體關(guān)系語料效果并不是很好,主要是由于搜索引擎大都采用關(guān)鍵詞匹配技術(shù),即在信息檢索中存在詞不匹配問題,使得查詢串不能很好的表示我們的查詢意圖,從Web中獲取到部分整體關(guān)系語料,從而也不能進(jìn)一步從中獲取部分整體關(guān)系。如何在當(dāng)前的搜索引擎技術(shù)條件之下,構(gòu)造合適的查詢串,使得獲取的部分整體關(guān)系語料中含有更豐富的部分整體關(guān)系,是從Web中獲取部分整體關(guān)系的重要組成部分。

    3 語料獲取方法

    3.1 人工構(gòu)造查詢方法和基于語料庫構(gòu)造查詢方法的缺陷

    從Web中獲取語料的最直觀的方法就是人工構(gòu)造查詢方法,即手工構(gòu)造合適的查詢串,提交搜索引擎,檢索符合我們查詢意圖的結(jié)果。通過下面的實(shí)驗(yàn)分析可以看出,人工構(gòu)造查詢的方法雖然很直接便利,但獲取的語料質(zhì)量卻很低。

    從Web中獲取語料的另一種方法是利用目前從語料庫中獲取的表示部分整體關(guān)系的模式,將其直接轉(zhuǎn)化為查詢串,從Web中獲取部分整體關(guān)系語料。我們從Beland,Girju,Cao的文章中選取獲取中文和英文部分整體關(guān)系的最典型模式,將其轉(zhuǎn)化為查詢,具體實(shí)驗(yàn)詳見第4節(jié)。從實(shí)驗(yàn)中可以看出,由這種方法獲取的無論是中文或是英文部分整體關(guān)系語料,其含有的部分整體關(guān)系的數(shù)量并不多,且都不易于進(jìn)一步從中獲取部分整體關(guān)系。同時我們也對利用Hage提出的方法從Web中獲取部分整體,結(jié)果表明該方法對于Web中英文部分整體關(guān)系的獲取比例為10%,即獲取語料的前100條語句中有10條包含部分整體關(guān)系;但對于中文部分整體關(guān)系知識的獲取比例只有6%。實(shí)驗(yàn)表明:

    1)中文的語料有其自己的獲取方法,不能直接仿照獲取英文語料的方法;

    2)從Web中獲取部分整體關(guān)系語料,查詢串的構(gòu)造不能直接借用基于語料庫所獲取的模式;

    3)從Web中獲取中文的部分整體關(guān)系語料,不論是人工構(gòu)造查詢方法還是基于語料庫構(gòu)造查詢的方法對于獲取的結(jié)果都不理想。

    基于以上分析,本文給出一種通過構(gòu)造含有語境詞的查詢,從Web中獲取關(guān)于給定概念的部分整體關(guān)系語料的方法。

    3.2 基本假設(shè)和總體框架

    從Web獲取部分整體關(guān)系語料基于以下兩個前提:

    1)部分整體關(guān)系可以由其共同頻繁出現(xiàn)的某些詞體現(xiàn);

    2)可以用多個蘊(yùn)含部分整體關(guān)系的概念對代表部分整體關(guān)系。

    與部分整體關(guān)系聯(lián)系緊密,可以體現(xiàn)部分整體關(guān)系的詞,我們稱為語境詞。包含語境詞和部分整體關(guān)系的語句片段,我們稱為語境片段。由于語境詞可以反映概念之間的關(guān)系,故構(gòu)造帶有語境詞的查詢串不僅可以從Web中獲取富含大量部分整體關(guān)系的語料,同時可以根據(jù)查詢串提供的信息進(jìn)一步從獲取的語料中得到部分整體關(guān)系。由于這種查詢可以很好的反應(yīng)我們的查詢意圖,在本文中將帶有語境詞的,基于意圖的查詢串稱為意圖查詢。

    本方法的主要步驟為:

    步驟1:利用已知蘊(yùn)含部分整體關(guān)系的概念對S和搜索引擎,從Web中獲取一定長度的語境片段Occ;

    步驟2:依據(jù)前提2,計算語境片段中頻繁出現(xiàn)的詞與部分整體關(guān)系的相關(guān)度,由相關(guān)度確定候選語境詞CW;

    步驟3:利用Web驗(yàn)證候選語境詞,將語境詞W和初始查詢串提交搜索引擎,得到新的語境片段 Occ′;

    步驟4:從新的語境片段中抽取意圖查詢Pattern,獲取部分整體關(guān)系語料Corpus。

    算法流程:

    3.3 具體步驟

    1)將已知蘊(yùn)含部分整體關(guān)系的概念對(w,p),直接作為初始查詢串q,提交搜索引擎,取檢索結(jié)果集的Topk;

    2)語境片段的獲取包括以下兩部分。

    a)對于中文文件而言,通常一個句子表達(dá)一個相對較完整的意思[11],處于一個句子中的概念更能反映出意義上的相關(guān)性。故對查詢串q返回的檢索結(jié)果集的Topk文檔,截取概念w和概念p所在句子,然后取句子中概念w和概念p固定長度為m的文檔片段Dq為語境片段;

    b)返回的網(wǎng)頁中,搜索引擎通常會提供與查詢有關(guān)的相關(guān)搜索,記檢索結(jié)果中提供的相關(guān)搜索的內(nèi)容為Drq;

    3)對語境片段Dq和Drq分詞,分別統(tǒng)計Dq和Drq中出現(xiàn)的各詞的詞頻,由于動詞和名詞會表示比較明確的意義,故記Dq和Drq中出現(xiàn)的名詞和動詞的集合分別為Cq和Crq,C=Cq∪Crq;

    4)取n對蘊(yùn)含部分整體關(guān)系的概念對,重復(fù)1、2、3步驟,n個初始查詢串組成查詢集合Q;

    5)計算詞c(c∈Cq)與部分整體關(guān)系R的相關(guān)度。相關(guān)度高說明此詞與部分整體關(guān)系聯(lián)系密切。相關(guān)度的衡量基于以下兩個假設(shè):1)根據(jù)TF的計算方法,如果詞c在查詢串q的檢索結(jié)果中出現(xiàn)次數(shù)較多,則詞c與查詢串q相關(guān)度高;2)查詢同一個問題,可以構(gòu)造多個查詢串。詞c出現(xiàn)在越多查詢串的檢索結(jié)果中,詞c與這個問題越相關(guān)。在步驟1中,我們已經(jīng)將已知蘊(yùn)含部分整體關(guān)系的概念對轉(zhuǎn)化為初始查詢串,根據(jù)前提2和假設(shè)1),將相關(guān)度計算公式定義為

    其中,cf(c,q)為查詢q的檢索結(jié)果中詞c出現(xiàn)的次數(shù),sc(c)表示與詞c相關(guān)的查詢串q的數(shù)目。當(dāng)詞c是由搜索引擎的相關(guān)搜索提供時,即c∈Crq,δ=0.1;否則 δ=0;

    6)取corrvalue(c,R)值在Top10之內(nèi)的詞c作為候選語境詞;

    7)查找包含候選語境詞的語境片段Dq,根據(jù)其出現(xiàn)的頻度,確定語境詞c與查詢q頻繁出現(xiàn)的形式,將其中的部分概念置為*,得到查詢串 q′;將q′提交搜索引擎,如果返回的Top100檢索結(jié)果中出現(xiàn)查詢串q中的部分概念,則候選語境詞c既是我們所需的語境詞,查詢串q′即是從Web中獲取關(guān)于已知整體概念的部分整體關(guān)系的查詢串。利用搜索引擎,查詢串q′的檢索結(jié)果即為包含已知整體概念的部分整體關(guān)系語料。我們可以從中進(jìn)一步獲取關(guān)于已知概念的部分整體關(guān)系。

    例如,我們選取Google搜索引擎,利用本文提出的方法從Web中獲取關(guān)于“汽車”的部分整體關(guān)系語料。

    1)我們選取10對蘊(yùn)含相同部分整體關(guān)系的概念對,例如,(計算機(jī),硬盤)、(相機(jī),鏡頭)、(飛機(jī) ,機(jī)翼)等,分別構(gòu)建初始查詢串,如“計算機(jī) 硬盤”,“相機(jī)鏡頭”等,將其提交給Google。根據(jù)語境片段獲取方法,我們得到例如“計算機(jī)硬盤技術(shù)”、“計算機(jī)硬盤維修”、“專業(yè)相機(jī)所用鏡頭”、“相機(jī)鏡頭知識”、“相機(jī)鏡頭清洗”和“飛機(jī)機(jī)翼的作用”、“飛機(jī)機(jī)翼結(jié)構(gòu)”文檔片段,通過計算相關(guān)度,共得到10個候選語境詞,如技術(shù)、維修、作用等;

    2)根據(jù)候選語境詞在語境片段中出現(xiàn)的頻率,選取包含高頻度候選語境詞的語境片段。構(gòu)造查詢串q′,如“相機(jī)鏡頭清洗”、“計算機(jī)硬盤技術(shù)”和“飛機(jī)機(jī)翼的作用”,其相應(yīng)查詢串q′分別為“相機(jī)*清洗”、“計算機(jī) *技術(shù)”和“飛機(jī) *的作用”。通過Web驗(yàn)證,最終得到8個語境詞,分別為使用、維修、清洗、技術(shù)、原理、結(jié)構(gòu)、類型、價格。同時獲取查詢串為:“汽車*的<!語境詞>”,<!語境詞>表示語境詞變量,可以替換為任意一個語境詞;

    3)構(gòu)造意圖查詢“汽車*的使用”O(jiān)R“汽車*的維修”O(jiān)R“汽車*的清洗”O(jiān)R“汽車*的技術(shù)”O(jiān)R“汽車*的原理”O(jiān)R“汽車*的構(gòu)造”O(jiān)R“汽車*的類型”O(jiān)R“汽車*的價格”提交Google搜索引擎,以其返回的Top100項(xiàng)檢索結(jié)果作為語料,其中包含部分整體關(guān)系的語句共有70項(xiàng),可以輕易地從語料中獲取44個汽車部件,在不進(jìn)行任何驗(yàn)證的情況下,手工檢測其抽樣結(jié)果的準(zhǔn)確率為45.5%。

    4 實(shí)驗(yàn)分析與對比

    4.1 評價指標(biāo)

    我們從兩個方面衡量語料質(zhì)量:1)語料中含有部分整體關(guān)系的語句的數(shù)量;2)從語料中抽取部分整體關(guān)系的難易程度,即可以從語料中獲取的部分整體關(guān)系數(shù)量。

    4.2 對比試驗(yàn)

    我們選取了100個不同的概念,例如,計算機(jī)、汽車、空調(diào)等,利用搜索引擎Google從Web中獲取關(guān)于這些概念的部分整體關(guān)系語料,衡量平均一個概念獲取的部分整體關(guān)系語料的質(zhì)量。根據(jù)4.1節(jié)中提出的兩個指標(biāo),計算獲取的語料中含有部分整體關(guān)系的語句的數(shù)量和能得到的部分整體關(guān)系的數(shù)量,將本文中提出的意圖查詢方法與人工構(gòu)造查詢方法和基于語料庫構(gòu)造查詢方法進(jìn)行對比。

    為了解某個概念C的部分,人們通常會構(gòu)造查詢“C有哪些部件”和“C的部件有哪些”。如“汽車有哪些部件”和“計算機(jī)的部件有哪些”等。表1給出了其檢索結(jié)果的部分實(shí)例。

    對于基于語料庫構(gòu)造查詢方法,我們分別從Beland和Girju的文章中選取獲取英文部分整體關(guān)系的最典型模式“NPXof NPY[7]”和“NNparts of NNwholes[8]”,將其轉(zhuǎn)化為查詢串“*of C” 、“*of the C”,在返回的Top100項(xiàng)中檢索結(jié)果中,沒有包含關(guān)于汽車的部分整體關(guān)系知識。從Cao文章中選取模式:<?c1>由<?c2><組成>,將其轉(zhuǎn)化為查詢“C由***組成”O(jiān)R“C由****組成”O(jiān)R“C由*****組成”O(jiān)R“C由******組成”。其檢索結(jié)果的部分實(shí)例如表2所示。

    根據(jù)本文中提出的方法,可以構(gòu)造查詢:“C*的使用”O(jiān)R“C*的維修”O(jiān)R“C*的清洗”O(jiān)R“C*的技術(shù)”O(jiān)R“C*的原理”O(jiān)R“C*的構(gòu)造”O(jiān)R“C*的類型”O(jiān)R“C*的價格”,例如,“汽車*的價格”“汽車*的使用”“計算機(jī)*的價格”“計算機(jī)*的類型”。表3給出了檢索結(jié)果的部分實(shí)例。

    表1 人工構(gòu)造查詢方法獲取的部分檢索結(jié)果實(shí)例

    表2 基于語料庫構(gòu)造查詢方法獲取的部分檢索結(jié)果實(shí)例

    續(xù)表

    表3 意圖查詢方法獲取的部分檢索結(jié)果實(shí)例

    根據(jù)Google的檢索機(jī)制,將檢索結(jié)果中匹配查詢串關(guān)鍵詞的部分標(biāo)記為紅字,我們用斜體黑體表示這些匹配的部分。

    圖1中比較三種不同方法中獲取的部分整體關(guān)系語料中,含有部分整體關(guān)系語句的數(shù)量。由于人工構(gòu)造查詢方法獲取的部分整體關(guān)系語料是一種完全非結(jié)構(gòu)化的,因此不能利用查詢串提供的信息自動獲取其中的部分整體關(guān)系。圖2對比基于語料庫構(gòu)造查詢方法和意圖查詢方法獲取的部分整體關(guān)系數(shù)量。

    4.3 實(shí)驗(yàn)分析

    從圖1可以看出,在由返回的 Top100項(xiàng)、Top200項(xiàng)、Top300項(xiàng)、Top400項(xiàng)和 Top500項(xiàng)檢索結(jié)果組成的部分整體關(guān)系語料中,人工構(gòu)造查詢方法所獲取的各個語料中蘊(yùn)含部分整體關(guān)系的語句數(shù)量最少,意圖查詢方法獲取數(shù)量最多,且部分整體關(guān)系語料的規(guī)模越大,意圖查詢方法的優(yōu)勢越明顯。

    圖1 三種不同方法獲取的語料中含有部分整體關(guān)系的語句的數(shù)量

    圖2 基于語料庫構(gòu)造查詢方法和意圖查詢方法獲取的部分整體關(guān)系數(shù)量

    在部分整體關(guān)系抽取難易方面,通過表1、表2和表3顯示的三種方法各自獲取的語料部分實(shí)例可以看出,人工構(gòu)造查詢方法獲取的部分整體關(guān)系語料中,雖然包含了關(guān)于給定概念的部分整體關(guān)系,但其所在文本結(jié)構(gòu)復(fù)雜,很難從中抽取部分整體關(guān)系,而且通常需要具備某些基礎(chǔ)知識,才能判定語料中是否包括了部分整體關(guān)系。例如第三個實(shí)例中,需要知道“電腦”和“計算機(jī)”之間的關(guān)系以及“心臟”的含義。只單純利用查詢串提供的信息,不可能進(jìn)一步從獲取的語料中得到關(guān)于給定概念的部分整體關(guān)系;對于基于語料庫構(gòu)造查詢方法,雖然通過查詢串提供的信息可以從獲取的語料中抽取關(guān)于給定概念的部分整體關(guān)系,抽取的部分概念也符合查詢的本意,但得到的部分整體關(guān)系比較單一,即部分整體關(guān)系數(shù)量較少;通過表3所顯示的本文所提意圖查詢方法獲取的部分整體關(guān)系語料部分實(shí)例中可以看出,對于這種語料,我們能很容易的利用查詢串本身提供的信息,從中抽取出符合我們查詢本意的部分整體關(guān)系。通過圖2中的實(shí)驗(yàn)數(shù)據(jù)可以看出,對比基于語料庫構(gòu)造查詢方法,意圖查詢方法從獲取的部分整體關(guān)系語料中可以多獲取大約兩倍的部分整體關(guān)系。

    5 結(jié)束語

    目前人們使用搜索引擎作為從Web獲取知識的有效手段,但網(wǎng)上絕大多數(shù)搜索引擎都使用基于關(guān)鍵詞匹配的全文檢索技術(shù),不支持語義搜索。因?yàn)椴灰讓z索對象本身做出處理[4],我們只能對查詢串本身做出某些改變,使其接近我們需要的語義。故本文提出了一種新的用于從Web獲取部分整體關(guān)系語料的基于意圖的查詢構(gòu)造方法即意圖查詢方法。在查詢中加入與部分整體相關(guān)度高的語境詞,構(gòu)造新的查詢,從Web中檢索富含部分整體關(guān)系的網(wǎng)頁,即部分整體關(guān)系語料。通過與人工構(gòu)造查詢方法和基于語料庫構(gòu)造查詢方法對比實(shí)驗(yàn)表明,在分別由返回的Top100項(xiàng)、Top200項(xiàng)、Top300項(xiàng)、Top400項(xiàng)和Top500項(xiàng)檢索結(jié)果構(gòu)成的語料中,本方法可以獲取更多的蘊(yùn)含給定概念部分整體關(guān)系的語句,且容易進(jìn)一步從中獲取部分整體關(guān)系。本方法獲取的部分整體關(guān)系數(shù)量遠(yuǎn)多于基于語料庫構(gòu)造查詢方法。

    [1]Marti A.Hearst,Automatic Acquisition of hyponyms from large text corpora[C]//Proceedings of the 14th International Conference on Computational Linguistics,1992,539-545.

    [2]Morton E.Winston,Roger Chaffin,and Douglas Hermann.A taxonomy of part-whole relations[J].Cognitive Science,1987,417-444.

    [3]張森,王斌.Web檢索查詢意圖分類技術(shù)綜述[J].中文信息學(xué)報,2008,22(4):75-82.

    [4]袁毓林.用同義表達(dá)形式來擴(kuò)充信息檢索的查詢語句例證研究——對于一種基于語義的搜索方式的若干設(shè)想[J].語言文字應(yīng)用.2008,123-131.

    [5]Christiane Fellbaum.WordNet:An Electronic Lexical Database[M].1998.MIT Press.

    [6]知網(wǎng):http://www.keenage.com/[DB/OL]

    [7]Matthew Berland and Eugene Charniak.Finding Parts in Very Large Corpora[C]//Proceedings of the the 37th Annual Meeting of the Association for Computational Linguistics.1999.

    [8]Roxana Girju,Adriana Badulescu and Dan Moldovan,Automatic Discoveryof Part-WholeRelations[J].Computational Linguistics,2006,32(1):83-135.

    [9]Xinyu Cao,Cungen Cao,Shi Wang and Han Lu.Extracting Part-Whole Relations from Unstructured Chinese Corpus[C]//Proceedings 4th International Conference on Natural Computation and 5th International Conference on Fuzzy Systems and Knowledge Discovery.2008.

    [10]Robert Van HageWillem,Hap Kolb and Guus Schreiber.A method for learning part-whole relations[C]//Proceedings of the 5th Int.Semantic Web Conf.,2006:723-736.

    [11]賀宏朝,何丕廉,高劍峰,等.一種基于上下文的中文信息檢索查詢擴(kuò)展[J].中文信息學(xué)報,2002,16(6):32-37.

    猜你喜歡
    概念方法
    Birdie Cup Coffee豐盛里概念店
    幾樣概念店
    學(xué)習(xí)方法
    學(xué)習(xí)集合概念『四步走』
    聚焦集合的概念及應(yīng)用
    可能是方法不對
    論間接正犯概念之消解
    用對方法才能瘦
    Coco薇(2016年2期)2016-03-22 02:42:52
    四大方法 教你不再“坐以待病”!
    Coco薇(2015年1期)2015-08-13 02:47:34
    賺錢方法
    人人澡人人妻人| 国产欧美日韩精品一区二区| 在线天堂最新版资源| av福利片在线| 日韩成人av中文字幕在线观看| 亚洲精品日本国产第一区| av在线app专区| 欧美xxxx性猛交bbbb| 亚洲精品一区蜜桃| 三级经典国产精品| 少妇人妻一区二区三区视频| 国产精品欧美亚洲77777| 热99国产精品久久久久久7| 熟妇人妻不卡中文字幕| 久久久久久久久久久免费av| 成人黄色视频免费在线看| 久久久久人妻精品一区果冻| 亚洲精品日本国产第一区| 日日啪夜夜爽| 亚洲av二区三区四区| 美女主播在线视频| 亚洲色图综合在线观看| 欧美 日韩 精品 国产| 日韩在线高清观看一区二区三区| 亚洲av日韩在线播放| 97超视频在线观看视频| 最近手机中文字幕大全| 在线观看人妻少妇| 九草在线视频观看| 国产欧美日韩综合在线一区二区 | 免费黄网站久久成人精品| 国产伦理片在线播放av一区| av在线观看视频网站免费| 亚洲欧洲日产国产| 欧美xxxx性猛交bbbb| 秋霞伦理黄片| 91午夜精品亚洲一区二区三区| 国产欧美另类精品又又久久亚洲欧美| 18禁在线无遮挡免费观看视频| 欧美日韩亚洲高清精品| 女人久久www免费人成看片| 亚洲天堂av无毛| 观看美女的网站| 青春草国产在线视频| 赤兔流量卡办理| 男的添女的下面高潮视频| 国产成人精品婷婷| 国产精品久久久久久精品电影小说| 在线观看一区二区三区激情| 肉色欧美久久久久久久蜜桃| 亚洲av福利一区| 亚洲va在线va天堂va国产| 日日啪夜夜爽| 夜夜看夜夜爽夜夜摸| 桃花免费在线播放| 亚洲av免费高清在线观看| 国产色爽女视频免费观看| 久久久久久久久久人人人人人人| 一区二区av电影网| 亚洲欧美清纯卡通| 黄色欧美视频在线观看| 日韩av在线免费看完整版不卡| 国产亚洲欧美精品永久| 欧美日韩av久久| 日韩电影二区| 亚洲av中文av极速乱| 伦理电影免费视频| 啦啦啦啦在线视频资源| av有码第一页| 日本vs欧美在线观看视频 | 高清黄色对白视频在线免费看 | a级片在线免费高清观看视频| 亚洲av国产av综合av卡| 少妇裸体淫交视频免费看高清| a级毛色黄片| 中文资源天堂在线| 免费观看a级毛片全部| 国产av国产精品国产| 如何舔出高潮| 成人亚洲精品一区在线观看| 亚州av有码| 国内精品宾馆在线| 赤兔流量卡办理| 亚洲精品视频女| 亚洲欧洲精品一区二区精品久久久 | 大码成人一级视频| 国产黄色视频一区二区在线观看| 久久毛片免费看一区二区三区| 日韩av在线免费看完整版不卡| 国产高清国产精品国产三级| 免费看av在线观看网站| 亚洲成色77777| 欧美日韩在线观看h| 精品少妇久久久久久888优播| 国产一级毛片在线| 九九在线视频观看精品| 一边亲一边摸免费视频| 国产日韩欧美视频二区| 亚洲国产精品999| 国产极品天堂在线| 国产男女内射视频| 啦啦啦啦在线视频资源| 色网站视频免费| av免费在线看不卡| 国产黄色视频一区二区在线观看| 久久亚洲国产成人精品v| 亚洲欧美精品专区久久| 亚洲高清免费不卡视频| 国产淫语在线视频| 蜜臀久久99精品久久宅男| 午夜免费鲁丝| 日日啪夜夜爽| 中文天堂在线官网| 亚洲国产精品一区三区| 如何舔出高潮| 免费观看av网站的网址| 亚洲精品国产成人久久av| 欧美丝袜亚洲另类| 免费av不卡在线播放| 女人精品久久久久毛片| 国产成人a∨麻豆精品| 高清在线视频一区二区三区| 亚洲国产精品一区二区三区在线| 日韩强制内射视频| 99热这里只有精品一区| 人妻夜夜爽99麻豆av| 国产亚洲午夜精品一区二区久久| 欧美 日韩 精品 国产| av天堂中文字幕网| 国产亚洲欧美精品永久| 另类精品久久| 人体艺术视频欧美日本| 777米奇影视久久| 97精品久久久久久久久久精品| 熟女av电影| 一区在线观看完整版| 精品卡一卡二卡四卡免费| 丁香六月天网| 亚洲精品日韩在线中文字幕| 免费观看无遮挡的男女| 女人精品久久久久毛片| 狂野欧美激情性bbbbbb| 黄色一级大片看看| 大片电影免费在线观看免费| 美女视频免费永久观看网站| 夜夜看夜夜爽夜夜摸| 欧美国产精品一级二级三级 | 久久久久久久久大av| 国产淫片久久久久久久久| 美女中出高潮动态图| 久久99精品国语久久久| 我要看黄色一级片免费的| 在线观看免费视频网站a站| 免费高清在线观看视频在线观看| 国产成人免费无遮挡视频| 老女人水多毛片| 交换朋友夫妻互换小说| 午夜福利视频精品| av专区在线播放| 国产极品天堂在线| 91精品国产国语对白视频| 精品亚洲成国产av| 日韩人妻高清精品专区| 久久97久久精品| 丁香六月天网| 国产免费福利视频在线观看| 哪个播放器可以免费观看大片| 国产一区二区在线观看日韩| 午夜日本视频在线| 日本wwww免费看| 最新的欧美精品一区二区| 亚州av有码| 亚洲色图综合在线观看| 日韩电影二区| 国产伦精品一区二区三区视频9| 99久国产av精品国产电影| 国产又色又爽无遮挡免| 最近最新中文字幕免费大全7| 久久精品夜色国产| 全区人妻精品视频| 久久ye,这里只有精品| 久久久久久久大尺度免费视频| 欧美区成人在线视频| √禁漫天堂资源中文www| 一级av片app| 日本免费在线观看一区| 亚洲精品久久午夜乱码| 免费黄频网站在线观看国产| 欧美精品一区二区免费开放| 老司机影院成人| 人妻一区二区av| 七月丁香在线播放| 国产精品久久久久久精品古装| 国产高清不卡午夜福利| 中国国产av一级| 熟妇人妻不卡中文字幕| 精品国产一区二区三区久久久樱花| 纵有疾风起免费观看全集完整版| 日日啪夜夜爽| 黄色欧美视频在线观看| 久久av网站| 国产女主播在线喷水免费视频网站| 国产国拍精品亚洲av在线观看| 性色av一级| 熟女电影av网| 天美传媒精品一区二区| av专区在线播放| 最新中文字幕久久久久| 亚洲人与动物交配视频| 熟女电影av网| 日日爽夜夜爽网站| 熟女av电影| 国产成人免费观看mmmm| 秋霞在线观看毛片| 亚洲欧美精品自产自拍| 啦啦啦视频在线资源免费观看| 免费人成在线观看视频色| 亚洲熟女精品中文字幕| 女性被躁到高潮视频| 免费看光身美女| 在线观看三级黄色| 自线自在国产av| 国内少妇人妻偷人精品xxx网站| av国产精品久久久久影院| 日韩视频在线欧美| 极品人妻少妇av视频| 狂野欧美白嫩少妇大欣赏| 成人免费观看视频高清| 我要看日韩黄色一级片| 精品亚洲乱码少妇综合久久| 成人黄色视频免费在线看| 亚洲精品日本国产第一区| 岛国毛片在线播放| 成人影院久久| 国产成人精品一,二区| 五月伊人婷婷丁香| 亚洲精品成人av观看孕妇| av天堂中文字幕网| 亚洲色图综合在线观看| 亚洲无线观看免费| 免费av中文字幕在线| 欧美成人午夜免费资源| 免费观看a级毛片全部| 欧美日韩av久久| 国产精品一区二区在线观看99| 成人特级av手机在线观看| av黄色大香蕉| 亚洲欧美成人综合另类久久久| 乱系列少妇在线播放| 日韩熟女老妇一区二区性免费视频| 国国产精品蜜臀av免费| 新久久久久国产一级毛片| 日本av免费视频播放| 中文乱码字字幕精品一区二区三区| 女性生殖器流出的白浆| 久久精品久久精品一区二区三区| 蜜桃在线观看..| av免费在线看不卡| 久久久久久久久久久丰满| 久久99蜜桃精品久久| 男人爽女人下面视频在线观看| 岛国毛片在线播放| 精品少妇久久久久久888优播| 久久精品熟女亚洲av麻豆精品| 九九久久精品国产亚洲av麻豆| 国产乱来视频区| 欧美日韩一区二区视频在线观看视频在线| 91久久精品国产一区二区成人| 欧美变态另类bdsm刘玥| 久久久久视频综合| 国产亚洲av片在线观看秒播厂| 哪个播放器可以免费观看大片| 最近2019中文字幕mv第一页| 亚洲av日韩在线播放| 精品少妇内射三级| 女人久久www免费人成看片| 久久久久人妻精品一区果冻| 欧美变态另类bdsm刘玥| 国产精品三级大全| 久久狼人影院| 一本—道久久a久久精品蜜桃钙片| 一级av片app| 亚洲精品亚洲一区二区| 精品一区二区三区视频在线| 肉色欧美久久久久久久蜜桃| 一本久久精品| 欧美区成人在线视频| 国产高清有码在线观看视频| 99国产精品免费福利视频| 高清av免费在线| 久久精品国产a三级三级三级| 在线观看免费日韩欧美大片 | 建设人人有责人人尽责人人享有的| 亚洲欧美精品自产自拍| 高清欧美精品videossex| 亚洲国产日韩一区二区| 日韩成人av中文字幕在线观看| 少妇被粗大的猛进出69影院 | 菩萨蛮人人尽说江南好唐韦庄| 三级国产精品片| 交换朋友夫妻互换小说| 曰老女人黄片| 三级国产精品欧美在线观看| av不卡在线播放| 少妇高潮的动态图| 中文字幕av电影在线播放| 久久这里有精品视频免费| 亚洲精品乱码久久久久久按摩| 激情五月婷婷亚洲| 日韩欧美精品免费久久| 精品亚洲乱码少妇综合久久| 国产黄片美女视频| 午夜激情久久久久久久| 乱系列少妇在线播放| 欧美日本中文国产一区发布| 菩萨蛮人人尽说江南好唐韦庄| 春色校园在线视频观看| 国产精品麻豆人妻色哟哟久久| av有码第一页| 久久热精品热| 久久精品久久精品一区二区三区| 少妇精品久久久久久久| 国产永久视频网站| 日本猛色少妇xxxxx猛交久久| 国产亚洲一区二区精品| 亚洲av二区三区四区| 少妇人妻久久综合中文| 一区二区三区乱码不卡18| 亚洲国产毛片av蜜桃av| 久久久亚洲精品成人影院| 黄色怎么调成土黄色| 精品亚洲成国产av| 2022亚洲国产成人精品| 亚洲高清免费不卡视频| 久久毛片免费看一区二区三区| 日本午夜av视频| 亚洲va在线va天堂va国产| 国产成人午夜福利电影在线观看| 亚洲欧洲国产日韩| 精品一区二区三区视频在线| 日本黄色日本黄色录像| 国产欧美另类精品又又久久亚洲欧美| 性色av一级| 夜夜看夜夜爽夜夜摸| av天堂久久9| 熟妇人妻不卡中文字幕| 亚洲精品aⅴ在线观看| 大片免费播放器 马上看| www.av在线官网国产| 一级毛片久久久久久久久女| 国产精品99久久久久久久久| 天堂8中文在线网| 国产毛片在线视频| 视频中文字幕在线观看| 看免费成人av毛片| 91久久精品国产一区二区成人| 尾随美女入室| 免费不卡的大黄色大毛片视频在线观看| 在线 av 中文字幕| 91精品一卡2卡3卡4卡| 欧美日韩在线观看h| 亚洲色图综合在线观看| 美女视频免费永久观看网站| 女人久久www免费人成看片| 国产男人的电影天堂91| 另类精品久久| 久久人妻熟女aⅴ| 久久久久久久精品精品| 午夜影院在线不卡| 国产午夜精品久久久久久一区二区三区| 国产免费一区二区三区四区乱码| 免费看不卡的av| 国产成人91sexporn| 韩国av在线不卡| 肉色欧美久久久久久久蜜桃| 少妇裸体淫交视频免费看高清| 午夜影院在线不卡| 看非洲黑人一级黄片| 亚洲精品日本国产第一区| 成人亚洲精品一区在线观看| av国产久精品久网站免费入址| 久久国产精品大桥未久av | 99re6热这里在线精品视频| 免费大片18禁| 久久久久久久久久成人| 91久久精品国产一区二区成人| 女性生殖器流出的白浆| 人妻人人澡人人爽人人| 日本-黄色视频高清免费观看| 亚洲四区av| 制服丝袜香蕉在线| 国产老妇伦熟女老妇高清| 亚洲av日韩在线播放| av女优亚洲男人天堂| 国产永久视频网站| 国产视频内射| 国产午夜精品久久久久久一区二区三区| 国产无遮挡羞羞视频在线观看| 亚洲精品日韩av片在线观看| 亚洲美女搞黄在线观看| 一本—道久久a久久精品蜜桃钙片| 国产一区有黄有色的免费视频| 一本色道久久久久久精品综合| 观看免费一级毛片| 高清av免费在线| 成人午夜精彩视频在线观看| 久久久久人妻精品一区果冻| 日韩,欧美,国产一区二区三区| 久久 成人 亚洲| 五月开心婷婷网| 好男人视频免费观看在线| 在线天堂最新版资源| 久久午夜综合久久蜜桃| 国产亚洲av片在线观看秒播厂| 日韩三级伦理在线观看| av专区在线播放| 日韩强制内射视频| 国产探花极品一区二区| 国产成人a∨麻豆精品| 大陆偷拍与自拍| 人妻人人澡人人爽人人| 日韩欧美 国产精品| 免费黄色在线免费观看| 哪个播放器可以免费观看大片| 99热这里只有精品一区| 免费不卡的大黄色大毛片视频在线观看| 夜夜爽夜夜爽视频| 在线观看国产h片| 麻豆成人av视频| 日日爽夜夜爽网站| 国产av码专区亚洲av| 亚洲欧美清纯卡通| 美女大奶头黄色视频| 在线免费观看不下载黄p国产| 最新的欧美精品一区二区| 亚洲精品中文字幕在线视频 | 午夜激情福利司机影院| 国产精品无大码| 中文字幕亚洲精品专区| 一本—道久久a久久精品蜜桃钙片| 久久狼人影院| 久久综合国产亚洲精品| 色94色欧美一区二区| 亚洲综合精品二区| 日韩一本色道免费dvd| 在线观看www视频免费| 日韩伦理黄色片| 国产日韩欧美亚洲二区| √禁漫天堂资源中文www| 久久av网站| 久久国产亚洲av麻豆专区| 国产男女超爽视频在线观看| 久久久久精品性色| 久久99蜜桃精品久久| 狠狠精品人妻久久久久久综合| 女人精品久久久久毛片| 成人综合一区亚洲| 搡老乐熟女国产| 在线精品无人区一区二区三| 精品少妇内射三级| 国产成人精品无人区| 久久久久国产精品人妻一区二区| 国产色爽女视频免费观看| 亚洲精品色激情综合| 人妻 亚洲 视频| 亚洲国产精品一区三区| 国产精品一区二区在线观看99| 在现免费观看毛片| 99国产精品免费福利视频| 99久久综合免费| 永久网站在线| 亚洲精品第二区| 欧美日韩视频精品一区| 伊人久久国产一区二区| 九色成人免费人妻av| 国产伦精品一区二区三区四那| 国产成人精品婷婷| 香蕉精品网在线| 三上悠亚av全集在线观看 | 国产国拍精品亚洲av在线观看| 日日啪夜夜爽| 久久精品国产自在天天线| 老司机亚洲免费影院| 黄色一级大片看看| 91久久精品国产一区二区三区| 91成人精品电影| 一本—道久久a久久精品蜜桃钙片| 午夜精品国产一区二区电影| 日韩av在线免费看完整版不卡| 成年人午夜在线观看视频| 中文字幕人妻丝袜制服| 99久久综合免费| 久久久久久久久久久免费av| 国产黄片视频在线免费观看| 欧美+日韩+精品| 亚洲国产精品一区三区| 亚洲精品一二三| 夫妻午夜视频| 男女无遮挡免费网站观看| 日韩中文字幕视频在线看片| 日本91视频免费播放| 精品久久久久久久久亚洲| 国产无遮挡羞羞视频在线观看| 免费高清在线观看视频在线观看| 好男人视频免费观看在线| 国产精品国产av在线观看| 成人特级av手机在线观看| 又爽又黄a免费视频| 日日啪夜夜撸| 51国产日韩欧美| 免费人妻精品一区二区三区视频| 日日啪夜夜爽| 成人影院久久| 成人亚洲欧美一区二区av| 欧美xxxx性猛交bbbb| 日韩精品有码人妻一区| 青春草视频在线免费观看| 18禁在线播放成人免费| 成人亚洲欧美一区二区av| 97精品久久久久久久久久精品| 日韩精品有码人妻一区| 日韩一区二区视频免费看| 免费观看无遮挡的男女| 成人毛片a级毛片在线播放| 成人二区视频| 亚洲国产欧美在线一区| 国产成人freesex在线| 大香蕉97超碰在线| 午夜av观看不卡| 99热这里只有是精品50| 精品少妇久久久久久888优播| av.在线天堂| 国产69精品久久久久777片| 一本—道久久a久久精品蜜桃钙片| 国产伦理片在线播放av一区| 亚洲国产最新在线播放| av在线观看视频网站免费| 中文在线观看免费www的网站| 久久久久人妻精品一区果冻| 精品国产露脸久久av麻豆| 国产精品一二三区在线看| 中国三级夫妇交换| 日日摸夜夜添夜夜添av毛片| 午夜91福利影院| 国产极品天堂在线| 观看免费一级毛片| 色视频在线一区二区三区| 亚洲欧美一区二区三区黑人 | 成人免费观看视频高清| 欧美日韩视频精品一区| 精品少妇久久久久久888优播| 一个人看视频在线观看www免费| 成人影院久久| 久久av网站| 天美传媒精品一区二区| 岛国毛片在线播放| 美女内射精品一级片tv| 全区人妻精品视频| av女优亚洲男人天堂| 亚洲精品亚洲一区二区| 欧美3d第一页| 国产极品粉嫩免费观看在线 | 91精品国产国语对白视频| 人体艺术视频欧美日本| 国产精品嫩草影院av在线观看| 日韩欧美 国产精品| 久久人人爽人人片av| 久久国产乱子免费精品| 国产爽快片一区二区三区| 97超视频在线观看视频| 秋霞伦理黄片| 青青草视频在线视频观看| 十八禁网站网址无遮挡 | 男女边摸边吃奶| 国产深夜福利视频在线观看| 久久午夜综合久久蜜桃| 久久人妻熟女aⅴ| 欧美 日韩 精品 国产| 国产精品免费大片| 黄色日韩在线| 三级国产精品片| 国产欧美另类精品又又久久亚洲欧美| 亚洲国产日韩一区二区| 亚洲欧美一区二区三区国产| 亚洲av男天堂| 精品人妻熟女毛片av久久网站| 久久久久精品性色| 亚洲伊人久久精品综合| 久久久久久久久久成人| 简卡轻食公司| 国产成人91sexporn| 欧美人与善性xxx| 老司机影院成人| 人人妻人人澡人人看| 久久亚洲国产成人精品v| 一本一本综合久久| 26uuu在线亚洲综合色| av视频免费观看在线观看| 国产在视频线精品| 日本午夜av视频| 少妇的逼水好多| 精品久久久精品久久久| 69精品国产乱码久久久| 国产av一区二区精品久久| 日韩免费高清中文字幕av| 婷婷色综合大香蕉| 午夜视频国产福利| 一本久久精品| av福利片在线| 在线播放无遮挡| 五月天丁香电影| 极品人妻少妇av视频| 内射极品少妇av片p| 国产美女午夜福利| 国产精品国产三级国产av玫瑰|