• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于并列結(jié)構(gòu)的概念實(shí)例和屬性的同步提取方法

    2012-06-29 01:37:28李文杰穗志方
    中文信息學(xué)報 2012年2期
    關(guān)鍵詞:語料實(shí)例準(zhǔn)確率

    李文杰,穗志方

    (1. 北京大學(xué) 計算語言學(xué)研究所,北京 100871;2. 北京大學(xué) 計算語言學(xué)教育部重點(diǎn)實(shí)驗(yàn)室,北京 100871)

    1 引言

    概念是反映客觀事物及其特有屬性的思維對象,它是知識表示的核心要素。對概念的提取研究分為: (1)概念實(shí)例提取。例如,提取“疾病”概念下的所有疾病名,包括: “感冒”、“心肌炎”等;(2)提取概念的屬性名(例如,提取“疾病”概念的屬性名“癥狀”、“并發(fā)癥”、“用藥”等)。對概念實(shí)例和屬性的提取研究,不僅對Ontology的自動構(gòu)建,而且對其他的自然語言處理任務(wù)比如自動問答、文本分類等都具有重要地指導(dǎo)作用。

    在概念實(shí)例和屬性的自動提取方面,當(dāng)前已有很多研究。有一些方法是利用手工構(gòu)造的模式去進(jìn)行提取,比如文獻(xiàn)[1-5],這種方法準(zhǔn)確率比較高,但是人工干預(yù)比較大,召回率也比較低;還有一些是利用半自動或自動的方法去進(jìn)行提取,比如文獻(xiàn)[6-10],監(jiān)督性比較小,但準(zhǔn)確率比較低。

    文獻(xiàn)[1] Hearst提出了一種利用手工指定的模式從非限定性文本中自動獲取上下位關(guān)系的方法,這種方法可以獲得很高地準(zhǔn)確率,但是需要人工制訂模式,這種方法提取出的結(jié)果往往都是有限的。文獻(xiàn)[2-3,6]從Web文檔中提取實(shí)例,其中文獻(xiàn)[6]利用迭代的方式對種子實(shí)例集合進(jìn)行擴(kuò)展,文獻(xiàn)[2-3]利用給定的概念和上下位模式通過在搜索引擎中構(gòu)造查詢請求來自動獲取實(shí)例。文獻(xiàn)[7]是利用搜索引擎的查詢?nèi)罩緛磉M(jìn)行實(shí)例提取,文獻(xiàn)[8]提出一種無指導(dǎo)的方法從半結(jié)構(gòu)化的HTML文檔中提取屬性和屬性值對,文獻(xiàn)[9]利用給定的概念和概念的實(shí)例集合從結(jié)構(gòu)化的網(wǎng)頁文本中提取概念屬性,文獻(xiàn)[4]利用手工指定的模式分別對網(wǎng)頁文件和查詢記錄中提取屬性的結(jié)果進(jìn)行了比較。

    以上研究大多關(guān)注的是單獨(dú)的概念實(shí)例和屬性提取,而文獻(xiàn)[5]提出了一種利用非常少的種子屬性從Web文檔和搜索引擎查詢?nèi)罩局型瑫r提取實(shí)例和屬性的方法,文獻(xiàn)[10]提出了一種基于Web弱指導(dǎo)的本體概念實(shí)例和屬性的同步提取方法,利用給定的種子實(shí)例和屬性集,在Web搜索引擎中查詢,通過尋找實(shí)例和屬性共現(xiàn)的上下文模式來提取新的概念實(shí)例和屬性。

    本文在文獻(xiàn)[10]基礎(chǔ)上提出了一種基于并列結(jié)構(gòu)的概念實(shí)例和屬性的同步提取方法。在同步提取之前,首先利用并列結(jié)構(gòu)去獲得一些同類詞語集合,然后再用這些集合去擴(kuò)充同步提取結(jié)果。實(shí)驗(yàn)結(jié)果表明這種使用并列結(jié)構(gòu)的方法在不降低準(zhǔn)確率的情況下,能大大提高提取結(jié)果的召回率。

    本文的結(jié)構(gòu)如下: 第二部分提出了本方法的基本思想;第三部分介紹了本方法各部分的關(guān)鍵技術(shù);第四部分介紹了實(shí)驗(yàn)設(shè)置及對實(shí)驗(yàn)結(jié)果的分析評價;最后對本文的工作進(jìn)行了總結(jié)。

    2 基于并列結(jié)構(gòu)的概念實(shí)例和屬性的同步提取基本思想

    文獻(xiàn)[10] 假設(shè)概念實(shí)例和屬性往往出現(xiàn)在特定的上下文模式中,利用種子實(shí)例和屬性構(gòu)造形如“IH1AH2”(I為種子實(shí)例,A為種子屬性,H1和H2是上下文)的查詢請求,在搜索引擎返回的結(jié)果中自動提取實(shí)例和屬性共現(xiàn)的上下文模式。然后利用這些模式,再構(gòu)造形如“*H1AH2”的查詢請求去提取候選實(shí)例,構(gòu)造形如“IH1*H2”的查詢請求去提取候選屬性。

    這種基于模式的同步提取方法有一個很大的缺點(diǎn)就是召回率比較低,當(dāng)提取出模式后,只有當(dāng)某個實(shí)例或?qū)傩阅芫_匹配該模式時才能被提取出。但是通過觀察,我們發(fā)現(xiàn)語料中存在著很多這樣的句子,例如,“心律失常的并發(fā)癥有冠心病、風(fēng)心病、心肌病、高心病、肺心病等。”和“高血壓的病因、癥狀、預(yù)防、治療等”,即很多情況下多個概念實(shí)例和屬性都是以某種并列結(jié)構(gòu)的形式出現(xiàn)在語料中。如果我們提前能通過句子中的并列結(jié)構(gòu)將這幾種疾病歸為一類,當(dāng)我們利用模式提取“疾病”概念實(shí)例時,若發(fā)現(xiàn)了“冠心病”為一個實(shí)例,則只需將其他的“風(fēng)心病、心肌病、高心病、肺心病”等都加入候選實(shí)例集合即可,這樣可以提取出很多基于模式的方法提取不出的候選實(shí)例,屬性的提取也同樣如此。

    因此本文提出了基于并列結(jié)構(gòu)的概念實(shí)例和屬性的提取方法,在進(jìn)行提取時融入了并列結(jié)構(gòu)這樣一種特征,能大大提高系統(tǒng)的召回率。和前面的工作類似,本文也選取搜索引擎作為獲得語料的工具。和單一文本相比,Web的信息冗余性能獲得更好地結(jié)果。

    3 關(guān)鍵技術(shù)

    3.1 整體結(jié)構(gòu)

    基于并列結(jié)構(gòu)的概念實(shí)例和屬性的同步提取方法,其輸入是少量的種子概念實(shí)例和種子屬性,以Web搜索引擎為語料獲取工具。這種方法的整體結(jié)構(gòu)如圖1所示。

    它主要包含四個模塊: 基于并列結(jié)構(gòu)的同類詞語提取、上下文模式的提取、候選實(shí)例的提取及候選屬性的提取,下面對這幾部分涉及到的關(guān)鍵技術(shù)分別予以介紹。

    圖1 整體結(jié)構(gòu)框架圖

    3.2 基于并列結(jié)構(gòu)的同類詞語的提取

    之所以采用并列結(jié)構(gòu)是由于具有并列關(guān)系的兩個詞語表現(xiàn)為相同概念下的特性,即如果并列結(jié)構(gòu)中的一個詞語是某個概念下的實(shí)例(或?qū)傩?,那么跟它具有并列關(guān)系的其他詞語也非??赡芏际窃摳拍钕碌钠渌麑?shí)例(或?qū)傩?。

    本文獲取包含并列結(jié)構(gòu)語料的方法是: 利用給定的種子實(shí)例和種子屬性,將種子實(shí)例兩兩組合和種子屬性兩兩組合作為查詢關(guān)鍵詞,在搜索引擎中進(jìn)行查詢,將每個結(jié)果網(wǎng)頁下載下來,對網(wǎng)頁進(jìn)行預(yù)處理,抽取出網(wǎng)頁中的文本內(nèi)容作為語料。

    然后人工構(gòu)造并列結(jié)構(gòu)的規(guī)則,提取出語料中能匹配這類規(guī)則的所有詞語。構(gòu)造的規(guī)則為: “S→、詞、詞”,即出現(xiàn)在三個“、”中間的兩個詞語就被認(rèn)為是具有并列結(jié)構(gòu)關(guān)系的詞語對。我們只選取了這一種規(guī)則,是因?yàn)檫@種規(guī)則準(zhǔn)確度很高。有一些其他的規(guī)則也可能包含并列結(jié)構(gòu)信息,例如,出現(xiàn)在“和”字周圍的兩個詞,但是這些規(guī)則準(zhǔn)確度不高,會提取出很多錯誤的詞語對,這些噪音很大程度上會影響后面的提取結(jié)果。

    接著將這些詞語對按照貪心的思想進(jìn)行簡單的分塊,分塊遵循的原則是按并查集算法將具有并列結(jié)構(gòu)關(guān)系的詞語放在同一個集合中,算法偽代碼如算法1描述所示。

    分塊完成后會生成一個大的集合記作Φ,Φ中包含有很多個詞語集合Φi,每個集合中包含的是同一類的詞語,并且對于Φ中的任意兩個集合Φi和Φj,它們之間沒有交集,因?yàn)槿籀礽和Φj存在著某個共同的詞語,則它們應(yīng)該會被歸并成同一個集合。

    這樣做的好處是,可以通過這種方法盡可能多地將表現(xiàn)相同概念的詞放在同一個集合中。在后面的基于模式的提取過程中,若提取出的某個候選實(shí)例或?qū)傩猿霈F(xiàn)在了某個集合Φi中,則可以認(rèn)為Φi中的其他詞語也都為候選概念實(shí)例或?qū)傩浴?/p>

    算法1詞語分塊算法

    1. 初始時分好塊的詞語集合Φ為空;

    2. 對于通過規(guī)則找出的所有具有并列關(guān)系的詞語對集合NounPairs;

    取出每一個詞語對中的每一個詞,若該詞在Φ中的某個集合中,就將該詞的詞頻加1,否則在Φ中新建一個集合Set,令該詞的詞頻為1,將該詞加入到Set中;

    3. 再取出每一個詞語對,合并詞語對中的兩個詞在Φ中所屬的集合;

    4. 返回Φ;

    表1給出了“疾病”概念下利用并列結(jié)構(gòu)規(guī)則提取的同類集合示例列表。

    表1 通過并列結(jié)構(gòu)提取出的同類詞語集合

    3.3 模式的提取

    3.3.1 模式的提取

    和文獻(xiàn)[10]類似,本文提取模式的方法也是根據(jù)給定的種子實(shí)例和種子屬性,對每個種子實(shí)例ins_seed和種子屬性attr_seed,構(gòu)造這樣的查詢關(guān)鍵詞“ins_seedC1attr_seedC2”(C1、C2為通配符)在搜索引擎中進(jìn)行查詢。提取出每一對匹配到的字符串C1和C2,若C1和C2的長度不超過閾值L,就將{C1,C2}加入到候選模式集合P中。例如,種子實(shí)例是“高血壓”,種子屬性是“癥狀”,就構(gòu)造這樣的關(guān)鍵詞“高血壓*癥狀*”去搜索引擎中查詢,找到匹配的句子,若其中的一條返回結(jié)果是“高血壓的癥狀有”,就將“*的*有”拿出來當(dāng)作一個候選模式。

    3.3.2 模式的評價

    一個候選模式在語料中出現(xiàn)的次數(shù)越多,則表明該模式是一個比較好的模式,應(yīng)該具有相對較高的權(quán)重。因此對于模式集合P中的每一個候選模式Pi,我們定義了如下的模式評價公式:

    (1)

    其中Conf(Pi)為模式Pi在語料中出現(xiàn)的頻率,freq(Pi)為模式Pi在語料中出現(xiàn)的頻次。

    3.4 基于并列結(jié)構(gòu)的概念實(shí)例提取

    3.4.1 基于模式的概念實(shí)例提取及評價

    ? 提取

    對于3.3提取出的模式集合P中的每一個模式Pi={C1,C2}和每一個種子屬性attr_seed,我們構(gòu)造這樣的模式“*C1attr_seedC2”去搜索引擎中進(jìn)行查詢。然后搜索每一個以該模式開頭的句子,將匹配“*”部分的字符串抽取出來,通過構(gòu)造停用詞表去掉字符串前后的無用信息,若最后剩下的字符串長度在2~10之間,則將其作為候選實(shí)例記作ins。假設(shè)種子屬性是“癥狀”,上一步獲得的模式是“*的*有”,就構(gòu)造這樣的關(guān)鍵詞“*的癥狀有”去搜索引擎中查詢,若其中的一條返回結(jié)果是“感冒的癥狀有”,就將“感冒”拿出來當(dāng)作一個候選實(shí)例。

    ? 評價

    一個模式的置信度值越高,這個模式就越能反應(yīng)概念實(shí)例和屬性之間的關(guān)聯(lián)程度,出現(xiàn)在該模式周圍的候選實(shí)例和屬性就越有可能是正確的概念實(shí)例和屬性。對于由模式Pi和種子屬性提取出的實(shí)例ins,我們定義如下的公式來計算候選實(shí)例ins的置信度值。

    (2)

    初始時實(shí)例集合Ins為空。若提取出的候選實(shí)例不在實(shí)例集合Ins中,則令其置信度值直接等于模式的置信度值;若提取出的候選實(shí)例已經(jīng)在實(shí)例集合Ins中,則將其以前的置信度值加上模式的置信度值作為其新的置信度值。

    3.4.2 利用同類詞語集合對原始候選進(jìn)行擴(kuò)充

    提取出原始候選實(shí)例ins后,接著將ins在3.2提取出的集合Φ中進(jìn)行查找,若發(fā)現(xiàn)ins在Φ中的某個詞語集合Φi中,則Φi中的其他詞語都可看作候選實(shí)例。

    且Φi中某個詞語的詞頻越大即其與其他詞語出現(xiàn)過并列結(jié)構(gòu)的次數(shù)越多,該詞也越有可能是概念實(shí)例。因此對于通過候選實(shí)例ins在集合Φi中發(fā)現(xiàn)的每個候選實(shí)例ins_par,我們定義如下的公式來計算其置信度值。

    Conf(ins_par)

    (3)

    若ins_par已經(jīng)在實(shí)例集合Ins中,則不改變其置信度值;若ins_par不在實(shí)例集合Ins中,則通過下面的公式來計算其置信度值,其中freq(ins_par)為ins_par在集合Φi中的頻次,freq(ins)為ins在集合Φi中的頻次,Conf(Pi)為發(fā)現(xiàn)候選實(shí)例ins的模式Pi的置信度值,λ為權(quán)重因子。

    3.4.1和3.4.2中的過程可以用下面的偽代碼來描述:

    算法2基于并列結(jié)構(gòu)的概念實(shí)例提取算法

    1. 基于模式的概念實(shí)例提取及評價:

    a) 利用種子屬性和模式構(gòu)造關(guān)鍵詞,去搜索引擎中提取候選實(shí)例;

    b) 對基于模式的方法提取出的候選實(shí)例進(jìn)行評價。

    2. 利用同類詞語集合對原始候選進(jìn)行擴(kuò)充

    對于第1步中提取出的每個候選實(shí)例ins:

    a) 將ins在同類詞語集合中進(jìn)行查找,找到ins所在的詞語集合,將集合中的其他詞語都當(dāng)作候選實(shí)例;

    b) 對這些通過同類詞語集合擴(kuò)充進(jìn)來的候選實(shí)例進(jìn)行評價。

    3.5 基于并列結(jié)構(gòu)的屬性提取

    3.5.1 基于模式的屬性提取及評價

    ? 提取

    和實(shí)例提取的方法類似,對每一個上下文模式Pi={C1,C2}和每一個種子實(shí)例ins_seed,我們構(gòu)造查詢關(guān)鍵詞“ins_seedC1*C2”去搜索引擎中獲取屬性提取的語料。然后構(gòu)造同樣的模式“ins_seedC1*C2”去語料中搜索,將匹配“*”部分的全部字符串抽取出來,若字符串的長度在2~8之間,則將其作為候選屬性記作attr。假設(shè)種子實(shí)例是“高血壓”,上一步獲得的模式是“*的*有”,就構(gòu)造這樣的關(guān)鍵詞“高血壓的*有”去搜索引擎中查詢,若其中的一條返回結(jié)果是“高血壓的并發(fā)癥有”,就將“并發(fā)癥”拿出來當(dāng)作一個候選屬性。

    ? 評價

    候選屬性的評價我們也是采用和實(shí)例評價同樣的方法,通過其和模式之間的關(guān)聯(lián)程度來評價。對于每個通過模式Pi提取出的候選屬性attr,我們定義如下的置信度計算公式。

    (4)

    3.5.2 利用同類詞語集合對原始候選進(jìn)行擴(kuò)充

    同樣的,將候選屬性attr在3.2提取出的集合Φ中進(jìn)行查找。對于通過候選屬性attr在Φ中的某個集合Φj中發(fā)現(xiàn)的每個候選屬性attr_par,我們定義和上面類似的公式來計算其置信度值。

    Conf(attr_par)

    (5)

    3.5.1和3.5.2中的過程也可以用下面的偽代碼來描述:

    算法3基于并列結(jié)構(gòu)的屬性提取算法

    1. 基于模式的屬性提取及評價:

    c) 利用種子實(shí)例和模式構(gòu)造關(guān)鍵詞,去搜索引擎中提取候選屬性;

    d) 對基于模式的方法提取出的候選屬性進(jìn)行評價。

    2. 利用同類詞語集合對原始候選進(jìn)行擴(kuò)充

    對于第1步中提取出的每個候選屬性attr:

    c) 將attr在同類詞語集合中進(jìn)行查找,找到attr所在的詞語集合,將集合中的其他詞語都當(dāng)作候選屬性;

    d) 對這些通過同類詞語集合擴(kuò)充進(jìn)來的候選屬性進(jìn)行評價。

    4 實(shí)驗(yàn)

    4.1 實(shí)驗(yàn)設(shè)置

    本文以Web為語料,選取百度為獲得語料的工具。除和文獻(xiàn)[10]一樣選取醫(yī)學(xué)領(lǐng)域的“疾病”概念為實(shí)驗(yàn)對象外,我們還選取了“藥物”、“汽車”、“國家”以及“宗教”這幾個概念來評價本方法的提取效果。對于提取結(jié)果,通過人工去判別其準(zhǔn)確性。因?yàn)閃eb上實(shí)例提取結(jié)果的召回率很難去計算,因此我們選取計算提取結(jié)果在所選的黃金標(biāo)準(zhǔn)中的覆蓋率來代替召回率。

    4.2 實(shí)驗(yàn)結(jié)果

    4.2.1 “疾病”概念實(shí)驗(yàn)結(jié)果

    醫(yī)學(xué)領(lǐng)域以MESH的現(xiàn)代醫(yī)學(xué)領(lǐng)域Ontology作為實(shí)例和屬性提取的黃金標(biāo)準(zhǔn)。該Ontology中包含有3 904個疾病實(shí)例。本文以文獻(xiàn)[10]為Baseline,使用和文獻(xiàn)[10]相同的種子實(shí)例集{感冒、高血壓、鼻炎、頸椎病、腎結(jié)石}和種子屬性集{癥狀、治療、病因},選取了模式提取的前十個模式進(jìn)行實(shí)驗(yàn),評價時令權(quán)重因子λ=1.0。

    表1給出了本文的方法和Baseline在黃金標(biāo)準(zhǔn)所有疾病實(shí)例上的覆蓋率之間的對比,而圖2則給出了本文提取結(jié)果前2 000個的準(zhǔn)確率。

    由表2和圖2我們發(fā)現(xiàn),Baseline在不使用并列結(jié)構(gòu)的情況下只找出315個實(shí)例,而本文的方法在仍然保持很高的準(zhǔn)確率上,比Baseline多找出431個實(shí)例,覆蓋率從8.1%提高到了19.1%。甚至在前兩百個實(shí)例的準(zhǔn)確率上,本方法的準(zhǔn)確率還高于Baseline。

    表2 實(shí)例提取在黃金標(biāo)準(zhǔn)上的覆蓋率對比

    圖2 疾病概念下實(shí)例提取的準(zhǔn)確率對比

    通過對屬性結(jié)果進(jìn)行評價,我們發(fā)現(xiàn)本文的方法在屬性提取的準(zhǔn)確率上也有很大地提高,這是因?yàn)橛刹⒘薪Y(jié)構(gòu)提取出的同類詞語具有很高地準(zhǔn)確度。圖3給出了屬性提取的準(zhǔn)確率對比。

    圖3 疾病概念下屬性提取的準(zhǔn)確率對比

    4.2.2 其他概念實(shí)驗(yàn)結(jié)果

    除了選取醫(yī)學(xué)下的“疾病”概念為實(shí)驗(yàn)對象外,本文還選了“藥物”、“汽車”、“國家”和“宗教”這幾個概念下的實(shí)例和屬性提取來比較使用并列結(jié)構(gòu)和不使用并列結(jié)構(gòu)的結(jié)果。在進(jìn)行實(shí)驗(yàn)的時候,我們發(fā)現(xiàn)文獻(xiàn)[10]的方法對種子的依賴很強(qiáng),差的種子會得到很差的結(jié)果,并且當(dāng)實(shí)例不是簡單的出現(xiàn)在句子的開頭時,通過模式的方法提取的候選結(jié)果會很差,而從并列結(jié)構(gòu)獲取的候選往往都比較準(zhǔn)確,這個時候我們可以提高從并列結(jié)構(gòu)獲取候選的權(quán)重因子,來獲得不錯的準(zhǔn)確率。

    “藥物”概念以上面的醫(yī)學(xué)領(lǐng)域Ontology列出的1 576種藥物為黃金標(biāo)準(zhǔn);“汽車”概念以汽車之家網(wǎng)站列出的101種汽車品牌為實(shí)例提取黃金標(biāo)準(zhǔn);“國家”概念以當(dāng)前聯(lián)合國的192個會員國為實(shí)例提取黃金標(biāo)準(zhǔn);“宗教”以中文維基百科提供的154種宗教為黃金標(biāo)準(zhǔn)。表3給出了幾個概念的實(shí)例提取結(jié)果對比。

    在屬性提取方面,對比前三十個候選屬性的準(zhǔn)確率,不使用并列結(jié)構(gòu)與使用并列結(jié)構(gòu)時,“藥物”概念下準(zhǔn)確率從56.7%提高到86.7%,“汽車”概念下準(zhǔn)確率從46.7%提高到60%,“國家”概念下準(zhǔn)確率從50%提高到63.3%,“宗教”概念下準(zhǔn)確率從 56.7% 提高到70%。表4給出了幾個概念下的屬性提取結(jié)果的前十個候選屬性。

    表4 屬性提取結(jié)果

    5 結(jié)論

    本文提出了一種基于并列結(jié)構(gòu)的概念實(shí)例和屬性的同步提取方法,這種方法在基于模式的方法中融入了并列結(jié)構(gòu)這樣一種特殊結(jié)構(gòu),首先通過并列結(jié)構(gòu)提取出一些同類詞語集合,然后再用基于種子的弱指導(dǎo)方法去提取候選實(shí)例和候選屬性,每提取出一個候選,就將該候選所在的同類詞語集合中的其他詞語都加入到候選集合中。并且和以往的以普通文本和網(wǎng)頁文本為語料的方法不同,本文利用搜索引擎對相關(guān)語料的篩選功能,只選擇搜索引擎結(jié)果返回的每組關(guān)鍵詞的前1 000條網(wǎng)頁title和sinnpet來進(jìn)行實(shí)驗(yàn),能大大提高運(yùn)行速率。實(shí)驗(yàn)結(jié)果表明,和單純的同步提取的弱指導(dǎo)方法比,本文的方法在不降低準(zhǔn)確率的基礎(chǔ)上,能大大提高提取結(jié)果的召回率。

    [1] M. Hearst. Automatic Acquisition of Hyponyms from Large Text Corpora[C]//Proceedings of the 14th International Conference on Computational Linguistics. Nantes, France, 1992:539-545.

    [2] R. C. Wang, W. W. Cohen. Automatic Set Instance Extraction using the Web[C]//Proceedings of ACL-IJCNLP-09, Suntec City, Singapore, August 2009.

    [3] Z. Kozareva, E. Riloff, E. Hovy. Semantic class learning from the web with hyponym pattern linkage graphs[C]//Proceedings of ACL-08: HLT, Columbus, Ohio, June: 2008,1048-1056.

    [4] M. Pasca, B. Van Durme, N. Garera. The role of documents vs. queries in extracting class attributes from text[C]//Proceedings of the 16th CIKM (CIKM-07), Lisbon, Portugal, 2007:485-494.

    [5] M. Pasca, B.V. Durme. Weakly-Supervised Acquisition of Open-Domain Classes and Class Attributes from Web Documents and Query Logs[C]//Proceedings of the ACL-08: HLT. Columbus, Ohio, USA, June 2008.

    [6] R. C. Wang, W. W. Cohen. Iterative Set Expansion of Named Entities using the Web[C]//Proceedings of ICDM 2008. Pisa, Italy,2008.

    [7] M. Pasca. Weakly-supervised discovery of named entities using web search queries[C]//Proceedings of CIKM-07, New York, NY, USA, 2007: 683-690.

    [8] N. Yoshinaga, K. Torisawa. Open-Domain Attribute-Value Acquisition from Semi-Structured Texts[C]//Proceedings of the OntoLex 2007. Busan, South-Korea, 2007.

    [9] S. Ravi, M. Pasca. Using structured text for large-scale attribute extraction[C]//Proceedings of the 17th CIKM (CIKM 2008), Napa Valley, California, 2008: 1183-1192.

    [10] 康為,穗志方. 基于Web弱指導(dǎo)的本體概念實(shí)例及屬性的同步提取[J]. 中文信息學(xué)報, 2010, 24(1), 54-59.

    猜你喜歡
    語料實(shí)例準(zhǔn)確率
    乳腺超聲檢查診斷乳腺腫瘤的特異度及準(zhǔn)確率分析
    健康之家(2021年19期)2021-05-23 11:17:39
    不同序列磁共振成像診斷脊柱損傷的臨床準(zhǔn)確率比較探討
    2015—2017 年寧夏各天氣預(yù)報參考產(chǎn)品質(zhì)量檢驗(yàn)分析
    高速公路車牌識別標(biāo)識站準(zhǔn)確率驗(yàn)證法
    基于語料調(diào)查的“連……都(也)……”出現(xiàn)的語義背景分析
    華語電影作為真實(shí)語料在翻譯教學(xué)中的應(yīng)用
    《苗防備覽》中的湘西語料
    國內(nèi)外語用學(xué)實(shí)證研究比較:語料類型與收集方法
    完形填空Ⅱ
    完形填空Ⅰ
    午夜福利在线观看吧| 国产国拍精品亚洲av在线观看| 日本av手机在线免费观看| 午夜福利视频1000在线观看| 亚洲图色成人| 白带黄色成豆腐渣| 在线观看一区二区三区| 青青草视频在线视频观看| 成人性生交大片免费视频hd| 免费一级毛片在线播放高清视频| 国产极品精品免费视频能看的| 亚洲美女视频黄频| 久久精品久久精品一区二区三区| 干丝袜人妻中文字幕| 欧美变态另类bdsm刘玥| 国产高潮美女av| 在线免费观看的www视频| 欧美成人a在线观看| 99久国产av精品| 91狼人影院| 中文字幕av成人在线电影| av又黄又爽大尺度在线免费看 | 天堂网av新在线| 美女脱内裤让男人舔精品视频| 久久精品久久久久久噜噜老黄 | 高清午夜精品一区二区三区| 爱豆传媒免费全集在线观看| 麻豆成人午夜福利视频| av在线老鸭窝| 国产高潮美女av| 天堂√8在线中文| 国产精品熟女久久久久浪| 国产大屁股一区二区在线视频| 成年版毛片免费区| 亚洲伊人久久精品综合 | 国产亚洲精品av在线| 中文字幕av成人在线电影| 国产黄a三级三级三级人| 毛片女人毛片| 国产又黄又爽又无遮挡在线| 国产高潮美女av| 又粗又硬又长又爽又黄的视频| 久久国内精品自在自线图片| 精品国内亚洲2022精品成人| 麻豆久久精品国产亚洲av| 久久久久久久久久黄片| 在现免费观看毛片| 99热精品在线国产| 日韩av在线免费看完整版不卡| 国产成人福利小说| 欧美xxxx性猛交bbbb| 秋霞伦理黄片| 2021天堂中文幕一二区在线观| 国产高清国产精品国产三级 | 日韩中字成人| 亚洲精品影视一区二区三区av| 高清毛片免费看| 网址你懂的国产日韩在线| 日韩精品有码人妻一区| av卡一久久| 国产精品久久电影中文字幕| 免费av不卡在线播放| 久久久久久国产a免费观看| 国产亚洲av嫩草精品影院| 级片在线观看| 精品一区二区三区人妻视频| 国产亚洲最大av| 在线免费观看不下载黄p国产| 中文字幕久久专区| 又粗又爽又猛毛片免费看| 国产精品日韩av在线免费观看| 国产淫片久久久久久久久| 国产在视频线在精品| 色综合色国产| 国产欧美另类精品又又久久亚洲欧美| 欧美xxxx性猛交bbbb| 久久久久久久久中文| 日韩一本色道免费dvd| 色哟哟·www| 国产美女午夜福利| 伦精品一区二区三区| 久久国产乱子免费精品| 69av精品久久久久久| 免费黄网站久久成人精品| 网址你懂的国产日韩在线| www.色视频.com| 最后的刺客免费高清国语| 午夜久久久久精精品| 成年女人看的毛片在线观看| 男女国产视频网站| 欧美成人精品欧美一级黄| 黄色一级大片看看| 亚洲精品乱久久久久久| 欧美色视频一区免费| 免费人成在线观看视频色| 久久热精品热| 日本爱情动作片www.在线观看| 久久久国产成人精品二区| 日韩,欧美,国产一区二区三区 | 精品久久久噜噜| 国产高潮美女av| 男女国产视频网站| 麻豆av噜噜一区二区三区| 亚洲在久久综合| 久久精品夜夜夜夜夜久久蜜豆| 亚洲高清免费不卡视频| 午夜精品一区二区三区免费看| 午夜福利网站1000一区二区三区| 搡老妇女老女人老熟妇| 在线播放国产精品三级| ponron亚洲| 亚洲精品国产成人久久av| 麻豆乱淫一区二区| 天天躁夜夜躁狠狠久久av| 一边亲一边摸免费视频| 国产亚洲一区二区精品| 国产探花极品一区二区| eeuss影院久久| 国产精品久久久久久av不卡| 亚洲丝袜综合中文字幕| 国产真实伦视频高清在线观看| 久久99热这里只频精品6学生 | 国产三级在线视频| 精品久久久久久久末码| 秋霞伦理黄片| 亚洲欧美成人综合另类久久久 | 2022亚洲国产成人精品| 91久久精品国产一区二区成人| av线在线观看网站| 91久久精品电影网| 一个人免费在线观看电影| 欧美高清性xxxxhd video| 欧美日韩一区二区视频在线观看视频在线 | 一本久久精品| 麻豆一二三区av精品| 亚洲乱码一区二区免费版| 日韩av在线大香蕉| 国产精品电影一区二区三区| 亚洲成人精品中文字幕电影| 亚洲欧美清纯卡通| 一级毛片aaaaaa免费看小| 亚洲精品,欧美精品| 狠狠狠狠99中文字幕| 国产av一区在线观看免费| 日本黄大片高清| 国产亚洲最大av| 18禁动态无遮挡网站| 中文亚洲av片在线观看爽| 一边亲一边摸免费视频| 亚洲av电影不卡..在线观看| 我的老师免费观看完整版| 综合色av麻豆| 又爽又黄a免费视频| 男的添女的下面高潮视频| 18禁在线播放成人免费| 日韩欧美国产在线观看| 国产三级在线视频| 久久国内精品自在自线图片| 久久久欧美国产精品| eeuss影院久久| 春色校园在线视频观看| 国产伦在线观看视频一区| 久久这里只有精品中国| 国产黄色视频一区二区在线观看 | 亚洲va在线va天堂va国产| 免费人成在线观看视频色| 黄片无遮挡物在线观看| 亚洲欧美清纯卡通| 一个人看视频在线观看www免费| 色综合亚洲欧美另类图片| 精品欧美国产一区二区三| 日韩在线高清观看一区二区三区| 国产成人免费观看mmmm| 三级毛片av免费| 久久久久国产网址| 天堂√8在线中文| 免费看av在线观看网站| 精品一区二区三区人妻视频| 国产黄色小视频在线观看| videos熟女内射| 久久精品人妻少妇| 亚洲国产精品成人综合色| 亚洲在线自拍视频| 亚洲成人中文字幕在线播放| 简卡轻食公司| 欧美日韩综合久久久久久| 国产一区二区在线av高清观看| 女人被狂操c到高潮| 精品不卡国产一区二区三区| 青青草视频在线视频观看| 国产在视频线在精品| 亚洲av中文av极速乱| 卡戴珊不雅视频在线播放| 精品久久久噜噜| 欧美日本亚洲视频在线播放| 舔av片在线| 国产69精品久久久久777片| 伦精品一区二区三区| 男人舔奶头视频| 91精品伊人久久大香线蕉| 国内精品一区二区在线观看| 国产亚洲最大av| 国产av一区在线观看免费| 91午夜精品亚洲一区二区三区| 亚洲aⅴ乱码一区二区在线播放| 午夜精品一区二区三区免费看| 国产一区二区三区av在线| 99久久精品国产国产毛片| 国产成人一区二区在线| 少妇的逼好多水| 国产v大片淫在线免费观看| 日本免费在线观看一区| 欧美激情在线99| videos熟女内射| 欧美日本亚洲视频在线播放| 亚洲欧美中文字幕日韩二区| av天堂中文字幕网| 嫩草影院新地址| 免费观看精品视频网站| 亚洲综合色惰| 亚洲国产成人一精品久久久| 蜜臀久久99精品久久宅男| 午夜免费激情av| 国产伦一二天堂av在线观看| 国产一区二区在线av高清观看| 免费黄网站久久成人精品| 亚洲激情五月婷婷啪啪| 毛片女人毛片| 免费av不卡在线播放| 我要看日韩黄色一级片| 99热这里只有是精品50| 国内揄拍国产精品人妻在线| 桃色一区二区三区在线观看| 精品一区二区三区人妻视频| 丰满少妇做爰视频| 成人高潮视频无遮挡免费网站| 又粗又硬又长又爽又黄的视频| 成人亚洲精品av一区二区| 中文字幕av成人在线电影| 好男人视频免费观看在线| 亚洲国产日韩欧美精品在线观看| 久久精品影院6| 欧美另类亚洲清纯唯美| 欧美日韩在线观看h| 国产亚洲av嫩草精品影院| 成人高潮视频无遮挡免费网站| 精品久久国产蜜桃| 久久久精品大字幕| 99热网站在线观看| 亚洲av电影不卡..在线观看| 日韩欧美精品v在线| 欧美色视频一区免费| 免费无遮挡裸体视频| 久久久精品94久久精品| 国产色婷婷99| 婷婷六月久久综合丁香| 午夜福利成人在线免费观看| 精品人妻视频免费看| 中文乱码字字幕精品一区二区三区 | .国产精品久久| 美女xxoo啪啪120秒动态图| 国产精品麻豆人妻色哟哟久久 | 日日干狠狠操夜夜爽| 国产欧美日韩精品一区二区| 国产欧美另类精品又又久久亚洲欧美| av黄色大香蕉| 精华霜和精华液先用哪个| 热99re8久久精品国产| 熟女电影av网| 六月丁香七月| 中国美白少妇内射xxxbb| 97超视频在线观看视频| 直男gayav资源| 久久99蜜桃精品久久| 亚洲国产精品成人久久小说| 日本黄大片高清| 美女内射精品一级片tv| 熟妇人妻久久中文字幕3abv| 偷拍熟女少妇极品色| 亚洲丝袜综合中文字幕| 长腿黑丝高跟| 丝袜喷水一区| 久久久久久伊人网av| 久久久国产成人精品二区| 久久久亚洲精品成人影院| 禁无遮挡网站| 熟女电影av网| 性色avwww在线观看| www.av在线官网国产| 中文字幕熟女人妻在线| 久久久欧美国产精品| 亚洲自偷自拍三级| av在线老鸭窝| 亚洲精品乱久久久久久| 国产又黄又爽又无遮挡在线| 国产精品一及| 高清在线视频一区二区三区 | 在线免费观看不下载黄p国产| 精品熟女少妇av免费看| 亚洲综合精品二区| 在线天堂最新版资源| 亚洲av熟女| 国产成人一区二区在线| av在线天堂中文字幕| 啦啦啦韩国在线观看视频| 最近最新中文字幕免费大全7| 女的被弄到高潮叫床怎么办| 国产 一区精品| 最近的中文字幕免费完整| 小说图片视频综合网站| 18禁在线无遮挡免费观看视频| 久久精品国产亚洲av涩爱| 欧美性猛交黑人性爽| 夜夜爽夜夜爽视频| 五月玫瑰六月丁香| 一级爰片在线观看| 免费不卡的大黄色大毛片视频在线观看 | 最近最新中文字幕大全电影3| 欧美日韩精品成人综合77777| 久久99热6这里只有精品| 亚洲激情五月婷婷啪啪| 非洲黑人性xxxx精品又粗又长| 九九在线视频观看精品| 亚洲国产精品成人综合色| 亚洲在久久综合| 听说在线观看完整版免费高清| a级一级毛片免费在线观看| 国产高清视频在线观看网站| 久久久a久久爽久久v久久| 99久久精品热视频| 亚洲国产精品国产精品| 亚洲av男天堂| 国产 一区 欧美 日韩| 色综合亚洲欧美另类图片| 99热这里只有精品一区| 亚洲欧洲国产日韩| 亚洲国产精品久久男人天堂| 亚洲怡红院男人天堂| 如何舔出高潮| 午夜a级毛片| 18禁动态无遮挡网站| 久久国产乱子免费精品| 18禁动态无遮挡网站| 91av网一区二区| 免费看av在线观看网站| 五月伊人婷婷丁香| 成年av动漫网址| 3wmmmm亚洲av在线观看| 午夜福利成人在线免费观看| 哪个播放器可以免费观看大片| 成人鲁丝片一二三区免费| 久久99精品国语久久久| 欧美3d第一页| 中文欧美无线码| 久久精品久久久久久久性| 亚洲精品久久久久久婷婷小说 | 国产极品精品免费视频能看的| 一本久久精品| 亚洲av日韩在线播放| 久久国内精品自在自线图片| 欧美日韩一区二区视频在线观看视频在线 | 三级国产精品欧美在线观看| 精品一区二区三区视频在线| 久久久亚洲精品成人影院| 日韩 亚洲 欧美在线| 欧美精品一区二区大全| 日韩 亚洲 欧美在线| 日韩人妻高清精品专区| 中文字幕精品亚洲无线码一区| 男女啪啪激烈高潮av片| 久久99热6这里只有精品| 只有这里有精品99| 国产精品久久久久久久久免| 久久精品久久久久久噜噜老黄 | 亚洲中文字幕一区二区三区有码在线看| 国模一区二区三区四区视频| 高清午夜精品一区二区三区| 1024手机看黄色片| 91久久精品电影网| 国产中年淑女户外野战色| 波多野结衣高清无吗| 狂野欧美白嫩少妇大欣赏| 亚洲精品自拍成人| 色视频www国产| 亚洲欧美精品专区久久| 国产精品久久久久久久久免| 美女大奶头视频| 国产v大片淫在线免费观看| 3wmmmm亚洲av在线观看| 在线播放国产精品三级| 国产欧美另类精品又又久久亚洲欧美| 亚洲丝袜综合中文字幕| 国产精品精品国产色婷婷| 亚洲无线观看免费| 欧美激情在线99| 亚洲av二区三区四区| 亚洲高清免费不卡视频| 日本-黄色视频高清免费观看| 六月丁香七月| 永久网站在线| 久久精品夜色国产| 国产精品无大码| 亚洲欧美精品综合久久99| 看非洲黑人一级黄片| 亚洲人成网站在线播| 久久久久精品久久久久真实原创| 乱码一卡2卡4卡精品| 免费不卡的大黄色大毛片视频在线观看 | 午夜视频国产福利| 久久综合国产亚洲精品| www.av在线官网国产| 美女内射精品一级片tv| 日本黄大片高清| 亚洲成人久久爱视频| 亚洲精品亚洲一区二区| 免费看日本二区| 亚洲欧洲国产日韩| 日本一本二区三区精品| 有码 亚洲区| 日韩在线高清观看一区二区三区| 69人妻影院| 看十八女毛片水多多多| 美女cb高潮喷水在线观看| 1000部很黄的大片| 免费在线观看成人毛片| 97人妻精品一区二区三区麻豆| 国产91av在线免费观看| 国产成人免费观看mmmm| 成人欧美大片| 我要搜黄色片| 看十八女毛片水多多多| 日本欧美国产在线视频| 日韩精品青青久久久久久| 成人鲁丝片一二三区免费| 久久精品久久久久久噜噜老黄 | 91久久精品国产一区二区三区| av在线亚洲专区| 日日摸夜夜添夜夜爱| 三级男女做爰猛烈吃奶摸视频| 99久久精品国产国产毛片| 91久久精品电影网| 久久久国产成人精品二区| 午夜a级毛片| 国产色爽女视频免费观看| 国产精品三级大全| 搞女人的毛片| 97热精品久久久久久| 三级国产精品欧美在线观看| 建设人人有责人人尽责人人享有的 | 欧美性感艳星| 久久久久久久久久久免费av| 久久国内精品自在自线图片| 神马国产精品三级电影在线观看| 嘟嘟电影网在线观看| 99久久精品热视频| 可以在线观看毛片的网站| 18禁在线播放成人免费| 国产精品1区2区在线观看.| 亚洲最大成人手机在线| 天堂√8在线中文| 高清毛片免费看| av又黄又爽大尺度在线免费看 | 国产男人的电影天堂91| 尾随美女入室| 性插视频无遮挡在线免费观看| 全区人妻精品视频| 国产美女午夜福利| 日本午夜av视频| 天堂影院成人在线观看| 精品久久国产蜜桃| 天天一区二区日本电影三级| 亚洲欧美清纯卡通| 国产精品国产三级专区第一集| 如何舔出高潮| 亚洲自偷自拍三级| 国产午夜精品论理片| 嫩草影院入口| 亚洲精品aⅴ在线观看| 久久99热6这里只有精品| 精品国产三级普通话版| 国产淫语在线视频| 天美传媒精品一区二区| 九九在线视频观看精品| 秋霞在线观看毛片| 精品国产三级普通话版| 久久精品熟女亚洲av麻豆精品 | 精品久久久久久久末码| 国内少妇人妻偷人精品xxx网站| 美女高潮的动态| 色综合亚洲欧美另类图片| av专区在线播放| 日本爱情动作片www.在线观看| 中文亚洲av片在线观看爽| 久久精品夜色国产| 亚洲欧洲国产日韩| 成人一区二区视频在线观看| 免费观看性生交大片5| 在线天堂最新版资源| 午夜激情福利司机影院| 色噜噜av男人的天堂激情| 国产一区有黄有色的免费视频 | 好男人视频免费观看在线| 国产高潮美女av| 久久草成人影院| 97超视频在线观看视频| 国产伦一二天堂av在线观看| 午夜免费激情av| 午夜日本视频在线| 亚洲图色成人| 欧美性猛交黑人性爽| 伦理电影大哥的女人| 欧美色视频一区免费| 国产 一区精品| 国产色爽女视频免费观看| 最近视频中文字幕2019在线8| 白带黄色成豆腐渣| 熟女人妻精品中文字幕| 少妇丰满av| 啦啦啦韩国在线观看视频| 久久精品久久精品一区二区三区| 国内精品美女久久久久久| 色视频www国产| 免费电影在线观看免费观看| 日日摸夜夜添夜夜添av毛片| 一区二区三区乱码不卡18| 欧美又色又爽又黄视频| 尤物成人国产欧美一区二区三区| 91久久精品国产一区二区三区| 国产黄片美女视频| 久久精品夜色国产| 亚洲国产精品专区欧美| 亚洲人成网站在线观看播放| 亚洲婷婷狠狠爱综合网| 婷婷色麻豆天堂久久 | 99在线人妻在线中文字幕| 欧美激情国产日韩精品一区| 亚洲四区av| 亚洲国产精品sss在线观看| 亚洲人成网站高清观看| 欧美一区二区亚洲| 国产熟女欧美一区二区| 国产乱来视频区| 我的女老师完整版在线观看| 国产伦在线观看视频一区| 禁无遮挡网站| 哪个播放器可以免费观看大片| 天堂网av新在线| 69人妻影院| 91久久精品电影网| 日本三级黄在线观看| 国产视频首页在线观看| 国产av码专区亚洲av| 欧美丝袜亚洲另类| 亚洲伊人久久精品综合 | 长腿黑丝高跟| 国产精品国产高清国产av| 人妻少妇偷人精品九色| 久久婷婷人人爽人人干人人爱| 国产成人午夜福利电影在线观看| 性色avwww在线观看| 国产精品福利在线免费观看| 成人美女网站在线观看视频| 狠狠狠狠99中文字幕| 欧美一区二区精品小视频在线| 亚洲人成网站在线播| 男女国产视频网站| 在线天堂最新版资源| 成人二区视频| 九色成人免费人妻av| 国产精品国产高清国产av| 亚洲欧美一区二区三区国产| 免费av毛片视频| 国产精品不卡视频一区二区| 男插女下体视频免费在线播放| 亚洲自拍偷在线| 青春草视频在线免费观看| 日日摸夜夜添夜夜爱| 91久久精品电影网| 国产精品永久免费网站| 成人漫画全彩无遮挡| 精品熟女少妇av免费看| 一卡2卡三卡四卡精品乱码亚洲| 精品久久久久久久久av| 嫩草影院新地址| 国产精品综合久久久久久久免费| 欧美成人午夜免费资源| or卡值多少钱| 亚洲中文字幕一区二区三区有码在线看| 18禁动态无遮挡网站| 欧美性猛交黑人性爽| 熟女电影av网| 99久国产av精品| 欧美一区二区国产精品久久精品| 人体艺术视频欧美日本| 婷婷色av中文字幕| 麻豆国产97在线/欧美| 夫妻性生交免费视频一级片| 成人鲁丝片一二三区免费| 九色成人免费人妻av| 一级黄色大片毛片| 桃色一区二区三区在线观看| 又粗又硬又长又爽又黄的视频| 国语自产精品视频在线第100页| 日韩一区二区三区影片| 亚洲熟妇中文字幕五十中出| 国产精品国产高清国产av| 久久精品国产亚洲网站| 国产精品久久久久久精品电影| 特级一级黄色大片| 国产黄色视频一区二区在线观看 | 国产成人午夜福利电影在线观看| 美女cb高潮喷水在线观看| 男女下面进入的视频免费午夜| 亚洲国产日韩欧美精品在线观看| 日韩亚洲欧美综合|