• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    面向特定領(lǐng)域文本的重疊關(guān)系語料庫構(gòu)建方法

    2022-10-24 01:20:10廖湘琳張宏軍
    關(guān)鍵詞:文本

    劉 凱,廖湘琳,張宏軍

    (陸軍工程大學(xué) 指揮控制工程學(xué)院,江蘇 南京 210000)

    0 引 言

    現(xiàn)如今,信息抽取領(lǐng)域中,以給定關(guān)系模式(schema),通過有監(jiān)督學(xué)習(xí)方式對(duì)深度學(xué)習(xí)模型進(jìn)行訓(xùn)練,進(jìn)而完成對(duì)文本數(shù)據(jù)信息抽取的過程已被廣泛應(yīng)用,且在重疊關(guān)系三元組抽取上有明顯效果[1-2]。該文對(duì)爬取得到的新聞網(wǎng)絡(luò)文本進(jìn)行分析,發(fā)現(xiàn)特定領(lǐng)域?qū)嶓w間存在重要的重疊關(guān)系,但是受標(biāo)注語料匱乏問題的制約,信息抽取領(lǐng)域在這方面的研究較少,無法滿足國內(nèi)外研究者們的需求。所以,為了更高效準(zhǔn)確地抽取文本中的重疊關(guān)系,該文構(gòu)建重疊關(guān)系標(biāo)注語料庫,為信息抽取模型訓(xùn)練提供豐富數(shù)據(jù),為當(dāng)前國內(nèi)信息抽取語料庫構(gòu)建和完善提供借鑒和參考。

    如何完善地構(gòu)建實(shí)體關(guān)系模式,如何高效準(zhǔn)確地構(gòu)建特定領(lǐng)域?qū)嶓w重疊關(guān)系抽取標(biāo)注語料庫是該文的研究重點(diǎn)。目前網(wǎng)頁新聞和網(wǎng)絡(luò)博客等開放領(lǐng)域是大部分語料庫的主要數(shù)據(jù)來源,如公開的中英文關(guān)系抽取語料庫DuIE1.0[3],其關(guān)系類型主要包含常見的人物關(guān)系,CMeIE[4]為醫(yī)學(xué)領(lǐng)域關(guān)系語料庫, FewRel[5]關(guān)系數(shù)據(jù)集包含多領(lǐng)域的關(guān)系類型。該文借助遠(yuǎn)程監(jiān)督知識(shí),依據(jù)命名實(shí)體識(shí)別、依存句法分析和觸發(fā)詞詞典,基于自定義schema對(duì)網(wǎng)絡(luò)文本中的重疊關(guān)系進(jìn)行語料標(biāo)注,構(gòu)建關(guān)系抽取語料庫。其主要描述作戰(zhàn)力量編成部署信息。

    1 相關(guān)工作

    語料庫構(gòu)建工作,過程復(fù)雜,形式多樣。針對(duì)通用語料庫的構(gòu)建工作已經(jīng)取得很多成果。比如周惠巍等人[6]依據(jù)詞性和句子結(jié)構(gòu)等信息構(gòu)建中文模糊限制信息語料庫,為事件信息抽取提供資源支持。蔣貽順[7]構(gòu)建觸發(fā)詞詞典,通過規(guī)則匹配實(shí)現(xiàn)人物關(guān)系三元組抽取。針對(duì)特定領(lǐng)域的研究,目前更多的研究集中在地理實(shí)體關(guān)系[8-9]、醫(yī)學(xué)領(lǐng)域[10-11]和軍事領(lǐng)域。茍繼承[12]利用遠(yuǎn)程監(jiān)督方法,基于規(guī)則匹配的方式獲得實(shí)體關(guān)系信息,構(gòu)建實(shí)體關(guān)系知識(shí)庫。蔣序平等人[13]通過定義事件模板,構(gòu)造觸發(fā)詞詞典,形成人工標(biāo)注種子數(shù)據(jù)集,經(jīng)過模型訓(xùn)練迭代生成針對(duì)軍事想定文本事件抽取的語料庫。馮鸞鸞等人[14]制定了一系列標(biāo)注規(guī)范,對(duì)收集到的海量互聯(lián)網(wǎng)文本進(jìn)行術(shù)語語料標(biāo)注,并且構(gòu)建出面向國防科技領(lǐng)域的技術(shù)和術(shù)語語料庫。上述方法需要人工構(gòu)建規(guī)則,增加人工標(biāo)注負(fù)擔(dān)。該文巧妙融合上述研究方法,根據(jù)自定義實(shí)體關(guān)系schema對(duì)收集到的特定領(lǐng)域新聞網(wǎng)絡(luò)文本進(jìn)行自動(dòng)回標(biāo)。該方法避免了大量的人工標(biāo)注工作,構(gòu)建出的語料庫規(guī)模較大,質(zhì)量較高,有較大實(shí)用價(jià)值。

    2 語料庫構(gòu)建方法

    面向特定領(lǐng)域文本的重疊關(guān)系抽取語料庫構(gòu)建流程如圖1所示。

    圖1 語料庫構(gòu)建流程

    2.1 語料來源

    該文將語料限定在特定領(lǐng)域內(nèi),為了發(fā)現(xiàn)網(wǎng)絡(luò)文本中重疊關(guān)系信息,建立一個(gè)通用的、實(shí)體覆蓋面更廣的關(guān)系類型模式。通過網(wǎng)絡(luò)爬蟲抓取來自新浪網(wǎng)、光明網(wǎng)、國防科技信息網(wǎng)、武器百科大全網(wǎng)站等超過1 000個(gè)網(wǎng)頁,獲得原始數(shù)據(jù)約10萬條,占用空間資源26.3 M。數(shù)據(jù)樣例如下所示:(1)近日,北京武警放出了使用QMK171瞄準(zhǔn)鏡的95-1式的照片,意味著QMK171瞄準(zhǔn)鏡已經(jīng)大量入役。(2)日前,美國通用動(dòng)力公司在美國首都華盛頓舉行的美國陸軍協(xié)會(huì)年會(huì)博覽會(huì)上展示了其最新的RM277型全自動(dòng)輕機(jī)槍的信息,將采用美軍最新研發(fā)的6.8毫米彈藥,等等。

    新聞?lì)愓Z料來源于網(wǎng)頁。通過觀察網(wǎng)頁源代碼中的HTML標(biāo)簽和文字分布特點(diǎn),利用python的爬蟲庫BeautifulSoup解析網(wǎng)頁源代碼,對(duì)網(wǎng)頁中正文較集中的內(nèi)容塊進(jìn)行文本提取。

    正文提取完成后,為方便后續(xù)實(shí)體關(guān)系的抽取,將語料數(shù)據(jù)進(jìn)行分句處理。中文語句的一句話通常由句號(hào)“?!薄柼?hào)“?”、感嘆號(hào)“!”、省略號(hào)“……”等符號(hào)結(jié)尾,利用這些符號(hào)作為句子分割條件,得到分句后的無標(biāo)注文本數(shù)據(jù)集D,作為語料庫構(gòu)建的數(shù)據(jù)來源。

    2.2 關(guān)系模式構(gòu)建

    ACE評(píng)測會(huì)議于2005年公布了官方標(biāo)注的關(guān)系抽取語料庫,包括中文、英文、阿拉伯文的標(biāo)注語料,其定義了表中的6類大類關(guān)系和18類小類關(guān)系的關(guān)系類型。COAE會(huì)議于2016年針對(duì)中文領(lǐng)域關(guān)系抽取推出包含10種關(guān)系類型的中文關(guān)系抽取訓(xùn)練集。

    但是上面兩個(gè)數(shù)據(jù)集的關(guān)系體系與特定領(lǐng)域的關(guān)系具有一定差異,無法成為構(gòu)筑特定領(lǐng)域關(guān)系體系的基礎(chǔ)。通過專家知識(shí)和對(duì)特定領(lǐng)域文本的分析,根據(jù)上述關(guān)系分類,對(duì)實(shí)體關(guān)系的篩選,過濾與領(lǐng)域無關(guān)的大量內(nèi)容,經(jīng)過整理,該文最終預(yù)定義了5種命名實(shí)體,分別是組織(ORG)、武器(WEAP)、地點(diǎn)(LOC)、行動(dòng)(ACT)、人員(PER);7種實(shí)體關(guān)系類別,分別是人員和組織的隸屬關(guān)系、組織與組織的編成關(guān)系、組織與行動(dòng)的執(zhí)行關(guān)系、組織與地點(diǎn)的部署關(guān)系、行動(dòng)與地點(diǎn)的目標(biāo)關(guān)系、組織與武器的配置關(guān)系。關(guān)系schema如下:

    {"object_type": "ORG", " predicate ": "編成", "subject_type": "ORG"}

    {"object_type": "ACT", " predicate ": "執(zhí)行", "subject_type": "ORG"}

    {"object_type": "LOC", " predicate ": "部署", "subject_type": "ORG"}

    {"object_type": "LOC", " predicate ":"布置", "subject_type": "WEAP"}

    {"object_type": "LOC", " predicate ": "目標(biāo)", "subject_type": "ACT"}

    {"object_type": "WEAP", " predicate ":"配置", "subject_type": "ORG"}

    {"object_type": "ORG", " predicate ": "隸屬", "subject_type": "PER"}

    通過分析語料文本,存在如圖2中三種重疊關(guān)系,以此為基準(zhǔn)進(jìn)行下一步研究。

    圖2 重疊關(guān)系示例圖

    2.3 基于自定義關(guān)系schema的重疊關(guān)系語料標(biāo)注

    2.3.1 實(shí)體集構(gòu)建

    根據(jù)2.2節(jié)中確定的五種實(shí)體進(jìn)行以下分析:首先利用命名實(shí)體識(shí)別方法和自制的領(lǐng)域?qū)I(yè)詞典,將2.1節(jié)構(gòu)建的訓(xùn)練語料輸入BiLSTM+CRF命名實(shí)體識(shí)別模型[15]進(jìn)行實(shí)體識(shí)別,然后通過啟發(fā)式規(guī)則,比如去掉單字符名詞、保留專有名詞等進(jìn)行人工篩選,最后獲得備選實(shí)體集N,為后續(xù)啟發(fā)式實(shí)體關(guān)系對(duì)齊和關(guān)系數(shù)據(jù)去噪做準(zhǔn)備。備選實(shí)體集N部分實(shí)體如表1所示。

    表1 備選實(shí)體集N部分實(shí)體示例

    命名實(shí)體識(shí)別所用標(biāo)注數(shù)據(jù)集由多人進(jìn)行手動(dòng)標(biāo)注并打分評(píng)估進(jìn)行融合所得。

    2.3.2 觸發(fā)詞詞典構(gòu)建

    觸發(fā)詞詞典構(gòu)建過程為:首先進(jìn)行特征詞抽取(運(yùn)用LTP工具抽取動(dòng)詞、名詞),然后根據(jù)schema聚類成觸發(fā)詞詞典,最后根據(jù)實(shí)體對(duì)進(jìn)行啟發(fā)式關(guān)系過濾。

    (1)特征詞抽取。

    通過觀察語料庫發(fā)現(xiàn),絕大多數(shù)產(chǎn)生關(guān)系的實(shí)體對(duì)都可以由其上下文中一般動(dòng)詞或者一般名詞觸發(fā)和描述(統(tǒng)稱為特征詞),而且這些特征詞均與待處理的實(shí)體對(duì)在依存句法分析樹中產(chǎn)生有限的幾類關(guān)系。

    特征詞抽取過程是為了抽取語料庫中與特定實(shí)體對(duì)類型下的實(shí)例共現(xiàn),且依存句法分析后具有特定語義關(guān)系的動(dòng)詞或名詞。然后采用啟發(fā)式過濾規(guī)則,進(jìn)行特征詞集過濾篩選[16]。

    詞性分析和依存句法分析中,使用哈工大語言技術(shù)平臺(tái)(Language Technology Platform,LTP)的處理模塊。LTP處理中文文本具有良好的性能。首先對(duì)語料庫進(jìn)行詞性標(biāo)注,抽取出動(dòng)詞或動(dòng)名詞。LTP定義了15個(gè)依存句法標(biāo)簽,包括主謂關(guān)系(SBV)、動(dòng)賓關(guān)系(VOB)、間賓關(guān)系(IOB)、并列關(guān)系(COO)等。

    具體步驟如下所示:

    ①根據(jù)2.2節(jié)中構(gòu)建的schema,得到特定實(shí)體對(duì)類型的槽(socket)。對(duì)每個(gè)實(shí)體n∈N,在語料D中檢索包含實(shí)體的所有句子,保留那些同時(shí)包含實(shí)體ni和另一個(gè)與其形成特定實(shí)體對(duì)類型的實(shí)體nj的句子Sent,由此形成七種關(guān)系句子集m(m=1,2,…,7)。

    ②對(duì)m中包含的所有句子進(jìn)行詞性標(biāo)注,抽取所有動(dòng)詞和名詞,按照如下啟發(fā)式規(guī)則進(jìn)行統(tǒng)計(jì)過濾,得到候選特征詞集Rm。

    Rule1:根據(jù)依存句法分析后,動(dòng)詞或名詞必須滿足與實(shí)體對(duì)中任一實(shí)體存在主謂賓結(jié)構(gòu)SBV-VOB、從屬關(guān)系結(jié)構(gòu)ATT-ATT、動(dòng)補(bǔ)介賓關(guān)系結(jié)構(gòu)CMP-POB。

    ③對(duì)于每一個(gè)w∈R,統(tǒng)計(jì)其在第(1)步得到的句子Sent集中出現(xiàn)的頻率PS(wk),去掉頻率小于常數(shù)θ的特征詞。

    ④根據(jù)候選特征詞wk在D中和特定實(shí)體對(duì)類型句子集Sent中的分布信息,采用以下公式計(jì)算其與實(shí)體對(duì)類型的相關(guān)度Rel(wk)[16],其中PS(wk)和PD(wk)分別表示wk在特定實(shí)體對(duì)類型句子集和語料庫D中的頻率。

    Rel(wk)=PS(wk)/PD(wk)

    ⑤根據(jù)相關(guān)度對(duì)候選特征詞進(jìn)行排序,根據(jù)排序位置取靠前的Top-K個(gè)作為特征詞,獲得篩選后候選特征詞集R。

    (2)Schema聚類與觸發(fā)詞詞典構(gòu)建。

    一系列具有相同含義和用法的特征詞可以體現(xiàn)同一種關(guān)系,因此根據(jù)2.2節(jié)Schema中確定的七種關(guān)系詞對(duì)上述包含七種關(guān)系類型的候選特征詞集R進(jìn)行對(duì)應(yīng)聚類,構(gòu)建觸發(fā)詞詞典W,如表2所示。

    表2 觸發(fā)詞詞典部分觸發(fā)詞示例

    2.3.3 語料回標(biāo)

    借助實(shí)體識(shí)別和觸發(fā)詞規(guī)則,基于自定義關(guān)系schema的語料標(biāo)注方法假設(shè):如果訓(xùn)練語料的某一句話包含的實(shí)體集中的實(shí)體對(duì)在觸發(fā)詞詞典中有對(duì)應(yīng)的觸發(fā)詞,就認(rèn)為這句話描述了觸發(fā)詞所表示的schema中的關(guān)系類型?;诖思僭O(shè)進(jìn)行語料自動(dòng)回標(biāo),有助于減少人工標(biāo)注的工作量。

    標(biāo)注算法流程:首先,根據(jù)命名實(shí)體識(shí)別結(jié)果,獲得實(shí)體和實(shí)體類型列表,然后順序掃描根據(jù)領(lǐng)域詞典進(jìn)行結(jié)巴分詞后的語料文本,依次匹配實(shí)體集中的實(shí)體,先進(jìn)行頭實(shí)體subject匹配,查找到一個(gè)實(shí)體后轉(zhuǎn)為該文本片段尾實(shí)體Object匹配,然后根據(jù)schema槽中的實(shí)體對(duì)類型進(jìn)行判斷,兩者是否相關(guān),若相關(guān),則提取關(guān)系信息,查找觸發(fā)詞詞典,對(duì)關(guān)系類型標(biāo)注和保存,否則繼續(xù)進(jìn)行實(shí)體匹配,此過程在句子集內(nèi)循環(huán),直到遍歷完成單個(gè)句子中所有關(guān)系。此方法簡單有效,標(biāo)注效率高。算法如下所示:

    算法1:重疊關(guān)系語料回標(biāo)算法。

    輸入:實(shí)體集N,觸發(fā)詞詞典W,待匹配語料D,schema;

    輸出:標(biāo)注文本s。

    ① forD中的每一句話sdo:

    ② for 實(shí)體集N中的每一個(gè)實(shí)體和類型type do:

    ③ 頭實(shí)體[subject,s_type]匹配

    ④ if subject=匹配成功 then

    ⑤ for 實(shí)體集N中除subject外的每一個(gè)實(shí)體和類型type do:

    ⑥ 尾實(shí)體[object,o_type]匹配

    ⑦ if object=匹配成功 then

    ⑧ if schema[s_type,o_type] and 對(duì)應(yīng)關(guān)系r←W[w] then

    ⑨ 標(biāo)注文本←文本串s+關(guān)系r+subject+object

    3 實(shí)驗(yàn)分析

    為了保證語料庫的專業(yè)性和可靠性,首先探討本語料庫數(shù)據(jù)源的可用性,然后進(jìn)行標(biāo)注質(zhì)量評(píng)價(jià)并使用基礎(chǔ)模型驗(yàn)證語料庫的質(zhì)量。

    3.1 數(shù)據(jù)源可用性分析

    對(duì)約10萬條原始數(shù)據(jù)進(jìn)行隨機(jī)抽取,以評(píng)價(jià)新聞網(wǎng)站作為構(gòu)建特定領(lǐng)域重疊關(guān)系抽取語料庫的可用性。(1)從原始數(shù)據(jù)中隨機(jī)抽取1 000條語句;(2)根據(jù)語句中包含的實(shí)體類型將其劃分到文中的實(shí)體分類體系中;(3)統(tǒng)計(jì)每個(gè)實(shí)體類型下語句的信息量,結(jié)果如表3所示。

    表3 數(shù)據(jù)源可用性統(tǒng)計(jì)

    由表3可以看到:(1)從原始數(shù)據(jù)中隨機(jī)抽取的1 000條新聞?wù)Z句中最多有89.5%被成功劃分到該文提出的實(shí)體分類體系中,但是不同句子中,實(shí)體數(shù)量分布不均勻;(2)包含關(guān)系三元組的語句數(shù)約占抽取的句子總數(shù)的64.3%,平均每個(gè)句子中含有6個(gè)關(guān)系三元組,涵蓋了自定義的7種實(shí)體關(guān)系。可見通過新聞等網(wǎng)站爬取的原始語料蘊(yùn)含了豐富的實(shí)體關(guān)系三元組,為構(gòu)建實(shí)體關(guān)系語料庫提供了充足的數(shù)據(jù)資源。

    3.2 標(biāo)注質(zhì)量評(píng)價(jià)

    基于數(shù)據(jù)可用性分析結(jié)果,從實(shí)體集N中分別為實(shí)體分類的5個(gè)實(shí)體類型選取50個(gè)實(shí)體,共計(jì)250個(gè);然后對(duì)基于該方法構(gòu)建的重疊關(guān)系語料庫和實(shí)體識(shí)別篩選語料進(jìn)行統(tǒng)計(jì)分析。特定領(lǐng)域的重疊關(guān)系語料庫成功標(biāo)注18 750個(gè)句子,占實(shí)體識(shí)別篩選語料的51.3%。此語料庫中的知識(shí)形式為{“text”: “文本”, “spo_list”: “{subject,predicate,object}”},其中subject表示主語(頭實(shí)體),object是賓語(尾實(shí)體),predicate是謂詞(關(guān)系的抽象表示)。為了方便查詢,依然采用json格式保存三元組信息,標(biāo)注示例如:{"text": "海軍軍事學(xué)術(shù)研究所研究員里奇博士說:“這次建造輕型航母的決定是‘一石二鳥’,這將成為體現(xiàn)‘有效性的韓國海軍核心戰(zhàn)斗力’”。", "spo_list": [{"predicate": "編成", "object_type":"ORG", "subject_type": "ORG", "object": "海軍軍事學(xué)術(shù)研究所","subject": "韓國海軍"}, {"predicate": "配置", "object_type":"WEAP", "subject_type": "ORG", "object": "輕型航母","subject": "韓國海軍"},{"predicate": "隸屬", "object_type":"ORG", "subject_type": "PER", "object": "海軍軍事學(xué)術(shù)研究所","subject": "里奇"},{"predicate": "隸屬", "object_type":"ORG", "subject_type": "PER", "object": "韓國海軍","subject": "里奇"}}。

    表4為數(shù)據(jù)統(tǒng)計(jì)信息。其中成功率表示成功匹配包含該實(shí)體的三元組的句子數(shù)占包含該實(shí)體的標(biāo)注句子總數(shù)的百分比;準(zhǔn)確率表示正確標(biāo)注的三元組數(shù)占包含該實(shí)體的三元組數(shù)的百分比。實(shí)驗(yàn)中根據(jù)250個(gè)實(shí)體得到了實(shí)體識(shí)別篩選標(biāo)注語料中的1 024條語句,通過隨機(jī)抽樣計(jì)算,語料庫的總體回標(biāo)成功率為76.7%,總體關(guān)系標(biāo)注準(zhǔn)確率為85.8%。

    表4 標(biāo)注質(zhì)量評(píng)價(jià)統(tǒng)計(jì)

    針對(duì)標(biāo)注出的實(shí)體關(guān)系,進(jìn)行如下統(tǒng)計(jì)展示。圖3表示每句話中包含不同三元組數(shù)目的句子數(shù);圖4反映句子集中包含各類重疊關(guān)系的數(shù)目及三元組總數(shù)。

    圖3 三元組頻數(shù)統(tǒng)計(jì)

    圖4 重疊關(guān)系頻數(shù)統(tǒng)計(jì)

    3.3 信息抽取模型實(shí)驗(yàn)

    為了說明構(gòu)建的語料庫的可用性,實(shí)現(xiàn)對(duì)軍事新聞中蘊(yùn)含的作戰(zhàn)力量編成部署信息的抽取,該文使用信息抽取基礎(chǔ)模型DGCNN+self-attention[17]進(jìn)行實(shí)驗(yàn)。將構(gòu)建好的語料庫按照7∶3的比例進(jìn)行訓(xùn)練集和驗(yàn)證集的劃分,并選擇17 942條經(jīng)過清洗后的語句作為測試集。評(píng)測采用傳統(tǒng)的召回率(R)、準(zhǔn)確率(P)、F1值。模型實(shí)驗(yàn)結(jié)果顯示,利用構(gòu)建的語料庫訓(xùn)練的基礎(chǔ)模型,其準(zhǔn)確率達(dá)到95.98%,召回率達(dá)到91.50%,F(xiàn)1值為93.68%,效果較好。

    3.4 語料庫結(jié)果可視化

    為更好展示構(gòu)建的語料庫效果,采用neo4j圖數(shù)據(jù)庫存儲(chǔ)并進(jìn)行可視化。語料庫部分語句各關(guān)系可視化如圖5所示。

    圖5 關(guān)系三元組可視化

    以美國為例:如“美國”存在“美國-編成-美國特種作戰(zhàn)司令部”、“美國-配置-黃蜂級(jí)航空母艦”、“美國-執(zhí)行-護(hù)航”等三種關(guān)系,26個(gè)關(guān)系三元組。

    4 結(jié)束語

    該文描述了面向特定領(lǐng)域文本的重疊關(guān)系抽取語料庫構(gòu)建工作。首先對(duì)爬取到的特定領(lǐng)域網(wǎng)絡(luò)文本進(jìn)行分析,構(gòu)建關(guān)系模式schema,然后利用命名實(shí)體識(shí)別模型對(duì)文本進(jìn)行實(shí)體識(shí)別得到備選實(shí)體集,通過依存句法分析和特征詞聚類構(gòu)造觸發(fā)詞詞典,最后基于實(shí)體集和觸發(fā)詞詞典進(jìn)行語料自動(dòng)回標(biāo),構(gòu)建出目前規(guī)模較大的面向特定領(lǐng)域的實(shí)體重疊關(guān)系抽取語料庫。同時(shí),探究了數(shù)據(jù)源的可用性和標(biāo)注質(zhì)量,語料總體的回標(biāo)成功率為76.7%,總體關(guān)系標(biāo)注準(zhǔn)確率為85.8%,利用基礎(chǔ)重疊關(guān)系抽取模型進(jìn)行實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果F1值達(dá)到93.68%。

    文中的構(gòu)建方法減少了人工標(biāo)注的工作量,標(biāo)注效率較快,質(zhì)量較高。但是,由于網(wǎng)絡(luò)文本的冗雜,構(gòu)建的語料庫仍存在部分實(shí)體和不常見實(shí)體無法識(shí)別,目標(biāo)等關(guān)系數(shù)量相對(duì)較少,且包含的關(guān)系類型較少等問題。未來的工作中,將利用抽取模型進(jìn)行迭代更新,改進(jìn)標(biāo)注質(zhì)量,并且繼續(xù)完善標(biāo)注體系,擴(kuò)大標(biāo)注規(guī)模,為后續(xù)特定領(lǐng)域的信息抽取、知識(shí)圖譜構(gòu)建等工作奠定基礎(chǔ)。

    猜你喜歡
    文本
    文本聯(lián)讀學(xué)概括 細(xì)致觀察促寫作
    重點(diǎn):論述類文本閱讀
    重點(diǎn):實(shí)用類文本閱讀
    初中群文閱讀的文本選擇及組織
    甘肅教育(2020年8期)2020-06-11 06:10:02
    作為“文本鏈”的元電影
    在808DA上文本顯示的改善
    “文化傳承與理解”離不開對(duì)具體文本的解讀與把握
    基于doc2vec和TF-IDF的相似文本識(shí)別
    電子制作(2018年18期)2018-11-14 01:48:06
    文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學(xué)隱喻
    從背景出發(fā)還是從文本出發(fā)
    国产精品电影一区二区三区 | 99国产精品一区二区蜜桃av | 丁香六月欧美| 淫妇啪啪啪对白视频| 欧美日韩一级在线毛片| 热re99久久精品国产66热6| 亚洲欧美日韩高清在线视频 | 老司机深夜福利视频在线观看| av天堂久久9| 久久免费观看电影| 久久av网站| 欧美精品亚洲一区二区| 亚洲精品一卡2卡三卡4卡5卡| 精品福利观看| 黄网站色视频无遮挡免费观看| 国产亚洲精品第一综合不卡| 国产亚洲av高清不卡| 在线亚洲精品国产二区图片欧美| 午夜福利影视在线免费观看| 久久午夜综合久久蜜桃| 国产精品亚洲av一区麻豆| 99久久国产精品久久久| 桃红色精品国产亚洲av| 美女主播在线视频| 久久这里只有精品19| 人妻久久中文字幕网| xxxhd国产人妻xxx| 99精品在免费线老司机午夜| 久久国产精品人妻蜜桃| 欧美久久黑人一区二区| 欧美中文综合在线视频| 午夜福利视频精品| 又紧又爽又黄一区二区| 一个人免费看片子| 一区二区日韩欧美中文字幕| 999精品在线视频| 亚洲国产欧美网| 欧美黄色淫秽网站| 国产又爽黄色视频| 无人区码免费观看不卡 | 国产极品粉嫩免费观看在线| 99热网站在线观看| 法律面前人人平等表现在哪些方面| 久久ye,这里只有精品| 国产一区二区 视频在线| 黄色毛片三级朝国网站| 一区二区三区乱码不卡18| 久久精品亚洲熟妇少妇任你| 99国产精品一区二区三区| 欧美中文综合在线视频| 少妇的丰满在线观看| av福利片在线| 亚洲 国产 在线| 中文亚洲av片在线观看爽 | 国产精品国产av在线观看| 久久久久视频综合| 纵有疾风起免费观看全集完整版| 免费观看av网站的网址| 性色av乱码一区二区三区2| 中文字幕另类日韩欧美亚洲嫩草| 黄色视频,在线免费观看| 欧美激情极品国产一区二区三区| 国产精品.久久久| 视频区欧美日本亚洲| 久久久久精品人妻al黑| av有码第一页| 亚洲欧美激情在线| 多毛熟女@视频| 香蕉丝袜av| 欧美+亚洲+日韩+国产| 一区二区三区国产精品乱码| 丰满少妇做爰视频| 欧美大码av| 国产1区2区3区精品| 亚洲精品久久午夜乱码| 99精品在免费线老司机午夜| 少妇的丰满在线观看| av网站在线播放免费| 99热国产这里只有精品6| 天天添夜夜摸| 19禁男女啪啪无遮挡网站| 俄罗斯特黄特色一大片| 日本精品一区二区三区蜜桃| 久久久精品免费免费高清| 久久av网站| 精品国产一区二区三区久久久樱花| 亚洲国产精品一区二区三区在线| 男女边摸边吃奶| 国产av精品麻豆| 亚洲av日韩在线播放| 电影成人av| 日韩欧美三级三区| a级片在线免费高清观看视频| 久久毛片免费看一区二区三区| 99re6热这里在线精品视频| 午夜福利在线免费观看网站| 欧美日韩中文字幕国产精品一区二区三区 | 成人影院久久| 热99re8久久精品国产| 电影成人av| 国产黄色免费在线视频| 欧美日韩中文字幕国产精品一区二区三区 | 午夜福利视频在线观看免费| 国产日韩欧美在线精品| 国产精品免费一区二区三区在线 | 国产精品一区二区在线不卡| 99国产精品99久久久久| 老司机亚洲免费影院| 精品国产超薄肉色丝袜足j| 国产男靠女视频免费网站| 精品少妇黑人巨大在线播放| 交换朋友夫妻互换小说| 精品一区二区三区av网在线观看 | 久久精品91无色码中文字幕| 日本av手机在线免费观看| 久久久久久人人人人人| 99国产综合亚洲精品| 可以免费在线观看a视频的电影网站| 不卡av一区二区三区| 亚洲国产看品久久| 国产av又大| 女警被强在线播放| 一本—道久久a久久精品蜜桃钙片| 国产单亲对白刺激| 日韩欧美免费精品| 欧美日韩亚洲综合一区二区三区_| 亚洲一区二区三区欧美精品| 成年人黄色毛片网站| 成年女人毛片免费观看观看9 | 深夜精品福利| 久久久国产精品麻豆| 一夜夜www| 国产av又大| 操美女的视频在线观看| 久热爱精品视频在线9| 久久久欧美国产精品| 桃红色精品国产亚洲av| 香蕉久久夜色| 久久天堂一区二区三区四区| 在线观看免费午夜福利视频| 欧美激情久久久久久爽电影 | 国产av国产精品国产| 国产精品影院久久| 最新的欧美精品一区二区| 黄色怎么调成土黄色| 日韩免费av在线播放| 天天添夜夜摸| 夫妻午夜视频| 国产精品影院久久| 亚洲人成电影观看| 99久久99久久久精品蜜桃| 美女午夜性视频免费| 99riav亚洲国产免费| 窝窝影院91人妻| 少妇精品久久久久久久| 欧美成狂野欧美在线观看| 色播在线永久视频| 久久久精品免费免费高清| 国产欧美日韩一区二区精品| 高清欧美精品videossex| 午夜福利一区二区在线看| 久久午夜亚洲精品久久| 午夜91福利影院| 国产精品久久久av美女十八| 亚洲av第一区精品v没综合| 久久ye,这里只有精品| 好男人电影高清在线观看| 免费女性裸体啪啪无遮挡网站| 国产精品欧美亚洲77777| 一区二区三区激情视频| 亚洲av日韩在线播放| 久久久精品区二区三区| 女性生殖器流出的白浆| 午夜久久久在线观看| 丝袜在线中文字幕| 天堂中文最新版在线下载| 制服人妻中文乱码| 国产亚洲精品第一综合不卡| tocl精华| 国产精品国产高清国产av | 日韩大码丰满熟妇| 搡老熟女国产l中国老女人| 一区福利在线观看| 99久久精品国产亚洲精品| 亚洲专区国产一区二区| 欧美激情高清一区二区三区| 人人澡人人妻人| 国产野战对白在线观看| 制服诱惑二区| 美女福利国产在线| 亚洲,欧美精品.| 久久久精品国产亚洲av高清涩受| 黄网站色视频无遮挡免费观看| 久久国产精品大桥未久av| 在线播放国产精品三级| 国产精品久久久av美女十八| 国产国语露脸激情在线看| 欧美精品啪啪一区二区三区| 国产一卡二卡三卡精品| 久久精品国产99精品国产亚洲性色 | 国产野战对白在线观看| 亚洲一卡2卡3卡4卡5卡精品中文| 亚洲色图av天堂| 捣出白浆h1v1| 成人影院久久| 美女午夜性视频免费| 久9热在线精品视频| www日本在线高清视频| 免费在线观看完整版高清| aaaaa片日本免费| 一二三四在线观看免费中文在| 在线天堂中文资源库| 成年女人毛片免费观看观看9 | 女人高潮潮喷娇喘18禁视频| 嫁个100分男人电影在线观看| 精品国产国语对白av| av视频免费观看在线观看| 青草久久国产| 老熟妇乱子伦视频在线观看| 国产亚洲欧美在线一区二区| 国产精品一区二区在线不卡| 精品视频人人做人人爽| 国产欧美日韩综合在线一区二区| 成人特级黄色片久久久久久久 | 91精品国产国语对白视频| av在线播放免费不卡| 国产欧美日韩一区二区精品| 亚洲色图av天堂| 91成年电影在线观看| 色尼玛亚洲综合影院| 好男人电影高清在线观看| 色精品久久人妻99蜜桃| netflix在线观看网站| 他把我摸到了高潮在线观看 | 午夜福利乱码中文字幕| 国产单亲对白刺激| 精品亚洲乱码少妇综合久久| av福利片在线| 不卡一级毛片| 久久免费观看电影| www日本在线高清视频| 美女高潮到喷水免费观看| 欧美中文综合在线视频| 乱人伦中国视频| 久久精品成人免费网站| 热99国产精品久久久久久7| 91精品三级在线观看| 精品午夜福利视频在线观看一区 | 中亚洲国语对白在线视频| 精品少妇内射三级| 精品少妇黑人巨大在线播放| 91大片在线观看| 亚洲美女黄片视频| 黄色片一级片一级黄色片| 一边摸一边做爽爽视频免费| 亚洲一码二码三码区别大吗| 亚洲国产欧美网| 一本一本久久a久久精品综合妖精| 欧美一级毛片孕妇| 日本五十路高清| 黄片大片在线免费观看| 天天躁日日躁夜夜躁夜夜| 午夜福利欧美成人| 大型av网站在线播放| 别揉我奶头~嗯~啊~动态视频| 在线观看免费高清a一片| 午夜视频精品福利| 99在线人妻在线中文字幕 | e午夜精品久久久久久久| 亚洲欧美一区二区三区久久| 国产精品麻豆人妻色哟哟久久| 国内毛片毛片毛片毛片毛片| 国产成人欧美在线观看 | 黑人巨大精品欧美一区二区mp4| 另类亚洲欧美激情| 久久精品成人免费网站| 日本av手机在线免费观看| 一个人免费看片子| 亚洲成a人片在线一区二区| 妹子高潮喷水视频| 人成视频在线观看免费观看| 天天躁日日躁夜夜躁夜夜| 久久久水蜜桃国产精品网| 正在播放国产对白刺激| 精品人妻在线不人妻| 亚洲人成伊人成综合网2020| a级毛片黄视频| 国产xxxxx性猛交| 欧美亚洲 丝袜 人妻 在线| 午夜福利视频精品| 亚洲第一青青草原| 欧美国产精品一级二级三级| 日韩视频在线欧美| 大码成人一级视频| 男女午夜视频在线观看| 国产麻豆69| 热re99久久精品国产66热6| av超薄肉色丝袜交足视频| 一区二区三区乱码不卡18| 大香蕉久久网| 精品国内亚洲2022精品成人 | videosex国产| 99精品在免费线老司机午夜| 精品人妻熟女毛片av久久网站| 亚洲欧洲日产国产| 国产又色又爽无遮挡免费看| 国产区一区二久久| 精品亚洲乱码少妇综合久久| 亚洲国产av影院在线观看| 欧美 日韩 精品 国产| 国产精品偷伦视频观看了| 欧美性长视频在线观看| 亚洲精品中文字幕一二三四区 | 天天操日日干夜夜撸| 亚洲欧美一区二区三区久久| 大陆偷拍与自拍| 久久青草综合色| 国产不卡av网站在线观看| 国产激情久久老熟女| videos熟女内射| 操出白浆在线播放| 飞空精品影院首页| 亚洲人成电影免费在线| 久久久久久久国产电影| 亚洲性夜色夜夜综合| 怎么达到女性高潮| 黄色视频不卡| 国产精品电影一区二区三区 | tocl精华| 免费在线观看影片大全网站| av福利片在线| 久久人人97超碰香蕉20202| 久久香蕉激情| 每晚都被弄得嗷嗷叫到高潮| 中文字幕人妻熟女乱码| 亚洲全国av大片| 欧美成狂野欧美在线观看| 亚洲欧美激情在线| 中文欧美无线码| 变态另类成人亚洲欧美熟女 | 热re99久久精品国产66热6| 亚洲av欧美aⅴ国产| 中文字幕精品免费在线观看视频| 欧美日韩亚洲综合一区二区三区_| 一区二区三区国产精品乱码| 国产精品.久久久| 国精品久久久久久国模美| 一本一本久久a久久精品综合妖精| 久久ye,这里只有精品| 考比视频在线观看| 国产精品 欧美亚洲| av欧美777| 熟女少妇亚洲综合色aaa.| 国产xxxxx性猛交| 亚洲第一欧美日韩一区二区三区 | 国产熟女午夜一区二区三区| 丝袜在线中文字幕| 国产国语露脸激情在线看| 国产欧美日韩一区二区三区在线| 国产成人av教育| 自线自在国产av| 三级毛片av免费| 嫩草影视91久久| av福利片在线| 乱人伦中国视频| 菩萨蛮人人尽说江南好唐韦庄| 午夜精品国产一区二区电影| 18禁黄网站禁片午夜丰满| 伊人久久大香线蕉亚洲五| 视频区图区小说| 国产欧美日韩一区二区三区在线| 精品一区二区三区四区五区乱码| 91成人精品电影| 日本撒尿小便嘘嘘汇集6| 人人妻,人人澡人人爽秒播| 亚洲熟女精品中文字幕| 欧美日韩亚洲高清精品| 精品一区二区三区四区五区乱码| 国产野战对白在线观看| 婷婷丁香在线五月| 一区福利在线观看| 制服人妻中文乱码| 捣出白浆h1v1| 男女高潮啪啪啪动态图| 色在线成人网| 在线观看www视频免费| 性高湖久久久久久久久免费观看| 99久久精品国产亚洲精品| 美女国产高潮福利片在线看| 欧美老熟妇乱子伦牲交| 女人精品久久久久毛片| 动漫黄色视频在线观看| 日韩视频一区二区在线观看| 成人国产av品久久久| 成年动漫av网址| 成年人黄色毛片网站| 色老头精品视频在线观看| 欧美黑人欧美精品刺激| 国产成人欧美在线观看 | 久久精品国产a三级三级三级| 亚洲黑人精品在线| 啦啦啦视频在线资源免费观看| 国产高清激情床上av| 日本vs欧美在线观看视频| 不卡一级毛片| av超薄肉色丝袜交足视频| 久久精品国产综合久久久| 午夜福利在线免费观看网站| 99国产精品一区二区三区| 69av精品久久久久久 | 操出白浆在线播放| 91成人精品电影| 777米奇影视久久| 国产主播在线观看一区二区| 黑人欧美特级aaaaaa片| 99国产精品免费福利视频| 看免费av毛片| 精品国产一区二区三区久久久樱花| 一本大道久久a久久精品| 51午夜福利影视在线观看| 五月天丁香电影| 精品福利永久在线观看| 精品国产亚洲在线| 精品国产一区二区久久| 国产又爽黄色视频| 男女高潮啪啪啪动态图| 国产在线视频一区二区| 亚洲国产欧美网| 天堂中文最新版在线下载| 欧美日韩精品网址| 精品国产乱码久久久久久男人| 黄色毛片三级朝国网站| 狠狠精品人妻久久久久久综合| 十八禁高潮呻吟视频| 99riav亚洲国产免费| 午夜91福利影院| 十八禁网站免费在线| 老司机福利观看| 乱人伦中国视频| 黄片大片在线免费观看| 97人妻天天添夜夜摸| 久久中文字幕人妻熟女| 我的亚洲天堂| 亚洲国产看品久久| 人人妻人人澡人人看| 欧美亚洲日本最大视频资源| 久久亚洲真实| 亚洲专区字幕在线| 捣出白浆h1v1| 久久ye,这里只有精品| 天天影视国产精品| 热99re8久久精品国产| 免费在线观看影片大全网站| 国产精品偷伦视频观看了| 亚洲精品一卡2卡三卡4卡5卡| 免费女性裸体啪啪无遮挡网站| 亚洲中文日韩欧美视频| 99国产综合亚洲精品| 老司机亚洲免费影院| 又大又爽又粗| 成人国产一区最新在线观看| 亚洲第一欧美日韩一区二区三区 | 又大又爽又粗| 久久人人97超碰香蕉20202| 在线十欧美十亚洲十日本专区| 亚洲黑人精品在线| 老汉色∧v一级毛片| 日韩有码中文字幕| 波多野结衣av一区二区av| 黑人猛操日本美女一级片| 美女高潮喷水抽搐中文字幕| 亚洲成人手机| av网站免费在线观看视频| 欧美日韩黄片免| 18禁黄网站禁片午夜丰满| 搡老岳熟女国产| 久久午夜综合久久蜜桃| 露出奶头的视频| 亚洲一区中文字幕在线| 国产精品成人在线| 涩涩av久久男人的天堂| 国产人伦9x9x在线观看| 人人妻人人澡人人爽人人夜夜| 欧美 亚洲 国产 日韩一| 中亚洲国语对白在线视频| 飞空精品影院首页| 久久久久国产一级毛片高清牌| 在线永久观看黄色视频| 日日爽夜夜爽网站| 国产福利在线免费观看视频| 精品国产亚洲在线| 久久久久久亚洲精品国产蜜桃av| 久久天堂一区二区三区四区| 午夜日韩欧美国产| 欧美国产精品va在线观看不卡| 久久天躁狠狠躁夜夜2o2o| 亚洲国产成人一精品久久久| 亚洲综合色网址| 亚洲第一青青草原| 天天躁日日躁夜夜躁夜夜| 久久精品91无色码中文字幕| 大型黄色视频在线免费观看| 老司机福利观看| 亚洲久久久国产精品| 女人爽到高潮嗷嗷叫在线视频| 久久精品91无色码中文字幕| 嫩草影视91久久| 亚洲国产中文字幕在线视频| 大香蕉久久网| 亚洲色图av天堂| av福利片在线| 丝袜喷水一区| 777米奇影视久久| 国产精品香港三级国产av潘金莲| 精品熟女少妇八av免费久了| www.精华液| 啦啦啦中文免费视频观看日本| 午夜福利免费观看在线| 精品国产国语对白av| 久久中文字幕一级| 午夜91福利影院| 国产亚洲精品久久久久5区| www日本在线高清视频| 1024视频免费在线观看| 欧美日韩黄片免| 国产国语露脸激情在线看| 久久久国产欧美日韩av| 首页视频小说图片口味搜索| 国产无遮挡羞羞视频在线观看| 亚洲欧美一区二区三区黑人| 欧美激情久久久久久爽电影 | 中文字幕人妻熟女乱码| 欧美日韩亚洲高清精品| 日本vs欧美在线观看视频| 亚洲国产毛片av蜜桃av| 自拍欧美九色日韩亚洲蝌蚪91| 日韩精品免费视频一区二区三区| 91麻豆av在线| 国产又爽黄色视频| 亚洲avbb在线观看| 日韩视频在线欧美| 久久人人爽av亚洲精品天堂| 亚洲中文av在线| 一本综合久久免费| 最近最新免费中文字幕在线| a级毛片黄视频| 中国美女看黄片| 女人被躁到高潮嗷嗷叫费观| 国产av又大| 天天躁夜夜躁狠狠躁躁| 日韩大片免费观看网站| 久热这里只有精品99| 久久99热这里只频精品6学生| 欧美日韩亚洲综合一区二区三区_| av免费在线观看网站| tocl精华| 精品亚洲乱码少妇综合久久| 欧美日韩亚洲国产一区二区在线观看 | 五月开心婷婷网| 热re99久久国产66热| 黑丝袜美女国产一区| 亚洲一区中文字幕在线| 精品福利永久在线观看| 999久久久精品免费观看国产| 国产精品秋霞免费鲁丝片| 国产在线一区二区三区精| 国产单亲对白刺激| 欧美黑人精品巨大| 我的亚洲天堂| 日韩视频一区二区在线观看| 中文字幕精品免费在线观看视频| 大型av网站在线播放| 久久国产精品影院| bbb黄色大片| 成年动漫av网址| 多毛熟女@视频| 一本一本久久a久久精品综合妖精| 99精品在免费线老司机午夜| 国产av精品麻豆| 国产老妇伦熟女老妇高清| 1024视频免费在线观看| 亚洲国产欧美日韩在线播放| 国产黄色免费在线视频| 大型黄色视频在线免费观看| 欧美另类亚洲清纯唯美| 亚洲精品美女久久av网站| 丝袜美足系列| 99国产精品一区二区蜜桃av | 日韩免费av在线播放| 女人精品久久久久毛片| 国产xxxxx性猛交| 亚洲精品国产色婷婷电影| 亚洲精品一二三| 王馨瑶露胸无遮挡在线观看| 99国产精品一区二区蜜桃av | 妹子高潮喷水视频| 亚洲成a人片在线一区二区| 国产不卡一卡二| 91大片在线观看| 99精国产麻豆久久婷婷| 亚洲午夜精品一区,二区,三区| 久久性视频一级片| 新久久久久国产一级毛片| 久久午夜综合久久蜜桃| 国产免费现黄频在线看| 黄色视频在线播放观看不卡| 在线观看免费日韩欧美大片| 狠狠精品人妻久久久久久综合| 午夜激情久久久久久久| 午夜福利,免费看| 汤姆久久久久久久影院中文字幕| 国产日韩欧美亚洲二区| 90打野战视频偷拍视频| 国产精品一区二区免费欧美| 亚洲精品国产区一区二|