• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于MPNet 與BiLSTM 的COVID-19 臨床文本命名實(shí)體識(shí)別方法

    2023-02-08 12:54:44蔡曉瓊鄭增亮蘇前敏郭晶磊
    關(guān)鍵詞:文本模型

    蔡曉瓊,鄭增亮,蘇前敏,郭晶磊

    (1 上海工程技術(shù)大學(xué) 電子電氣工程學(xué)院,上海 201620;2 上海中醫(yī)藥大學(xué) 基礎(chǔ)醫(yī)學(xué)院,上海 201203)

    0 引言

    生物醫(yī)學(xué)命名實(shí)體識(shí)別,是生物醫(yī)學(xué)信息提取領(lǐng)域最基本的任務(wù)之一,其準(zhǔn)確性對后續(xù)研究工作至關(guān)重要。隨著生物醫(yī)學(xué)研究與信息化技術(shù)的迅速發(fā)展,臨床醫(yī)學(xué)文獻(xiàn)數(shù)量呈指數(shù)級(jí)增長,這些資源中存在大量非結(jié)構(gòu)化數(shù)據(jù),迫切需要開發(fā)一些自動(dòng)化技術(shù),來解決生物醫(yī)學(xué)領(lǐng)域的單詞分割、實(shí)體識(shí)別、關(guān)系抽取、主題分類等問題。由于生物醫(yī)學(xué)實(shí)體的多樣性和變異性,識(shí)別生物醫(yī)學(xué)實(shí)體是一項(xiàng)非常具有挑戰(zhàn)性的任務(wù)。目前,生物醫(yī)學(xué)命名實(shí)體識(shí)別方法主要分為基于字典和規(guī)則的方法,以及基于深度學(xué)習(xí)的方法。

    基于規(guī)則的命名實(shí)體識(shí)別方法主要依賴于人工定義的詞典和規(guī)則,可以根據(jù)特定領(lǐng)域的詞典和句法-詞匯模式來進(jìn)行設(shè)計(jì)。一些著名的基于規(guī)則的命名實(shí)體識(shí)別模型包括LaSIE-II、Sra、FASTUS 和LTG 等[1-4]。與傳統(tǒng)方法相比,引入深度學(xué)習(xí)技術(shù)的命名實(shí)體識(shí)別方法,通過在大規(guī)模語料庫中進(jìn)行訓(xùn)練與學(xué)習(xí),自動(dòng)提取語義特征,使模型具有較強(qiáng)的泛化能力,同時(shí)降低了人力與時(shí)間成本。目前常用的詞嵌入方法是由Mikolov 等[5]提出的Word2Vec模型。但該方法訓(xùn)練獲得的詞向量是靜態(tài)的,無法解決一詞多義問題。隨著自然語言處理技術(shù)的發(fā)展,ELMo[6]、BERT[7]和XLNet[8]等預(yù)訓(xùn)練語言模型的推出,為下游任務(wù)提供了極大的幫助,對模型進(jìn)行微調(diào)后,在命名實(shí)體識(shí)別任務(wù)上取得了較好的效果。但ELMo 輸出的語義表征是單向的,無法獲得更全面的雙向信息;BERT 和XLNet 采用的MLM 和PLM 方法各自存在局限性,在用于下游任務(wù)微調(diào)時(shí),會(huì)造成預(yù)訓(xùn)練和微調(diào)不匹配。為了解決以上問題,南京大學(xué)和微軟共同提出了基于MLM 和PLM各自優(yōu)點(diǎn)的預(yù)訓(xùn)練模型MPNet[9],彌補(bǔ)了MLM 無法學(xué)習(xí)tokens 之間依賴關(guān)系的不足,同時(shí)克服了PLM 無法獲得下游任務(wù)中可見完整信息的問題。

    針對目前臨床試驗(yàn)文本研究匱乏、語料不足與標(biāo)注質(zhì)量不高等問題,本文結(jié)合UMLS 語義網(wǎng)絡(luò)和專家定義方法建立了COVID-19 臨床實(shí)體識(shí)別語料庫,并將預(yù)訓(xùn)練語言模型MPNet 引入COVID-19 臨床實(shí)體識(shí)別任務(wù)中,提出了一種基于MPNet 與BiLSTM 的醫(yī)學(xué)實(shí)體識(shí)別模型。

    1 MPNet-BiLSTM-CRF 命名實(shí)體識(shí)別模型

    本文提出的MPNet-BiLSTM-CRF 命名實(shí)體識(shí)別模型主要結(jié)構(gòu)如圖1 所示。采用MPNet 預(yù)訓(xùn)練模型作為嵌入層對輸入進(jìn)行語義提取生成動(dòng)態(tài)詞向量;采用BiLSTM 捕捉長距離依賴關(guān)系;最后由CRF推理層進(jìn)行最佳標(biāo)注序列解碼,預(yù)測出全局最優(yōu)標(biāo)簽。該方法在經(jīng)典BiLSTM-CRF 的基礎(chǔ)上進(jìn)行了改進(jìn),引入了MPNet 語言模型,在預(yù)測掩碼標(biāo)記的同時(shí)以更多的信息為條件,從而獲得更好的學(xué)習(xí)表征,并減少了微調(diào)階段的差異。

    圖1 MPNet-BiLSTM-CRF 模型結(jié)構(gòu)圖Fig.1 The structure of MPNet-BiLSTM-CRF model

    1.1 MPNet 預(yù)訓(xùn)練模型

    MPNet 模型的注意力掩碼機(jī)制:首先設(shè)長度n =6 的輸入序列為(x1,x2,x3,x4,x5,x6),若隨機(jī)生成的序列為(x5,x4,x2,x6,x3,x1),預(yù)測值分別是x6、x3和x1,則非預(yù)測序列表示為(x5,x4,x2,[MASK],[MASK],[MASK] ),對應(yīng)位置序列為(P5,P4,P2,P6,P3,P1)。其次,為 了能讓預(yù)測部分 的[MASK]看到之前預(yù)測的tokens,MPNet 采用了PLM 雙流自注意力機(jī)制完成自回歸生成,并為內(nèi)容流和查詢流設(shè)置了不同的掩蔽機(jī)制。例如,MPNet在預(yù)測上述序列中的x3時(shí),能在非預(yù)測部分看到(x5+P5,x4+P4,x2+P2),同時(shí)在預(yù)測部分看到之前預(yù)測的(x6+P6),從而避免MLM 中依賴關(guān)系遺漏的問題。此外,為了確保預(yù)訓(xùn)練中輸入信息與下游任務(wù)中輸入信息的一致性,MPNet 在非預(yù)測部分增加了掩碼符號(hào)和位置信息([MASK]+P6,[MASK]+P3,[MASK]+P1),使模型能看到完整的句子。當(dāng)預(yù)測x3時(shí),能在非預(yù)測部分看到原始的(x5+P5,x4+P4,x2+P2)以及引入了額外tokens和位置信息的([MASK]+P3,[MASK]+P1),同時(shí)在預(yù)測部分看到之前預(yù)測的(x6+P6)。通過上述辦法對查詢流和內(nèi)容流進(jìn)行位置補(bǔ)償后的模型,能夠大幅減少預(yù)訓(xùn)練與微調(diào)之間輸入不一致的問題。

    假定句子為“to take up seasonal flu vaccination”,模 型 輸 入 序 列 為[to,take up,seasonal,flu,vaccination],需 要 預(yù) 測 的token 是[seasonal,flu,vaccination],MPNet 的因子化如下:

    1.2 Transformer

    自Vaswani 等[10]提出Transformer 這一基于自注意力機(jī)制的深度學(xué)習(xí)模型以來,已被廣泛應(yīng)用到NLP 領(lǐng)域中解決各種復(fù)雜問題,幾款主流的預(yù)訓(xùn)練語言模型(如BERT、XLNet 和ALBERT 等)都以Transformer 作為其骨干網(wǎng)絡(luò)。傳統(tǒng)語言模型通?;贑NN 或RNN 編碼器進(jìn)行訓(xùn)練,在長周期語境建模中能力較為欠缺,并且在學(xué)習(xí)單詞表征時(shí)存在位置偏差,尤其RNN 是按順序處理輸入的,即一個(gè)字一個(gè)字地處理,對計(jì)算機(jī)硬件的并行能力要求較高。為了克服現(xiàn)有深度學(xué)習(xí)模型的缺點(diǎn),Transformer 在每個(gè)關(guān)鍵模塊中引入了Attention 機(jī)制,大幅提升了模型對文本的特征提取能力。此外,Transformer 還引入了多頭注意力機(jī)制(Multi-Head Attention),使模型能夠使用各個(gè)序列位置的各個(gè)子空間的表征信息來進(jìn)行序列數(shù)據(jù)處理,其相當(dāng)于多個(gè)不同的自注意力模塊的集成,從而構(gòu)成蘊(yùn)含完整語料信息的多粒度特征。標(biāo)準(zhǔn)的Transformer 結(jié)構(gòu)如圖2 所示。

    圖2 標(biāo)準(zhǔn)Transformer 結(jié)構(gòu)圖Fig.2 Standard Transformer structure diagram

    通 過 圖2 可 知,Transformer 由encoder 和decoder 兩部分組合而成。其中,encoder 通過6 個(gè)編碼器疊加構(gòu)成,每個(gè)encoder 中都包含一個(gè)自注意力層和前饋神經(jīng)網(wǎng)絡(luò)層,兩個(gè)子層之間通過殘差網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行連接,后接一個(gè)正則化層。為了方便各層之間的殘差連接,模型中所有子層的輸出維度均為512。Decoder 也由6 個(gè)完全相同的解碼器疊加組成,除了與編碼器完全一致的兩個(gè)子層外,Decoder 還設(shè)置了一個(gè)多頭注意力層。多頭注意力層是由多個(gè)自注意力層拼接而成的,可以捕捉到單詞之間各維度上的相關(guān)系數(shù)。

    1.3 雙向長短期記憶網(wǎng)絡(luò)(BiLSTM)模型

    為了解決傳統(tǒng)循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)在訓(xùn)練較長語句時(shí)可能導(dǎo)致梯度爆炸和梯度消失問題,Hochreiter 等人[11]提出了長短期記憶網(wǎng)絡(luò)(Long Short-Term Memory,LSTM),該模型能夠在長文本訓(xùn)練中捕捉長距離依賴特征。與標(biāo)準(zhǔn)RNN 模型相比,LSTM 在其結(jié)構(gòu)基礎(chǔ)上增加了門控機(jī)制和記憶單元兩個(gè)模塊。其中,記憶單元用于存儲(chǔ)文本特征,門控機(jī)制則對記憶單元中的存儲(chǔ)信息進(jìn)行篩選。LSTM 模型分別設(shè)置了輸入門、遺忘門和輸出門保護(hù)和控制細(xì)胞狀態(tài),通過累加更新傳遞信息的方式,消除了RNN 模型在處理長文本任務(wù)時(shí)可能出現(xiàn)的問題,其單元結(jié)構(gòu)如圖3 所示。

    圖3 LSTM 單元結(jié)構(gòu)圖Fig.3 LSTM unit structure

    LSTM 模型是由t時(shí)刻的輸入詞Xt、細(xì)胞狀態(tài)Ct、臨時(shí)細(xì)胞狀態(tài)隱含狀態(tài)ht、遺忘門ft、記憶門it及輸出門ot組成,通過對細(xì)胞狀態(tài)中信息遺忘和記憶新的信息,使得對后續(xù)時(shí)刻計(jì)算有用的信息得以傳遞,而無用的信息被摒棄,并在每個(gè)時(shí)間步都會(huì)輸出隱含狀態(tài)ht。其中遺忘、記憶與輸出通過上一時(shí)刻的隱含狀態(tài)ht-1和當(dāng)前輸入Xt計(jì)算出來的遺忘門ft、記憶門it和輸出門ot來控制,遺忘門計(jì)算如公式(2):

    其中,輸入為前一時(shí)刻的隱含狀態(tài)ht -1和當(dāng)前時(shí)刻的輸入詞Xt。

    記憶門的值it和臨時(shí)細(xì)胞狀態(tài)分別由公式(3)和公式(4)計(jì)算得出:

    根據(jù)輸入為記憶門的值it、遺忘門的值ft、臨時(shí)細(xì)胞狀態(tài)和上一時(shí)刻細(xì)胞狀態(tài)Ct -1計(jì)算t時(shí)刻細(xì)胞狀態(tài)Ct為

    前一時(shí)刻的隱含狀態(tài)ht -1、當(dāng)前時(shí)刻的輸入詞Xt和當(dāng)前時(shí)刻細(xì)胞狀態(tài)ht,計(jì)算t時(shí)刻輸出門的值ot和隱含狀態(tài)ht為

    其中,σ為sigmoid函數(shù);tanh 為雙曲正切激活函數(shù);W和b分別表示鏈接兩層的權(quán)重矩陣和偏置向量。經(jīng)過LSTM 模型計(jì)算后,最終即可得到與句子長度相同的隱含狀態(tài)序列{h0,h1,…,hn-1}。

    對于處理NLP 任務(wù)(尤其對序列標(biāo)注任務(wù)),上下文內(nèi)容無論對單詞、詞組還是字符,在整個(gè)研究過程中都尤為重要。通常情況下,LSTM 常用單元為前向傳播,然而在研究序列問題時(shí),前向LSTM 無法處理下文的內(nèi)容信息,從而導(dǎo)致模型無法學(xué)習(xí)到下文的知識(shí),影響最終模型效果。而雙向長短期記憶網(wǎng)絡(luò)(Bi -directional Long Short -Term Memory,BiLSTM)既能獲取上文信息,又能捕獲下文內(nèi)容,對雙向信息都能進(jìn)行記憶,通過同時(shí)得到前后兩個(gè)方向的輸出,來提高整個(gè)NLP 模型的性能。BiLSTM模型結(jié)構(gòu)如圖4 所示。

    圖4 BiLSTM 模型結(jié)構(gòu)圖Fig.4 BiLSTM model structure

    1.4 條件隨機(jī)場(CRF)

    條件隨機(jī)場(Conditional Random Field,CRF)是Lafferty 等[12]基于最大熵模型和隱馬爾可夫模型所提出的一種判別式概率無向圖學(xué)習(xí)模型,常用于標(biāo)注和切分有序數(shù)據(jù)的條件概率模型。在序列任務(wù)標(biāo)注任務(wù)中,令X =(X1,X2,…,Xn)表示模型的觀察序列,Y =(Y1,Y2,…,Yn)表示狀態(tài)序列,P(Y |X)為線性鏈條件隨機(jī)場,則在隨機(jī)變量X取值為x的條件下,計(jì)算狀態(tài)序列Y取值為y的條件概率分布P(Y |X),計(jì)算公式為

    其中,tk、sl為特征函數(shù),其函數(shù)取值為0 或1(當(dāng)滿足特征條件時(shí),函數(shù)取值為1,反之為0);λk、ul為對應(yīng)權(quán)重;Z(x)為歸一化因子,其計(jì)算公式為

    為了對上述公式進(jìn)行簡化,可將轉(zhuǎn)移特征、狀態(tài)特征及其權(quán)重用統(tǒng)一的符號(hào)進(jìn)行表示,簡化后的公式為

    CRF 中最重要的就是訓(xùn)練模型的權(quán)重。通常情況下,使用最大化對數(shù)似然函數(shù)進(jìn)行CRF 模型的訓(xùn)練,通過式(12)計(jì)算在給定條件下,標(biāo)簽序列Y的條件概率:

    最后,在CRF 模型預(yù)測過程中采用維特比(Viterbi)算法來求解全局最優(yōu)序列,通過該算法可以計(jì)算出與預(yù)測對象對應(yīng)的最大概率標(biāo)簽,計(jì)算公式為

    2 實(shí)驗(yàn)結(jié)果與分析

    2.1 實(shí)驗(yàn)數(shù)據(jù)

    本文使用的是美國臨床試驗(yàn)注冊中心(ClinicalTrials,CT)中的COVID-19 相關(guān)臨床試驗(yàn)注冊數(shù)據(jù),CT 官方網(wǎng)址為https://clinicaltrials.gov。CT 中收錄了臨床研究者在世界各地進(jìn)行的私人或公共資助的臨床研究項(xiàng)目,其中包含有關(guān)人類志愿者醫(yī)學(xué)研究的信息。隨著COVID-19 的爆發(fā),越來越多相關(guān)的臨床試驗(yàn)在此平臺(tái)進(jìn)行了注冊,臨床記錄中富含COVID-19 相關(guān)的臨床醫(yī)學(xué)知識(shí)??紤]到試驗(yàn)結(jié)束前可能存在信息更新不完整的問題,本文基于已完成的697 項(xiàng)干預(yù)性試驗(yàn)數(shù)據(jù)進(jìn)行COVID-19 臨床試驗(yàn)的命名實(shí)體識(shí)別實(shí)驗(yàn)。

    2.2 實(shí)驗(yàn)配置

    本研究采用的NER 模型基于PyTorch 深度學(xué)習(xí)框架,實(shí)驗(yàn)環(huán)境配置見表1。

    表1 實(shí)驗(yàn)環(huán)境配置Tab.1 Experimental environment configuration

    本研究采用微軟發(fā)布的MPNet 模型,由12 個(gè)Transformer 層組合而成,隱藏層維度設(shè)為768,12 個(gè)注意頭模式;使用GELU 作為其激活函數(shù),BiLSTM隱藏單元為128。在訓(xùn)練階段,MPNet-BiLSTM-CRF的最大序列長度為256,batch_size 為128,MPNet 學(xué)習(xí)率設(shè)為3e-5,Dropout 為0.1,其他模塊Dropout 為0.3,并通過Adam 優(yōu)化算法對模型進(jìn)行訓(xùn)練。

    2.3 概念定義與標(biāo)注策略

    臨床試驗(yàn)注冊中的非結(jié)構(gòu)化文本主要涉及了具有特定意義的相關(guān)醫(yī)學(xué)實(shí)體。例如:藥物名稱“Remdesivir”、醫(yī)療程序“bronchoalveolar lavage”、疾病名稱“COVID-19”等等。不同的研究對醫(yī)療實(shí)體的標(biāo)注規(guī)則和定義都有一定差異,統(tǒng)一醫(yī)學(xué)語言系統(tǒng)(Unified Medical Language System,UMLS)收錄了超過500 萬條生物醫(yī)學(xué)術(shù)語,至少200 萬種醫(yī)學(xué)概念,目前已廣泛應(yīng)用于文獻(xiàn)分類、臨床研究和中英文電子病歷等領(lǐng)域中。本研究參考了UMLS 定義的實(shí)體類別以及文獻(xiàn)[13]中提出的醫(yī)學(xué)實(shí)體標(biāo)注規(guī)范,對臨床試驗(yàn)注冊內(nèi)容規(guī)定了實(shí)體標(biāo)準(zhǔn)和含義,結(jié)合文本內(nèi)容定義了8 種類別的臨床實(shí)體,COVID-19臨床文本命名實(shí)體識(shí)別示例見表2。

    表2 實(shí)體類型定義與示例Tab.2 Entity type definitions and examples

    NER 任務(wù)旨在提取文本中的命名實(shí)體,如名稱或帶有適當(dāng)NER 類的標(biāo)簽,本文使用BIO 標(biāo)注方式對序列進(jìn)行標(biāo)注。在這種格式中,不屬于實(shí)體的標(biāo)記被標(biāo)記為“O”,“B”標(biāo)記對應(yīng)實(shí)體的第一個(gè)單詞,“I”標(biāo)記對應(yīng)同一實(shí)體的其余單詞?!癇”和“I”標(biāo)簽后跟連字符(或下劃線),后跟實(shí)體類別縮寫(如Dru、Dis、Syp 等),表3 是對COVID-19 臨床實(shí)體預(yù)測標(biāo)簽的示例。

    表3 實(shí)體預(yù)測標(biāo)簽定義Tab.3 Entity prediction label definitions

    2.4 評價(jià)指標(biāo)

    本研究采用精確率(P)、召回率(R)和F1 值(F1)作為模型的評價(jià)指標(biāo)。P是指正確識(shí)別的實(shí)體占全部預(yù)測實(shí)體的比重,R是正確識(shí)別的實(shí)體占語料庫中所有實(shí)體的比重。各指標(biāo)對應(yīng)的計(jì)算公式如下:

    其中,TP指正確地將正例預(yù)測為正的數(shù)量;FP指錯(cuò)誤地將負(fù)例預(yù)測為正的數(shù)量;FN指錯(cuò)誤地將正例預(yù)測為負(fù)的數(shù)量。

    2.5 對比實(shí)驗(yàn)

    為了驗(yàn)證本文提出的MPNet-BiLSTM-CRF 融合模型對COVID-19 臨床試驗(yàn)注冊實(shí)體具有較好的識(shí)別效果,與以下幾種方法進(jìn)行對比實(shí)驗(yàn):

    (1)經(jīng)典的BiLSTM-CRF 模型:該模型采用word2vec 訓(xùn)練得到的詞,嵌入向量作為輸入,然后通過雙向LSTM 層和CRF 完成編碼與識(shí)別任務(wù)。目前該模型已廣泛應(yīng)用于中英文生物醫(yī)學(xué)NER 任務(wù)中,并取得了良好的效果。

    (2)Att-BiLSTM-CRF 融合模型[14]:該模型通過引入Attention 機(jī)制,確保模型能夠?qū)W⒂跇?biāo)記本文中同一token 的多個(gè)實(shí)例之間的一致性。

    (3)XLNet-BiLSTM-CRF 模型[15]:該模型使用XLNet 預(yù)訓(xùn)練語言模型提取句子特征,然后將經(jīng)典神經(jīng)網(wǎng)絡(luò)模型與獲取的特征相結(jié)合,在公共醫(yī)療數(shù)據(jù)集上識(shí)別效果較好。

    (4)BERT-BiLSTM-CRF 模型:通過使用BERT替換上個(gè)模型中的XLNet 方法。與現(xiàn)有方法相比,該模型在英文生物醫(yī)學(xué)NER 任務(wù)中具有更好的表現(xiàn)[16]。

    2.6 結(jié)果分析

    對于不同的實(shí)體類型,各模型的實(shí)驗(yàn)結(jié)果見表4。由表4 可知,本文提出的MPNet-BiLSTM-CRF模型在大部分實(shí)體上表現(xiàn)較好,少數(shù)幾類實(shí)體上表現(xiàn)略遜于基于XLNet 的融合模型,但F1 值的差別不明顯。在所有模型的實(shí)驗(yàn)結(jié)果中,“Disease”、“Symptom”和“Severity”的F1 值較高,這是由于在摘要中這3 類實(shí)體結(jié)構(gòu)簡單且包含的信息種類較少,模型能夠充分學(xué)習(xí)這些文本的特征。通過分析另外幾種實(shí)體發(fā)現(xiàn),存在訓(xùn)練數(shù)據(jù)集較少導(dǎo)致過擬合現(xiàn)象,另外部分實(shí)體結(jié)構(gòu)復(fù)雜且出現(xiàn)次數(shù)少(例如為特定情況下COVID-19 防治選用的藥物、檢查或治療措施),導(dǎo)致模型難以充分提取其特征。在后續(xù)COVID-19 臨床試驗(yàn)摘要的NER 任務(wù)中,可以通過適量加入專業(yè)的英語語料庫來增加語義特征,從而優(yōu)化模型的識(shí)別能力。由表5 中展示的實(shí)驗(yàn)結(jié)果可知,在COVID-19臨床試驗(yàn)注冊數(shù)據(jù)集中,MPNet-BiLSTM-CRF 模型與其它4 種模型相比,整體的精確率、召回率和F1值都有所提高。經(jīng)典BiLSTM-CRF 模型實(shí)體識(shí)別的F1 值為69.42%,引入Attention 機(jī)制后的模型F1值提升了2.49%。注意力矩陣能夠計(jì)算當(dāng)前的目標(biāo)單詞與序列中所有單詞的相似性,通過權(quán)重矩陣為不同重要程度的單詞分配相應(yīng)的權(quán)重值,計(jì)算出文本的全局向量作為BiLSTM 輸出的加權(quán)和。對比ERT-BiLSTM-CRF 和Att-BiLSTM-CRF 模型,前者實(shí)驗(yàn)結(jié)果的3 項(xiàng)指標(biāo)均有提升,F(xiàn)1 值比后者提升了1.26%,說明BERT 預(yù)訓(xùn)練語言模型能更好地捕捉語義關(guān)系和單詞特征。BERT-BiLSTM-CRF 與XLNet-BiLSTM-CRF 模型相比,精確率分別是72.60%和74.57%,F(xiàn)1 值分別為73.17%和74.01%。相比之下,基于XLNet 的NER 模型效果略優(yōu)于BERT。而本文提出的MPNet-BiLSTM-CRF 融合模型與XLNet-BiLSTM-CRF 模型相比,F(xiàn)1 值提高了1.06%,通過使用融合了BERT 和XLNet 優(yōu)點(diǎn)的MPNet 預(yù)訓(xùn)練語言模型,增強(qiáng)了序列的特征表示,同時(shí)彌補(bǔ)了兩者的缺陷,從而提高了模型整體的識(shí)別能力。此外,MPNet 模型的識(shí)別能力提高后,速度并未有明顯下降,因此MPNet 作為詞嵌入層將具有更優(yōu)秀的表現(xiàn)。

    表4 不同實(shí)體類型的識(shí)別結(jié)果Tab.4 Identification results of different entity types

    表5 各模型整體對比結(jié)果Tab.5 Overall comparison results for each model %

    3 結(jié)束語

    本文提出了一種基于MPNet 和BiLSTM 的醫(yī)學(xué)實(shí)體識(shí)別模型,聯(lián)合BiLSTM 網(wǎng)絡(luò)適應(yīng)長文本特征提取和CRF 序列標(biāo)注方法,能適應(yīng)于COVID-19 臨床試驗(yàn)注冊文本中新興醫(yī)學(xué)實(shí)體的識(shí)別任務(wù)。實(shí)驗(yàn)設(shè)置了多組對比模型以驗(yàn)證本文方法的有效性,結(jié)果表明其識(shí)別性能優(yōu)于基準(zhǔn)模型以及近年來被廣泛研究的基于主流預(yù)訓(xùn)練模型的實(shí)體識(shí)別方法,并且能夠較好地實(shí)現(xiàn)COVID-19 相關(guān)臨床醫(yī)學(xué)實(shí)體的識(shí)別任務(wù),對醫(yī)學(xué)領(lǐng)域相關(guān)研究具有一定參考價(jià)值。本實(shí)驗(yàn)數(shù)據(jù)僅包含697 份臨床試驗(yàn)注冊記錄中的摘要文本,存在實(shí)體種類多但數(shù)量不均衡的問題,因此在接下來的工作中,將納入更多臨床文本來豐富語料庫,為挖掘COVID-19 臨床文本中隱含的醫(yī)學(xué)知識(shí)與臨床價(jià)值做準(zhǔn)備。

    猜你喜歡
    文本模型
    一半模型
    重要模型『一線三等角』
    初中群文閱讀的文本選擇及組織
    甘肅教育(2020年8期)2020-06-11 06:10:02
    重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
    在808DA上文本顯示的改善
    基于doc2vec和TF-IDF的相似文本識(shí)別
    電子制作(2018年18期)2018-11-14 01:48:06
    3D打印中的模型分割與打包
    文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學(xué)隱喻
    論《柳毅傳》對前代文本的繼承與轉(zhuǎn)化
    人間(2015年20期)2016-01-04 12:47:10
    FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
    亚洲av电影不卡..在线观看| av福利片在线观看| 亚洲精品一区蜜桃| 一级黄片播放器| 99九九线精品视频在线观看视频| 日韩制服骚丝袜av| 日韩av在线免费看完整版不卡| 久久久久免费精品人妻一区二区| 精品亚洲乱码少妇综合久久| 欧美3d第一页| 一本久久精品| 淫秽高清视频在线观看| 国产精品一及| 久久99蜜桃精品久久| 九九在线视频观看精品| 天堂网av新在线| 亚洲精品国产av蜜桃| 人妻少妇偷人精品九色| 嫩草影院入口| 亚洲国产欧美在线一区| 亚洲成人精品中文字幕电影| 永久免费av网站大全| 成人亚洲欧美一区二区av| 日韩欧美一区视频在线观看 | 一级毛片 在线播放| 插逼视频在线观看| 99久久九九国产精品国产免费| 观看免费一级毛片| 婷婷色av中文字幕| 午夜精品在线福利| 亚洲国产精品成人综合色| 亚洲欧洲日产国产| 日韩不卡一区二区三区视频在线| 蜜臀久久99精品久久宅男| 男的添女的下面高潮视频| 日韩,欧美,国产一区二区三区| av专区在线播放| 内地一区二区视频在线| 久热久热在线精品观看| 国产视频内射| 在线免费十八禁| 久久久久网色| 日本欧美国产在线视频| 国产精品久久久久久av不卡| 国精品久久久久久国模美| 国产亚洲午夜精品一区二区久久 | 婷婷色麻豆天堂久久| 亚洲av中文av极速乱| 亚洲国产高清在线一区二区三| 亚洲最大成人中文| 久久久精品免费免费高清| 午夜视频国产福利| 天堂影院成人在线观看| 高清在线视频一区二区三区| 91精品国产九色| 女人被狂操c到高潮| 韩国高清视频一区二区三区| 亚洲精品日本国产第一区| 日日摸夜夜添夜夜爱| 青青草视频在线视频观看| 久久久久久久午夜电影| av免费在线看不卡| 日韩制服骚丝袜av| 男人舔女人下体高潮全视频| 国产乱人视频| 免费观看在线日韩| 免费大片黄手机在线观看| 一个人看视频在线观看www免费| 中文资源天堂在线| 亚洲精品一二三| 午夜免费男女啪啪视频观看| 国产精品人妻久久久久久| 小蜜桃在线观看免费完整版高清| 小蜜桃在线观看免费完整版高清| 午夜免费男女啪啪视频观看| 国产精品不卡视频一区二区| 久久久精品免费免费高清| 少妇的逼水好多| 午夜精品一区二区三区免费看| 最近最新中文字幕大全电影3| 精品亚洲乱码少妇综合久久| 中文字幕亚洲精品专区| 丝瓜视频免费看黄片| 丝袜喷水一区| 大又大粗又爽又黄少妇毛片口| 中文字幕久久专区| 精品久久久噜噜| 97超碰精品成人国产| 国产欧美日韩精品一区二区| 观看免费一级毛片| 男女那种视频在线观看| 国产一区有黄有色的免费视频 | 少妇高潮的动态图| 看十八女毛片水多多多| 一个人看的www免费观看视频| 亚洲色图av天堂| 国内精品一区二区在线观看| 成年版毛片免费区| 久久精品国产亚洲av涩爱| 欧美激情久久久久久爽电影| 看十八女毛片水多多多| 全区人妻精品视频| 免费观看在线日韩| 永久网站在线| 纵有疾风起免费观看全集完整版 | 日韩大片免费观看网站| 热99在线观看视频| 男女下面进入的视频免费午夜| 美女国产视频在线观看| 久久久成人免费电影| 亚洲综合色惰| 日韩av免费高清视频| 激情五月婷婷亚洲| 激情 狠狠 欧美| 视频中文字幕在线观看| 丝袜美腿在线中文| 一区二区三区免费毛片| 午夜福利视频1000在线观看| 老司机影院成人| 好男人在线观看高清免费视频| 亚洲成人久久爱视频| 如何舔出高潮| 亚洲精品一区蜜桃| 久热久热在线精品观看| 麻豆av噜噜一区二区三区| 午夜福利成人在线免费观看| 晚上一个人看的免费电影| 精品亚洲乱码少妇综合久久| 黄色欧美视频在线观看| 成人午夜精彩视频在线观看| 少妇的逼水好多| 内射极品少妇av片p| 久久久久久久久久人人人人人人| 99视频精品全部免费 在线| 国产有黄有色有爽视频| 日韩欧美 国产精品| 日韩欧美精品v在线| 免费av毛片视频| 丰满人妻一区二区三区视频av| 午夜激情久久久久久久| 欧美性感艳星| 免费观看性生交大片5| 久久久久九九精品影院| 国产人妻一区二区三区在| 三级国产精品片| 国产亚洲一区二区精品| 中文在线观看免费www的网站| 久久精品久久久久久久性| 久久精品久久久久久久性| av线在线观看网站| 国产亚洲av片在线观看秒播厂 | 天天一区二区日本电影三级| 国产黄片美女视频| 夜夜看夜夜爽夜夜摸| 男女啪啪激烈高潮av片| 亚洲精品日韩av片在线观看| eeuss影院久久| 菩萨蛮人人尽说江南好唐韦庄| 高清日韩中文字幕在线| 日韩强制内射视频| 久久99热这里只频精品6学生| 久久国内精品自在自线图片| 成年免费大片在线观看| 日日啪夜夜爽| 午夜视频国产福利| 国产成人精品福利久久| 日本-黄色视频高清免费观看| 国产精品综合久久久久久久免费| 日韩欧美精品v在线| 美女大奶头视频| av免费在线看不卡| 男女国产视频网站| 欧美成人一区二区免费高清观看| 人妻少妇偷人精品九色| 亚洲国产精品国产精品| 联通29元200g的流量卡| 久久亚洲国产成人精品v| 国产精品1区2区在线观看.| 日本黄大片高清| 久久99蜜桃精品久久| 最近最新中文字幕免费大全7| 亚洲欧洲日产国产| 亚洲国产精品成人综合色| 亚洲av免费高清在线观看| 国产片特级美女逼逼视频| 日本黄色片子视频| 国产高清三级在线| av在线亚洲专区| 久久久久久久久久人人人人人人| 国产乱人视频| 国产真实伦视频高清在线观看| 国产亚洲91精品色在线| 日韩成人av中文字幕在线观看| 久久久色成人| 简卡轻食公司| 特大巨黑吊av在线直播| 国产成人a区在线观看| 亚洲欧美成人精品一区二区| 一级毛片黄色毛片免费观看视频| 2022亚洲国产成人精品| 美女国产视频在线观看| 在线观看美女被高潮喷水网站| 精品久久久久久久末码| 亚洲国产精品成人久久小说| 免费看日本二区| 啦啦啦韩国在线观看视频| 久久久久国产网址| 国内少妇人妻偷人精品xxx网站| 久久精品国产自在天天线| 亚洲一级一片aⅴ在线观看| 少妇裸体淫交视频免费看高清| 五月天丁香电影| 久久久久久久国产电影| 亚洲欧美成人精品一区二区| 插逼视频在线观看| 国产黄频视频在线观看| 国产精品久久久久久精品电影| 我要看日韩黄色一级片| 精品欧美国产一区二区三| 欧美成人午夜免费资源| 国产精品不卡视频一区二区| 一级毛片黄色毛片免费观看视频| 欧美不卡视频在线免费观看| 伊人久久国产一区二区| 亚洲欧美一区二区三区黑人 | 亚洲国产欧美人成| 深爱激情五月婷婷| 亚洲av免费高清在线观看| 女的被弄到高潮叫床怎么办| 精品久久久噜噜| 岛国毛片在线播放| 亚洲精品自拍成人| 日日撸夜夜添| 国产综合精华液| 一本一本综合久久| 一级av片app| 日本一本二区三区精品| 内射极品少妇av片p| 大陆偷拍与自拍| ponron亚洲| 中文欧美无线码| 免费不卡的大黄色大毛片视频在线观看 | 全区人妻精品视频| 美女大奶头视频| 黑人高潮一二区| 最近中文字幕高清免费大全6| 午夜爱爱视频在线播放| 亚洲av电影不卡..在线观看| 国产日韩欧美在线精品| 夫妻性生交免费视频一级片| 自拍偷自拍亚洲精品老妇| 亚洲精品成人久久久久久| 国产成人91sexporn| 精品久久国产蜜桃| 免费观看无遮挡的男女| 亚洲最大成人手机在线| 国产v大片淫在线免费观看| 中文字幕久久专区| www.av在线官网国产| 神马国产精品三级电影在线观看| 99热网站在线观看| 综合色av麻豆| 久久久久精品性色| 午夜久久久久精精品| av在线亚洲专区| av.在线天堂| 亚洲综合色惰| 亚洲婷婷狠狠爱综合网| 国产单亲对白刺激| 美女被艹到高潮喷水动态| 精品不卡国产一区二区三区| 日韩欧美精品v在线| 免费看美女性在线毛片视频| 少妇熟女欧美另类| 国产大屁股一区二区在线视频| 日韩,欧美,国产一区二区三区| freevideosex欧美| 久久久成人免费电影| 91久久精品国产一区二区成人| 超碰97精品在线观看| 国产伦精品一区二区三区四那| 国产老妇女一区| 久久99热这里只有精品18| 18禁在线播放成人免费| 免费在线观看成人毛片| 亚洲人成网站高清观看| 白带黄色成豆腐渣| 97人妻精品一区二区三区麻豆| 激情五月婷婷亚洲| 精品人妻熟女av久视频| 成人综合一区亚洲| 欧美日韩一区二区视频在线观看视频在线 | 精品久久久精品久久久| 成人二区视频| 色5月婷婷丁香| 亚洲欧美精品专区久久| or卡值多少钱| 麻豆成人午夜福利视频| 国产在视频线在精品| 久久鲁丝午夜福利片| 免费高清在线观看视频在线观看| 日韩av免费高清视频| 午夜福利视频1000在线观看| 伊人久久国产一区二区| 高清视频免费观看一区二区 | 深爱激情五月婷婷| 中文乱码字字幕精品一区二区三区 | 成人午夜精彩视频在线观看| 国产老妇女一区| 精品久久久久久久久亚洲| 在线观看美女被高潮喷水网站| 在线免费十八禁| 联通29元200g的流量卡| 夫妻性生交免费视频一级片| eeuss影院久久| 91精品伊人久久大香线蕉| 三级国产精品片| 色5月婷婷丁香| 在线观看av片永久免费下载| 国产成人精品婷婷| 毛片一级片免费看久久久久| 久久久久性生活片| 日韩电影二区| 肉色欧美久久久久久久蜜桃 | 亚洲精品久久久久久婷婷小说| 日韩中字成人| 成人午夜高清在线视频| 亚洲精品中文字幕在线视频 | 成人av在线播放网站| 直男gayav资源| 国产黄片美女视频| 又大又黄又爽视频免费| 激情 狠狠 欧美| 春色校园在线视频观看| 狠狠精品人妻久久久久久综合| 色5月婷婷丁香| 国产欧美日韩精品一区二区| 国产在线男女| .国产精品久久| 最新中文字幕久久久久| 美女xxoo啪啪120秒动态图| 亚洲人与动物交配视频| 最近最新中文字幕大全电影3| 老司机影院毛片| 亚洲精品成人久久久久久| 亚洲欧洲日产国产| 水蜜桃什么品种好| 国产欧美日韩精品一区二区| 熟女电影av网| 精品一区二区免费观看| 一区二区三区四区激情视频| 天堂俺去俺来也www色官网 | 精品少妇黑人巨大在线播放| av播播在线观看一区| 国产亚洲午夜精品一区二区久久 | 能在线免费看毛片的网站| 中文字幕亚洲精品专区| 国产探花极品一区二区| 国产极品天堂在线| 淫秽高清视频在线观看| 麻豆乱淫一区二区| 白带黄色成豆腐渣| 搡女人真爽免费视频火全软件| 欧美成人一区二区免费高清观看| 国产成人a区在线观看| 男的添女的下面高潮视频| 国产精品一区二区三区四区久久| 国产精品熟女久久久久浪| 日本一本二区三区精品| 三级国产精品欧美在线观看| 国产一区亚洲一区在线观看| 婷婷色综合www| 亚洲在线自拍视频| 午夜福利网站1000一区二区三区| 最近最新中文字幕免费大全7| 在现免费观看毛片| 中文字幕久久专区| 日韩av在线免费看完整版不卡| 少妇的逼好多水| 久99久视频精品免费| 18+在线观看网站| 国产精品福利在线免费观看| 久久6这里有精品| 亚洲天堂国产精品一区在线| 亚洲第一区二区三区不卡| 又粗又硬又长又爽又黄的视频| 麻豆成人午夜福利视频| 亚洲国产日韩欧美精品在线观看| 日日啪夜夜撸| 69人妻影院| 天堂影院成人在线观看| 国产女主播在线喷水免费视频网站 | 超碰av人人做人人爽久久| 国产v大片淫在线免费观看| 成人亚洲精品一区在线观看 | 成人无遮挡网站| 尤物成人国产欧美一区二区三区| 成年女人看的毛片在线观看| 国产亚洲午夜精品一区二区久久 | 午夜福利在线观看吧| 最近最新中文字幕大全电影3| 国产精品一区二区性色av| 麻豆国产97在线/欧美| 日韩一区二区三区影片| 一个人看视频在线观看www免费| 成人国产麻豆网| 国语对白做爰xxxⅹ性视频网站| 免费人成在线观看视频色| 免费高清在线观看视频在线观看| 亚洲欧美日韩卡通动漫| 国产乱人偷精品视频| 国产一级毛片七仙女欲春2| 国产精品爽爽va在线观看网站| 国产一级毛片在线| 欧美日韩综合久久久久久| 高清av免费在线| 91精品国产九色| 你懂的网址亚洲精品在线观看| 亚洲国产欧美人成| 午夜福利成人在线免费观看| 精品国产一区二区三区久久久樱花 | 九九久久精品国产亚洲av麻豆| 99久国产av精品国产电影| 91狼人影院| 国产精品一及| 久久久久性生活片| 精品不卡国产一区二区三区| 国产亚洲午夜精品一区二区久久 | 亚洲成人一二三区av| .国产精品久久| 色哟哟·www| 99热这里只有精品一区| 中文字幕av成人在线电影| 免费观看无遮挡的男女| 成人综合一区亚洲| 亚洲欧美精品专区久久| 丰满少妇做爰视频| 啦啦啦韩国在线观看视频| 久久国产乱子免费精品| 在线 av 中文字幕| 精品少妇黑人巨大在线播放| 爱豆传媒免费全集在线观看| 天堂俺去俺来也www色官网 | 黄片wwwwww| 在线 av 中文字幕| 久久久久国产网址| 久久人人爽人人爽人人片va| 又爽又黄无遮挡网站| 欧美日韩亚洲高清精品| 女人十人毛片免费观看3o分钟| 免费黄频网站在线观看国产| 中文欧美无线码| 国产精品嫩草影院av在线观看| 特级一级黄色大片| 国产男人的电影天堂91| 婷婷色av中文字幕| 亚洲欧美精品自产自拍| 欧美性猛交╳xxx乱大交人| 国产大屁股一区二区在线视频| 只有这里有精品99| 国产亚洲av嫩草精品影院| 中文字幕av在线有码专区| 国产伦精品一区二区三区视频9| 国产片特级美女逼逼视频| 黄色配什么色好看| 麻豆国产97在线/欧美| 欧美日韩亚洲高清精品| 欧美日韩一区二区视频在线观看视频在线 | 午夜精品一区二区三区免费看| 少妇人妻一区二区三区视频| 婷婷色综合www| 看免费成人av毛片| 男女边吃奶边做爰视频| 在线观看人妻少妇| 少妇人妻一区二区三区视频| 亚洲va在线va天堂va国产| 国产精品人妻久久久久久| 亚洲精品色激情综合| 嘟嘟电影网在线观看| 中文欧美无线码| 在线免费观看不下载黄p国产| 高清午夜精品一区二区三区| 18禁在线播放成人免费| 青春草视频在线免费观看| 精品久久久久久电影网| 久久99热6这里只有精品| 国产精品久久久久久久电影| 日本av手机在线免费观看| 可以在线观看毛片的网站| 精品一区二区免费观看| 麻豆精品久久久久久蜜桃| 亚洲色图av天堂| 国产精品爽爽va在线观看网站| 老师上课跳d突然被开到最大视频| 中文欧美无线码| 免费观看的影片在线观看| 国产成人精品福利久久| 激情 狠狠 欧美| 精品久久久噜噜| 七月丁香在线播放| 久久精品久久久久久久性| 麻豆久久精品国产亚洲av| 亚洲高清免费不卡视频| 91狼人影院| 国产精品日韩av在线免费观看| 国产综合懂色| 在线观看一区二区三区| 51国产日韩欧美| 夜夜看夜夜爽夜夜摸| 在线观看免费高清a一片| 久久久久免费精品人妻一区二区| 欧美精品国产亚洲| 日本三级黄在线观看| 深夜a级毛片| 97精品久久久久久久久久精品| 美女脱内裤让男人舔精品视频| 卡戴珊不雅视频在线播放| 久久久久免费精品人妻一区二区| 亚洲18禁久久av| 99久久人妻综合| 黄片wwwwww| 国产成人aa在线观看| 夜夜看夜夜爽夜夜摸| 国产精品久久久久久av不卡| 少妇熟女aⅴ在线视频| 青青草视频在线视频观看| 成人欧美大片| 国产av不卡久久| 久久久a久久爽久久v久久| 久久99热这里只有精品18| 午夜精品国产一区二区电影 | 可以在线观看毛片的网站| 高清日韩中文字幕在线| 亚洲美女搞黄在线观看| 亚洲成人中文字幕在线播放| 人妻系列 视频| 亚洲真实伦在线观看| 好男人在线观看高清免费视频| 九九在线视频观看精品| 好男人视频免费观看在线| 不卡视频在线观看欧美| 听说在线观看完整版免费高清| 99久久精品一区二区三区| 亚洲精品色激情综合| 天堂影院成人在线观看| 男女下面进入的视频免费午夜| 超碰97精品在线观看| 2022亚洲国产成人精品| 51国产日韩欧美| 边亲边吃奶的免费视频| 免费观看的影片在线观看| 亚洲av二区三区四区| 男女视频在线观看网站免费| 内射极品少妇av片p| 亚洲av电影在线观看一区二区三区 | 一区二区三区免费毛片| 少妇高潮的动态图| 69人妻影院| 久久久久久久久久成人| 91久久精品国产一区二区三区| 成年女人在线观看亚洲视频 | 一本—道久久a久久精品蜜桃钙片 精品乱码久久久久久99久播 | 亚洲av男天堂| 国产单亲对白刺激| 亚洲av国产av综合av卡| 国产成人aa在线观看| 全区人妻精品视频| 69av精品久久久久久| 国产精品99久久久久久久久| 欧美一区二区亚洲| 日日摸夜夜添夜夜添av毛片| 亚洲国产欧美人成| 久久久久久久亚洲中文字幕| 国产成人免费观看mmmm| av黄色大香蕉| 我的女老师完整版在线观看| 国产综合懂色| 国产精品人妻久久久影院| 亚洲人成网站高清观看| 国产成人91sexporn| 国产在视频线在精品| 99热网站在线观看| 国产综合懂色| 丰满人妻一区二区三区视频av| 国产大屁股一区二区在线视频| 亚洲av男天堂| 国产 一区 欧美 日韩| 日韩欧美三级三区| 极品少妇高潮喷水抽搐| 国产精品一及| 国产高清三级在线| 国产精品一区二区三区四区久久| 久久久久久久亚洲中文字幕| 国产一区亚洲一区在线观看| 夜夜爽夜夜爽视频| 色哟哟·www| 久久久精品免费免费高清| 狂野欧美激情性xxxx在线观看| 午夜视频国产福利| 搡老乐熟女国产| 国产成人一区二区在线| 久久97久久精品| 免费无遮挡裸体视频| 一个人观看的视频www高清免费观看| 久久久久久久久久久免费av| 天天躁日日操中文字幕| 少妇高潮的动态图| 视频中文字幕在线观看| 欧美潮喷喷水| 亚洲一级一片aⅴ在线观看| 久热久热在线精品观看| 亚洲激情五月婷婷啪啪| 久久国内精品自在自线图片| 黄色一级大片看看| 亚洲精品久久午夜乱码|