• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    中文醫(yī)療實體的弱監(jiān)督識別方法

    2020-07-28 02:40:24趙青王丹徐書世張曉桐王曉曦
    哈爾濱工程大學學報 2020年3期
    關鍵詞:字符命名本體

    趙青,王丹,徐書世,張曉桐,王曉曦

    (1.北京工業(yè)大學 信息學部,北京 100124; 2.紐約州立大學 賓哈姆頓大學,紐約 13902; 3.國家電網(wǎng)管理學院,北京 102200)

    醫(yī)療電子病歷(electronic medical records, EMR)目前已經(jīng)成為實施疾病治療和醫(yī)療保健的基礎,它包含了大量與患者相關的病程記錄,因此被廣泛地應用于各個醫(yī)療保健相關的領域[1]。調(diào)查發(fā)現(xiàn),接近83%的醫(yī)生表示他們目前都在使用EMR系統(tǒng)或者準備使用[2]。在與EMR相關的語義信息挖掘任務中,命名實體識別(named entity recognition, NER)是基礎,也是至關重要的一個步驟,例如:知識圖譜構建[3]、文本檢索[4]、文本分類[5]和信息抽取[6]等領域中都需要識別命名實體。

    命名實體識別可以看作是一個序列標注任務[7-8],通過提取出來的信息來查找實體并將其分為一組固定的類別。傳統(tǒng)實現(xiàn)NER的2種方法是基于規(guī)則的學習方法和有監(jiān)督的學習方法,其中有監(jiān)督的學習方法占主導地位。基于規(guī)則學習的解決方法是假設可用的訓練數(shù)據(jù)已全部標記(即所有包含在文檔中的實體都被標記)的前提下,再從文檔中找到候選實體的標簽序列。

    目前,中文醫(yī)療領域的命名實體識別問題依然面臨很多挑戰(zhàn),主要原因如下:1)醫(yī)療電子病歷中大部分是半結構或非結構化的數(shù)據(jù),并且很多信息是敘述性的,無結構信息,不適用于單純利用語法結構上下文特征進行醫(yī)療概念的發(fā)現(xiàn)和抽取;2)醫(yī)學術語通常具有模糊性和表達不一致的特點,例如:“慢性阻塞性肺疾病”也可以縮寫為COPD(chronic obstructive pulmonary disease),這會造成特征維度高、計算量大;3)需要大量人工標注的語料庫作為訓練集,且大多數(shù)傳統(tǒng)NER方法是通過詞向量來提取特征的,這在中文醫(yī)療文本中會導致部分語義信息割裂,并且數(shù)據(jù)量越大消耗的人工標注量就越多,因此很難在現(xiàn)實中得到廣泛應用。

    近年來,深度學習因其在圖像處理、音頻識別、自然語言處理等領域的優(yōu)異表現(xiàn)吸引了大量的關注,表現(xiàn)了其良好的圖像、音頻的特征信息抽取能力,同時在NLP(natural language processing)領域的應用也越來越多[9-10]。深度學習的主要特點是通過其自身的深層網(wǎng)絡結構來自主地學習更深層的特征及規(guī)律,因此可以大大減輕人工標注的時間,并且具有較強的魯棒性和泛化性。其中循環(huán)神經(jīng)網(wǎng)絡(recurrent neural network, RNN)是一個序列模型,它具有時序記憶的特點,能夠考慮詞與詞之間的順序,從而能將詞與詞之間的語義聯(lián)系體現(xiàn)出來,因此可以較好地應用于序列標注的任務中。目前,深度學習在NER任務中的應用并不少見,但大多數(shù)是關于英文醫(yī)療領域的,在中文領域中的成果尚不多見,仍需學者們不斷研究和擴展。

    針對以上問題,本文提出了一種結合醫(yī)療本體語義知識和標注數(shù)據(jù)集的弱監(jiān)督方法來處理訓練語料標注不全的NER任務。首先,基于現(xiàn)有的醫(yī)療本體提取語義特征,并在語義特征的基礎上提取字符特征,再利用RNN模型時序記憶的特點來提取命名實體相關的上下文信息,并將提取的特征作為訓練模型RNN的輸入,最后通過softmax獲得中文醫(yī)療文本中的標簽序列。1)結合醫(yī)療領域廣泛存在的醫(yī)療本體進行醫(yī)療文本的語義概念特征抽取,將其與現(xiàn)有的詞與字向量特征進行融合在一起,通過基于RNN的弱監(jiān)督學習方法進行命名實體識別,提高了中文醫(yī)療命名實體識別的準確率。2)基于某醫(yī)院真實臨床文本數(shù)據(jù)集進行了實驗驗證,將本文提出的基于語義特征融合的弱監(jiān)督學習方法與現(xiàn)有概念實體識別方法進行了性能對比,對實驗結果進行了分析與討論。

    在1996年的MUC-6會議上命名實體首次被提后,NER在英文領域的應用逐漸成熟?,F(xiàn)有的大多數(shù)NER工作是基于假設沒有領域本體知識的情況下,主要通過標注的訓練集來學習。例如Li等[11]訓練了條件隨機場(conditional random fields, CRF)和支持向量機(support vector machines, SVM)2種分類模型。結果表明,CRF的性能比SVM高。Lei等[12]構建并對比了CRF、SVM、最大熵馬爾可夫(MEMM)和結構化的支持向量機(SSVM)4種模型,并在醫(yī)療數(shù)據(jù)集中對4類實體進行了實體識別,其中SSVM的準確率最高。何林娜等[13]提出了一種基于特征耦合泛化(feature coupling generalization,F(xiàn)CG)的實體識別方法并結合CRF來自動的識別醫(yī)療文獻中的藥物名稱。

    雖然CRF在大多數(shù)NER任務上都取得了較高的準確率,但是該方法的特征選擇過程較為繁瑣,隨著特征的增多模型會變得尤為復雜,從而造成召回率的急劇下降,可移植性差。近年來,基于深度學習的NER工作也相繼展開。Guillaume等[14]提出了一種基于長短時記憶網(wǎng)絡(long short term memory, LSTM)和CRF結合的命名實體識別方法,用來識別英文人名、地名等實體。Dong等[15]提出了利用卷積神經(jīng)網(wǎng)絡(convolutional neural networks, CNN)進行特征提取的方法來進行命名實體識別。Li等[16]使用RNN并結合詞字特征來構建醫(yī)療領域的命名實體識別模型。楊培等[17]提出了一種基于字詞特征并結合注意力機制的實體識別方法,該方法通過神經(jīng)網(wǎng)絡LSTM來訓練實體識別分類器,并采用CRF產(chǎn)生最后的實體標簽分類結果。

    顯然,通過這些方法獲得的命名實體識別分類器的知識僅來源于作為訓練集的標注語料庫,從而造成其性能對大規(guī)模充分標注的數(shù)據(jù)有很強的依賴性。本文的工作充分考慮醫(yī)療領域大量醫(yī)療本體存在的事實和中文醫(yī)療文本自身的特點,通過從已有的醫(yī)療本體中獲取部分命名實體知識并與訓練集中已標注的知識相結合來進行序列學習分類器的構建,有效提高了準確率。

    1 基于多粒度特征融合的命名實體識別方法

    本文提出的基于循環(huán)神經(jīng)網(wǎng)絡的語義和字符向量結合的命名實體識別模型整體結構,如圖1所示。

    圖1 基于RNN的語義和字符向量相結合的命名實體識別模整體結構Fig.1 The model architecture of combining semantic and character embedding based on RNN

    1.1 特征提取

    1.1.1 語義向量特征表示

    語義特征包含概念特征和詞特征2個部分。其中,概念是指由多個包含語義的單獨詞匯組成的一個特殊的領域術語,例如,慢性阻塞性肺疾病。詞是指一個單獨的語義詞匯,例如,困難。本文對于那些能夠從領域本體里映射出概念的,就提取概念特征;對那些不能提取概念的直接提取詞特征,最后通過CBOW(continuous bag-of-words model)模型提取語義特征。

    1)概念特征表示。

    由于醫(yī)療術語通常是由多個詞組成,僅考慮詞特征會使語義信息割裂,因此在本文的方法中加入了概念特征。首先,將所有稀疏標記的語料庫根據(jù)特殊符號切分成較短的漢子字符串(包括標點符號、數(shù)字和空格符)并去除停用詞;其次,將預處理后的字符串映射在構建好的醫(yī)療本體中,通過最大匹配法來提取本體中的概念;最后,采用一種基于本體計算概念特征相似度的方法來降低語義特征的維度,從而減少計算量。具體流程如算法1所示。

    算法1概念特征提取

    輸入:數(shù)據(jù)集D(包含已標注數(shù)據(jù)集和未標注數(shù)據(jù)集),本體O;

    輸出:概念特征。

    1)進行概念特征提??;

    2)通過特殊符號將數(shù)據(jù)集D切分為漢字字符串L,L=(L1,L2,…,Ln);

    3)將字符串L映射到本體O;

    4)For 匹配字符串L中的每一個字符;

    5)如果Lmax=Llen(Lmax為字符串的最大初始匹配長度,Llen為字符串的長度);

    6) 則字符串整體為一個概念;

    7) 如果Lmax

    則i=1 (i為字符串中字符的位置);

    8) 如果L1

    9) 則i=i+1;

    10)直到匹配到Li=Lmax,

    11)End for

    12) 將Lmax從L中抽取出來,并將Lmax的左右兩邊分為2個新的待切分字符串。

    2)詞特征表示。

    將詞輸入到模型中是深度學習方法在處理NLP任務時的首要步驟,因為它能夠從大量已標注和未標注的數(shù)據(jù)中學習到有用的語義和語法信息。傳統(tǒng)的機器學習方法通常采用詞袋模型(bag of words)表示詞向量特征。例如,One-hot Representation[18],該模型在處理離散數(shù)據(jù)時有一定的優(yōu)勢,但是它沒有考慮詞與詞之間的順序,因此,不能很好地體現(xiàn)出詞與詞之間的語義聯(lián)系,不適用于實體識別這樣的序列標注任務;其次,隨著數(shù)據(jù)量的增大,特征維度將會呈現(xiàn)爆炸式增長,會給后期的運算帶來很大的壓力。與高維、稀疏的詞袋模型相比,分布式詞向量表示具有低維,密集的特點更適用于實體識別任務。

    目前常用的分布式詞向量表示模型有word2vec[19]和GolVe[20]等,本文采用word2vec中的CBOW模型來提取語義特征。CBOW的訓練目標使平均對數(shù)的概率最大化:

    (1)

    式中:K為數(shù)據(jù)集D中目標詞的上下文信息;yi為數(shù)據(jù)集D中的語義。

    1.1.2 字符向量特征表示

    字符是中文中最自然的語言單位[21],與詞不同,字符主要關注的是詞語拼寫的特點而不是詞語本身的語義。由于中文不間斷的書寫特性,字符向量也能夠表達詞語的語義信息,例如:“瘦弱”一詞,既可以根據(jù)上下文來判斷該詞的語義特征,也可以通過該詞的字符“瘦”和“弱”來直接判斷語義。因此,在中文命名實體識別的任務中,字符向量不僅可以輔助判斷語義特征還可以通過字意達到預測新詞的效果。

    本文采用CEW[22](character-enhanced word embeddding)模型來學習字符特征并結合語義特征一起進行訓練。該模型在word2vec的CBOW模型的基礎上進行了改進。結合語義向量和字符向量的CWE模型具體的計算方式為:

    (2)

    式中:yi為語義Yi的語義向量;zk為yn中第k個字符向量;yn為語義Yi所包含的字符個數(shù);Qi由語義向量和其平均字符向量組合運算得出。

    組合運算?有2個運算方式:相加或者結合計算。相加就是將語義向量和字符向量的平均值相加,其中語義向量和字符向量位數(shù)相等,如|yi|=|zk|。另一方面,也可以通過結合的方式,詞向量和字符向量的平均值相加得到Qi,并且Qi的向量維度為|yi|+|zk|。通過實驗證明,2種運算方法的性能差別不大,但在效率方面,相對于結合運算方法的維度高、復雜性大的特點,加法的運算效率更高。因此,本文采用了相加的運算方法來提取字符向量:

    (3)

    1.2 基于RNN的弱監(jiān)督實體識別模型

    循環(huán)神經(jīng)網(wǎng)絡(RNN)[23]是一個序列模型,每個神經(jīng)元不僅能夠沿層間向上傳遞信息,還可以傳輸給下一個序列,因此比其他的神經(jīng)網(wǎng)絡更適用于序列標注的任務。RNN具有一個隱藏單元,即:

    ht=σ(Wxt+Uht-1+b)

    (4)

    式中:ht為t時刻的輸出,由輸入xt在t-1時刻的ht-1隱藏單元一起決定;σ為激活函數(shù),例如sigmoid、tanch或者ReLU (rectified liner unit)等;W、U為權重向量;b為偏差向量。

    理論上,RNN是可以處理任意長度的序列標注任務。然而,實驗表明:由于RNN的存儲記憶功能過于簡單,隨著序列長度的增加會產(chǎn)生梯度消失或者梯度爆炸的問題,因此RNN不能夠學習與當前時刻較遠的信息。為了解決這個問題,LSTM和GRU (gate recurrent unit) 模型被相繼提出。

    長短時記憶網(wǎng)絡(LSTM)在1997年被Hochreiter和Schmidhuber提出,主要為了解決RNN的梯度消失問題[24]。LSTM能夠處理無界任意長度的順序輸入,并返回輸入中每個步驟的序列信息。相對于傳統(tǒng)的RNN模型,LSTM可以處理長期依賴的問題,在每個時刻步驟中都包含了控制門(輸入門、遺忘門和輸出門),允許網(wǎng)絡忘記、記憶和更新上下文記憶,并減輕了梯度消失等問題。

    (5)

    (6)

    ht=ot⊙g(ct)

    (7)

    it=σ(Wixt+Uiht-1+bi)

    (8)

    ft=σ(Wfxt+Ufht-1+bf)

    (9)

    ot=σ(Woxt+Uoht-1+bo)

    (10)

    式中:it、ft、ot分別為時間節(jié)點t的輸入、遺忘、輸出門;σ為非線性函數(shù)。每一個控制門的參數(shù)都由2個矩陣和1個偏差向量組成,因此,3個控制門的矩陣參數(shù)分別為Wi、Ui、Wf、Uf、Wo、Uo,偏差參數(shù)為bi、bf、bo。LSTM的記憶單元參數(shù)分別為Wc、Uc和bc。這些參數(shù)在訓練和儲存時的每一步都進行更新。

    門控神經(jīng)網(wǎng)絡(GRU)與LSTM的目標一樣,都是為了解決RNN長期記憶和反向傳播中的梯度消失或者爆炸問題。不同的是,GRU將LSTM中3個控制門整合為更新門和重置門[25]。GRU的整體結構為:

    (11)

    (12)

    zt=σ(Wzxt+Uzht-1+bz)

    (13)

    rt=σ(Wrxt+Urht-1+br)

    (14)

    式(13)和式(14)分別代表GRU的2個控制門,其中zt代表更新門,rt代表重置門。GRU降低了LSTM的模型結構的復雜度,并且減少了訓練參數(shù)從而降低訓練難度,因此,GRU也是當前神經(jīng)網(wǎng)絡中流行的算法。本文同樣采取雙向GRU(BGRU)來獲得與當前時刻相關的上下文信息。

    如圖1所示,本文的模型采用了深度學習模型RNN并結合了語義特征和字符特征,將現(xiàn)有的醫(yī)療本體與訓練集相結合來獲取命名實體知識。由于醫(yī)療術語大多是由多個詞組成,僅考慮詞特征會造成語義信息割裂,因此首先基于本體提取概念特征,對于不能提取概念特征的直接進提取詞特征,概念特征和詞特征統(tǒng)稱為語義特征。

    由于在中文中,大部分字符本身就含有一些語義信息,例如:疼痛,即使該詞在訓練預料庫里從未出現(xiàn)過,也可以根據(jù)該詞的字面信息“疼”和“痛”來判斷語義,因此在語義特征的基礎上提取了字符特征。對于因醫(yī)療術語表達不一致所造成的特征維度高、計算量大的問題,本文通過一種基于本體計算概念特征相似度的方法來降低語義特征的維度,以而減少計算量。

    本方法的主要目的是通過提取不同粒度的文本特征來提高命名實體識別的準確率。整體流程如算法2所示。

    算法2基于RNN的弱監(jiān)督實體識別

    輸入:數(shù)據(jù)集D(包含已標注數(shù)據(jù)集和未標注數(shù)據(jù)集),本體O;

    輸出:命名實時識別的預測標簽。

    1) For 對于切分好的語義集(包含概念集和詞集){G1,G2,…,GN}∪{C1,C2,…,CN}∈Y;

    3) End For

    4) For對于每一個語義特征

    yi∈(y1,y2,…,yn)提取字符特征

    6) End For

    7) 將融合字符特征的語義特征映射到本體O;

    8) If 有概念特征gi和gk對應本體概念oi∈O;

    9) 通過余弦相似度計算gi和gk到本體概念oi的相似度距離;

    10) Else If 小于相似度閾值α;

    11)gi和gk分別為本體中的一個獨立概念(α的取值范圍在0.82~0.92,由于實驗中α為0.87時誤差最小,因此設為0.87);

    12) Else If大于相似度閾值α;

    13) 認為yj和yk為同一個概念;

    14) 初始化:RNN訓練模型。

    其中,1)、2)為CBOW的語義特征提取,4)、5)為用CEW的方法提取字符特征,7)、13)為基于本體計算概念特征相似度的方法來降低語義特征的維度,14)為啟用RNN相關模型來進行實體標簽預測。

    2 實驗和結果

    2.1 數(shù)據(jù)集和參數(shù)設置

    本文采用了合作醫(yī)院的真實數(shù)據(jù)集,共15 589份電子病歷,包含普通外科、內(nèi)科等17類疾病。每份病歷包含入院、出院、病程3分記錄,由主訴、既往史、檢查、治療手段4部分組成。表1為電子醫(yī)療病歷數(shù)據(jù)集的構成。

    表1 電子醫(yī)療病歷語料庫的統(tǒng)計Table 1 Statistics of EMR corpus

    實驗中將電子醫(yī)療病歷數(shù)據(jù)集分為:訓練集(已標注)、訓練集(未標注)、驗證集(用于調(diào)整模型的超參數(shù))和測試集(用來評估模型的泛化性)。已標注數(shù)據(jù)集中的數(shù)據(jù)標注任務是由醫(yī)生與醫(yī)學相關專業(yè)的學生共同完成的。為了克服單獨測試結果過于片面以及訓練數(shù)據(jù)不足的問題,本文在訓練時采用5折交叉的方法,每次選取4個子集作為訓練集,1個子集作為驗證集,不斷重復,直到所有的子集都作為訓練集和驗證集并且完成訓練。

    表2為模型的超參數(shù)設置,對于字符少于4位的進行補0操作,采用隨機梯度下降算法(stochastic gradient descent, SGD)對模型進行優(yōu)化。為了防止過擬合,在模型的每層加入了批次正則化(bath normalization),并且引入了dropout訓練策略[26]。大量實驗證明,該方法能夠在不同程度上有效防止過擬合現(xiàn)象。

    表2 模型在實驗中的超參數(shù)Table 2 The hyper-parameters of model in experiment

    2.2 實體類型和標簽機制

    在全部的數(shù)據(jù)集中,實體分為如下4類:

    1)疾?。喊娮硬v中病人的現(xiàn)病史、既往史、家族病史和醫(yī)生根據(jù)患者的身體狀況做出的診斷。例如:慢性肺源性心臟病、急性阻塞性肺疾病、高血壓等。

    2)癥狀:表示患者向醫(yī)生陳訴(或者別人代訴)的不適感覺或異常感覺,也包括嚴重程度的修飾成分。例如:喘息、頭痛、惡心等。

    3)檢查:指通過實驗室檢查或體格檢查來判斷患者所患疾病。例如:胸部X線、血常規(guī)、肺功能等。

    4)治療:指治愈疾病、緩解或改善癥狀所用的治療方法。例如:藥物、呼吸機、手術等。

    考慮到實體識別也是一個序列標注任務,由于醫(yī)療實體通常由多個詞組成,因此本文采用廣泛應用的BIESO標簽機制:O表示不屬于任何概念的實體,B、I、E分別表示一個實體的第一個詞、中間詞和結尾詞。S代表該詞本身就是一個實體。

    2.3 評價標準

    本文采用實體識別常用的幾個評價標準來衡量本文提出方法的有效性:準確率(precision)、召回率(recall)和F1值。

    準確率指正確識別出的命名實體占總識別出的比例,召回率是指正確識別出的命名實體數(shù)量占文件中所包含的實體數(shù)量的比例。設置A為被成功識別出的實體數(shù)量,B為未被成功識別出的實體數(shù)量,C為模型錯誤地將非命名實體識別為命名實體的數(shù)量。

    準確率為:

    (15)

    召回率為:

    (16)

    準確率和召回率并不總是同時達到峰值(它們甚至常常呈負相關)。為了在這2個標準之間做出權衡,實驗也采用了考慮這2個標準的F1測度來衡量實體識別的有效性:

    (17)

    2.4 實驗結果

    本文實驗分為3個部分:首先,對比CRF、Rule-base、SVM 3種傳統(tǒng)方法與本文提出的基于RNN的語義和字符特征結合的方法的性能,即分別對全部已標數(shù)據(jù)集和加入部分未標數(shù)據(jù)集的識別性能進行了對比;其次,為了說明概念特征在中文醫(yī)療命名實體識別任務中的重要性,對基于RNN的詞字向量結合模型和基于RNN的語義和字符向量結合模型進行了對比;最后,對RNN相關的3種模型(RNN、LSTM和GRU)的性能進行比較。

    表3和表4為CRF、Rule-based、SVM方法與本文基于RNN的語義和字符向量結合的弱監(jiān)督方法在全部已標注數(shù)據(jù)集與加入未標注數(shù)據(jù)集的性能對比結果。實驗結果表明,基于RNN的方法優(yōu)于其他3種傳統(tǒng)方法。在全部已標數(shù)據(jù)集和加入未標數(shù)據(jù)集中,基于BGRU的詞字向量結合模型的效果是最好的,分別達到了86.35%和84.54%。不同的是,在表3全部已標注數(shù)據(jù)集中,本文方法只比傳統(tǒng)方法的準確率提高了1.5%~4.2%,這說明傳統(tǒng)方法在處理有監(jiān)督學習任務時也有不錯的表現(xiàn)。但是,由表4可以看出,在加入未標數(shù)據(jù)集后,本文方法比著傳統(tǒng)方法的準確率提高了2.2%~6.1%。由此可以看出,RNN相關模型的時序記憶功能對弱監(jiān)督的實體識別任務有著非常重要的影響。總的來說,在訓練語料庫不充分時本文方法表現(xiàn)更好,這十分有助于解決如今大量人工標注耗時耗力的問題。

    表3 傳統(tǒng)方法與基于RNN的語義和字符向量結合模型在全部已標數(shù)據(jù)集上的性能對比Table 3 The comparison of the performance between the model of combining semantic and character embedding base on RNN and traditional methods on fully labeled dataset

    表4 傳統(tǒng)方法與基于RNN的語義和字符向量結合模型在部分未標數(shù)據(jù)集上的性能對比Table 4 The comparison of the performance between combining semantic and character embedding base on RNN model and traditional methods on a part of unlabeled dataset

    表5和表6分別描述了基于RNN的詞字向量結合模型和基于RNN的語義和字符向量結合模型在全部已標數(shù)據(jù)集上的性能對比。從實驗結果可以看出,語義和字符向量結合模型比詞字向量結合模型的準確率提高了0.62%。由此可以說明,在中文醫(yī)療領域的命名實體識別任務中概念特征也是非常重要的,因為它能夠防止語義信息割裂,保持語義的完整性。從表6中可以觀察到,在基于RNN的語義和字符向量結合模型中BiLSTM和BGRU的表現(xiàn)都比BRNN好,這也驗證了前文提到的RNN模型不能處理較長序列的任務,因為隨著序列長度的不斷增加會出現(xiàn)梯度消失或者爆炸的情況??偟膩碚f:基于RNN相關模型的弱監(jiān)督方法由于具有時序記憶功能更適合處理實體識別等序列標注的任務,尤其針對訓練語料庫不全的情況;在命名實體識別的任務中,概念特征能夠防止語義信息割裂,提高命名實體的準確率;在RNN相關的模型中,由于BRNN不能處理較長序列任務,因此比BiLSTM和BGRU方法的性能低。其次,本文提出的命名實體識別方法也存在一定的局限性:對領域本體的依賴性較高,本文提出的概念特征是從本體中獲取的,高質(zhì)量的語義特征抽取依賴于高質(zhì)量的外部領域本體庫。分類器構建的學習過程中計算復雜性較高,例如一個字符串在本體中可能會匹配出多個概念,而且特征融合造成特征維度的增加也會增加分類器構建的學習時間。由于目前公開的中文電子病歷數(shù)據(jù)集很難獲取到,因此本文的實驗部分只在合作醫(yī)院提供的數(shù)據(jù)集上進行。

    表5 基于RNN的詞字向量結合模型Table 5 Model of combining word and character embedding base on RNN

    表6 基于RNN的語義和字符向量結合模型Table 6 Combining semantic and character embedding base on RNN model

    3 結論

    1)從醫(yī)療本體中提取概念特征可以保持中文術語語義的完整性,并降低人工標注成本,提高命名實體識別的準確率。

    2)通過實驗表明,相比BRNN、BiLSTM和BGRU更擅長處理較長序列的文本。

    3)基于真實臨床醫(yī)療文本挖掘的實驗驗證了本文提出的方法在實際應用中的有效性。

    在未來的工作中,將會進一步考慮命名實體識別的時間復雜性,通過將一個字符串匹配出的多個相關概念進行相關度排序,來降低特征維度,從而提高分類器學習的速度;同時將繼續(xù)尋找適用于中文醫(yī)療文本挖掘的公開評測數(shù)據(jù)集進行更全面的性能比較和算法的改進研究。

    猜你喜歡
    字符命名本體
    Abstracts and Key Words
    哲學分析(2023年4期)2023-12-21 05:30:27
    尋找更強的字符映射管理器
    命名——助力有機化學的學習
    對姜夔自度曲音樂本體的現(xiàn)代解讀
    中國音樂學(2020年4期)2020-12-25 02:58:06
    字符代表幾
    一種USB接口字符液晶控制器設計
    電子制作(2019年19期)2019-11-23 08:41:50
    消失的殖民村莊和神秘字符
    有一種男人以“暖”命名
    東方女性(2018年3期)2018-04-16 15:30:02
    為一條河命名——在白河源
    散文詩(2017年17期)2018-01-31 02:34:08
    《我應該感到自豪才對》的本體性教學內(nèi)容及啟示
    文學教育(2016年27期)2016-02-28 02:35:15
    制服丝袜香蕉在线| 人妻少妇偷人精品九色| 青春草视频在线免费观看| 欧美最新免费一区二区三区| 国产精品成人在线| 欧美国产精品一级二级三级 | 日本欧美视频一区| 免费观看av网站的网址| 女人精品久久久久毛片| 能在线免费看毛片的网站| 国产精品蜜桃在线观看| 国产精品一区二区三区四区免费观看| 亚洲真实伦在线观看| 有码 亚洲区| 久久国内精品自在自线图片| 国产成人精品一,二区| av天堂中文字幕网| 日韩精品有码人妻一区| 亚洲婷婷狠狠爱综合网| 久久精品国产亚洲av天美| 伊人久久精品亚洲午夜| 国产午夜精品久久久久久一区二区三区| 欧美精品国产亚洲| 丝袜脚勾引网站| 中文在线观看免费www的网站| 国产精品.久久久| 久久国产乱子免费精品| 日日摸夜夜添夜夜爱| 久久99热6这里只有精品| 国产在线男女| av网站免费在线观看视频| 国产一区亚洲一区在线观看| 男人爽女人下面视频在线观看| 在线观看免费视频网站a站| 日本免费在线观看一区| 啦啦啦在线观看免费高清www| 一本久久精品| av黄色大香蕉| 熟女电影av网| 久久久久视频综合| 下体分泌物呈黄色| 久久婷婷青草| 国产黄频视频在线观看| 国产黄片视频在线免费观看| 男人狂女人下面高潮的视频| 国产成人精品福利久久| 视频区图区小说| av在线播放精品| 欧美丝袜亚洲另类| 中国美白少妇内射xxxbb| 亚洲激情五月婷婷啪啪| 一边亲一边摸免费视频| 欧美xxxx性猛交bbbb| 一级毛片aaaaaa免费看小| 亚洲欧美精品自产自拍| 国产亚洲91精品色在线| 在现免费观看毛片| 少妇的逼水好多| 久久免费观看电影| 中国国产av一级| 秋霞在线观看毛片| 精品少妇黑人巨大在线播放| 国产精品成人在线| 男男h啪啪无遮挡| 自线自在国产av| av有码第一页| 99久久中文字幕三级久久日本| 大片免费播放器 马上看| 国产精品久久久久久久久免| 人妻一区二区av| 男女边摸边吃奶| xxx大片免费视频| 2021少妇久久久久久久久久久| 内地一区二区视频在线| 欧美最新免费一区二区三区| 七月丁香在线播放| 一本久久精品| 成人午夜精彩视频在线观看| 欧美精品人与动牲交sv欧美| 我要看日韩黄色一级片| 超碰97精品在线观看| 久久鲁丝午夜福利片| 3wmmmm亚洲av在线观看| 免费大片18禁| 亚洲精品乱码久久久v下载方式| 三级经典国产精品| 日本wwww免费看| videossex国产| 亚洲av在线观看美女高潮| 99国产精品免费福利视频| av播播在线观看一区| 免费观看性生交大片5| 久久99热6这里只有精品| 亚洲在久久综合| 免费观看a级毛片全部| 国产高清有码在线观看视频| 久久久久久久亚洲中文字幕| 亚洲真实伦在线观看| 校园人妻丝袜中文字幕| 日日啪夜夜爽| 国内少妇人妻偷人精品xxx网站| 免费久久久久久久精品成人欧美视频 | 久久久久久久久久人人人人人人| 大码成人一级视频| 51国产日韩欧美| kizo精华| 日韩不卡一区二区三区视频在线| 大香蕉97超碰在线| 日韩一区二区视频免费看| a级毛片在线看网站| 夫妻午夜视频| 欧美成人精品欧美一级黄| 伦理电影大哥的女人| 在线观看免费日韩欧美大片 | 香蕉精品网在线| 大香蕉久久网| 最近最新中文字幕免费大全7| 2021少妇久久久久久久久久久| 亚洲丝袜综合中文字幕| 午夜日本视频在线| 激情五月婷婷亚洲| 亚洲av免费高清在线观看| 大又大粗又爽又黄少妇毛片口| 久久av网站| 日日啪夜夜撸| 91精品伊人久久大香线蕉| 丝瓜视频免费看黄片| 高清午夜精品一区二区三区| 亚洲精品国产色婷婷电影| 久久精品久久久久久久性| 女性生殖器流出的白浆| 国产成人精品婷婷| 亚洲精品中文字幕在线视频 | 久久久久人妻精品一区果冻| 国产精品久久久久久精品古装| 国产伦理片在线播放av一区| 亚洲美女视频黄频| 国产精品一区www在线观看| 国产精品不卡视频一区二区| 亚洲伊人久久精品综合| 狂野欧美激情性bbbbbb| 欧美最新免费一区二区三区| 午夜激情久久久久久久| 丝袜在线中文字幕| 两个人的视频大全免费| 久久青草综合色| av线在线观看网站| 亚洲精品乱码久久久久久按摩| 久久青草综合色| 中文在线观看免费www的网站| 男的添女的下面高潮视频| 日韩强制内射视频| 亚洲精品乱码久久久v下载方式| 三级国产精品欧美在线观看| 青青草视频在线视频观看| 狠狠精品人妻久久久久久综合| 日本免费在线观看一区| 人人妻人人添人人爽欧美一区卜| 亚洲精品一区蜜桃| 91久久精品电影网| 免费观看无遮挡的男女| 美女中出高潮动态图| 亚洲av中文av极速乱| 亚洲内射少妇av| 日本黄色片子视频| 精品国产露脸久久av麻豆| 国产精品免费大片| 内地一区二区视频在线| 免费高清在线观看视频在线观看| 国产黄片视频在线免费观看| 纯流量卡能插随身wifi吗| 夫妻性生交免费视频一级片| 国产一区亚洲一区在线观看| 纯流量卡能插随身wifi吗| 永久网站在线| 国产高清有码在线观看视频| 日本欧美视频一区| 成人黄色视频免费在线看| videossex国产| 80岁老熟妇乱子伦牲交| 亚洲天堂av无毛| 美女xxoo啪啪120秒动态图| 三上悠亚av全集在线观看 | 亚洲欧美一区二区三区国产| 久久女婷五月综合色啪小说| 久久午夜综合久久蜜桃| 久久久国产欧美日韩av| 精品久久久久久久久亚洲| 亚洲精品国产av成人精品| av视频免费观看在线观看| 一区在线观看完整版| 人妻人人澡人人爽人人| 99re6热这里在线精品视频| 中国三级夫妇交换| 亚洲精品日本国产第一区| 久久精品国产亚洲av涩爱| 99热网站在线观看| 热re99久久精品国产66热6| 女性生殖器流出的白浆| 欧美性感艳星| 成人综合一区亚洲| 欧美日韩在线观看h| 一区二区三区乱码不卡18| 少妇的逼水好多| 亚洲精品日韩av片在线观看| 国产淫片久久久久久久久| 看免费成人av毛片| 亚洲国产精品一区三区| 在线观看人妻少妇| 3wmmmm亚洲av在线观看| 国产视频内射| 国产成人精品无人区| 日本av手机在线免费观看| 精品人妻一区二区三区麻豆| 午夜av观看不卡| 大香蕉97超碰在线| av天堂中文字幕网| 国产av国产精品国产| 日韩视频在线欧美| 国产成人免费观看mmmm| 丝袜在线中文字幕| 伊人亚洲综合成人网| 毛片一级片免费看久久久久| 内射极品少妇av片p| 黑人高潮一二区| 免费看日本二区| 我的老师免费观看完整版| 国精品久久久久久国模美| 日本欧美视频一区| 亚洲av.av天堂| 麻豆精品久久久久久蜜桃| 大陆偷拍与自拍| 久久人人爽av亚洲精品天堂| 久久婷婷青草| 亚州av有码| 亚洲国产欧美日韩在线播放 | 欧美成人精品欧美一级黄| 日韩欧美 国产精品| 免费观看无遮挡的男女| 欧美+日韩+精品| 亚洲国产欧美在线一区| 乱人伦中国视频| 亚洲精品日韩在线中文字幕| 亚洲av免费高清在线观看| 人妻制服诱惑在线中文字幕| 免费久久久久久久精品成人欧美视频 | 亚州av有码| 久久久久久久大尺度免费视频| 国产女主播在线喷水免费视频网站| 久久97久久精品| 精品一品国产午夜福利视频| av免费在线看不卡| 丝瓜视频免费看黄片| av在线观看视频网站免费| av不卡在线播放| 五月开心婷婷网| 日韩强制内射视频| 秋霞伦理黄片| 精品一区二区免费观看| 欧美 日韩 精品 国产| 一级,二级,三级黄色视频| 成人无遮挡网站| 亚洲国产精品999| 国产一区亚洲一区在线观看| 女的被弄到高潮叫床怎么办| 亚洲精品,欧美精品| 老司机影院成人| 伦理电影大哥的女人| 在线观看国产h片| 国产一区有黄有色的免费视频| 亚洲天堂av无毛| 久久精品夜色国产| 国产成人精品久久久久久| 久久精品久久精品一区二区三区| 欧美老熟妇乱子伦牲交| 夫妻午夜视频| h视频一区二区三区| 极品人妻少妇av视频| 久久精品久久久久久久性| av网站免费在线观看视频| 插阴视频在线观看视频| 久久久国产精品麻豆| 久久久久人妻精品一区果冻| 久久精品熟女亚洲av麻豆精品| 99热网站在线观看| 乱人伦中国视频| 精华霜和精华液先用哪个| 99热6这里只有精品| 免费观看在线日韩| 最后的刺客免费高清国语| 亚洲在久久综合| 国产亚洲最大av| 国产一区有黄有色的免费视频| 人人妻人人澡人人看| 国产日韩欧美视频二区| 2022亚洲国产成人精品| 最近2019中文字幕mv第一页| 国内少妇人妻偷人精品xxx网站| 插阴视频在线观看视频| 成人亚洲精品一区在线观看| 在线观看免费高清a一片| 日韩成人伦理影院| av一本久久久久| 亚洲三级黄色毛片| 五月玫瑰六月丁香| 又爽又黄a免费视频| 最新中文字幕久久久久| 欧美 日韩 精品 国产| 久久99精品国语久久久| 建设人人有责人人尽责人人享有的| 国产精品一区二区性色av| 一区二区三区乱码不卡18| 国产精品.久久久| 欧美日韩视频高清一区二区三区二| 80岁老熟妇乱子伦牲交| 一级毛片电影观看| 少妇的逼水好多| 国产亚洲欧美精品永久| 精品久久久噜噜| 中国三级夫妇交换| 亚洲av成人精品一区久久| 精品国产一区二区久久| 精品99又大又爽又粗少妇毛片| 在线观看免费日韩欧美大片 | 亚洲国产精品999| 成人特级av手机在线观看| 美女中出高潮动态图| 免费不卡的大黄色大毛片视频在线观看| 狠狠精品人妻久久久久久综合| 91aial.com中文字幕在线观看| 亚洲人与动物交配视频| 寂寞人妻少妇视频99o| 午夜91福利影院| 国产白丝娇喘喷水9色精品| 最近中文字幕高清免费大全6| 久久av网站| 国产精品一区二区在线不卡| 国产成人午夜福利电影在线观看| 久久久久人妻精品一区果冻| 大片免费播放器 马上看| 亚洲在久久综合| 国产精品女同一区二区软件| 午夜福利,免费看| 国产高清国产精品国产三级| 久久av网站| 中国国产av一级| 欧美高清成人免费视频www| 九色成人免费人妻av| 国产色婷婷99| 国产精品免费大片| 久久毛片免费看一区二区三区| 国产国拍精品亚洲av在线观看| 少妇精品久久久久久久| 国产一区亚洲一区在线观看| 精品视频人人做人人爽| 亚洲内射少妇av| 久久精品熟女亚洲av麻豆精品| 久久人人爽人人爽人人片va| 男人添女人高潮全过程视频| 亚洲内射少妇av| 美女中出高潮动态图| 又粗又硬又长又爽又黄的视频| 丝袜喷水一区| av又黄又爽大尺度在线免费看| 中文在线观看免费www的网站| 色婷婷av一区二区三区视频| 涩涩av久久男人的天堂| 大码成人一级视频| 99久久精品一区二区三区| 大片电影免费在线观看免费| 国产在线男女| 9色porny在线观看| 人妻制服诱惑在线中文字幕| 精品少妇内射三级| 一级毛片黄色毛片免费观看视频| 五月天丁香电影| 纵有疾风起免费观看全集完整版| 免费黄色在线免费观看| 欧美精品一区二区免费开放| 美女视频免费永久观看网站| 久久精品国产自在天天线| 中文字幕免费在线视频6| 少妇人妻 视频| 熟妇人妻不卡中文字幕| 国产精品秋霞免费鲁丝片| 久久久久久久国产电影| 亚洲怡红院男人天堂| 极品少妇高潮喷水抽搐| xxx大片免费视频| 男女无遮挡免费网站观看| 中文精品一卡2卡3卡4更新| 午夜影院在线不卡| 国产精品国产三级国产av玫瑰| 日日啪夜夜爽| 欧美精品国产亚洲| 人人妻人人看人人澡| 久久影院123| 欧美老熟妇乱子伦牲交| 久久精品久久精品一区二区三区| 国产精品一区二区在线观看99| 99九九在线精品视频 | 久久精品国产亚洲网站| 亚洲精品日韩av片在线观看| 亚洲图色成人| 精品午夜福利在线看| 成人综合一区亚洲| 搡老乐熟女国产| 久久亚洲国产成人精品v| 成人18禁高潮啪啪吃奶动态图 | 国产av码专区亚洲av| 最近手机中文字幕大全| 22中文网久久字幕| 青春草国产在线视频| 亚洲熟女精品中文字幕| 熟妇人妻不卡中文字幕| 久久久久视频综合| 亚洲人成网站在线观看播放| 校园人妻丝袜中文字幕| 久久久久久久久久人人人人人人| 国产精品久久久久成人av| 日本黄大片高清| 亚洲国产色片| 日韩一本色道免费dvd| 国产精品一二三区在线看| 久久99精品国语久久久| 欧美日韩亚洲高清精品| www.色视频.com| 精品久久久噜噜| a级毛片免费高清观看在线播放| 色5月婷婷丁香| 国产av国产精品国产| av天堂中文字幕网| 亚洲国产精品成人久久小说| 日产精品乱码卡一卡2卡三| 日本黄色片子视频| 亚洲欧美成人综合另类久久久| 91成人精品电影| 高清av免费在线| 赤兔流量卡办理| 成人影院久久| 五月开心婷婷网| 春色校园在线视频观看| 亚洲精品视频女| 久久精品久久久久久久性| 国产欧美日韩综合在线一区二区 | 街头女战士在线观看网站| 久久久久久久国产电影| 黑人高潮一二区| av视频免费观看在线观看| 少妇裸体淫交视频免费看高清| 熟女av电影| 91久久精品国产一区二区成人| 国产高清不卡午夜福利| a 毛片基地| 中文欧美无线码| 丝瓜视频免费看黄片| 亚洲自偷自拍三级| 中文资源天堂在线| 卡戴珊不雅视频在线播放| 免费观看av网站的网址| 日韩一区二区三区影片| 一区二区av电影网| 免费人成在线观看视频色| 欧美性感艳星| 欧美日韩综合久久久久久| 在现免费观看毛片| 少妇人妻一区二区三区视频| 狠狠精品人妻久久久久久综合| 国产精品国产三级国产av玫瑰| 人妻 亚洲 视频| 嫩草影院新地址| 免费av不卡在线播放| 日本欧美国产在线视频| freevideosex欧美| 高清毛片免费看| 黑人高潮一二区| 亚洲精品一二三| 日日爽夜夜爽网站| 国产精品一区二区性色av| 国产精品一二三区在线看| 少妇丰满av| 久久久a久久爽久久v久久| 亚洲精品国产成人久久av| 欧美激情极品国产一区二区三区 | 日日摸夜夜添夜夜爱| 免费观看在线日韩| 韩国高清视频一区二区三区| 亚洲美女视频黄频| a级一级毛片免费在线观看| 91在线精品国自产拍蜜月| 欧美日韩一区二区视频在线观看视频在线| 一级黄片播放器| 少妇被粗大猛烈的视频| 国产色婷婷99| 日本爱情动作片www.在线观看| 一级毛片黄色毛片免费观看视频| 少妇人妻精品综合一区二区| 亚洲av成人精品一二三区| 国产一区有黄有色的免费视频| 在线观看国产h片| 国产精品一区二区在线观看99| 简卡轻食公司| 国产精品福利在线免费观看| 亚洲精品一区蜜桃| 精品一区在线观看国产| 免费大片黄手机在线观看| 最近手机中文字幕大全| 国产黄频视频在线观看| 久久久国产欧美日韩av| 亚洲av电影在线观看一区二区三区| 黄色日韩在线| 99热6这里只有精品| 草草在线视频免费看| 精品一区二区三卡| 天美传媒精品一区二区| 你懂的网址亚洲精品在线观看| 久久精品夜色国产| 精品久久久久久电影网| 久久久精品免费免费高清| 久久青草综合色| 亚洲国产精品一区二区三区在线| 丝袜在线中文字幕| 午夜激情久久久久久久| 免费大片黄手机在线观看| 亚洲精品日本国产第一区| 少妇人妻一区二区三区视频| 日本欧美视频一区| av在线播放精品| 两个人的视频大全免费| 午夜精品国产一区二区电影| 免费久久久久久久精品成人欧美视频 | 春色校园在线视频观看| 亚洲美女黄色视频免费看| 涩涩av久久男人的天堂| 美女xxoo啪啪120秒动态图| 国产精品久久久久久久电影| 麻豆精品久久久久久蜜桃| 桃花免费在线播放| 午夜免费观看性视频| 亚洲欧美日韩卡通动漫| 欧美精品人与动牲交sv欧美| 亚洲不卡免费看| 夫妻午夜视频| 国产男女超爽视频在线观看| 在线免费观看不下载黄p国产| 26uuu在线亚洲综合色| 美女中出高潮动态图| 一二三四中文在线观看免费高清| 91久久精品电影网| 亚洲不卡免费看| 欧美日本中文国产一区发布| 国产精品久久久久久精品电影小说| 日本午夜av视频| 久久国产精品男人的天堂亚洲 | 亚洲精品国产成人久久av| 夫妻性生交免费视频一级片| a级毛色黄片| 我的女老师完整版在线观看| 尾随美女入室| 在现免费观看毛片| 国产极品粉嫩免费观看在线 | 久久久久国产网址| 久久国内精品自在自线图片| 亚洲天堂av无毛| 久久婷婷青草| av国产久精品久网站免费入址| 免费人妻精品一区二区三区视频| 精品亚洲成国产av| 校园人妻丝袜中文字幕| av网站免费在线观看视频| 99久久人妻综合| 国产视频首页在线观看| 中文字幕人妻丝袜制服| 国产精品伦人一区二区| 国产成人精品婷婷| 精品人妻熟女毛片av久久网站| 一本一本综合久久| 婷婷色综合大香蕉| 成年女人在线观看亚洲视频| 在线观看免费高清a一片| 亚洲精品自拍成人| 少妇精品久久久久久久| 高清不卡的av网站| freevideosex欧美| 成人美女网站在线观看视频| 一区二区三区四区激情视频| 91午夜精品亚洲一区二区三区| 乱人伦中国视频| 一级毛片久久久久久久久女| 交换朋友夫妻互换小说| 国产乱人偷精品视频| 综合色丁香网| 在线观看av片永久免费下载| 久久久久久久久久久丰满| 一级毛片久久久久久久久女| 欧美精品一区二区大全| 又爽又黄a免费视频| 久久久久久久精品精品| 亚洲精品aⅴ在线观看| 国产乱人偷精品视频| 日本av手机在线免费观看| 一级,二级,三级黄色视频| av在线老鸭窝| 国产免费视频播放在线视频| 只有这里有精品99| 大又大粗又爽又黄少妇毛片口| 美女内射精品一级片tv| 少妇人妻一区二区三区视频| 久久久精品免费免费高清| 美女cb高潮喷水在线观看| 又大又黄又爽视频免费| 国产伦理片在线播放av一区| 亚洲国产色片| 女人精品久久久久毛片| 国产在线免费精品|