• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于條件隨機(jī)場(chǎng)的中醫(yī)臨床病歷命名實(shí)體抽取

    2014-06-06 10:46:47周雪忠1b1b張潤(rùn)順
    計(jì)算機(jī)工程 2014年9期
    關(guān)鍵詞:誘因命名病歷

    劉 凱,周雪忠,1b,于 劍,1b,張潤(rùn)順

    (1.北京交通大學(xué)a.計(jì)算機(jī)與信息技術(shù)學(xué)院;b.交通數(shù)據(jù)分析與挖掘北京市重點(diǎn)實(shí)驗(yàn)室,北京100044; 2.中國(guó)中醫(yī)科學(xué)院廣安門(mén)醫(yī)院,北京100053)

    基于條件隨機(jī)場(chǎng)的中醫(yī)臨床病歷命名實(shí)體抽取

    劉 凱1a,周雪忠1a,1b,于 劍1a,1b,張潤(rùn)順2

    (1.北京交通大學(xué)a.計(jì)算機(jī)與信息技術(shù)學(xué)院;b.交通數(shù)據(jù)分析與挖掘北京市重點(diǎn)實(shí)驗(yàn)室,北京100044; 2.中國(guó)中醫(yī)科學(xué)院廣安門(mén)醫(yī)院,北京100053)

    中醫(yī)臨床病歷是中醫(yī)重要的科研數(shù)據(jù)資源,但目前臨床病歷仍以文本為主要表達(dá)形式,對(duì)病歷數(shù)據(jù)深入分析的前提是進(jìn)行結(jié)構(gòu)化信息抽取,而命名實(shí)體抽取是其基礎(chǔ)性步驟。針對(duì)中醫(yī)臨床病歷的命名實(shí)體,如癥狀、疾病和誘因等的抽取問(wèn)題,通過(guò)手工標(biāo)注的413份病歷數(shù)據(jù)(以中文字為特征)與4類(lèi)特征模版,將條件隨機(jī)場(chǎng)(CRF)、隱馬爾科夫模型(HMM)和最大熵馬爾科夫模型(MEMM)用于中醫(yī)病歷命名實(shí)體抽取的實(shí)驗(yàn),并進(jìn)行比較分析。結(jié)果表明,結(jié)合合適的特征模版,CRF命名實(shí)體抽取方法取得了較好的性能,F1值的癥狀達(dá)到0.80,疾病名稱達(dá)到0.74,誘因0.74。與HMM和MEMM相比,CRF有最高的準(zhǔn)確率和召回率,是一種較為適用的中醫(yī)臨床病歷命名實(shí)體抽取方法。

    中醫(yī)臨床病歷;命名實(shí)體抽取;語(yǔ)料庫(kù)標(biāo)注系統(tǒng);條件隨機(jī)場(chǎng);特征模板

    1 概述

    隨著近十年醫(yī)療信息化建設(shè)的進(jìn)展和臨床數(shù)據(jù)的不斷積累,作為診療實(shí)踐主要信息載體的中醫(yī)臨床病歷成為中醫(yī)學(xué)和信息學(xué)關(guān)注的重要研究資源[1-2]。名老中醫(yī)文本病歷是中醫(yī)臨床診療的重要數(shù)據(jù)資源,它具有非結(jié)構(gòu)化、口語(yǔ)化、專業(yè)化等特點(diǎn),對(duì)其數(shù)據(jù)深度利用的重要前提是對(duì)相關(guān)醫(yī)學(xué)命名實(shí)體術(shù)語(yǔ)的抽取,而命名實(shí)體抽取方法正是從自由文本中抽取所需命名實(shí)體術(shù)語(yǔ)的基礎(chǔ)技術(shù)。但由于中文自然語(yǔ)言表達(dá)的靈活性和中醫(yī)臨床信息內(nèi)容的個(gè)體性特點(diǎn),進(jìn)行中醫(yī)臨床文本病歷的信息抽取研究是一個(gè)難點(diǎn)問(wèn)題。因此進(jìn)行中醫(yī)文本病歷的命名實(shí)體抽取研究,探索形成相關(guān)的適宜信息抽取方法具有重要價(jià)值[3-4]。

    中醫(yī)臨床病歷中蘊(yùn)含著豐富的疾病治療、疾病誘因、疾病癥狀等信息,所以對(duì)病歷進(jìn)行數(shù)據(jù)挖掘,能推動(dòng)中醫(yī)的發(fā)展。由于大部分中醫(yī)病歷是自由文本,因此在對(duì)其進(jìn)行深度利用前,必須通過(guò)命名實(shí)體抽取技術(shù)提取病歷中的重要命名實(shí)體。

    本文首先提出條件隨機(jī)場(chǎng)的概念,然后是中醫(yī)臨床病歷標(biāo)準(zhǔn)數(shù)據(jù)集的介紹和特征的選擇。隨后在標(biāo)準(zhǔn)數(shù)據(jù)集上,使用條件隨機(jī)場(chǎng)(Conditional Random Field,CRF)在不同特征模板上進(jìn)行命名實(shí)體抽取實(shí)驗(yàn)和分析,并與HMM和MEMM模型進(jìn)行命名實(shí)體抽取對(duì)比。

    2 條件隨機(jī)場(chǎng)

    文獻(xiàn)[5]提出了一個(gè)基于統(tǒng)計(jì)的序列標(biāo)記和數(shù)據(jù)分割的概率模型——條件隨機(jī)場(chǎng)CRF。CRF是一種通過(guò)最大化條件概率來(lái)訓(xùn)練模型的無(wú)向圖模型,它是一個(gè)以全局觀察O為條件的隨機(jī)場(chǎng)。在實(shí)際中,最常用的CRF是一種線性鏈結(jié)構(gòu),它非常適合于序列標(biāo)注。序列標(biāo)注分布的條件屬性,使得CRF可以很好地?cái)M合真實(shí)世界的數(shù)據(jù)。而在這些數(shù)據(jù)中,命名實(shí)體抽取的條件概率是依賴于觀察序列中非獨(dú)立的相互作用的特征,通常通過(guò)賦予這些特征不同的權(quán)重來(lái)表示該特征的重要程度[6]。圖1是一種最簡(jiǎn)單最常用的CRF,稱為線性CRF。

    圖1 CRF的概率圖模型

    其中,Z0為歸一化因子,它保證所有可能的狀態(tài)序列概率之和為1,即式(2):

    其中,fk(st-1,st,O,t)是模型中任意的特征函數(shù),它通常是一個(gè)二值函數(shù);λk是特征函數(shù)fk(st-1,st,O,t)在模型中的權(quán)重;λk可以經(jīng)過(guò)模型訓(xùn)練得到。如果λk是值很大的正數(shù),說(shuō)明特征函數(shù)fk所表示的事件在訓(xùn)練集中出現(xiàn)的次數(shù)很多。

    給定一個(gè)由式(1)定義的CRF模型,在已經(jīng)輸入的數(shù)據(jù)序列O的情況下,最可能的標(biāo)記序列可表示為下式:

    對(duì)式(3)的計(jì)算可以通過(guò)維特比算法。

    將條件概率公式式(1)代入式(4)中,可得:

    為了避免參數(shù)估計(jì)時(shí)出現(xiàn)的過(guò)擬合情況,在進(jìn)行參數(shù)估計(jì)時(shí),采用高斯先驗(yàn)來(lái)調(diào)整模型的參數(shù)計(jì)算過(guò)程,式(5)變?yōu)?

    其中,最后一項(xiàng)是用于進(jìn)行調(diào)整的高斯先驗(yàn)值,σ2表示方差。

    通過(guò)前文的介紹可知CRF的圖模型是無(wú)向圖模型。CRF與HMM,MEMM,ME相比,保持了它們的優(yōu)點(diǎn),避免了它們的不足。不同于MEMM在給定當(dāng)前的狀態(tài),計(jì)算下一個(gè)狀態(tài)的狀態(tài)概率分布,CRF是在給定需要標(biāo)注的觀察序列的條件下,計(jì)算整個(gè)狀態(tài)序列的聯(lián)合概率分布,求解一個(gè)全局的最優(yōu)狀態(tài)序列,因此,CRF避免了標(biāo)注偏置的問(wèn)題。

    3 數(shù)據(jù)集和特征選擇

    3.1 數(shù)據(jù)集信息

    本標(biāo)準(zhǔn)語(yǔ)料集的原始中醫(yī)臨床病歷來(lái)源于廣安門(mén)醫(yī)院、西苑醫(yī)院、望京醫(yī)院等多所醫(yī)院2009年-2010年采集的冠心病、糖尿病的門(mén)診病歷和住院病歷。在原始病歷的篩選時(shí),使用隨機(jī)抽樣結(jié)合人工篩選的樣本篩選方式,因此,該原始病歷(樣本)能較好地代表中醫(yī)臨床病歷集。

    病歷中包括病人基本信息、主訴、現(xiàn)病史等內(nèi)容??紤]要抽取命名實(shí)體在病歷中的分布和最終數(shù)據(jù)集的標(biāo)準(zhǔn)化,選擇主訴、現(xiàn)病史作為數(shù)據(jù)集的源數(shù)據(jù)。

    在中醫(yī)臨床病歷標(biāo)注過(guò)程中,首先利用語(yǔ)料庫(kù)標(biāo)注系統(tǒng)對(duì)病歷進(jìn)行粗標(biāo)注,然后對(duì)病歷進(jìn)行數(shù)次細(xì)致的審核,再由中醫(yī)專家對(duì)標(biāo)注病歷進(jìn)行最后的審核和校對(duì)。整個(gè)標(biāo)準(zhǔn)語(yǔ)料集的標(biāo)注過(guò)程先后持續(xù)半年之久。

    使用語(yǔ)料庫(kù)標(biāo)注系統(tǒng)結(jié)合臨床人員的校對(duì)方式,標(biāo)注了413份病歷。其中冠心病(233)、糖尿病(180)。該標(biāo)準(zhǔn)語(yǔ)料集共有癥狀實(shí)體3 623個(gè),誘因?qū)嶓w250個(gè),疾病實(shí)體340個(gè)。

    在構(gòu)造標(biāo)準(zhǔn)數(shù)據(jù)集時(shí),本文沒(méi)有對(duì)中醫(yī)臨床病歷文本進(jìn)行分詞,而是直接在單字粒度上對(duì)病歷進(jìn)行標(biāo)注,這是由于現(xiàn)階段中醫(yī)病歷領(lǐng)域缺乏準(zhǔn)確度高、標(biāo)準(zhǔn)統(tǒng)一的詞典。

    本文雖然采用以字為單位的標(biāo)注方式,但為了保持病歷中單字在命名實(shí)體中的位置特征,在對(duì)單字進(jìn)行標(biāo)注的同時(shí),使用符號(hào)集(B,E)來(lái)保存字在詞中的位置信息。例如在疾病名“糖尿病”中,將它標(biāo)注為糖(B-D)尿(E-D)病(E-D)。在中醫(yī)病歷標(biāo)注數(shù)據(jù)中,字特征標(biāo)注符號(hào)的聲明如表1所示。

    表1 數(shù)據(jù)符號(hào)集

    3.2 特征選擇

    本節(jié)將分別介紹訓(xùn)練CRF模型時(shí)使用的詞位特征、狀態(tài)轉(zhuǎn)移特征、上下文窗口特征、指示詞特征、詞典特征和構(gòu)詞模式特征。

    3.2.1 詞位特征

    詞位的選擇有3種方案,分別是2詞位標(biāo)注集、4詞位標(biāo)注集和6詞位標(biāo)注集[7]。本文采用的是2詞位標(biāo)注集,即對(duì)一個(gè)漢字按照它是否是詞首字進(jìn)行劃分,單字成詞或者處于非單字詞的詞首時(shí)都劃分為B,其余情況劃分為E。詞位特征能有效地保留實(shí)體中字的關(guān)系。例如:“烘熱”標(biāo)為“烘/B-Z熱/E-Z”。

    3.2.2 狀態(tài)轉(zhuǎn)移特征

    在CRF中,特征函數(shù)fk(st-1,st,o,t)既能整合觀察序列的特征,也能整合隱藏狀態(tài)轉(zhuǎn)移的特征。

    例如,當(dāng)st-1標(biāo)記為“癥狀指示詞”,st標(biāo)記為“癥狀”,并且O中的第1個(gè)字在癥狀首字詞典中時(shí),特征函數(shù)的取值為“1”。這樣,CRF模型將狀態(tài)轉(zhuǎn)移st-1→st整合到特征函數(shù)中。

    3.2.3 上下文窗口特征

    所謂上下文窗口,指的是包括當(dāng)前字w0及其前后若干個(gè)字組成的一個(gè)字符串(w-n,w-n+1,…,w0,…,wn)。窗口越大,能利用的上下文越多,但效率會(huì)下降,而且還會(huì)產(chǎn)生過(guò)擬合現(xiàn)象;窗口過(guò)小,特征利用得就不夠充分,會(huì)因?yàn)檫^(guò)于簡(jiǎn)單而丟失有用的信息。有統(tǒng)計(jì)研究顯示,在中文語(yǔ)料中,99%的詞是由5個(gè)或者5個(gè)以下的子構(gòu)成[8]。因此,本文使用5字上下文特征。

    3.2.4 指示詞特征

    通過(guò)對(duì)中醫(yī)臨床病例中命名實(shí)體及其上下文信息進(jìn)行統(tǒng)計(jì)分析后,發(fā)現(xiàn)在特定的指示詞后面,有很大的概率出現(xiàn)癥狀、誘因和疾病實(shí)體。因此,選擇實(shí)體詞的前面2個(gè)或1個(gè)字作為實(shí)體指示詞特征。指示詞特征的特征函數(shù)為:

    其中,P-*代表指示詞(*表示任意一種實(shí)體類(lèi)型),如發(fā)現(xiàn)、由于等。本文中使用的指示詞部分如表2所示。

    表2 實(shí)體指示詞特征

    3.2.5 詞典特征

    本文中所使用的實(shí)體詞典是在對(duì)中醫(yī)病歷的統(tǒng)計(jì)分析的前提下,經(jīng)過(guò)人工挑選出的命名實(shí)體詞,包括癥狀詞典、疾病詞典和誘因詞典,具體情況如表3所示。其中,癥狀詞典中包括853個(gè)病歷中常見(jiàn)的癥狀詞;疾病詞典包括108個(gè)病歷中常見(jiàn)的疾病詞;誘因詞典包括46個(gè)病歷中常見(jiàn)的誘因(冠心病和糖尿病中醫(yī)臨床病歷)。3.2.6 構(gòu)詞模式特征

    表3 實(shí)體詞典特征

    通過(guò)對(duì)病歷的主訴、現(xiàn)病史的統(tǒng)計(jì)分析,發(fā)現(xiàn)癥狀通常由身體部位和基本癥狀詞2個(gè)部分組成,例如“雙上頜麻木”,可以拆分為“雙上頜”和“麻木”2個(gè)部分。疾病名通常由修飾部分、身體部位和基本疾病名3個(gè)部分組成,如“慢性心絞痛”,可以拆分為“慢性”、“心”和“絞痛”3個(gè)部分。在本文中,通過(guò)人工采集和拆分,共構(gòu)造了3個(gè)外部字典,如表4所示。

    表4 構(gòu)詞詞典特征

    4 實(shí)驗(yàn)及結(jié)果分析

    在中醫(yī)臨床病歷標(biāo)準(zhǔn)數(shù)據(jù)集上,首先選擇不同的特征模板訓(xùn)練CRF對(duì)中醫(yī)臨床病歷數(shù)據(jù)集進(jìn)行命名實(shí)體抽取實(shí)驗(yàn),并對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行分析。然后對(duì)CRF和HMM[9-10]、MEMM[11]進(jìn)行命名實(shí)體抽取對(duì)照實(shí)驗(yàn)。使用的命名實(shí)體工具是MALLET[12]。

    4.1 基于CRF的名老中醫(yī)病歷命名實(shí)體抽取

    選擇不同的特征組成特征模板進(jìn)行CRF模型的訓(xùn)練,并對(duì)它們進(jìn)行實(shí)驗(yàn)對(duì)比和結(jié)果分析。

    在本系列實(shí)驗(yàn)中,將字特征、轉(zhuǎn)移特征和上下文窗口特征作為基本特征,用B來(lái)標(biāo)識(shí),將其他特征作為備選組合特征,通過(guò)選擇不同的特征模板分析各個(gè)特征對(duì)實(shí)驗(yàn)結(jié)果的影響。本文中所使用的特征模板組成如表5所示,分別用T1,T2,T3來(lái)標(biāo)識(shí)實(shí)體指示詞特征、詞典特征和構(gòu)詞模式特征。

    表5 特征模板集

    根據(jù)疾病類(lèi)型的不同,首先將數(shù)據(jù)集中的數(shù)據(jù)分為2個(gè)部分,它們分別是糖尿病數(shù)據(jù)(180份)和冠心病數(shù)據(jù)(233份)。選擇基于不同特征模板集的CRF分別在這2個(gè)數(shù)據(jù)集上進(jìn)行十重交叉檢驗(yàn)。

    分別選擇特征模板集MT1,MT2和MT3在2類(lèi)數(shù)據(jù)集上對(duì)CRF模型進(jìn)行十重交叉驗(yàn)證,并與基于基本特征模板上的CRF模型進(jìn)行對(duì)比,實(shí)驗(yàn)結(jié)果如表6所示。

    表6 不同特征模板的CRF中醫(yī)病歷命名實(shí)體抽取比較

    對(duì)照實(shí)驗(yàn)顯示,相對(duì)于基本CRF,使用特征模板集MT1的CRF在對(duì)癥狀和誘因抽取時(shí),效果有一定的提高。而在對(duì)疾病實(shí)體進(jìn)行抽取時(shí),基本CRF效果更好,這是由于病歷中的癥狀和誘因指示詞比較固定,而疾病的出現(xiàn)較隨機(jī)。

    相對(duì)于模板集MT1,使用特征模板集MT2的CRF命名實(shí)體抽取的效果更好(其中,在糖尿病數(shù)據(jù)集上F1值分別達(dá)到了0.79,0.78,0.63;在冠心病數(shù)據(jù)集上F1值分別達(dá)到了0.77,0.56,0.71)。

    使用特征模板集MT3的CRF命名實(shí)體抽取的綜合效果比基本CRF有大幅提高(其中,在糖尿病數(shù)據(jù)集上F1值分別達(dá)到了0.8,0.74,0.63;在冠心病數(shù)據(jù)集上F1值分別達(dá)到了0.77,0.64,0.74)。

    以上一系列實(shí)驗(yàn)說(shuō)明,在對(duì)中醫(yī)臨床病歷進(jìn)行命名實(shí)體抽取時(shí),特征模板集MT3具有最好的效果。即除了使用基本特征意外,額外選用實(shí)體指示詞特征、詞典特征和構(gòu)詞模式特征。

    4.2 CRF與其他模型的比較

    分別在冠心病和糖尿病數(shù)據(jù)集上對(duì)使用特征模板MT3的CRF和HMM,MEMM進(jìn)行命名實(shí)體抽取對(duì)照實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果如表7所示。

    表7 CRF與其他模型的中醫(yī)病歷命名實(shí)體抽取比較

    實(shí)驗(yàn)顯示,在中醫(yī)臨床病歷標(biāo)準(zhǔn)數(shù)據(jù)集上,CRF命名實(shí)體抽取的性能最好,MEMM次之,HMM最差。從實(shí)驗(yàn)結(jié)果可知,HMM未能對(duì)疾病和誘因進(jìn)行有效的抽取。這是因?yàn)镠MM是一種產(chǎn)生式模型,模型依賴于大規(guī)模數(shù)據(jù)集。而在中醫(yī)病歷中,相對(duì)于癥狀實(shí)體,疾病實(shí)體和誘因出現(xiàn)的次數(shù)很少。除此之外,由于HMM模型是建立在條件獨(dú)立假設(shè)和觀察獨(dú)立假設(shè)之上的,這些假設(shè)使得HMM不能很好地利用數(shù)據(jù)特征集。MEMM模型對(duì)癥狀實(shí)體的抽取效果比較好(冠心病F1值達(dá)到了0.76;糖尿病F1值達(dá)到了0.74),但在對(duì)疾病和誘因的抽取上結(jié)果不夠理想。這是因?yàn)镸EMM模型存在標(biāo)注偏置問(wèn)題[5]。CRF是判別式模型且它的概率圖模型是無(wú)向圖,所以CRF能充分利用病歷中的特征;另一方面,CRF在所有狀態(tài)上進(jìn)行全局歸一化,可求得全局的最優(yōu)解,解決了標(biāo)注偏置問(wèn)題。所以相對(duì)于其他模型,CRF更適合對(duì)中醫(yī)臨床病歷的命名實(shí)體抽取。

    5 結(jié)束語(yǔ)

    從基于字特征的命名實(shí)體抽取實(shí)驗(yàn)研究可見(jiàn),采用基于CRF的方法對(duì)中醫(yī)病歷的主體內(nèi)容,如主訴和現(xiàn)病史進(jìn)行癥狀、誘因和疾病名稱的自動(dòng)抽取是可行的。癥狀名稱的抽取由于在標(biāo)注語(yǔ)料集中具有較多的出現(xiàn)率而達(dá)到較好的性能,后續(xù)研究將通過(guò)構(gòu)建更大規(guī)模的語(yǔ)料集,擬在CRF的基礎(chǔ)上探索研制一種更加實(shí)用高效的中醫(yī)病歷命名實(shí)體抽取方法。

    [1] 周雪忠.文本挖掘在中醫(yī)藥中的若干應(yīng)用研究[D].杭州:浙江大學(xué),2004.

    [2] Zhou Xuezhong,Peng Yonghong,Liu Baoyan.Text Mining for Traditional Chinese Medical Knowledge Discovery:A Survey[J].JournalofBiomedical Informatics,2010,43(4):650-660.

    [3] Zhou Xuezhong,Liu Baoyan,Wang Yinghui,et al. Building ClinicalData Warehouse for Traditional Chinese Medicine Knowledge Discovery[C]//Proc.of International Conference on BioMedical Engineering and Informatics.[S.l.]:IEEE Press,2008:615-620.

    [4] Zhou Xuezhong,Chen Shibo,Liu Baoyan,etal. Development of Traditional Chinese Medicine Clinical Data Warehouse for Medical Knowledge Discovery and Decision Support[J].Artificial Intelligence in Medicine, 2010,48(2/3):139-152.

    [5] Lafferty J D,McCallum A,Pereira F C N.Conditional Random Fields:Probabilistic Models for Segmenting and Labeling Sequence Data[C]//Proc.ofthe 18th International Conference on Machine Learning.[S.l.]: Morgan Kaufmann Publishers Inc.,2001:282-289.

    [6] 熊 英.中文自然語(yǔ)言理解中基于條件隨機(jī)場(chǎng)理論的詞法分析研究[D].上海:上海交通大學(xué),2009.

    [7] Franzén K,Eriksson G,Olsson F,et al.Protein Names and How to Find Them[J].International Journal of medical Informatics,2002,67(1):49-61.

    [8] Kim J D,Ohta T,Tsuruoka Y,et al.Introduction to the Bio-Entity Recognition Task at JNLPBA[C]//Proc.of InternationalJointWorkshop on NaturalLanguage Processing in Biomedicine and Its Applications.[S.l.]: IEEE Press,2004:70-75.

    [9] 宗成慶.統(tǒng)計(jì)自然語(yǔ)言處理[M].北京:清華大學(xué)出版社,2008.

    [10] Freitag D,McCallum A.Information Extraction with HMM Structures Learned by Stochastic Optimization [C]//Proc.of the National Conference on Artificial Intelligence.[S.l.]:AAAI Press,2000:584-589.

    [11] McCallum A,Freitag D,Pereira F.Maximum Entropy Markov Models for Information Extraction and Segmentation[C]//Proc.of the 17th International Conference on Machine Learning.Pittsburgh,USA:[s.n.],2000: 591-598.

    [12] McCallum A K.Mallet:A Machine Learning for Language Toolkit[EB/OL].(2002-02-28).http:// mallet.cs.umass.edu.

    編輯 顧逸斐

    Named Entity Extraction of Traditional Chinese Medicine
    Medical Records Based on Conditional Random Field

    LIU Kai1a,ZHOU Xue-zhong1a,1b,YU Jian1a,1b,ZHANG Run-shun2
    (1a.School of Computer and Information Technology;1b.Beijing Key Lab of Traffic Data Analysis and Mining,Beijing Jiaotong University,Beijing 100044,China;2.Guang'anmen Hospital,China Academy of Chinese Medical Sciences,Beijing 100053,China)

    Traditional Chinese Medicine(TCM)medical records are the important data resources of the TCM medical research.The main form of them is still text now,and it is necessary to extract the structured information from the medical records,while named entity extraction is the basic step.It makes 413 copies of manually labeled medical records in Chinese text and four types of feature templates to study about the named entity extraction practice such as symptoms, diseases and incentives.It compares the results of TCM medical records named entity extraction by Conditional Random Field(CRF),Hidden Markov Model(HMM)and Maximum Entropy Markov Model(MEMM).Combined with appropriate feature templates,CRF has well performance of F1:symptoms 0.80,the name of the disease 0.74,incentives 0.74.Compared with HMM and MEMM,CRF has the highest precision and recall rate.This preliminary shows that CRF is an applicable method of the Chinese medical records named entity extraction.

    Traditional Chinese Medicine(TCM)medical records;named entity extraction;corpus annotation system; Conditional Random Field(CRF);feature template

    1000-3428(2014)09-0312-05

    A

    TP391

    10.3969/j.issn.1000-3428.2014.09.062

    國(guó)家自然科學(xué)基金資助項(xiàng)目(61105055,81230086);國(guó)家“863”計(jì)劃基金資助項(xiàng)目(2012AA02A609);中央高?;究蒲袠I(yè)務(wù)費(fèi)專項(xiàng)基金資助項(xiàng)目(K13JB00140)。

    劉 凱(1986-),男,碩士,主研方向:文本信息抽取;周雪忠(通訊作者),副教授;于 劍、張潤(rùn)順,教授。

    2013-06-07

    2013-08-21E-mail:xzzhou@bjtu.edu.cn

    猜你喜歡
    誘因命名病歷
    強(qiáng)迫癥病歷簿
    憋尿是尿路感染的重要誘因之一
    公路施工安全事故誘因與預(yù)警管理的探討
    命名——助力有機(jī)化學(xué)的學(xué)習(xí)
    “大數(shù)的認(rèn)識(shí)”的診斷病歷
    幼兒攻擊性行為的誘因及干預(yù)策略
    甘肅教育(2020年21期)2020-04-13 08:08:28
    有一種男人以“暖”命名
    東方女性(2018年3期)2018-04-16 15:30:02
    為一條河命名——在白河源
    為何要公開(kāi)全部病歷?
    村醫(yī)未寫(xiě)病歷,誰(shuí)之過(guò)?
    草草在线视频免费看| 性插视频无遮挡在线免费观看| 美女免费视频网站| 91字幕亚洲| 波多野结衣高清无吗| 久久国产乱子伦精品免费另类| 国产极品精品免费视频能看的| 最近视频中文字幕2019在线8| 亚洲国产欧美人成| 国产一区二区三区在线臀色熟女| 国产精品精品国产色婷婷| 国产精品爽爽va在线观看网站| av视频在线观看入口| 男人和女人高潮做爰伦理| 青草久久国产| 欧美xxxx黑人xx丫x性爽| 女人十人毛片免费观看3o分钟| 搡老妇女老女人老熟妇| 制服丝袜大香蕉在线| 天美传媒精品一区二区| 如何舔出高潮| 日韩国内少妇激情av| 日本免费一区二区三区高清不卡| 亚洲av日韩精品久久久久久密| 亚洲五月婷婷丁香| 十八禁国产超污无遮挡网站| 国产一级毛片七仙女欲春2| 高清日韩中文字幕在线| 亚洲最大成人手机在线| 看片在线看免费视频| 亚洲一区二区三区色噜噜| 黄色女人牲交| 18禁裸乳无遮挡免费网站照片| 首页视频小说图片口味搜索| 午夜激情欧美在线| 免费在线观看亚洲国产| 国产淫片久久久久久久久 | 久久久久久久午夜电影| 亚洲狠狠婷婷综合久久图片| 亚洲七黄色美女视频| 国产精品久久久久久人妻精品电影| 国产精品日韩av在线免费观看| 亚洲性夜色夜夜综合| 亚洲av电影在线进入| 婷婷色综合大香蕉| 欧美日本亚洲视频在线播放| 亚洲乱码一区二区免费版| 亚洲精品一区av在线观看| 日本与韩国留学比较| 美女大奶头视频| 亚洲精品日韩av片在线观看| 男女做爰动态图高潮gif福利片| 九九久久精品国产亚洲av麻豆| 精品久久久久久久久av| 欧美一区二区亚洲| 91久久精品国产一区二区成人| 午夜免费激情av| bbb黄色大片| 国产视频内射| 免费看日本二区| 国产大屁股一区二区在线视频| 精品不卡国产一区二区三区| 九九久久精品国产亚洲av麻豆| 久久午夜福利片| 99热这里只有是精品在线观看 | 久久精品久久久久久噜噜老黄 | 亚洲男人的天堂狠狠| 高潮久久久久久久久久久不卡| 伦理电影大哥的女人| 亚洲,欧美,日韩| 他把我摸到了高潮在线观看| 一级a爱片免费观看的视频| 欧美精品国产亚洲| 三级国产精品片| 中国美白少妇内射xxxbb| av在线观看视频网站免费| 偷拍熟女少妇极品色| 久久99热6这里只有精品| 国产成人一区二区在线| 免费播放大片免费观看视频在线观看| 大香蕉97超碰在线| 男女那种视频在线观看| 永久网站在线| 国产欧美另类精品又又久久亚洲欧美| 乱系列少妇在线播放| 久久久精品免费免费高清| 国产在线一区二区三区精| 黄色日韩在线| 少妇的逼好多水| 午夜爱爱视频在线播放| 久久久精品免费免费高清| 亚洲一区二区三区欧美精品 | 少妇猛男粗大的猛烈进出视频 | 精品熟女少妇av免费看| 久久热精品热| 一区二区三区精品91| 男的添女的下面高潮视频| 欧美精品人与动牲交sv欧美| 亚洲精品视频女| 美女主播在线视频| 国产精品久久久久久av不卡| 国产精品麻豆人妻色哟哟久久| 九九在线视频观看精品| 亚洲精品国产色婷婷电影| 国产视频内射| 99精国产麻豆久久婷婷| av一本久久久久| 国产精品国产三级国产专区5o| 麻豆成人av视频| 久久精品国产自在天天线| 美女内射精品一级片tv| 国产色爽女视频免费观看| 欧美xxⅹ黑人| 国产精品精品国产色婷婷| 久热久热在线精品观看| 精品国产露脸久久av麻豆| 一本色道久久久久久精品综合| 禁无遮挡网站| 久久亚洲国产成人精品v| 久久97久久精品| 国产精品国产三级国产专区5o| 伊人久久精品亚洲午夜| 我的女老师完整版在线观看| 久久精品夜色国产| 国产成人freesex在线| 国产精品秋霞免费鲁丝片| 丰满少妇做爰视频| 青春草视频在线免费观看| 亚洲一区二区三区欧美精品 | 人体艺术视频欧美日本| 国产欧美另类精品又又久久亚洲欧美| 成人鲁丝片一二三区免费| 成人免费观看视频高清| 视频区图区小说| 18禁裸乳无遮挡免费网站照片| 日韩电影二区| 自拍偷自拍亚洲精品老妇| 一区二区三区四区激情视频| 免费少妇av软件| 中文字幕av成人在线电影| 欧美性猛交╳xxx乱大交人| 香蕉精品网在线| 夫妻性生交免费视频一级片| 丰满人妻一区二区三区视频av| 噜噜噜噜噜久久久久久91| 亚洲精品国产av成人精品| 亚洲精品456在线播放app| 免费看不卡的av| 人体艺术视频欧美日本| 国产精品偷伦视频观看了| 一边亲一边摸免费视频| 天美传媒精品一区二区| 国产淫片久久久久久久久| 欧美成人午夜免费资源| 小蜜桃在线观看免费完整版高清| 最近中文字幕2019免费版| 自拍偷自拍亚洲精品老妇| 亚洲伊人久久精品综合| 男女边吃奶边做爰视频| 国产成人免费无遮挡视频| 狂野欧美激情性bbbbbb| 久久久a久久爽久久v久久| 国产欧美日韩精品一区二区| 国产白丝娇喘喷水9色精品| 国产免费一级a男人的天堂| 男女下面进入的视频免费午夜| 高清av免费在线| 欧美激情在线99| 久久久久网色| 亚洲天堂国产精品一区在线| 成人毛片60女人毛片免费| 青青草视频在线视频观看| 久久久久久久久久久丰满| 午夜福利网站1000一区二区三区| 少妇猛男粗大的猛烈进出视频 | 久久久精品欧美日韩精品| 午夜精品国产一区二区电影 | 亚洲aⅴ乱码一区二区在线播放| 别揉我奶头 嗯啊视频| 亚洲av日韩在线播放| 搡老乐熟女国产| 国产精品蜜桃在线观看| 国产成人午夜福利电影在线观看| 亚洲国产日韩一区二区| 男女啪啪激烈高潮av片| 国产国拍精品亚洲av在线观看| videossex国产| 一级av片app| 国产成人a区在线观看| 99re6热这里在线精品视频| 国产成人精品久久久久久| 看非洲黑人一级黄片| 一级a做视频免费观看| 禁无遮挡网站| 日本熟妇午夜| 中国三级夫妇交换| 一级av片app| 欧美三级亚洲精品| 69人妻影院| 精品久久久噜噜| 91精品伊人久久大香线蕉| 天堂网av新在线| 欧美日韩在线观看h| 欧美成人一区二区免费高清观看| 日日摸夜夜添夜夜添av毛片| 国产成人免费观看mmmm| 国产精品久久久久久久久免| 制服丝袜香蕉在线| 久久午夜福利片| 国产又色又爽无遮挡免| 国产欧美另类精品又又久久亚洲欧美| 免费黄网站久久成人精品| 成人毛片a级毛片在线播放| 国精品久久久久久国模美| 国产免费又黄又爽又色| 又大又黄又爽视频免费| 国产69精品久久久久777片| 熟女电影av网| 亚洲,一卡二卡三卡| 老女人水多毛片| 麻豆久久精品国产亚洲av| 97超视频在线观看视频| 禁无遮挡网站| 国产日韩欧美在线精品| 精品人妻偷拍中文字幕| 日韩av免费高清视频| 亚洲婷婷狠狠爱综合网| 如何舔出高潮| 国产午夜精品一二区理论片| 欧美精品人与动牲交sv欧美| 国产精品人妻久久久影院| 久久午夜福利片| 成人鲁丝片一二三区免费| 成年女人在线观看亚洲视频 | 国模一区二区三区四区视频| 日韩一区二区视频免费看| 国产黄色免费在线视频| 国产精品爽爽va在线观看网站| 少妇 在线观看| 免费人成在线观看视频色| 一级毛片黄色毛片免费观看视频| 视频区图区小说| 少妇猛男粗大的猛烈进出视频 | 亚洲av国产av综合av卡| 亚洲国产欧美人成| av女优亚洲男人天堂| 日本一本二区三区精品| 成人毛片60女人毛片免费| 免费观看无遮挡的男女| 另类亚洲欧美激情| 国产精品人妻久久久影院| 18禁动态无遮挡网站| 国产高潮美女av| 18禁在线无遮挡免费观看视频| 欧美高清成人免费视频www| 一级毛片 在线播放| 韩国高清视频一区二区三区| 日韩av不卡免费在线播放| 一区二区三区乱码不卡18| 久久久久久久久久成人| 听说在线观看完整版免费高清| 国产综合懂色| 亚洲国产精品专区欧美| 免费黄网站久久成人精品| 蜜臀久久99精品久久宅男| 亚洲va在线va天堂va国产| 欧美+日韩+精品| 有码 亚洲区| 中文在线观看免费www的网站| 哪个播放器可以免费观看大片| 国产 精品1| 99视频精品全部免费 在线| 国产视频首页在线观看| 精品久久久久久久人妻蜜臀av| 免费电影在线观看免费观看| av线在线观看网站| 视频区图区小说| 成年免费大片在线观看| 国产精品国产三级专区第一集| 一本久久精品| 国产老妇女一区| av国产精品久久久久影院| 人妻 亚洲 视频| 一本—道久久a久久精品蜜桃钙片 精品乱码久久久久久99久播 | 亚洲精品日韩在线中文字幕| 在线 av 中文字幕| av福利片在线观看| 国产男人的电影天堂91| 成人无遮挡网站| 亚洲aⅴ乱码一区二区在线播放| 青春草国产在线视频| 精品国产一区二区三区久久久樱花 | 亚洲国产最新在线播放| 波多野结衣巨乳人妻| av在线观看视频网站免费| 久久99热这里只频精品6学生| 伊人久久国产一区二区| 午夜福利高清视频| 国产成人a∨麻豆精品| 大又大粗又爽又黄少妇毛片口| 久久久久精品久久久久真实原创| 免费黄色在线免费观看| 全区人妻精品视频| 午夜亚洲福利在线播放| 国产成人精品一,二区| 2021天堂中文幕一二区在线观| 日韩免费高清中文字幕av| 日韩电影二区| 午夜福利在线在线| 国语对白做爰xxxⅹ性视频网站| a级一级毛片免费在线观看| 成人黄色视频免费在线看| 好男人视频免费观看在线| 久久精品熟女亚洲av麻豆精品| 成人毛片a级毛片在线播放| 精品久久久精品久久久| 欧美区成人在线视频| 国产av国产精品国产| 人人妻人人爽人人添夜夜欢视频 | 身体一侧抽搐| 日韩欧美精品免费久久| av福利片在线观看| 欧美日韩国产mv在线观看视频 | 一区二区av电影网| av线在线观看网站| 亚洲欧洲国产日韩| 直男gayav资源| 又大又黄又爽视频免费| 日本三级黄在线观看| 黄片wwwwww| 成人鲁丝片一二三区免费| 日日啪夜夜撸| 三级国产精品片| 亚洲一区二区三区欧美精品 | 五月伊人婷婷丁香| 中文字幕制服av| 亚洲欧美精品专区久久| 天堂俺去俺来也www色官网| 午夜日本视频在线| 麻豆精品久久久久久蜜桃| 亚洲精品自拍成人| 少妇熟女欧美另类| av播播在线观看一区| 三级国产精品片| 亚洲av国产av综合av卡| 久久99热6这里只有精品| 日日啪夜夜撸| 久久精品久久久久久久性| 免费高清在线观看视频在线观看| 麻豆乱淫一区二区| 亚洲自拍偷在线| 99热全是精品| 夫妻午夜视频| 亚洲av成人精品一区久久| 美女国产视频在线观看| 日本一本二区三区精品| 一级片'在线观看视频| 欧美一级a爱片免费观看看| 亚洲av免费在线观看| 国产 一区 欧美 日韩| 日本wwww免费看| av线在线观看网站| 我的女老师完整版在线观看| 国产日韩欧美在线精品| 国产黄a三级三级三级人| 成人综合一区亚洲| 麻豆国产97在线/欧美| 免费人成在线观看视频色| 一级片'在线观看视频| 青春草视频在线免费观看| 又粗又硬又长又爽又黄的视频| 国产高清三级在线| 日韩av免费高清视频| 美女被艹到高潮喷水动态| 日韩av免费高清视频| 可以在线观看毛片的网站| 久久人人爽人人爽人人片va| 波多野结衣巨乳人妻| 国产视频首页在线观看| 特级一级黄色大片| 午夜福利视频精品| 欧美日韩综合久久久久久| 18禁裸乳无遮挡免费网站照片| 熟女电影av网| 男人爽女人下面视频在线观看| 成人毛片60女人毛片免费| 人妻少妇偷人精品九色| 日日啪夜夜撸| 国产精品久久久久久久久免| 欧美日韩视频精品一区| 亚洲不卡免费看| 免费av毛片视频| 免费黄频网站在线观看国产| 亚洲内射少妇av| 久热这里只有精品99| 又粗又硬又长又爽又黄的视频| 可以在线观看毛片的网站| 成人特级av手机在线观看| 免费看不卡的av| 久久人人爽av亚洲精品天堂 | 深夜a级毛片| 韩国高清视频一区二区三区| 久久精品国产自在天天线| 亚洲美女搞黄在线观看| 高清日韩中文字幕在线| 日韩电影二区| av在线天堂中文字幕| 久久精品国产亚洲av涩爱| 亚洲av电影在线观看一区二区三区 | 亚洲欧美精品专区久久| 久久久久久久国产电影| 99久久中文字幕三级久久日本| 国产 一区 欧美 日韩| 精品午夜福利在线看| 成年女人在线观看亚洲视频 | h日本视频在线播放| 一区二区三区免费毛片| 成人毛片60女人毛片免费| 狂野欧美激情性bbbbbb| 少妇人妻一区二区三区视频| 午夜精品国产一区二区电影 | 女的被弄到高潮叫床怎么办| 久久久久久久久大av| 又黄又爽又刺激的免费视频.| 国产av不卡久久| 日韩欧美一区视频在线观看 | 午夜激情久久久久久久| 亚洲欧美成人精品一区二区| 欧美zozozo另类| 夫妻性生交免费视频一级片| 成年人午夜在线观看视频| 亚洲精品亚洲一区二区| 国产精品蜜桃在线观看| 色吧在线观看| 日韩电影二区| 在线观看美女被高潮喷水网站| 看非洲黑人一级黄片| 色婷婷久久久亚洲欧美| 国产精品国产三级专区第一集| 国产精品伦人一区二区| 国产精品秋霞免费鲁丝片| 日本一本二区三区精品| 亚洲精品国产色婷婷电影| 91狼人影院| 亚洲国产精品成人综合色| 精品国产露脸久久av麻豆| 亚洲国产色片| 欧美日韩在线观看h| 欧美高清性xxxxhd video| 色吧在线观看| 久久久欧美国产精品| 精品少妇久久久久久888优播| 国产精品.久久久| 插阴视频在线观看视频| 中文天堂在线官网| 一级av片app| 菩萨蛮人人尽说江南好唐韦庄| 天堂网av新在线| 久久久精品欧美日韩精品| 黄色配什么色好看| 99久国产av精品国产电影| 22中文网久久字幕| 晚上一个人看的免费电影| 免费av毛片视频| 一级毛片aaaaaa免费看小| 免费大片18禁| 欧美最新免费一区二区三区| 国产淫片久久久久久久久| 免费看a级黄色片| 欧美高清性xxxxhd video| xxx大片免费视频| 亚洲精品一二三| 一二三四中文在线观看免费高清| 日本黄大片高清| 在线免费观看不下载黄p国产| av播播在线观看一区| 久久精品国产a三级三级三级| 啦啦啦在线观看免费高清www| 国产欧美日韩精品一区二区| 国产黄片视频在线免费观看| av.在线天堂| 亚洲欧美日韩另类电影网站 | 国产精品国产三级国产av玫瑰| 国产伦精品一区二区三区四那| 综合色丁香网| 欧美日韩一区二区视频在线观看视频在线 | 伊人久久国产一区二区| 国产精品三级大全| 国产毛片a区久久久久| 午夜福利视频1000在线观看| 欧美亚洲 丝袜 人妻 在线| 在线亚洲精品国产二区图片欧美 | 欧美高清成人免费视频www| 亚洲欧美日韩卡通动漫| 国产精品一区二区性色av| 美女高潮的动态| 一区二区av电影网| 久久久精品免费免费高清| 一区二区三区四区激情视频| 身体一侧抽搐| 嘟嘟电影网在线观看| 我的女老师完整版在线观看| 97超碰精品成人国产| 天天躁日日操中文字幕| 午夜福利高清视频| 亚洲人成网站在线播| 中文精品一卡2卡3卡4更新| 亚洲,欧美,日韩| 亚洲va在线va天堂va国产| freevideosex欧美| 精品亚洲乱码少妇综合久久| 一级毛片电影观看| 亚洲色图av天堂| 国产人妻一区二区三区在| 黄片无遮挡物在线观看| 国产欧美日韩一区二区三区在线 | 尾随美女入室| 国模一区二区三区四区视频| freevideosex欧美| 极品少妇高潮喷水抽搐| 在线观看国产h片| 成人亚洲欧美一区二区av| 精品人妻熟女av久视频| 最新中文字幕久久久久| 精品视频人人做人人爽| 日日摸夜夜添夜夜爱| 亚洲精品aⅴ在线观看| 久热久热在线精品观看| 欧美精品国产亚洲| 久久久久国产网址| 国产老妇伦熟女老妇高清| 日本午夜av视频| 欧美97在线视频| 欧美一区二区亚洲| 天堂中文最新版在线下载 | 日韩一本色道免费dvd| 免费黄网站久久成人精品| 精品久久国产蜜桃| h日本视频在线播放| 狂野欧美白嫩少妇大欣赏| 国产伦精品一区二区三区视频9| 国产爽快片一区二区三区| 少妇人妻 视频| 人妻制服诱惑在线中文字幕| 色哟哟·www| 国产精品人妻久久久久久| 日韩不卡一区二区三区视频在线| 一级毛片久久久久久久久女| 在线精品无人区一区二区三 | 亚洲国产精品成人综合色| 亚洲av二区三区四区| 亚洲综合精品二区| 午夜福利在线观看免费完整高清在| 国产精品熟女久久久久浪| 日韩欧美 国产精品| 99热6这里只有精品| av国产免费在线观看| 91精品国产九色| 日韩中字成人| 日本三级黄在线观看| 中国三级夫妇交换| 在线观看人妻少妇| 免费播放大片免费观看视频在线观看| 国产 一区 欧美 日韩| av免费在线看不卡| 亚洲精品国产av蜜桃| 国产成人免费观看mmmm| 午夜免费观看性视频| 亚洲av一区综合| 久久久久国产网址| 久久国内精品自在自线图片| 亚洲一区二区三区欧美精品 | 亚洲熟女精品中文字幕| 亚洲不卡免费看| 国产男人的电影天堂91| 人人妻人人看人人澡| 亚洲精品久久午夜乱码| 国产一区二区三区综合在线观看 | 日韩不卡一区二区三区视频在线| 伊人久久国产一区二区| www.色视频.com| 国产成人a区在线观看| 一级a做视频免费观看| 另类亚洲欧美激情| 欧美日韩视频高清一区二区三区二| 九草在线视频观看| 午夜老司机福利剧场| 久久人人爽av亚洲精品天堂 | 国产有黄有色有爽视频| 国产淫片久久久久久久久| 亚洲一区二区三区欧美精品 | 91aial.com中文字幕在线观看| 国产欧美日韩一区二区三区在线 | 性色av一级| 深夜a级毛片| av线在线观看网站| 99久久中文字幕三级久久日本| 男人添女人高潮全过程视频| 国产精品爽爽va在线观看网站| 国产伦在线观看视频一区| 国产高清有码在线观看视频| 亚洲av二区三区四区| 欧美日韩国产mv在线观看视频 | 欧美精品人与动牲交sv欧美| 亚洲精品成人av观看孕妇| 国产真实伦视频高清在线观看| 中文字幕免费在线视频6| 日韩三级伦理在线观看| 80岁老熟妇乱子伦牲交| 18禁在线播放成人免费| 久久女婷五月综合色啪小说 | 国产精品人妻久久久久久| 国产免费视频播放在线视频| 寂寞人妻少妇视频99o| 麻豆精品久久久久久蜜桃|