• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    中文電子病歷信息提取方法研究綜述

    2024-02-28 01:26:18吉旭瑞魏德健張俊忠
    計算機(jī)工程與科學(xué) 2024年2期
    關(guān)鍵詞:方法模型

    吉旭瑞,魏德健,張俊忠,張 帥,曹 慧

    (山東中醫(yī)藥大學(xué)智能與信息工程學(xué)院,山東 濟(jì)南 250355)

    1 引言

    近年來,人工智能和大數(shù)據(jù)的普及帶動了各個行業(yè)的發(fā)展。在與人們健康息息相關(guān)的醫(yī)療行業(yè)中,每天都會產(chǎn)生大量的醫(yī)療數(shù)據(jù)。在這些數(shù)據(jù)中,電子病歷EMR(Electronic Medical Record)的重要性不言而喻。同時,作為智慧醫(yī)療建設(shè)的重要一環(huán),電子病歷已逐漸被各大醫(yī)院所使用。電子病歷以病人為主體,記錄著患者的個人基本信息、就診時間、發(fā)病時間、癥狀、診斷結(jié)果以及患者的治療情況。相比于傳統(tǒng)的紙質(zhì)病歷,電子病歷依托計算機(jī)相關(guān)技術(shù)處理患者的這些信息,從而形成結(jié)構(gòu)化的病例報告,便于醫(yī)生對患者進(jìn)行更準(zhǔn)確的診斷治療。因此,如何從電子病歷中提取出跟患者病情相關(guān)的信息,也就成為了現(xiàn)如今電子病歷數(shù)據(jù)挖掘的重要研究方向[1]。

    在提取電子病歷信息的任務(wù)中,最為關(guān)鍵的2個內(nèi)容就是中文電子病歷命名實體識別和實體關(guān)系抽取。其中,中文電子病歷命名實體識別是提取電子病歷中醫(yī)療信息的第一步,實體關(guān)系抽取則是構(gòu)建醫(yī)療知識數(shù)據(jù)庫的基礎(chǔ)[2]。隨著深度學(xué)習(xí)在其他領(lǐng)域的廣泛應(yīng)用,很多研究人員嘗試使用深度學(xué)習(xí)技術(shù)提取電子病歷中的信息,也都取得了不錯的效果[3,4]。

    本文從國內(nèi)外中文電子病歷的研究現(xiàn)狀入手,針對電子病歷中的信息提取部分,分析現(xiàn)階段中文電子病歷在命名實體識別和實體關(guān)系抽取2方面的研究進(jìn)展,討論更加合適的應(yīng)用技術(shù),為更進(jìn)一步的探索提供參考。

    2 中文電子病歷信息提取研究現(xiàn)狀

    電子病歷是我國醫(yī)療信息化中不可缺少的部分,因此國內(nèi)對于電子病歷的相關(guān)研究在近年來得到了廣泛關(guān)注。國外的許多發(fā)達(dá)國家在信息化建設(shè)的道路上開始較早,他們建立電子病歷檔案至今已經(jīng)有五十多年的歷史了。在政府的大力支持下,國外電子病歷的規(guī)模逐漸壯大,形成了一套較為完整的醫(yī)療信息體系。國外研究人員在處理電子病歷數(shù)據(jù)時,主要是在命名實體識別和實體關(guān)系抽取2個方面進(jìn)行,這一點(diǎn)跟國內(nèi)對電子病歷的研究類似。不過,中文跟英文不同,它有著許多英文所不具備的特點(diǎn)[5]。例如,英文會用空格將2個單詞隔開,這在處理時能夠很好地找到實體的邊界,但中文則只能以單個漢字為最小的單位來進(jìn)行命名實體識別和實體關(guān)系抽取。這無疑給中文電子病歷數(shù)據(jù)的信息提取帶來了不小的挑戰(zhàn)。現(xiàn)如今在處理中文電子病歷數(shù)據(jù)時,還存在以下問題:(1)不論進(jìn)行命名實體識別任務(wù)還是進(jìn)行實體關(guān)系抽取任務(wù),所使用的數(shù)據(jù)集都需要專業(yè)人員手工標(biāo)注,標(biāo)注的工程龐大且繁瑣,這也給電子病歷的信息抽取設(shè)置了無形的障礙。(2)各大醫(yī)院電子病歷的標(biāo)準(zhǔn)化程度不同,這樣很難將訓(xùn)練好的模型適用于不同醫(yī)院的電子病歷信息提取任務(wù)中。因此,需要一些政策的指引來不斷完善電子病歷的標(biāo)準(zhǔn)化程度。

    中文電子病歷的信息提取可以將病歷文本中的核心信息快速地提取出來,并且將這些知識以形式化和結(jié)構(gòu)化的方式表示出來[6],從而讓醫(yī)生能夠更加清晰地了解患者的病情,利用已經(jīng)抽取好的醫(yī)療數(shù)據(jù)對病人的病情進(jìn)行分析。對于中文電子病歷的信息抽取流程如圖1所示。

    Figure 1 Process of Chinese electronic medical record information extraction圖1 中文電子病歷信息提取流程

    其中,中文電子病歷信息抽取過程中的核心任務(wù)為命名實體識別、實體修飾識別和實體關(guān)系抽取[7]。本文接下來將會探討研究人員在處理命名實體識別和實體關(guān)系抽取2大任務(wù)時所構(gòu)建的模型,詳細(xì)闡述常用的各種研究方法;然后系統(tǒng)分析中文電子病歷所面臨的一些障礙并提出相應(yīng)的解決方案;最后再對本文研究內(nèi)容進(jìn)行總結(jié),展望中文電子病歷信息抽取今后的發(fā)展趨勢。

    3 中文電子病歷命名實體識別

    命名實體識別NER(Named Entity Recognition)是對中文電子病歷中的醫(yī)療信息進(jìn)行抽取的第一步,它是實體關(guān)系抽取任務(wù)的基礎(chǔ),影響著接下來任務(wù)的進(jìn)行。NER的主要目的是識別出與醫(yī)療信息相關(guān)的專業(yè)名詞,例如識別出電子病歷中存在的疾病名稱、藥品名稱、癥狀、醫(yī)療器械名稱和患者的身體部位等[8]。它可以將具有相同屬性的名詞歸為一類,使得醫(yī)生在處理病人病歷時能夠更高效。

    對于中文電子病歷的NER任務(wù),國內(nèi)外所采用的方法一共可分為3類[9]:基于規(guī)則與詞典的方法、基于機(jī)器學(xué)習(xí)的方法和基于深度學(xué)習(xí)的方法。這3種方法也代表了NER技術(shù)發(fā)展的路線,但現(xiàn)如今研究人員大多選擇將不同的方法融合在一起來處理NER任務(wù)[10-13],并取得了非常不錯的效果,這也給未來NER任務(wù)研究提供了參考。

    3.1 電子病歷命名實體識別評價指標(biāo)

    中文電子病歷命名實體識別常用的評價指標(biāo)包括精確率P(Precision)、召回率R(Recall)和F-Measure。這3種指標(biāo)都是通過真陽性TP(True Positive)、假陽性FP(False Positive)以及假陰性FN(False Negative)3個參數(shù)計算得出的。具體的計算如式(1)~式(3)所示:

    (1)

    (2)

    (3)

    其中,TP表示模型識別出正確實體的樣本數(shù);FP表示模型能夠識別出實體,但識別結(jié)果不正確的樣本數(shù);FN表示沒有被成功識別的樣本數(shù);α是用于平衡精確率和召回率的參數(shù)。特別地,當(dāng)α=1時,評價指標(biāo)可表示為F1-Measure。F1-Measure的值越高表示模型的效果越好。

    3.2 電子病歷命名實體識別常用方法

    3.2.1 基于規(guī)則與詞典的方法

    基于規(guī)則與詞典的方法是研究人員早期所采用的方法。該方法實際上是一種模式匹配范式。基于規(guī)則的專業(yè)詞典是模式匹配的基礎(chǔ),詞典和規(guī)則都需要人工編寫。在構(gòu)建詞典的過程中,需要專業(yè)人員將醫(yī)療領(lǐng)域中的專業(yè)名詞和術(shù)語等收集在一起,再進(jìn)行相應(yīng)的整理,最后構(gòu)建出專業(yè)詞典作為模式匹配的模板。在構(gòu)建好詞典后,再結(jié)合實體構(gòu)造規(guī)則,提取出相應(yīng)的實體。另外,相應(yīng)的實體規(guī)則還能夠彌補(bǔ)文本中缺少專有名詞的缺陷?;谝?guī)則與詞典的方法通過建立詞典、制定規(guī)則,能有效地識別出相應(yīng)的命名實體,同時詞典的完備性和規(guī)則的可行性也直接決定著命名實體識別最終的效果。顯然,這種方法實行起來難度不大,只要有專業(yè)的詞典以及相應(yīng)的規(guī)則作為基礎(chǔ),就能完成命名實體識別的任務(wù)。但是,由于國內(nèi)外開展自然語言處理NLP(Natural Language Processing)的時間不同,詞典的建立也存在著很大的差距。

    在國外,UMLS(Unified Medical Language System)[14]和ICD-10(International Classification of Diseases 10)[15]等都是具有權(quán)威性的醫(yī)療詞典,國外許多研究人員以這些權(quán)威性詞典為基礎(chǔ),早期開發(fā)出了一些實體識別工具。Savova等[16]開發(fā)了臨床文本分析和知識提取系統(tǒng)CTAKES(Clinical Text Analysis and Knowledge Extraction System)。該系統(tǒng)基于UMLS實現(xiàn)NER并對其結(jié)果進(jìn)行評估,最終得到的最佳成績中精確匹配的F-Measure為71.5%,重疊匹配的F-Measure為82.4%。Scott等[17]從轉(zhuǎn)錄的醫(yī)生筆記中使用正則表達(dá)式提取出藥物、劑量等命名實體。Yang等[18]使用縮寫定義識別算法擴(kuò)展了生物實體名稱字典,提高了詞典識別實體的性能,最終F-Measure達(dá)到了68.80%。在國內(nèi),楊錦鋒等[19]制定了命名實體和實體關(guān)系的標(biāo)注規(guī)范并構(gòu)建了命名實體和實體關(guān)系標(biāo)注語料庫,這也為中文電子病歷研究提供了一個良好的開端;蘇嘉等[20]針對心血管疾病領(lǐng)域制定了專門的標(biāo)注語料庫。但是,由于對NLP的研究起步較晚,國內(nèi)并沒有建立像國外如此完善的醫(yī)療詞典庫及相關(guān)規(guī)則。建立詞典需要很多專家且要花費(fèi)大量的時間,成本較高,需要定期維護(hù)。因此,基于規(guī)則與詞典的方法在處理中文電子病歷的NER任務(wù)時使用起來較為困難。不過,一旦建造出專業(yè)性強(qiáng)、完備性好的詞典,基于規(guī)則與詞典的方法也將會為NER任務(wù)提供很大的便利。

    3.2.2 基于機(jī)器學(xué)習(xí)的方法

    基于規(guī)則與詞典方法的缺點(diǎn)注定使其不能夠長期被人們所用,機(jī)器學(xué)習(xí)的快速發(fā)展讓研究人員更多地使用機(jī)器學(xué)習(xí)方法來處理NER任務(wù)。NER任務(wù)也轉(zhuǎn)化為給每個實體賦予相應(yīng)的標(biāo)記?;跈C(jī)器學(xué)習(xí)的NER方法主要是基于分類的方法和基于序列標(biāo)注的方法[7]。相比于基于規(guī)則和詞典的方法,基于機(jī)器學(xué)習(xí)的方法需要的人力更少,成本較低[21]。因此,近年來有很多研究人員使用不同的機(jī)器學(xué)習(xí)模型來進(jìn)行中文電子病歷的命名實體識別。

    隱馬爾可夫模型HMM(Hidden Markov Model)是NER任務(wù)研究初期使用較為廣泛的機(jī)器學(xué)習(xí)模型,是一種序列標(biāo)注方法。通過給定的輸入序列,計算出概率最大的標(biāo)記序列,再通過Viterbi算法得出命名實體識別序列標(biāo)注的最優(yōu)解。Zhang等[22]使用基于HMM的級聯(lián)識別方法訓(xùn)練出了基于HMM的命名實體識別模型,并在GENIA V3.02 和 V1.1語料庫上進(jìn)行了測試,分別得到了66.5%和62.5% 的F-Measure值。但是,HMM只考慮了當(dāng)前所觀察的對象,這就要求文本語句上下文具有很高的獨(dú)立性。電子病歷的上下文聯(lián)系緊密,難以實現(xiàn)這種獨(dú)立性,因此HMM僅適用于篇幅較短的NER任務(wù)。

    支持向量機(jī)SVM(Support Vector Machine)也是一種使用較為廣泛的機(jī)器學(xué)習(xí)方法,是一種分類算法,早期更多地被應(yīng)用于模式識別上[23,24]。由于NER可以被視為是一種分類任務(wù),因此SVM也被應(yīng)用到了此任務(wù)中。研究人員通常將其與條件隨機(jī)場CRF(Conditional Random Field)模型進(jìn)行比較。Lei等[25]使用自己手動創(chuàng)建的中文醫(yī)療文本數(shù)據(jù)集,來對CRF和SVM等機(jī)器學(xué)習(xí)模型進(jìn)行評估,其中CRF模型在實驗中得到了93.52%的F-Measure值,而SVM得到了90.54%的F-Measure值。通過實驗也證明了基于CRF的方法在NER任務(wù)中要優(yōu)于基于SVM的方法。與HMM相比,由于CRF沒有特別嚴(yán)格的約束條件,對上下文文本可以進(jìn)行靈活的歸納,從而克服了HMM無法獲取長距離文本特征、缺乏多特征融合能力等缺點(diǎn)。因此,基于CRF的方法逐漸成為了NER任務(wù)中最受歡迎的機(jī)器學(xué)習(xí)方法。

    近幾年,作為對SVM的改進(jìn),結(jié)構(gòu)化支持向量機(jī)SSVM(Structured SVM)在NER任務(wù)中呈現(xiàn)出不錯的識別效果[26,27]。SSVM擴(kuò)展了SVM的功能,結(jié)合了SVM和CRF的優(yōu)點(diǎn),能夠處理有關(guān)結(jié)構(gòu)化的問題。Lei等[25]在其實驗中比較了SSVM和CRF在NER任務(wù)中的表現(xiàn),最終SSVM得到了93.53%的F-Measure值,SSVM在命名實體識別任務(wù)中略優(yōu)于CRF,證明了SSVM是機(jī)器學(xué)習(xí)方法中處理中文NER任務(wù)效果最好的。Zhang等[28]還將SSVM用于化學(xué)領(lǐng)域的命名實體識別并取得了不錯的效果。Tang等[29]開發(fā)了基于SSVM的NER系統(tǒng),比較SSVM和CRF在NER任務(wù)上的評估結(jié)果,SSVM得到了85.82%的F-Measure值,CRF得到了85.68%的F-Measure值,并且在不同實體類型識別中SSVM比CRF更好。表1對上述方法進(jìn)行了總結(jié)。此外,對于連續(xù)標(biāo)簽問題,SSVM也有著很好的處理能力,這也說明SSVM在中文電子病歷NER任務(wù)研究中有著較好的發(fā)展?jié)摿?。并且SSVM和CRF組合起來也會是NER任務(wù)中一個較好的研究方向。

    Table 1 Applications of rule-based methods and machine learning based methods in named entity recognition

    3.2.3 基于深度學(xué)習(xí)的方法

    近年來,深度學(xué)習(xí)逐漸成為人工智能領(lǐng)域主要的研究內(nèi)容,并且在很多應(yīng)用中都取得了不錯的成果,也在一定程度上推動了人工智能領(lǐng)域的發(fā)展。在自然語言處理中,能夠運(yùn)用在中文NER任務(wù)上的深度學(xué)習(xí)模型包括長短時記憶LSTM(Long-Short Term Memory)網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)CNN(Convolutional Neural Networks)、雙向長短時記憶Bi-LSTM(Bi-directional LSTM)網(wǎng)絡(luò)、Transformer模型以及BERT(Bidirectional Encoder Representation from Transformers)模型。以下分別對這4種模型進(jìn)行介紹:

    (1)長短時記憶網(wǎng)絡(luò)。

    長短時記憶網(wǎng)絡(luò)是最先被廣泛應(yīng)用于NER任務(wù)[30,31]的深度學(xué)習(xí)模型。這種模型是循環(huán)神經(jīng)網(wǎng)絡(luò)的一種特殊類型,擁有2個傳輸狀態(tài)cell state和hidden state,能夠有效控制特征的流通和損失。同時,長短時記憶網(wǎng)絡(luò)也是解決長距離依賴問題行之有效的模型,因此也被廣泛地用于處理文本數(shù)據(jù)。LSTM+CRF模型是當(dāng)時比較流行的組合模型。Dong等[32]針對中文命名實體識別任務(wù),采用LSTM+CRF網(wǎng)絡(luò)加強(qiáng)了每個字的部首偏旁,從而加強(qiáng)字的表示來捕捉其象形詞根特征,在中文NER任務(wù)中獲得了很好的性能,這也是針對中文NER任務(wù)第一個使用基于字符的LSTM+CRF模型,在SIGHAN Bakeoff-3中文語料庫上最終得到了90.95%的F1-Measure值。在這個基礎(chǔ)上,Zhao等[33]進(jìn)行了創(chuàng)新,提出了一種基于對抗訓(xùn)練的網(wǎng)格LSTM-CRF模型AT-Lattice LSTM-CRF(Adversarial Training-Lattice LSTM CRF),得到了89.64%的F1-Measure值。在實驗中,對抗訓(xùn)練AT不僅提高了模型的性能,還保證了神經(jīng)網(wǎng)絡(luò)方法的穩(wěn)健性。

    在中文電子病歷的NER任務(wù)中,一個詞要想被命名為一個實體,與文本的上下文通常有一定的聯(lián)系。LSTM模型盡管能夠處理長距離的文本信息,但是它不能夠?qū)Ψ聪虻奈谋緮?shù)據(jù)進(jìn)行操作。于是,Schuster等[34]于1997年提出了雙向長短時記憶(Bi-LSTM)網(wǎng)絡(luò)。這種模型能夠捕捉每個狀態(tài)的上下文,使用從左到右和從右到左的2個獨(dú)立隱藏狀態(tài),同時捕獲過去和未來的信息,以更好地捕捉上下文的語句依賴信息。在Bi-LSTM模型被用來處理中文電子病歷NER任務(wù)后,它逐漸替代了具有一定局限性的LSTM模型。

    雙向長短時記憶網(wǎng)絡(luò)克服了LSTM的劣勢,成為了近年來處理各個領(lǐng)域NER任務(wù)時使用較為廣泛的模型[35,36]。與LSTM類似,研究人員發(fā)現(xiàn)在Bi-LSTM后面接CRF層作為輸出也是一個不錯的處理方法,其模型結(jié)構(gòu)如圖2所示。由于CRF層能夠考慮標(biāo)簽之間的順序問題,因此在接收到Bi-LSTM處理完的輸入后,能夠計算出更加精確的標(biāo)簽,使得提取的精度進(jìn)一步提高。

    Figure 2 Basic structure of Bi-LSTM+CRF model圖2 Bi-LSTM+CRF模型基本結(jié)構(gòu)

    Xu等[37]使用Bi-LSTM+CRF模型在公開的NCBI(National Center for Biotechnology Information)語料庫上進(jìn)行評估,最終得到了80.22%的F1-Measure值,其結(jié)果相對于其他廣泛使用的方法要更好。還有一些使用Bi-LSTM+CRF模型的研究[38,39]在命名實體識別任務(wù)中也獲得了不錯的效果。Yin等[40]提出了基于字符偏旁等級和自注意力(Self-attention)機(jī)制的Bi-LSTM+CRF模型,在實驗中使用CNN來提取字符偏旁的特征,得到字詞之間內(nèi)部的相關(guān)性,使用自注意力機(jī)制是為了捕捉上下文文本之間的依賴性。將訓(xùn)練得到的模型在CCKS-2017(China Conference on Knowledge graph and Semantic computing 2017)數(shù)據(jù)集上進(jìn)行評估,得到了93.00%的F1-Measure值。在TP-CNER(TP-Clinical Named Entity Recognition)數(shù)據(jù)集上得到了86.34%的F1-Measure值,其結(jié)果要好于原始Bi-LSTM+CRF模型的,也證明了基于字符偏旁等級的自注意力機(jī)制在處理中文醫(yī)療NER任務(wù)中的有效性。

    (2)卷積神經(jīng)網(wǎng)絡(luò)模型。

    卷積神經(jīng)網(wǎng)絡(luò)近年來在計算機(jī)視覺領(lǐng)域取得了顯著的成果,被大量應(yīng)用到圖像處理中[41-44],并且取得了很多突破性的進(jìn)展。在NLP領(lǐng)域中,CNN能夠在訓(xùn)練過程中充分利用GPU(Graphics Processing Unit)實現(xiàn)數(shù)據(jù)處理的并行化,這使CNN在并行計算過程中擁有很高的自由度。

    CNN在處理長距離文本信息時表現(xiàn)一般,只能通過不斷增加卷積層的個數(shù)來處理更多的輸入信息,但這會導(dǎo)致卷積層越來越深,參數(shù)越來越多,整個模型將會變得非常龐大不易訓(xùn)練?;诖?Yu等[45]提出了擴(kuò)張卷積神經(jīng)網(wǎng)絡(luò)(Dilate CNN),為過濾器增加了一個dilation width,但過濾器本身的大小保持不變,這樣可以讓過濾器獲得更多輸入數(shù)據(jù),隨著卷積層數(shù)的不斷增加,參數(shù)的數(shù)量只以線性增加,而感受域呈指數(shù)增加,使得感受域更快地覆蓋到全部的輸入數(shù)據(jù),從而解決了CNN在NER任務(wù)中的缺陷。Strubell等[46]又在上述工作的基礎(chǔ)上提出了迭代擴(kuò)張卷積神經(jīng)網(wǎng)絡(luò)ID-CNN(Iterated Dilated CNN),并且在實驗中將ID-CNN同CRF融合起來,把CRF接在ID-CNN后面,在CoNLL-2003數(shù)據(jù)集上ID-CNN-CRF模型得到了90.54%的F1-Measure值,略優(yōu)于NER任務(wù)中主流的深度學(xué)習(xí)模型Bi-LSTM+CRF的,并且ID-CNN-CRF在模型訓(xùn)練的速度上也要快于Bi-LSTM+CRF。但是不論LSTM還是CNN,它們在處理中文電子病歷NER任務(wù)時都存在局限性,LSTM在處理數(shù)據(jù)時不能實現(xiàn)并行化操作,CNN是不能處理序列化的文本信息。而將這2個模型一起配合訓(xùn)練可以發(fā)揮出它們的優(yōu)勢,同時彌補(bǔ)彼此的不足,這種融合方式在未來也不失是一種較好的處理NER任務(wù)的方法。

    (3)Transformer模型。

    只使用注意力機(jī)制的模型是2017年由Vaswani等[47]提出來的,也是近兩年來NLP領(lǐng)域主流的模型,并且還拓展到了其他的領(lǐng)域。這種模型緩解了循環(huán)神經(jīng)網(wǎng)絡(luò)訓(xùn)練慢的問題,使用完全基于注意力機(jī)制的方式,將自注意力機(jī)制作為編碼器和解碼器的核心,獲得了很好的學(xué)習(xí)效果。后來的BERT模型在NLP任務(wù)中能取得良好成績一個關(guān)鍵因素就是Transformer模型。

    李博等[48]針對中文電子病歷的NER任務(wù),提出了一種Transformer-CRF的模型,使用Transformer來提取上下文的文本特征,并增加CRF層作為分類器進(jìn)行聯(lián)合解碼。在實驗中,通過中文電子病歷數(shù)據(jù)自建數(shù)據(jù)集對比了包括Transformer-CRF在內(nèi)的8種模型,在身體部位的實體識別中Transformer-CRF得到了最高的F1-Measure值 95.05%。但是,Transformer模型也存在著一定的問題,其局部特征捕捉能力相比于循環(huán)神經(jīng)網(wǎng)絡(luò)RNN(Recurrent Neural Network)略顯不足。在文獻(xiàn)[48]中,對于醫(yī)療檢查和檢查類的實體,由于其包含大量的英文縮寫,在識別過程中文本特征較為復(fù)雜不易提取,導(dǎo)致模型的識別效果不佳,不過在其他醫(yī)療實體的識別中這種模型的識別效果都要好于其他模型的。盡管Transformer模型存在著一定的缺點(diǎn),但它這種完全基于注意力機(jī)制的方式很大程度上促進(jìn)了NLP領(lǐng)域的發(fā)展,也為后來BERT模型的出現(xiàn)打下了基礎(chǔ)。

    (4)BERT模型。

    BERT模型是Google在2018年開發(fā)出來的一種用于語言表示的模型,它的內(nèi)部采用全新的MLM(Masked Language Model)模型,對雙向的Transformers進(jìn)行預(yù)訓(xùn)練,這樣能快速生成深度的雙向語言表征。此外,微調(diào)(Fine-tune)BERT模型也能在很多下游NLP任務(wù)中獲得非常好的表現(xiàn)。

    近年來,BERT模型也逐漸被用于科學(xué)領(lǐng)域和生物醫(yī)學(xué)領(lǐng)域,以提高這些領(lǐng)域中NLP任務(wù)的性能。不過,在中文電子病歷NER任務(wù)中,僅使用BERT模型并不能夠獲得很好的效果。但是,通過對BERT模型進(jìn)行預(yù)訓(xùn)練或與其他模型相結(jié)合,都能獲得很多模型達(dá)不到的效果。Li等[49]使用網(wǎng)上爬取的中文醫(yī)療文本數(shù)據(jù)對BERT模型進(jìn)行預(yù)訓(xùn)練,并在BERT模型上添加不同的層(包括CRF、Bi-LSTM層等)來比較各種模型的性能,還在模型中添加了字典功能以及偏旁功能,最終的模型結(jié)構(gòu)為BERT+Bi-LSTM+CRF,在CCKS-CNER 2017與CCKS-CNER 2018數(shù)據(jù)集上分別進(jìn)行了模型評估。在實驗中,Li等[49]將BERT模型又進(jìn)行了微調(diào),微調(diào)的BERT模型要明顯優(yōu)于原始的BERT模型,在CCKS 2018數(shù)據(jù)集上基于FT-BERT+BiLSTM+CRF的模型得到了89.32%的F1-Measure值,該結(jié)果要優(yōu)于其他先進(jìn)方法的,并且集成模型獲得了更高的F1-Measure值89.56%。在CCKS2017數(shù)據(jù)集上,基于FT-BERT+BiLSTM+CRF的模型得到了91.60%的F1-Measure值。在整個實驗中,微調(diào)的BERT很明顯提高了模型的性能,并且字符偏旁部首的嵌入以及基于字典的后處理方式也在中文NER任務(wù)中十分有效。在Li等[49]的實驗中,他最開始對BERT模型進(jìn)行預(yù)訓(xùn)練。參照這個方法,胡婕等[50]從百科知識庫CN-DBPedia(ChiNa-DisamBiguation Pedia)中抽取實體來構(gòu)建詞典,隨后利用構(gòu)建的詞典來對BERT進(jìn)行預(yù)訓(xùn)練。這種方法可以免去網(wǎng)絡(luò)爬蟲所帶來的數(shù)據(jù)不規(guī)范等問題,為后續(xù)中文電子病歷NER的研究也提供了一種思路。

    ALBERT(A Lite BERT)模型是Google在2019年開發(fā)的一種更加精簡的模型[51],是BERT模型的改進(jìn)版。ALBERT的參數(shù)量要遠(yuǎn)遠(yuǎn)小于之前的BERT模型的,解決了BERT模型過大、訓(xùn)練困難的問題。李軍懷等[52]利用ALBERT模型進(jìn)行預(yù)訓(xùn)練,提出了基于ALBERT+BGRU+CRF的模型用于中文NER任務(wù)。在這個模型中,使用ALBERT模型處理相應(yīng)的文本,得到動態(tài)詞的向量表示作為下一層的輸入,雙向門控循環(huán)單元BGRU(Bidirectional Gated Recurrent Unit)用來捕捉上下文的語義信息,并通過在CRF層中加入約束來控制錯誤標(biāo)簽的輸出。此外,在MSRA(MicroSoft Research Asia)數(shù)據(jù)集上此模型得到了94.81%的F1-Measure值,要好于BERT- IDCNN-CRF模型的94.41%。ALBERT模型還能與IDCNN+CRF相結(jié)合,也能在NER任務(wù)中取得不錯的效果。表2對上述命名實體識別方法進(jìn)行了總結(jié)。

    Table 2 Summary of methods based on deep learning

    深度學(xué)習(xí)模型的廣泛應(yīng)用帶動了中文電子病歷NER任務(wù)的研究。圖3展示了近兩年中文電子病歷NER技術(shù)的發(fā)展路線。目前,研究人員主要采用基于多種模型相結(jié)合的方式來進(jìn)行命名實體識別。例如,Dong等[32]在模型中加入了字符;Li等[49]對BERT模型進(jìn)行了微調(diào)并將其加入到了原有的模型中,還嵌入了偏旁部首。這些研究人員都利用多種模型在NER任務(wù)中取得了非常不錯的效果,因此在未來的研究中,多模型組合將是中文電子病歷NER任務(wù)的一個重要研究方向。表3比較了中文電子病歷命名實體識別任務(wù)中所采用的各類方法及其基本思想、優(yōu)點(diǎn)和缺點(diǎn)。

    Table 3 Comparison of typical methods for named entity recognition

    Figure 3 Development route of Chinese EMR NER technology圖3 中文電子病歷NER技術(shù)發(fā)展路線

    4 中文電子病歷實體關(guān)系抽取

    實體關(guān)系抽取(Entity Relation Extraction)是NLP任務(wù)中重要的一步,是在命名實體識別任務(wù)的基礎(chǔ)上,進(jìn)一步提取出2類實體之間存在的關(guān)系。這項任務(wù)也是醫(yī)療健康知識庫建立維護(hù)的基礎(chǔ)。在電子病歷中,大部分的實體之間存在著一定的關(guān)系。關(guān)系抽取任務(wù)不僅要抽取出它們之間的關(guān)系,更重要的是要識別出這些關(guān)系是屬于哪種類型[53],很大程度上會影響后續(xù)電子病歷處理任務(wù)。

    對于醫(yī)療關(guān)系,Uzuner等[54]率先展開了研究,將醫(yī)療實體關(guān)系分為6大類:當(dāng)前的疾病-治療、可能的疾病-治療、當(dāng)前的癥狀-治療、可能的癥狀-治療、疾病-檢查和疾病-癥狀。根據(jù)中文電子病歷的特點(diǎn),可以將醫(yī)療關(guān)系解釋為更加通俗易懂的說法。例如,將疾病-癥狀關(guān)系類型解釋為疾病導(dǎo)致了這種癥狀,疾病-檢查關(guān)系類型解釋為通過檢查找出了這種疾病,疾病-治療關(guān)系解釋為這種疾病通過這種方式進(jìn)行治療。抽取出這些關(guān)系類型能輔助醫(yī)生更加全面地了解患者的病情,對患者的下一步治療有更加明確的方向。

    目前,中文電子病歷的實體關(guān)系抽取研究尚在起步階段。綜合近年來研究人員所采用的各類方法[55,56],可以大致分為3種:有監(jiān)督學(xué)習(xí)的方法、半監(jiān)督學(xué)習(xí)的方法和無監(jiān)督學(xué)習(xí)的方法。這3種方法各有優(yōu)劣,在不同的時期都發(fā)揮出了不同的作用。如今,半監(jiān)督學(xué)習(xí)的方法也逐漸被廣泛應(yīng)用于實體關(guān)系抽取的任務(wù)中,成為了一大熱門的研究方向。無監(jiān)督學(xué)習(xí)的方法目前還處于探索階段,還未出現(xiàn)有效的實體關(guān)系抽取方法,本文不作詳細(xì)介紹。接下來本文將會對有監(jiān)督學(xué)習(xí)、半監(jiān)督學(xué)習(xí)近年來的研究進(jìn)展進(jìn)行詳細(xì)介紹。

    4.1 有監(jiān)督學(xué)習(xí)的方法

    有監(jiān)督學(xué)習(xí)的方法是電子病歷實體關(guān)系抽取任務(wù)早期廣泛使用的方法,大多是采用機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的方法來完成實體關(guān)系的抽取。在傳統(tǒng)的機(jī)器學(xué)習(xí)方法中,使用到的方法主要是基于規(guī)則的方法和SVM等。在深度學(xué)習(xí)的方法中,主要使用深度神經(jīng)網(wǎng)絡(luò)來處理實體關(guān)系抽取的任務(wù)。這些方法在大量已標(biāo)注數(shù)據(jù)集為前提的情況下能夠獲得較好的分類效果。

    Xu等[57]提出了一種由數(shù)據(jù)驅(qū)動的模型,同時基于規(guī)則和SVM,并且在實驗中創(chuàng)新性地使用SVM估計醫(yī)療事件之間的相關(guān)性,以更好地對各類醫(yī)療實體進(jìn)行抽取,最終在中文電子病歷數(shù)據(jù)集上得到了84.6%的F1-Measure值。Tao等[58]提出了一種KeMRE(Knowledge-enhanced Medical Relation Extraction)的醫(yī)學(xué)關(guān)系抽取深度模型,所建造的模型共被分為4大塊。首先是基于BERT-CNN-LSTM的文本建模;之后是基于 CNN-LSTM 的實體建模,用來捕捉各個實體之間的相關(guān)性;第3是建立了知識嵌入,以代表實體之間潛在的關(guān)系;最后使用MLP(Multi-Layer Perceptron)網(wǎng)絡(luò)從實體的表示和知識嵌入中預(yù)測實體之間的關(guān)系。上述模型在自主構(gòu)建的數(shù)據(jù)集上的F1-Measure要明顯好于LSTM模型、CNN模型等的。隨著深度學(xué)習(xí)的快速發(fā)展,有監(jiān)督學(xué)習(xí)的方式也能在實體抽取中取得十分不錯的效果。但是,繁重的標(biāo)注工作是這類方法的一大缺陷,一旦缺少已標(biāo)注的數(shù)據(jù),模型性能會快速下降。因此,在之后的中文電子病歷研究中,如何使用較少的標(biāo)注數(shù)據(jù)來進(jìn)行關(guān)系抽取成為了研究人員著重關(guān)注的地方。

    4.2 半監(jiān)督學(xué)習(xí)的方法

    半監(jiān)督學(xué)習(xí)的方法能夠解決有標(biāo)注數(shù)據(jù)集稀缺的問題。有標(biāo)注的數(shù)據(jù)集難以獲取,而無標(biāo)注的數(shù)據(jù)集又不能夠很好地訓(xùn)練模型,因此半監(jiān)督學(xué)習(xí)的方法成為了近年來較為熱門的研究方向。這種學(xué)習(xí)方法只需要少量有標(biāo)注的數(shù)據(jù)集和大量無標(biāo)注的數(shù)據(jù)集,就可以獲得很好的效果。半監(jiān)督學(xué)習(xí)關(guān)系抽取基本框架如圖4所示。

    Figure 4 Basic framework of semi-supervised learning relation extraction圖4 半監(jiān)督學(xué)習(xí)關(guān)系抽取基本框架

    在中文電子病歷的研究中,標(biāo)注數(shù)據(jù)集的問題尤為突出,因此半監(jiān)督學(xué)習(xí)方法也逐漸被應(yīng)用起來。陳立瑋等[59]在解決雙語關(guān)系抽取問題時提出了n-gram的模型特征來增強(qiáng)模型的魯棒性,還提出了基于Bootstrapping思想的協(xié)同訓(xùn)練在中文知識庫上進(jìn)行半監(jiān)督學(xué)習(xí)來強(qiáng)化模型,以解決數(shù)據(jù)標(biāo)注的相關(guān)問題,最終在中文和英文的關(guān)系提取中這個模型能適應(yīng)不同語言的需求。肖丹[60]采用了半監(jiān)督學(xué)習(xí)的方法來對中文電子病歷進(jìn)行實體關(guān)系抽取,提出了一種基于殘差網(wǎng)絡(luò)的半監(jiān)督方法。該方法結(jié)合殘差網(wǎng)絡(luò)和BiGRU(Bi-Gated Recurrent Unit)2種神經(jīng)網(wǎng)絡(luò)的優(yōu)勢,還融入了注意力機(jī)制,構(gòu)建了ResGRU-Att(Residual Gated Recurrent Unit Attention)混合神經(jīng)網(wǎng)絡(luò)模型,并在訓(xùn)練過程中使用Bootstrapping半監(jiān)督學(xué)習(xí)算法對沒有被標(biāo)記的數(shù)據(jù)集不斷迭代,擴(kuò)展數(shù)據(jù)集。此外,該方法還針對關(guān)系抽取任務(wù)改進(jìn)了Bootstrapping算法。結(jié)果表明,多層卷積的ResNet(deep Residual Network)模型效果要明顯好于單一的CNN模型的,當(dāng)ResNet模型增加注意力機(jī)制以及GRU模型后獲得了更好的效果,F1-Measure值達(dá)89.78%。

    作為半監(jiān)督學(xué)習(xí)的一種方法,遠(yuǎn)程監(jiān)督也能夠解決標(biāo)注語料少的問題。隨著人工智能的發(fā)展,遠(yuǎn)程監(jiān)督通過機(jī)器學(xué)習(xí)得到了進(jìn)一步的發(fā)展。在關(guān)系抽取任務(wù)中,為了避免使用到龐大的標(biāo)注數(shù)據(jù)集,無監(jiān)督學(xué)習(xí)的方法被應(yīng)用到了關(guān)系抽取的任務(wù)中。無監(jiān)督學(xué)習(xí)的方法不需要使用帶標(biāo)簽的數(shù)據(jù),通過聚類算法來自動歸納關(guān)系的類型,從而達(dá)到關(guān)系抽取的目的。不過,這種方法所抽取出來的關(guān)系在一定程度上規(guī)范化程度很差,而且會影響其他的關(guān)系屬性。因此,Mintz等[61]在2009年第1次提出了遠(yuǎn)程監(jiān)督的概念來解決上述問題,并將文本與大規(guī)模知識圖譜進(jìn)行對齊。遠(yuǎn)程監(jiān)督既能夠解決有監(jiān)督學(xué)習(xí)中缺少有標(biāo)簽數(shù)據(jù)集的問題,又能夠彌補(bǔ)無監(jiān)督學(xué)習(xí)中關(guān)系的規(guī)范化問題。車金立等[62]基于遠(yuǎn)程監(jiān)督方法提出了一種基于雙重注意力機(jī)制的關(guān)系抽取模型,使用網(wǎng)絡(luò)爬蟲來篩選實驗數(shù)據(jù),再通過遠(yuǎn)程監(jiān)督得到有標(biāo)注的關(guān)系數(shù)據(jù)。但是,遠(yuǎn)程監(jiān)督有可能會帶來一部分的噪聲數(shù)據(jù)。為了解決這個問題,該模型通過BI-GRU網(wǎng)絡(luò)獲取上下文語義信息,并使用字符級注意力機(jī)制來關(guān)注語義特征,利用實例級注意力機(jī)制來計算實例和對應(yīng)關(guān)系之間的相關(guān)性。上述模型結(jié)合了雙重注意力機(jī)制的優(yōu)勢,有效地處理了噪聲數(shù)據(jù),在關(guān)系抽取的任務(wù)中得到了更高的準(zhǔn)確率。王斌等[63]提出了基于遠(yuǎn)程監(jiān)督的領(lǐng)域?qū)嶓w屬性關(guān)系抽取的混合方法,使用隱含狄利克雷分布LDA(Latent Dirichlet Allocation)主題模型來進(jìn)行數(shù)據(jù)去噪,并且將各項特征融合用于關(guān)系抽取,實驗結(jié)果表明,去噪后的訓(xùn)練數(shù)據(jù)更加具有代表性,上述模型訓(xùn)練后取得了91%的F1-Measure值。表4對上述方法進(jìn)行了總結(jié)。遠(yuǎn)程監(jiān)督在關(guān)系抽取任務(wù)中主要是為深度學(xué)習(xí)模型處理無標(biāo)簽數(shù)據(jù),它較依賴各個領(lǐng)域的專業(yè)知識庫。近年來,國內(nèi)各科研機(jī)構(gòu)已初步建立了幾個中文開放百科類知識圖譜的鏈接,包括Zhishi.me(狗尾草科技、東南大學(xué))、CN-DBPedia(復(fù)旦大學(xué))、XLore(清華大學(xué))、Belief-Engine(中科院自動化所)和PKUPie(北京大學(xué))等。這些知識圖譜都已經(jīng)通過OpenKG提供了開放的Dump或開放訪問API。這些中文知識圖譜的建立為遠(yuǎn)程監(jiān)督方法在中文電子病歷關(guān)系抽取上的應(yīng)用提供了良好的基礎(chǔ)。

    Table 4 Typical methods for entity relationship extraction 表4 實體關(guān)系抽取常用方法

    5 問題分析

    5.1 數(shù)據(jù)集

    目前,不論是在國內(nèi)還是在國外,對于電子病歷的研究都需要非常龐大的醫(yī)療數(shù)據(jù)集作為基礎(chǔ)。國外對電子病歷的研究起步較早,到目前為止,已經(jīng)形成了以I2B2為代表的醫(yī)療評測任務(wù)及相應(yīng)醫(yī)療語料庫,這在很大程度上促進(jìn)了國外對于電子病歷的命名實體識別和關(guān)系抽取方面的研究。并且這些數(shù)據(jù)集以及語料庫還在不斷地改良和完善。

    在國內(nèi),由于對電子病歷信息抽取方面的研究起步較晚,因此并沒有形成完善的醫(yī)療語料庫。為了推動中文電子病歷命名實體識別研究的發(fā)展,中國知識圖譜與語義計算大會CCKS(China Conference on Knowledge graph and Semantic computing)從2017年起,連續(xù)幾年推出了中文電子病歷命名實體識別評測任務(wù)[64,65],所用的數(shù)據(jù)集都經(jīng)過了專業(yè)人員的標(biāo)注,這也使得近年來國內(nèi)中文電子病歷的NER任務(wù)得到了突飛猛進(jìn)的發(fā)展,取得了很多顯著的進(jìn)展。

    在實體關(guān)系抽取任務(wù)上,國內(nèi)的大多數(shù)研究都是使用人工標(biāo)注的電子病歷數(shù)據(jù)集,但標(biāo)注過程中的工作量巨大且特別耗時。為了促進(jìn)中文醫(yī)學(xué)NLP的發(fā)展,阿里云天池實驗室在近年來發(fā)布了中文醫(yī)學(xué)文本實體關(guān)系抽取CMeIE(Chinese Medical Information Extraction)評測任務(wù),并提供了評測任務(wù)所需要的數(shù)據(jù)集[66]。國外的I2B2評測任務(wù)為國內(nèi)研究電子病歷的NER以及關(guān)系抽取任務(wù)指明方向,發(fā)起和組織與電子病歷相關(guān)的評測任務(wù)是解決現(xiàn)如今中文電子病歷語料庫缺乏的有效途徑[67]。

    在中文電子病歷語料庫的構(gòu)建上,楊錦鋒等[19]利用賓州中文樹庫 PCTB(Penn Chinese TreeBank) 標(biāo)注規(guī)范[68,69]作為語料庫構(gòu)建的基礎(chǔ)規(guī)范,制定了適用于中文電子病歷的標(biāo)注規(guī)范,并且構(gòu)建了分詞和詞性標(biāo)注的語料庫,為構(gòu)建中文電子病歷語料庫做出了杰出的貢獻(xiàn)。隨著研究的不斷深入,相信在未來也會形成如同國外一樣龐大的中文電子病歷語料庫。

    5.2 模型性能

    盡管深度學(xué)習(xí)近年來在中文電子病歷信息提取任務(wù)中取得了較大的進(jìn)步,但組合經(jīng)典的模型處理相關(guān)任務(wù)也使性能達(dá)到了瓶頸。轉(zhuǎn)換思路設(shè)計更合適的模型可以顯著提高模型的性能。Li等[70]創(chuàng)新性地將NER視為機(jī)器閱讀理解MRC(Machine Reading Comprehension)任務(wù),而不是經(jīng)典的序列標(biāo)記問題,提出了一種MRC框架,獲得了顯著的效果。因此,如何將此模型推廣到中文電子病歷信息提取的任務(wù)中,也成了今后研究的方向之一。

    此外,深度學(xué)習(xí)模型對于實體的邊界不太敏感,尤其是醫(yī)療領(lǐng)域,實體的邊界具有很高的專業(yè)性。將基于規(guī)則的詞典信息引入深度學(xué)習(xí)模型是一種不錯的方法,但龐大的詞典使模型運(yùn)行速度過慢,因此如何在保證識別準(zhǔn)確率的基礎(chǔ)上提高運(yùn)行效率也是今后的研究方向之一。

    5.3 嵌套實體的識別與提取

    嵌套實體是指一個實體嵌套在另外一個實體中,例如在中文電子病歷中經(jīng)常會出現(xiàn)“肺結(jié)節(jié)”“胃潰瘍”“腎結(jié)石”等嵌套實體,實體“肺、胃、腎”都被嵌套在了相應(yīng)的疾病實體中。這些問題也是今后的模型需要解決的。

    6 結(jié)束語

    本文闡述了近年來中文電子病歷命名實體識別和關(guān)系抽取方面的研究進(jìn)展,選取了國內(nèi)外在這些方面的典型論文,重點(diǎn)介紹了中文電子病歷信息提取所采用的方法、建立的模型、使用的相關(guān)數(shù)據(jù)集、數(shù)據(jù)標(biāo)注情況以及這些模型最終所取得的效果。

    近年來,深度學(xué)習(xí)在各個領(lǐng)域都取得了十分顯著的進(jìn)展,也被應(yīng)用于中文電子病歷的命名實體識別和關(guān)系抽取的任務(wù)中,是諸多方法中效果最好的方法,也促進(jìn)了中文電子病歷信息提取領(lǐng)域的發(fā)展。在有關(guān)電子病歷的任務(wù)中,比較常見的深度學(xué)習(xí)模型包括LSTM模型和CNN模型。近幾年,多種模型融合的方式也逐漸成為了研究人員主要的研究方向。Transformer模型和BERT模型的快速應(yīng)用也在NLP領(lǐng)域展現(xiàn)出了很高的性能,也推動了中文電子病歷NER任務(wù)的發(fā)展。另外,圖神經(jīng)網(wǎng)絡(luò)、數(shù)據(jù)增強(qiáng)在NLP領(lǐng)域中的應(yīng)用等都處于前期的發(fā)展階段,如何將它們與現(xiàn)有的模型進(jìn)行融合也將會成為今后的研究方向。

    猜你喜歡
    方法模型
    一半模型
    重要模型『一線三等角』
    重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
    學(xué)習(xí)方法
    可能是方法不對
    3D打印中的模型分割與打包
    用對方法才能瘦
    Coco薇(2016年2期)2016-03-22 02:42:52
    FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
    四大方法 教你不再“坐以待病”!
    Coco薇(2015年1期)2015-08-13 02:47:34
    賺錢方法
    欧美zozozo另类| 中文字幕熟女人妻在线| 国产精品av视频在线免费观看| 日本免费一区二区三区高清不卡| 久久香蕉精品热| 三级男女做爰猛烈吃奶摸视频| 搞女人的毛片| 精品久久久久久久人妻蜜臀av| 精品日产1卡2卡| 国产97色在线日韩免费| bbb黄色大片| 高清毛片免费观看视频网站| 亚洲中文av在线| 男女床上黄色一级片免费看| 波多野结衣巨乳人妻| 日韩欧美精品v在线| 99久国产av精品| 免费看美女性在线毛片视频| 亚洲成人中文字幕在线播放| 99国产极品粉嫩在线观看| 欧美日韩黄片免| 全区人妻精品视频| 精品国产超薄肉色丝袜足j| 亚洲人成网站在线播放欧美日韩| 亚洲欧美精品综合一区二区三区| 国产免费男女视频| 免费在线观看视频国产中文字幕亚洲| 好看av亚洲va欧美ⅴa在| 亚洲国产欧美网| 国产精品野战在线观看| 真人做人爱边吃奶动态| 免费在线观看日本一区| 午夜精品一区二区三区免费看| 中文在线观看免费www的网站| 国产高清videossex| 日本在线视频免费播放| 成人亚洲精品av一区二区| 法律面前人人平等表现在哪些方面| 亚洲精品456在线播放app | 日日干狠狠操夜夜爽| 欧美zozozo另类| 老鸭窝网址在线观看| 高清毛片免费观看视频网站| 嫁个100分男人电影在线观看| 一边摸一边抽搐一进一小说| 色精品久久人妻99蜜桃| 又大又爽又粗| 亚洲色图 男人天堂 中文字幕| 精品熟女少妇八av免费久了| 好男人在线观看高清免费视频| 成人性生交大片免费视频hd| 久久久国产成人免费| 精品一区二区三区视频在线 | 老鸭窝网址在线观看| 欧美zozozo另类| 欧美在线一区亚洲| 麻豆av在线久日| 又大又爽又粗| 午夜精品在线福利| 午夜精品在线福利| 后天国语完整版免费观看| 亚洲色图 男人天堂 中文字幕| 久久午夜亚洲精品久久| 色视频www国产| 亚洲人与动物交配视频| 精品一区二区三区视频在线 | 亚洲五月婷婷丁香| 女警被强在线播放| 桃色一区二区三区在线观看| 亚洲精品乱码久久久v下载方式 | 国产激情偷乱视频一区二区| 一个人免费在线观看的高清视频| 色噜噜av男人的天堂激情| 久久人人精品亚洲av| 最新中文字幕久久久久 | 男插女下体视频免费在线播放| 成人性生交大片免费视频hd| 久久精品国产99精品国产亚洲性色| 日本三级黄在线观看| 国产在线精品亚洲第一网站| 精品久久久久久久人妻蜜臀av| 91九色精品人成在线观看| 亚洲专区国产一区二区| 日韩欧美 国产精品| 女人高潮潮喷娇喘18禁视频| 久久久成人免费电影| 亚洲av免费在线观看| 90打野战视频偷拍视频| 亚洲欧美一区二区三区黑人| 久久亚洲真实| 欧美日韩福利视频一区二区| 中文字幕精品亚洲无线码一区| 中出人妻视频一区二区| 亚洲男人的天堂狠狠| 国产 一区 欧美 日韩| 一级毛片高清免费大全| 99国产精品一区二区三区| 三级男女做爰猛烈吃奶摸视频| 一区二区三区高清视频在线| 在线视频色国产色| 欧美午夜高清在线| 色综合站精品国产| 老鸭窝网址在线观看| tocl精华| 久久久国产成人精品二区| 午夜久久久久精精品| 黑人操中国人逼视频| 日韩精品中文字幕看吧| 久久精品91蜜桃| 国产av在哪里看| 久久99热这里只有精品18| 国产av不卡久久| 少妇裸体淫交视频免费看高清| cao死你这个sao货| 黄片大片在线免费观看| 在线看三级毛片| www.精华液| 天堂网av新在线| 波多野结衣巨乳人妻| 亚洲国产精品合色在线| 人妻夜夜爽99麻豆av| 国产精品影院久久| 欧美在线黄色| 国产精品,欧美在线| 90打野战视频偷拍视频| 观看美女的网站| 嫁个100分男人电影在线观看| 狂野欧美白嫩少妇大欣赏| 精品久久久久久成人av| 亚洲av成人精品一区久久| 久久久久免费精品人妻一区二区| 一个人看的www免费观看视频| 老汉色∧v一级毛片| 神马国产精品三级电影在线观看| 亚洲国产精品999在线| 久久精品aⅴ一区二区三区四区| 亚洲国产欧洲综合997久久,| 国产精品自产拍在线观看55亚洲| 欧美zozozo另类| 亚洲国产色片| 欧美3d第一页| 九色国产91popny在线| 美女被艹到高潮喷水动态| 成人高潮视频无遮挡免费网站| 欧美日韩黄片免| 一a级毛片在线观看| 老汉色av国产亚洲站长工具| 免费观看人在逋| 禁无遮挡网站| 欧美中文日本在线观看视频| 99久国产av精品| 99久久精品一区二区三区| 成人国产综合亚洲| 精品国产超薄肉色丝袜足j| 天天躁狠狠躁夜夜躁狠狠躁| 国产精品免费一区二区三区在线| 九色成人免费人妻av| 精品久久久久久久毛片微露脸| 欧美zozozo另类| 成人性生交大片免费视频hd| 校园春色视频在线观看| 久久国产精品人妻蜜桃| 啦啦啦韩国在线观看视频| 日韩国内少妇激情av| 我的老师免费观看完整版| 午夜a级毛片| 国产一区二区激情短视频| 国产成人精品久久二区二区91| tocl精华| svipshipincom国产片| 成人欧美大片| 欧美激情久久久久久爽电影| 国产乱人伦免费视频| 又粗又爽又猛毛片免费看| 他把我摸到了高潮在线观看| 亚洲九九香蕉| 午夜精品在线福利| 亚洲国产精品久久男人天堂| 免费一级毛片在线播放高清视频| 一二三四在线观看免费中文在| 欧美又色又爽又黄视频| 精品久久蜜臀av无| 两个人看的免费小视频| 欧美绝顶高潮抽搐喷水| 成人av一区二区三区在线看| 色噜噜av男人的天堂激情| 国产精品精品国产色婷婷| 国产亚洲精品久久久com| 成人三级做爰电影| 久久久久免费精品人妻一区二区| h日本视频在线播放| 日韩精品青青久久久久久| 日本精品一区二区三区蜜桃| 黄频高清免费视频| 亚洲人成电影免费在线| 亚洲男人的天堂狠狠| 久久精品国产综合久久久| 黄色成人免费大全| 免费看a级黄色片| 国产黄a三级三级三级人| 高清毛片免费观看视频网站| 99久久精品国产亚洲精品| 精品一区二区三区av网在线观看| 一个人看视频在线观看www免费 | 亚洲午夜精品一区,二区,三区| 成人av一区二区三区在线看| av欧美777| 免费大片18禁| 午夜精品久久久久久毛片777| 欧美日韩亚洲国产一区二区在线观看| 99热精品在线国产| 精品福利观看| 欧美在线黄色| 偷拍熟女少妇极品色| 好男人在线观看高清免费视频| 黄色丝袜av网址大全| 少妇熟女aⅴ在线视频| 欧美一区二区精品小视频在线| 色噜噜av男人的天堂激情| 亚洲狠狠婷婷综合久久图片| 久99久视频精品免费| 夜夜躁狠狠躁天天躁| 激情在线观看视频在线高清| 伊人久久大香线蕉亚洲五| 日韩欧美三级三区| 免费看十八禁软件| 人妻久久中文字幕网| 91九色精品人成在线观看| 成人av一区二区三区在线看| 亚洲av成人av| 男人的好看免费观看在线视频| 欧美另类亚洲清纯唯美| 熟妇人妻久久中文字幕3abv| 国产精品久久久久久亚洲av鲁大| 99在线人妻在线中文字幕| 男人的好看免费观看在线视频| svipshipincom国产片| 757午夜福利合集在线观看| 午夜福利在线在线| 十八禁网站免费在线| 99riav亚洲国产免费| 观看免费一级毛片| 午夜两性在线视频| 宅男免费午夜| 丝袜人妻中文字幕| 国产精品 欧美亚洲| 成人高潮视频无遮挡免费网站| 久久久久亚洲av毛片大全| 午夜福利免费观看在线| 熟女人妻精品中文字幕| 久久人妻av系列| 久久国产精品影院| 久久亚洲精品不卡| 国模一区二区三区四区视频 | 国产一区在线观看成人免费| 黄频高清免费视频| 成年女人毛片免费观看观看9| 欧美绝顶高潮抽搐喷水| 最好的美女福利视频网| 香蕉丝袜av| 美女高潮的动态| 国产伦在线观看视频一区| 婷婷精品国产亚洲av在线| 琪琪午夜伦伦电影理论片6080| 国产成人av教育| 色综合婷婷激情| 欧美又色又爽又黄视频| 听说在线观看完整版免费高清| 午夜激情欧美在线| 小蜜桃在线观看免费完整版高清| 一区二区三区高清视频在线| 亚洲18禁久久av| 99精品久久久久人妻精品| 可以在线观看毛片的网站| 日本黄大片高清| 久久精品影院6| 久9热在线精品视频| 国产成人av激情在线播放| 老汉色∧v一级毛片| 国产av不卡久久| 国产真实乱freesex| 成人一区二区视频在线观看| 悠悠久久av| 十八禁网站免费在线| 精品熟女少妇八av免费久了| 免费一级毛片在线播放高清视频| 久久欧美精品欧美久久欧美| 久久久国产精品麻豆| 色视频www国产| 又黄又粗又硬又大视频| 亚洲欧美日韩无卡精品| 俄罗斯特黄特色一大片| 国产精品亚洲av一区麻豆| 不卡av一区二区三区| 18禁黄网站禁片免费观看直播| 亚洲精品美女久久av网站| 黄片大片在线免费观看| 人妻丰满熟妇av一区二区三区| 1000部很黄的大片| 免费高清视频大片| 熟女人妻精品中文字幕| 少妇的逼水好多| 欧美日本亚洲视频在线播放| 亚洲av日韩精品久久久久久密| 非洲黑人性xxxx精品又粗又长| 亚洲国产日韩欧美精品在线观看 | 精品乱码久久久久久99久播| 亚洲国产精品成人综合色| 亚洲欧洲精品一区二区精品久久久| 久久国产精品影院| 国产欧美日韩一区二区三| 亚洲欧美日韩高清专用| 国产1区2区3区精品| 久久国产乱子伦精品免费另类| 一夜夜www| 欧美国产日韩亚洲一区| 国产亚洲av高清不卡| 亚洲av免费在线观看| 可以在线观看的亚洲视频| 国产亚洲精品综合一区在线观看| 欧美又色又爽又黄视频| 欧美日韩乱码在线| 久久久久国产一级毛片高清牌| 国产黄片美女视频| 在线永久观看黄色视频| 久久性视频一级片| 国产1区2区3区精品| 亚洲成人中文字幕在线播放| 在线观看午夜福利视频| 免费在线观看日本一区| 91字幕亚洲| 19禁男女啪啪无遮挡网站| e午夜精品久久久久久久| 亚洲午夜精品一区,二区,三区| 亚洲激情在线av| 麻豆成人午夜福利视频| 久久久久免费精品人妻一区二区| 18禁黄网站禁片免费观看直播| 欧美成人一区二区免费高清观看 | 亚洲国产看品久久| 男插女下体视频免费在线播放| 成人欧美大片| 午夜福利高清视频| 在线观看美女被高潮喷水网站 | 免费观看精品视频网站| 亚洲国产精品合色在线| 欧美日本亚洲视频在线播放| 啪啪无遮挡十八禁网站| 99热这里只有是精品50| 999久久久国产精品视频| 叶爱在线成人免费视频播放| 在线播放国产精品三级| 神马国产精品三级电影在线观看| 夜夜爽天天搞| 日日夜夜操网爽| 日韩欧美精品v在线| 夜夜爽天天搞| 精品国内亚洲2022精品成人| 精品久久久久久,| 又大又爽又粗| 日日夜夜操网爽| av国产免费在线观看| 这个男人来自地球电影免费观看| 小蜜桃在线观看免费完整版高清| 在线视频色国产色| 一边摸一边抽搐一进一小说| 国产av麻豆久久久久久久| 美女大奶头视频| 欧美成狂野欧美在线观看| 91九色精品人成在线观看| 国产主播在线观看一区二区| 久久久久国内视频| 亚洲国产欧美网| 一区福利在线观看| 1024手机看黄色片| 一个人看视频在线观看www免费 | 1024香蕉在线观看| 一级作爱视频免费观看| 又黄又粗又硬又大视频| 国产91精品成人一区二区三区| 国产成人av教育| 国产精品1区2区在线观看.| 亚洲精品国产精品久久久不卡| 成人三级做爰电影| 国产一级毛片七仙女欲春2| 成在线人永久免费视频| 国产成人啪精品午夜网站| 国产一区二区三区视频了| 男女之事视频高清在线观看| 99热这里只有是精品50| 人人妻人人澡欧美一区二区| 又大又爽又粗| 中文资源天堂在线| 日韩 欧美 亚洲 中文字幕| 国产淫片久久久久久久久 | 男女床上黄色一级片免费看| 最新在线观看一区二区三区| 全区人妻精品视频| 亚洲九九香蕉| xxx96com| 美女大奶头视频| 精品熟女少妇八av免费久了| 白带黄色成豆腐渣| 90打野战视频偷拍视频| 法律面前人人平等表现在哪些方面| 老汉色∧v一级毛片| 成人午夜高清在线视频| 美女被艹到高潮喷水动态| 在线观看一区二区三区| 精品熟女少妇八av免费久了| 成年版毛片免费区| 亚洲av电影在线进入| 国产精品永久免费网站| 男人舔奶头视频| 又大又爽又粗| 国产伦一二天堂av在线观看| 中文字幕人妻丝袜一区二区| 老司机福利观看| 欧美+亚洲+日韩+国产| 国产精品久久视频播放| 国产午夜精品论理片| 十八禁网站免费在线| 老司机午夜福利在线观看视频| av在线蜜桃| 欧美在线一区亚洲| 国产欧美日韩精品一区二区| 国产蜜桃级精品一区二区三区| 在线免费观看不下载黄p国产 | 神马国产精品三级电影在线观看| 久久亚洲真实| 亚洲av中文字字幕乱码综合| 香蕉av资源在线| 精品一区二区三区四区五区乱码| 麻豆成人av在线观看| 精品久久久久久久毛片微露脸| 久久人妻av系列| www日本黄色视频网| 在线免费观看不下载黄p国产 | 12—13女人毛片做爰片一| 欧美激情在线99| 国产1区2区3区精品| 丰满人妻一区二区三区视频av | 天堂动漫精品| 麻豆国产av国片精品| 一个人看的www免费观看视频| 亚洲av电影在线进入| 99热这里只有是精品50| 中文字幕av在线有码专区| 中文亚洲av片在线观看爽| 叶爱在线成人免费视频播放| 国产欧美日韩精品一区二区| 一进一出好大好爽视频| 中出人妻视频一区二区| 波多野结衣高清无吗| 给我免费播放毛片高清在线观看| 一本综合久久免费| 长腿黑丝高跟| 国产精品久久电影中文字幕| www.自偷自拍.com| 青草久久国产| h日本视频在线播放| 一个人免费在线观看电影 | 亚洲av美国av| 亚洲avbb在线观看| 久久国产乱子伦精品免费另类| 亚洲国产色片| 国产亚洲av高清不卡| 亚洲精品中文字幕一二三四区| 99国产精品99久久久久| 欧美黑人欧美精品刺激| 亚洲男人的天堂狠狠| 男女午夜视频在线观看| 别揉我奶头~嗯~啊~动态视频| 黑人巨大精品欧美一区二区mp4| 精品免费久久久久久久清纯| 真实男女啪啪啪动态图| av中文乱码字幕在线| 欧美日韩乱码在线| 性欧美人与动物交配| 亚洲中文日韩欧美视频| 久久香蕉精品热| 欧美日韩黄片免| 精品不卡国产一区二区三区| 亚洲精品一卡2卡三卡4卡5卡| 99视频精品全部免费 在线 | 中文字幕久久专区| 91麻豆精品激情在线观看国产| 97超级碰碰碰精品色视频在线观看| 国产极品精品免费视频能看的| 欧美xxxx黑人xx丫x性爽| 日韩精品中文字幕看吧| 我要搜黄色片| 亚洲av中文字字幕乱码综合| 日本精品一区二区三区蜜桃| 天堂影院成人在线观看| 在线观看一区二区三区| 久久精品国产99精品国产亚洲性色| 日韩免费av在线播放| 亚洲国产色片| 国产一级毛片七仙女欲春2| 欧美成人一区二区免费高清观看 | 观看美女的网站| 亚洲av成人一区二区三| 哪里可以看免费的av片| 精品久久久久久久久久免费视频| 少妇丰满av| 国产精品亚洲av一区麻豆| av中文乱码字幕在线| 熟女人妻精品中文字幕| 麻豆久久精品国产亚洲av| 午夜免费激情av| 黄色日韩在线| 日韩av在线大香蕉| 国产精品99久久久久久久久| 国产精品自产拍在线观看55亚洲| 天堂av国产一区二区熟女人妻| 99在线人妻在线中文字幕| 99热这里只有是精品50| 色综合亚洲欧美另类图片| www.精华液| 欧美在线黄色| 欧美成人免费av一区二区三区| 欧美av亚洲av综合av国产av| 老司机午夜十八禁免费视频| 此物有八面人人有两片| 99精品久久久久人妻精品| 色哟哟哟哟哟哟| 欧美乱妇无乱码| 亚洲一区二区三区色噜噜| 免费看十八禁软件| 国语自产精品视频在线第100页| 免费观看人在逋| 黑人操中国人逼视频| 舔av片在线| 久久精品国产综合久久久| 极品教师在线免费播放| 亚洲国产日韩欧美精品在线观看 | 亚洲九九香蕉| 国产亚洲精品综合一区在线观看| 九九热线精品视视频播放| 小蜜桃在线观看免费完整版高清| 国产午夜精品久久久久久| 99精品在免费线老司机午夜| 亚洲精品美女久久av网站| 国产精品一区二区免费欧美| 日韩欧美一区二区三区在线观看| 99久久成人亚洲精品观看| 久久99热这里只有精品18| svipshipincom国产片| 久久久成人免费电影| 国产av一区在线观看免费| 久久精品aⅴ一区二区三区四区| 精品久久久久久成人av| 国产精品av视频在线免费观看| 日韩欧美在线二视频| av欧美777| 欧美中文综合在线视频| 久久精品国产亚洲av香蕉五月| 久久伊人香网站| 免费电影在线观看免费观看| 久久国产精品人妻蜜桃| 岛国视频午夜一区免费看| 日本一本二区三区精品| 岛国视频午夜一区免费看| 中文字幕久久专区| 亚洲精品美女久久久久99蜜臀| 美女被艹到高潮喷水动态| 久久香蕉国产精品| 日本三级黄在线观看| 色综合亚洲欧美另类图片| 久久国产精品人妻蜜桃| 亚洲精品美女久久久久99蜜臀| 精品国内亚洲2022精品成人| 19禁男女啪啪无遮挡网站| 小蜜桃在线观看免费完整版高清| 国产一区二区激情短视频| 欧美日本视频| 国产精品女同一区二区软件 | 精品福利观看| 综合色av麻豆| 99国产精品99久久久久| 国产精品日韩av在线免费观看| 欧美一级a爱片免费观看看| 亚洲国产欧美人成| 成人精品一区二区免费| 极品教师在线免费播放| 欧美日本视频| 最近最新中文字幕大全免费视频| 国产精品1区2区在线观看.| 亚洲精品久久国产高清桃花| 999久久久精品免费观看国产| 国产亚洲av嫩草精品影院| 一进一出抽搐gif免费好疼| 99热6这里只有精品| 亚洲自拍偷在线| 日韩欧美在线二视频| 丰满人妻一区二区三区视频av | 午夜日韩欧美国产| 亚洲精品国产精品久久久不卡| 日日摸夜夜添夜夜添小说| 亚洲狠狠婷婷综合久久图片| 久久久久免费精品人妻一区二区| 亚洲七黄色美女视频| 在线a可以看的网站| 久久午夜亚洲精品久久| 999久久久国产精品视频| 女人被狂操c到高潮| 国产高清激情床上av| 国产aⅴ精品一区二区三区波| 久久精品影院6| 91九色精品人成在线观看| 亚洲欧美日韩卡通动漫| 一个人看的www免费观看视频| a在线观看视频网站| 一区二区三区高清视频在线|