李肖楠(北京中醫(yī)藥大學附屬護國寺中醫(yī)醫(yī)院,北京 100035)
機器學習(Machine Learning,ML)是人工智能(Artificial Intelligence,AI)的分支學科,是目前計算機科學成長最快的領(lǐng)域之一。機器學習是讓計算機無需進行明確編程就具備學習能力的一個研究領(lǐng)域[1]。相對于傳統(tǒng)方法,機器學習具有自動適應(yīng)改變的特性,可以根據(jù)新情況不斷更新,并自動訓練學習算法。一般可根據(jù)是否在人類監(jiān)督下訓練分為監(jiān)督學習、無監(jiān)督學習、半監(jiān)督學習及強化學習。
近十余年來,由于機器學習等技術(shù)的迅速發(fā)展,人工智能在圖像識別、自然語言處理、預測等方面取得了極大進展,在解決一些特定問題方面甚至超過了人類[2]。機器學習技術(shù)在中醫(yī)現(xiàn)代診療中已經(jīng)取得了一定的進展,除了中醫(yī)藥研究機構(gòu),目前在清華大學、中國科學院[3]等工科研究機構(gòu)都有相關(guān)領(lǐng)域的研究。中藥藥學服務(wù)是中醫(yī)藥醫(yī)療服務(wù)中一個非常重要的方面,對提高處方質(zhì)量、促進合理用藥、保障醫(yī)療安全起著重要作用。本文針對使用機器學習技術(shù)促進中藥藥學服務(wù)的應(yīng)用方面提出一些思路及探討。
1.1 中藥藥學服務(wù)存在的問題 中藥藥學服務(wù)除了保障患者用藥安全有效、經(jīng)濟合理外,還有自身的特點。中藥藥學服務(wù)目前存在以下問題。
①中藥藥學服務(wù)不受重視。因我國中藥應(yīng)用的廣泛性及合理用藥需要的迫切性,中藥藥學服務(wù)應(yīng)實現(xiàn)同質(zhì)化[4],以避免對服務(wù)質(zhì)量產(chǎn)生影響。一些中醫(yī)院開展了相應(yīng)的中藥藥學服務(wù),也取得一定的成績,但目前仍未受到相應(yīng)的重視。而一些醫(yī)院并未開展中藥藥學信息服務(wù),因此無法為患者提供相應(yīng)的咨詢及用藥指導[5]。
②對專業(yè)人員的要求更高。根據(jù)衛(wèi)生部印發(fā)的《醫(yī)院處方點評管理規(guī)范(試行)》,醫(yī)院的藥學部門需成立處方點評工作小組,要求藥師不僅要具有較豐富的臨床用藥經(jīng)驗和合理用藥知識,還需具備相應(yīng)的藥學專業(yè)技術(shù)職務(wù)任職資格。國內(nèi)的中醫(yī)院是以中醫(yī)為主,中西醫(yī)并重,中醫(yī)院藥師需同時精通中藥、西藥及中西藥合用的情況,這對中醫(yī)院的藥師提出了更高的要求[6]。此外,藥師根據(jù)個體經(jīng)驗從人口統(tǒng)計學、患者基本情況、現(xiàn)有醫(yī)療條件等來判斷用藥的準確性,難度較大,相對于西藥而言,中藥藥學服務(wù)以中醫(yī)藥理論為指導,由于中醫(yī)辨證診治、配伍用藥的個體差異性大,中藥飲片處方點評難度較大,還面臨著點評內(nèi)容不一、標準不統(tǒng)一的情況[7]。
③專業(yè)人員緊缺。在2018年,中藥師在中醫(yī)類醫(yī)院及中醫(yī)類門診部占同類機構(gòu)藥師總數(shù)的52.2%和79.0%,均遠低于同類機構(gòu)平均水平。而在廣大的鄉(xiāng)鎮(zhèn)衛(wèi)生院,中藥師只占同類機構(gòu)藥師總數(shù)的25.1%[8]。專業(yè)技術(shù)資格人員的緊缺,尤其是基層專業(yè)藥師人員的緊缺也限制了中藥藥學服務(wù)的提供。
1.2 機器學習技術(shù)用于中醫(yī)的可能性 現(xiàn)代醫(yī)學和中醫(yī)的診療過程都是不確定性推理。中醫(yī)學注重整體效應(yīng)、經(jīng)驗思維、關(guān)注預測推理,傳統(tǒng)的數(shù)據(jù)統(tǒng)計方法對數(shù)據(jù)的同質(zhì)性、分布等要求高,難以對中醫(yī)數(shù)據(jù)進行有效的推理。
機器學習技術(shù)可以有效地將病證結(jié)合思想融入臨床診療活動中,并有效利用目前不斷積累的醫(yī)學數(shù)據(jù)[9],更好地處理高維數(shù)據(jù)。人工神經(jīng)網(wǎng)絡(luò)是用大量簡單處理單元經(jīng)廣泛連接而組成的人工網(wǎng)絡(luò),是對人類大腦或生物神經(jīng)網(wǎng)絡(luò)若干特征的抽象和模擬。機器學習或深度學習等機器學習技術(shù)可以從既往合理處方中生成相應(yīng)合理處方的數(shù)學概率模型,或者形成神經(jīng)網(wǎng)絡(luò),可以有效地擬合規(guī)則或推斷。此外,機器學習模型可復制,不受限于人力,對于醫(yī)療資源短缺及醫(yī)療公平有重要的意義。
2.1 中藥處方點評 處方點評是醫(yī)院持續(xù)醫(yī)療質(zhì)量改進和藥品臨床應(yīng)用管理的重要組成部分,是提高臨床藥物治療學水平的重要手段。處方點評對中藥臨床合理應(yīng)用有促進作用[10-11]。目前中藥飲片處方存在缺少中醫(yī)診斷、中醫(yī)診斷書寫不規(guī)范、診斷與用藥不符、藥味數(shù)超醫(yī)保、毒性中藥飲片超劑量、配伍禁忌、未標注特殊煎煮要求等問題[12-14]。相應(yīng)的問題可以分為以下兩方面進行解決。
對于用法用量不適宜、聯(lián)合用藥不適宜(十八反、十九畏)、重復給藥、藥味偏多、藥物超劑量使用未標明原因或未再次簽名等問題均屬于明確的問題,設(shè)定明確的規(guī)則即可在計算機上系統(tǒng)實現(xiàn)。研究[15]表明,使用處方前置審核系統(tǒng)可以明顯降低中成藥不合理用藥發(fā)生率。
在具體的臨床工作中,中藥處方的合理治療方案有其多樣性,臨床用量也有較大的差異,使用精確的方法難以完全適用于中藥處方的質(zhì)量管理[16]。對于無法用規(guī)則明確定義的問題,如處方功能主治與證型不符、中藥遴選不適宜、藥物劑量配比不合理、毒性中藥用量超量等,機器學習技術(shù)可以利用已有海量的處方數(shù)據(jù)及處方點評的結(jié)果,通過訓練形成數(shù)學概率模型或深層神經(jīng)網(wǎng)絡(luò)進行有效的推理,并根據(jù)數(shù)據(jù)積累,不斷提高正確率。有研究使用575個著名的中藥處方及1961個隨機生成的中藥處方做訓練,使用支持向量機SVM(Supprot Vector Machine,SVM)模型,最終結(jié)果顯示可以達到99.9%的精度,并測試近年發(fā)表的處方,有68.7%的處方被正確分類[17]。
此外,機器學習系統(tǒng)可以自動對處方點評結(jié)果進行匯總和綜合分析評價,并以此為基礎(chǔ)提出質(zhì)量改進建議,總結(jié)醫(yī)院在藥學管理、處方管理和臨床用藥方面存在的問題,這可以極大地提高處方點評的效率及處方點評的覆蓋度。
2.2 門診患者用藥咨詢工作 門診患者用藥咨詢是藥學服務(wù)的一個重要方面。中醫(yī)專家系統(tǒng)可為藥師提供有益的支持。中醫(yī)專家系統(tǒng)是對中醫(yī)臨床經(jīng)驗進行仿真的工具,在20世紀80年代一度成為中醫(yī)研究的熱點,使用的是一些簡單特征并套用現(xiàn)有規(guī)則,但由于臨床應(yīng)用效果不佳而自20世紀90年代日漸沉寂[18]。
目前專家系統(tǒng)綜合了自然語言處理、知識圖譜等技術(shù),模擬醫(yī)學專家診病開方的思維過程,繼承其豐富的臨證經(jīng)驗及辨證思維,形成一個潛在的、有效的知識體系來促進現(xiàn)代診療。在現(xiàn)實世界中,使用中醫(yī)診斷治療疾病的療效是非常復雜的,使用知識圖嵌入增強主題模型用于中藥推薦,不僅考慮了中醫(yī)醫(yī)學案例中的共現(xiàn)信息,還考慮了中醫(yī)知識圖中癥狀和中藥的綜合語義相關(guān)性,以更好地表示診斷和治療過程[19]。一種新的中醫(yī)知識發(fā)現(xiàn)系統(tǒng)結(jié)合多種數(shù)據(jù)挖掘技術(shù),主要包括藥物依賴關(guān)系發(fā)現(xiàn)算法、基于神經(jīng)網(wǎng)絡(luò)的降維算法、使用基因表達編程探索處方與療效之間關(guān)系的方法、基于中藥劑量發(fā)現(xiàn)性味和歸經(jīng)方面的屬性的方法,該系統(tǒng)可以協(xié)助進行處方審核,并自動區(qū)分處方中的配伍[20]。陳擎文[21]開發(fā)了基于神經(jīng)網(wǎng)絡(luò)技術(shù)的自動診療系統(tǒng),該系統(tǒng)可以極大地幫助各界醫(yī)生分享和學習中醫(yī)專家的經(jīng)驗,可以提高中醫(yī)的整體診療水平。Li[22]等學者提出了一種基于結(jié)構(gòu)偏序?qū)傩詧D理論,從著名中醫(yī)糖尿病專家經(jīng)驗中發(fā)現(xiàn)臨床診斷新知識的方法。使用自動知識圖譜構(gòu)建技術(shù),構(gòu)建中醫(yī)學知識網(wǎng)絡(luò),并達到較高的精確度[23]。這些方法為中醫(yī)藥的處方發(fā)現(xiàn)及處方推薦提供了一種科學先進的技術(shù)手段。以數(shù)據(jù)驅(qū)動的中藥推薦方法可以在實際臨床實踐中更加精準、智能地制定及推薦科學的治療處方,相應(yīng)的中藥處方推薦可以為藥師提供有益的參考。
2.3 中藥不良反應(yīng)監(jiān)測工作 醫(yī)療機構(gòu)在開展中藥臨床藥學服務(wù)時,除了采用標準的方法評估中藥的安全性以外,還可以借助機器學習方法提高中藥不良反應(yīng)監(jiān)測工作的效率。
現(xiàn)有的多數(shù)方法在中藥不良反應(yīng)監(jiān)測工作中都是在分析已知的中藥禁忌藥味,而機器學習技術(shù)可整合現(xiàn)有數(shù)據(jù),幫助臨床藥師在臨床實踐中預測藥物不良事件甚至可能存在禁忌的中藥藥味。如有研究使用中醫(yī)文獻的信息來估計中藥屬性之間的相關(guān)性,這些信息共同納入框架以改進最終的預測效果,根據(jù)真實世界的數(shù)據(jù)集進行驗證,相關(guān)方法可以用于中藥可能的禁忌藥味的預測[24]。使用傳統(tǒng)的詞袋(Bag-of-Word,BOW)模型預測中藥處方的不良反應(yīng),其最高的預測準確率可達0.908,這種方法可以預測中藥處方的副作用或者其他復合成分的藥物[25]。同時機器學習算法還可以用于毒性成分的預測,相關(guān)研究整合了十大肝毒性中藥,通過系統(tǒng)藥理學方法及中藥系統(tǒng)藥理學數(shù)據(jù)庫識別潛在的肝毒性成分。He[26]等學者基于機器學習可用于評估天然化合物和合成藥物的肝毒性風險,提出的計算毒理學方法將有助于篩選中藥中的肝毒性成分。這不僅為了解中藥的肝毒性機制提供了一個新的視角,還有助于中藥的安全應(yīng)用。
2.4 病歷數(shù)據(jù)的信息標注 中醫(yī)醫(yī)案承載著中醫(yī)的核心知識內(nèi)涵。在中醫(yī)領(lǐng)域,病歷是醫(yī)生診治的客觀記錄。中藥臨床藥學工作中,中醫(yī)醫(yī)案對于評價患者病情及評估用藥合理性至關(guān)重要,但由于信息內(nèi)容龐大并且相對無序,占用了臨床藥師大量的閱讀時間,如何從中提取有用的信息是一項重大的挑戰(zhàn)。
機器學習及自然語言處理(Natural Language Processing,NLP)技術(shù)可以快速標注并處理病歷數(shù)據(jù),極大地提高了臨床藥師的效率。NLP是研究人與計算機之間用自然語言進行有效通信的理論和方法。由于電子病歷數(shù)據(jù)不僅有結(jié)構(gòu)化數(shù)據(jù),還有大量非結(jié)構(gòu)化的文本數(shù)據(jù),且大量中醫(yī)相關(guān)的信息存在于非結(jié)構(gòu)化的文本中。非結(jié)構(gòu)化數(shù)據(jù)必須通過標準化和解析后才可以使用機器學習進行分析和訓練。手動構(gòu)建及標注語義既費時又費力,將文本中的非結(jié)構(gòu)化信息提取并標注為結(jié)構(gòu)化數(shù)據(jù)是文本分析的第一步。自動構(gòu)建任務(wù)的自動化方法的開發(fā)還處于初期階段[27]。信息提取最基本的工作是命名實體識別。針對目前的情況,利用中醫(yī)藥專利文本的語言特點和結(jié)構(gòu)特點,提出了一種改進的序列化協(xié)同訓練方法來識別中醫(yī)藥專利摘要文本中的藥名。該方法可以在相對較低的時間復雜度下保持較高的精度。此外,該方法還可以擴展到對中藥專利中其他命名實體的識別,如疾病名稱、制備方法等[28]。Chowdhury[29]等人使用一種新的多任務(wù)雙向RNN模型,以提高電子病歷中命名實體識別的性能,并使用真實數(shù)據(jù)集的評估結(jié)果證明了所提出模型的有效性。
機器學習的方法將極大地提高醫(yī)療服務(wù)的效率。假如機器學習可以學習中醫(yī)處方及處方應(yīng)用、處方識別的能力,那么未來全世界醫(yī)院的醫(yī)師及藥師都將共享這一能力?;谶@種能力,人工智能有望幫助人類進行診斷及調(diào)配處方,協(xié)助醫(yī)師及藥師提高合理用藥水平,保證患者用藥安全,從而極大地提高中藥藥學服務(wù)水平并減輕藥師的負擔,這對中醫(yī)藥服務(wù)和醫(yī)療決策支持具有重要意義[30]。
將機器學習技術(shù)與中醫(yī)藥服務(wù)領(lǐng)域整合,幫助中醫(yī)藥進入大數(shù)據(jù)時代和人工智能時代,可有效地提高中醫(yī)藥服務(wù)的效率和公平度,最終為中醫(yī)藥現(xiàn)代化作出相應(yīng)的貢獻。