高 睿 ,劉 智 ,王 輝 ,劉春香 ,夏 彤 ,姚 楊
(1.天津中醫(yī)藥大學國際教育學院,天津 301617;2.天津中醫(yī)藥大學中醫(yī)藥研究院,天津 301617)
近年來,隨著人工智能醫(yī)療信息技術(shù)快速發(fā)展,臨床研究中現(xiàn)實診療環(huán)境下的真實世界數(shù)據(jù)日益豐富,循證醫(yī)學研究方法學的需求與人工智能信息技術(shù)相融合,開始由理論向應用轉(zhuǎn)化,真實世界數(shù)據(jù)開始向臨床研究證據(jù)轉(zhuǎn)化,為中醫(yī)真實世界研究發(fā)展提供了客觀條件,本文介紹人工智能應用的基本方法及在中醫(yī)藥真實世界可能會應用的領域。
隨著時代變遷,21世紀臨床研究的方法學研究也在進步。2016年美國食品藥品監(jiān)督管理局(FDA)和國際藥物經(jīng)濟學與結(jié)果研究協(xié)會(ISPOR)在The New England Journal of Medicine發(fā)表文章對真實世界研究進行定義,指在真實醫(yī)療環(huán)境中排除臨床試驗外開展的所有臨床醫(yī)療數(shù)據(jù)研究[1-2]。中國學術(shù)界后續(xù)也發(fā)表了相關定義,指在真實臨床或家庭醫(yī)療環(huán)境中開展的臨床醫(yī)學研究,為評價某種患者健康的真實影響而開展的治療措施研究[3]。中醫(yī)藥臨床研究特點是“辨證論治,方證結(jié)合”,可根據(jù)患者的實際病情與診療意愿選擇不同的診療方法,這與西方真實世界研究下的精準醫(yī)學有著相似的理論。這套理論需要大量的臨床觀察數(shù)據(jù)對臨床問題進行分析與解釋,或許這就是真實世界研究被中醫(yī)藥領域廣泛接受并迅速開展的原因。中醫(yī)藥真實世界研究完全遵循循證醫(yī)學的理念,在常規(guī)醫(yī)療條件下,利用日常工作中產(chǎn)生的數(shù)據(jù)信息開展臨床科研活動,已經(jīng)成為臨床研究不可分割的一個重要組成部分。中國人口資源眾多,真實世界研究數(shù)據(jù)極為豐富,可為中醫(yī)藥真實世界研究提供充足的科研信息數(shù)據(jù),為開展大型中醫(yī)藥真實世界研究提供助力。但目前中醫(yī)藥真實世界研究正處于起步階段,中醫(yī)藥真實世界研究方法稀缺,數(shù)據(jù)采集方式單一,數(shù)據(jù)質(zhì)量不佳,研究者和患者依從性不佳都為中醫(yī)藥真實世界研究增加了實施難度,最終影響真實世界研究的結(jié)果。因此,如何能在快速、安全、可靠的基礎上獲得大規(guī)模的臨床數(shù)據(jù)并進行相對應的分析、預測是當下開展高質(zhì)量真實世界研究的前提。
當前,國際臨床研究仍然以隨機對照研究作為臨床有效性評價的“金標準”,無論解釋性研究或者實用型研究均采用隨機抽樣方式[4]。而對于中醫(yī)藥臨床研究來說,隨機對照試驗顯然是不可被替代的[5]。隨機對照試驗雖然仍被視為高質(zhì)量的證據(jù),但在中醫(yī)藥臨床研究中,由于中醫(yī)辨證論治療效評價的特點,可能會產(chǎn)生某些研究結(jié)論不一致、研究數(shù)據(jù)不精確、研究報告出現(xiàn)偏倚等現(xiàn)象,其相應證據(jù)級別會被降低,不利于中醫(yī)藥臨床研究在世界范圍內(nèi)的開展。真實世界研究內(nèi)容包括觀察性研究和試驗性研究[6],特點如下:1)真實世界研究納入人群廣,對患者的病情限制較低,設計樣本量較大,隨訪時間長。2)不采用隨機化的分組方式,根據(jù)臨床的實際選擇進行分組。3)根據(jù)真實世界的外部真實性環(huán)境進行評價,可獲得較高的真實性數(shù)據(jù)。4)真實世界研究所獲取的數(shù)據(jù)為臨床實踐真實數(shù)據(jù),不限于電子病歷、醫(yī)保數(shù)據(jù)等真實世界數(shù)據(jù)信息,可獲得較長時間內(nèi)的隨訪信息,便于大數(shù)據(jù)分析與療效評價。
根據(jù)以上真實世界研究特點,可發(fā)現(xiàn)真實世界研究與中醫(yī)藥臨床研究證據(jù)評價有極為相似的特點,中醫(yī)藥臨床研究“辨證論治,方證結(jié)合”的特點就是在以“臨床經(jīng)驗”為基礎的療效評價前提下進行的證據(jù)評價研究[7-9]。而證據(jù)評價需要海量數(shù)據(jù)作為證據(jù)來源,中醫(yī)藥臨床證據(jù)的評價就是建立在極為豐富的中醫(yī)藥臨床實踐大規(guī)模證據(jù)基礎上,也就是以真實世界研究為基礎的臨床評價數(shù)據(jù)研究。因此,如何將真實世界中的大數(shù)據(jù)規(guī)范化采集并合理優(yōu)效使用是當前中醫(yī)藥臨床研究中急需解決的科學問題。
3.1 人工智能技術(shù)的發(fā)展現(xiàn)狀 隨著計算機技術(shù)與信息技術(shù)的快速發(fā)展,人工智能技術(shù)逐漸成為計算機領域的翹楚,雖然人工智能技術(shù)發(fā)展時間較短,發(fā)展過程曲折,但人工智能技術(shù)已應用在各大領域,并成為各自領域創(chuàng)新發(fā)展迫切要應用的一種技術(shù)方法。人工智能是指將人類思維中的理論、方法、技術(shù)用計算機的開發(fā)方式模擬、擴展和延伸在真實世界中以機器語言表達實現(xiàn)的一種科學技術(shù)[10-12]。這一概念在1956年被正式提出,并持續(xù)發(fā)展至今,21世紀初大數(shù)據(jù)高性能技術(shù)應用于各行各業(yè),絕大多數(shù)領域都將互聯(lián)網(wǎng)+大數(shù)據(jù)的技術(shù)方法作為本行業(yè)的突破,力求達到技術(shù)突破并解決本行業(yè)內(nèi)存在的傳統(tǒng)行業(yè)壁壘。但直至今日,各領域都沒有達到各自目的,只是存儲了大量的數(shù)據(jù)資源,造成了時間與存儲空間的浪費。本研究認為,大數(shù)據(jù)技術(shù)只是將傳統(tǒng)領域中的數(shù)據(jù)優(yōu)效存儲并分類關聯(lián),并未像人類思維的方式預測并解決現(xiàn)實行業(yè)中的技術(shù)壁壘和難題。但不可否認大數(shù)據(jù)是實現(xiàn)人工智能技術(shù)的前提,人工智能技術(shù)利用存在的龐大數(shù)據(jù)信息開展機器學習,相互推衍快速迭代和進步,其強大的賦能性可解決真實世界中的各種問題。目前,在人工智能領域相對成熟的人工智能技術(shù)包括:語音識別、圖像識別、智能機器人等技術(shù)。在醫(yī)學領域,語音識別、圖像識別技術(shù)已相對比較完善,并已應用于醫(yī)學臨床實踐,得到有效的結(jié)論[13]。
3.2 人工智能技術(shù)在中醫(yī)藥真實世界研究中存在的問題及未來發(fā)展趨勢 中醫(yī)證候研究是中醫(yī)臨床實踐的基礎與核心,是疾病發(fā)生與演變過程的真實反映。真實世界研究中,醫(yī)生通過證候與疾病發(fā)生的關系為主要切入點可以充分了解患者的病情并針對患者的真實情況進行準確的診療。但目前在中醫(yī)藥真實世界實踐中由于中醫(yī)證候具有相當?shù)膹碗s性、模糊性與難操作性,使得醫(yī)生在診療時中醫(yī)證候辨別不清,未能充分發(fā)揮中醫(yī)的特點。因此,中醫(yī)在真實世界研究中的準確辨證成為亟需解決的重要問題。人工智能大數(shù)據(jù)真實世界研究主要解決的是在極為復雜的數(shù)據(jù)中尋找可能存在的相關性,剛好可以解決與中醫(yī)真實世界研究中多變復雜的相互關系,為中醫(yī)證候辨別提供一種準確的方法。中醫(yī)藥真實世界研究領域,特征便是以患者為中心,以數(shù)據(jù)為導向,精準實現(xiàn)醫(yī)療實踐的科學預測與模擬計算[14-15]。而人工智能技術(shù)中機器學習技術(shù)可解決中醫(yī)藥臨床研究診療中“辨證論治,方證結(jié)合”的復雜性與多樣性,可精準預測個體化患者可能患有的證候、疾病及可能會應用的方證,為實現(xiàn)中醫(yī)藥臨床評價提供助力。機器學習是人工智能領域的一個重要方向,近年來隨著技術(shù)的不斷發(fā)展,機器學習的技術(shù)不斷被快速更新,內(nèi)容越來越豐富,常見的算法應用包括決策樹算法、人工神經(jīng)元網(wǎng)絡、深度學習、支持向量機、樸素貝葉斯等,機器學習最重要的功能就是獲得輸入數(shù)據(jù)分類學習的能力,包括對不同語言、文字的區(qū)分以及識別。
3.3 神經(jīng)元網(wǎng)絡算法的特點和優(yōu)點 人工神經(jīng)元網(wǎng)絡是一種模仿動物神經(jīng)網(wǎng)絡特征進行分布式信息運算的一種特殊數(shù)學模型,簡稱“神經(jīng)元網(wǎng)絡”[16-17]。這種網(wǎng)絡通過調(diào)整內(nèi)部相鄰的節(jié)點進行相互快速訪問,可達到信息快速響應處理。神經(jīng)元網(wǎng)絡算法具有極強的相互學習能力與適應能力,可通過預先學習本主提供的不同類型數(shù)據(jù)進行學習分析,掌握不同數(shù)據(jù)類型之間潛在的特征與規(guī)律,通過分析這些規(guī)律,獲得新的輸入數(shù)據(jù)來推衍計算得到最終的結(jié)果,這種推衍方式被稱為“機器訓練”。這種算法配合大數(shù)據(jù)的使用可以運用到各種相關的領域,近些年隨著人工智能技術(shù)的發(fā)展,科學家們根據(jù)神經(jīng)元網(wǎng)絡算法的規(guī)律又提出新的具備不同信息處理能力的神經(jīng)元網(wǎng)絡算法模型,這幾種模型可以分為3個不同的方向[18]:1)根據(jù)神經(jīng)元網(wǎng)絡算法的初衷,探索人類腦神經(jīng)系統(tǒng)生物的結(jié)構(gòu)、機制,根據(jù)結(jié)構(gòu)的演變進行算法的推衍。2)運用計算機制造學中的光學與微電子學科學技術(shù)進行神經(jīng)網(wǎng)絡學的功能網(wǎng)絡構(gòu)造。3)將神經(jīng)網(wǎng)絡學理論作為一種解決問題的方法與手段,特別運用于傳統(tǒng)方式無法解決或技術(shù)上存在困難的的領域。
神經(jīng)元網(wǎng)絡算法的優(yōu)點:1)神經(jīng)元網(wǎng)絡算法與傳統(tǒng)的計算機算法在計算上有著本質(zhì)的區(qū)別,可以把計算處理器分配到很多細小又相互緊密連接的微處理單元中,各微處理單元計算功能簡單,大量簡單又相互連接的處理單元識別與計算不同類型的數(shù)據(jù)既便捷、迅速,同時又可滿足計算機硬件更新?lián)Q代的速度,很大程度上提升了軟件在計算機中運行的速度。2)神經(jīng)元網(wǎng)絡容錯機制高,若某部分神經(jīng)元網(wǎng)絡損壞,不會對網(wǎng)絡整體造成特殊的影響,只會降低神經(jīng)元網(wǎng)絡內(nèi)部的運行性能,但并不能妨礙神經(jīng)元網(wǎng)絡的正常工作,即便網(wǎng)絡主體部分受到破壞也不會造成網(wǎng)絡的癱瘓,可充分保障軟件運行的安全機制。3)神經(jīng)元網(wǎng)絡中的數(shù)據(jù)存儲信息極度安全,不同類型的定量或定性數(shù)據(jù)被保存在各種神經(jīng)元之間的節(jié)點權(quán)值上,進行分布式神經(jīng)網(wǎng)絡協(xié)同運算處理,各節(jié)點之間可以通過訓練樣本與訓練過程進行有效切分,同時通過競爭篩選把學習內(nèi)容遷移到相鄰的節(jié)點,已獲得較多的學習資源,保證數(shù)據(jù)的存儲安全。4)神經(jīng)元網(wǎng)絡算法的學習功能強大,可以通過節(jié)點連接權(quán)值或連接結(jié)構(gòu)學習已知或未知的系統(tǒng),且自學習功能對未知功能預測有特別重要的意義,應用領域較廣。神經(jīng)元網(wǎng)絡算法的這些特點和優(yōu)點,使其在中醫(yī)藥臨床研究中得以應用成為可能。
3.4 神經(jīng)元網(wǎng)絡算法在中醫(yī)藥真實世界中的應用模式 神經(jīng)元網(wǎng)絡算法作為一種自學習、自適應識別技術(shù)模型,不需要預先給出大量的經(jīng)驗數(shù)據(jù)或算法函數(shù)作為參考依據(jù),依靠自身的節(jié)點連接自適應機器學習機制就可以形成所需要方法的決策區(qū)域[19]。神經(jīng)元算法的特性由節(jié)點所連接的權(quán)值、節(jié)點拓撲結(jié)構(gòu)、學習與訓練規(guī)則來決定。神經(jīng)元網(wǎng)絡算法可以充分利用不同類型的數(shù)據(jù)信息互相訓練學習,并且相互映射,獲得更多的信息資源,若網(wǎng)絡狀態(tài)發(fā)生改變,還可重新調(diào)整自適應學習新的規(guī)則。
中醫(yī)藥從秦漢時期發(fā)展至今,之所以還擁有重要的位置,正是秉承了中醫(yī)的辨證論治、方證結(jié)合的特點。臨床醫(yī)生將患者的“望、聞、問、切”結(jié)果作為真實世界中臨床診斷的基本數(shù)據(jù)。隨著5 000多年時間的推移,中醫(yī)藥經(jīng)驗醫(yī)學積攢與印證了相當豐富的數(shù)據(jù)資源,作為整體醫(yī)學與精準醫(yī)學的代表,中醫(yī)藥的數(shù)據(jù)資源已經(jīng)具備了大數(shù)據(jù)的潛在特征[20]。人工智能技術(shù)在大數(shù)據(jù)研究的基礎上可快速實現(xiàn)中醫(yī)學在真實世界中關于診斷癥狀、證候與方證的評價。神經(jīng)元網(wǎng)絡算法為中醫(yī)藥真實世界臨床研究提供必需的技術(shù)支持,為臨床醫(yī)生提供證候診斷、藥物評價等技術(shù)方法。在保證診療結(jié)果正確的前提下,為醫(yī)生提供便利的醫(yī)學決策輔助參考方式。
文章重點介紹了基于神經(jīng)元網(wǎng)絡算法的中醫(yī)藥證候辨識如何在真實世界研究中的開展模式(見圖1)。中醫(yī)真實世界中,神經(jīng)元網(wǎng)絡算法可應用于臨床證候的診斷,病癥與疾病對應神經(jīng)網(wǎng)絡的輸入節(jié)點,輸出節(jié)點對應著中醫(yī)證候,首先利用一組已經(jīng)被識別的癥狀與疾病樣本進行訓練學習,確定神經(jīng)元網(wǎng)絡的結(jié)構(gòu)(函數(shù)與神經(jīng)元數(shù)目)和基本參數(shù)(連接權(quán)值)。訓練后,證候模式的分類就是設定一組中醫(yī)癥狀,實現(xiàn)患者患病癥狀到痊愈癥狀之間的非線性映射的過程。具體可以分為以下幾步:1)首先獲得一定數(shù)量的某中醫(yī)學領域患者的學習樣本進行神經(jīng)元網(wǎng)絡訓練,得到期望的診療效果。2)設定合理的中醫(yī)癥狀網(wǎng)絡結(jié)構(gòu)和模型,尤其是網(wǎng)絡中間層神經(jīng)元個數(shù)。3)確定中醫(yī)癥狀訓練的樣本集與測試集。癥狀樣本集用于神經(jīng)元網(wǎng)絡的訓練,測試集用于核查與印證神經(jīng)網(wǎng)絡訓練的效果是否準確。中醫(yī)證候樣本集應該大范圍涵蓋所有可能出現(xiàn)的中醫(yī)證候,并具有一定的代表性,同時還必須保證學習的正確性。4)在神經(jīng)元網(wǎng)絡算法中根據(jù)中醫(yī)癥狀訓練樣本集,經(jīng)過測試后的樣本集訓練結(jié)果可以作為中醫(yī)證候樣本庫用以預測與判斷患者未來可能會產(chǎn)生的中醫(yī)證候。
圖1 基于中醫(yī)癥狀診斷的神經(jīng)網(wǎng)絡算法
目前,真實世界研究已經(jīng)逐漸被臨床研究者接受并開展到臨床研究領域和循證醫(yī)學實踐中。中醫(yī)藥真實世界研究起步較晚,但發(fā)展?jié)摿薮?,憑借豐富的人群資源與中醫(yī)藥經(jīng)驗醫(yī)學的特點可為世界醫(yī)學提供寶貴的醫(yī)學知識。21世紀醫(yī)學是信息醫(yī)學的時代,同樣也是數(shù)據(jù)引領的時代,人工智能技術(shù)的出現(xiàn)可為臨床研究者更加深入解決重大臨床問題與科研難題作出貢獻。神經(jīng)元網(wǎng)絡算法作為人工智能的核心,將其應用于中醫(yī)藥真實世界研究是可行的,其將先進的技術(shù)理論與中醫(yī)臨床理論相結(jié)合,客觀評價與解決中醫(yī)藥真實世界研究中辨證方法不可測量、不可重復、不可評價的技術(shù)問題,逐步探索并解決中醫(yī)藥臨床研究中可能存在的各種技術(shù)壁壘與孤島,助力中醫(yī)藥臨床研究在世界醫(yī)學研究中的位置,為推動中醫(yī)藥大健康在人工智能時代的發(fā)展提供巨大幫助,具有極其重要的意義。