潘玉穎,崔偉峰,馬笑凡,范軍銘
(河南省中醫(yī)藥研究院,河南 鄭州450004)
醫(yī)生診療疾病是一個嚴謹?shù)倪壿嬐评磉^程,從采集病史、診斷疾病到臨床治療、預測轉(zhuǎn)歸,醫(yī)生需要把所有信息在大腦中篩檢、融合、匯總、分析。因西醫(yī)診斷疾病標準清晰,“同病同方”,自20世紀開始已有不同疾病的醫(yī)學診療模型指導診斷治療。但與此相對的中醫(yī)診療,其智能化發(fā)展相對滯后,多數(shù)研究僅停留在名老中醫(yī)經(jīng)驗的整理和數(shù)據(jù)分析,因此,構(gòu)建中醫(yī)人工智能診療模型,實現(xiàn)智能診療是中醫(yī)藥現(xiàn)代化發(fā)展的關(guān)鍵。
西醫(yī)應用人工智能技術(shù)開發(fā)的智能診斷模型、專家系統(tǒng)已應用于臨床,而中醫(yī)診療智能化的發(fā)展與臨床實用要求還有很大差距。
自1959年LEDLEY等首次應用計算機輔助診斷的數(shù)學模型診斷出一組肺癌病例,計算機輔助診斷應運而生,如今人工智能技術(shù)在醫(yī)學診療領(lǐng)域的應用日益廣泛[1]。日本三菱公司研制的“人工網(wǎng)膜基片”能快速精確地識別海量醫(yī)學圖像信息,其速度是傳統(tǒng)識別系統(tǒng)的數(shù)萬倍。人工智能在腫瘤性疾病和心臟病、糖尿病視網(wǎng)膜病變等疾病的臨床診斷中已廣泛應用[2]。西醫(yī)智能診療系統(tǒng)已越來越多地應用于臨床,反觀中醫(yī),比較深入的研究出現(xiàn)在20世紀90年代,研究也多集中在根據(jù)模糊判別模式模擬臨床經(jīng)驗進行中醫(yī)辨證[3-7]、采用協(xié)同分布式方法進行中醫(yī)診斷[8-9]、廣泛采用神經(jīng)網(wǎng)絡模型建立中醫(yī)辨證系統(tǒng)[10-15]、應用數(shù)據(jù)挖掘技術(shù)和決策樹方法進行中醫(yī)證型分類[16-18]、采用基于信息熵的決策樹算法[19]等。但是這些研究都沒有系統(tǒng)引進人工智能先進的理論、方法和技術(shù),使研究內(nèi)容與臨床應用相互分離,限制了中醫(yī)診斷思維機制的實現(xiàn)效果。
中醫(yī)診療智能化的主要難點在于中醫(yī)辨證論治的思維難以轉(zhuǎn)化為線性邏輯,中醫(yī)診療輸出信息多,高維度的數(shù)據(jù)難以計算分析。
目前國內(nèi)外有關(guān)中醫(yī)診斷智能方法與技術(shù)的研究開發(fā),主要是一些具體方法和技術(shù)的分散研究,其無法系統(tǒng)集成的原因主要有兩個方面。第一個方面是沒有解決中醫(yī)辨證論治思維方法中的形式化描述問題。中醫(yī)臨床診斷多是在許多模糊、非定性、獨立于生化指標外的情況下進行辨證論治,依托數(shù)理模板、經(jīng)典邏輯及其推理技術(shù)無法從根本上解決這一問題,成為中醫(yī)診斷智能化發(fā)展的瓶頸。第二個方面是中醫(yī)輸入輸出信息量巨大,高維度的信息阻礙計算效率。中醫(yī)證候因人而異,證型繁多,用藥隨癥加減沒有固定標準,無法用簡單的符號算法代替。大量信息不經(jīng)降維處理難以計算分析,海量信息直接應用于模型會造成系統(tǒng)崩潰。傳統(tǒng)的專家系統(tǒng)主要是采用符號計算方法構(gòu)建,系統(tǒng)規(guī)則一旦形成,難以更新,導致系統(tǒng)內(nèi)容不能適應不斷變化的環(huán)境。因此,如何利用人工智能技術(shù),使之具有自學習、自適應的功能,成為開發(fā)先進智能中醫(yī)診斷系統(tǒng)的關(guān)鍵。中醫(yī)診療病歷數(shù)據(jù)的數(shù)字化、網(wǎng)絡化積累了海量的數(shù)據(jù)資料,這些數(shù)據(jù)資料的維數(shù)已經(jīng)對目前大多數(shù)據(jù)挖掘算法的效率造成了嚴重的阻礙,這種阻礙被稱為“維數(shù)災難”[20],所以處理高維數(shù)據(jù)必須進行降維。降維是一種將輸入空間的樣本線性或非線性地投影到低維空間,以求獲得一個關(guān)于原數(shù)據(jù)集的緊致的低維表示方法[21]。醫(yī)學研究中最常見的數(shù)據(jù)格式之一是矢量數(shù)據(jù),隨著醫(yī)學實驗水平的發(fā)展,對個體的觀察指標變得越來越多,描述的內(nèi)容也變得越來越豐富,數(shù)據(jù)集的維數(shù)也不斷增高。海量數(shù)據(jù)的降維是醫(yī)學大數(shù)據(jù)研究的基礎(chǔ)和關(guān)鍵。在醫(yī)學數(shù)據(jù)中降維方法的選擇應用及開發(fā)新的有效的降維方法是本課題擬解決的關(guān)鍵問題。四診合參是中醫(yī)診療的核心,也是收集疾病信息的主要途徑。近年來,人機對話技術(shù)、面部自動識別技術(shù)、嗅覺傳感器技術(shù)與圖片處理技術(shù)的高速發(fā)展,為中醫(yī)四診信息的自動化采集識別、智能化處理分析提供了方法學上的支持。脈象儀記錄脈象信息和舌象儀記錄客觀舌象信息解決了中醫(yī)望診智能化信息的獲取問題。舌脈象的智能化、客觀化不僅是未來中醫(yī)互聯(lián)網(wǎng)醫(yī)療所需要的,更是中醫(yī)智能化診療所必需的。
名老中醫(yī)辨證施治、遣方用藥準確靈活,拓制名老中醫(yī)診病思維是智能診療的核心,將最新的人工智能技術(shù)與中醫(yī)結(jié)合能夠高度模擬名老中醫(yī)的診療思維。
傳統(tǒng)中醫(yī)學是中華民族應用千年的寶貴財富,名老中醫(yī)診療經(jīng)驗是中醫(yī)理論、前人經(jīng)驗與當今臨床實踐的高度結(jié)合,是長期臨床實踐的積累,是中醫(yī)學術(shù)創(chuàng)新發(fā)展的源泉。將名老中醫(yī)的臨床經(jīng)驗高效地保存?zhèn)鞒?成為中醫(yī)藥現(xiàn)代化發(fā)展的關(guān)鍵。傳統(tǒng)中醫(yī)診斷脫離現(xiàn)代病理檢測,具有經(jīng)驗性、模糊性、不確定性等特點,諸多非客觀指標嚴重制約了中醫(yī)的發(fā)展和應用。目前,中醫(yī)辨證診斷過程無法做到規(guī)范化、客觀化、定量化,如何將經(jīng)驗性、模糊性的中醫(yī)辨證過程變的具有可計算性是中醫(yī)現(xiàn)代化研究的主要問題。中醫(yī)的精要在于辨證論治,以往根據(jù)經(jīng)驗和文獻直接定性的方法難以得到客觀的辨證分型。不客觀的辨證分型使證候的命名及描述帶有很強的主觀性和隨意性,得出的結(jié)果就不能反映中醫(yī)診病的思路。目前關(guān)于中醫(yī)證候分類研究的方法繁多,但沒有一個某種單一技術(shù)模擬中醫(yī)證候辨證的應用,因此借鑒先進的人工智能技術(shù)和方法進行中醫(yī)智能診療研究成為可能。在人工智能技術(shù)指導下模擬診療思維模型,這個模型包括了中醫(yī)望聞問切、生化指標和處方用藥。用臨床病歷訓練模型,調(diào)整隱含層各參數(shù),通過臨床自學習功能進一步提高診療準確性,這樣既避免了探索性研究的煩瑣,也最大程度保持與臨床實踐的一致性。
現(xiàn)代人工智能技術(shù)多種多樣,其中人工神經(jīng)網(wǎng)絡能夠模擬人類思維,具有自學習、自適應等功能,成為人工智能領(lǐng)域的主流技術(shù)。其深度增強學習算法通過大樣本的訓練和獎勵樣本的重復學習能夠較好地解決中醫(yī)診療的模糊性、高維度性、經(jīng)驗性等問題。
中醫(yī)智能化診療是未來醫(yī)療發(fā)展的趨勢,目前中醫(yī)智能化診療的關(guān)鍵在于中醫(yī)診療的經(jīng)驗性、不確定性、模糊性難以轉(zhuǎn)化為線性邏輯。隨著人工智能技術(shù)發(fā)展日益成熟,多種模型可模擬人腦進行黑箱操作,處理非線性信息并可適應學習。目前人工智能領(lǐng)域較先進、應用較廣泛的核心技術(shù)是深度神經(jīng)網(wǎng)絡,并逐漸成為人工智能領(lǐng)域的主流技術(shù)。人工神經(jīng)網(wǎng)絡(ANN)是用來模擬腦神經(jīng)系統(tǒng)的結(jié)構(gòu)和功能,是由大量處理單元經(jīng)廣泛互連而組成的人工網(wǎng)絡。ANN根據(jù)樣本進行訓練,訓練時,樣本的輸入值傳給ANN的輸入層節(jié)點,ANN接受這些輸入值并與權(quán)值進行運算,在輸出層節(jié)點產(chǎn)生輸出模式,若輸出模式與樣本的目標模式有誤差,ANN對權(quán)值進行調(diào)優(yōu),這樣的訓練過程將迭代進行許多次。后期通過應用ANN能夠自動適應輸入信息調(diào)整參數(shù),并從中學習,具有自學習、自適應和聯(lián)想記憶等功能。MLP算法即多層感知器,是一種前向結(jié)構(gòu)的ANN,映射一組輸入向量到一組輸出向量,是常見的ANN算法,它由一個輸入層、一個輸出層和一個或多個隱藏層組成。深度增強學習(DRL)是深度學習范疇的一個分支,近年來發(fā)展迅猛。DRL是實現(xiàn)從perception感知到action動作的端對端學習的一種全新的算法,是將深度學習與增強學習結(jié)合,從而解決計算機從感知到?jīng)Q策控制的問題,進而實現(xiàn)通用人工智能。通用人工智能是要創(chuàng)造一種無須人工編程而自己學會解決各種問題的智能體,最終目標是實現(xiàn)類人級別甚至超人級別的智能。DRL可類比人類認知,輸入感知信息如視覺,然后通過深度神經(jīng)網(wǎng)絡直接輸出動作,中間沒有hand-crafted工作。DRL具備使機器實現(xiàn)完全自主學習的一種甚至多種技能的潛力。深度學習把原始數(shù)據(jù)通過一些簡單、非線性的模型轉(zhuǎn)變?yōu)楦邔哟?、更加抽象的表達,其實質(zhì)是一種特征學習方法。深度學習擅長發(fā)現(xiàn)高維數(shù)據(jù)中的復雜結(jié)構(gòu),因此它被應用于中醫(yī)證候診斷方面[22-23]。增強學習強調(diào)模型在與環(huán)境的交互中學習,利用環(huán)境的評價性反饋信號修正行為、選擇策略,成為求解復雜決策問題的一種可行性手段[20,24]。2016年Google推出的AlphaGo使計算機的圍棋水平達到甚至超過了頂尖職業(yè)棋手的水平,引起了世界性的轟動。AlphaGo的核心在于使用了DRL的最新算法,使計算機能夠通過自對弈的方式不斷提升棋力。將DRL應用到中醫(yī)智能化治療模型,將會為解決中醫(yī)診療的經(jīng)驗性、不確定性、模糊性等問題帶來重大突破,將克服傳統(tǒng)智能技術(shù)的不足,為中醫(yī)智能診療系統(tǒng)的研發(fā)開辟新思路、新途徑。