胡 文,侯政昆,劉鳳斌,陳新林
(1. 廣州中醫(yī)藥大學(xué)第一臨床醫(yī)學(xué)院 廣州 510006 ;2. 廣州中醫(yī)藥大學(xué)第一附屬醫(yī)院 廣州 510405;3. 廣州中醫(yī)藥大學(xué)基礎(chǔ)醫(yī)學(xué)院衛(wèi)生統(tǒng)計(jì)教研室 廣州 510006)
在現(xiàn)今時(shí)代,數(shù)據(jù)是材料,分析計(jì)算是生產(chǎn)。信息時(shí)代促使醫(yī)療行業(yè)的諸多業(yè)務(wù)開始走向信息化、數(shù)字化和智能化?,F(xiàn)階段醫(yī)療活動(dòng)也開始以信息技術(shù)、網(wǎng)絡(luò)技術(shù)等多種形式展開,整個(gè)醫(yī)療行業(yè)朝著智能化方向推進(jìn)。大數(shù)據(jù)其名是JohnR.Masey 于1998 年在USENIX 贊助的計(jì)算機(jī)系統(tǒng)實(shí)驗(yàn)座談會(huì)上首次提出,在《Big Data and the Next Wave of Infrastress》提出這一概念[1]。大數(shù)據(jù)只是一門市場(chǎng)語言,代表的是一種理念、一種問題解決賽思路、一系列技術(shù)的集合?!按髷?shù)據(jù)”泛指巨量的數(shù)據(jù)集,互聯(lián)網(wǎng)行業(yè)指的是互聯(lián)網(wǎng)公司在日常用運(yùn)營(yíng)中生成、積累的行為數(shù)據(jù),大數(shù)據(jù)的價(jià)值是運(yùn)用方法和工具之后,將存放在服務(wù)器中平淡無奇的數(shù)據(jù)變成具有超高價(jià)值的產(chǎn)品。
數(shù)據(jù)是平臺(tái)運(yùn)行后最基本的產(chǎn)物,亦是最基本的再生資料。大數(shù)據(jù)具有體量大、數(shù)據(jù)類型多樣、數(shù)據(jù)處理速度快和數(shù)據(jù)價(jià)值密度低等特點(diǎn)。數(shù)據(jù)把握事實(shí)的真相,中醫(yī)臨床診斷治療疾病主要靠臨床醫(yī)師個(gè)人對(duì)疾病的經(jīng)驗(yàn)性抽象認(rèn)識(shí),缺少臨床診療過程直觀證據(jù)。中醫(yī)理論及在治療疾病時(shí)對(duì)信息的處理方法和“大數(shù)據(jù)”處理方式很相似,即是對(duì)整體的把握、模糊信息的提取和對(duì)相關(guān)性信息的探討[2]。臨床醫(yī)師經(jīng)驗(yàn)積累的過程是人腦對(duì)數(shù)據(jù)樣本不斷提取、推斷和總結(jié)的過程,樣本量的積累和對(duì)疾病的認(rèn)識(shí)、中醫(yī)理論的理解和及中醫(yī)藥方面的創(chuàng)新呈正相關(guān)。大數(shù)據(jù)能盡可能多的收集具有多樣性、多范圍、多空間等特性的樣本,并快速對(duì)信息進(jìn)行提取、推斷和總結(jié),其高效性、正確率遠(yuǎn)遠(yuǎn)超過傳統(tǒng)的臨床經(jīng)驗(yàn)積累。
互聯(lián)網(wǎng)大數(shù)據(jù)主要分為設(shè)備數(shù)據(jù)和用戶數(shù)據(jù)兩類,具體為位置數(shù)據(jù)、上網(wǎng)數(shù)據(jù)、用戶興趣數(shù)據(jù)、通信數(shù)據(jù)和社交數(shù)據(jù)、身份證信息數(shù)據(jù)、用戶金融數(shù)據(jù)等[3]。互聯(lián)網(wǎng)數(shù)據(jù)采集是在互聯(lián)網(wǎng)系統(tǒng)平臺(tái)對(duì)數(shù)據(jù)進(jìn)行采集,其中包括Web 端和APP 手機(jī)客戶端兩大系統(tǒng),分別在各個(gè)系統(tǒng)中埋點(diǎn)規(guī)范或標(biāo)準(zhǔn)化來滿足通用瀏覽、點(diǎn)擊、特殊交互等多種業(yè)務(wù)場(chǎng)景,建立一套高性能、高可靠性的數(shù)據(jù)傳輸體系,完成數(shù)據(jù)從生產(chǎn)業(yè)務(wù)端到大數(shù)據(jù)系統(tǒng)的傳輸。大數(shù)據(jù)的大、快、多樣性只是它的表象,大數(shù)據(jù)真正的價(jià)值在于生命性和生態(tài)性。不斷產(chǎn)生的數(shù)據(jù)是活數(shù)據(jù),活數(shù)據(jù)是全本記錄、實(shí)時(shí)驅(qū)動(dòng)決策和迭代,其價(jià)值是使用場(chǎng)景和方式呈動(dòng)態(tài)變化。在中醫(yī)藥臨床研究中大量的活數(shù)據(jù)可進(jìn)行量化、衡量、對(duì)比和評(píng)估,其對(duì)于中醫(yī)藥臨床的研究?jī)r(jià)值不可估量。
對(duì)數(shù)據(jù)進(jìn)行分析計(jì)算是產(chǎn)出過程,數(shù)據(jù)挖掘是從海量數(shù)據(jù)中獲取有效的、新穎的、潛在有用的、最終可理解的非平凡過程。機(jī)器學(xué)習(xí)是數(shù)據(jù)挖掘的重要工具,其專門研究計(jì)算機(jī)是怎么模擬或?qū)崿F(xiàn)人類的學(xué)習(xí)行為,以獲取新的知識(shí)或技能,重新組織已有的知識(shí)結(jié)構(gòu),使之不斷的改善自身性能,主要流程是對(duì)數(shù)據(jù)進(jìn)行特征提取、特征選擇、推理、預(yù)測(cè)或者識(shí)別。在機(jī)器學(xué)習(xí)中深度學(xué)習(xí)(Deep Learning)算法是人工智能最熱門的算法,其目的在于建立、模擬人腦進(jìn)行分析和學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò),模仿人腦的機(jī)制來解釋數(shù)據(jù),由于模型的層次多、參數(shù)多、容量大,因此有能力處理龐大、復(fù)雜和多維的數(shù)據(jù)。中醫(yī)診斷治療疾病的過程在基于客觀事實(shí)的基礎(chǔ)上偏向主觀經(jīng)驗(yàn),大數(shù)據(jù)善于挖掘較微小數(shù)據(jù)、容易被忽視的數(shù)據(jù),發(fā)現(xiàn)和挖掘這些細(xì)小數(shù)據(jù)的價(jià)值,中醫(yī)經(jīng)驗(yàn)性的抽象操作很大可能與這些微小的信息數(shù)據(jù)有關(guān),大數(shù)據(jù)的應(yīng)用為中醫(yī)藥的發(fā)展提供了更多的可能[4]。
中醫(yī)藥臨床大數(shù)據(jù)技術(shù)的處理和運(yùn)用主要操作步驟分別為“數(shù)據(jù)儲(chǔ)存和預(yù)處理”、“從非結(jié)構(gòu)數(shù)據(jù)中提取結(jié)構(gòu)數(shù)據(jù)”、“電腦錄入信息”、“數(shù)據(jù)分析”、“數(shù)據(jù)可視化、預(yù)測(cè)和決策”五個(gè)部分。中醫(yī)藥臨床數(shù)據(jù)的采集主要為住院病歷系統(tǒng)和門診病歷系統(tǒng),規(guī)范化、結(jié)構(gòu)化和統(tǒng)一的病例標(biāo)準(zhǔn)減輕了數(shù)據(jù)采集的難度,然而臨床單位病例數(shù)據(jù)庫為局域網(wǎng)受保護(hù)數(shù)據(jù),單個(gè)醫(yī)院病源數(shù)量有限,患者流動(dòng)情況、復(fù)診情況及其它因素造成數(shù)據(jù)采集不全面,導(dǎo)致患者資料庫進(jìn)展緩慢和數(shù)據(jù)不全。臨床醫(yī)療數(shù)據(jù)不能共享造成巨大的醫(yī)療資源浪費(fèi),同時(shí)阻撓了對(duì)患者信息資料全面采集、觀察和數(shù)據(jù)提取?,F(xiàn)階段已經(jīng)出現(xiàn)了區(qū)域性和全國(guó)性病歷資料統(tǒng)一管理平臺(tái),具體有醫(yī)院聯(lián)合創(chuàng)建的區(qū)域性的病歷庫、單病種互聯(lián)網(wǎng)病歷庫等多種形式的數(shù)據(jù)資料整合,像中國(guó)中醫(yī)科學(xué)院的聯(lián)合病例系統(tǒng)、不良反應(yīng)哨點(diǎn)計(jì)劃和國(guó)家局首頁監(jiān)測(cè)等,作為平臺(tái)對(duì)中醫(yī)藥臨床進(jìn)行數(shù)據(jù)采集、管理和臨床治療質(zhì)量進(jìn)行監(jiān)控。
大樣本量的大數(shù)據(jù)平臺(tái)下,抽樣的傳統(tǒng)臨床評(píng)估方法可以克服樣本量小的缺陷和不足,同時(shí)臨床科研變得更加的方便、容易和多樣化。Zhang Junhua[5]認(rèn)為在大數(shù)據(jù)時(shí)代下醫(yī)學(xué)研究目標(biāo)從“因果關(guān)系推斷”轉(zhuǎn)向“相關(guān)性分析”,有助于評(píng)估個(gè)體疾病走向,然中醫(yī)藥臨床數(shù)據(jù)復(fù)雜、種類繁多、區(qū)域差異等特點(diǎn),需求具有中醫(yī)藥特色的數(shù)據(jù)錄入存儲(chǔ)方式、數(shù)據(jù)標(biāo)準(zhǔn)化方法和數(shù)據(jù)分析方法。大數(shù)據(jù)的價(jià)值越來越被認(rèn)可,大量的適用于中醫(yī)藥特色的數(shù)據(jù)錄入、挖掘、分析系統(tǒng)開始投入研發(fā)和使用[6-8],使其更好的服務(wù)于臨床研究。同時(shí)大數(shù)據(jù)在中醫(yī)藥臨床研究中的應(yīng)用發(fā)展呈現(xiàn)多樣性,適用于中醫(yī)理論、診斷方法學(xué)、組方規(guī)律等多個(gè)方面的研究。Li juan C[9]通過對(duì)收集慢性乙型肝炎患者的中醫(yī)辨證診斷信息,通過數(shù)據(jù)分析研制出慢性乙肝的中醫(yī)診斷量表。Zhang XP[10]采用收集和分析艾滋病患者中醫(yī)癥候和處方數(shù)據(jù),確認(rèn)艾滋病的中醫(yī)診斷、辨證和治療方法。You Xin[11]對(duì)多個(gè)數(shù)據(jù)庫進(jìn)行中藥補(bǔ)腎藥方進(jìn)行數(shù)據(jù)挖掘和分析,認(rèn)為中藥補(bǔ)腎法治療骨髓抑制的規(guī)律是健脾補(bǔ)腎。
采用精確檢索的方法對(duì)中國(guó)知網(wǎng)數(shù)據(jù)庫進(jìn)行檢索,檢索式為(TI = 數(shù)據(jù)OR TI = 信息OR TI = 智能化)AND(TI = 挖掘OR TI = 分析OR TI = 統(tǒng)計(jì))AND(AB = 經(jīng)驗(yàn)OR AB = 治療OR AB = 臨床),學(xué)科領(lǐng)域?yàn)橹嗅t(yī)學(xué)、中藥學(xué)、中西醫(yī)結(jié)合,末次檢索時(shí)間為2018年12月3日。
文獻(xiàn)納入標(biāo)準(zhǔn),需同時(shí)滿足:①中醫(yī)藥領(lǐng)域的數(shù)據(jù)研究;②對(duì)數(shù)據(jù)庫進(jìn)行挖掘;③采用計(jì)算等方法對(duì)獲得的數(shù)據(jù)進(jìn)行分析;④有明確的研究結(jié)果
文獻(xiàn)排除標(biāo)準(zhǔn),滿足以下任一標(biāo)準(zhǔn)即被排除:①挖掘?qū)ο鬄楣糯?jīng)典著作;②臨床實(shí)驗(yàn)對(duì)照性研究;③數(shù)據(jù)來源不明;④單一中藥化學(xué)成分的研究;⑤理論探討研究;⑥涉及西醫(yī)細(xì)胞、分子等機(jī)理研究。⑦重復(fù)發(fā)表或數(shù)據(jù)庫間重復(fù)的文獻(xiàn);⑧無法獲得全文者。
數(shù)據(jù)管理措施:①由2 名研究者獨(dú)立搜索并追溯相關(guān)參考文獻(xiàn),獲取信息后依據(jù)統(tǒng)一的納入和排除標(biāo)準(zhǔn)進(jìn)行篩選,選出相關(guān)文獻(xiàn);若2名研究者的結(jié)果不一致,交由第三方(侯政昆)評(píng)價(jià),取得一致意見后交由下一步研究;②在獲取納入文獻(xiàn)后,由2名研究者獨(dú)立提取文獻(xiàn)資料,制作表格,交由第三方評(píng)價(jià),對(duì)表格不同的地方進(jìn)行重新追蹤文獻(xiàn),避免及減少偏倚。
(1)一般結(jié)果依據(jù)預(yù)制檢索式,共獲得2,086 條記錄,其中受國(guó)家自然科學(xué)基金支持的文獻(xiàn)有285 篇。依據(jù)統(tǒng)一的納入和排除標(biāo)準(zhǔn),最終確定135 篇文獻(xiàn)納入分析。2014 年以前僅有文獻(xiàn)10 篇,2015 年至2016年有文獻(xiàn)37 篇。2017 年至2018 年12 月3 日有文獻(xiàn)88篇。
(2)西醫(yī)病種類研究77 種,具體設(shè)計(jì)病種情況見圖1。中醫(yī)病種及證型研究14 種,中藥類研究14 種,經(jīng)絡(luò)穴位針刺類研究8 種,分別為針刺、埋線、穴位注射、推拿、頭皮針、耳穴、灸法、敷貼。
圖1 77種西醫(yī)病種具體情況雷達(dá)圖
(3)疾病方藥的數(shù)據(jù)研究有文獻(xiàn)64 篇,對(duì)疾病病理、機(jī)制、辯證及臨床應(yīng)用特點(diǎn)等理論研究有文獻(xiàn)12篇,對(duì)中藥在方劑中的應(yīng)用和配伍特點(diǎn)的數(shù)據(jù)研有15篇文獻(xiàn),中藥藥物不良反應(yīng)的數(shù)據(jù)研究有2 篇,針刺、推拿、敷貼等選穴數(shù)據(jù)研究有38 篇文獻(xiàn),針刺手法數(shù)據(jù)研究有4篇文獻(xiàn)。
(4)以文獻(xiàn)檢索的形式進(jìn)行數(shù)據(jù)據(jù)挖掘的文獻(xiàn)有84 篇,對(duì)圖書資源進(jìn)行數(shù)據(jù)挖掘的文獻(xiàn)有12 篇,通過上?!按竽c癌臨床多中心大樣本病歷數(shù)據(jù)庫”進(jìn)行數(shù)據(jù)挖掘的文獻(xiàn)有1 篇,通過臨床病例收集進(jìn)行數(shù)據(jù)挖掘的文獻(xiàn)有42 篇。其中對(duì)名中醫(yī)的用藥經(jīng)驗(yàn)研究的文獻(xiàn)有41 篇,其中39 篇選擇臨床病例收集進(jìn)行數(shù)據(jù)挖掘,2篇選用名老中醫(yī)書籍進(jìn)行數(shù)據(jù)挖掘。3篇文獻(xiàn)對(duì)地方藥物及用藥經(jīng)驗(yàn)進(jìn)行挖掘分析。
(5)納入的文獻(xiàn)總共采用了10 種分析方法,分別是網(wǎng)狀Meta、頻次、描敘性分析、關(guān)聯(lián)法則、聚類分析、因子分析及主成分分析、互信息法、貝葉斯網(wǎng)絡(luò)、神經(jīng)網(wǎng)絡(luò)、決策樹。應(yīng)用SPSS 20.0 統(tǒng)計(jì)軟件進(jìn)行頻數(shù)統(tǒng)計(jì)(表1)。
表1 分析方法頻數(shù)統(tǒng)計(jì)
本文數(shù)據(jù)只基于中國(guó)知網(wǎng)數(shù)據(jù)庫的精確檢索,文獻(xiàn)選取有國(guó)家自然基金支持的研究,不能夠概括所有整體情況,但仍能反應(yīng)數(shù)據(jù)分析技術(shù)在中醫(yī)藥研究中的應(yīng)用現(xiàn)狀;①在文獻(xiàn)數(shù)量上,2017 年至2018 年關(guān)于數(shù)據(jù)挖掘發(fā)表的文獻(xiàn)比之前數(shù)年發(fā)表文獻(xiàn)的總和多了近兩倍,研究數(shù)據(jù)呈增長(zhǎng)趨勢(shì),說明數(shù)據(jù)的價(jià)值被認(rèn)可,數(shù)據(jù)挖掘和計(jì)算分析作為新的技術(shù),正在中醫(yī)藥學(xué)科迅猛的發(fā)展和推廣應(yīng)用;②研究范圍廣泛,從“西醫(yī)-方藥”“中醫(yī)-方藥”“中藥-中藥”“疾病-選穴”,“疾病-病機(jī)”等多緯度、多空間、多方面對(duì)中醫(yī)藥進(jìn)行研究,并均有一定的研究發(fā)現(xiàn);③研究選用的資料來源呈現(xiàn)多樣性,包括臨床病例收集、文獻(xiàn)檢索、出版書籍等;④對(duì)地方性的傳統(tǒng)中醫(yī)藥進(jìn)行了數(shù)據(jù)挖掘,促進(jìn)了對(duì)名醫(yī)經(jīng)驗(yàn)方的研究,及流派、地方性中藥研究的發(fā)展,促進(jìn)了地域性中醫(yī)藥資源的保護(hù)和發(fā)掘;⑤分析技術(shù)和方法呈多樣性。
通過文獻(xiàn)檢索結(jié)果可知數(shù)據(jù)分析在中醫(yī)藥中的應(yīng)用具有多樣性、廣泛性和有效性等特點(diǎn),對(duì)中醫(yī)藥的研究有明顯的推動(dòng)作用,但在存在諸多不足:①中藥質(zhì)量受產(chǎn)地、緯度、氣候和收割季節(jié)等多種因素影響,臨床研究中藥質(zhì)量難以監(jiān)控,對(duì)臨床試驗(yàn)結(jié)果和可重復(fù)性研究造成影響;②進(jìn)行計(jì)算和數(shù)據(jù)分析時(shí)多只集中在分類、聚類算法、關(guān)聯(lián)規(guī)則等傳統(tǒng)方法,并未涉及到現(xiàn)今比流行的推薦算法,以及熱門的深度分析,存在技術(shù)的延后問題;③病例收集的數(shù)據(jù)挖掘僅對(duì)用藥進(jìn)行分析,未進(jìn)行患者用藥后療效結(jié)果反饋,其研究結(jié)果存在偏倚。
新技術(shù)的發(fā)展彌補(bǔ)在中醫(yī)藥臨床數(shù)據(jù)研究中的不足,促使中醫(yī)藥大數(shù)據(jù)的應(yīng)用和發(fā)展。理論知識(shí)、分析技術(shù)、應(yīng)用技術(shù)的發(fā)展為中醫(yī)藥的研究創(chuàng)新和發(fā)展提供了更多機(jī)遇,中藥上市讓中醫(yī)臨床研究中的用藥變得標(biāo)準(zhǔn)化、量化、可監(jiān)測(cè)等保障,中醫(yī)量表的臨床應(yīng)該讓臨床診斷、療效、預(yù)測(cè)更為直觀和科學(xué),真實(shí)世界理論依據(jù)為中醫(yī)藥大數(shù)據(jù)應(yīng)用和數(shù)據(jù)信息處理提供了理論支持。
隨著我國(guó)制藥技術(shù)的規(guī)范化、標(biāo)準(zhǔn)化、可監(jiān)測(cè)等多種技術(shù)的發(fā)展,使中藥便捷性、安全性及療效得到保障,促進(jìn)了中醫(yī)藥的推廣和普及。中藥上市使得中藥生產(chǎn)進(jìn)行了更多的嚴(yán)格把控和規(guī)范化管理,讓中藥變得安全、有效、高質(zhì)量的同時(shí),更為中醫(yī)藥臨床研究提供了更多的便捷和支持。目前中藥上市對(duì)中藥的監(jiān)控、療效、結(jié)果反饋都在實(shí)驗(yàn)階段,但隨著信息化、標(biāo)準(zhǔn)化的發(fā)展,中藥的數(shù)據(jù)監(jiān)控及臨床治療信息將是客觀的數(shù)據(jù)資料。這不僅保證了中藥的品質(zhì),更方便了學(xué)者對(duì)中藥的研究,何偉[12]對(duì)藥品上市后的臨床試驗(yàn)設(shè)計(jì)流程進(jìn)行要點(diǎn)闡述,從設(shè)計(jì)方法,療效評(píng)價(jià)方法(如使用中醫(yī)證候量表的設(shè)計(jì))等多個(gè)方面進(jìn)行探討。趙穎[13]等對(duì)中藥上市后臨床有效性再評(píng)價(jià)技術(shù)進(jìn)行規(guī)范化、標(biāo)準(zhǔn)化操作解析。王永炎[14]等基于中藥上市后規(guī)范化操作及臨床評(píng)價(jià)反饋后的信息整合及大數(shù)據(jù)統(tǒng)計(jì)進(jìn)行了探索。
量表是指“一種收集數(shù)據(jù)的途徑并加上所有支持說明其如何使用的信息和資料,它預(yù)先清晰描述管理或回答的方法及相關(guān)說明,并包含數(shù)據(jù)收集的標(biāo)準(zhǔn)格式,良好的計(jì)分和分析方法,并說明在目標(biāo)人群中結(jié)果如何解釋”[15]。臨床療效是中醫(yī)藥生存發(fā)展數(shù)千年的基石和保障,中醫(yī)臨床結(jié)局評(píng)價(jià)將中醫(yī)藥臨床療效由模糊不清的抽象認(rèn)知進(jìn)行量化、具體化、客觀化,實(shí)現(xiàn)中醫(yī)藥的治療療效證據(jù)更加具體。中醫(yī)在臨床診斷時(shí)有獨(dú)特的證候,臨床治療以緩解患者癥狀為治療目的,單純的以西醫(yī)的微觀指標(biāo)、實(shí)驗(yàn)室檢查去評(píng)價(jià)中醫(yī)療效,忽視中醫(yī)辨證施治的特點(diǎn)證候的療效評(píng)價(jià)是不合理的。結(jié)合中醫(yī)特點(diǎn),應(yīng)用量表測(cè)評(píng)工具對(duì)中醫(yī)藥人群特征、疾病診斷及療效進(jìn)行測(cè)量,可直觀的、標(biāo)準(zhǔn)化的發(fā)現(xiàn)中醫(yī)臨床證候、診斷、質(zhì)量、療效評(píng)價(jià)特點(diǎn)[16]。開發(fā)適用于中醫(yī)證候的中醫(yī)臨床診斷量表、療效測(cè)評(píng)量表、患者結(jié)局報(bào)告量表等,并試圖對(duì)中醫(yī)、中藥等中醫(yī)治療手段進(jìn)行量化、數(shù)字化處理,使中醫(yī)臨床診斷、療效結(jié)果趨向于標(biāo)準(zhǔn)化、可測(cè)化和客觀化[17]?,F(xiàn)階段中醫(yī)藥臨床測(cè)評(píng)表發(fā)展迅速,僅脾胃病就有劉鳳斌教授團(tuán)隊(duì)制作的《胃痞報(bào)告結(jié)局量表》、《脾胃病癥狀量化標(biāo)準(zhǔn)》、《中華健康狀況量表》等多種測(cè)評(píng)量表,并投入臨床使用和繼續(xù)研究?jī)?yōu)化。
真實(shí)世界證據(jù)起源于實(shí)用性隨機(jī)對(duì)照試驗(yàn),于1966年被提出,1993年由Kaplan教授在其論文雷米普利治療高血壓病的前瞻性研究中正式提出后逐漸受到重視[18],是指在常規(guī)條件下,不需要采取限定理想環(huán)境,不抹殺個(gè)體差異,不排除特殊人群,由日常臨床診斷實(shí)踐所產(chǎn)生的信息數(shù)據(jù),運(yùn)用流行病學(xué)的研究方法,在真實(shí)無偏倚或偏倚較少的人群中,對(duì)某種或某些干預(yù)措施的實(shí)際應(yīng)用情況進(jìn)行研究。Sherman 博士[19]認(rèn)為,真正世界數(shù)據(jù)是指醫(yī)療衛(wèi)生系統(tǒng)數(shù)據(jù)中,除了傳統(tǒng)的臨床研究數(shù)據(jù)以外的所有數(shù)據(jù),包括來自醫(yī)院電子病歷系統(tǒng)的數(shù)據(jù)、醫(yī)療費(fèi)用報(bào)銷數(shù)據(jù),藥品或疾病的登記研究數(shù)據(jù),或者個(gè)體醫(yī)療設(shè)備數(shù)據(jù)以及健康管理軟件數(shù)據(jù)等。相對(duì)于隨機(jī)對(duì)照試驗(yàn)多種局限性,真實(shí)世界研究不僅反映真實(shí)診斷環(huán)境和實(shí)際診療過程的研究設(shè)計(jì),還可在不影響患者治療的情況下進(jìn)行研究[20],其數(shù)據(jù)包括以特定目的開展的觀察性研究數(shù)據(jù)、基于真實(shí)醫(yī)療條件開展的干預(yù)性研究數(shù)據(jù)、非研究性數(shù)據(jù)(醫(yī)療領(lǐng)域的數(shù)據(jù)、醫(yī)保數(shù)據(jù)、公共衛(wèi)生調(diào)查數(shù)據(jù)等),囊括了患者社會(huì)生活條件、患者身體健康情況及心理情況,可全方位掌握病人信息,減少微小因素對(duì)試驗(yàn)造成偏差的影響。真實(shí)世界研究是包含了醫(yī)院內(nèi)關(guān)于所有患者信息的數(shù)據(jù)研究,和大數(shù)據(jù)的基本思想相同,它注重微小數(shù)據(jù)對(duì)主體的影響,為大數(shù)據(jù)在中醫(yī)藥臨床的使用提供了重要理論和方法的支持。
大數(shù)據(jù)給中醫(yī)藥臨床研究帶了研究思維的轉(zhuǎn)變,其數(shù)據(jù)全面龐大、多維復(fù)雜,可進(jìn)行相關(guān)關(guān)系與因果關(guān)系的多種方式的研究,給中醫(yī)藥的研究帶來了創(chuàng)新和挑戰(zhàn)。在大數(shù)據(jù)時(shí)代,醫(yī)療數(shù)據(jù)是不枯竭的寶庫,像互聯(lián)網(wǎng)數(shù)據(jù)一樣可大量涌現(xiàn)數(shù)據(jù),可對(duì)患者的健康進(jìn)行監(jiān)控,疾病的信號(hào)早發(fā)現(xiàn),對(duì)疾病進(jìn)行走向進(jìn)行預(yù)測(cè)。
大數(shù)據(jù)應(yīng)用于中醫(yī)藥臨床是科技發(fā)展的必然結(jié)果,但推動(dòng)大數(shù)據(jù)進(jìn)入中醫(yī)藥臨床依然面臨較多的問題:①最真實(shí)的數(shù)據(jù)產(chǎn)生最準(zhǔn)確的結(jié)果,大數(shù)據(jù)強(qiáng)調(diào)數(shù)據(jù)的質(zhì)量,保證數(shù)據(jù)的真實(shí)性,確保數(shù)據(jù)有可靠的科學(xué)證據(jù)、同臨床相關(guān)、產(chǎn)生過程可靠,然臨床上難以完全確保數(shù)據(jù)真實(shí);②標(biāo)準(zhǔn)化的操作確保數(shù)據(jù)真實(shí)、完整和易于分析,數(shù)據(jù)標(biāo)準(zhǔn)化需要在數(shù)據(jù)錄入時(shí)有具體的數(shù)據(jù)元定義,其中數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)格式清晰,數(shù)據(jù)元的收集記錄過程完整和收集時(shí)效明確,然中醫(yī)藥臨床數(shù)據(jù)復(fù)雜,對(duì)疾病的癥狀、程度、診斷依據(jù)具有抽象判斷性質(zhì),且用詞復(fù)雜多樣,增加了標(biāo)準(zhǔn)化難度;③患者納入標(biāo)準(zhǔn)和排除標(biāo)準(zhǔn)需嚴(yán)格和完整,最大程度接近真實(shí)世界和減小偏倚,然中醫(yī)診斷量表推出但未大面積使用,仍難以控制偏倚;④在臨床藥物試驗(yàn)中需要對(duì)試驗(yàn)的數(shù)據(jù)嚴(yán)格監(jiān)控,大數(shù)據(jù)大樣本量下的中藥的質(zhì)量、藥效難以把控,中藥上市后標(biāo)準(zhǔn)化、可追溯的中藥將會(huì)改善這一狀況。
數(shù)據(jù)已經(jīng)成為了資源資產(chǎn),數(shù)據(jù)的處理、加工、管理、分析和產(chǎn)出有著巨大的潛力和機(jī)遇。中藥上市保證了藥品的安全性和有效性,中醫(yī)藥臨床量表讓中醫(yī)實(shí)現(xiàn)循證臨床評(píng)價(jià),RWE理論為大數(shù)據(jù)在中醫(yī)藥臨床應(yīng)用提供了理論依據(jù),保證了大數(shù)據(jù)在中醫(yī)藥臨床應(yīng)用的科學(xué)性和可靠性。而大量數(shù)據(jù)的生成、分析和研究促進(jìn)了中藥上市后藥效監(jiān)測(cè)和評(píng)價(jià),促進(jìn)中醫(yī)診斷、治療、療效評(píng)價(jià)等中醫(yī)量表的研制和應(yīng)用,同時(shí)也可促進(jìn)真實(shí)世界理論知識(shí)和醫(yī)療器械的研發(fā),形成良好的臨床研究反饋和循環(huán)。中醫(yī)藥自古以來都有賴于經(jīng)驗(yàn)總結(jié),大數(shù)據(jù)對(duì)微小數(shù)據(jù)的處理能力、高速計(jì)算能力、特殊的信息處理方式切合了中醫(yī)藥臨床對(duì)數(shù)據(jù)處理的要求,具有中醫(yī)藥特色中醫(yī)藥臨床大數(shù)據(jù)應(yīng)用、分析計(jì)算和解析,是中醫(yī)藥人工智能化和現(xiàn)代化的必經(jīng)之路,它可推動(dòng)中醫(yī)藥經(jīng)驗(yàn)的傳承、助力中藥新藥研發(fā)、規(guī)范中醫(yī)藥臨床診斷治療,為中醫(yī)藥臨床診療技術(shù)發(fā)展、中醫(yī)理論的創(chuàng)新提供了更多的機(jī)遇。