朱立峰,劉淑君,陳德華,樂嘉錦
1.上海交通大學(xué)醫(yī)學(xué)院附屬瑞金醫(yī)院,上海 200025;
2.東華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,上海 201620
近年來,多中心臨床研究受到越來越多的關(guān)注。所謂多中心臨床研究指的是由多個(gè)研究中心的臨床醫(yī)生或科研人員按照同樣的研究設(shè)計(jì)、為同一個(gè)研究目的、協(xié)同完成的臨床研究工作[1]。其中,研究中心可以是三級(jí)甲等醫(yī)院,也可以是負(fù)責(zé)某個(gè)具體區(qū)域的社區(qū)醫(yī)院。具體而言,在多中心臨床研究中,臨床科研由一個(gè)研究中心總體負(fù)責(zé),擔(dān)當(dāng)牽頭單位的角色,然后由多個(gè)研究中心的臨床醫(yī)生共同合作,按照同一個(gè)研究方案在不同的研究中心同時(shí)進(jìn)行。這樣,多位臨床醫(yī)生可不受地點(diǎn)的限制,在不同科室、不同醫(yī)院按同一試驗(yàn)方案同時(shí)進(jìn)行臨床研究,協(xié)同完成各項(xiàng)研究工作。多中心臨床研究實(shí)現(xiàn)了多中心、多學(xué)科對(duì)同一臨床問題的廣泛協(xié)作研究,對(duì)于發(fā)揮臨床醫(yī)生的學(xué)術(shù)優(yōu)勢(shì)、促進(jìn)醫(yī)學(xué)科學(xué)的發(fā)展具有重要的意義。
經(jīng)過多年的努力,多中心臨床研究已成為國(guó)內(nèi)外各類醫(yī)療機(jī)構(gòu)開展疾病臨床研究的重要方法[2]。一方面,相對(duì)于單中心研究,多中心臨床研究要求多個(gè)研究中心同時(shí)參與,可在較短的時(shí)間內(nèi)遴選出臨床科研所需的病例數(shù);另一方面,相對(duì)于單中心研究,在多中心臨床研究中多個(gè)中心入選的病例在病種病情分布等方面范圍比較廣。以糖尿病多中心研究為例,在確診和治療前期,患者多選擇到三級(jí)甲等醫(yī)院就診,確定適合個(gè)體的治療方案。治療方案穩(wěn)定后,患者大多會(huì)選擇到社區(qū)衛(wèi)生服務(wù)中心進(jìn)行長(zhǎng)期治療和監(jiān)督控制。因此,多中心的研究可以覆蓋更多的糖尿病患者。
雖然多中心臨床研究已被眾多的醫(yī)院、科研機(jī)構(gòu)、臨床醫(yī)生廣泛采納,但是在實(shí)際應(yīng)用中,多中心臨床研究也具有許多不足之處。
(1)樣本量往往偏小(即參與臨床科研的病例數(shù)偏少)
在選取參與科研的樣本病例上,當(dāng)前的多中心臨床研究通常采取一種協(xié)商遴選的辦法,即各個(gè)研究中心的臨床醫(yī)生根據(jù)臨床科研目標(biāo)提供候選病例,再由總負(fù)責(zé)的研究中心確定目標(biāo)樣本。這種協(xié)商遴選的方法難以在較短的時(shí)間內(nèi)收集足夠多的病例[3]。當(dāng)前的多中心臨床研究的樣本數(shù)量規(guī)模大致為幾百,樣本規(guī)模偏小,病例數(shù)不多。
(2)臨床科研相對(duì)封閉、開放程度不高
在臨床科研上,多中心臨床研究需要科研團(tuán)隊(duì)之間共享科研數(shù)據(jù)和臨床研究設(shè)計(jì)。當(dāng)前的多中心臨床研究在組建科研團(tuán)隊(duì)上大多采用如下3種方式:針對(duì)某一研究問題正式指派組成團(tuán)隊(duì);有相同研究興趣的同事組成團(tuán)隊(duì);先決定團(tuán)隊(duì)的帶頭人,再由帶頭人發(fā)現(xiàn)團(tuán)隊(duì)成員。無論采取哪種方式組織團(tuán)隊(duì),臨床科研數(shù)據(jù)的搜集與共享都依賴于參與多中心臨床研究的醫(yī)院、科室、臨床醫(yī)生,這使得臨床科研相對(duì)比較封閉。
因此,本文針對(duì)當(dāng)前多中心臨床研究存在的“樣本量偏少、相對(duì)封閉”的缺點(diǎn),結(jié)合新近興起的大數(shù)據(jù)與云計(jì)算等技術(shù),將物理上分散的各醫(yī)院臨床中心融合成邏輯上統(tǒng)一的臨床大數(shù)據(jù),在此基礎(chǔ)上構(gòu)建多中心臨床大數(shù)據(jù)應(yīng)用平臺(tái),并將之運(yùn)用于多中心的臨床研究實(shí)踐中,實(shí)現(xiàn)多中心臨床研究向“全樣本、多學(xué)科、多病種、開放性”轉(zhuǎn)變,探索基于多中心臨床大數(shù)據(jù)的應(yīng)用示范。
本文首先給出多中心臨床大數(shù)據(jù)平臺(tái)的總體架構(gòu),然后詳細(xì)闡述臨床隨訪系統(tǒng)、平臺(tái)核心系統(tǒng),最后闡述臨床大數(shù)據(jù)平臺(tái)在內(nèi)分泌和高血壓等疾病上的深度應(yīng)用。
本文所提的多病種、多中心臨床大數(shù)據(jù)平臺(tái)的總體架構(gòu)如圖1所示。平臺(tái)總體框架由數(shù)據(jù)基礎(chǔ)層、臨床隨訪系統(tǒng)、平臺(tái)核心系統(tǒng)、應(yīng)用系統(tǒng)構(gòu)成。
● 數(shù)據(jù)基礎(chǔ)層是整個(gè)平臺(tái)的數(shù)據(jù)來源,多病種、多中心臨床大數(shù)據(jù)主要來源于醫(yī)院臨床數(shù)據(jù)倉庫、其他大型醫(yī)院臨床數(shù)據(jù)倉庫及社區(qū)衛(wèi)生服務(wù)中心臨床數(shù)據(jù)倉庫。
● 臨床隨訪系統(tǒng)的目的是為??漆t(yī)生進(jìn)行臨床科研隨訪提供支持,包括建立隨訪隊(duì)列、形成隨訪表單、導(dǎo)出隨訪數(shù)據(jù)、對(duì)患者隨訪進(jìn)行提醒跟蹤。
● 平臺(tái)核心系統(tǒng)是臨床大數(shù)據(jù)平臺(tái)的核心層,由3個(gè)子系統(tǒng)組成,即多中心臨床大數(shù)據(jù)整合子系統(tǒng)、多中心臨床大數(shù)據(jù)存儲(chǔ)子系統(tǒng)、多中心臨床大數(shù)據(jù)分析挖掘算法子系統(tǒng)。
● 應(yīng)用系統(tǒng)為平臺(tái)面向用戶(包括醫(yī)生和患者)提供的疾病分析應(yīng)用服務(wù),本文選擇內(nèi)分泌、高血壓、腫瘤等若干病種作為研究對(duì)象,通過對(duì)多中心臨床大數(shù)據(jù)進(jìn)行分析與挖掘,更好地為醫(yī)生和患者提供輔助診療服務(wù)。
臨床隨訪系統(tǒng)方便??漆t(yī)生篩選隨訪隊(duì)列,幫助??漆t(yī)生自助設(shè)計(jì)隨訪表單,并在完成隨訪表單填寫時(shí),高效、準(zhǔn)確地獲取患者臨床數(shù)據(jù),如就診記錄、醫(yī)囑、檢驗(yàn)檢查報(bào)告、病理報(bào)告、手術(shù)麻醉記錄、病史記錄等,并提供隨訪表單數(shù)據(jù)手工錄入功能,幫助??漆t(yī)生獲取和瀏覽患者在院內(nèi)的全部診療記錄,為科研與臨床診療結(jié)合提供流程優(yōu)化支持[4]。具體而言,臨床隨訪系統(tǒng)包括以下4項(xiàng)。
● 隨訪信息維護(hù)。通過輸入隨訪名稱、課題名稱、課題組成員、課題起始時(shí)間等信息創(chuàng)建隨訪隊(duì)列,并基于隨訪隊(duì)列維護(hù)課題組成員,可以添加賬戶或凍結(jié)賬戶,并通過結(jié)題管理維護(hù)隊(duì)列狀態(tài)。
● 隨訪表單管理,編輯管理表單模板名稱、用途、適用的隨訪隊(duì)列。每個(gè)隨訪隊(duì)列可對(duì)應(yīng)多個(gè)表單模板,主要可分為首次隨訪記錄、住院隨訪記錄、門診隨訪記錄等。
● 隨訪提示為臨床醫(yī)生提供如下功能:對(duì)于隨訪隊(duì)列中的患者,如果超過預(yù)定時(shí)間(如門診、住院一個(gè)月)無就診記錄,在隨訪隊(duì)列中的負(fù)責(zé)醫(yī)生登錄時(shí)進(jìn)行提示;如果存在就診事件(門診、急診、住院),但尚未填寫對(duì)應(yīng)的隨訪表單,在隨訪隊(duì)列中的負(fù)責(zé)醫(yī)生登錄時(shí)進(jìn)行提示。
● 隨訪信息庫提供網(wǎng)頁形式,可由院外科研人員進(jìn)入某一隨訪隊(duì)列,添加患者信息,錄入隨訪表單或者批量導(dǎo)入隨訪數(shù)據(jù)。
本節(jié)闡述的多中心臨床大數(shù)據(jù)平臺(tái)的核心系統(tǒng)包括多中心臨床大數(shù)據(jù)整合子系統(tǒng)、多中心臨床大數(shù)據(jù)存儲(chǔ)子系統(tǒng)和多中心臨床大數(shù)據(jù)分析挖掘算法子系統(tǒng)。
臨床數(shù)據(jù)整合技術(shù)旨在將現(xiàn)有的不同臨床信息系統(tǒng)產(chǎn)生的臨床數(shù)據(jù)匯總到統(tǒng)一的信息平臺(tái),實(shí)現(xiàn)患者標(biāo)識(shí)統(tǒng)一以及患者臨床信息的統(tǒng)一瀏覽發(fā)布。目前,筆者所在單位擁有醫(yī)院信息系統(tǒng)(HIS)、實(shí)驗(yàn)室信息系統(tǒng)(LIS)、放射科信息管理系統(tǒng)(RIS)、電子病歷(EMR)、病理、手麻、心電等業(yè)務(wù)系統(tǒng),數(shù)據(jù)庫管理系統(tǒng)采用了MS SQL Server和 Sybase ASE,為了將數(shù)據(jù)抽取、加載和轉(zhuǎn)換(extraction-loadingtransformation,ETL)過程對(duì)實(shí)時(shí)業(yè)務(wù)系統(tǒng)的影響降到最低,采用規(guī)范化數(shù)據(jù)存儲(chǔ)(normalized data store,NDS)+多維數(shù)據(jù)存儲(chǔ)(dimensional data store,DDS)的數(shù)據(jù)流架構(gòu),臨床數(shù)據(jù)整合流程如圖2所示。ETL是構(gòu)建數(shù)據(jù)倉庫的重要一環(huán),用戶從數(shù)據(jù)源抽取所需的數(shù)據(jù),經(jīng)過數(shù)據(jù)清洗,最終按照預(yù)先定義的數(shù)據(jù)倉庫模型,將數(shù)據(jù)加載到數(shù)據(jù)倉庫中。
其中,Stage為源系統(tǒng)數(shù)據(jù)的一個(gè)副本,從Source到Stage的ETL過程并不對(duì)數(shù)據(jù)進(jìn)行刪減、修改或整合,僅負(fù)責(zé)抽取和加載,而從Stage到NDS的ETL過程則需要按照數(shù)據(jù)倉庫建模的需求對(duì)數(shù)據(jù)進(jìn)行一定的清洗和轉(zhuǎn)換[5]。
多中心臨床大數(shù)據(jù)存儲(chǔ)子系統(tǒng)是整個(gè)平臺(tái)的存儲(chǔ)基礎(chǔ),為數(shù)據(jù)篩選、過濾、處理、分析提供原始數(shù)據(jù),要求容量大、效率高、安全性強(qiáng)。云存儲(chǔ)是通過集群應(yīng)用、網(wǎng)絡(luò)技術(shù)分布式文件系統(tǒng)等將不同種類的存儲(chǔ)設(shè)備協(xié)調(diào)工作,共同對(duì)外提供數(shù)據(jù)存儲(chǔ)和訪問功能的一個(gè)系統(tǒng),它以數(shù)據(jù)存儲(chǔ)和數(shù)據(jù)管理為核心[6]。本文采用云計(jì)算的數(shù)據(jù)管理平臺(tái)實(shí)現(xiàn)對(duì)多中心臨床大數(shù)據(jù)的多元化存儲(chǔ)與訪問,提供線性擴(kuò)展的分布式存儲(chǔ)能力。多中心臨床大數(shù)據(jù)存儲(chǔ)系統(tǒng)通過整合關(guān)系數(shù)據(jù)庫、NoSQL數(shù)據(jù)庫、文件系統(tǒng)等異構(gòu)存儲(chǔ)模式,實(shí)現(xiàn)多中心異構(gòu)臨床數(shù)據(jù)按需、按數(shù)據(jù)特性存儲(chǔ),支持大容量存儲(chǔ)空間,存儲(chǔ)效率快,可擴(kuò)展性強(qiáng),并通過統(tǒng)一的數(shù)據(jù)總線實(shí)現(xiàn)跨存儲(chǔ)設(shè)施的統(tǒng)一訪問。此外,借助并行數(shù)據(jù)處理技術(shù)對(duì)吞吐量、并發(fā)量以及可用性進(jìn)行增強(qiáng)。
圖1 多病種、多中心臨床大數(shù)據(jù)平臺(tái)總體架構(gòu)
圖2 數(shù)據(jù)整合流程
多中心臨床數(shù)據(jù)種類很多,針對(duì)不同的臨床科研需求和數(shù)據(jù)特點(diǎn),遵循HL7標(biāo)準(zhǔn)對(duì)各種來源的多中心臨床數(shù)據(jù)進(jìn)行語義轉(zhuǎn)換、結(jié)構(gòu)變換,然后調(diào)用統(tǒng)一數(shù)據(jù)訪問接口將其存儲(chǔ)到合適的底層存儲(chǔ)系統(tǒng)中。多中心臨床大數(shù)據(jù)存儲(chǔ)子系統(tǒng)考慮到異構(gòu)數(shù)據(jù)的特點(diǎn),采用了不同的底層存儲(chǔ)設(shè)施,具體包括MongoDB、MySQL、HBase、Hadoop分布式文件系統(tǒng)(HDFS)等關(guān)系數(shù)據(jù)庫、列存儲(chǔ)數(shù)據(jù)庫和分布式文件系統(tǒng)。其中,MongoDB、HBase主要用來存儲(chǔ)半結(jié)構(gòu)化數(shù)據(jù),如檢驗(yàn)/檢查報(bào)告、出院小結(jié)等;MySQL主要用來存儲(chǔ)結(jié)構(gòu)化數(shù)據(jù),如病人信息、處方等;HDFS主要用來存儲(chǔ)非結(jié)構(gòu)化的二進(jìn)制文件,如來自影像歸檔和通信系統(tǒng)(PACS)的放射檢查膠片圖像。
多中心臨床大數(shù)據(jù)分析挖掘算法子系統(tǒng)為疾病臨床數(shù)據(jù)分析挖掘系統(tǒng)提供多維分析、分類、聚類、預(yù)測(cè)、回歸分析和深度學(xué)習(xí)算法支持。在該系統(tǒng)中,共劃分為多維分析算法、數(shù)據(jù)挖掘算法、深度學(xué)習(xí)預(yù)測(cè)算法三大基礎(chǔ)模塊。
(1)多維分析算法
多維數(shù)據(jù)分析首先需要建立多維數(shù)據(jù)集,由于其具有很多維度的特性,多維數(shù)據(jù)集通常被形象地稱為數(shù)據(jù)立方體(cube)。多維數(shù)據(jù)集是一個(gè)數(shù)據(jù)集合,通常先從數(shù)據(jù)倉庫中選取若干數(shù)據(jù)子集,再組織和匯總成由多個(gè)維度和度量值定義的多維結(jié)構(gòu),多維數(shù)據(jù)分析可對(duì)以多維形式組織起來的數(shù)據(jù)立方體進(jìn)行上卷、下鉆、切片、切塊、旋轉(zhuǎn)等多種分析操作,以便剖析數(shù)據(jù),使分析者、決策者能從多個(gè)角度、多個(gè)側(cè)面觀察數(shù)據(jù)庫中的數(shù)據(jù),從而深入了解包含在數(shù)據(jù)中的信息和內(nèi)涵[7]。
(2)數(shù)據(jù)挖掘算法
數(shù)據(jù)挖掘算法模塊提供了包括分類、聚類、關(guān)聯(lián)規(guī)則、回歸分析等機(jī)器學(xué)習(xí)算法的統(tǒng)一注冊(cè)、應(yīng)用與注銷管理,用于針對(duì)特定數(shù)據(jù)集的挖掘分析,實(shí)現(xiàn)臨床的深度分析、預(yù)警與預(yù)測(cè)。
數(shù)據(jù)挖掘算法模塊中集成了隨機(jī)森林、支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)、決策樹等分類算法和K-means聚類算法、邏輯回歸、線性回歸和關(guān)聯(lián)分析等算法[8]。
(3)深度學(xué)習(xí)預(yù)測(cè)算法
深度學(xué)習(xí)預(yù)測(cè)算法模塊集成了卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)、循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)和長(zhǎng)短期記憶(long short term memory,LSTM)網(wǎng)絡(luò)[9]等算法。
在多中心臨床大數(shù)據(jù)平臺(tái)的基礎(chǔ)上,進(jìn)一步結(jié)合內(nèi)分泌學(xué)科、高血壓等學(xué)科的優(yōu)勢(shì),開展臨床大數(shù)據(jù)的深度應(yīng)用。
(1)面向甲狀腺腫瘤的臨床醫(yī)療大數(shù)據(jù)的知識(shí)挖掘系統(tǒng)
臨床中患者腫瘤的良惡性診斷結(jié)果的準(zhǔn)確性主要依賴于醫(yī)生的主觀判斷,不同醫(yī)生的臨床經(jīng)驗(yàn)和醫(yī)院醫(yī)療水平等存在差異,勢(shì)必會(huì)造成不同程度的誤診。為了提高醫(yī)生臨床診斷的準(zhǔn)確性,簡(jiǎn)化不必要的檢查過程,降低誤診率,通過大數(shù)據(jù)分析方法實(shí)現(xiàn)醫(yī)療智能化已成為研究的熱點(diǎn)。本文設(shè)計(jì)開發(fā)的系統(tǒng),通過對(duì)甲狀腺腫瘤治療過程中的臨床數(shù)據(jù)進(jìn)行挖掘分析,實(shí)現(xiàn)了對(duì)甲狀腺腫瘤良惡性診斷的準(zhǔn)確預(yù)測(cè)。
(2)糖尿病轉(zhuǎn)歸及風(fēng)險(xiǎn)評(píng)估系統(tǒng)
糖尿病作為一種常見的慢性病,有治療周期長(zhǎng)、并發(fā)癥多、病情反復(fù)等特點(diǎn)。當(dāng)前的糖尿病的診斷還是以傳統(tǒng)的診斷方式為主,每個(gè)門診患者和醫(yī)生接觸的時(shí)間有限,醫(yī)生無法在每個(gè)病人身上花費(fèi)大量時(shí)間深入探究患者的個(gè)體情況和診療背景,這導(dǎo)致醫(yī)院和醫(yī)生無法更好地在后期監(jiān)測(cè)患者狀況。在有關(guān)糖尿病預(yù)測(cè)的實(shí)驗(yàn)中,可以將樣本數(shù)據(jù)根據(jù)要求按照一定比例劃分成訓(xùn)練集、測(cè)試集和獨(dú)立樣本集,進(jìn)行糖尿病的預(yù)測(cè)和建模,對(duì)糖尿病高危人群提供有效、準(zhǔn)確的幫助[10]。本文針對(duì)患者糖尿病生化指標(biāo)預(yù)測(cè)這一問題,構(gòu)建了一個(gè)基于緩存神經(jīng)網(wǎng)絡(luò)的糖尿病生化指標(biāo)變化趨勢(shì)預(yù)測(cè)模型。該模型特點(diǎn)是在隱藏層中增加計(jì)算結(jié)果緩存區(qū)域,以應(yīng)對(duì)數(shù)據(jù)模型的不規(guī)則時(shí)序特性和內(nèi)部復(fù)雜的相互關(guān)系,從而達(dá)到輔助診療的目的。
(3)基于數(shù)據(jù)挖掘的高血壓患病趨勢(shì)分析及控制
依托臨床大數(shù)據(jù)平臺(tái),對(duì)高血壓科近15年的住院患者的約500萬條臨床數(shù)據(jù)及門診患者的約700萬條臨床數(shù)據(jù)進(jìn)行收集整理,并進(jìn)行多維度分析。找出該病種的患病趨勢(shì),并通過對(duì)降壓藥處方的分析,指導(dǎo)臨床更加有效地防治高血壓。通過臨床數(shù)據(jù)分析,識(shí)別高血壓患者靶器官(心、腦、腎、血管等)損傷,獲取高血壓患者的心血管及其他指標(biāo)參數(shù),基于這些參數(shù),進(jìn)行數(shù)據(jù)評(píng)估患者心血管風(fēng)險(xiǎn),降低心腦血管病發(fā)生率[11]。
本文針對(duì)傳統(tǒng)多中心臨床研究存在的問題,逐步推進(jìn)多中心臨床大數(shù)據(jù)平臺(tái)建設(shè)和深度應(yīng)用工作,完成了多中心臨床大數(shù)據(jù)平臺(tái)建設(shè),并對(duì)多中心臨床大數(shù)據(jù)平臺(tái)中臨床隨訪系統(tǒng)、核心系統(tǒng)和疾病分析應(yīng)用系統(tǒng)等進(jìn)行技術(shù)驗(yàn)證,建立了可行的技術(shù)框架。
[1]丁潔. 關(guān)于多中心臨床研究的思考[J]. 中華兒科雜志, 2011(11): 801-803.DING J. Thoughts on multi-center clinical research [J]. Chinese Journal of Pediatrics, 2011(11): 801-803.
[2]李娌, 魏玉萍, 錢芳橋, 等. 加強(qiáng)多中心臨床研究的組織管理水平促進(jìn)多中心臨床研究質(zhì)量提高[C]//2011第三屆全國(guó)醫(yī)學(xué)科研管理論壇暨江蘇省醫(yī)學(xué)科研管理學(xué)術(shù)年會(huì)論文集,2011年10月1日, 南京, 中國(guó). [出版地不詳: 出版者不詳], 2011: 207-210.LI L, WEI Y P, QIAN F Q, et al.strengthen the organization and management of multi-center clinical research to promote the quality of multi center clinical research to improve the [C]//2011 3rd National Medical Scientific Research Management Forum and the Jiangsu Provincial Medical Scientific Research Management Academic Annual Meeting, October 1,2011, Nanjing, China. [S.l.:s.n.], 2011:207-210.
[3]萬霞, 李贊華, 劉建平. 臨床研究中的樣本量估算:(1)臨床試驗(yàn)[J]. 中醫(yī)雜志, 2007(6):504-507.WAN X, LI Z H, LIU J P. Sample size estimation in clinical research: (1) clinical trials[J]. Journal of Chinese medicine,2007(6): 504-507.
[4]崔潔, 朱立峰, 左銘. 臨床科研隨訪系統(tǒng)需求與策略[J]. 中國(guó)數(shù)字醫(yī)學(xué), 2016(12):36-37, 71.CUI J, ZHU L F, ZUO M. Requirements and strategies for clinical research followup system[J]. Chinese Digital Medicine,2016(12): 36-37, 71.
[5]萇程. 基于ETL的數(shù)據(jù)集成過程模型[D]. 杭州: 浙江大學(xué), 2010.CHENG C. Data integration process model based on ETL[D]. Hangzhou: Zhejiang University, 2010.
[6]陳杰. 大數(shù)據(jù)場(chǎng)景下的云存儲(chǔ)技術(shù)與應(yīng)用[J].中興通訊技術(shù), 2012, 18(6): 47-51.CHEN J. Cloud storage technology and application in big data scenario[J]. ZTE Technology, 2012, 18(6): 47-51.
[7]ALPAY D. System theory, the Schur algorithm and multidimensional analysis[J]. Operator Theory Advances& Applications, 2007, 21(3): 133-150.
[8]DAN J, QIU J, XIANG G, et al. A synthesized data mining algorithm based on clustering and decision tree[C]// International Conference on Computer and Information Technology, June 29-July 1, 2010,Bradford, UK. Piscataway: IEEE Press, 2010: 2722-2728.
[9]GERS F A, SCHMIDHUBER J, CUMMINS F.Learning to forget: continual prediction with LSTM[J]. Neural Computation, 2000,12(10): 2451-2471.
[10]洪燁. 基于機(jī)器學(xué)習(xí)算法的糖尿病預(yù)測(cè)模型研究[D]. 哈爾濱: 哈爾濱工業(yè)大學(xué), 2016.HONG Y. Research on diabetes prediction model based on machine learning algorithm[D]. Harbin: Harbin Institute of Technology, 2016.
[11]蘇杰. 基于數(shù)據(jù)挖掘技術(shù)的高血壓疾病評(píng)估方法研究[D]. 杭州: 浙江大學(xué), 2006.SU J. Research on hypertension disease assessment method based on data mining technology[D]. Hangzhou: Zhejiang University, 2006.