趙 丹,吳宏宇,韓一平*,黃青山,李 強
(1.第二軍醫(yī)大學(xué)長海醫(yī)院呼吸內(nèi)科,上海 200433;2.復(fù)旦大學(xué)生命科學(xué)院,上海 200433)
肺癌是最常見的腫瘤性疾病,死亡率占各種惡性腫瘤之首[1],相關(guān)數(shù)據(jù)資源十分豐富。為了科學(xué)整理和收集臨床病例資料,便于臨床研究和及時總結(jié)臨床醫(yī)療工作中的經(jīng)驗,建立肺癌病例數(shù)據(jù)庫系統(tǒng)顯得非常重要。當(dāng)前國內(nèi)已有多家醫(yī)院建立肺癌病例數(shù)據(jù)庫,如北京腫瘤醫(yī)院采用SQL Servers建立底層關(guān)系型數(shù)據(jù)庫,同時采用Visual C++6.0開發(fā)Windows窗口應(yīng)用程序。這使得底層數(shù)據(jù)透明化,可以自如地操縱數(shù)據(jù)庫[2]。中國中醫(yī)科學(xué)院西苑醫(yī)院設(shè)計晚期非小細(xì)胞肺癌臨床病例分析數(shù)據(jù)庫系統(tǒng)[3]。河北醫(yī)科大學(xué)第四醫(yī)院選用C#2008進(jìn)行程序設(shè)計,后臺數(shù)據(jù)庫應(yīng)用Access 2007設(shè)計和開發(fā)非小細(xì)胞肺癌患者數(shù)據(jù)庫,利用該系統(tǒng)可以方便地進(jìn)行信息錄入,為統(tǒng)計分析提供完整準(zhǔn)確的原始數(shù)據(jù)記錄[4]。這些數(shù)據(jù)庫系統(tǒng)大多使用的是Windows平臺下數(shù)據(jù)庫軟件如SQL Server,Access,采用 C/S(客戶機/服務(wù)器)模式開發(fā)。限制在Windows平臺下使用的商業(yè)軟件,存在平臺依賴性。而且C/S模式開發(fā)的軟件要求每個使用者都必須安裝本地客戶端程序,進(jìn)行本地運行環(huán)境配置,增加了操作人員的工作量與復(fù)雜度,軟件的維護(hù)與更新繁瑣。最終此類數(shù)據(jù)庫一般只能在小范圍類使用,無法進(jìn)行互聯(lián)網(wǎng)共享操作。建立在線肺癌病例數(shù)據(jù)庫系統(tǒng)可擴(kuò)展其使用價值。
1.1 軟件平臺選擇 為了建立在線數(shù)據(jù)庫,必須采用B/S(瀏覽器/服務(wù)器)模式開發(fā)。綜合考慮軟件開發(fā)技術(shù)、經(jīng)費與軟件平臺的可擴(kuò)展性等因素后,最終選擇WAMP(Windows+PHP+Apache+MySQL)平臺作為數(shù)據(jù)庫系統(tǒng)開發(fā)與運行平臺。以配置有PHP(V5.2.13)和MySQL 數(shù)據(jù)庫(V5.1.40)的 Apache 服務(wù)器(V2.2.14)為后臺,前端使用PHP、HTML、JQuery和CSS技術(shù)實現(xiàn)。該系統(tǒng)占用系統(tǒng)資源少,效率高,訪問權(quán)限安全靈活,可擴(kuò)展性強。建成的在線肺癌病例數(shù)據(jù)庫,可以實現(xiàn)任何人對病例數(shù)據(jù)庫的查詢,授權(quán)用戶對病理數(shù)據(jù)的分析,匯總與數(shù)據(jù)管理。
肺癌病例數(shù)據(jù)庫系統(tǒng)是建立在PHP+Apache+MySQL核心軟件基礎(chǔ)上的,PHP是服務(wù)器端的HTML內(nèi)嵌式計算機腳本語言,Apache是Web服務(wù)器,Mysql是以SQL語言為基礎(chǔ)的數(shù)據(jù)庫。三者均為開放源代碼,免費且能在Linux和Windows等各種操作系統(tǒng)下跨平臺開發(fā)和運行的計算機軟件,這使得適合用作研究用途[5,6]。共同構(gòu)成典型的 B/W/D(瀏覽器/Web服務(wù)器/數(shù)據(jù)庫服務(wù)器)三層體系結(jié)構(gòu)模式。客戶端通過瀏覽器提交信息給Web服務(wù)器,Web服務(wù)器再通過PHP腳本語言與MySQL數(shù)據(jù)庫進(jìn)行數(shù)據(jù)交換,由標(biāo)準(zhǔn)SQL語言對數(shù)據(jù)庫進(jìn)行數(shù)據(jù)操作,最后將處理完畢的數(shù)據(jù)通過PHP腳本語言返回給客戶端,形成動態(tài)交互式 Web數(shù)據(jù)庫管理系統(tǒng)[7](圖1)。
圖1 系統(tǒng)流程
1.2 需求分析與數(shù)據(jù)庫設(shè)計 對本院肺癌病例數(shù)據(jù)資源進(jìn)行開發(fā),依據(jù)疾病診斷流程與系統(tǒng)使用者的功能訴求進(jìn)行迭代的需求分析,將其轉(zhuǎn)為系統(tǒng)需求,最終確立系統(tǒng)信息表。主要包括患者基本信息、入院診斷信息、檢驗信息、影像學(xué)信息、病理診斷信息、臨床治療信息、腫瘤組織及血液樣本信息、臨床評估信息、毒副反應(yīng)、隨訪資料信息等,對表中的具體信息進(jìn)行概括、定義,相關(guān)信息間建立關(guān)聯(lián),有多個數(shù)值的信息按時間順序加以區(qū)別。
肺癌病例數(shù)據(jù)庫的功能模式主要由一般臨床資源表、臨床評估資源表、血清數(shù)據(jù)模板和組織功能模板共同組成。一般臨床資源表包括肺癌患者的基線資料和診斷資料,如年齡、性別、體重指數(shù)、吸煙史、職業(yè)史、家族史、臨床特征,病理資料、影像學(xué)資料、實驗室檢驗資料、分子遺傳指標(biāo)、肺癌TNM分期;臨床評估資源表包括治療方案、隨訪資料、療效預(yù)后監(jiān)測如近期療效、遠(yuǎn)期療效、毒副反應(yīng)等;血清數(shù)據(jù)模板和組織功能模板,包括已收集編號存儲于指定空間,并低溫保存的組織標(biāo)本、血清標(biāo)本。
在這些種類繁多、數(shù)據(jù)形式復(fù)雜、技術(shù)性強、圖文并茂、隨時間動態(tài)變化的肺癌病例數(shù)據(jù)面前,通過上述的功能模式進(jìn)行進(jìn)一步的查詢、分析,對散在的肺癌病例數(shù)據(jù)分類、關(guān)聯(lián)、聚類、預(yù)測、評估,從而把數(shù)據(jù)的不確定性轉(zhuǎn)化為精準(zhǔn)的肺癌研究結(jié)論,實現(xiàn)肺癌病例的數(shù)據(jù)挖掘。
1.3 系統(tǒng)功能模塊設(shè)計與實現(xiàn) 建立一個在線肺癌病例數(shù)據(jù)庫用于輔助肺癌臨床研究,對不同類型的系統(tǒng)使用者有不同的功能需求。一般醫(yī)務(wù)人員最主要的功能需求是信息查詢,以及初步信息分析,高層次的醫(yī)務(wù)研究人員則在此基礎(chǔ)上的數(shù)據(jù)分析功能以及數(shù)據(jù)導(dǎo)出功能,而系統(tǒng)管理人員則需要對數(shù)據(jù)進(jìn)行錄入,修改和刪除功能。為此將系統(tǒng)劃分為查詢,分析,數(shù)據(jù)管理和系統(tǒng)維護(hù)四個模塊。為每個模塊設(shè)置不同的訪問權(quán)限。數(shù)據(jù)管理模塊是整個肺癌病例數(shù)據(jù)系統(tǒng)的核心,包括基本信息管理、檢驗診斷信息管理、病理診斷信息管理、影像診斷信息管理、臨床治療信息管理、腫瘤樣本信息管理、臨床評估信息管理。
1.3.1 基本信息管理 主要是住院號、年齡、性別、身高、體重、體表面積,其中還包含住院信息如吸煙史、診斷、癥狀、體征、家族史等,并采用最新的UICC 2009第7版肺癌國際分期標(biāo)準(zhǔn)為依據(jù)進(jìn)行肺癌診斷的TNM分期。
1.3.2 檢驗診斷信息管理 包含血液檢測,血液及體液的腫瘤標(biāo)志物檢測等,如有新增或刪除的檢測的項目,數(shù)據(jù)庫也可進(jìn)行有效管理。另外,兼有血液標(biāo)本庫的信息等。
1.3.3 病理診斷信息管理 包含有組織病理、細(xì)胞病理、免疫組化、靶標(biāo)檢測的相關(guān)信息,并詳細(xì)定義病理類型、淋巴結(jié)轉(zhuǎn)移、胸膜及周圍組織侵犯等,尤其免疫組化的檢測項目非常多,新增的病理分子隨著醫(yī)療技術(shù)的進(jìn)步逐漸運用于臨床,數(shù)據(jù)庫的管理解決這一問題。
1.3.4 影像診斷信息管理 包含胸部CT、頭顱MRI、骨ECT、全身PET、超聲及內(nèi)窺鏡檢查信息等,尤其對于胸部CT的影像變化,在存儲影像圖片的同時亦結(jié)合本院的PACS系統(tǒng)進(jìn)行專業(yè)的文字描述,如腫塊部位、密度、大小等變化。
1.3.5 臨床治療信息管理 包含有手術(shù)治療方案、化療方案、放療、介入治療、生物靶向治療等,可以按不同的治療方案實現(xiàn)肺癌病例個體化、綜合治療的管理。
1.3.6 腫瘤樣本信息管理 即肺癌組織標(biāo)本庫的相關(guān)信息,按癌組織、癌旁組織分別留存有新鮮組織標(biāo)本為今后的實驗研究提供標(biāo)本信息。
1.3.7 臨床評估信息管理 包括療RECIST 1.1作為肺癌的療效評價標(biāo)準(zhǔn)進(jìn)行近期療效的評估,WHO抗癌藥物常見毒副反應(yīng)分級標(biāo)準(zhǔn)評定不同治療方案的毒副反應(yīng)、癌癥患者生活質(zhì)量測定量表EORTC QLQ -C30來測定肺癌生存者的生命質(zhì)量、評價肺癌的治療標(biāo)準(zhǔn),治療結(jié)束后的隨訪資料按時間順序管理隨訪數(shù)據(jù)。
2.1 建成肺癌病例數(shù)據(jù)庫管理系統(tǒng) 建成后的肺癌病例數(shù)據(jù)庫管理系統(tǒng)簡潔流暢、易于操作、管理,人機界面友好、存儲數(shù)據(jù)豐富。肺癌病例數(shù)據(jù)庫主要包含數(shù)據(jù)查詢,數(shù)據(jù)分析,數(shù)據(jù)管理和系統(tǒng)維護(hù)四大模塊,除此之外還有首頁與系統(tǒng)幫助頁面,主要用于展示系統(tǒng)信息與輔助用戶使用系統(tǒng)。肺癌病例數(shù)據(jù)庫總體反應(yīng)了肺癌病例在發(fā)病、診斷、療效等全方位的功能作用,數(shù)據(jù)形式表現(xiàn)多樣、隨時間動態(tài)變化的各項肺癌信息以動態(tài)的網(wǎng)頁頁面形式呈現(xiàn)在訪問者的面前,從基本信息管理、檢驗診斷信息管理、病理診斷信息管理、影像診斷信息管理、臨床治療信息管理、腫瘤樣本信息管理、臨床評估信息管理七個方面,綜合歸納肺癌病例數(shù)據(jù)信息。注重統(tǒng)計不同暴露條件下疾病緩解率、疾病控制率、及抗癌藥物的毒副反應(yīng)的差異。在該數(shù)據(jù)庫長期運行下,也能跟進(jìn)中位生存時間、總生存期方面的測評。
2.2 肺癌病例數(shù)據(jù)庫系統(tǒng)的擴(kuò)展功能 通過PHP+Apache+MySQL核心軟件設(shè)計建立的肺癌病例數(shù)據(jù)庫系統(tǒng)能實現(xiàn)數(shù)據(jù)的導(dǎo)入和導(dǎo)出功能。包含有血清及組織標(biāo)本庫的綜合性強的肺癌病例數(shù)據(jù)庫系統(tǒng)。建成后的數(shù)據(jù)庫在有良好的網(wǎng)絡(luò)安全及訪問權(quán)限的設(shè)置前提下,通過Web技術(shù)發(fā)布于網(wǎng)絡(luò),實現(xiàn)資源共享。
3.1 新技術(shù)的運用和肺癌數(shù)據(jù)庫發(fā)展方向 信息技術(shù)的飛速發(fā)展使得海量的信息數(shù)據(jù)能安全存儲、便于檢索,通過對數(shù)據(jù)的統(tǒng)計分析有助于挖掘有利的信息資源。如著名的SEER數(shù)據(jù)庫經(jīng)常發(fā)布權(quán)威數(shù)據(jù)供醫(yī)務(wù)人員及科研工作提供指導(dǎo)[8,9],目前我國也建成了不少腫瘤數(shù)據(jù)庫[10,11,12],但對于肺癌單病種數(shù)據(jù)庫的建設(shè)還顯不足。將新一代的數(shù)據(jù)庫技術(shù)運用于肺癌病例數(shù)據(jù)資源中,設(shè)計發(fā)布的肺癌病例數(shù)據(jù)庫能安全地組織、存儲肺癌病例數(shù)據(jù),使得肺癌病例數(shù)據(jù)資料的研究處理更高效、準(zhǔn)確、安全。在嚴(yán)密保護(hù)肺癌患者隱私情況下還可進(jìn)一步通過網(wǎng)絡(luò)技術(shù)實現(xiàn)數(shù)據(jù)共享,從而合理開發(fā)利用寶貴有限的數(shù)據(jù)資源。
3.2 數(shù)據(jù)信息及時更新合理應(yīng)用 隨著肺癌臨床科研的進(jìn)展,建成的肺癌病例數(shù)據(jù)庫可以在計算機專業(yè)人員的幫助下簡便地增減數(shù)據(jù)表中的項目。不僅僅局限于橫向的肺癌發(fā)病、診斷、治療等信息的比較,隨時間動態(tài)變化的數(shù)據(jù)也記錄在數(shù)據(jù)庫中,這樣使得醫(yī)院的HIS病歷系統(tǒng)中的信息資源更具有活力。此外,還兼有血液標(biāo)本庫及組織標(biāo)本庫的功能,在基礎(chǔ)實驗研究的同時與臨床資料緊密結(jié)合,得出的研究結(jié)果意義更大、指導(dǎo)性更強。
3.3 網(wǎng)絡(luò)安全 目前我國腫瘤數(shù)據(jù)庫的建設(shè)尚在起步階段、未能聯(lián)網(wǎng),盡管本肺癌病例數(shù)據(jù)庫可以實現(xiàn)網(wǎng)絡(luò)化,但由于網(wǎng)絡(luò)安全及醫(yī)療信息保密性的問題,目前暫時未能將此項功能展開。隨著系統(tǒng)的不斷完善與資源條件的許可,將盡快將建成的肺癌病例數(shù)據(jù)庫發(fā)布到Internet上,實現(xiàn)資源共享。同時隨著研究深入、肺癌病例數(shù)據(jù)庫影響面的擴(kuò)大,將會完善其他的各項功能。
[1] Jemal A,Siegel R,Xu J,ect.Cancer Statistics[J].CA Cancer J Clin,2010,60(5):277 -300.
[2] 侯鳳貞,尤渺寧,李紀(jì)虎.肺癌病例資料數(shù)據(jù)庫系統(tǒng)的建立[J].現(xiàn)代醫(yī)院,2008,8(2):141 -142.
[3] 劉 赟,楊宇飛.綜合治療晚期非小細(xì)胞肺癌數(shù)據(jù)庫臨床病例分析[J].醫(yī)學(xué)研究雜志,2009,38(5):107-111.
[4] 靳 毅,劉 巍.非小細(xì)胞肺癌患者數(shù)據(jù)庫的設(shè)計與建立[J].醫(yī)學(xué)信息學(xué)雜志,2010,31(5):22-24.
[5] Roy S,Saha K.Development of Media Search Engine & its Optimization[J].Journal of Information and Computing Science,2011,6(4):255 -260.
[6] Laverty J P,Wood D,Turchek J.Implementing a Dynamic Database - Driven Course Using LAMP[J].Information Systems Education Journal,2011,9(7):33 -40.
[7] Jin P Y,Peng C.The Development of Online Examination System Based on B/S Structure [J].Key Engineering Materials,2011:474 -476,265 -270.
[8] Bhaskarla A,Tang PC,et al.Analysis of second primary lung cancer in the SEERdatabase[J]JSurg Res,2010,162(1):1 - 6.
[9] Martinez SR,Chen SL,Bilchik AJ.Treatment disparities in Hispanic rectal cancer patient cancer patient:aSEER database study[J]Am Surg.2006,72(10):906 -8.
[10]陳育德.中國腫瘤防治信息系統(tǒng)的建設(shè)和開發(fā)利用的思考[J].中國腫瘤,2002,11(4):212 -214.
[11]鮑萍萍,鄭 螢,王春芳,等.上海市腫瘤病人數(shù)據(jù)庫的建立和利用[J].中國腫瘤,2005,14(8):514-516.
[12]陳嘉寶,吳兆紅.肺癌病例數(shù)據(jù)庫系統(tǒng)的研究進(jìn)展[J].國際醫(yī)藥衛(wèi)生導(dǎo)報,2011,17(18):2220 -2223.