于佳,祝麗娜,李絢璇,王冬梅青島海慈醫(yī)療集團功能檢查科,山東青島 266033
統(tǒng)計分析在甲狀腺超聲診斷數(shù)字化管理系統(tǒng)中的應(yīng)用
于佳,祝麗娜,李絢璇,王冬梅
青島海慈醫(yī)療集團功能檢查科,山東青島266033
近年來,隨著超聲數(shù)字化水平、存儲技術(shù)、計算機技術(shù)等關(guān)聯(lián)技術(shù)的發(fā)展,許多醫(yī)院開始著手構(gòu)建超聲診斷數(shù)字化管理系統(tǒng),以輔助疾病管理。甲狀腺疾病是臨床常見病,超聲是甲狀腺疾病篩查、診斷、療效評估等重要技術(shù),獲取信息十分豐富,這些數(shù)據(jù)具有較大挖掘價值,在甲狀腺疾病超聲智能診斷、流行病學(xué)分析、病因與發(fā)病機制等研究中具有較高的價值。統(tǒng)計分析在甲狀腺超聲診斷數(shù)字化管理系統(tǒng)中發(fā)揮關(guān)鍵作用,可供選擇的數(shù)據(jù)挖掘方法包括關(guān)聯(lián)規(guī)則、集對分析、粗糙集理論、聚類分析等,可供選擇的統(tǒng)計學(xué)方法包括Logistic回歸分析、因子分析與主成分分析、典型相關(guān)分析、結(jié)構(gòu)方程模型、線性混合模型、最大似然判別,目前我國醫(yī)學(xué)統(tǒng)計學(xué)仍處于較低水平,數(shù)據(jù)挖掘利用水平遠遠不足,衛(wèi)生工作者應(yīng)努力掌握更加專業(yè)的統(tǒng)計學(xué)理論、方法,提高自身統(tǒng)計應(yīng)用水平。
甲狀腺疾病;統(tǒng)計學(xué)分析;超聲診斷數(shù)字化管理系統(tǒng)
[Abstract]In recent years,with the development of ultrasound digital level,storage technology,computer technology and other correlation technology,many hospitals begin to build ultrasound diagnosis digital management system in order to assist disease management,the thyroid disease is the common disease in clinic,and the ultrasound is the important technology of screening,diagnosis and curative effect evaluation of thyroid disease,and it can obtain rich information,and the data are of biggermining value and are of higher value in intelligent diagnosis of thyroid ultrasound,analysis of epidemiology and research of pathogeny and pathogenesis,and the statistical analysis is vital to the thyroid ultrasound diagnosis digital management system,the available datamining methods include correlation rule,setpair analysis,rough set theory and cluster analysis,the available statistical methods include Logistic regression analysis,factor analysis,principal component analysis,canonical correlation analysis,structural equation model,linear mixed model and maximum likelihood discriminant.At present,the medical statistics of our country is still at a lower level,the datamining use level remains far from adequate,and the health workers should make an effort to master more specified statistical theory and method and improve their own math application level.
[Key words]Thyroid disease;Statistical analysis;Ultrasound diagnosis digital management system
甲狀腺疾病是臨床常見病,發(fā)病率高達4%,其中絕大多數(shù)都需要經(jīng)超聲診斷。近年來,甲狀腺癌、甲狀腺腫發(fā)病率逐年上升。超聲醫(yī)學(xué)是物理學(xué)、醫(yī)學(xué)與電子工程技術(shù)相結(jié)合的一門學(xué)科,在甲狀腺等疾病診斷中具有重要價值,定性診斷甲狀腺良惡性疾病符合率約為80%~90%,近年來彈性超聲、高頻超聲等技術(shù)的應(yīng)用,極大地提高超聲診斷效用,在甲狀腺疾病篩查、診斷中的價值無可替代[1]。邁入21世紀(jì),數(shù)字化、信息與計算機飛速發(fā)展,并在醫(yī)院信息管理領(lǐng)域得到廣泛的應(yīng)用。超聲診斷數(shù)字化信息十分龐大,信息管理需求加強,超聲診斷數(shù)字化管理系統(tǒng)便是在這種背景下孕育而生,在流行病學(xué)管理、超聲智能診斷等領(lǐng)域發(fā)揮關(guān)鍵作用,給臨床工作帶來巨大的便利,但遺憾的是許多醫(yī)學(xué)工作者統(tǒng)計學(xué)分析能力欠佳,導(dǎo)致發(fā)表的文獻錯用誤用統(tǒng)計學(xué)方法等許多問題[2]。數(shù)據(jù)挖掘是超聲診斷數(shù)字化管理系統(tǒng)運用的基本工作,其中大量應(yīng)用醫(yī)學(xué)統(tǒng)計分析,該研究就此進行概述,總結(jié)統(tǒng)計學(xué)分析在甲狀腺超聲診斷數(shù)字化管理系統(tǒng)中的應(yīng)用價值與方法。
超聲診斷甲狀腺疾病數(shù)字信息十分龐大,特別是近年來超聲診斷技術(shù)飛速發(fā)展,不僅二維超聲、彩色多普勒超聲等常規(guī)超聲技術(shù)不斷發(fā)展進步,彈性顯像、高頻超聲等技術(shù)也得到廣泛應(yīng)用,圖像由二維圖像向三維、四維圖像轉(zhuǎn)變,這些技術(shù)也都已應(yīng)用于甲狀腺疾病診斷。鑒于甲狀腺疾病高發(fā),醫(yī)院甲狀腺超聲診斷信息十分驚人。甲狀腺超聲診斷基本信息包括:①形態(tài)學(xué)信息結(jié)節(jié)形態(tài)、邊界、包膜、縱橫比、邊緣光滑程度等,部分醫(yī)院利用計算機輔助診斷系統(tǒng)中還可能有圓形度、平均方向數(shù)、歸一化徑向長度標(biāo)準(zhǔn)差、粗糙度等信息;②衰減信息特征,后部回聲是超聲診斷甲狀腺結(jié)節(jié)的重要依據(jù),衰減系數(shù)是超聲診斷基本的信息;③紋理特征信息,根據(jù)數(shù)據(jù)計算方式,數(shù)據(jù)的形式、內(nèi)容繁多;④其他信息,如血流流速、頻譜等信息,組織彈性應(yīng)變值等。
2.1統(tǒng)計分析在數(shù)據(jù)挖掘中的應(yīng)用
甲狀腺超聲診斷信息龐大,呈現(xiàn)多模式特征,一定程度上增加了數(shù)據(jù)挖掘難度,部分信息體現(xiàn)出的客觀不完整、描述疾病主觀不確切,進一步增加了信息的復(fù)雜性。數(shù)據(jù)挖掘的意義在于從數(shù)據(jù)中發(fā)現(xiàn)有意義的知識,以總結(jié)甲狀腺超聲特征信息,或用于預(yù)測未來趨勢,進行前瞻性的決策。不同醫(yī)院超聲診斷數(shù)字化管理系統(tǒng)收集信息受醫(yī)院需求、設(shè)計者設(shè)計思路影響,統(tǒng)計學(xué)處理的軟件以SPSS系列為主,目前可供應(yīng)用的數(shù)據(jù)挖掘方法包括關(guān)聯(lián)規(guī)則、集對分析、粗糙集理論、聚類分析等。
2.1.1關(guān)聯(lián)規(guī)則 關(guān)聯(lián)規(guī)則是最常用的研究方法,側(cè)重于數(shù)據(jù)中不同領(lǐng)域的關(guān)系研究,滿足給定條件下的多個域間的依賴關(guān)系,如甲狀腺腫疾病形態(tài)學(xué)信息之間的關(guān)系,根據(jù)一個事物中某些數(shù)據(jù)項可以導(dǎo)出另一些數(shù)據(jù)項。在甲狀腺超聲診斷中,大量出現(xiàn)的形態(tài)學(xué)、組織學(xué)、物理學(xué)相關(guān)信息十分復(fù)雜,關(guān)聯(lián)規(guī)則可找出相關(guān)聯(lián)的各個數(shù)據(jù),但某個信息總是同時出現(xiàn)時,可以找出某種疾病的規(guī)律,甚至是疾病發(fā)生進展規(guī)律[3]。當(dāng)然,關(guān)聯(lián)規(guī)則可能并不能反映臨床實際情況,兩組信息存在關(guān)聯(lián)但并不代表這種關(guān)聯(lián)具有臨床意義。
2.1.2集對分析與粗糙理論 不確定性是自然界與人類社會普遍存在的一種客觀現(xiàn)象,對于超聲診斷更是如此,超聲診斷并不是診斷“金標(biāo)準(zhǔn)”,不可避免存在誤漏診。集對分析可作為統(tǒng)一處理模糊、隨機、中介和信息不完全所致的不確定性。其對不確定性的處理思路簡要概括可分為“客觀承認(rèn)、系統(tǒng)描述、定量刻畫、具體分析”,借助對系統(tǒng)中不確定性與確定性相互關(guān)系,以及一定條件下相互轉(zhuǎn)化的過程描述,處理不確定性在具體條件下的取值規(guī)律。如針對甲狀腺彈性應(yīng)變值,受掃查切面、儀器性能等因素影響,取均值也不能保證完整真實可靠,某些超聲主觀評價結(jié)果較模糊或不一致。集對分析職能在系統(tǒng)層次上,可與解決精確問題方法相結(jié)合,揚長避短。粗糙集理論為研究不精確數(shù)據(jù)分析、推理、挖掘數(shù)據(jù)間的關(guān)系,發(fā)現(xiàn)潛在的關(guān)聯(lián)性提供了行之有效的工具,將其引入到超聲診斷,可為智能化診斷提供一種方法,通過以患者一般情況、癥狀、超聲信息,建立信息表,采用差別矩陣法等獲得上下近似集,抽取確定規(guī)則、可能規(guī)則,以輔助診斷,避免可臨床醫(yī)師主觀性、片面性[4]。
2.1.3聚類分析 聚類分析是超聲診斷系統(tǒng)信息管理最常用的數(shù)據(jù)挖掘策略,通過分析變量之間的線性關(guān)系,按照相似程度進行歸類,將具有共線性關(guān)系的變量聚類分析到一類,從而達到降維目的。聚類分析應(yīng)用于甲狀腺超聲診斷信息,有助于尋找某一個給定條件下,具有共性特征的超聲信息特征,如惡性甲狀腺腫瘤超聲特征群。
2.2統(tǒng)計方法
2.2.1Logistic回歸分析Logistic回歸分析可分為非條件與有條件兩種,前者適用于隊列研究、成組病例對照組資料分析,后者適用于配比設(shè)計病例對照組研究資料分析[5]。甲狀腺超聲診斷信息十分龐大,其中可供對照研究的信息包括性別組、年齡組、良惡性組等,通過進行對照、隊列研究,利用標(biāo)準(zhǔn)偏回歸分析絕對值可了解各自變量對甲狀腺疾病的影響。通過大量的回顧性分析超聲診斷信息,可采用判別分析、回歸分析建立超聲診斷信息與“病種”之間的判別函數(shù),以達到篩查、診斷目的。Logistic逐步歸因分析考慮每一個變量與診斷樹每一個樹杈對“病種”的貢獻,符合臨床邏輯思維過程,更接近臨床實際。
2.2.2因子分析與主成分分析 因子分析是對多個指標(biāo)變量,用少數(shù)幾個潛在指標(biāo)的線性組合表示,綜合反映全部變量的大部分信息,雖然這些變量原始變量少,但包含的信息量可占原始信息的85%以上,且這些新變量可信度仍較高,而且這些新變量彼此之間并不相干,可消除多重共線性[6]。R型因子分析是指指標(biāo)變量做的因子分析,對觀測的個案所做的因子分析叫做Q型因子分析,兩者結(jié)合得到對應(yīng)分析,可同時揭示觀測對象、指標(biāo)變量兩方面的結(jié)果。通過隨機調(diào)查足夠足量的甲狀腺超聲診斷信息,利用SPSS軟件建立數(shù)據(jù)模型,進行實性因子分析(CFA),結(jié)果經(jīng)2-n因子分析,其中某n個因子分析可與臨床實際(甲狀腺主要病種)相符,根據(jù)結(jié)果排序,以標(biāo)準(zhǔn)回歸系數(shù)作為疾病的界值,可劃分不同甲狀腺疾病超聲診斷信息群。
2.2.3典型相關(guān)分析 典型相關(guān)分析是研究兩組變量相關(guān)關(guān)系的一種多元統(tǒng)計方法,應(yīng)用于甲狀腺超聲診斷信息處理,可揭示病種實質(zhì),通過希望了解的病種與客觀指標(biāo)的相關(guān)關(guān)系,利用典型相關(guān)分析,可將病種作為一組變量,某一個超聲診斷信息作為一組變量,分析疾病信息與超聲診斷信息相關(guān)性,了解推測客觀指標(biāo)變化情況。
2.2.4結(jié)構(gòu)方程模型 甲狀腺惡性特征并非一個可以準(zhǔn)確的、直接測量的變量,這種變量可稱為潛變量,通過對縱橫比等外顯指標(biāo),間接測量這些潛變量,結(jié)構(gòu)方程模型可分析潛變量復(fù)雜關(guān)系,用來尋找各種疾病相應(yīng)的主要超聲診斷信息[7]。
2.2.5線性混合模型線性模型主要包括線性回歸模型、方差分析模型、協(xié)方差分析模型、方差分量模型等。方差分量模型不同于其他固定效應(yīng)模型,其中含有部分效應(yīng)為隨機變量?;旌夏P偷囊环N表示形式為:Y=Xβ+ Zu+e,Y是n×1的觀測向量,β為p×1的非隨機未知參數(shù)向量,成為固定效應(yīng),X、Z分別為n×p和n×q已知的設(shè)計矩陣,u和e分別為q×1、n×1隨機向量,u為隨機效應(yīng),e為通常意義上的誤差。通過隨機抽取甲狀腺超聲診斷信息,所有信息并非這些個體本身的特征,而是整個甲狀腺超聲診斷綜合體特征,將單個甲狀腺超聲診斷信息產(chǎn)生的個體效應(yīng)看作隨機而引入模型,可提高模型的精度。線性混合模型在超聲輔助診斷、目標(biāo)預(yù)測中具有較高的價值,如以某一個時間段發(fā)病人數(shù)作為Y,既往任何一種甲狀腺疾病、不同時間段診斷人數(shù)作為自變量,可構(gòu)建線性混合模型,以預(yù)測未來某一個時間段就診人數(shù)值域。
2.2.6最大似然判別 最大似然判別法最好用于計數(shù)資料的判別分析,用于甲狀腺超聲診斷數(shù)字化信息處理,基本原理是,計算某一種甲狀腺疾病各相關(guān)超聲計量信息的條件概率,再將條件概率轉(zhuǎn)化為指數(shù)值,按照相對指數(shù)值大小對相關(guān)因素進行賦分,其與因素回歸分析主要差別在于因變量不是定量的。在獲得新的一組自變量(超聲診斷客觀信息)后,依據(jù)方程組計算概率值,判斷該組數(shù)據(jù)來自于哪一個類別的概率最大,從而判斷該組數(shù)據(jù)來自于哪一類。最大似然判別特別適用于病例樣本較大的數(shù)據(jù),得出的數(shù)據(jù)頻率較穩(wěn)定,作為目標(biāo)指標(biāo)評價指標(biāo)要多,則判斷而定準(zhǔn)確率越高。最大似然判別法可與計量學(xué)中概率換算法進行結(jié)合。
統(tǒng)計研究是衛(wèi)生領(lǐng)域作用工作內(nèi)容,有報告顯示全世界約80%的數(shù)字信息是醫(yī)學(xué)信息。我國人口眾多,醫(yī)學(xué)信息十分龐大,一方面為開展醫(yī)學(xué)統(tǒng)計學(xué)工作提供了更豐富的材料;另一方面對統(tǒng)計工作者業(yè)務(wù)能力提出了更高的要求[8]。醫(yī)學(xué)統(tǒng)計在公共衛(wèi)生、臨床等領(lǐng)域發(fā)揮重要作用,衛(wèi)生工作者應(yīng)努力提升自身的統(tǒng)計學(xué)知識水平,以提升挖掘數(shù)據(jù)、處理數(shù)據(jù),提升自身科研能力。
[1]詹維偉.甲狀腺結(jié)節(jié)的超聲診斷進展[J].中華醫(yī)學(xué)超聲雜志,2011,8(6):1170-1179.
[2]何慶勇.臨床論著中常見統(tǒng)計學(xué)錯誤辨析[J].中國中醫(yī)基礎(chǔ)醫(yī)學(xué)雜志,2011,15(7):552-553.
[3]王華,胡學(xué)鋼.基于關(guān)聯(lián)規(guī)則的數(shù)據(jù)挖掘在臨床上的應(yīng)用[J].安徽大學(xué)學(xué)報:自然科學(xué)版,2006(30):21-25.
[4]張文修,吳偉志.粗糙集理論與方法[M].北京:科學(xué)出版社,2003:22-23.
[5]王濟川,郭志剛.Logistic回歸模型—方法與應(yīng)用[M].北京:高等教育出版社,2001:9.
[6]王芳.主成分分析與因子分析的異同比較及應(yīng)用[J].統(tǒng)計教育,2003(5):14.
[7]侯杰泰,溫忠麟,成子娟.結(jié)構(gòu)方程模型及其應(yīng)用[M].北京:教育科學(xué)出版社,2004:13-14.
[8]趙耐青.醫(yī)學(xué)統(tǒng)計學(xué)[M].高等教育出版社,2004:1.
Application of Statistical Analysis in the Thyroid Ultrasound Diagnosis Digital Management System
YU Jia,ZHU Li-na,LI Xuan-xuan,WANG Dong-mei
Functional Inspection Department,Qingdao Haici Medical Group,Qingdao,Shandong Province,266033 China
R73
A
1672-5654(2016)05(a)-0178-03
于佳(1982.1-),女,山東青島人,本科,住院醫(yī)師,主要從事超聲診斷方面的工作。
王冬梅(1983.12-),女,山東青島人,本科,住院醫(yī)師,主要研究方向:超聲診斷,E-mail:wangdongmei1108@163.com。
2016-02-04)