張雁磊
(菏澤家政職業(yè)學(xué)院 山東 菏澤 274300)
Excel統(tǒng)計(jì)分析功能在醫(yī)學(xué)檢驗(yàn)(高職)教學(xué)中的應(yīng)用
張雁磊
(菏澤家政職業(yè)學(xué)院 山東 菏澤 274300)
Excel具有強(qiáng)大的統(tǒng)計(jì)分析功能,這些功能完全可以滿足醫(yī)學(xué)檢驗(yàn)教學(xué)(高職)過程中的和學(xué)生在以后在工作中分析數(shù)據(jù)的要求。
Excel;統(tǒng)計(jì)分析;應(yīng)用
統(tǒng)計(jì)學(xué)是一門處理數(shù)據(jù)的科學(xué),處理數(shù)據(jù)一般來(lái)說就是對(duì)數(shù)據(jù)進(jìn)行計(jì)算,而統(tǒng)計(jì)學(xué)的數(shù)據(jù)大部分是通過統(tǒng)計(jì)調(diào)查得到的,這些數(shù)據(jù)大部分都十分龐大,并且計(jì)算比較繁雜,人工計(jì)算一般來(lái)說實(shí)現(xiàn)不了?,F(xiàn)在在統(tǒng)計(jì)分析中常用的軟件主要有SAS、SPSS、R、STATA,而這些統(tǒng)計(jì)軟件沒有漢化并且要求使用者有一定的編程基礎(chǔ),所以對(duì)于大部分高職學(xué)生來(lái)說要想熟練運(yùn)用上述統(tǒng)計(jì)軟件是非常困難的。Excel作為Office組件之一已經(jīng)漢化,并且現(xiàn)在它的使用已經(jīng)相當(dāng)普及,而其身附帶的統(tǒng)計(jì)函數(shù)相當(dāng)完善,完全可以滿足在高職統(tǒng)計(jì)教學(xué)和學(xué)生日后在工作中分析數(shù)據(jù)的需要。本文首先對(duì)常用的統(tǒng)計(jì)函數(shù)分類介紹,然后通過實(shí)例說明其在統(tǒng)計(jì)分析中的應(yīng)用。
以上函數(shù)中參數(shù)可以是數(shù)字、數(shù)組和引用,但參數(shù)的個(gè)數(shù)不能為0,也不能超過30個(gè)。
(1)單項(xiàng)式分組的頻數(shù)統(tǒng)計(jì)函數(shù):=COUNTIF(range,criteria)
range為所要統(tǒng)計(jì)頻數(shù)的數(shù)據(jù)所在的區(qū)域;criteria為函數(shù)計(jì)數(shù)的條件。
(2)組距分組的頻數(shù)統(tǒng)計(jì)函數(shù):=FREQUENCY(data_array,bins_array)
data_array為一個(gè)數(shù)組或?qū)σ唤M數(shù)值的引用,統(tǒng)計(jì)的就是它出現(xiàn)的頻率。如果data_array中不包含任何數(shù)值,函數(shù)FREQUENCY將返回一個(gè)零數(shù)組;bins_array是一個(gè)區(qū)間數(shù)組或?qū)^(qū)間的引用,該區(qū)間用于對(duì)data_array中的數(shù)值進(jìn)行分組。
(1)二項(xiàng)分布函數(shù):=BINOMDIST(number_s,trials,probability_s,cumulative)
number_s為成功試驗(yàn)的次數(shù);trials為試驗(yàn)的總次數(shù);probability_s為每次試驗(yàn)中成功的概率;cumulative為一邏輯值,如果cumulative=1,返回累積分布函數(shù),即至多number_s次成功的概率;如果cumulative=0,返回概率密度函數(shù),即number_s次成功的概率。
(2)Poisson分布函數(shù):=POISSON(x,mean,cumulative)
x為事件數(shù);mean為Poisson分布的期望值;cumulative同二項(xiàng)分布函數(shù)中cumulative的作用。
(3)正態(tài)分布函數(shù):=NORMDIST(x,mean,Standard_dev,cumulative)
x為需要計(jì)算其正態(tài)分布的變量;mean正態(tài)分布的數(shù)學(xué)期望;Standard_devStandard_dev為正態(tài)分布的標(biāo)準(zhǔn)差;cumulative同二項(xiàng)分布函數(shù)中cumulative的作用。
(4)t-分布函數(shù):=TDIST(x,degrees_freedom,tails)
x為需要計(jì)算其t-分布的變量;degrees_freedom為 t-分布的自由度;tails指明t-分布函數(shù)的尾數(shù),tails=1,函數(shù)TDIST返回單尾分布,如果tails=2,函數(shù)TDIST返回雙尾分布。
(5)F-分布函數(shù):=FDIST(x,degrees_freedom 1,degrees_freedom 2)
x為需要計(jì)算其F-分布的變量;degrees_freedom 1為F-分布函數(shù)分子的自由度;degrees_freedom 2為F-分布函數(shù)分母的自由度。
(6)χ2分布函數(shù):=CHIDIST(x,degrees_freedom)
x為需要計(jì)算其χ2分布的變量;degrees_freedom為χ2分布函數(shù)的自由度。
(1)t-分布臨界值函數(shù):=TINV(probability,degrees_freedom)
probability為雙尾t-分布的概率;degrees_freedom為t-分布函數(shù)的自由度。
(2)正態(tài)分布臨界值函數(shù):=NORMINV(probability,m ean,Standard_dev)
probability為雙尾正態(tài)分布的概率;mean為正態(tài)分布的數(shù)學(xué)期望值;Standard_dev為正態(tài)分布的標(biāo)準(zhǔn)差。
(3)χ2分布臨界值函數(shù):=CHIINV(probability,degrees_freedom)
probability為χ2分布的單尾概率;degrees_freedom為χ2分布函數(shù)的自由度。
(4)F-分布臨界值函數(shù):=FINV(probability,degrees_freedom 1,degrees_freedom 2)
probability為F-分布函數(shù)累積分布相關(guān)的概率;degrees_freedom 1為probability分布函數(shù)分子的自由度;degrees_freedom 2為probability分布函數(shù)分母的自由度。
(1)z-檢驗(yàn)函數(shù):=ZTEST(array,μ0,б)
array為用來(lái)檢驗(yàn)μ0的數(shù)組或數(shù)據(jù)區(qū)域;μ0為被檢驗(yàn)的值;б為樣本總體的標(biāo)準(zhǔn)差,此參數(shù)如果省略,則使用樣本標(biāo)準(zhǔn)差。
(2)t-檢驗(yàn)函數(shù):=TTEST(array1,array2,tails,type)
array1為第一個(gè)數(shù)組或數(shù)據(jù)區(qū)域;array2為第二個(gè)數(shù)組或數(shù)據(jù)區(qū)域;type指明t-分布曲線是單尾還是雙尾。
(3)χ2檢 驗(yàn) 函 數(shù):=CHITEST(actual_range,expected_range)
actual_range為實(shí)際觀測(cè)頻數(shù)所在的區(qū)域;expected_range為理論頻數(shù)所在的區(qū)域。
(4)F-檢驗(yàn)函數(shù):=FTEST(array1,array2)
array1第一個(gè)數(shù)組或數(shù)據(jù)區(qū)域;array2第二個(gè)數(shù)組或數(shù)據(jù)區(qū)域。
Pearson相關(guān)系數(shù):=CORREL(array1,array2)
array1、array2為進(jìn)行相關(guān)分析兩組數(shù)據(jù)所在的單元格區(qū)域。
(1)斜率函數(shù):=SLOPE(knowen_y's,knowen_x's)
knowen_y's為反應(yīng)變量的觀測(cè)值或數(shù)據(jù)集合所在的區(qū)域;knowen_x's為解釋變量的觀測(cè)值或數(shù)據(jù)集合所在的區(qū)域。
(2)截距函數(shù):=INTERCEPT(knowen_y's,knowen_x's)
knowen_y's、knowen_x's同斜率函數(shù)中的解釋。
(3)回歸直線函數(shù):=LINEST(knowen_y's,knowen_x's,const,stats)
knowen_y's是關(guān)系表達(dá)式y(tǒng)=mx+b中已知的y值集合;knowen_x's是關(guān)系表達(dá)式y(tǒng)=mx+b中已知的可選x值集合;const為一邏輯值,用于指定是否將常量b強(qiáng)制設(shè)為0;stats用于指定是否返回附加的回歸統(tǒng)計(jì)值。
(4)判定系數(shù):=RSQ(knowen_y's,knowen_x's)
knowen_y's為反應(yīng)變量的觀測(cè)值或數(shù)據(jù)集合所在的區(qū)域;knowen_x's為解釋變量的觀測(cè)值或數(shù)據(jù)集合所在的區(qū)域。
在醫(yī)療領(lǐng)域中對(duì)于癥狀的發(fā)展早期診斷一直是一項(xiàng)重要的任務(wù),大量的案例積累為早期診斷的研究提供了重要的基礎(chǔ)依據(jù)。而Excel為分析研究這些基礎(chǔ)性資料并得到相關(guān)的結(jié)論提供了有力的工具。為此選取北京兒童醫(yī)院的“圍手術(shù)期輸血與先天性巨結(jié)腸癥術(shù)后感染”為例,講解Excel在醫(yī)學(xué)檢驗(yàn)中的應(yīng)用。數(shù)據(jù)見表1。
表1 圍手術(shù)期輸血與先天性巨結(jié)腸癥術(shù)后感染數(shù)據(jù)
本案例的分析思路如下,首先利用方差分析方法分析不同手術(shù)持續(xù)時(shí)間的結(jié)果是否存在顯著差異;然后利用回歸分析方法建立回歸函數(shù),從而得到影響術(shù)后感染的主要因素。
(1)方差分析,見表2。
表2 Excel單因素方差分析數(shù)據(jù)
(2)回歸分析,見表3。
表3 Excel回歸分析數(shù)據(jù)
(1)手術(shù)時(shí)間對(duì)術(shù)后感染情況的結(jié)果分析
從表2中可以得到手術(shù)時(shí)間對(duì)術(shù)后感染無(wú)顯著影響檢驗(yàn)的P值為0.0000,小于顯著水平0.05,因此可以認(rèn)為手術(shù)時(shí)間對(duì)術(shù)后感染有顯著影響。
(2)術(shù)后感染情況影響因素的分析
表3中的“回歸統(tǒng)計(jì)”輸出的結(jié)果了用性別、月齡、紅細(xì)胞壓積、手術(shù)時(shí)間、失血量、輸血次數(shù)、輸血量來(lái)解釋術(shù)后感染與否的能力,具體給出了R、R2調(diào)整后R2以及標(biāo)準(zhǔn)誤和觀測(cè)值。在本例中回歸模型調(diào)整的R2為0.52,說明回歸的擬合度一般。
表3中的“方差分析”,得到回歸部分的F值為4.51,相應(yīng)的P值為0.006,小于顯著水平0.05,因此可以判斷由性別、月齡、紅細(xì)胞壓積、手術(shù)時(shí)間、失血量、輸血次數(shù)、輸血量等指標(biāo)對(duì)術(shù)后感染與否的解釋能力比較顯著。
表3中最后一部分給出了線性回歸模型的回歸系數(shù)及相應(yīng)的統(tǒng)計(jì)量,從該部分可得到線性回歸模型中的性別、月齡、紅細(xì)胞壓積、手術(shù)時(shí)間、失血量、輸血次數(shù)、輸血量的系數(shù)。另外,線性回歸模型中的紅細(xì)胞壓積、手術(shù)時(shí)間、輸血次數(shù)、輸血量四個(gè)指標(biāo)的T值分別為2.07、2.02、2.98、3.99,相應(yīng)的P值為0.05、0.06、0.009、0.001,說明系數(shù)顯著,即樣本術(shù)后感染與否高度受紅細(xì)胞壓積、手術(shù)時(shí)間、輸血次數(shù)、輸血量四個(gè)指標(biāo)的影響;而性別、月齡和失血量的T值很小,對(duì)應(yīng)的P值均大于0.1,說明系數(shù)不顯著,即性別、月齡和失血量三個(gè)指標(biāo)在該回歸模型中對(duì)樣本術(shù)后感染與否沒有顯著影響。
[1]方積乾衛(wèi)生統(tǒng)計(jì)學(xué)[M].人民衛(wèi)生出版社,2015.
[2]魏宗舒概率論與數(shù)理統(tǒng)計(jì)教程[M].高等教育出版社,2008.
[3]張聯(lián)鋒Excel統(tǒng)計(jì)分析與應(yīng)用[M].電子工業(yè)出版社,2013.
R197.39 【文獻(xiàn)標(biāo)識(shí)碼】A 【文章編號(hào)】1009-5624(2018)01-0093-03