• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      合理進(jìn)行多重Logistic回歸分析
      ——結(jié)合ROC曲線分析

      2022-02-02 03:23:40胡純嚴(yán)胡良平
      四川精神衛(wèi)生 2022年6期
      關(guān)鍵詞:血鈉面積曲線

      胡純嚴(yán) ,胡良平 ,2*

      (1.軍事科學(xué)院研究生院,北京 100850;2.世界中醫(yī)藥學(xué)會聯(lián)合會臨床科研統(tǒng)計(jì)學(xué)專業(yè)委員會,北京 100029*通信作者:胡良平,E-mail:lphu927@163.com)

      在醫(yī)學(xué)上,若某種定量觀測指標(biāo)的取值大小與受試者是否患某種疾病之間存在一定的關(guān)聯(lián)性,研究者希望用某種定量指標(biāo)的取值去預(yù)測或判斷受試者患該疾病的概率。這樣的定量指標(biāo)被稱為診斷指標(biāo)。而評價(jià)這種診斷指標(biāo)診斷性能高低的有效方法為ROC曲線分析。本文將基于多重Logistic回歸分析,并結(jié)合ROC曲線分析處理診斷試驗(yàn)資料,以展示將這兩種方法結(jié)合使用相較于僅用多重Logistic回歸分析,可以獲得更豐富、更合理的統(tǒng)計(jì)分析結(jié)果。

      1 基本概念

      1.1 常用診斷指標(biāo)的統(tǒng)計(jì)描述

      1.1.1 診斷試驗(yàn)結(jié)果的表達(dá)形式

      診斷試驗(yàn)結(jié)果可整理成表1所示的形式[1]。

      表1 診斷試驗(yàn)結(jié)果的表達(dá)形式Table 1 Expression of diagnostic test results

      1.1.2 評價(jià)診斷試驗(yàn)真實(shí)性的指標(biāo)

      1.1.2.1 金標(biāo)準(zhǔn)或標(biāo)準(zhǔn)診斷

      評價(jià)任何一種診斷試驗(yàn)在臨床上的價(jià)值,都是與金標(biāo)準(zhǔn)或標(biāo)準(zhǔn)診斷相比較而言的。所謂金標(biāo)準(zhǔn),是醫(yī)學(xué)界公認(rèn)的、具有診斷某一疾病價(jià)值的最佳方法,如國際、國內(nèi)公認(rèn)的診斷標(biāo)準(zhǔn)、方法、病理學(xué)檢查、手術(shù)所見及特殊檢查所獲得的結(jié)論等。

      1.1.2.2 靈敏度

      靈敏度(Sensitivity,Se)即真陽性率,指在標(biāo)準(zhǔn)診斷確診陽性組中,診斷試驗(yàn)陽性結(jié)果人數(shù)與患者組總?cè)藬?shù)的比值,其計(jì)算公式見式(1)。

      靈敏度反映了診斷試驗(yàn)將實(shí)際已患所研究疾病的受試者正確判斷為該病患者的能力。

      1.1.2.3 假陰性率

      假陰性率(False negative rate,F(xiàn)NR)即漏診率,指在標(biāo)準(zhǔn)診斷確診陽性組中,診斷試驗(yàn)陰性結(jié)果人數(shù)與患者組總?cè)藬?shù)的比值,其計(jì)算公式見式(2)。

      假陰性率反映了診斷試驗(yàn)將實(shí)際已患所研究疾病的受試者錯(cuò)誤判斷為非該病患者的比例。

      1.1.2.4 特異度

      特異度(Specificity,Sp)即真陰性率,指在標(biāo)準(zhǔn)診斷確診陰性組中,診斷試驗(yàn)陰性結(jié)果人數(shù)與非患者組總?cè)藬?shù)的比值,其計(jì)算公式見式(3)。

      特異度反映了診斷試驗(yàn)將實(shí)際未患所研究疾病的受試者正確判斷為非該病患者的能力。

      1.1.2.5 假陽性率

      假陽性率(False positive rate,F(xiàn)PR)即誤診率,指在標(biāo)準(zhǔn)診斷確診陰性組中,診斷試驗(yàn)陽性結(jié)果人數(shù)與非患者組總?cè)藬?shù)的比值,其計(jì)算公式見式(4)。

      假陽性率反映了診斷試驗(yàn)將實(shí)際未患所研究疾病的受試者錯(cuò)誤判斷為該病患者的比例。

      1.1.2.6 約登指數(shù)

      約登指數(shù)(Yonden's index)又稱正確指數(shù),是評價(jià)診斷試驗(yàn)結(jié)果真實(shí)性的綜合指標(biāo),其計(jì)算公式見式(5)。

      1.2 診斷資料的ROC曲線分析方法

      1.2.1 ROC曲線分析

      ROC是受試者工作特征(Receiver Operating Characteristic,ROC)或相對工作特征(Relative Operating Characteristic)的縮寫[2-3]。ROC曲線分析于20世紀(jì)50年代起源于統(tǒng)計(jì)決策理論,后來應(yīng)用于雷達(dá)信號觀察能力的評價(jià),20世紀(jì)60年代中期,該方法大量成功地用于實(shí)驗(yàn)心理學(xué)和心理物理學(xué)研究。1971年,Lusted描述了如何將心理物理學(xué)上常用的ROC曲線方法用于醫(yī)學(xué)決策,該方法克服了診斷試驗(yàn)中僅孤立地使用靈敏度與特異度以及相關(guān)指標(biāo)的缺陷。自此以后,ROC曲線分析成為非常有價(jià)值的描述與比較診斷試驗(yàn)的工具。

      1.2.2 ROC曲線的構(gòu)建

      ROC曲線的橫軸(x軸)表示診斷試驗(yàn)的假陽性率,常表示為1-Sp,縱軸(y軸)表示診斷試驗(yàn)的靈敏度,由不同決策界值點(diǎn)(1-Sp,Se)產(chǎn)生二維直角坐標(biāo)系(簡稱圖)中的不同點(diǎn)。采用線段連接圖中所有可能的界值點(diǎn),即形成經(jīng)驗(yàn)ROC曲線。隨著靈敏度的增加,假陽性率也增加,ROC曲線下面積反映了這種增加的數(shù)量大小。

      2 計(jì)算方法

      2.1 ROC曲線下面積的計(jì)算

      2.1.1 計(jì)算方法概述

      一般采用“ROC曲線下面積”反映診斷試驗(yàn)的準(zhǔn)確性。理論上,這一指標(biāo)取值范圍為0.5~1.0,完全無價(jià)值的診斷試驗(yàn)的ROC曲線下面積為0.5,完善的診斷試驗(yàn)的ROC曲線下面積為1.0。ROC曲線下面積及其標(biāo)準(zhǔn)誤的計(jì)算目前有非參數(shù)、半?yún)?shù)和參數(shù)方法,應(yīng)用較廣泛的包括Wilcoxon非參數(shù)法和最大似然估計(jì)“雙正態(tài)”參數(shù)法。參數(shù)法與非參數(shù)法估計(jì)ROC曲線下面積均適用于診斷結(jié)果為連續(xù)性定量資料或等級資料的診斷試驗(yàn)的評價(jià)。

      2.1.2 非參數(shù)法

      非參數(shù)法是根據(jù)診斷試驗(yàn)結(jié)果直接計(jì)算繪制ROC曲線所需的工作點(diǎn),由此繪制的ROC曲線為經(jīng)驗(yàn)ROC曲線,曲線下面積與患者和非患者試驗(yàn)結(jié)果秩和檢驗(yàn)的Mann-Whitney統(tǒng)計(jì)量相等,但其結(jié)果常小于真實(shí)的面積值。

      2.1.3 參數(shù)法

      參數(shù)法是根據(jù)試驗(yàn)結(jié)果擬合雙正態(tài)模型,利用最大似然法估計(jì)模型的2個(gè)參數(shù)a和b,由2個(gè)參數(shù)可得到光滑的ROC曲線及曲線下面積的估計(jì)值。參數(shù)法的應(yīng)用條件為:患者與非患者的診斷試驗(yàn)結(jié)果服從雙正態(tài)分布。當(dāng)不滿足這一應(yīng)用條件時(shí),需要采用變量變換,將診斷試驗(yàn)結(jié)果轉(zhuǎn)換為正態(tài)分布;在樣本量較大、相同值較少時(shí),參數(shù)法與非參數(shù)法估計(jì)的ROC曲線下面積常常近似相等。雙正態(tài)模型參數(shù)法估計(jì)ROC曲線下面積的公式見式(6)。

      式(6)中的a和b分別見式(7)和式(8)。

      式(6)、式(7)和式(8)中,A為ROC曲線下面積,a和b分別為雙正態(tài)模型的2個(gè)參數(shù),Φ表示標(biāo)準(zhǔn)正態(tài)分布函數(shù),xˉ和yˉ分別為患者組和非患者組診斷試驗(yàn)結(jié)果的均數(shù)(假定患者組高于非患者組,μx>μy),sx和sy分別為患者組和非患者組診斷試驗(yàn)結(jié)果的標(biāo)準(zhǔn)差。

      2.2 多條ROC曲線下面積的比較

      在成組設(shè)計(jì)下,兩獨(dú)立樣本所算得的ROC曲線下面積的比較,可令兩面積之間的協(xié)方差為0;在自身配對設(shè)計(jì)下,兩種診斷方法測定同一組樣本,此時(shí),兩面積之間的協(xié)方差不為0,有較復(fù)雜的計(jì)算公式。當(dāng)兩條ROC曲線無交叉時(shí),它們ROC曲線下面積的比較可由式(9)計(jì)算。

      式(9)中的Z值服從或近似服從標(biāo)準(zhǔn)正態(tài)分布,查正態(tài)分布表可得相應(yīng)的P值,A1和A2分別為兩診斷試驗(yàn)ROC曲線下面積,Var(A1)和Var(A2)分別為兩曲線下面積的方差,Cov(A1,A2)為兩曲線下面積的協(xié)方差,當(dāng)兩診斷試驗(yàn)獨(dú)立時(shí),此協(xié)方差項(xiàng)為0。當(dāng)兩條ROC曲線交叉時(shí),兩診斷試驗(yàn)的比較應(yīng)比較部分ROC曲線下的面積或固定假陽性率時(shí)的靈敏度。當(dāng)需要同時(shí)比較多條ROC曲線下面積時(shí),一般需要選定其中之一作為對照,生成比較矩陣,構(gòu)建復(fù)雜且服從χ2分布的檢驗(yàn)統(tǒng)計(jì)量,見文獻(xiàn)[2,4]。

      3 實(shí)例與SAS實(shí)現(xiàn)

      3.1 問題與數(shù)據(jù)結(jié)構(gòu)

      3.1.1 問題與數(shù)據(jù)

      【例1】研究者采用某種金標(biāo)準(zhǔn),將45例受試者中的21例診斷為落基山斑點(diǎn)熱(RMSF)(病例組),其余24例為非RMSF(對照組),分別用兩種方法測得受試者血鈉水平,因篇幅所限,具體數(shù)據(jù)見文獻(xiàn)[5]。問這兩種方法診斷性能之間的差異有無統(tǒng)計(jì)學(xué)意義?

      3.1.2 對數(shù)據(jù)結(jié)構(gòu)的分析

      例1的資料涉及3個(gè)變量,一是金標(biāo)準(zhǔn)診斷結(jié)果(包括患RMSF、非RMSF),二是檢測方法(包括方法1、方法2),三是血鈉水平。

      3.1.3 統(tǒng)計(jì)分析方法的選擇

      如何選擇統(tǒng)計(jì)分析方法對例1中的資料進(jìn)行分析,取決于研究目的。第一個(gè)目的:分析檢測方法和血鈉水平對診斷結(jié)果的影響是否有統(tǒng)計(jì)學(xué)意義。此時(shí),適合選用二值結(jié)果變量的多重Logistic回歸分析[6-7]。第二個(gè)目的:基于哪種檢測方法得到的血鈉水平,對診斷受試者是否患RMSF的診斷性能更好。此時(shí),適合選用基于多重Logistic回歸分析的ROC曲線分析。

      3.2 僅采用多重Logistic回歸分析

      3.2.1 將檢驗(yàn)方法和血鈉水平值分別視為定性和計(jì)量原因變量

      分別采用method和bs表示“檢測方法”和“血鈉水平值”。設(shè)所需要的SAS程序如下:

      【SAS主要輸出結(jié)果及解釋】由glm過程輸出的主要結(jié)果見表2。

      表2 兩因素各水平組合下的血鈉水平(±s)Table 2 Blood sodium value under the combination of two factors and different levels

      表2 兩因素各水平組合下的血鈉水平(±s)Table 2 Blood sodium value under the combination of two factors and different levels

      “disease”的水平“method”的水平數(shù) 目0 0 1 1 0 1 0 1 24 24 21 21血鈉水平(mmol/L)136.500±5.022 137.417±3.729 130.238±4.918 130.714±4.406

      由以上輸出結(jié)果可知,RMSF患者的平均血鈉水平(disease=1)低于非RMBF者的平均血鈉水平(disease=0);方法1測定的平均血鈉水平(method=1)高于方法2測定的平均血鈉水平(method=0)。

      由Logistic過程輸出的主要結(jié)果見表3。

      表3 Logistic回歸模型中參數(shù)的估計(jì)和假設(shè)檢驗(yàn)結(jié)果Table 3 Estimation and hypothesis test results of the parameters in the Logistic regression model

      由以上輸出結(jié)果可知,兩種檢測方法之間差異無統(tǒng)計(jì)學(xué)意義(χ2=0.207,P=0.649),說明兩種檢測方法在診斷RMSF方面的性能接近;血納水平對結(jié)果的影響有統(tǒng)計(jì)學(xué)意義(χ2=22.453,P<0.01),因血鈉水平的回歸系數(shù)為負(fù)值且建模的概率為disease=1(即患RMSF),說明RMSF患者較非RMSF者的血鈉水平低。

      3.2.2 將兩次檢測的血鈉水平作為自變量

      分別采用m1和m2表示第1次與第2次血鈉水平檢測結(jié)果。設(shè)所需要的SAS程序如下:

      【SAS主要輸出結(jié)果及解釋】由Logistic過程輸出的主要結(jié)果見表4。

      表4 Logistic回歸模型中參數(shù)的估計(jì)和假設(shè)檢驗(yàn)結(jié)果Table 4 Estimation and hypothesis test results of the parameters in the Logistic regression model

      由以上輸出結(jié)果可知,兩種檢測方法檢測的血鈉水平對預(yù)測患RMSF有統(tǒng)計(jì)學(xué)意義(P均<0.01)。由于對disease=1(患RMSF)建模,又由于m1與m2的回歸系數(shù)分別為負(fù)值與正值,表明方法1檢測的血鈉水平一般低于方法2。

      3.3 基于多重Logistic回歸分析并結(jié)合ROC曲線分析

      3.3.1 以空模型為對照進(jìn)行ROC曲線下面積比較

      設(shè)所需要的SAS程序如下:SAS數(shù)據(jù)步程序與“第3.2.2節(jié)”中的數(shù)據(jù)步相同,下面僅給出SAS過程步程序。

      proc logistic data=a1;

      model disease(event="1")=m1 m2;

      roc m1; roc m2; roc;

      roccontrast reference('roc3') / estimate e;

      run;

      【SAS主要輸出結(jié)果及解釋】與ROC曲線分析有關(guān)的計(jì)算結(jié)果見表5。

      表5 ROC曲線下面積及其關(guān)聯(lián)統(tǒng)計(jì)量的計(jì)算結(jié)果Table 5 Calculation results of area under ROC curveand its association statistics

      在以上的輸出結(jié)果中,“模型”代表包含方法1和方法2檢測結(jié)果的總模型;ROC1代表僅有方法1檢測結(jié)果的模型;ROC2代表僅有方法2檢測結(jié)果的模型;ROC3代表空模型。從表格的前3行結(jié)果中的95%置信區(qū)間不包含0.5可以間接判斷出,前3個(gè)模型對應(yīng)的ROC曲線下的面積與0.5之間的差異有統(tǒng)計(jì)學(xué)意義。不同模型對應(yīng)的ROC曲線下面積的比較結(jié)果見表6。

      表6 ROC對比估計(jì)和逐行檢驗(yàn)結(jié)果Table 6 Results of ROC comparative estimation and the row by row test

      由以上輸出結(jié)果可知,3個(gè)模型(總模型、ROC1、ROC2)與空模型(ROC3)ROC曲線下面積相比較,P值均<0.01。說明這3個(gè)模型對RMSF都具有一定的診斷價(jià)值。

      3.3.2 以方法2的模型為對照進(jìn)行ROC曲線下面積比較

      設(shè)所需要的SAS程序如下:

      【SAS主要輸出結(jié)果及解釋】以方法2的模型為對照,與其他模型ROC曲線下面積進(jìn)行比較,結(jié)果見表7。

      表7 ROC對比估計(jì)和逐行檢驗(yàn)結(jié)果Table 7 Results of ROC comparative estimation and the row by row test

      由以上輸出結(jié)果可知,3個(gè)其他模型與方法2的模型比較,ROC曲線下的面積之間的差異均有統(tǒng)計(jì)學(xué)意義(P<0.05或0.01)。說明在診斷RMSF方面,方法1比方法2好。

      3.3.3 采用score語句輸出各診斷評價(jià)指標(biāo)的估計(jì)值

      設(shè)所需要的SAS程序如下:

      【SAS主要輸出結(jié)果及解釋】各種診斷試驗(yàn)評價(jià)指標(biāo)[8]的估計(jì)值見表8。

      表8 各觀測點(diǎn)上各種診斷試驗(yàn)評價(jià)指標(biāo)的估計(jì)值Table 8 Estimated values of various diagnostic test evaluation indicatorsat each observation point

      “19個(gè)觀測”代表用方法1檢測45例受試者,得到了19個(gè)不同的血鈉水平(m1)。將這19個(gè)m1從小到大排序(實(shí)現(xiàn)的SAS程序?yàn)椋簆roc freq data=a1;tables m1;run;),到第9個(gè)m1(m1=133)時(shí)的累計(jì)頻率為0.400,到第10個(gè)m1(m1=134)時(shí)的累計(jì)頻率為0.444。由輸出結(jié)果的最后一行可知,Yonden指數(shù)=0.607為最大值,此時(shí)對應(yīng)的概率(近似等于累計(jì)頻率)為0.402。提示:基于方法1檢測結(jié)果診斷受試者是否患RMSF,對應(yīng)的血鈉水平的最佳診斷點(diǎn)介于133~134 mmol/L,可近似將血鈉水平133 mmol/L作為RMSF的最佳診斷點(diǎn)。

      3.4 結(jié)論

      由“第3.2節(jié)”的分析結(jié)果可知,采用兩種多重Logistic回歸模型分析,得到如下兩個(gè)結(jié)論:其一,兩種檢測血鈉水平的方法在診斷RMSF方面的性能基本相同;其二,檢測方法1比檢測方法2得到的平均血鈉水平低。

      由“第3.3節(jié)”的分析結(jié)果可知,采用基于多重Logistic回歸分析,并結(jié)合ROC曲線分析,得到如下兩個(gè)結(jié)論:其一,兩種檢測血鈉水平的方法在診斷RMSF方面的準(zhǔn)確度不同,方法1優(yōu)于方法2;其二,基于ROC曲線分析,可以獲得血鈉水平的診斷點(diǎn)的估計(jì)值。

      4 討論與小結(jié)

      4.1 討論

      在“第3.2節(jié)”的分析中,顯示的“觀測數(shù)(即樣本含量)”為90例,這是因?yàn)閷γ课皇茉囌哌M(jìn)行了兩次重復(fù)觀測,故得45×2=90。嚴(yán)格地說,該資料所對應(yīng)的設(shè)計(jì)類型為具有1個(gè)重復(fù)測量因素的兩因素設(shè)計(jì)(試驗(yàn)分組因素為“是否患RMSF”,重復(fù)測量因素為“兩種檢測方法”)。由于兩次檢測的指標(biāo)都是血鈉水平,故對每位受試者測得的兩個(gè)血鈉水平數(shù)據(jù)可以相減(屬于自身配對),得到差量(md)。這樣,就消除了一個(gè)自變量(即兩種檢測方法)。此時(shí),就可用差量md作為唯一的自變量,以disease作為二值結(jié)果變量,構(gòu)建一重Logistic回歸模型,分析的結(jié)果表明:md對結(jié)果的影響無統(tǒng)計(jì)學(xué)意義,也就意味著兩種檢測方法的診斷性能基本相同。但這個(gè)結(jié)論與“第3.3節(jié)”所得的結(jié)論(方法1的診斷性能好于方法2)不一致。值得一提的是:“第3.2.1節(jié)”的分析法相當(dāng)于兩血鈉水平均值之間的比較,而“第3.3.2節(jié)”的分析法相當(dāng)于兩條ROC曲線下面積之間的比較。結(jié)果表明,“第3.3.2節(jié)”的分析法對資料的利用率高于前者,故所得結(jié)論更可信。

      4.2 小結(jié)

      本文介紹了常用診斷指標(biāo)的統(tǒng)計(jì)描述和診斷資料的ROC曲線分析方法;扼要介紹了ROC曲線下面積的計(jì)算和多條ROC曲線下面積的比較;針對一個(gè)診斷試驗(yàn)資料,采取了兩種分析策略。第一種,僅采用多重Logistic回歸分析;第二種,基于多重Logistic回歸分析,再使用ROC曲線分析。從兩種分析策略得到的結(jié)果和結(jié)論來看,第二種分析策略比第一種分析策略好,獲得了更豐富的結(jié)果和更合理的結(jié)論。

      猜你喜歡
      血鈉面積曲線
      未來訪談:出版的第二增長曲線在哪里?
      出版人(2022年8期)2022-08-23 03:36:50
      自發(fā)性腦出血發(fā)病后血鈉水平對30 d內(nèi)死亡率的影響
      血鈉波動值在預(yù)警院內(nèi)死亡中的價(jià)值
      怎樣圍面積最大
      最大的面積
      巧用面積法解幾何題
      肝硬化急性消化道出血患者應(yīng)用特利加壓素治療后低鈉血癥的發(fā)病率及其危險(xiǎn)因素
      幸福曲線
      英語文摘(2020年6期)2020-09-21 09:30:40
      沿平坦凸曲線Hilbert變換的L2有界性
      巧用面積求坐標(biāo)
      吉林省| 昭平县| 东丽区| 紫云| 达拉特旗| 弋阳县| 博兴县| 合水县| 霍林郭勒市| 灵川县| 西城区| 慈溪市| 高安市| 阳山县| 大荔县| 永清县| 高阳县| 论坛| 沙田区| 元氏县| 延边| 乌兰县| 东乡| 左贡县| 大足县| 织金县| 瓮安县| 衡阳市| 义乌市| 鄂尔多斯市| 通化市| 巴楚县| 南岸区| 安徽省| 南投县| 化隆| 灵川县| 墨竹工卡县| 遂溪县| 襄汾县| 剑河县|