任嘉銘 謝洋 郭楠楠
(河南中醫(yī)藥大學(xué)第一附屬醫(yī)院呼吸科 呼吸疾病診療與新藥研發(fā)河南省協(xié)同創(chuàng)新中心,河南 鄭州 450000)
生存質(zhì)量研究已經(jīng)成為生物-心理-社會醫(yī)學(xué)模式下療效評價的重點。研制具有良好信度、效度的生存質(zhì)量評價量表等測評工具,是有效評價生存質(zhì)量的前提。既往多運用經(jīng)典測量理論(CTT)來篩選與測評相關(guān)量表,但存在樣本依賴性、測驗平行假設(shè)難以實現(xiàn)及難以保證測驗結(jié)果拓廣的有效性等問題〔1〕。因此,以概化理論(GT)、項目反應(yīng)理論(IRT)和計算機(jī)自適應(yīng)理論為主的現(xiàn)代測量理論研究逐漸興起。GT基本觀點在20世紀(jì)60年代末由Cronbach等提出,80年代中期GT理論內(nèi)容、術(shù)語規(guī)范、計算軟件等趨于完善。本文就GT的基本內(nèi)容與特點及其在生存質(zhì)量評價工具中的應(yīng)用進(jìn)行分析。
GT是在CTT基礎(chǔ)上采用實驗設(shè)計思想和方差分析方法,分析測量過程中變異的各種來源及其總測量的影響情況,確定測量側(cè)面對測量目標(biāo)的影響程度,并有效控制其可能產(chǎn)生的誤差〔2〕。不同的條目數(shù)可能影響量表信度,我們可以利用條目數(shù)的改變來評估量表信度,為量表研究提供依據(jù)。①主要步驟:概括度(G)研究和決策度(D)研究。G研究旨在評估特定測量技術(shù)的可靠性,而D研究依賴于G研究產(chǎn)生的證據(jù)來設(shè)計一個可靠的測量工具〔3〕。具體來講,G研究是在方差分析或多元方差分析的基礎(chǔ)上估計方差和協(xié)方差分量,并確定測量目標(biāo)和測量側(cè)面及其關(guān)系;D研究則以概化系數(shù)(Eρ2)最大化及誤差最小化為原則,綜合G研究得出的結(jié)果,分析并優(yōu)選最合適的方案,對測量進(jìn)行有依據(jù)的改進(jìn)〔4〕。G研究是D研究的基礎(chǔ),D研究是G研究的深化。②主要評價指標(biāo):信噪比(S/N)、Eρ2、可靠性指數(shù)(φ)。通過這些指標(biāo)可描述測驗的精準(zhǔn)程度,而這些相關(guān)統(tǒng)計量依賴于G研究的方差分量估計(GT分析的關(guān)鍵)。③分類:以測量情境關(guān)系為基礎(chǔ),測量目標(biāo)確定的情況下,測量側(cè)面可以有多個。若某個測量目標(biāo)的測量側(cè)面僅有一個(如p×i設(shè)計),就稱之為單側(cè)面設(shè)計。對p×i設(shè)計而言,若i為隨機(jī)側(cè)面,就叫做單側(cè)面隨機(jī)設(shè)計;若i為固定側(cè)面,則稱為單側(cè)面固定設(shè)計。另外,若測量側(cè)面大于一個,且設(shè)計類型包括交叉、嵌套或者混合,則可稱之為多側(cè)面設(shè)計〔5〕。GT包括一元GT(UGT) 和多元GT(MGT)。MGT是在UGT的基礎(chǔ)上發(fā)展起來的,繼承了UGT的基本思想,增加了協(xié)方差的信息,在信度上相比UGT有一定的優(yōu)勢。比如UGT在解決多維問題的估計時,誤差分量的估計可能會有誤差效應(yīng),此時就需要運用MGT來減小誤差。
2.1CTT 經(jīng)典測量理論的基本思想是把測驗的得分看作真分?jǐn)?shù)與誤差分?jǐn)?shù)的線性組合,其數(shù)學(xué)模型可歸結(jié)為:X=T+E(X是觀測分?jǐn)?shù),T是真分?jǐn)?shù),E是誤差分?jǐn)?shù))。CTT的信度,即測驗分?jǐn)?shù)中的真分?jǐn)?shù)與觀測分?jǐn)?shù)之間的方差比值。隨著測量設(shè)計的改變,信度系數(shù)也會隨之變化,導(dǎo)致誤差難以控制,不能有效地分離各種誤差來源。CTT推崇的嚴(yán)格平行測驗,要求過于嚴(yán)格,在測量實踐中難以達(dá)到。在相同的測量資料中,盡管測量結(jié)果推論的范圍或使用目的會有所不同,但GT提供的不同的測量誤差估計指標(biāo),可使測量更為恰當(dāng)和合理。GT用可靠性概念代替經(jīng)典測量理論傳統(tǒng)的信度概念,并用隨機(jī)平行試驗代替嚴(yán)格平行測驗,使得測量更容易實現(xiàn),并具有較好的精確性和可靠性〔6,7〕。
2.2IRT 項目反應(yīng)理論主要用于處理分?jǐn)?shù)等值和測驗項目參數(shù)、測驗和項目質(zhì)量的分析,剝離測驗情境中評委特征對測驗結(jié)果的影響及測查項目功能差異、編制適應(yīng)性測驗等。雖然IRT目前在國內(nèi)的相關(guān)研究較少〔8〕,但I(xiàn)RT作為一種新興的測量理論,其有效縮短測試時間,精確評估被試者能力的優(yōu)點使其逐漸成為研究熱點,不僅表現(xiàn)在心理和教育測量領(lǐng)域,在國內(nèi)外呼吸疾病生存質(zhì)量研究中也有相關(guān)應(yīng)用〔9〕。研究表明,在問卷設(shè)計中,IRT在處理被訪者與問項之間的實質(zhì)性關(guān)系等微觀問題時更顯出色, CTT 在處理常見的標(biāo)準(zhǔn)化測試等中觀問題時顯得方便易懂, GT 在處理對結(jié)果作推論等宏觀問題時優(yōu)勢較明顯〔10〕。見表1。
表1 三種測量理論的比較
CTT、IRT和GT各有其優(yōu)勢與不足,如果說GT是在CTT基礎(chǔ)上的擴(kuò)展與改進(jìn),那么 IRT就是通過不同的角度,分析各個項目的特征曲線和信息函數(shù)。隨著三大測量理論的優(yōu)勢互補(bǔ)和不斷發(fā)展,如今已經(jīng)成為生存質(zhì)量測評工具研制的基石。
3.1GT在評價及評定量表編制中的應(yīng)用 評價方面主要集中在人事測評、教學(xué)能力水平測評等。黎光明等〔11〕分析了GT在人事測評中的應(yīng)用現(xiàn)狀并通過與CTT的對比,表明了GT的優(yōu)勢和存在的問題??荡夯ǖ取?2〕運用GT對某公司的某次人事測評結(jié)果的評價者一致性信度進(jìn)行評估,以期發(fā)現(xiàn)該理論在人事測評研究中的應(yīng)用現(xiàn)狀。王幸君等〔13〕研究者運用GT對高校教師教學(xué)水平進(jìn)行了探究,提出了用CTT評價教學(xué)水平的弊端,相比而言,GT能夠關(guān)注每一個被測對象的特質(zhì),考慮多個測量側(cè)面,最終使評價結(jié)果更可靠。與此相關(guān)的還有包軍等〔14〕對個人臨床實際能力的測量。在評定量表編制方面,羅杰等〔15〕運用GT對大學(xué)生社會支持評定量表的信度和效度進(jìn)行評估。安哲鋒等〔16〕以音像教材為實例說明了MGT對評定量表編制的指導(dǎo)作用。
3.2GT在考試領(lǐng)域的應(yīng)用 考試領(lǐng)域方面主要用于試卷的信度和效度分析。劉燕等〔17〕運用MGT分析了英語聽說考試的信度和效度問題,結(jié)果表明英語聽說考試有較高的信度。嚴(yán)芳〔18〕用MGT分析國家公務(wù)員錄用面試中的評分者信度,結(jié)果表明了多元概化分析的優(yōu)勢,并為國家公務(wù)員錄用面試的測量設(shè)計、規(guī)范實施作出貢獻(xiàn)。與此相關(guān)的還有林絢暉〔19〕對行政職業(yè)能力測驗的GT分析及胡月星等〔20〕運用GT對結(jié)構(gòu)化面試的評分誤差進(jìn)行控制等。
3.3GT在生存質(zhì)量評價工具中的應(yīng)用 生存質(zhì)量測評方面主要用于測評量表研制、健康行為測量、測評量表評價及臨床應(yīng)用。在健康行為測量方面,Christophersen等〔21〕運用GT對健康成年人生命質(zhì)量評價問卷KINDL-N進(jìn)行了評價與分析。在質(zhì)量量表的評價及臨床應(yīng)用方面,何立國等〔22〕運用概化理論對青少年學(xué)生生活滿意度量表進(jìn)行了研究。Iramaneerat〔23〕采用p×c×i設(shè)計的GT模型,以患者、6個領(lǐng)域和18個條目作為3個側(cè)面對臨床勝任力(OSCE)量表進(jìn)行評價并證明了量表的可靠性。孟瓊等〔24〕帶領(lǐng)的研究小組運用概化理論評價癌癥患者生命質(zhì)量測定量表體系之胃癌量表的信度。潘海燕等〔25〕用GT對慢性病患者生命質(zhì)量測定量表體系共性模塊(QLICD-GM)生理、心理和社會功能3個領(lǐng)域的概化全域進(jìn)行評價,證明慢性病患者生命質(zhì)量測定量表體系共性模塊有較好的信度和效度。楊錚等〔26〕基于GT,計算各領(lǐng)域概化系數(shù)和可靠性系數(shù),證明了慢性腎衰竭患者生命質(zhì)量測定量表(QLICD-CRF)的信度。
4.1數(shù)據(jù)缺失問題 目前GT多基于完備數(shù)據(jù)進(jìn)行方差分量及其變異量的估計,往往忽視了數(shù)據(jù)缺失的問題。以隨機(jī)抽樣為模型的概化分析,其抽樣的易變性要求實測數(shù)據(jù)必須具有完備性,這樣才能保證結(jié)果的可靠性。但是當(dāng)出現(xiàn)數(shù)據(jù)缺失的情況時,后續(xù)的處理經(jīng)常會影響結(jié)果分析:記錄的刪除會導(dǎo)致可供分析的數(shù)據(jù)減少,影響統(tǒng)計分析;記錄的插補(bǔ)規(guī)則很多,可能會產(chǎn)生不同的結(jié)果。因此,要合理分析數(shù)據(jù)缺失來源,結(jié)合方差分析要求,進(jìn)行GT研究。另外,GT的方差分析可以同時考慮多個不確定度源,但在計量方法上,由于數(shù)據(jù)結(jié)構(gòu)的復(fù)雜性,方差分量估計有時還會出現(xiàn)負(fù)值〔27〕。
4.2GT與其他測量理論相結(jié)合 GT有其優(yōu)勢和潛力,隨著研究水平的提高,GT的價值也日益提升。但不可否認(rèn)其局限性依然存在,如何將概化理論和其他測量理論更好地結(jié)合與完善,并積極應(yīng)用于生存質(zhì)量測評工具的研制及評價是我們亟待思考的。