倪飛霞 黃躍師 顧艷葒 蔡婷婷 黃青梅 吳傅蕾 袁長蓉
(1.復(fù)旦大學(xué)護(hù)理學(xué)院,上海 200032;2.復(fù)旦大學(xué)附屬腫瘤醫(yī)院,上海 200032;3.復(fù)旦大學(xué)附屬上海市第五人民醫(yī)院,上海 200240)
世界衛(wèi)生組織發(fā)布的《全球癌癥報告》[1]中顯示, 我國2020年新發(fā)癌癥患者457萬人,占全球23.7%,癌癥發(fā)病率為204.8/10萬,高于全球平均水平。在漫長的治療及疾病進(jìn)展過程中,超過半數(shù)的癌癥患者會出現(xiàn)身體功能方面的問題,影響其生活質(zhì)量[2]。此外,身體功能的缺陷與跌倒的風(fēng)險增加等密切相關(guān)[3]。因此,對患者進(jìn)行身體功能評估,并及時給予相應(yīng)的干預(yù)及跟蹤隨訪將有利于改善其預(yù)后?;颊邎蟾娼Y(jié)局測量信息系統(tǒng)(patient reported outcome measurement information system,PROMIS)基于項目反應(yīng)理論(item response theory,IRT)開發(fā)并經(jīng)過大樣本的測量學(xué)檢驗,可用于慢性病人群和一般人群自我報告的癥狀及功能評估[4]。其中,身體功能簡表8b(PROMIS physical function short form 8b,PROMIS-PF-8b)是PROMIS生理健康領(lǐng)域被應(yīng)用最廣泛的量表之一。等級反應(yīng)模型又被稱為塞姆吉瑪?shù)燃壏磻?yīng)模型,該模型為雙參數(shù)模型,包含區(qū)分度和難度2個參數(shù),在該模型中,每個條目在各個等級上的難度呈單調(diào)遞增,適用于Likert型量表。本研究以IRT為指導(dǎo),分析中文版PROMIS-PF-8b在癌癥患者群體中的測量學(xué)屬性,了解該量表在癌癥群體中的適用性。
1.1一般資料 采用方便抽樣法,選取2020年11月-2022年8月復(fù)旦大學(xué)附屬腫瘤醫(yī)院和復(fù)旦大學(xué)附屬上海市第五人民醫(yī)院的癌癥患者為研究對象。納入標(biāo)準(zhǔn):(1)確診為惡性腫瘤。(2)年齡≥18歲。(3)認(rèn)知功能正常,可獨(dú)立進(jìn)行閱讀及書寫。(4)知曉病情并自愿參與本研究。排除標(biāo)準(zhǔn):病情危重或合并其他嚴(yán)重疾病,影響進(jìn)行問卷調(diào)查者?;诘燃壏磻?yīng)模型的量表檢驗要求樣本量應(yīng)>1 000例[5],故本研究共發(fā)放1 200份問卷。
1.2研究工具
1.2.1一般資料調(diào)查表 采用自制的人口學(xué)及疾病特征采集表,收集患者的性別、宗教信仰、年齡、文化程度、婚姻狀況、子女?dāng)?shù)量、主要照顧者、工作狀況、常住地、支付方式、吸煙史、飲酒史、患病時長及癌種等資料。
1.2.2中文版成人PROMIS-PF-8b PROMIS-PF-8b是PROMIS生理健康領(lǐng)域中最常用的量表,身體功能主要涉及上肢功能、下肢功能、軀干功能及日?;顒幽芰6]。本研究團(tuán)隊根據(jù)慢性病治療功能評價(functional assessment of chronic illness therapy,FACIT)翻譯方法,嚴(yán)格遵循其步驟,已完成中文版成人PROMIS-PF-8b的翻譯[7]。該量表共8個條目,采用Likert 5級評分(前4個條目:1=無法做到、2=非常困難、3=有一些困難、4=有少許困難、5=沒有任何困難;后4個條目:1=非常、2=相當(dāng)、3=有些、4=有一點(diǎn)、5=一點(diǎn)也不)??偡譃?~40分,按PROMIS對于簡表的計分要求,原始得分經(jīng)轉(zhuǎn)換后采用標(biāo)準(zhǔn)T-score(50±10),得分越高表明身體功能越好[8]。英文版PROMIS-PF-8b的Cronbach′s α系數(shù)為0.950,分半信度為0.920。
1.3.1單維性 單維性是指量表所有條目測量的都是同一潛在特質(zhì),即量表所測量的特質(zhì)是影響研究對象對條目做出相應(yīng)回答的主要因素[9]。本研究采用主成分分析方法判斷量表是否滿足單維性,若量表滿足第1因子特征根與第2因子特征根之比超過4且第1因子特征根所解釋的方差>20%時,則表明該量表符合單維性[10]。
1.3.2單調(diào)性 單調(diào)性是指研究對象正確作答的概率應(yīng)隨著其潛在特征水平的增加而增加,本研究通過量表各條目的項目特征曲線(item characteristic curve,ICC)來判斷條目的單調(diào)性[11]。若曲線單調(diào)遞增,則表明該條目符合單調(diào)性。
1.3.3區(qū)分度、難度及信息量 通過擬合模型估計各個條目的區(qū)分度、難度及信息量等,并根據(jù)其估計值評價條目質(zhì)量[12]。(1)區(qū)分度參數(shù):條目區(qū)分不同能力水平研究對象的能力,值越大表示條目對不同研究對象能力水平的鑒別能力越強(qiáng)。在ICC圖中,區(qū)分度反映了ICC曲線的斜率,一般認(rèn)為條目的區(qū)分度應(yīng)>0.50。(2)難度:又被稱為位置參數(shù),表示正確作答條目的概率為0.5的能力值點(diǎn),也就是ICC曲線的中間點(diǎn)落在能力量尺(X軸)上的位置。一般認(rèn)為條目的難度應(yīng)在區(qū)間[-3.00,3.00][13]。(3)信息量:反映各條目在估計研究對象能力時所能提供信息的確定性水平,與信度密切相關(guān)[14]。量表的信度越高,其信息量越大,測量標(biāo)準(zhǔn)誤差就越小,一般要求整個量表信息量≥16,即要求測量誤差≤0.25[13]。
1.3.4項目功能差異 項目功能差異是指具有相同能力水平但屬于不同群體的被試答對某一項目的概率有所不同,即群體關(guān)系這個變量對被試的表現(xiàn)產(chǎn)生影響,從而影響了測試的有效性[15]。本研究采用R4.2.1軟件的軟件包scDIFtest和使用multi Group 函數(shù)檢驗量表各個條目在性別與年齡上是否存在項目功能差異,P<0.05則認(rèn)為該條目存在項目功能差異。
2.1研究對象一般資料 本研究共發(fā)放1 200份問卷,回收有效問卷為1 024份,有效回收率為85.3%。見表1。
表1 研究對象一般資料(n=1 024例)
2.2量表條目得分 量表各條目的得分及條目-總分相關(guān)系數(shù),見表2。條目PFA23得分最高(4.65±0.92),條目PFA23得分最低(2.48±1.37),條目-總分相關(guān)系數(shù)為[0.68,0.88],相關(guān)較好(P<0.05)。量表的天花板效應(yīng)(0.3%)和地板效應(yīng)(2.8%)較低,可忽略。
表2 中文版PROMIS-PF-8b條目得分
2.3單維性檢驗 主成分分析結(jié)果顯示,第1因子的方差貢獻(xiàn)率為65.1%(>20%),且第1因子特征根與第2因子特征根的比值為4.38(>4),符合單維性。
2.4單調(diào)性檢驗 基于量表各個條目的項目特征曲線判斷其單調(diào)性,以條目PFA11的項目特征曲線為例,曲線單調(diào)遞增,圖中橫軸為患者的身體功能水平,縱軸為患者的選項回答情況,身體功能越好的患者,越傾向于選擇更高級別的選項。量表的所有條目均符合單調(diào)性的假設(shè)。各條目的ICC圖,見圖1(掃后文二維碼獲取)。
2.5條目區(qū)分度、難度和信息量 各條目的區(qū)分度較好,為[1.11,7.42],其中,條目PFA11和PFA53的區(qū)分度最好。各條目難度為[-1.44,2.30],條目難度適中。量表各條目的區(qū)分度和難度,見表3。Y軸表示的是信息量,X軸表示的是難度水平,量表最大信息量為34.768,最大信息量所對應(yīng)的潛在能力參數(shù)值為-1.4,量表信息量理想。
表3 各條目區(qū)分度和難度
量表整體及各條目信息量,見圖2,掃二維碼獲取圖1和圖2。
2.6項目功能差異分析 項目功能差異分析結(jié)果顯示,條目PFA53和條目PFA4在性別上存在項目功能差異,PFC12和條目PFA4在年齡上存在項目功能差異,見表4。
表4 量表項目功能差異分析
3.1中文版成人PROMIS-PF-8b在癌癥患者中具有理想的測量學(xué)屬性 本研究基于等級反應(yīng)模型對量表進(jìn)行測量學(xué)屬性分析,結(jié)果顯示,量表符合單維性和單調(diào)性的基本假設(shè),在區(qū)分度、難度及信息量等測量學(xué)屬性上表現(xiàn)較好。主成分因子分析結(jié)果顯示,第1因子的方差貢獻(xiàn)率為65.1%(>20%),且第1因子特征根與第2因子特征根的比值為4.38(>4),量表符合單維性。也可采用驗證性因子分析檢驗量表的單維度因子結(jié)構(gòu),模型擬合良好,則表示量表符合單維性[16]。本研究量表區(qū)分度范圍為[1.11,7.42],難度范圍為[-1.44,2.30],整體信息量為[0.10,34.77],最大信息量所對應(yīng)的潛在能力參數(shù)值為-1.4,信息量較好[17]。Feng等[6]在慢性病群體中檢驗了英文版成人PROMIS-PF-8b,指出該量表具有較高的內(nèi)部一致性(Cronbach′s α=0.95)和折半信度(r=0.92,P<0.001)。Van等[18]使用PROMIS-PF-8b及簡明生活質(zhì)量量表中身體功能維度評估腹部手術(shù)患者在術(shù)前(T0)、術(shù)后1周(T1)、術(shù)后3周(T2)以及術(shù)后5周(T3)的身體功能狀況,通過計算Spearman相關(guān)性分析發(fā)現(xiàn),2份量表在T0、T2和T3時間點(diǎn)得分高度相關(guān)(r>0.7),PROMIS-PF-8b具有較好的校標(biāo)效度及反應(yīng)度。
3.2中文版成人PROMIS-PF-8b在癌癥患者中的部分測量學(xué)性能尚待進(jìn)一步改善 雖然中文版成人PROMIS-PF-8b在癌癥患者中的區(qū)分度和難度等測量學(xué)性能較好,但部分條目在癌癥患者群體中存在項目功能差異。本研究檢驗了量表在癌癥患者性別及年齡上的項目功能差異,結(jié)果顯示,量表的條目PFA53和PFA4存在跨性別的測量不等價,條目PFC12和PFA4存在跨年齡的測量不等價。Feng等[6]研究結(jié)果與本研究采用條目打包技術(shù)的多組驗證性因子分析(multi-group confirmatory factor analysis, MGCFA)模型,驗證了英文版成人PROMIS-PF-8b在患有慢性病患者中的測量等價性,發(fā)現(xiàn)量表8個條目均未出現(xiàn)項目功能差異(P>0.05)。原因可能是中西方文化的差異,使得患者對這些條目表述的理解不相同。盡管前期中文版的引進(jìn)嚴(yán)格按照 FACTI的翻譯方法進(jìn)行,但也可能存在部分條目用詞不夠準(zhǔn)確的問題,提示今后可能還需要對以上條目開展認(rèn)知性訪談,再次進(jìn)行中文用詞上的修訂和完善。
3.3本研究的局限性 (1)本研究的橫斷面設(shè)計僅收集了癌癥患者單個時間點(diǎn)的測評數(shù)據(jù),今后應(yīng)增加患者不同時間點(diǎn)的癥狀評估數(shù)據(jù)收集,以評價量表在不同時間節(jié)點(diǎn)的反應(yīng)度。(2)本研究樣本來自華東地區(qū),具有明顯的區(qū)域特征;研究對象均為住院患者,未進(jìn)行治療期和非治療期癌癥患者的已知組別效度分析。(3)在今后的研究中可進(jìn)一步完善以上不足,豐富樣本,提高中文版成人PROMIS-PF-8b的適用性。(4)跨文化等價性是PROMIS這一國際標(biāo)準(zhǔn)化的量表進(jìn)行國際推廣應(yīng)用的重要前提,中文版成人PROMIS-PF-8b的跨文化測量等價性的檢驗有待完善。
綜上所述,本研究通過大樣本的資料收集,在癌癥患者群體中評價了中文版成人PROMIS-PF-8b的測量學(xué)性能。總體上,量表在癌癥患者中的測量學(xué)性能較好,適用于中國癌癥患者人群,也可嘗試用于其他慢病人群,并借助PROMIS統(tǒng)一的度量標(biāo)準(zhǔn)實(shí)現(xiàn)與不同國家及地區(qū)相關(guān)研究數(shù)據(jù)的比較。