AbstractObjective:ToevaluatetheasessmenttolsformentalhealthliteracyamongadultsinChinaandprovidereferenceforte selectionandevelopmentofigualityassessmenttolsformentalhealthitracyMetos:Acomputerbasedsystematicarchas conducted inKI,WanfangData,VI,hinaBiology Medicine(inoMed),ubMed,WebofSience,EMbase,andCAHfor literaturesrelatedtoemeasuremenproprtofmentalealthiterac.eretrealtlitwasfrotablishmentofttabass toAugust24osesdepeentlyeedtlieaturesmmardotiodaatedhud using theConsensus-basedStandards forthe SelectionofHealth Measurement Instruments(COSMN).Finally,therecommendation gradesandopiosereforedResults:Atotalofpaperswereicudednvolingsessmenttolsformentalalthlieacy. Amongthem,thecontentvalidityasnotreportedin2paper,tehothesstestingofostructvalidityasotreporedi5paprsthe stabilitywas noteportedinpapers,tecriterionvdityasotreportedi9papers,themeasurementeroandresponsiveswere noteportedinalldtouaiepodiolppsofsilld, andtherecommendationopionsereallClassBrecommendatiosConclusios:Thequestionnaireonmentalealthliteracyofinese adultsndthequestionnaireonmentalhealthliteracyofresidentscanbetentativelyrecommended.Inthefuture,guidedbyCOMIN, high-qualityaessmenttoolsformentalhathliteracysuitablefortheChinesepopulationcanbecontiuouslyimprovedordeveloped. Attentionshouldbepaidtotereportingors,layingthefoundationforresearcerstoslectandapplyappropatetolstoaurately measure the mental health literacy level of the target population.
KeywordsCOSMIN; mental health literacy; evaluation tool; measurement atribute; systematic review
摘要目的:評價我國成人心理健康素養(yǎng)的測評工具,為選擇和開發(fā)高質(zhì)量心理健康素養(yǎng)評估工具提供參考。方法:計算機(jī)系統(tǒng)檢索中國知網(wǎng)、萬方數(shù)據(jù)庫、維普、中國生物醫(yī)學(xué)文獻(xiàn)數(shù)據(jù)庫(SinoMed)、PubMed、Webof Science、EMbase、CINAHL中與心理健康素養(yǎng)測量學(xué)屬性相關(guān)的文獻(xiàn),檢索時限為建庫至2023年8月24日;由2名研究者獨立篩選文獻(xiàn)、歸納信息,并應(yīng)用基于共識的健康測量工具避選標(biāo)準(zhǔn)(COSMIN)對納入文獻(xiàn)進(jìn)行評價,最終形成推薦等級和意見。結(jié)果:共納入11篇文獻(xiàn),涉及11個心理健康素養(yǎng)測評工具,其中2項研究未報告內(nèi)容效度,5項研究未報告結(jié)構(gòu)效度的假設(shè)檢驗,6項研究未報告穩(wěn)定性,9項研究未報告效標(biāo)效度,所有研究均未報告測量誤差和反應(yīng)度,僅1項研究報告了跨文化效度,納入的研究均存在一定偏倚風(fēng)險,推薦意見均為B類推薦。結(jié)論:中國成人心理健康素養(yǎng)問卷和居民心理健康素養(yǎng)問卷暫可被推薦。未來可以COSMIN為指導(dǎo)繼續(xù)改良或開發(fā)適用于我國人群的高質(zhì)量心理健康素養(yǎng)測評工具,注重報告規(guī)范,為研究人員選擇和應(yīng)用合適的工具,精準(zhǔn)測量目標(biāo)人群的心理健康素養(yǎng)水平奠定基礎(chǔ)。
關(guān)鍵詞基于共識的健康測量工具避選標(biāo)準(zhǔn)(COSMIN);心理健康素養(yǎng);測評工具;測量屬性;系統(tǒng)評價doi:10.12102/j.issn.1009-6493.2025.13.012
據(jù)世界衛(wèi)生組織(WHO)統(tǒng)計,全球約10億人正遭受心理精神障礙的困擾[1]。心理精神障礙的復(fù)發(fā)率、致殘率和自殺率均較高,常給病人、家庭和社會帶來沉重負(fù)擔(dān)2。我國精神衛(wèi)生調(diào)查數(shù)據(jù)顯示,18歲以上人群的抑郁癥、精神分裂癥及雙相障礙的終生患病率分別為 3.40%,0.59%,0.57%[3] 。即便如此,因心理健康問題尋求專業(yè)幫助的人群比例低,主要原因之一就是心理健康素養(yǎng)嚴(yán)重不足[4]。近年來,我國加強了對提升心理健康素養(yǎng)的重視,《“健康中國2030”規(guī)劃綱要》《健康中國行動(2019一2030)》均明確要求提升居民心理健康素養(yǎng)。心理健康素養(yǎng)這一概念是由Jorm等[5于1997年首次提出,指有關(guān)心理健康的知識和態(tài)度,有助于人們認(rèn)識、管理和預(yù)防心理健康問題。自前,心理健康素養(yǎng)的測評工具研究雖發(fā)展迅速,但質(zhì)量卻參差不齊,限制了研究者選擇合適的測評工具?;诠沧R的健康測量工具遴選標(biāo)準(zhǔn)(Consensus-BasedStandards forthe Selectionof Health MeasurementInstrument,COSMIN)用于評價現(xiàn)有的病人報告結(jié)局測量工具(Patient Reported Outcome Measures,PROMs)的測量性能及研究質(zhì)量,提出推薦意見,從而幫助研究者選擇合適的測評工具[6-7]。國內(nèi)已有學(xué)者應(yīng)用COSMIN對病人報告結(jié)局相關(guān)工具進(jìn)行評價[8-10],但仍處于起步階段。此外,雖然部分學(xué)者回顧了心理健康素養(yǎng)的測評工具[11-12],,但存在缺乏規(guī)范系統(tǒng)的評定標(biāo)準(zhǔn)或是未納人近幾年開發(fā)的新工具等問題。因此,本研究采用COSMIN對我國成人心理健康素養(yǎng)測評工具研究的方法學(xué)質(zhì)量和工具的測量屬性進(jìn)行系統(tǒng)評價,并形成推薦意見,旨在篩選出高質(zhì)量的測評工具,為心理健康素養(yǎng)測評工具的應(yīng)用、開發(fā)和推廣提供循證證據(jù)。
1 資料與方法
1.1文獻(xiàn)的納入和排除標(biāo)準(zhǔn)
納入標(biāo)準(zhǔn):1)研究對象為年齡 ?18 歲的成年人;2)研究內(nèi)容涉及心理健康素養(yǎng)測評工具的任意一項測量屬性的評估;3)評估方式為自評;4)語言為中英文。排除標(biāo)準(zhǔn):1)測評工具僅作為現(xiàn)況調(diào)查、隨機(jī)對照研究等的結(jié)局指標(biāo)的測量;2)文獻(xiàn)類型為計劃書、會議論文、個案研究、綜述、社論等;3)重復(fù)發(fā)表、不能獲取全文的文獻(xiàn)。
1.2 檢索策略
采用主題詞與自由詞相結(jié)合并搭配截詞符的方法,經(jīng)過文獻(xiàn)回顧及課題組討論,確定中文檢索詞為心理健康素養(yǎng)、心理衛(wèi)生素養(yǎng)、心理素養(yǎng)、精神衛(wèi)生素養(yǎng)、精神健康素養(yǎng)、工具、測*、檢*、問卷、量表、效度、信*度、系數(shù)、內(nèi)*一致性、反應(yīng)度。英文檢索詞為:“mentalhealthliteracy”“psychological literacy”\"MHL\"\"instrumentation\"“tool\"\"screening\"\"questionaire\"\"scale\"\"assessment\"\"measure*”“reliab*”“valid*”\"internal consistency”“responsiveness\"“Cronbach”“ ICC”\"cross-cultural equivalence”\"psychometr*”等。計算機(jī)系統(tǒng)檢索中國知網(wǎng)、萬方數(shù)據(jù)庫、維普、中國生物醫(yī)學(xué)文獻(xiàn)數(shù)據(jù)庫(SinoMed)、PubMed、WebofScience、EMbase、CINAHL中與心理健康素養(yǎng)測量學(xué)屬性相關(guān)的文獻(xiàn),檢索時限為建庫至2023年8月24日。中文數(shù)據(jù)庫以萬方數(shù)據(jù)庫為例,檢索式為:(題名或關(guān)鍵詞:“心理健康素養(yǎng)OR心理衛(wèi)生素養(yǎng)OR心理素養(yǎng)OR精神衛(wèi)生素養(yǎng)OR精神健康素養(yǎng)\"AND(題名或關(guān)鍵詞:“工具OR測 * OR檢*OR問卷OR量表OR效度OR信*度OR系數(shù)OR內(nèi)*一致性O(shè)R反應(yīng)度\")。本研究參考COSMIN推薦的PubMed數(shù)據(jù)庫過濾器的檢索式,并參考相關(guān)文獻(xiàn)后確定最終的檢索式。以PubMed數(shù)據(jù)庫為例,檢索策略如下。
#1\"mental health literacy\"[Title/Abstract] OR \"psychological literacy\"[Title/Abstract]OR \"MHL\"[Title/Abstract]
#2 (instrumentation[sh] OR methods[sh] OR \"validation stud*”[pt] OR \"comparative study\"[pt] OR \"psychometrics\" [MeSH] OR psychometr*[tiab] OR clinimetr*[tw] OR clinometr* [tw] OR \"patient reported outcome measures\"[MeSH] OR \"health care outcome assessment\"[tw] OR \"outcome measure*\"[tw] OR \"observer variation\"[MeSH] OR \"observer variation\"[tiab] OR \"Health Status Indicators\"[Mesh] OR \"reproducibility of results\" [MeSH] OR reproducib*[tiab] OR \"discriminant analysis\"[MeSH] ORreliab*[tiab] OR unreliab*[tiab] OR valid*[tiab] OR \"coefficient ofvariation\"[tiab] OR coefficient[tiab] OR homogeneity[tiab] OR homogeneous[tiab] OR \"internal consistency\"[tiab] OR (cronbach* [tiab]AND(alpha[tiab] OR alphas[tiab])) OR (item[tiab] AND (correlation*[tiab] OR selection*[tiab] OR reduction*[tiab])) OR agreement[tw] OR precision[tw] OR imprecision[tw] OR \"precise values\"[tw] OR test-retest[tiab] OR (test[tiab] AND retest[tiab]) OR (reliab*[tiab]AND (test[tiab]OR retest[tiab])OR stability[tiab] ORinterrater[tiab] OR inter-rater[tiab] OR intrarater[tiab] OR intra-rater [tiab]OR intertester[tiab] OR inter-tester[tiab] OR intratester [tiab]OR intra-tester[tiab] OR interobserver[tiab] OR inter-observer [tiab]OR intraobserver[tiab]OR intra-observer[tiab] OR intertechnician [tiab] OR inter-technician[tiab] OR intratechnician[tiab] OR intra-technician [tiab]OR interexaminer[tiab]OR interexaminer[tiab] OR intraexaminer [tiab]OR intra-examiner[tiab]OR interassay[tiab]OR inter-assay [tiab]OR intraassay[tiab] OR intra-assay[tiab] OR interindividual[tiab] OR inter-individual[tiab] OR intraindividual[tiab] OR intra-individual [tiab]OR interparticipant[tiab] OR inter-participant[tiab] OR intraparticipant[tiab] OR intra - participant[tiab] OR Kappa[tiab] ORKappa's[tiab] OR Kappas[tiab] OR repeatab*[tw] OR((replicab* [tw] OR repeated[tw]) AND (measure[tw] OR measures[tw] OR findings[tw] OR result[tw] OR results[tw] OR test[tw] OR tests [tw]))OR generaliza*[tiab] OR generalisa*[tiab] ORconcordance [tiab]OR (intraclass[tiab] AND correlation*[tiab]) OR discriminative [tiab]OR \"known group\"[tiab] OR \"factor analysis\"[tiab] OR \"factor analyses\"[tiab] OR \"factor structure\"[tiab] OR \"factor structures\" [tiab]OR dimension*[tiab] OR subscale*[tiab]OR (multitrait [tiab]AND scaling[tiab]AND (analysis[tiab] OR analyses[tiab])) OR\"item discriminant\"[tiab] OR \"interscale correlation*\"[tiab] ORerror[tiab]OR errors[tiab] OR \"individual variability\"[tiab] OR \"interval variability\"[tiab]OR \"rate variability[tiab]OR (variability [tiab]AND (analysis[tiab] OR values[tiab]) OR(uncertainty[tiab] AND (measurement[tiab] OR measuring[tiab])) OR \"standard error of measurement\"[tiab] OR sensitiv*[tiab] OR responsive*[tiab] OR(limit[tiab]AND detection[tiab]) OR \"minimal detectable concentration\"[tiab] OR interpretab*[tiab] OR((minimal[tiab] OR minimally[tiab]ORclinical[tiab] ORclinically[tiab])AND (important [tiab]OR significant[tiab] OR detectable[tiab]) AND (change[tiab]
ORdifference[tiab]))OR(small*[tiab]AND(real[tiab]OR detectable[tiab])AND(change[tiab]ORdifference[tiab]))OR \"meaningfulchange\"[tiab]OR\"ceilingeffect\"[tiab]OR \"floor effect\"[tiab] OR \"Item response model\"[tiab] OR IRT[tiab]OR Rasch[tiab]OR \"differential item functioning\"[tiab]ORDIF[tiab] OR\"computeradaptivetesting\"[tiab]OR\"itembank\"[tiab]OR \"cross-cultural equivalence\"[tiab])
#3 #1 AND #2
1.3文獻(xiàn)篩選與資料提取
將檢索到的文獻(xiàn)導(dǎo)人EndNoteX9去重,由2名經(jīng)循證護(hù)理和心理測量學(xué)培訓(xùn)的碩士研究生獨立篩選文獻(xiàn)并提取文獻(xiàn)信息,如遇分歧由第3名研究者介入?yún)f(xié)商后確定。提取的文獻(xiàn)信息包括年份、地區(qū)、第一作者、量表名稱、目標(biāo)人群、維度或條目數(shù)、評分方法、樣本量、重測時間、測量屬性。
1.4 質(zhì)量評價
1.4.1 質(zhì)量評價流程
由2名經(jīng)過循證護(hù)理及心理測量學(xué)培訓(xùn)的碩士研究生依據(jù)COSMIN共識,評價文獻(xiàn)中應(yīng)用測評工具的方法學(xué)部分、測量屬性和證據(jù)等級,隨后交叉評價結(jié)果,當(dāng)發(fā)生分歧時由第3名研究者介入后協(xié)商處理。
1.4.2 評價內(nèi)容
1.4.2.1COSMIN方法學(xué)質(zhì)量評價
本研究應(yīng)用COSMIN中的偏倚風(fēng)險清單進(jìn)行評價,內(nèi)容包括PROMs的開發(fā)(35個條目)、內(nèi)容效度(31個條目)結(jié)構(gòu)效度(4個條目)、內(nèi)在一致性(5個條目)、假設(shè)檢驗(7個條目)效標(biāo)效度(3個條目)穩(wěn)定性(8個條目)跨文化效度(13個條目)、測量誤差(6個條目)反應(yīng)度(13個條目)。各板塊的每個條目均以很好(V)、良好(A)不清楚(D)不合格(I評價,遵從最低分評價原則。
1.4.2.2 COSMIN測量學(xué)屬性評價
COSMIN共有3個維度(信度、效度、反應(yīng)度)、9種測量學(xué)屬性,其中信度包括內(nèi)部一致性、穩(wěn)定性、測量誤差,效度包括內(nèi)容效度、構(gòu)念效度(包含結(jié)構(gòu)效度、假設(shè)檢驗、跨文化效度)效標(biāo)效度。評價結(jié)果分為3個等級,分別為充分 (+) 、模糊(?)不充分(一)。
1.4.2.3 證據(jù)等級評價
采用COSMIN推薦的改良版證據(jù)分級評價方法(The Grading of Recommendations Assessment DevelopmentandEvaluation,GRADE)[13]綜合評價納入研究的測量屬性。先將每項研究默認(rèn)為“高質(zhì)量”,然后根據(jù)偏倚風(fēng)險、不一致性、不精確性、間接性4方面內(nèi)容對證據(jù)質(zhì)量進(jìn)行降級,最后用“高”\"中”“低”“極低\"4個等級評價證據(jù)質(zhì)量,根據(jù)客觀評價結(jié)果形成推薦意見,并標(biāo)注推薦強度。若內(nèi)容效度為“充分”,且量表內(nèi)在一致性等級不低于“低\"級別,推薦等級可評為“A級”(推薦使用);若內(nèi)容效度為“不充分”,則推薦等級評為“C級”(不推薦使用);若測評工具既非“A級”也非“C級”,有一定應(yīng)用潛力,未來有開展更多研究的空間,需進(jìn)一步評價測量屬性,則推薦等級評為\"B級”。
2結(jié)果
2.1文獻(xiàn)篩選結(jié)果
本研究共檢索到相關(guān)文獻(xiàn)2267篇(中文文獻(xiàn)544篇,英文文獻(xiàn)1723篇),去重后余163篇。根據(jù)文獻(xiàn)的納人和排除標(biāo)準(zhǔn)篩選后,最終共納人11篇文獻(xiàn)[14-25]。文獻(xiàn)篩選流程見圖1。
2.2納入文獻(xiàn)的基本特征
本研究共納入11項研究,包括11個心理健康素養(yǎng)測評工具,分別為大學(xué)生心理健康素養(yǎng)問卷(MHLQ)、中國成人心理健康素養(yǎng)問卷(MHLQ)中文版心理健康素養(yǎng)量表(C-MHLS)、中文版心理健康素養(yǎng)量表(MHLS-C)、多維心理健康素養(yǎng)量表(MMHLS)、青少年心理健康素養(yǎng)評定問卷(AMHLAQ)已婚婦女心理健康素養(yǎng)量表(MHLS)、修訂版多維心理健康素養(yǎng)量表(MMHLS-C)、衛(wèi)生保健專業(yè)學(xué)生心理健康素養(yǎng)量表(MHLS-HS)漢化版心理健康素養(yǎng)量表(MHLS)和居民心理健康素養(yǎng)問卷(MHLQ)。納人文獻(xiàn)的一般信息見表1。
2.3我國成人心理健康素養(yǎng)測評工具相關(guān)研究方法學(xué)質(zhì)量和測量學(xué)屬性評價
納入研究的方法學(xué)質(zhì)量及測量學(xué)屬性評價結(jié)果詳見表2。
2.3.1 PROMs的開發(fā)
由于5項研究[16-18.22.24]是將國外的心理健康素養(yǎng)測評工具翻譯漢化后進(jìn)行檢驗,因此PROMs開發(fā)過程的評價不適用。其余研究在PROMs開發(fā)過程方面均不佳,主要評定結(jié)果為“有問題”“不合格”。主要原因體現(xiàn)在以下方面:1)未做認(rèn)知性訪談或預(yù)試驗;2)樣本缺乏代表性;3)條目的來源僅從文獻(xiàn)和專家層面,未從研究對象處獲?。?)未說明是否所有條目都以最終形式進(jìn)行了測試;5未說明訪談是否錄音并逐字轉(zhuǎn)錄;6)未說明定性資料的分析方法;7)未說明是否由兩名研究者參與分析等研究細(xì)節(jié);8)不清楚是否雇用了有經(jīng)驗的主持人/訪談?wù)撸?)未說明使用的數(shù)據(jù)分析方法。
2.3.2 內(nèi)容效度
9項研究[14-16,18-19,21-24]報告了內(nèi)容效度,其中7項研究[14-16.19,21.23-24]采用專家咨詢法來評價工具的內(nèi)容效度,5項研究[14-16.22-23]除專家咨詢法外,還收集了來自研究對象的看法,5項研究[14,18-19,23-24]應(yīng)用了訪談法、4項研究[14-15,23-24]應(yīng)用了問卷調(diào)查法來評價內(nèi)容效度,其余研究未說明采用訪談法或調(diào)查法進(jìn)行評價。在應(yīng)用訪談法的研究中均未明確說明在評估內(nèi)容效度時(如質(zhì)性訪談)的過程和細(xì)節(jié),包括有無錄音并逐字轉(zhuǎn)錄、有無雇用有經(jīng)驗的主持人或訪談?wù)摺⑹欠袷且粚σ贿M(jìn)行、資料分析方法以及是否至少有2名研究者參與資料分析等。此外,研究對內(nèi)容效度的相關(guān)性、全面性和可理解性描述得不夠清晰和全面,因此,大部分研究的方法學(xué)質(zhì)量被評為“有問題的”,測量學(xué)特性被評為“模糊”。
2.3.3 結(jié)構(gòu)效度
2項研究[15-16]應(yīng)用了項目反應(yīng)理論(IRT),8項研究[14,17,19,21-25]采用了經(jīng)典測量理論(CTT),1項研究[18]結(jié)合了上述兩種理論。納入的研究中有10項研究[14-19,21-224-25]進(jìn)行了驗證性因子分析來評估測評工具的結(jié)構(gòu)效度,1項研究24僅進(jìn)行了探索性因子分析,但無其他方法學(xué)缺陷,因此方法學(xué)部分評為“合格”,其余研究的方法學(xué)樣本量充足,因此均評為“非常好”。5項研究[14,17,19,21,23]的比較擬合 lt;0.95 ,故結(jié)構(gòu)效度的測量特性評為“不合格”,1項研究[15結(jié)構(gòu)效度結(jié)果中的標(biāo)準(zhǔn)化殘差均方根(SRMR) gt;0.08.1 項研究[22]結(jié)果中的近似誤差均方根(RMSEA)為0.06,不符合COSMIN標(biāo)準(zhǔn),故測量特性評為“不充分”,其余3項研究[18.24-25]的結(jié)果達(dá)到COSMIN要求,故測量特性評為“充分”。
2.3.4 內(nèi)在一致性
納人的所有研究均采用了Cronbach'sα系數(shù)來表示工具的內(nèi)在一致性。1項研究[24]未報告分量表的內(nèi)在一致性,因此方法學(xué)評為“不合格”。6項研究[14,16,18-19,22報告的Cronbach's α系數(shù)均 ?0.7 ,且無其他方法學(xué)缺陷,因此,內(nèi)在一致性方法學(xué)評為“非常好”,測量學(xué)屬性質(zhì)量評為“充分”,其余工具由于個別維度的Cronbach'sα系數(shù) lt;0.7 ,因此評為“不充分”。
2.3.5 結(jié)構(gòu)效度的假設(shè)檢驗
6項研究[15-18.22-23]報告了結(jié)構(gòu)效度的假設(shè)檢驗。方法學(xué)方面,其中3項研究[17.22-23]盡管對照測評工具有足夠的測量特性,但不確定這些特性是否適用于研究人群,因此方法學(xué)評為“合格”。其余3項研究[15-16.18]符合COSMIN標(biāo)準(zhǔn),因此,評為“非常好”。測量特性方面,3項研究[17.2-23]由于未提出假設(shè),測量特性評為\"模糊”,其余3項研究[15-17提出了假設(shè)并且結(jié)果符合假設(shè),測量特性評為“充分”。
2.3.6 穩(wěn)定性
5項研究[15-16,18.21-22]報告了測評工具的穩(wěn)定性,其中2項研究[15-16]計算了組內(nèi)相關(guān)系數(shù)(ICC)。3項研究[18.21-22]未明確說明重測信度的計算方法、測量間隔期間病人是否穩(wěn)定、測量時的測量條件是否相似,且重測信度結(jié)果 lt;0.7,1 項研究[5的時間間隔不符合COSMIN要求,未說明給出時間間隔的說明,且ICC結(jié)果 lt;0.7 因此方法學(xué)評為“有問題的”,測量特性評為“不充分”。1項研究的ICC結(jié)果 gt;0.7 ,且無其他方法學(xué)缺陷,故方法學(xué)和測量屬性評為“非常好”“充分”。
2.3.7 跨文化效度/測量不變性
納入的研究中僅1項研究[18報告了跨文化效度,研究者用項目功能差異分析(differentialitemfunction,DIF)進(jìn)行了跨文化效度檢驗,方法和樣本量合適,方法學(xué)評為“非常好”。但在研究結(jié)果中發(fā)現(xiàn)“性別\"這一重要差異,因此測量特性評為“不充分”。
2.3.8 效標(biāo)效度
納人研究中共2項研究[17,21]報告了效標(biāo)效度。目前,心理健康素養(yǎng)尚未檢索到金標(biāo)準(zhǔn),根據(jù)COSMIN共識,簡版工具可用原工具作為金標(biāo)準(zhǔn)來檢驗效標(biāo)效度。漢化而來的工具由于原工具非本土語言,因此無法將原工具作為效標(biāo)工具。1項研究對漢化而來的工具進(jìn)行信效度檢驗,將領(lǐng)域內(nèi)公認(rèn)的心理韌性量表(14ItemsResilienceScale,RS-14)作為效標(biāo)工具,方法學(xué)評為“合格”,測量特性評為“不充分”。另一項工具開發(fā)類研究21將焦慮、抑郁量表作為效標(biāo)工具,不符合COSMIN要求,方法學(xué)評為“不合格”,測量特性評為“不充分”。
2.4納入測評工具的證據(jù)等級評價及推薦意見
本研究納入的11個測評工具的內(nèi)容效度均不符合“充足”的要求,多數(shù)研究的內(nèi)容效度為低質(zhì)量證據(jù),故無A類證據(jù)推薦。此外,效標(biāo)效度均為低質(zhì)量或極低質(zhì)量證據(jù)。所有研究均有一定的應(yīng)用潛力,予以B類推薦,其中,中國成人心理健康素養(yǎng)問卷共60個條目,其內(nèi)容效度相對于其他研究而言證據(jù)質(zhì)量稍優(yōu),且該問卷是根據(jù)我國國情和文化特點的新概念框架下進(jìn)行編制,具有一定科學(xué)性[15]。居民心理健康素養(yǎng)問卷共16個條目,適用于快速篩查,具有簡單、省時的特點,但問卷有待改良,其測量學(xué)指標(biāo)有待進(jìn)一步驗證,如內(nèi)容效度驗證過程描述不充分、Cronbach'sα系數(shù) lt; 0.7等[25]。因此,經(jīng)權(quán)衡后認(rèn)為上述2個測評工具可暫被推薦使用。見表3。
3討論
3.1我國成人心理健康素養(yǎng)測評工具的內(nèi)容效度及其他結(jié)果報告質(zhì)量和完整性亟待提高
盡管我國研究者開發(fā)和改編了適用于不同成年人群的工具,但質(zhì)量參差不齊。首先,內(nèi)容效度方面,內(nèi)容效度是評價測評工具優(yōu)先考慮的指標(biāo)[26],但納人的研究主要側(cè)重于專家層面的意見,而忽視了來自研究對象的看法和意見。條目形成的權(quán)威性、科學(xué)性固然重要,但事實上測評工具最終需要在研究對象中進(jìn)行應(yīng)用,因此來自研究對象的感受也不容忽視,未來有待加強對研究對象進(jìn)行質(zhì)性研究(如認(rèn)知性訪談)的重視,從而提升測評工具內(nèi)容效度相關(guān)性、全面性、可理解性結(jié)果報告的完整性。此外,納入研究的共性問題在于均未清晰描述質(zhì)性研究或是調(diào)查法來驗證內(nèi)容效度的過程,如質(zhì)性研究中是否由有經(jīng)驗的專業(yè)人士來擔(dān)任訪談?wù)?、訪談是否基于恰當(dāng)?shù)脑L談提綱、訪談是否錄音并逐字轉(zhuǎn)錄等;調(diào)查中每個條目是否在適當(dāng)數(shù)量的研究對象(其中樣本量 ?50 可評為“非常好”中進(jìn)行測試等,因此,很大程度上影響了內(nèi)容效度的報告和測量屬性的質(zhì)量。其次,穩(wěn)定性方面,COSMIN建議,重測信度的時間間隔一般為2周,但有3項研究[15.18.22]的重測時間間隔分別為3、4、6周,不符合COSMIN要求,也未給出設(shè)定該時間間隔的原因。時間間隔過長或過短可能會影響對工具重測信度的判斷,從而高估或低估重測信度的結(jié)果2,因此,今后需要注重設(shè)定重測信度時間間隔的規(guī)范性。跨文化效度方面,僅1項研究[18報告了跨文化效度。跨文化效度是在不同文化群體中應(yīng)用工具測量時各條目得分的一致程度,主要通過計算測評工具的測量不變性或項目功能差異進(jìn)行評估。納入的研究中有6項研究[16-18.22-24]引進(jìn)國外或參考了國外的測評工具,但未進(jìn)行跨文化效度的檢驗,由于文化背景和人群差異的影響,可能會給測試結(jié)果帶來誤差,測評工具在不同國家、不同人群中的適用性仍有待商榷。因此,對于漢化而來的工具,進(jìn)行跨文化效度的檢驗尤為重要。綜上,研究者在未來應(yīng)當(dāng)依據(jù)COSMIN注重完善研究細(xì)節(jié),從而提升報告的完整性和質(zhì)量。
3.2我國成人心理健康素養(yǎng)測評工具測量學(xué)屬性報告的全面性有待加強
納入的研究多是有選擇性地報告測評工具的測量學(xué)屬性,報告結(jié)果并不全面,缺乏系統(tǒng)的報告體系,且對于未報告的屬性也并未作出合理、詳細(xì)的解釋說明。本研究納入的文獻(xiàn)均未報告測量誤差和反應(yīng)度。測量誤差包含系統(tǒng)誤差和隨機(jī)誤差,是研究對象真實變異之外的其他變異產(chǎn)生的原因[28]。重視測量時間間隔的合理性和所測構(gòu)念的穩(wěn)定性,可提高測評結(jié)果的準(zhǔn)確性[29]。反應(yīng)度主要反映測評工具的敏感性,用于檢驗測評工具能否區(qū)分出不同群體或是同一群體不同階段變化的水平[30]。測量學(xué)屬性報告不全可能會對測評工具的信度和效度造成負(fù)面影響。例如,未報告測量誤差可能會掩蓋測評工具在不同子群體中的差異性,而未報告反應(yīng)度可能會限制測評工具在檢測隨時間變化的性能。故全面評估和報告這些屬性對于確保測評工具的科學(xué)性和實用性至關(guān)重要。推測報告的不全面可能與研究設(shè)計的限制、資源的有限性或與研究者的偏好等有關(guān)。未來研究者在開發(fā)或檢驗測評工具時,應(yīng)盡可能依據(jù)COSMIN共識中要求報告的測量屬性,以提升研究的完整性和科學(xué)性。此外,若在研究中,某項測量指標(biāo)不適用或未報告,研究者應(yīng)當(dāng)給出合理理由予以補充說明,便于讀者進(jìn)行評價和應(yīng)用。
3.3中國成人心理健康素養(yǎng)問卷和居民心理健康素養(yǎng)問卷可暫被推薦,但仍需進(jìn)一步改良和驗證
本研究納入的所有工具的推薦意見均為B級推薦。其中,中國成人心理健康素養(yǎng)問卷基于我國國情和文化特點構(gòu)建新概念框架后,以此為基礎(chǔ)形成條目,內(nèi)容效度方面相較于其他工具而言尚完善,內(nèi)容效度的驗證人群來源豐富,不僅采納了不同專業(yè)領(lǐng)域的專家意見,還收集了來自研究對象的意見。該問卷共60個條目,包含了心理健康知識、心理疾病知識、心理健康態(tài)度、心理疾病態(tài)度、心理健康促進(jìn)行為和心理疾病應(yīng)對行為6個維度,假設(shè)檢驗和效標(biāo)效度結(jié)果較佳,內(nèi)部一致性尚可,除跨文化效度、效標(biāo)效度、反應(yīng)度外,其余測量屬性均報告,綜合考慮后暫予以推薦。另外,居民心理健康素養(yǎng)問卷共16個條目,包含心理學(xué)知識、對心理障礙病人的污名、對心理問題的知識、求助效能4個維度,條目簡單,用時少,可用于快速篩查,具有一定的應(yīng)用潛力,但有諸多測量屬性報告不全,包括內(nèi)容效度、穩(wěn)定性、假設(shè)檢驗、效標(biāo)效度,且內(nèi)部一致性不佳,為 0.49~0.72 ,對于問卷開發(fā)的研究細(xì)節(jié)尚存在闡述不足的問題,如形成問卷條目的過程(專家咨詢或焦點小組討論過程等)問卷的修訂過程等,因此建議未來可在原問卷框架的基礎(chǔ)上進(jìn)行進(jìn)一步優(yōu)化和改良,問卷的測量屬性有待深入發(fā)展和驗證。此外,可對研究細(xì)節(jié)部分進(jìn)行詳細(xì)闡述,避免研究者在評價過程中因模棱兩可而產(chǎn)生歧義,從而低估測評工具的質(zhì)量。上述兩種暫被推薦的心理健康素養(yǎng)測評工具尚未依據(jù)COSMIN共識進(jìn)行研究,但為了增強研究報告的完整性并確保研究過程的規(guī)范化,建議未來的研究者在對這些工具進(jìn)行優(yōu)化或開發(fā)新工具時,能夠采納COSMIN共識并作為衡量和指導(dǎo)的標(biāo)準(zhǔn),以提高心理健康素養(yǎng)測評工具的科學(xué)性和實用性。
4小結(jié)
本研究對我國成人心理健康素養(yǎng)的測評工具進(jìn)行系統(tǒng)評價后發(fā)現(xiàn),自前我國成人心理健康素養(yǎng)的測評工具存在方法學(xué)嚴(yán)謹(jǐn)性不足、測量特性報告不全的問題,測評工具整體質(zhì)量良莠不齊。經(jīng)權(quán)衡后認(rèn)為,Wu等[15]報道的中國成人心理健康素養(yǎng)問卷和陳玥[25]報道的居民心理健康素養(yǎng)問卷可暫被推薦,但仍有待改良和驗證。期待研究者未來以COSMIN共識為指導(dǎo),開發(fā)或改良高質(zhì)量的心理健康素養(yǎng)測評工具。本研究納入了我國心理健康素養(yǎng)測評工具,未來研究可對國內(nèi)外心理健康素養(yǎng)測評工具進(jìn)行比較分析,以便提出吸收國外測評工具研究優(yōu)點后的建設(shè)性意見。最后,本研究未檢索灰色文獻(xiàn),且僅納入了中英文文獻(xiàn)。因此,研究結(jié)果可能會有所欠缺,應(yīng)當(dāng)審慎看待,有待進(jìn)一步更新。
參考文獻(xiàn):
[1]FREEMAN M.The world mental health report:transforming mentalhealth for all[J].WorldPsychiatry,2022,21(3):391-392.
[2]LUJ,XUXF,HUANGYQ,etal.Prevalenceofdepressivedisorders and treatment in China:a cross-sectional epidemiologicalstudy[J].TheLancetPsychiatry,2021,8(11):981-990.
[3]HUANGYQ,WANGY,WANGH,etal.Prevalenceof mentaldisorders in China:a cross-sectional epidemiological study[J].TheLancet Psychiatry,2019,6(3):211-224.
[4]LU S R,OLDENBURG B,LI W J,et al.Population-based surveysand interventions for mental health literacy in China during 1997-2018:a scoping review[J].BMCPsychiatry,20l9,19(1):316.
[5]JORMAF,KORTENAE,JACOMBPA,et al.\"Mental healthliteracy\":a survey of the public's ability to recognise mental disordersandtheir beliefsabout theefectiveness of treatment[J].MedicalJournal of Australia,1997,166(4):182-186.
[6]PRINSENCC,MOKKINKLB,BOUTERLM,etal.COSMINguideline for systematic reviews of patient-reported outcomemeasures[J].QualityofLifeResearch,2018,27(5):1147-1157.
[7]陳祎婷,彭健,沈藍(lán)君,等.COSMIN方法介紹:結(jié)合一項系統(tǒng)評價實例進(jìn)行解讀[J].護(hù)理研究,2021,35(9):1505-1510.
[8]金錦珍,王巖,陳冉,等.基于COSMIN指南的健康老齡化測評工具的系統(tǒng)評價[J].護(hù)理學(xué)雜志,2023,38(11):97-100;108.
[9]劉素香,邊莉,張葉群,等.基于COSMIN指南對糖尿病病人健康素養(yǎng)評估工具的系統(tǒng)評價[J].中華護(hù)理雜志,2023,58(21):2670-2677.
[10]張露露,陳歡,羅歡,等.基于健康測量工具的共識標(biāo)準(zhǔn)對癌癥復(fù)發(fā)恐懼評估工具的系統(tǒng)評價[J].中國全科醫(yī)學(xué),2023,26(17):2138-2146.
[11]宋利,張慶華,尹金瑜,等.老年人心理健康素養(yǎng)研究進(jìn)展[J].護(hù)理學(xué)雜志,2022,37(7):105-109.
[12]馬曉欣,付偉.國外心理健康素養(yǎng)測量方法研究進(jìn)展[J].護(hù)理研究,2019,33(7):1186-1189.
[13]陳祎婷,沈藍(lán)君,彭健,等.改良版定量系統(tǒng)評價證據(jù)分級方法對患者報告結(jié)局測量工具的評價[J].解放軍護(hù)理雜志,2020,37(10):57-60.
[14]喬思迎.大學(xué)生心理健康素養(yǎng)的問卷編制、現(xiàn)狀調(diào)查及干預(yù)研究[D].沈陽:沈陽師范大學(xué),2023.
[15]WUJ,WANGC X,LU Y,et al.Development and initialvalidation of the Mental Health Literacy Questionnaire for Chineseadults[J].Current Psychology,2023,42(10):8425-8440.
[16]WANG A N,JIA S M,SHI Z Y,et al.Validation andpsychometric testing of theChineseversionof theMental HealthLiteracy Scaleamongnurses[J].Frontiers inPsychology,2O22,12:791883.
[17]張培培,李惠萍,李志菊.中文版心理健康素養(yǎng)量表在臨床護(hù)士中的信效度檢驗[J].職業(yè)與健康,2022,38(21):2941-2945.
[18]WANGX,LIANGW,LIUJD,et al.Further examination of thepsychometric properties of the Multicomponent Mental HealthLiteracy Scale:evidence from Chinese eliteathletes[J].InternationalJournal of Environmental Research and Public Health,2O22,19(19):12620.
[19]李丹琳,胡婕,黃雪雪,等《青少年心理健康素養(yǎng)評定量表》編制及在醫(yī)學(xué)生中的應(yīng)用[J].中國學(xué)校衛(wèi)生,2021,42(7):1038-1041.
[20]盧曉艷,王君,石安霞,等.已婚婦女心理健康素養(yǎng)量表應(yīng)用的信效度檢驗[J].中國健康教育,2022,38(10):878-881;887.
[21]盧曉艷,張志華,王君,等.已婚婦女心理健康素養(yǎng)量表的編制研究[J].中國健康教育,2021,37(10):909-914.
[22] 明志君,陳祉妍,王雅芯,等.中文版多元心理健康素養(yǎng)量表在男性軍人中信效度評價[J].中國公共衛(wèi)生,2021,37(1):86-91.
[23]CHAOHJ,LIENYJ,KAO YC,et al.Mental health literacy inhealthcare students:an expansion of the Mental Health LiteracyScale[J]. International Journal of Environmental ResearchandPublicHealth,2020,17(3):948.
[24] 馬曉欣.心理健康素養(yǎng)量表的漢化及信效度研究[D].杭州:杭州師范大學(xué),2019.
[25] 陳玥.居民心理健康素養(yǎng)問卷編制及在社區(qū)心理服務(wù)中的應(yīng)用[D].北京:中國科學(xué)院大學(xué),2019.
[26] 金瑜.心理測量[M].3版.上海:華東師范大學(xué)出版社,2023:1.
[27] MOREIRA R S L,BASSOLLI L,COUTINHO E,etal.Reproducibilityandreliabilityofthequalityoflifequestionnaireinpatientswith atrialfibrillation[J].ArquivosBrasileirosdeCardiologia,2016,106(3):171-181.
[28]彭健,沈藍(lán)君,陳祎婷,等.對COSMIN-RoB清單中測量工具穩(wěn)定性、測量誤差和效標(biāo)效度研究偏倚風(fēng)險的清單解讀[J].中國循證醫(yī)學(xué)雜志,2020,20(11):1340-1344.
[29] 閻子花,杜靜,張興梅,等.以病人安全為導(dǎo)向的延續(xù)護(hù)理測評工具系統(tǒng)評價[J].中國護(hù)理管理,2023,23(12):1817-1824.
[30]TERWEECB,DEKKERFW,WIERSINGAWM,etal.Onassessing responsiveness of health-related quality of life instruments:guidelines for instrument evaluation[J].Quality of Life Research,2003,12(4):349-362.(收稿日期:2024-04-03;修回日期:2025-06-02)(本文編輯崔曉芳)