夏安琪,李 軍,岳 玲,洪 波,嚴 峰,蘇 寧,肖世富,劉園園#,王 濤#
1.上海交通大學醫(yī)學院附屬精神衛(wèi)生中心老年精神科,上海 200030;2.上海交通大學阿爾茨海默病診治中心,上海 200030;3.安徽醫(yī)科大學附屬巢湖醫(yī)院,合肥 238000
輕度認知功能損害(mild cognitive impairment,MCI)是介于正常衰老和癡呆之間的階段,此類患者存在主觀上的記憶力下降和客觀上的認知障礙,但未達到癡呆的臨床狀態(tài)[1]。有縱向研究[2]顯示,MCI 患者的癡呆發(fā)病率為每年10%~15%,而正常人的癡呆發(fā)病率為1%~2%,因此MCI 患者是罹患癡呆的高風險人群。2018年,全球用于阿爾茨海默病防治護理的費用約為1 萬億美元。隨著人口老齡化進程不斷加深,這一數(shù)字將不斷上升[3]。由于癡呆的不可逆性,在MCI 階段即開始干預(yù)是減輕社會重擔的重要途徑[4]。一項納入41項研究的meta分析[5]表明中國55歲以上老人MCI 的患病率為12.2%,說明中國老人中受MCI影響的人群甚廣,因此早期發(fā)現(xiàn)MCI 至關(guān)重要。
在臨床實踐中許多老人認為自己的記憶力下降是正常衰老所致,因此為識別MCI 與正常老化需要進行標準化測試以提高篩查率。研究發(fā)現(xiàn),正常衰老表現(xiàn)為單詞、句子語音識別[6]以及視覺空間功能[7-8]的下降,而在命名和自我中心定向力方面無功能受損[9-10]。因此,為識別MCI 與正常衰老,在認知功能篩查測試中自我中心的定向力檢驗及命名能力必須包含在內(nèi)且應(yīng)占據(jù)較大比重。
目前臨床使用最廣泛的認知篩查測試是簡明精神狀態(tài)檢查(Mini-Mental State Examination,MMSE)。由于MMSE 存在天花板效應(yīng),故對MCI 的識別能力不足。蒙特利爾認知評估量表(Montreal Cognitive Assessment Scale,MoCA)能夠檢測出90%的MCI 受試者,是一種可廣泛用于人群篩查MCI 的評估量表[1]。自2005 年MoCA 原版量表誕生,多個不同語言地區(qū)相繼將其本土化后形成多個版本,不同語言的MoCA 在各個國家和地區(qū)表現(xiàn)出不同的敏感度和特異度,總體來說低于原版。因此,為更好地進行臨床使用,不同國家地區(qū)有必要建立適合本土文化環(huán)境的篩查量表,并需要隨時間進行修訂。
我國使用最廣泛的是由英文直譯的MoCA 北京版(下文MoCA 均指MoCA 北京版)。對北京市1 001 名社區(qū)老年人的MoCA 評估結(jié)果表明,在推薦的分界值26 分時,MoCA 的敏感度為90.4%,特異度為31.3%;當分界值降至22 分時, 敏感度為68.7%, 特異度為63.9%[11]。在我國其他地區(qū)也發(fā)現(xiàn)了同樣的高敏感度和低特異度特征[12-13]。本研究針對中國城市老人進行MoCA 的測評,依據(jù)年齡、受教育程度進行分層分析,以期為未來認知功能篩查提供建議,并界定其區(qū)分正常老人與MCI 受試者的分界值,為早期篩查MCI 提供更可靠的工具。
本研究于2011年對北京、上海、寧波、沈陽、合肥、杭州、吉安、南昌、西安、杭州等10 個城市社區(qū)老年人進行了認知功能評估調(diào)查。依據(jù)所在地2010 年全國人口普查數(shù)據(jù),在選定社區(qū)中對60 歲及以上老人進行隨機抽樣,隨機化由SPSS 軟件完成。本調(diào)查充分考慮受試者的狀態(tài)和合作程度,為保證評估的準確性,評估分2次進行以避免疲勞效應(yīng)。正常老年人(normal elderly,NE)組納入標準:①認知功能正常。②無嚴重軀體疾病。③能夠配合并完成相關(guān)檢查。MCI 組納入標準:①患者自覺存在記憶障礙,或知情者認為患者存在記憶障礙超過1 年。②整體認知功能正常。③客觀認知功能評估有記憶障礙存在,且認知功能評分低于同年齡、同文化程度的平均值1.5 個標準差。④臨床癡呆評定量表評分為0.5 分。⑤日常生活功能正常。⑥不符合癡呆診斷標準。MCI組排除標準:①各種原因所致癡呆。②抑郁障礙、精神分裂癥等重性精神疾病患者。本研究通過上海交通大學醫(yī)學院附屬精神衛(wèi)生中心倫理委員會批準,所有受試者均簽署知情同意書。
1.2.1 一般資料調(diào)查表 包含姓名、年齡、性別、民族、受教育程度、家庭住址、職業(yè)、聯(lián)系方式、生活習慣(吸煙史、飲酒史、飲茶史、運動習慣、業(yè)余愛好、睡眠習慣)等。
1.2.2 認知功能評估部分 MMSE:包括定向力(10 分)、計算能力(5 分)、瞬時記憶(3 分)、延遲記憶(3 分)、命名(2 分)、語言流暢性(1 分)、閱讀能力(1 分),表達能力(1 分),執(zhí)行能力(3 分)、視空間能力(1分),總分30分。
MoCA:包括視空間功能(5 分),命名(3 分),注意力(6 分),重復(fù)句子(2 分),流暢性(1 分),抽象能力(2 分),延遲回憶(5 分),定向力(6 分),總分30分;若被試受教育年限≤12年則總分加1分。
最終,共2 920例社區(qū)60歲及以上老人納入研究,其中NE受試者2 367例,MCI受試者553例;男性1 319例,女性1 601 例;平均年齡(70.7±7.6)歲,平均受教育年限(8.7±5.2)年。分組分布情況見表1。
表1 受試者人口學特征Tab 1 Sociodemographic characteristics of the study sample
MCI 與NE 2 組間性別、年齡、受教育程度差異均具有統(tǒng)計學意義。女性患MCI 可能性更高(χ2=13.5,P=0.000)。MCI組平均年齡為(74.1±8.0)歲,NE組平均年齡為(69.8±7.2)歲,2 組間差異具有統(tǒng)計學意義(t=12.3,P=0.000)。MCI 組平均受教育年限為(6.1±5.1)年,NE 組平均受教育年限為(9.3±5.0)年,2 組間差異有統(tǒng)計學意義(t=-13.5,P=0.000)。而不同年齡組的平均年齡在2 組間差異無統(tǒng)計學意義(均P>0.05)。不同受教育年限組除7~12 年組以外,其余組的受教育年限在MCI與NE組間差異無統(tǒng)計學意義(均P>0.05)。
NE 組總體MoCA 評分為(22.7±5.1)分。根據(jù)受教育年限(0 年、1~6 年、7~12 年、>12 年)、年齡(60~64歲、65~69 歲、70~74 歲、75~79 歲、80~84 歲、≥85 歲)和性別(男、女)對NE 組進行劃分后,各組MoCA 評估分值見表2所示。
表2 中國不同年齡、性別和受教育年限正常老人MoCA得分Tab 2 MoCA scores of normal elderly people of different ages,genders and years of education in China urban area
在多變量模型中,性別、年齡和受教育年限與MoCA總分相關(guān)(R2=0.467)(表3)。
表3 多元回歸模型中MoCA總分顯著預(yù)測因子Tab 3 Significant predictors of MoCA score in the multivariate regression model
選取數(shù)據(jù)穩(wěn)定性較好的≥60歲且<70歲年齡組按照受教育年限6年為分界對分量表得分進行分析,得到分量表得分數(shù)據(jù)如表4所示。
表4 不同受教育年限正常老人MoCA分量表分Tab 4 Sub-scale score of normal elderly of different years of education
不同受教育程度組被試在各個分量表認知域上皆存在顯著差異。總體在定向力、注意力測試部分被試表現(xiàn)較好,視空間功能、延遲回憶、句子重復(fù)及抽象能力得分率較低。被試在延遲回憶等較難題目上得分標準差較大,說明即便在正常老人中測定亦存在較大差異性,不能以某一認知域的功能下降斷定老人為MCI。
本研究中MoCA 的Cronbach′α系數(shù)為0.933??偡峙cMMSE的相關(guān)系數(shù)為0.825。采用主成分分析法進行探索性因子分析對量表的結(jié)構(gòu)效度進行評價,結(jié)果顯示,提取了5個公因子,總解釋能力>65%。旋轉(zhuǎn)成分矩陣顯示公因子1包括注意力、重復(fù)句子、流暢性、抽象能力,公因子2為定向力,公因子3為視空間結(jié)構(gòu)功能,公因子4為延遲回憶,公因子5為命名,各維度劃分比較合理。以上結(jié)果表明MoCA具有良好的信度和效度,適合用于認知功能評估。
MoCA中難度系數(shù)<0.4的問題(40%以下的被試回答正確)包括命名中的犀牛、單峰駱駝,延遲記憶中的教堂、面孔,視覺空間功能和鐘表畫實驗中的指針位置。其中,視空間功能和延遲記憶是MCI 的主要認知功能受損區(qū)域,辨別力較強。命名部分犀牛的難度系數(shù)最低,只有37%的被試回答正確。延遲回憶部分題目包括一些不符合中國文化背景的詞匯,包括天鵝絨和教堂。同時,一些題目的表達也比較書面化,例如面孔,臨床應(yīng)用中常有被試者回答為“臉”造成失分。在重復(fù)句子部分由于漢語表達方式的多樣性,在翻譯相同的短句后,有許多詞語表達相似的含義。在臨床實踐中,受試者往往出現(xiàn)添加虛詞來表達相同的意思最終造成失分。視空間功能部分難點在于交替連線題目中“甲乙丙丁戊”的使用,受教育程度較低的受試者對該表達不熟悉可造成失分。
各分測驗區(qū)分度如表5所示。視空間功能、命名、延遲回憶、注意力4 個分測驗區(qū)分度均高于0.4,證明題目設(shè)置區(qū)分度良好;定向力與流暢性分測驗區(qū)分度低于0.2,證明此2 項分測驗區(qū)分度較低,參與測驗的社區(qū)老人表現(xiàn)相對良好。
表5 不同分測驗區(qū)分度Tab 5 Degree of differentiation in subscales
本研究中,采用受試者操作特征曲線(receiver operator characteristic curve,ROC 曲線)分析(圖1)計算約登指數(shù)最高的整體最佳分界值為20 分(敏感度63.7%,特異度75.7%),曲線下面積為0.76。低年齡(≥60 歲且<70 歲)+高文化程度(>12 年)組的最佳臨界值為25(敏感度70.5%,特異度63.5%),而其他組最佳分界值波動于15~25 分之間。忽略年齡差異,較高學歷組(>6 年)推薦分界值為23 分,較低學歷組(≤6 年)為16分。
圖1 整體ROC曲線(A)及低年齡高文化程度組ROC曲線(B)Fig 1 ROC curve of total(A)and ROC curve of low age and high education level group(B)
既往多項研究中MoCA 的Cronbach's α 系數(shù)均高于0.75,說明量表內(nèi)部一致性信度良好[14-16]。同時,MoCA在重測信度與調(diào)查員信度方面均高于0.85[14,16]。在以MMSE 為檢驗校標時兩者相關(guān)性高[14,17-18],效度良好。本研究結(jié)果仍舊證實了MoCA 量表(北京版)具有良好的信度和效度。
除了證實了MoCA 量表信效度的可靠性外,我們的研究結(jié)果也與之前多項研究一致,性別、年齡和受教育程度與MoCA 評分相關(guān)。本研究中,在受教育年限超過12 年的高學歷組中,女性的MoCA 得分與男性差異無統(tǒng)計學意義,甚至在≥65 歲且<70 歲年齡組中女性表現(xiàn)更好,因此提高女性教育水平可能有助于輔助改善人群整體認知功能。在既往研究中,65 歲以上老年人的年齡每增加5歲,阿爾茨海默病的發(fā)病率即出現(xiàn)顯著上升。因此我們將2 920 例受試者按年齡分為6 組,每5 年一組,發(fā)現(xiàn)MoCA 總分隨年齡增長而下降。差距在10 年以上的各年齡組與其他年齡組MoCA 總分差距均有統(tǒng)計學意義。受教育程度是認知評估的重要影響因素,在MoCA 測評過程中,當受教育年限低于12 年時,分數(shù)應(yīng)加1 分得到最終分數(shù)。本研究中,老年人的平均受教育年限為8.7 年,NE 組平均受教育年限為9.3 年,MCI 組平均受教育年限為6.1 年;以6 年為分界線將案例分為高受教育程度組(>6 年)和低受教育程度組(≤6 年),2 組得分之間差異具有統(tǒng)計學意義。
難度分析發(fā)現(xiàn),延遲回憶的難點在于詞頻的差異。通過Google Books Ngram 進行詞頻檢索,中文詞匯詞頻來自2019 年簡體中文數(shù)據(jù)庫,英文詞匯詞頻來自2019 年英文數(shù)據(jù)庫。高頻詞匯“教堂”(英文為church),在英語國家的詞頻為0.009 07%,而漢語為0.000 99%(教堂)?!癲aisy”菊花在英語世界的詞頻為0.000 7%,而在漢語中為0.000 84%。“velvet”(天鵝絨) 在英語中的詞頻為0.000 55%,在漢語中的詞頻為0.000 02%;“面孔”中文詞頻為0.000 316%,英文為0.034%。由于詞頻的巨大差異,高頻詞匯教堂(church)和面孔(face)應(yīng)在新版本中進行修改。同時因原版MoCA 中“velvet”設(shè)計為低頻詞匯用以提高測試難度,中文“天鵝絨”則無需進行修改。通過詞頻檢測,可考慮將“面孔”替換為“手”(詞頻0.008%),“教堂”替換為“工廠”(詞頻0.006%)。在命名部分,MoCA 量表測試3種不常見動物的命名。犀牛的詞頻為0.000 048%,是其中最難的題目。而在初始設(shè)計中為檢測命名困難,題目難度較高,因此命名部分的題目無需修訂。
本研究涉及北京、上海、寧波、沈陽、合肥、杭州、吉安、南昌、西安、廣州10 個城市,推薦分界值為20 分(敏感度63.7%,特異度75.7%),該結(jié)果相對于原版量表敏感度及特異度均較低。在以往研究中,不同的國家使用各自語言的MoCA 版本分界值推薦各不相同。例如,韓國版MoCA[19]最佳分界值為23, 而土耳其版MoCA[20]最佳分界值為21。在漢語言文化人口中有多個經(jīng)過驗證成型的MoCA 版本,包括我國北京、廣東、長沙、香港和新加坡,為區(qū)分MCI和NE人群研究建議的分界值范圍為13~26 分[21]。新加坡推薦以受教育程度10 年為界納入?yún)^(qū)分標準[22],本研究同樣發(fā)現(xiàn)受教育程度以6 年為界時高低2 組得分具有顯著差異,在較低學歷組中得分個體差異較大。因此可將受教育年限6年及以下納入?yún)^(qū)分標準,同時保留受教育年限12年及以下加分的策略。在我國香港的一項研究[23]中,315 名粵語母語參與者的MoCA 測評結(jié)果顯示敏感度為0.861,特異度為0.723。一項由1 552名捷克老年人參與的研究[24]中,MoCA-CZ 量表常模經(jīng)計算推薦分界值為≤25,顯示出94%的敏感度,而特異度較低為62%。在瑞典的一項研究[25]中,由于年齡和受教育程度的不同,700余名認知正常的老年人平均得分為16~24 分。因此,在不同的文化背景下老年人MoCA 測評結(jié)果不盡相同,這與量表本身題目設(shè)置與文化背景的貼合性相關(guān)。本土化后MoCA 測試結(jié)果較接近原版的是日本版本,當根據(jù)單詞頻率將延遲回憶部分單詞轉(zhuǎn)換為符合日本文化習慣的日語單詞時,MoCA-J 在MCI篩查中的敏感度為93.0%,特異度為87.0%[26]。本研究樣本量較大,平均MoCA 得分減1 個標準差對應(yīng)于第16 個百分位,平均MoCA 得分減1.5 個標準差對應(yīng)第7 百分位;平均MoCA 得分減2 個標準差對應(yīng)第2 百分位。有其他MoCA 相關(guān)研究[20]認為,平均MoCA 得分減1 個標準差是較合適的下限標準;對于其他許多神經(jīng)心理學測試,如韋氏智力量表,依據(jù)人口學資料進行分組后正常人群的平均數(shù)減1.5 個標準差被定為異常標準。但在以往的MoCA 相關(guān)研究中,同樣有研究[27]表明調(diào)整后的標準并不合適,以平均值減1.5 個標準差或平均值減1 個標準差為異常標準,會顯著降低靈敏度造成篩查效率下降。本研究結(jié)果顯示ROC 曲線計算所得分界值明顯高于平均值減1 個標準差,因此不采用平均值減1 個標準差進行判斷。本研究存在一定的局限性,本研究未進行重測信度及調(diào)查員信度檢驗,但后期隨訪已經(jīng)開始,后續(xù)將觀察參與本項目受試者的轉(zhuǎn)歸,同時將對詞頻修訂后版本的信度和效度進行進一步研究。
綜上所述,通過神經(jīng)心理量表進行MCI 篩查更易大范圍推行,是目前一項經(jīng)濟易行的認知障礙篩查手段。MoCA 量表測試時間短,靈敏度高,適于進行MCI 的篩查。本研究調(diào)查中國城市地區(qū)老人的認知水平,通過MoCA 量表進行量化,建立可用于未來對比研究的隊列。老年人整體認知水平隨受教育程度的提高而顯著提高。老年人總體中MoCA 測試的最佳分界值為20(敏感度63.7%,特異度75.7%)?;诹勘矸猪椀碾y度分析,我們將把MoCA 延遲記憶部分詞語的“面孔”和“教堂”進行替換,以評估其是否能夠達到更好的MCI篩查效力。