林靖凱,涂冬波
(1.北京師范大學(xué)教育學(xué)部,北京 100875,2.江西師范大學(xué)心理學(xué)院,江西 南昌 330022)
近年來,由于積極心理學(xué)興起,所以對于“生命意義感”的研究熱度逐步增加,而且社會競爭越來越激烈,這使得不少人感到壓力劇增,在這快節(jié)奏的競爭中逐漸迷失自我,導(dǎo)致生命意義感缺失,這一現(xiàn)象也使得越來越多研究人員投入生命意義感的研究中.關(guān)于生命意義感,V.E. Frankl[1]認為“對意義的尋求是人類在生活中的首要動機”,人類有在生命中尋找意義和價值的內(nèi)在需求,意義和目的感的缺乏會使人深陷痛苦[1-2];后來也有許多學(xué)者從不同角度對生命意義感進行論述,但一直以來沒有得到一個統(tǒng)一的界定.直到2016年對生命意義感進行了總結(jié),學(xué)術(shù)界才基本認可了生命意義感包含理解、目的和價值[3].
從積極心理學(xué)的意義出發(fā),李金珍等[4]認為心理學(xué)有必要去關(guān)注在人性中的積極面,致力于幫助普通人生活得更健康、更美好,促進個人、團體和社會的繁榮.盡管人們的生存環(huán)境和內(nèi)外在條件存在種種困難,但絕大多數(shù)普通人能過上一種相對滿意的、有尊嚴的生活,而正是這些普通人構(gòu)成了社會的基礎(chǔ).生命意義感是積極心理學(xué)的一個重要研究內(nèi)容,對生命意義感測量方式的研究也符合積極心理學(xué)研究的價值導(dǎo)向;大量研究證實,生命意義感的缺乏會對個體或他人造成危及生命等嚴重后果.因此,為了減輕缺乏生命意義感的個體給自己或他人帶來的傷害,生命意義感的測量、識別及診斷就顯得十分必要.為此,國內(nèi)外大量學(xué)者開發(fā)了相關(guān)的測評工具,這些量表所包含的維度、測量角度并不完全一致,相互之間存在些許差異,但目的都是生命意義感(或被稱為生活意義感)這一特質(zhì).有些項目直接測量了生命意義感,有些項目并非直接測量生命意義感.如有些項目會對生命意義感的來源或?qū)τ绊懮饬x感的因素進行測量,并取得了較好的效果,從這方面可以看出生命意義感的測量是多元的.V.E. Frankl[1]表示生命可以從3個方面來獲得意義:(i)從人們所給予生活的東西中獲得,即從人們的創(chuàng)造物中獲得;(ii)從人們對世界所求取的東西中獲得,即從人們認為有價值的事情中獲得;(iii)從人們對命運所采納的立場中獲得,這一立場是人們深信而不可改變的.盛正群[5]認為:從生存的悲劇性經(jīng)驗中、從痛苦、死亡和愧疚中也可以找到生命的意義.如從“相信生活有終極目的和意義”以及“致力于創(chuàng)造性工作”是從生命意義的來源等角度進行測量.又如“我有自己人生意義的理論體系,這使我真正懂得活著的意義”“我有清晰的人生目標和目的”“我認為自己的人生很重要”這3個項目就分別從生命意義感的理解、目的和價值[3]3個成分對生命意義感進行直接測量.另外,影響生命意義感的因素眾多,如R.F. Baumeister[6]指出:生命的意義對個體的自我感和同一性起著重要的作用.缺乏意義和價值就會導(dǎo)致自我的分裂,這種情況通常會在邊緣性人格障礙的患者身上發(fā)現(xiàn),在生命意義感量表[7]中的“從兼職或?qū)W生工作等日常生活中,我更了解自己和肯定自己”“我在付出中獲得了對于自我的肯定與喜悅”便是從該角度對生命意義感進行的測量.在以往對生命意義感的研究中,有研究人員認為其是一個1維結(jié)構(gòu),也有研究人員則認為其是多維結(jié)構(gòu).因此,生命意義感的測量結(jié)構(gòu)有待進一步驗證,而且結(jié)合以往量表測量角度的多元性和測量結(jié)果的相關(guān)性來看,有理由相信,生命意義感可能不是簡單的1維或多維結(jié)構(gòu),而是含有一般因子和特殊因子的Bifactor結(jié)構(gòu),在這種結(jié)構(gòu)中每一個項目都對應(yīng)1個特殊因子和1個一般因子.本文利用計算機自適應(yīng)測驗題庫體量大、內(nèi)容覆蓋面廣的優(yōu)勢,試圖從更全面的多元角度,探索一個更加有效合理的測量結(jié)構(gòu).
現(xiàn)有的量表是采用傳統(tǒng)紙筆測驗的施測手段,而且?guī)缀醵际腔诮?jīng)典測量理論(classical test theory,CTT)開發(fā)出來的.然而,傳統(tǒng)紙筆測驗存在一些先天性的局限,如為了使分數(shù)具有可比性,所有的人都必須回答相同的項目,這意味著被試常常需要回答與他們心理特質(zhì)水平不匹配的項目,從而降低了測試的動機、興趣及測量的精度.對于大學(xué)生生命意義感的監(jiān)測(尤其是對生命意義感缺失個體的監(jiān)測),需做到定期測量和長期追蹤觀察,很明顯,傳統(tǒng)紙筆測驗很難做到這一點.因為每一次對傳統(tǒng)紙筆測驗進行測量,被試都要做相同的題目,在多次重復(fù)測量之后被試可能形成作答定勢,所以很難排除過往測量的干擾;而且,傳統(tǒng)紙筆測驗題量較大,測量耗費大量的時間,對大學(xué)生群體進行普測也會耗費大量的人力和物力.
然而,計算機自適應(yīng)測試(computerized adaptive testing,CAT)技術(shù)的產(chǎn)生能夠很好地解決上述問題.CAT可以根據(jù)每位被試的反應(yīng)情況和心理特質(zhì)水平,智能地從題庫中挑選出與被試特質(zhì)水平相匹配的題目,從而做到對被試的自適應(yīng)測量,即“千人千卷”的個性化測試.CAT在每次測量中只有少數(shù)題目曝光,大大延長了測驗的使用壽命;同時CAT還能減少題長,減輕被試負擔,提高了測試的動機和水平,并在一定程度上降低被試的厭煩情緒.總的來說,CAT是一種同時兼顧了測量效率和測量精度的新型測量技術(shù),目前已被廣泛應(yīng)用于心理測評領(lǐng)域,如艾森克個性問卷(成人版)計算機自適應(yīng)測驗[8]、特質(zhì)焦慮計算機化自適應(yīng)測驗[9]等.
因此,為了進一步克服目前國內(nèi)外關(guān)于生命意義感紙筆測量的不足,本文擬在項目反應(yīng)理論(IRT)框架下,采用CAT技術(shù)探討生命意義感的計算機化自適應(yīng)測驗(CAT-MLM),以此來克服傳統(tǒng)紙筆測驗的一些缺陷;同時,本文還進一步驗證了CAT-MLM的科學(xué)性及有效性,并且探討了CAT-MLM對傳統(tǒng)紙筆測驗在測量信度及測量精度上的提升效果,這將為生命意義感的測量提供一種新視角和新技術(shù).
計算機化自適應(yīng)測驗的開發(fā)離不開大型的題庫支持,本文CAT-MLM初始題庫的項目主要來自通用的4個知名生命意義感量表[10-11],包含生活信念、生活熱情、生活成就、生活目的和生活價值等5個子維度;生命意義感量表[7,12]包含意志自由、追求意義的意志和生命的意義等3個子維度;生活目的測試[13-14]包含生活感受、生活目標、生命態(tài)度和自主感等4個子維度;生命意義問卷[5,15]包含成就、人際關(guān)系、公平、追求、信仰、家庭、親密關(guān)系、自我超越、自我接受和快樂等10個子維度.CAT-MLM初始題庫共計109題,保留每個項目原始計分方式,同時本研究使用以上量表的中文版量表.
另外,還有一份效標量表,即人生意義問卷(meaning in life questionnaire,MLQ),它是由王鑫強漢化修訂[16]的,該量表共10題,采用Likert7點計分,該問卷在美國和日本大學(xué)生樣本中表現(xiàn)出良好的信效度[17].
將在初始題庫中所有項目組成的測驗,通過網(wǎng)絡(luò)問卷和紙筆測試的形式進行發(fā)放和回收,并根據(jù)該數(shù)據(jù)構(gòu)建生命意義感題庫.
被試來自中國30個省級行政區(qū)(澳門、天津、西藏和新疆除外)的大學(xué)生,共調(diào)查1 101人,刪除10個項目以上未作答的被試82人.根據(jù)測謊題的作答與最佳答案的差值,3道測謊題差值總和最大的前5%刪除,上述2種策略共刪137人,剩余有效被試964人.被試年齡最小值為17,年齡最大值為29,年齡平均數(shù)為19.98(SD=1.51);男生人數(shù)為349,女生人數(shù)為615;大一學(xué)生人數(shù)為230,大二學(xué)生人數(shù)為294,大三學(xué)生人數(shù)為333,大四學(xué)生人數(shù)為107;文科學(xué)生人數(shù)為417,理工科學(xué)生人數(shù)為474,藝術(shù)與體育學(xué)生人數(shù)為46,醫(yī)學(xué)學(xué)生人數(shù)為27;城鎮(zhèn)學(xué)生人數(shù)為524,農(nóng)村學(xué)生人數(shù)為440.
1.3.1 實驗1:CAT-MLM題庫開發(fā)及CAT-MLM算法有效性驗證 (i)基于Bifactor模型的因素分析.將964份有效數(shù)據(jù)隨機分成數(shù)量相等的2份,分別作為探索樣本和驗證樣本.利用探索樣本進行探索性因素分析,以各項目的因素負荷作為指標,對題庫的項目進行篩選.根據(jù)CFI、NNFI等擬合指標,選取擬合最好的模型,對驗證樣本進行驗證性因素分析,并將該模型用于后續(xù)CAT的開發(fā).
(ii)IRT模型選擇.在IRT中,選擇合適的IRT模型進行數(shù)據(jù)分析是保證數(shù)據(jù)分析結(jié)果準確的前提.本文采用常用的偏差(-2LL、AIC、BIC統(tǒng)計量)等[18-19]相對擬合指標進行模型擬合比較,以選擇相對更擬合數(shù)據(jù)的模型.-2LL、AIC、BIC統(tǒng)計量的值越小表示模型擬合越好.本文考察的IRT模型主要有使用較廣泛的等級反應(yīng)模型(GRM)[20]和拓廣分部評分模型(GPCM)[21],并從這2個模型中選擇一個與實測數(shù)據(jù)擬合更佳的模型作為隨后數(shù)據(jù)分析的IRT模型.
(iii)項目分析.對題庫進行項目質(zhì)量分析,以確保最終留在題庫中的項目具有較高的質(zhì)量.項目質(zhì)量分析主要包括項目區(qū)分度、項目擬合度(item-fit)檢驗以及項目功能差異(DIF)檢驗.
項目區(qū)分度表示具有相似分數(shù)的人在潛在特質(zhì)上的差異程度,為了保證題庫的高質(zhì)量,本文刪除區(qū)分度過低的項目[22].
采用Logistic回歸方法進行DIF檢驗,并使用McFadden′s pseudoR2的變化量進行評價,當R2的改變量大于0.02時,項目存在DIF[24].
(iv)CAT-MLM算法與效果驗證.在建立完成CAT-MLM題庫的基礎(chǔ)上,對CAT-MLM的相關(guān)算法進行設(shè)置并檢驗其效果.CAT算法主要涉及初始題選取、選題策略、能力估計方法及終止規(guī)則等方面.本文CAT-MLM的初始題采用隨機法選取,選題策略采用最大信息量法(maximum information,MI),能力參數(shù)估計方法采用期望后驗方法(EAP),終止規(guī)則采用定長終止規(guī)則(即被試的用題量達到了事先設(shè)定的要求則終止測試).
實驗1以CAT-MLM真實的題庫參數(shù)以及真實被試在所有項目上紙筆測驗的真實作答為基礎(chǔ),模擬真實被試在CAT-MLM上的自適應(yīng)過程,從而檢驗 CAT-MLM的測量效果.真實被試共計964人,這些真實被試完成了題庫中所有項目的紙筆作答,模擬被試在CAT-MLM上的自適應(yīng)作答.目前在國際上有2種運用較廣的雙因子CAT 測驗設(shè)計[25],本文采用Bifactor CAT[26]設(shè)計,具體過程如下:從第1位真實被試開始,進行其在一般因子上的CAT程序,第1題從題庫中隨機選取,并將該被試在紙筆測驗中對該題的作答作為其在G因子CAT上的作答,根據(jù)該作答估計該被試特質(zhì)水平,并根據(jù)估計的特質(zhì)水平(θ)采用最大信息量的方法選取下一試題給被試作答,同樣將該被試在紙筆測驗中對該題的作答作為其在G因子CAT上的作答,…,依此進行直至達到了事先設(shè)定的終止規(guī)則,結(jié)束G因子的測試;在G因子CAT中已經(jīng)被執(zhí)行的項目同時測量了1個一般因子和1個特殊因子,根據(jù)被試已作答的項目估計被試在特殊因子F1上的水平值,并作為F1因子CAT的水平初始值,根據(jù)該水平初始值選擇被試在F1因子上的所要作答的項目,然后采用與G因子CAT相同的方法進行F1因子的CAT選題與測試,直至達到F1因子的終止規(guī)則,結(jié)束F1因子的測試;以同樣的方法,測試下一個因子;接下來其余被試依次按此方法模擬,直至完成所有被試在所有因子(包含1個一般因子和3個特殊因子)上的CAT-MLM測試.最后,將964位被試在CAT-MLM一般因子測試中估計的特質(zhì)水平(θ1)與使用在題庫中所有題目的紙筆測驗所估計的特質(zhì)水平(θ2)求相關(guān)系數(shù),再計算964位被試在CAT-MLM各因子測試上的誤差均值和邊際信度,以考察CAT-MLM的測量效果.
同時,為了考察CAT-MLM的測量效度,964位被試還完成了在效標量表上的作答,將這964位被試在CAT-MLM一般因子上的測量結(jié)果與在效標量表MLQ上的測量結(jié)果進行比較分析,并求取其校標關(guān)聯(lián)效度.
1.3.2 實驗2:CAT-MLM對傳統(tǒng)紙筆測驗測量精度的提升 在CAT-MLM(一般因子)的測驗長度與傳統(tǒng)紙筆測驗(即傳統(tǒng)生命意義感量表)相同的情況下,實驗2探討CAT-MLM是否能提供比傳統(tǒng)量表更高的測量精度以及更高的測量信度,即在相同測驗長度下,CAT-MLM是否能顯著提升測量的精度及信度,從而探討CAT-MLM的性能及其優(yōu)勢.實驗2選用了用于構(gòu)建CAT-MLM的4個量表,即PIL、SLMS、MLM和PMP,它們的題數(shù)分別為20題、20題、23題、46題.因此在實驗2中CAT-MLM的一般因子測驗的終止規(guī)則分別設(shè)置為20題、20題、23題和46題.
實驗2在CAT算法的選擇上與實驗1一致,實驗2將在4種終止規(guī)則下CAT-MLM的結(jié)果與具有同等題長的傳統(tǒng)量表的結(jié)果進行比較,重點比較它們的測量誤差、測驗信度和信息量,根據(jù)被試特質(zhì)水平和測驗對于被試的測量誤差的關(guān)系做散點圖,然后依據(jù)相同方法做特質(zhì)水平-信度散點圖和特質(zhì)水平-信息量散點圖,以此比較在相同題長下這2種測量形式對于不同特質(zhì)水平被試的測量誤差、測驗信度和信息量差異.
探索性因素分析(EFA)和驗證性因素分析(CFA)均采用軟件Mplus7,其余分析利用R語言的各種軟件包進行,如模型選擇和項目擬合檢驗等采用mirt包、DIF檢驗采用lordif包、CAT算法采用catR包.
2.1 實驗1:CAT-MLM題庫開發(fā)及CAT-MLM算法有效性驗證
2.1.1 因素分析 采用雙因子模型(Bifactor model)對探索樣本進行探索性因素分析,并在多個競爭模型(分別為2個、3個、4個和5個特殊因子模型)中選擇出擬合指標最好的模型(3個特殊因子的Bifactor model),其比較擬合指數(shù)(CFI)為0.91、近似誤差均方根(RMSEA)為0.034、標準化殘差均方根(SRMR)為0.045,在刪除因素負荷過低或為負的項目后,剩余92題;然后利用驗證樣本對該模型進行驗證性因素分析,其CFI為0.90、RMSEA為0.035、SRMR為0.050,模型如圖1所示(該示意圖已將項目按照維度順序重新編號).這一結(jié)構(gòu)說明:目前國內(nèi)外關(guān)于生命意義量表測量了1個共同因素(即整體生命意義感),同時包含了3個相對獨立的特殊因素(即生活感受、生命意志以及生活價值).
2.1.2 題庫建設(shè) 在嘗試GRM和GPCM模型之后,GRM模型的-2LL統(tǒng)計量值為21 9687.6、AIC統(tǒng)計量值為221 095.5、BIC統(tǒng)計量值為224 524.8(這里-2LL是在logistic回歸中的最大似然估計,AIC是赤池信息準則,BIC是貝葉斯信息準則),GPCM模型在經(jīng)過500次迭代后,仍然無法收斂,這說明GPCM模型不適用于本研究.因此,選擇GRM模型有助于后續(xù)的研究.
圖1 CAT-MLM模型示意圖
運用GRM模型進行參數(shù)估計,在92題中有5題區(qū)分度過低,為了提高題庫的質(zhì)量,將這5題刪除,剩下87題.對剩余87個項目進行項目擬合檢驗,發(fā)現(xiàn)所有項目的顯著性p值均小于臨界值0.01.將男性作為參照組,女性作為目標組,考察項目是否存性別DIF.所有項目的McFadden′sR2變化量均高于臨界值0.02,即項目在性別水平上均不存在DIF.最終的CAT-MLM題庫構(gòu)建完成,共包含87個項目.整個題庫的平均區(qū)分度參數(shù)為1.46(SD=0.82),這說明整個題庫具有較高的質(zhì)量;同時項目的位置參數(shù)(難度參數(shù))的取值范圍為[-6.24,6.80],覆蓋范圍遠大于能力值標準正態(tài)分布的“3σ原則”的區(qū)間(-3,3),適合測量不同特質(zhì)水平的被試.結(jié)果如表1所示.
表1 在題庫中各項目的來源
表1呈現(xiàn)了在最終題庫中87個項目所測量的子維度,從表1可知4個原量表的所有子維度均有項目被納入題庫,即在題庫中的87個項目測量了4個原量表的所有子維度.
2.1.3 CAT-MLM算法與效果驗證 表2和表3分別為G因子和特殊因子(包括F1因子、F2因子、F3因子)基于真實被試模擬的CAT在定長終止規(guī)則下各項指標的結(jié)果,其中G因子的定長終止規(guī)則為做完20個項目即停止測試,F1、F2、F3因子的定長終止規(guī)則為做完屬于本因子題庫60%的項目即停止測試,表2和表3所呈現(xiàn)的指標結(jié)果可以反映CAT-MLM題庫質(zhì)量及其CAT算法的效果.表2包括了一般因子在定長終止規(guī)則下的平均測量誤差、測量的邊際信度,以及使用題庫所有題目所估計的特質(zhì)值與使用定長終止策略估計的特質(zhì)值的相關(guān)系數(shù)和一般因子在定長終止規(guī)則下與效標量表MLQ的效標關(guān)聯(lián)效度;表3包含3個特殊因子在定長終止規(guī)則下的誤差均值和邊際信度.
從表2可知:使用題庫中所有項目對一般因子進行估計,其誤差均值和邊際信度分別為0.10和0.99,效標關(guān)聯(lián)效度高達0.753,這也能夠說明本文所開發(fā)的CAT題庫有較高的質(zhì)量.若使用20題定長終止為一般因子CAT的終止規(guī)則,則測驗整體的誤差均值和邊際信度與使用整個題庫基本相當,分別為0.15和0.98,在此終止規(guī)則下,估計出的特質(zhì)值與使用整個題庫估計出的特質(zhì)值相關(guān)系數(shù)高達0.978,且效標關(guān)聯(lián)效度為0.749,這說明使用此終止規(guī)則能夠使測量結(jié)果穩(wěn)定、精確、有效.
表3為該CAT的各特殊因子分測驗的精度指標,F1、F2、F3因子的誤差均值分別為0.34、0.37、0.45,均不大于0.45;3個因子的邊際信度分別為0.89、0.86、0.80,均不小于0.80.
總之,實驗1的結(jié)果說明CAT-MLM有較好的測量信度和效度,同時也說明CAT-MLM所采用的算法可行、科學(xué),效果好.
表2 在定長20題終止規(guī)則下一般因子CAT的各項效果指標
表3 定長CAT的各特殊因子的測量誤差和信度
2.2 實驗2:CAT-MLM與傳統(tǒng)紙筆測驗的比較
實驗2的結(jié)果如圖2~圖4所示.圖2呈現(xiàn)了在相同測驗長度下CAT-MLM(一般因子)和傳統(tǒng)量表的測量誤差散點圖.圖2結(jié)果顯示:在題數(shù)相同的情況下,絕大多數(shù)被試在CAT上的測量誤差比在傳統(tǒng)量表上的測量誤差更低,即CAT-MLM有效降低了測驗誤差.其中,與SLMS、PIL、MLM、PMP相比,CAT-MLM的平均測量誤差分別降低了41.13%、39.30%、27.50%、29.20%.
圖2 在各定長下CAT-MLM與其相同題數(shù)的傳統(tǒng)紙筆測驗的測量誤差散點圖
圖3呈現(xiàn)了在相同測驗長度下CAT-MLM(一般因子)和傳統(tǒng)量表的測量信度散點圖.圖3結(jié)果顯示:在測量題數(shù)相同的情況下,絕大多數(shù)被試在CAT上的測量信度比在傳統(tǒng)量表上的測量信度更高,即CAT-MLM有效提升了測量信度.其中,與SLMS、PIL、MLM、PMP相比,CAT-MLM的邊際信度分別提升了5.10%、4.41%、2.09%、1.43%.
圖3 在各定長下CAT-MLM與其相同題數(shù)的傳統(tǒng)紙筆測驗的測量信度散點圖
圖4 在各定長下CAT-MLM與其相同題數(shù)的傳統(tǒng)紙筆測驗的信息量散點圖
圖4為CAT-MLM使用定長終止規(guī)則在各種題長下對于所有真實被試的信息量與其題長相等的傳統(tǒng)紙筆測驗量表對于所有真實被試的信息量的散點圖.由圖4可以看出:無論是傳統(tǒng)紙筆測驗量表還是計算機化自適應(yīng)測驗,對于生命意義感水平在[-2,2]上的被試都有較高的信息量.除了題數(shù)較多的PMP外,其余獨立量表對于生命意義感很低的極端被試的信息量都較低(信息量低于25意味著測驗標準誤差大于0.2),而與其題長相同的CAT-MLM能夠在生命意義感水平較低的被試群體中有較好的表現(xiàn).相比傳統(tǒng)紙筆測驗量表,CAT-MLM對于生命意義感低的極端被試在測量信息量上有相當大的提升.從圖4不難看出:在相同題長的情況下,對于在[-4,4]上的所有被試,CAT-MLM的信息量幾乎大于任何一個傳統(tǒng)紙筆測驗量表的信息量.由此可見,CAT-MLM對于所有生命意義感水平的被試信息量都有所提升,尤其是對于生命意義感水平低于-2的極端被試,CAT-MLM更是有飛躍性的提升.
本研究的目的是:探索出一個更有利于生命意義感測量,且擬合度更佳的測量模型,并依據(jù)此模型,建立一個基于IRT的生命意義感的計算機自適應(yīng)測驗(CAT-MLM),再驗證CAT-MLM對傳統(tǒng)紙筆測驗在測驗精度及測量信度上的提升.實驗1基于964位真實被試的作答數(shù)據(jù),運用Bifactor模型對所有項目進行探索性因素分析和驗證性因素分析,最終選取在所有競爭模型中擬合最佳的模型,用于后續(xù)CAT的開發(fā),最終選取的模型包含1個一般因子和3個特殊因子.在IRT框架下,通過項目擬合檢驗、項目功能差異分析等方法,最終選取了包括符合測量學(xué)要求且項目質(zhì)量較高的87題來構(gòu)建CAT-MLM題庫.研究發(fā)現(xiàn):在本實驗開發(fā)的題庫中擁有87個項目的CAT-MLM效果良好;使用定長終止規(guī)則和最大信息量選題法對真實被試進行模擬測量,一般因子的平均測量誤差為0.15、邊際信度高達0.98,一般因子的平均誤差均不大于0.45、邊際信度均不小于0.80,并且該CAT有良好的效標關(guān)聯(lián)效度,能高效地對生命意義感進行測量.以上多方面結(jié)果說明本研究開發(fā)的CAT-MLM算法可行、科學(xué)、效果好.另外,從表1可以看出:所有原量表的子維度均有題目被保留下來,并納入最終題庫,各子維度的測量角度存在些許差異,但都測量了生命意義感這一共同因子.本文利用了CAT題庫題量大、覆蓋面廣的優(yōu)點,對生命意義感的測量結(jié)構(gòu)進行了重新探索,本文構(gòu)建的Bifactor模型在一定程度上說明生命意義感的測量是多角度、多元的,但最終都能有效測量生命意義感這個一般因子.從理論上分析,由于每個個體所處的外部環(huán)境和自己心理的內(nèi)部環(huán)境都十分復(fù)雜,導(dǎo)致生命意義感的影響因素眾多,所以生命意義感的測量內(nèi)容十分多元.由于以往生命意義感量表的開發(fā)者有些從生命意義感本身進行直接測量,有些從生命意義感的來源或影響因素進行間接測量,所以以往量表的開發(fā)者開發(fā)出了測量角度差異較大,但測量目標高度重合,結(jié)果高度相關(guān);從統(tǒng)計分析的角度看,對被試在原量表各子維度的得分進行相關(guān)性分析,結(jié)果發(fā)現(xiàn)這些子維度兩兩之間都具有顯著的中度或高度相關(guān).從理論和統(tǒng)計測量的角度都能有力地支持本研究所開發(fā)的Bifactor測量模型,也能解釋Bifactor模型對生命意義感的測量為何有更好的擬合度.由于傳統(tǒng)紙筆量表需要被試完成所有的項目,要考慮到被試的答題負擔,所以要控制量表的題量,便難以同時涵蓋如此多的測量角度,而將CAT運用于類似于生命意義感這種測量角度多元的特質(zhì)的測量,就能顯示出CAT題庫內(nèi)容覆蓋面廣的優(yōu)點,由于生命意義涵蓋廣泛的內(nèi)容與諸多因素相關(guān),所以更廣的覆蓋面無疑能使生命意義感的測量有更好的效果,要有如此多元的測量角度和內(nèi)容覆蓋面,這是傳統(tǒng)量表難以做到的.因此,盡管CAT-MLM從不同的測量視度出發(fā),但是它們均是從直接測量和間接測量2個角度來測量人的生命意義感這一相同特質(zhì).綜合這些結(jié)果也可以看出生命意義感不是簡單的多維結(jié)構(gòu),而是一種被較少用于生命意義感研究的雙因子結(jié)構(gòu),同時,也能夠較好地解釋長期以來生命意義感的結(jié)構(gòu)和成分為何一直難以統(tǒng)一.實驗2在與傳統(tǒng)量表相同題長的情況下考察CAT-MLM是否能有效提高測量的精度及測量的信度.實驗結(jié)果顯示:與傳統(tǒng)紙筆測驗的量表相比,無論是測量誤差、邊際信度還是信息量CAT-MLM都有明顯差異,CAT-MLM對傳統(tǒng)紙筆測驗量表的測量誤差降低幅度最多達到41.13%,對傳統(tǒng)紙筆測驗量表的邊際信度提升幅度最高達到5.10%.比較不同測量方式對于所有被試的信息量后發(fā)現(xiàn):相比傳統(tǒng)紙筆測量,CAT-MLM對絕大多數(shù)被試具有較高的測量精度,尤其是對生命意義感水平低于-2的極端被試的信息量有極大提升.
本文開發(fā)的CAT-MLM對于傳統(tǒng)紙筆測量的測量精度有極大提升.CAT-MLM作為生命意義感的一種新的測量工具,利用其高精度、高效率和對生命意義感極低的被試十分敏感的特點,可以被用來較好地解決前文提到的對在大學(xué)生群體中缺失生命意義的個體的篩查問題,以識別出生命意義感水平過低的人,及早預(yù)防和干預(yù),并對所有在校大學(xué)生進行定期普查.利用CAT-MLM進行普查的優(yōu)勢是速度快、效率高,同時CAT可以減少題目的曝光率,增長題庫使用壽命,防止被試前后多次重復(fù)回答同樣的題目,形成回答定勢,導(dǎo)致測驗準確度降低.而且,CAT-MLM能較好地彌補傳統(tǒng)紙筆測量對于極端被試測量精度極低的缺陷,對于在普查中期望發(fā)現(xiàn)嚴重缺乏生命意義感的個體具有較高的敏感度,一旦發(fā)現(xiàn)生命意義感過低的學(xué)生,盡早采取必要措施,減少自殘、自殺等悲劇事件的發(fā)生.