劉 麗,石 巖
臨床運(yùn)動心理干預(yù)效果評價實(shí)驗(yàn)設(shè)計的現(xiàn)狀、困境與出路
劉 麗,石 巖
臨床運(yùn)動心理干預(yù)效果的評價是臨床運(yùn)動心理學(xué)面臨的重要任務(wù),實(shí)踐者必須承擔(dān)評價并說明其干預(yù)有效性的責(zé)任。首先分析了臨床運(yùn)動心理干預(yù)效果評價實(shí)驗(yàn)設(shè)計的現(xiàn)狀與困境,再結(jié)合近年來經(jīng)濟(jì)學(xué)、統(tǒng)計學(xué)和醫(yī)藥學(xué)等領(lǐng)域研究方法的進(jìn)步,提出了解決這些問題的對策:治療目標(biāo)分析、被試脫落的預(yù)防與分析、傾向得分匹配法、嵌套設(shè)計分析、焦點(diǎn)局部控制、回歸間斷設(shè)計和個案實(shí)驗(yàn)的隨機(jī)檢驗(yàn)等。
臨床運(yùn)動心理學(xué);心理干預(yù);效果評價;實(shí)驗(yàn)設(shè)計
臨床運(yùn)動心理干預(yù)(Interventions in Clinical Sport Psychology)是臨床運(yùn)動心理學(xué)工作者有目的地改變運(yùn)動者的心理與行為,包括3種方式:1)心理技能訓(xùn)練(Psychological Skill Training,PST),這種干預(yù)主要針對心理正常的競技運(yùn)動員,以教育和訓(xùn)練的方式,使他們掌握相應(yīng)的心理技能(如放松、目標(biāo)設(shè)置、積極想象、積極自我對話等),以促進(jìn)健康、積極行為,提高競技表現(xiàn)水平;2)預(yù)防運(yùn)動者心理問題和障礙的干預(yù),它主要針對遇到各種困惑(如運(yùn)動損傷、角色轉(zhuǎn)換、人際沖突、運(yùn)動退役等)的運(yùn)動者,以咨詢的方式,幫助他們順利應(yīng)對各種難題,促進(jìn)適應(yīng),降低出現(xiàn)心理問題與障礙的可能性;3)對運(yùn)動者心理治療,即對有心理障礙(如各種神經(jīng)癥、情緒障礙、飲食障礙、憤怒控制障礙、創(chuàng)傷后應(yīng)激障礙、物質(zhì)濫用等)的運(yùn)動者進(jìn)行的矯正性的心理干預(yù)。
臨床運(yùn)動心理學(xué)的一個基本理念是,運(yùn)動者通過與臨床運(yùn)動心理學(xué)工作者的互動后在某些方面發(fā)生積極有利的變化。臨床運(yùn)動心理干預(yù)的效果評價就是要甄別這些變化,以確定干預(yù)是否會像其理論描述的那樣,在臨床背景下起作用,干預(yù)方法的具體適用范圍,干預(yù)措施中的有效成分,以及不同干預(yù)的效果差異。
臨床運(yùn)動心理干預(yù)的效果評價是臨床運(yùn)動心理學(xué)面臨的重要任務(wù)。首先,從職業(yè)道德角度來講,臨床運(yùn)動心理學(xué)實(shí)踐者有責(zé)任和義務(wù)采用經(jīng)臨床實(shí)驗(yàn)研究證明有效的干預(yù)方法;其次,當(dāng)代衛(wèi)生保健監(jiān)管機(jī)構(gòu)越來越重視監(jiān)管,其核心工作是進(jìn)行責(zé)任、成本與效率的分析,只有通過臨床驗(yàn)證有效的干預(yù)才能得到其經(jīng)費(fèi)支持;最后,臨床運(yùn)動心理學(xué)作為一門新興的應(yīng)用運(yùn)動心理學(xué)學(xué)科,要想得到公眾的認(rèn)可,必須用科學(xué)的方法證明其干預(yù)的有效性??傊?臨床運(yùn)動心理干預(yù)的效果評價研究關(guān)系著臨床運(yùn)動心理學(xué)的生死存亡。
1972年,英國流行病學(xué)家、內(nèi)科醫(yī)生Cochrane在其專著《療效與效益:健康服務(wù)的隨想》中首次論述了醫(yī)療服務(wù)的效益問題,主張使用隨機(jī)組間實(shí)驗(yàn)(randomized controlled trial,RCT)來證明醫(yī)療保健措施的效果。1992年,英國首先開啟了循證醫(yī)學(xué)(Evidence-based Medicine,EBM),提倡任何醫(yī)療決策應(yīng)建立在科學(xué)研究證據(jù)基礎(chǔ)上。1993年,國際性的循證醫(yī)學(xué)網(wǎng)絡(luò)Cochrane協(xié)作網(wǎng)在英國成立。1995年,美國心理協(xié)會(APA)臨床心理學(xué)分會成立了一個特別工作組,負(fù)責(zé)制定并頒布衡量心理治療方法是否有效的標(biāo)準(zhǔn)和確定已經(jīng)實(shí)驗(yàn)研究證明有效的心理治療方法。
心理治療有效性的實(shí)證支持標(biāo)準(zhǔn)(Chambless&Ollendick,2001)[8]包括:1)經(jīng)2項或2項以上的隨機(jī)對照設(shè)計實(shí)驗(yàn)研究(或9個以上的個案設(shè)計實(shí)驗(yàn)研究)驗(yàn)證,證實(shí)其效果顯著且優(yōu)于藥物、安慰治療或其他心理治療,或與另一種已被證明確實(shí)有效的治療方法療效相當(dāng);2)實(shí)驗(yàn)研究在治療手冊的指導(dǎo)下實(shí)施;3)所選取的臨床樣本必須具有代表性;4)治療效果至少被2個不同的研究者或研究團(tuán)隊證實(shí)。由此標(biāo)準(zhǔn)可以看出,要證明某種心理干預(yù)有效,最佳方案是開展2個以上的隨機(jī)對照設(shè)計實(shí)驗(yàn)研究,或者進(jìn)行9個以上的個案設(shè)計實(shí)驗(yàn)研究。
隨機(jī)化原則指在選取樣本時,應(yīng)確保總體中任何一個個體都有同等的機(jī)會被抽取進(jìn)入樣本;在分配樣本時,應(yīng)確保樣本中任何一個個體都有同等的機(jī)會被分入任何一個組中去接受不同形式的干預(yù)或處理。隨機(jī)化使樣本具有極好的代表性,使各組受試對象在重要的非實(shí)驗(yàn)因素方面具有極好的均衡性,從而提高組間實(shí)驗(yàn)資料的可比性。
一種干預(yù)的效果如何,要看它與不干預(yù)或其他干預(yù)的效果有何不同。對照原則指干預(yù)研究應(yīng)設(shè)立對照組,即尋找一個“參照物”或“對比的基礎(chǔ)”。設(shè)立對照組能提高鑒別一種干預(yù)效果的能力及其結(jié)論的說服力。如果僅有一種干預(yù)方法需考察其干預(yù)效果,就必須有不給予任何干預(yù)的空白對照組。但在實(shí)際中這有時行不通,因?yàn)樗`反倫理道德,研究者不能對有問題的被試不給予任何干預(yù)。如果所有被試都必須接受某種干預(yù),那么,就必須具有2種或2種以上的不同方式的干預(yù)。
重復(fù)實(shí)驗(yàn)指在相同的實(shí)驗(yàn)條件下,做2次或2次以上的獨(dú)立實(shí)驗(yàn)。重復(fù)原則有利于使隨機(jī)變量的統(tǒng)計規(guī)律性充分地顯露出來。為了保證實(shí)驗(yàn)研究的可重復(fù)性,就需要制定詳細(xì)的干預(yù)指導(dǎo)手冊,并在實(shí)驗(yàn)中嚴(yán)格執(zhí)行,即實(shí)施標(biāo)準(zhǔn)的干預(yù)。
均衡指某心理干預(yù)各實(shí)驗(yàn)組中的受試對象所受到的非實(shí)驗(yàn)因素的影響是完全平衡的,即這些組之間的差別完全是由于干預(yù)采取了不同方法所致,而非其他因素取值不同所造成。均衡通過分層取樣、盲法分組等來實(shí)現(xiàn)。盲法是指在臨床實(shí)驗(yàn)設(shè)計中使研究者、研究對象或資料分析者不知道研究對象隨機(jī)分配情況和處理情況,由此,克服了主觀因素的影響,而獲得客觀數(shù)據(jù)。
個案實(shí)驗(yàn)設(shè)計是將被試置于系統(tǒng)設(shè)計的多種實(shí)驗(yàn)條件下,并在每種條件下評估被試心理功能的變化。個案實(shí)驗(yàn)設(shè)計常見的方式是簡單的A-B設(shè)計、A-B-A-B設(shè)計和多基線設(shè)計(Multiple Baseline Design)。
簡單的A-B時序設(shè)計亦稱基線-干預(yù)模式,即干預(yù)開始前為基線期的“A”階段,以及干預(yù)過程為“B”階段,對照2個不同階段的數(shù)據(jù)以說明干預(yù)的效果。AB設(shè)計通常不是一種有效的實(shí)驗(yàn)設(shè)計,因?yàn)锽階段發(fā)生的變化可能是其他因素導(dǎo)致的,該設(shè)計不能排除無關(guān)變量或新異變量對實(shí)驗(yàn)結(jié)果的干擾。
A-B-A-B設(shè)計是在沒有任何干預(yù)因素的情況下對被試行為進(jìn)行連續(xù)評估,然后實(shí)施心理干預(yù),接著停止干預(yù),過后再次實(shí)施心理干預(yù)。如果所觀察的行為隨著干預(yù)因素的介入與撤離而出現(xiàn)系統(tǒng)性的變化,即說明該治療有效。
多基線設(shè)計是同一個體在不同的時期分別接受2種或2種以上的干預(yù),或者不同的個體在不同的時間段接受相同的干預(yù),通過數(shù)據(jù)的變化分析干預(yù)的效果。
由于個案設(shè)計的研究對象只是特定的個體,很難判斷該干預(yù)方案是否可以有效地推廣到其他個體,所以,其對干預(yù)效果的證明力度較小。為了令人信服地證明干預(yù)的效果,就需要更多的其他研究來支撐。
雖然,臨床運(yùn)動心理干預(yù)效果評價的問題在許多場合被提及和強(qiáng)調(diào),但遺憾的是,通過實(shí)驗(yàn)研究來考察臨床運(yùn)動心理干預(yù)的研究一直很少(Barlow等,2009)[6]。Martin等(2005)回顧了1972—2002年間3種行為雜志(《Behavior Modification》,《Behavior Therapy》和《Journal of Applied Behavior Analysis》)和7種運(yùn)動心理學(xué)雜志(《International Journal of Sport Psychology》,《Journal of Applied Sport Psychology》,《Journal of Sport Behavior》,《Journal of Sport and Exercise Psychology》,《Quest》,《Research Quarterly for Exercise and Sport》和《The Sport Psychologist》),發(fā)現(xiàn)只有15篇文章符合心理干預(yù)實(shí)證研究支持標(biāo)準(zhǔn)。其中,7篇文章采用了個案實(shí)驗(yàn)設(shè)計,8篇文章采用了隨機(jī)組間實(shí)驗(yàn)設(shè)計[20]。
2007-2009年間,臨床運(yùn)動心理學(xué)雜志(《Journal of Clinical Sport Psychology》)共發(fā)表了15篇干預(yù)研究的文章,其中,1篇采用個案法,5篇采用了非隨機(jī)組間實(shí)驗(yàn)設(shè)計,6篇采用個案實(shí)驗(yàn)設(shè)計,僅有3篇采用隨機(jī)組間設(shè)計(占所有研究的1/5)。
中國運(yùn)動心理學(xué)研究起步較晚,20世紀(jì)90年代以后,運(yùn)動員心理干預(yù)研究才逐漸興盛起來。回顧近20年來中國主要的臨床運(yùn)動心理干預(yù)研究發(fā)現(xiàn):中國的臨床運(yùn)動心理干預(yù)研究以個案實(shí)驗(yàn)設(shè)計為主(占總數(shù)的一半),個案實(shí)驗(yàn)設(shè)計絕大多數(shù)為簡單的A-B設(shè)計;20世紀(jì)90年代末開始采用隨機(jī)組間實(shí)驗(yàn)來考察心理干預(yù)的效果,但為數(shù)不多(占總數(shù)的1/4)。
表1 近20年來我國運(yùn)動心理干預(yù)主要研究成果一覽表
心理技能訓(xùn)練作為提高運(yùn)動員競技表現(xiàn)的主要措施已經(jīng)有幾十年的歷史。傳統(tǒng)心理技能訓(xùn)練的基本目標(biāo)是通過自我控制內(nèi)部狀態(tài)而提高運(yùn)動表現(xiàn)水平。普遍應(yīng)用的運(yùn)動心理技能訓(xùn)練的技術(shù)主要有:目標(biāo)設(shè)置(goal setting)、表象訓(xùn)練(imagery training)、喚醒水平控制(arousal regulation)、自我對話(self-talk)和放松訓(xùn)練(relaxation training)等。
雖然,有一些研究支持傳統(tǒng)心理技能訓(xùn)練的作用,但是,近年來這些研究受到方法學(xué)的質(zhì)疑,越來越多的研究不支持傳統(tǒng)心理技能訓(xùn)練提高運(yùn)動表現(xiàn)的效果。
Moore(2003)[22]收集了從1960年開始的104個心理技能訓(xùn)練的研究,用實(shí)證支持有效的心理干預(yù)標(biāo)準(zhǔn)考核了這些心理技能訓(xùn)練的效果。結(jié)果表明,有44項研究不符合研究設(shè)計及方法學(xué)要求(26項沒有隨機(jī)分組或缺乏控制,17項研究采用了單因素實(shí)驗(yàn)設(shè)計而沒有與其他干預(yù)方法比較);60項符合設(shè)計要求的研究中只有19項研究選取了真正的運(yùn)動員作被試;大部分研究未采用雙盲法;沒有一項研究評估治療關(guān)系、參加者期望等對研究結(jié)果的影響。
Feltz和Landers(1983)[12]對60項表象訓(xùn)練研究進(jìn)行了元分析,探討了表象訓(xùn)練對運(yùn)動技能學(xué)習(xí)和操作成績的影響,得出平均效果量為0.48,即不到半個標(biāo)準(zhǔn)差單位,由此認(rèn)為表象訓(xùn)練的效果很小。張力為(1990)的研究未發(fā)現(xiàn)表象訓(xùn)練可改善運(yùn)動員的注意力和念動能力[3]。Callow和Hardy(2005)研究表明,在20年的時間里,只有7個研究用實(shí)際的運(yùn)動者做被試評估了表象訓(xùn)練的效果,這些研究只得出了模棱兩可的結(jié)果[7]。
Daw和Burton(1994)和Holm(1996)的研究發(fā)現(xiàn),盡管心理技能訓(xùn)練顯著降低了運(yùn)動員的焦慮并增強(qiáng)了他們的自信,但并沒有有效提高他們的運(yùn)動表現(xiàn)水平[11,17]。季瀏(1998)研究發(fā)現(xiàn),目標(biāo)設(shè)置訓(xùn)練提高了運(yùn)動員的運(yùn)動表現(xiàn)水平,但對其焦慮并無顯著影響[2]。Cohen等(2003)認(rèn)為,降低焦慮并不是提高運(yùn)動表現(xiàn)水平的內(nèi)在機(jī)制[9]。
由于傳統(tǒng)心理技能訓(xùn)練提高運(yùn)動表現(xiàn)效果缺乏實(shí)證研究的充分支持,Moore和Gardner(2004)提出了提高運(yùn)動表現(xiàn)水平的“正念-接受-承諾”方案(Mindfulness-Acceptance-Commitment,MAC)[12]。該方案的有效性已經(jīng)得到眾多實(shí)證研究的支持(Wolanin,2005;Gardner等,2006; Lutkenhouse等,2007;Schwanhausser,2009)[31,14,18,19,24]。但是,令人遺憾的是,傳統(tǒng)心理技能訓(xùn)練仍然支配著運(yùn)動表現(xiàn)增強(qiáng)的實(shí)踐與研究(Mellalieu和Hanton,2009)[21]。從表1和我國運(yùn)動心理學(xué)工作者為北京奧運(yùn)會、殘奧會運(yùn)動員開展的心理訓(xùn)練工作[1]可以看出,中國的情況也是如此。由此可見,臨床運(yùn)動心理干預(yù)研究與臨床實(shí)踐存在脫節(jié)現(xiàn)象,臨床運(yùn)動心理實(shí)踐者采用實(shí)證支持的心理干預(yù)方法的意識比較淡漠。
隨機(jī)對照實(shí)驗(yàn)是心理干預(yù)效果評價實(shí)驗(yàn)設(shè)計首選的方案,但是,臨床運(yùn)動心理學(xué)的干預(yù)研究在開展隨機(jī)組間實(shí)驗(yàn)時卻遇到了重重困難,學(xué)者們?yōu)榭朔死щy做了多種嘗試,但面臨諸多質(zhì)疑。
長期以來,在運(yùn)動心理學(xué)界有一種反對意見,認(rèn)為通過隨機(jī)組間實(shí)驗(yàn)進(jìn)行臨床運(yùn)動心理干預(yù)效果的研究不切合實(shí)際(Martin和Hrycaiko,1983;Moran,2004),也不恰當(dāng)(Callow和Hardy,2005)[7]。他們反對通過隨機(jī)組間實(shí)驗(yàn)進(jìn)行臨床運(yùn)動心理干預(yù)效果研究的理由有:1)在實(shí)際的運(yùn)動實(shí)踐中不宜設(shè)計控制組,因?yàn)榻叹毘钟小叭绻环N干預(yù)是有益的,那么,我要整個團(tuán)隊都要接受這種干預(yù)”的理念;2)隨機(jī)對照實(shí)驗(yàn)設(shè)計所要求的“標(biāo)準(zhǔn)的干預(yù)”在運(yùn)動實(shí)踐中與“干預(yù)應(yīng)考慮每個運(yùn)動者的個別特點(diǎn)和需要”是不相容的;3)臨床運(yùn)動心理學(xué)工作者最關(guān)心的是運(yùn)動者個人的健康與福利,而隨機(jī)組間實(shí)驗(yàn)設(shè)計要求研究者努力控制各種潛在變量,創(chuàng)設(shè)一種人為的環(huán)境,這與真正的臨床實(shí)踐不同,也非常不舒服;4)可用做臨床運(yùn)動心理干預(yù)研究的被試較少(Anderson等,2002)[4];5)臨床研究中被試不一定完全投入地接受干預(yù)甚至?xí)型就顺?6)正常的訓(xùn)練秩序不可能隨意改變,運(yùn)動員(尤其是高水平運(yùn)動員)常常不能隨機(jī)分組。
在難以隨機(jī)分組的情況下,有些研究者通過比較自愿選擇干預(yù)組和對照組的差異來說明臨床運(yùn)動心理干預(yù)的實(shí)際效果,但這種方法受到強(qiáng)烈質(zhì)疑。因?yàn)?在這種條件下干預(yù)組與對照組之間存在治療動機(jī)和心理發(fā)展?fàn)顩r的系統(tǒng)差異,這種差異會混淆心理干預(yù)的效果。治療動機(jī)、心理發(fā)展?fàn)顩r既影響被試選擇參與治療,同時,也與治療效果密切相關(guān),這種同時影響干預(yù)措施分配和干預(yù)結(jié)果的變量稱為混雜因素。消除混雜因素對推斷結(jié)果的影響是臨床運(yùn)動心理干預(yù)效果研究的難題。
為了克服運(yùn)動員無法隨機(jī)分組的問題,一些研究者采取了以固定群體為單位隨機(jī)分配不同方案進(jìn)行干預(yù)實(shí)驗(yàn)的方法,即組群隨機(jī)實(shí)驗(yàn)(cluster-randomized trials)。例如,Smoll等(2007)[28]關(guān)于教練員的動機(jī)氛圍干預(yù)對少年運(yùn)動員成就動機(jī)變化的影響研究中,被試由37個教練員和225個少年運(yùn)動員組成。研究者不是將運(yùn)動員隨機(jī)分組,而是將20個教練員所帶領(lǐng)的運(yùn)動隊作為實(shí)驗(yàn)組(共計155名運(yùn)動員),要求教練員為運(yùn)動員提供掌握取向的動機(jī)氛圍,而其他17個教練員所帶的運(yùn)動隊作為對照組,沒有給他們訓(xùn)練方式的指導(dǎo)。在結(jié)果處理時通過t檢驗(yàn)來考察實(shí)驗(yàn)組和對照組成就動機(jī)取向的差異。
在組群隨機(jī)實(shí)驗(yàn)中,同一群內(nèi)的個體由于具有某些相同的特征或受到一些共同因素的影響常常表現(xiàn)出一定的相似性,從而產(chǎn)生了群內(nèi)相關(guān),而群內(nèi)相關(guān)的存在使得有關(guān)個體指標(biāo)的方差發(fā)生了“膨脹”,這樣,當(dāng)隨機(jī)化單位是群體,而統(tǒng)計推斷單位是個體時,若誤用傳統(tǒng)的統(tǒng)計分析方法,則由于忽視群效應(yīng)所造成的方差“膨脹”容易產(chǎn)生虛假的統(tǒng)計顯著性結(jié)論,增大了統(tǒng)計推斷的I型誤差[30]。因此,Zueker(1990)指出:將適合于個體隨機(jī)實(shí)驗(yàn)的分析方法應(yīng)用于組群隨機(jī)實(shí)驗(yàn)實(shí)際上是一種自我欺騙的數(shù)字游戲,這樣的統(tǒng)計結(jié)論不應(yīng)被接受。另外,組群隨機(jī)實(shí)驗(yàn)由于分層需要大量的群組(Hayes,Bennet)[16],這在臨床運(yùn)動心理學(xué)實(shí)踐中不易做到。
為了克服運(yùn)動員無法隨機(jī)分組的問題,一些研究者采取了不等同對照組設(shè)計,其模式為:實(shí)驗(yàn)組前測O1→實(shí)驗(yàn)處理→后測O2;控制組前測O3→后測O4。研究者通過前測分?jǐn)?shù)(O1和O3)和對實(shí)驗(yàn)處理有潛在影響的變量來比較實(shí)驗(yàn)組和控制組,如果2組相等,或偏差不至于影響實(shí)驗(yàn)結(jié)果,則可以開始實(shí)驗(yàn),最后通過后測的比較來評定實(shí)驗(yàn)處理的效果。
不等同對照組設(shè)計的問題主要有:1)前測的作用容易形成練習(xí)效應(yīng),對某些研究不適宜;2)前測還要測量一些相關(guān)變量,研究者難以正確取舍對實(shí)驗(yàn)造成影響的變量;3)前測使測試量加大了,不太經(jīng)濟(jì);4)如果通過比較發(fā)現(xiàn)對照組之間前測結(jié)果不相等,問題就要更復(fù)雜一些,需要通過匹配被試或協(xié)變量后才可進(jìn)行實(shí)驗(yàn)。
在實(shí)際的研究中,研究者常常在對照組有差異的情況下就進(jìn)行對比實(shí)驗(yàn),影響了研究推論的可靠性。例如,“幾種心理訓(xùn)練方法的應(yīng)用效果及其綜合評價手段的研究”一文中,被試由24人組成,選7人作為實(shí)驗(yàn)組進(jìn)行心理訓(xùn)練,其他人作為控制組。實(shí)驗(yàn)組與對照組人員分配依據(jù)未報告,但從前測結(jié)果看,2組被試在認(rèn)知焦慮上存在顯著差異,在軀體焦慮存在非常顯著的差異,后測時,實(shí)驗(yàn)組與控制組這2方面仍然存在著顯著的差異。研究者認(rèn)為,心理訓(xùn)練顯著降低了認(rèn)知焦慮,而軀體焦慮水平的變化不明顯,說明運(yùn)動員賽前的軀體焦慮并不是主要的心理障礙,這種解釋令人費(fèi)解。
在國外臨床運(yùn)動心理學(xué)領(lǐng)域,個案實(shí)驗(yàn)設(shè)計一直被用來替代隨機(jī)組間實(shí)驗(yàn)設(shè)計而位于干預(yù)效果評價方法之首(Barlow等,1984;Hrycaiko和Martin,1996)[6]。我國運(yùn)動心理學(xué)者也常常通過個案設(shè)計實(shí)驗(yàn)來證明心理干預(yù)的有效性,如韓玲等(2006)對藝術(shù)體操運(yùn)動員進(jìn)行的心境管理訓(xùn)練研究;林嶺等(2007)對雅典奧運(yùn)會女子柔道運(yùn)動員進(jìn)行的控降體重個案研究;姒剛彥等(2008)對一位奧運(yùn)銀牌運(yùn)動員的“低挫折容忍度”心理干預(yù)研究;張忠秋等(2009)對高水平運(yùn)動員開展的賽前行為干預(yù)研究等。
個案實(shí)驗(yàn)設(shè)計的優(yōu)點(diǎn)包括:1)可在真實(shí)的環(huán)境中進(jìn)行,不必象實(shí)驗(yàn)室實(shí)驗(yàn)研究那樣嚴(yán)格控制條件;2)可以搜集各種質(zhì)性與量性的數(shù)據(jù),全面呈現(xiàn)干預(yù)模式;3)非常適用于檢驗(yàn)一種新的干預(yù)方案的效果;4)有利于充分理解個案(Anderson等,2002)[4]。
但是,僅憑個案來評價心理干預(yù)的有效性是令人懷疑的,它本身并不能充分說明干預(yù)的效果。這是因?yàn)?1)個案研究通常只涉及少數(shù)幾個被試,這幾個被試又常常不是從隨機(jī)抽樣獲得的,因此,個案研究的結(jié)果常常不太容易推廣到總體(張力為,2002);2)從統(tǒng)計學(xué)角度講,只有一個或幾個案例的研究無法做干預(yù)效果的顯著性分析;3)個案研究條件控制常常難以保證,有些情況下又無法操縱自變量,不能保證排除干預(yù)以外因素的影響,因此,往往難以得出因果關(guān)系的確切結(jié)論(張力為,2002;Gardner, 2009;Barlow和Nock,2009)[6,15];4)在臨床運(yùn)動心理學(xué)實(shí)際工作中,人們并不希望撤除干預(yù)或看到來訪者心理健康狀況的惡化,因此,ABAB方式的個案實(shí)驗(yàn)設(shè)計在某些情況下是違犯職業(yè)道德的,不便被廣泛應(yīng)用;5)對于單個被試不同行為進(jìn)行干預(yù)的多基線設(shè)計可能存在泛化效應(yīng)。
總之,臨床運(yùn)動心理干預(yù)研究的困境可分為兩類,即觀念問題與方法的局限。隨著循證心理學(xué)的進(jìn)一步發(fā)展,觀念問題自然會得到解決,但方法的局限則必須通過深入研究來解決。
近年來,經(jīng)濟(jì)學(xué)、統(tǒng)計學(xué)和醫(yī)藥學(xué)等領(lǐng)域關(guān)于實(shí)驗(yàn)設(shè)計和分析技術(shù)已經(jīng)取得了巨大的進(jìn)步,可以通過更為完善的研究設(shè)計與分析更為精確地進(jìn)行干預(yù)效果評估,這也導(dǎo)致了通過現(xiàn)場實(shí)驗(yàn)評估心理干預(yù)效果研究的復(fù)興[30],對臨床運(yùn)動心理干預(yù)效果研究無疑具有很強(qiáng)的借鑒意義。
在臨床醫(yī)學(xué)中,依從性(compliance)指患者執(zhí)行醫(yī)囑的客觀應(yīng)答程度。在臨床運(yùn)動心理干預(yù)研究中,難免會出現(xiàn)被試的依從性問題,即有些被試由于各種各樣的原因沒有完全接受干預(yù)措施或中途退出。被試的依從性與治療效果密切相關(guān),一種治療能否發(fā)揮其應(yīng)有的療效,首先取決于該治療是否被積極地接受,不依從或依從性差是導(dǎo)致治療無效的最常見原因。以往效果評價常簡單地排除不依從的案例,而簡單地將退出、未完成治療或失訪的病例排除于結(jié)果的分析,由于破壞了隨機(jī)化的原則,將會影響結(jié)果的真實(shí)性,夸大治療的效果。因此,應(yīng)將其納入資料分析。
隨機(jī)臨床實(shí)驗(yàn)中的意向性治療分析(Intent-to-treat Analysis,ITT),是指參與隨機(jī)分組的對象,無論其是否真正接受了該組的治療,是否完成了實(shí)驗(yàn),都最終納入所分配的組中進(jìn)行療效的統(tǒng)計分析[5,30]。結(jié)果指標(biāo)的類型不同(計數(shù)或計量資料),意向性治療分析的方法也不同。對于結(jié)果為計數(shù)資料的實(shí)驗(yàn),由于不能確定患者治療的結(jié)果,通常將實(shí)驗(yàn)組和對照組退出和失訪的病例作為治療失敗處理。對于計量資料,對退出和失訪病例的結(jié)果采用治療前或最后一次隨訪測定的水平作為其納入最后分析的測定值。這種分析保存了最初的隨機(jī)分配的完整性,提供了特殊治療目標(biāo)實(shí)現(xiàn)狀況的無偏估計,使臨床干預(yù)效果的結(jié)論趨于保守和客觀。
臨床運(yùn)動心理干預(yù)隨機(jī)實(shí)驗(yàn)中被試的脫落導(dǎo)致隨機(jī)實(shí)驗(yàn)可信度的下降,尤其是當(dāng)實(shí)驗(yàn)組與對照組脫落情況不同時。
有2種方法可以處理被試的脫落:第1種方法,是早期積極預(yù)防被試的脫落,這要求研究人員走出辦公室,深入訓(xùn)練場地與賽場,全身心地投入研究,做長期的追蹤;第2種方法,是分析被試脫落對效果評估潛在影響。Shadish等(1998)開發(fā)了用二分法(脫落者成功或失敗)檢驗(yàn)被試退出對效果評估的潛在影響的方法及電腦軟件。他們采用這種方法評估了家庭治療對物質(zhì)濫用者的療效(研究采用隨機(jī)對照實(shí)驗(yàn),但被試脫落率高),結(jié)果顯示,無論脫落者成功或者失敗,治療都是成功的[25]。
近年來,經(jīng)濟(jì)學(xué)家和統(tǒng)計學(xué)家已經(jīng)提出了解決混雜因素困境的方法,即傾向得分匹配法(Propensity Score Matching,PSM)。
Rosenbaum和Rubin(1983)提出,利用傾向得分匹配法來消除混雜因素所致的偏差。近年來,此法被廣泛應(yīng)用于醫(yī)藥、經(jīng)濟(jì)和政策評價研究等領(lǐng)域,成為因果推斷實(shí)證研究中最常用的方法[23]。
傾向得分匹配法是用于非隨機(jī)(非實(shí)驗(yàn))設(shè)計調(diào)查數(shù)據(jù)資料的分析研究,通過傾向得分及給定的匹配條件,由電腦為處理組個體與非處理組中的個體進(jìn)行海量的比較,尋找合適的可比對象進(jìn)行配對,在合理配對后再進(jìn)行相關(guān)結(jié)果指標(biāo)的比較,從而去除選擇性偏倚和混雜偏倚。
傾向得分估計量的基本思想是:干預(yù)組的第i個被研究對象在沒有進(jìn)行干預(yù)措施這一假設(shè)下的匹配值等于控制組觀察值的加權(quán)平均值,其權(quán)重的大小取決于第i個被研究對象的傾向得分Pi和控制組第j個被研究對象的傾向得分Pj。
傾向得分匹配法的步驟為:首先擬合出參與治療傾向的概率模型,計算出每個參與治療的被試的參與治療概率,再用此模型套用至對照組的數(shù)據(jù)庫,假定對照組也參與治療的情況下,也計算出每個被試的參與治療概率,利用PSM中的mahalanobis匹配方法,除了控制接受治療概率得分相近外,同時控制健康狀況和其他變量,經(jīng)電腦根據(jù)2組最相近的情況進(jìn)行個體匹配,再計算能理想匹配的2組人群的欲比較指標(biāo),然后用boot strap法進(jìn)行運(yùn)算檢驗(yàn)。Rubin(2008)總結(jié)了傾向得分匹配方法在實(shí)證研究中可能被誤用的一些情形,給出了一些實(shí)踐指導(dǎo),可供臨床運(yùn)動心理學(xué)研究者參考[23]。
目前,針對組群實(shí)驗(yàn)中的問題在兩方面取得了突破[30]。首先,發(fā)明了許多適合處理組群實(shí)驗(yàn)數(shù)據(jù)的統(tǒng)計模型及相關(guān)的計算機(jī)程序(Donner,Klar,1996;Murray, 1998;Raudenbush,Bryk,2002)。統(tǒng)計模型主要有分層線性模型、多層次模型、隨機(jī)系數(shù)模型,計算機(jī)程序主要有HLM(Raudenbush等,2004)、MLwiN(Rasbash等,2005)和SAS Proc Mixed(Littell,2006);其次,組群設(shè)計得到了改進(jìn)。因?yàn)榻M群隨機(jī)設(shè)計潛在的問題是多層次模型要獲得理想的顯著性(0.80)需要大量的組群(每一種處理需要50組),但客觀上常常難以做到。近年來,研究者采用匹配、分層、重測或預(yù)測的方法改進(jìn)了組群設(shè)計,這樣,獲得理想的顯著性每一種處理只需要10~12組。
現(xiàn)在已經(jīng)出現(xiàn)了應(yīng)對非等同對照組實(shí)驗(yàn)弊端的實(shí)驗(yàn)設(shè)計方法。
首先,在研究設(shè)計上采用焦點(diǎn)局部控制(Focal local controls)[30],即對照組與干預(yù)組的被試在與治療結(jié)果相關(guān)的關(guān)鍵特征上要基本相似,且來自同一地區(qū)和背景。
其次,也可采用相等的匹配設(shè)計來克服非等同對照組實(shí)驗(yàn)的弊端。在準(zhǔn)實(shí)驗(yàn)設(shè)計中,實(shí)驗(yàn)者不可能去匹配被試,也不可能隨機(jī)地把每個匹配單元中的一個成員分派到一個處理中去,只能通過尋找與接受干預(yù)組的被試匹配的被試作為對照組。
再次,匹配穩(wěn)定的協(xié)變量。在臨床準(zhǔn)實(shí)驗(yàn)設(shè)計中,干預(yù)組和對照組都是已存在的。研究者為了使干預(yù)組與對照組相等,可使用一種協(xié)變量,即因變量的協(xié)變,達(dá)到干預(yù)組與對照組相等。通常采用前測分?jǐn)?shù)作為協(xié)變分?jǐn)?shù)。
臨床運(yùn)動心理干預(yù)有時要考慮臨界值的問題。例如,如果運(yùn)動員的壓力指數(shù)達(dá)到臨界值,就需要安排其接受壓力應(yīng)對訓(xùn)練;如果運(yùn)動員的焦慮達(dá)到臨界值,就要安排其接受焦慮干預(yù)。這時,可以采用回歸間斷設(shè)計(Regression discontinuity designs,RDD)來評估其干預(yù)效果。
回歸間斷設(shè)計分配組是以自變量上的截止分?jǐn)?shù)為依據(jù)的,分?jǐn)?shù)落在截止分?jǐn)?shù)的一邊接受干預(yù)處理,另一邊作為對照組。只要任務(wù)變量(assignment variable)與結(jié)果變量(outcome variables)之間的關(guān)系符合線性模型,就可以通過考察實(shí)驗(yàn)組和控制組的回歸直線在截點(diǎn)處連續(xù)或間斷的程度來推論干預(yù)效果。如果實(shí)驗(yàn)處理前后的的回歸線出現(xiàn)了間斷,說明實(shí)驗(yàn)處理是有效果的。
研究表明,在截點(diǎn)處的回歸間斷是一個無偏估計(G oldberger,1972;Rubin,1977)。RDD在經(jīng)歷長期休眠后于20世紀(jì)90年代興盛起來,在經(jīng)濟(jì)學(xué)領(lǐng)域得到廣泛應(yīng)用。它是因果關(guān)系推論的一種理想方法(Cook,2007)[10],當(dāng)研究以需要和價值為基礎(chǔ)的干預(yù)效果時,尤其有用。
如果任務(wù)變量和結(jié)果變量之間的關(guān)系是非線性的,我們也可以發(fā)現(xiàn)確定的間斷,但這是人為的錯誤的模型,而不是真正的效果。為了減少此問題,Shadish等(2002)[26]建議:1)通過檢查圖表來識別非線性;2)通過增加任務(wù)變量的非線性函數(shù)和自變量與結(jié)果之間的交互作用來滿足線性模型;3)用相同的變量比較RDD的數(shù)據(jù)和干預(yù)前的數(shù)據(jù),使干預(yù)前的回歸情況(作為對抗?jié)撛诜蔷€性的控制)可以從治療效果中分離出來;4)用不以線性為假設(shè)的非參數(shù)估計技術(shù),如內(nèi)核密度指數(shù)和局部線性回歸技術(shù)等。
個案實(shí)驗(yàn)研究所面臨的挑戰(zhàn)之一是難以對數(shù)據(jù)進(jìn)行統(tǒng)計分析,只能運(yùn)用一些描述統(tǒng)計方法來對實(shí)驗(yàn)結(jié)果進(jìn)行解釋,即先把在實(shí)驗(yàn)中基線階段與處理階段所獲得數(shù)據(jù)用圖表的形式呈現(xiàn)出來,之后通過視覺分析(Visual Analysis of Graphs)的辦法來對實(shí)驗(yàn)結(jié)果進(jìn)行直觀判斷。這種分析實(shí)驗(yàn)效果的方法在對實(shí)驗(yàn)結(jié)果進(jìn)行判斷時極易出現(xiàn)偏差[27],比如,制圖時所選用的縱坐標(biāo)單位的不同就會直接影響對實(shí)驗(yàn)結(jié)果的判斷。
隨著研究的進(jìn)一步深入,個案實(shí)驗(yàn)的隨機(jī)檢驗(yàn)方法(randomization test for single-case designs)被提出。此種方法是通過隨機(jī)分配實(shí)驗(yàn)處理(而不是隨機(jī)分配被試)的方法來確定實(shí)驗(yàn)結(jié)果是否是自變量的引入而發(fā)生變化的。T odman和Dugard(2001)[29]運(yùn)用先進(jìn)的計算機(jī)技術(shù),在現(xiàn)有的統(tǒng)計程序基礎(chǔ)上進(jìn)行了系統(tǒng)的深化與擴(kuò)展,使得這種方法在實(shí)際研究中可以被更多的研究者采用。
臨床運(yùn)動心理干預(yù)效果評價是一個新的課題,從年輕到成熟需要專業(yè)人員的不斷探索和總結(jié)。臨床運(yùn)動心理干預(yù)效果評價研究水平的突破,在很大程度上有賴于研究設(shè)計的突破。
本研究簡要分析了臨床運(yùn)動心理干預(yù)研究設(shè)計的現(xiàn)狀與困境,并結(jié)合近年來經(jīng)濟(jì)學(xué)、統(tǒng)計學(xué)和醫(yī)藥學(xué)等領(lǐng)域研究方法的進(jìn)步,提出了解決這些問題的對策,希望這些方法對從事臨床運(yùn)動心理干預(yù)研究的同仁具有一定的參考價值,且能起到拋磚引玉的作用,引發(fā)更多的關(guān)于臨床運(yùn)動心理干預(yù)有效性評估方法的研究,使臨床運(yùn)動心理學(xué)的實(shí)踐建立在科學(xué)實(shí)證的基礎(chǔ)之上,使運(yùn)動者的利益得到更有效的保護(hù)。
[1]北京奧運(yùn)會、殘奧會運(yùn)動員心理訓(xùn)練工作論壇論文摘要集[C].北京:中國心理學(xué)會體育運(yùn)動心理分會、中國體育科學(xué)學(xué)會運(yùn)動心理學(xué)分會,2008.
[2]季瀏.短期目標(biāo)和長期目標(biāo)設(shè)置對投籃成績、努力程度和狀態(tài)焦慮的影響[J].心理科學(xué),1998,9(2):140-145.
[3]張力為.兒童乒乓球運(yùn)動員表象訓(xùn)練的實(shí)驗(yàn)研究[J].北京體育學(xué)院學(xué)報,1990,13(2):21-26.
[4]ANDERSON A G,MILES A,MAHONEY C,et al.Evaluating the effectiveness of applied sport psychology:Making the case for a case study approach[J].Sport Psychol,2002,16:432-453.
[5]BANG HEEJUNG,DAVIS CLARENCE E.On estimating treatment effects under non-compliance in randomized clinical trials: Are intent-to-treat or instrumental variables analyses perfect solutions[J].Statistics Med,2007,26:954-964.
[6]BARLOW D E,NOCK M K.Why can’t we be more idiographic in our research[J].Perspective Psychol Sci,2009,4:19-21.
[7]CALLOW N,HARDY L.A critical analysis of applied imagery research[A].In G.D.HRCKFORT,J.L.DUDA,R.LIDOR (Eds.),Handbook of research in applied sport and exercise psychology:International perspectives[M].Morgantown:WV:Fitness Information Technology,2005.
[8]CHAMBLESS D L,OLLENDICK T H.Empirically supported psychological intervention:Controversies and evidence[M].Annual Rev Psychol,2001,52:685-716.
[9]COHEN A,PARGMAN D,TENENBAUM G.Critical elaboration and empirical investigation of the cusp catastrophe model:A lesson for practitioners[J].J Appl Sport Psychol,2003,15(2): 144-159.
[10]COOK TD.“Waiting for Life to Arrive”:A history of the regression-discontinuity design in Psychology,Statistics and Economics[J].J Econometrics,2008,142(2):636-654.
[11]DAW J,BURTON D.Evaluation of a comprehensive psychological skill training program for collegiate tennis players[J]. Sport Psychol,1994,8(1):37-57.
[12]FEL TZ D L,LANDERS D M.The effectors of mental practice on motor skill learning and performance,A meta analysis[J].J Sport Psychol,1983,5:25-57.
[13]GARDNER F L,MOORE Z E.A Mindfulness-Acceptance-Commitment(MAC)based approach to performance enhancement:Theoretical considerations[J].Behavior Therapy,2004, 35:707-723.
[14]GARDNER F L,MOORE Z E.Clinical sport psychology[M]. Champaign,IL:Human Kinetics,2006.
[15]GARDNER,F.L.Efficacy,Mechanisms of Change,and the Scientific Development of Sport Psychology[J].J Clinical Sport Psychol,2009,3:139-155.
[16]HAYES R J,BENNET S.Simple sample size calculation for cluster-randomization trials[J].Int J Epidemiology,1999,28: 319-326.
[17]HOLM J E,BECHWITH B E,EHDE D M,et al.Cognitive-behavioral intervention for improving performance in competitive athletes:A controlled treatment outcome study[J].Int J Sport Psychol,1996,27(4):463-475.
[18]LUTKENHOUSE J M.The Case of Jenny:A Freshman Collegiate Athlete Experiencing Performance Dysfunction[J].J Clinical Sport Psychol,2007,(1):166-180.
[19]LUTKENHOUSE J M,GARDNER F L,MOORE Z E.A randomized controlled trial comparing the performance enhancement effects of Mindfulness-Acceptance-Commitment(MAC) performance enhancement and psychological skills training procedures[M].Manuscript in Preparation,2007.
[20]MARTIN GL,VAUSE T,SCHWARTZMAN L.Experimental Studies of Psychological Interventions With Athletes in Competitions Why So Few[J].Behav Modification,2005,29(4):161-147.
[21]MELLALIEU S D,HANTON S.Advances in applied sport psychology:A review[M].New York:Taylor&Francis, 2009.
[22]MOORE Z E.Toward the development of an evidence based practice of sport psychology:A structured qualitative study of performance enhancement interventions[D].Doctoral Dissertation,La Salle University,Dissertation Abstracts International B,2003.
[23]RUBIN D B.For objective causal inference:design trumps analysis[J].Annual Appl Statistic,2008,(3):808-840.
[24]SCHWANHAUSSER L.Application of the Mindfulness-Acceptance-Commitment(MAC)protocol with an adolescent springboard diver[J].J Clinical Sport Psychol,2009,4:377-395.
[25]SHADISH W R,HU X,Glaser R R,et al.A method for exploring the effects of attrition in randomized experiments with dichotomous outcomes[J].Psychol Method 1998,3:3-22.
[26]SHADISH W R,COOK T D,CAMPBELL D T.Experimental and quasi-experimental designs for generalized causal inference [M].Boston,MA:Houghton-Mifflin,2002.
[27]SHARPLEY C F.Some arguments against analyzing client change graphically[J].J Counsel Develop,1986,65:156-159.
[28]SMOLL F L,SMITH R E,CUMMING S P.Effects of a motivational climate intervention for coaches on changes in young athletes’achievement goal orientations[J].J Clinical Sport Psychol,2007,1:23-46.
[29]TODMAN J B,DUGARD P.Single-case and small experimental designs:A practical guide to randomization test[M].MAHWAH,NJ:Lawrence Erlbaum Associates Inc,2001.
[30]WILLIAM R,SHADISH,THOMAS D.Cook.The Renaissance of Field Experimentation in Evaluating Interventions[J].Annual Rev Psychol,2009,60:607-629.
[31]WOLANIN A.T.Mindfulness-acceptance-commitment(MAC) based performance enhancement for Division I collegiate athletes:A preliminary investigation[M].Dissertation Abstracts International,2005.
The Status,Predicaments and Solutions on Experimental Designs of Effectiveness Evaluation of Interventions in Clinical Sport Psychology
LIU Li,SHI Yan
The effectiveness evaluation of interventions was an important task in clinical sport psychology.The practitioners must take responsibility to evaluate and prove its effectiveness. Firstly,this paper analyzed the status and predicaments on experimental designs of effectiveness evaluation of clinical sport psychological interventions,and then solve these problems, combining with the methods improvement in economic,statistics,and medicine health research in recent years,proposed some countermeasures including intent-to-treat analysis,the prevention and analysis of attrition,propensity score analysis,analysis of nested designs,focal local controls,regression discontinuity designs and randomization test for single-case designs.
clinical sport psychology;psychological intervention;ef f ectiveness evaluation;experimental designs
G804.8 文獻(xiàn)標(biāo)識碼:A
1000-677X(2010)09-0030-07
2010-06-21;
2010-08-20
劉麗(1967-),女,山西霍州人,副教授,碩士,碩士研究生導(dǎo)師,在讀博士研究生,主要研究方向?yàn)轶w育心理學(xué)與學(xué)校心理學(xué),Tel:(0351)7010522,E-mail:Liuli@sxu. edu.c;石巖(1966-),男,山西汾陽人,教授,博士,博士研究生導(dǎo)師,主要研究方向?yàn)轶w育心理學(xué)與運(yùn)動訓(xùn)練學(xué), E-mail:tyshiyan@163.com。
山西大學(xué),山西太原030006 Shanxi University,Taiyuan 030006,China.