尚志忠,姜彥彪,趙冰,張哲文,張婷,張俊華,馬彬
目前,開(kāi)展動(dòng)物實(shí)驗(yàn)Meta分析已被認(rèn)為是探索提升動(dòng)物實(shí)驗(yàn)對(duì)臨床研究指導(dǎo)價(jià)值的有效途徑,可有效降低其結(jié)果向臨床轉(zhuǎn)化時(shí)的風(fēng)險(xiǎn)[1]。但由于動(dòng)物實(shí)驗(yàn)與臨床試驗(yàn)間存在一定差異[2],使得動(dòng)物實(shí)驗(yàn)Meta分析在方法學(xué)標(biāo)準(zhǔn)等多個(gè)方面與臨床研究不同。在對(duì)動(dòng)物實(shí)驗(yàn)進(jìn)行Meta分析時(shí),可參考臨床試驗(yàn)Meta分析的方法學(xué),但需要針對(duì)動(dòng)物研究特點(diǎn)進(jìn)行調(diào)整和優(yōu)化[3]。因此,本文主要介紹動(dòng)物實(shí)驗(yàn)Meta分析中異質(zhì)性的來(lái)源、相關(guān)數(shù)據(jù)處理等問(wèn)題,以期為動(dòng)物實(shí)驗(yàn)Meta分析提供一定的指導(dǎo)。
由于動(dòng)物實(shí)驗(yàn)的特點(diǎn),使得動(dòng)物實(shí)驗(yàn)Meta分析與臨床試驗(yàn)Meta分析在研究目的、數(shù)據(jù)效應(yīng)量的選擇、異質(zhì)性的來(lái)源等多個(gè)方面存在差異(表1)[4]。
表1 動(dòng)物實(shí)驗(yàn)與臨床試驗(yàn)Meta分析的區(qū)別
動(dòng)物實(shí)驗(yàn)Meta分析步驟主要包括5個(gè)步驟:①納入研究間異質(zhì)性評(píng)估;②數(shù)據(jù)收集及效應(yīng)尺度選擇;③選擇合理的統(tǒng)計(jì)分析模型;④減小與評(píng)估發(fā)表偏倚;⑤數(shù)據(jù)結(jié)果呈現(xiàn)并作出相應(yīng)的解釋。
2.1 納入研究間異質(zhì)性評(píng)估由于動(dòng)物實(shí)驗(yàn)Meta分析通常解決是比原始研究更廣泛的研究問(wèn)題[5],因此,納入的研究在動(dòng)物種屬、結(jié)果類型、測(cè)量時(shí)間等方面具有多樣性。為了能夠?qū)δ骋惶囟ǖ难芯繂?wèn)題提供有指導(dǎo)意義的證據(jù),進(jìn)行Meta分析的研究必須在研究對(duì)象、干預(yù)措施、實(shí)驗(yàn)設(shè)計(jì)和結(jié)果等方面具有充分的同質(zhì)性[6]。因此,在合并統(tǒng)計(jì)量前,需對(duì)納入研究進(jìn)行異質(zhì)性檢驗(yàn)。通過(guò)前瞻性定義嚴(yán)格納入和排除標(biāo)準(zhǔn),并對(duì)相似研究進(jìn)行合理的比較,可減少/降低異質(zhì)性。此外,如果Meta分析是以研究影響總效應(yīng)量的因素或關(guān)注研究特征和結(jié)局指標(biāo)間的關(guān)系為目的,則可包括更多異質(zhì)性較大的研究。
2.1.1 異質(zhì)性的來(lái)源動(dòng)物實(shí)驗(yàn)Meta分析中,異質(zhì)性可分為研究?jī)?nèi)和研究間兩方面。動(dòng)物實(shí)驗(yàn)研究?jī)?nèi)異質(zhì)性主要來(lái)自:①研究對(duì)象:同一種屬或品系動(dòng)物在飼養(yǎng)過(guò)程中因疾病或外界環(huán)境影響,在實(shí)驗(yàn)過(guò)程中其對(duì)相同干預(yù)措施及環(huán)境因素的反應(yīng)存在差異;②動(dòng)物安置:實(shí)驗(yàn)動(dòng)物安置的不同可導(dǎo)致其生存條件的差異,如當(dāng)飼養(yǎng)動(dòng)物的籠子處于不同高度或位置時(shí),其光照強(qiáng)度與溫度等均存在細(xì)微差異,亦若在動(dòng)物飼養(yǎng)過(guò)程中研究人員未對(duì)動(dòng)物進(jìn)行隨機(jī)化安置,則造成動(dòng)物因不同的外界環(huán)境而產(chǎn)生不同的反應(yīng)[7]。
相較于動(dòng)物研究?jī)?nèi)的異質(zhì)性,動(dòng)物研究間異質(zhì)性更明顯,主要包括:①研究對(duì)象:各研究間納入/排除標(biāo)準(zhǔn)的差異,實(shí)驗(yàn)動(dòng)物所代表的群體差異,實(shí)驗(yàn)規(guī)模的大小、實(shí)驗(yàn)場(chǎng)所不同以及對(duì)照個(gè)體的選擇所造成的差異等。②干預(yù)措施:藥物的劑量與劑型、給藥途徑與時(shí)間、干預(yù)措施的組合方式與作用時(shí)間的差異等。③實(shí)驗(yàn)設(shè)計(jì):如實(shí)驗(yàn)動(dòng)物是否隨機(jī)分組、隱蔽分組是否正確、是否實(shí)施盲法、樣本大小是否合理、實(shí)驗(yàn)動(dòng)物模型是否充分一致、實(shí)驗(yàn)過(guò)程中對(duì)結(jié)局指標(biāo)的定義和測(cè)量方法是否一致、納入研究可能由于研究目的不同導(dǎo)致對(duì)實(shí)驗(yàn)動(dòng)物的選擇、數(shù)據(jù)的收集與評(píng)價(jià)的傾向性出現(xiàn)差異;④統(tǒng)計(jì)學(xué):因隨機(jī)誤差和多種偏倚的存在,動(dòng)物實(shí)驗(yàn)結(jié)果僅能近似反映研究的真實(shí)效應(yīng)。若研究結(jié)果與真實(shí)效應(yīng)的差異超出了隨機(jī)誤差的范圍,則會(huì)導(dǎo)致各研究間存在較大統(tǒng)計(jì)學(xué)異質(zhì)性。⑤結(jié)果合并:不同種屬動(dòng)物,由遺傳決定的生物學(xué)基礎(chǔ)不同,在解剖結(jié)構(gòu)、代謝過(guò)程、疾病的發(fā)病機(jī)制等方面均存在差異,則需考慮合并的合理性;不同種屬或品種的實(shí)驗(yàn)動(dòng)物的結(jié)果合并后能夠代表何種動(dòng)物的合并結(jié)果,其代表的研究總體是否產(chǎn)生了更大不確定性;是否需要限定最低的樣本量以使各研究具有較好的同質(zhì)性和代表性;研究所得的結(jié)果及結(jié)論是否真實(shí)可靠,結(jié)果報(bào)告是否充分正確。此外,雖然使用多個(gè)種屬動(dòng)物模型的研究可探索或全面評(píng)估干預(yù)措施的有效性和安全性,但不同研究的動(dòng)物模型是否足夠標(biāo)準(zhǔn)化或是否使用了公認(rèn)而穩(wěn)定的模型以降低研究間異質(zhì)性。
2.1.2 異質(zhì)性的檢驗(yàn)與處理Meta分析僅對(duì)符合納入/排除標(biāo)準(zhǔn),探索相同主題的研究進(jìn)行統(tǒng)計(jì)合并。異質(zhì)性的存在影響各研究之間效應(yīng)量的合并,若不能對(duì)研究間存在的異質(zhì)性加以控制,或進(jìn)行合理解釋和分析,將嚴(yán)重降低Meta分析所得結(jié)果和結(jié)論的可信度[8,9]。因此,必須對(duì)納入研究的異質(zhì)性進(jìn)行評(píng)價(jià),包括異質(zhì)性檢驗(yàn)和異質(zhì)性處理兩個(gè)方面。
①異質(zhì)性檢驗(yàn)的方法異質(zhì)性檢驗(yàn)的方法包括定性和定量?jī)煞N,其中定性方法有圖示法,包括森林圖、拉貝圖、星狀圖,可以直觀觀察研究之間是否存在異質(zhì)性[10];定量統(tǒng)計(jì)分析方法包括Q檢驗(yàn),I2和H檢驗(yàn),可準(zhǔn)確檢驗(yàn)異質(zhì)性大小[9]。若經(jīng)上述方法檢測(cè)出研究間存在較大異質(zhì)性(P<0.05或I2>50%[11]),可通過(guò)亞組分析、Meta回歸分析等方法探索異質(zhì)性的來(lái)源并對(duì)異質(zhì)性進(jìn)行處理[12]。
②異質(zhì)性處理動(dòng)物實(shí)驗(yàn)研究的亞組分析是根據(jù)一定的研究水平變量(如研究設(shè)計(jì)、研究對(duì)象、干預(yù)措施的種類等)將研究分為若干亞組,然后對(duì)每個(gè)亞組分別進(jìn)行效應(yīng)量的合并以探討異質(zhì)性的來(lái)源[13]。亞組分析等同于Meta回歸分析中實(shí)驗(yàn)水平上的分類協(xié)變量。一次亞組分析僅能分析一個(gè)變量,而動(dòng)物實(shí)驗(yàn)通常樣本量較小而異質(zhì)性較大[4],過(guò)多亞組分析會(huì)導(dǎo)致Meta分析變得復(fù)雜而難以理解,因此,宜采用Meta回歸分析探索異質(zhì)性的來(lái)源以簡(jiǎn)化分析步驟。
Meta回歸分析是以研究結(jié)果的估計(jì)為因變量,一個(gè)或多個(gè)研究水平變量為自變量,采用回歸分析的方法探討各變量對(duì)Meta分析中合并效應(yīng)的影響,以明確各研究間異質(zhì)性的來(lái)源的研究[13,14]。因其屬于Meta分析的一部分,需遵守Meta分析的一般規(guī)律,符合Meta分析的特點(diǎn);同時(shí),也要符合回歸分析的一般規(guī)律,如樣本量不能過(guò)小,否則會(huì)降低檢驗(yàn)效能。此外,Meta回歸分析也存在局限性,包括混雜偏倚、測(cè)量誤差、無(wú)法獲取所需的全部信息資料,假陽(yáng)性結(jié)論等[15,16]。
2.2 數(shù)據(jù)收集及效應(yīng)尺度選擇[17,18]
2.2.1 二分類數(shù)據(jù)及效應(yīng)尺度選擇對(duì)于各實(shí)驗(yàn)組只有兩種結(jié)果,如死亡或存活、治療成功或失敗等,可選擇比值比(OR)、相對(duì)危險(xiǎn)度(RR)、危險(xiǎn)差(RD)為合并統(tǒng)計(jì)量。若不能獲得總樣本量和目標(biāo)事件發(fā)生數(shù),僅報(bào)告OR或RR值及其95%可信區(qū)間(CI)、標(biāo)準(zhǔn)誤(SE)或P值,則可通過(guò)經(jīng)典的方差倒數(shù)法合并數(shù)據(jù)[3]。OR、RR值作為相對(duì)效應(yīng)尺度指標(biāo),其不受基線風(fēng)險(xiǎn)的影響,具有較好的一致性。但某些情況下相對(duì)指標(biāo)不能反應(yīng)事件的真實(shí)風(fēng)險(xiǎn)情況,易夸大研究結(jié)果的效應(yīng),如實(shí)驗(yàn)組中某種不良反應(yīng)的發(fā)生率為0.8%,對(duì)照組為0.08%,此時(shí)RR=10,此時(shí)若單獨(dú)報(bào)告RR=10,則意味著非常強(qiáng)的聯(lián)系,難以接受干預(yù)措施的風(fēng)險(xiǎn),但如果計(jì)算RD,其數(shù)值僅為0.72%。RD值適用于研究對(duì)象的基線特征具有較好的一致性,當(dāng)所研究的結(jié)局事件在實(shí)驗(yàn)組或?qū)φ战M中全部發(fā)生或?yàn)?時(shí),此時(shí)不能計(jì)算OR和RR,可計(jì)算RD值。
2.2.2 連續(xù)型數(shù)據(jù)及效應(yīng)尺度選擇若納入研究中可提取的數(shù)據(jù)為各實(shí)驗(yàn)組測(cè)量結(jié)果的均數(shù)、標(biāo)準(zhǔn)差和測(cè)量結(jié)果的研究對(duì)象的數(shù)目,則可選擇均數(shù)差(MD or WMD)、標(biāo)準(zhǔn)化均數(shù)差(SMD)或正態(tài)化均數(shù)差(NMD)合并統(tǒng)計(jì)量。①M(fèi)D和WMD是以各研究間的結(jié)果測(cè)量方法或單位相同為基礎(chǔ)計(jì)算合并效應(yīng)量的大小,消除了研究間絕對(duì)值大小的影響,以原有的單位真實(shí)地反應(yīng)實(shí)驗(yàn)效應(yīng)。MD和WMD作為絕對(duì)效應(yīng)尺度指標(biāo),其結(jié)果易于解釋。但因其易夸大研究效應(yīng)且需納入的各研究間結(jié)果測(cè)量方法和尺度相同,導(dǎo)致可推廣性受到限制,如某一干預(yù)措施的干預(yù)效果,使得腦梗塞體積在小鼠模型中減少10 mm3,該結(jié)果與在靈長(zhǎng)類動(dòng)物模型中同樣減少10 mm3相比,小鼠疾病模型的干預(yù)效果要明顯優(yōu)于靈長(zhǎng)類動(dòng)物疾病模型。②NMD是將實(shí)驗(yàn)組干預(yù)措施產(chǎn)生的效應(yīng)與對(duì)照組動(dòng)物自身的效應(yīng)進(jìn)行比較,其應(yīng)用的前提是對(duì)照組的動(dòng)物是未接受任何干預(yù)措施的“正?!眲?dòng)物,且獲得自身效應(yīng),同時(shí)實(shí)驗(yàn)組和對(duì)照組之間的效應(yīng)可用比例尺度進(jìn)行量化比較。NMD的計(jì)算公式為:其中和分別代表研究中對(duì)照組和干預(yù)組的平均效應(yīng),代表未接受任何干預(yù)措施的“正?!眲?dòng)物的平均效應(yīng)。NMD的優(yōu)勢(shì)在于將實(shí)驗(yàn)組的效應(yīng)與正常動(dòng)物相比較,可更好地揭示干預(yù)措施的效應(yīng)。但由于動(dòng)物實(shí)驗(yàn)的樣本量通常較小,且易受到隨機(jī)誤差的影響,導(dǎo)致實(shí)驗(yàn)效應(yīng)的夸大,此時(shí)要使用矯正方法計(jì)算NMD,其具體計(jì)算方法詳見(jiàn) Vesterinen等[3]。若無(wú)法得到正常動(dòng)物的效應(yīng),如每個(gè)高倍視野中的神經(jīng)元數(shù)量,或者自發(fā)的運(yùn)動(dòng)行為等,此時(shí)可計(jì)算SMD[3]。③SMD既不受研究間絕對(duì)值大小的影響,也不受測(cè)量單位的差異對(duì)結(jié)果的影響,適用于各研究間相同干預(yù)措施采用不同的測(cè)量方法,也適用于研究間均數(shù)差異過(guò)大的情況。
有時(shí)原始研究數(shù)據(jù)報(bào)告并非標(biāo)準(zhǔn)和充分,如研究中僅報(bào)告中位數(shù)而未報(bào)告均數(shù);有些僅報(bào)告標(biāo)準(zhǔn)誤、可信區(qū)間、四分位間距、甚至最大值、最小值而未報(bào)告標(biāo)準(zhǔn)差;有些研究報(bào)告的結(jié)局指標(biāo)也不同,如有些研究報(bào)告干預(yù)前后的差值,有些報(bào)告原始數(shù)值,有些報(bào)告對(duì)數(shù)值等。因此,需要對(duì)納入研究的數(shù)據(jù)處理后再進(jìn)行Meta分析[3,16,19]。
2.3 有序數(shù)據(jù)及效應(yīng)尺度選擇各研究對(duì)象被分為幾個(gè)有自然順序的類別,如病情程度的“輕、中、重”等。此外,還有一種常用于測(cè)量行為及認(rèn)知功能的量表所得到的“得分”的特殊類型有序數(shù)據(jù),可作為連續(xù)型數(shù)據(jù)或有序數(shù)據(jù)進(jìn)行提取。如果分類等級(jí)較少,可采用比例優(yōu)勢(shì)模型進(jìn)行Meta分析;如果分類等級(jí)較多,可作為連續(xù)型數(shù)據(jù)進(jìn)行Meta分析,也可以選取適當(dāng)?shù)那懈铧c(diǎn)將其轉(zhuǎn)換為二分類數(shù)據(jù)。
2.4 計(jì)數(shù)數(shù)據(jù)及效應(yīng)尺度選擇部分研究中報(bào)告的是事件發(fā)生的次數(shù),如癲癇發(fā)生次數(shù)等,此類數(shù)據(jù)即為計(jì)數(shù)數(shù)據(jù)??煞譃楹币?jiàn)事件數(shù)據(jù)和常見(jiàn)事件數(shù)據(jù)。對(duì)于罕見(jiàn)事件數(shù)據(jù),常采用的指標(biāo)是“率”,“率”常與觀察時(shí)間跨度內(nèi)事件發(fā)生的次數(shù)有關(guān)。對(duì)于常見(jiàn)事件數(shù)據(jù),可作為連續(xù)型數(shù)據(jù)提取。當(dāng)獲得的頻數(shù)為小概率事件時(shí),若可獲得發(fā)病率,則計(jì)算RR或RD;當(dāng)頻數(shù)為非小概率事件時(shí),可將頻數(shù)當(dāng)作連續(xù)性變量處理。
2.5 時(shí)間事件(生存)數(shù)據(jù)及效應(yīng)量的選擇對(duì)于以死亡、疾病進(jìn)展等某些重要事件發(fā)生的時(shí)間為結(jié)局的觀察性動(dòng)物實(shí)驗(yàn),最好聯(lián)系作者獲得個(gè)體化數(shù)據(jù),重新分析得到logHR及其標(biāo)準(zhǔn)誤,然后進(jìn)行Meta分析。
總之,進(jìn)行Meta分析時(shí),納入研究的不同類型的數(shù)據(jù)均需轉(zhuǎn)化為二分類或連續(xù)性變量合并分析。
隨機(jī)效應(yīng)模型和固定效應(yīng)模型是基于不同的假設(shè)對(duì)研究結(jié)果進(jìn)行合并的兩種統(tǒng)計(jì)方法。固定效應(yīng)模型假設(shè)納入研究間的差異僅由隨機(jī)誤差引起,各研究具有相同的潛在真實(shí)效應(yīng);隨機(jī)效應(yīng)模型允許各研究間因研究特征等方面的差異而存在不同的潛在效應(yīng)[20],其比固定效應(yīng)模型具有更寬的可信區(qū)間。
統(tǒng)計(jì)分析模型的選擇取決于納入研究間異質(zhì)性的大小。若各研究間存在的異質(zhì)性較大,則需通過(guò)亞組分析、Meta回歸分析等探索異質(zhì)性的來(lái)源,使之達(dá)到同質(zhì)后再使用固定效應(yīng)模型;若經(jīng)過(guò)異質(zhì)性分析和處理后,各研究間的異質(zhì)性依舊較大,則考慮選擇隨機(jī)效應(yīng)模型。動(dòng)物實(shí)驗(yàn)因其研究性質(zhì)和多樣性,導(dǎo)致各研究間通常具有較大的異質(zhì)性,宜選擇隨機(jī)效應(yīng)模型進(jìn)行統(tǒng)計(jì)分析[2]。
雖然發(fā)表偏倚在動(dòng)物實(shí)驗(yàn)和臨床試驗(yàn)中均可能出現(xiàn),但在動(dòng)物實(shí)驗(yàn)中可能更為嚴(yán)重[21]。相較于陽(yáng)性結(jié)果,陰性或中立實(shí)驗(yàn)結(jié)果被發(fā)表的概率較低,因此對(duì)陰性或中立實(shí)驗(yàn)結(jié)果的不報(bào)告會(huì)導(dǎo)致高估干預(yù)措施效果[22]。Sena等[23]基于發(fā)表在CAMARARDS上的急性缺血性卒中動(dòng)物實(shí)驗(yàn)系統(tǒng)評(píng)價(jià)發(fā)現(xiàn):約14%的原始動(dòng)物實(shí)驗(yàn)未被發(fā)表,這些未發(fā)表的原始動(dòng)物實(shí)驗(yàn)導(dǎo)致的缺失數(shù)據(jù)使其結(jié)果比實(shí)際值高估了30%。
系統(tǒng)化地全面收集與當(dāng)前研究問(wèn)題有關(guān)的全部資料是控制發(fā)表偏倚的唯一措施。對(duì)動(dòng)物實(shí)驗(yàn)而言,除必檢數(shù)據(jù)庫(kù)PubMed、EMbase和Web of Science外,還應(yīng)檢索BIOSIS Previews等相關(guān)數(shù)據(jù)庫(kù)[24]。此外,會(huì)議摘要、灰色文獻(xiàn)、參考文獻(xiàn)目錄檢索都是必要的補(bǔ)充檢索手段。同時(shí),可借鑒臨床試驗(yàn)Meta分析的發(fā)表偏倚評(píng)估方法,如漏斗圖法、失安全數(shù)法、剪補(bǔ)法、森林圖法等識(shí)別動(dòng)物實(shí)驗(yàn)的發(fā)表偏倚。
作為Meta分析結(jié)果的主要呈現(xiàn)形式,森林圖中的相對(duì)效應(yīng)尺度指標(biāo)(RR和OR)的無(wú)效豎線的橫軸尺度為1,絕對(duì)效應(yīng)指標(biāo)(如RD、MD、SMD)的無(wú)效豎線的橫軸尺度為0。若某個(gè)研究95%CI的線條橫跨無(wú)效豎線,則該研究無(wú)統(tǒng)計(jì)學(xué)意義,反之,則該研究有統(tǒng)計(jì)學(xué)意義。每條橫線直觀地表示各研究的95%可信區(qū)間范圍的大小,線條中央的小方塊為統(tǒng)計(jì)量的位置,其方塊大小代表該研究權(quán)重大小。以ZHOU等[25]的關(guān)于白藜蘆醇對(duì)膿毒癥動(dòng)物模型組織中丙二醛影響的Meta分析結(jié)果為例。如圖1所示,圖中“菱形”為合并效應(yīng)量的圖示結(jié)果,“-3.10(-5.27,-0.93)”表示合并效應(yīng)量及其95%CI;“Z=2.80,P=0.005”,表示假設(shè)檢驗(yàn)中的統(tǒng)計(jì)量及其P值?!唉?=30.20,df=3,P<0.00001”,表示異質(zhì)性檢驗(yàn)的Q統(tǒng)計(jì)量、自由度及P值,異質(zhì)指數(shù)I2=90%(圖1)。
相比較于單個(gè)實(shí)驗(yàn)動(dòng)物研究,基于高質(zhì)量動(dòng)物研究的Meta分析的結(jié)果更為可靠,不僅可以有效評(píng)估和優(yōu)選最佳的實(shí)驗(yàn)動(dòng)物模型,避免衛(wèi)生資源的浪費(fèi)和實(shí)驗(yàn)動(dòng)物的重復(fù)利用,亦可在即將開(kāi)展的臨床試驗(yàn)中計(jì)算效能時(shí)增加估計(jì)療效的精度,降低假陰性結(jié)果的風(fēng)險(xiǎn),從而降低動(dòng)物實(shí)驗(yàn)結(jié)果向臨床試驗(yàn)轉(zhuǎn)化時(shí)的風(fēng)險(xiǎn),促進(jìn)其成果的轉(zhuǎn)化和利用。
圖1 白藜蘆醇對(duì)膿毒癥動(dòng)物模型組織中丙二醛的影響的森林圖