北京大學腫瘤醫(yī)院 付浩 編譯
中國胸腺瘤協(xié)作組 全體成員 審校
中國胸腺瘤協(xié)作組成員單位:上海交通大學附屬胸科醫(yī)院:方文濤(胸外科)、谷志濤(胸外科),王常祿(放療科),張杰(病理科);復旦大學附屬中山醫(yī)院:譚黎杰(胸外科);華山醫(yī)院:龐烈文(胸外科);同濟大學附屬肺科醫(yī)院:陳崗(病理科);中山大學附屬腫瘤醫(yī)院:傅劍華(胸外科);鄭州大學附屬腫瘤醫(yī)院:李印(胸外科);青島大學醫(yī)學院附屬醫(yī)院:沈毅(胸外科);天津醫(yī)科大學附屬腫瘤醫(yī)院:于振濤(胸外科);四川省腫瘤醫(yī)院:韓泳濤(胸外科);北京大學附屬第三醫(yī)院:閆天生(胸外科);北京大學附屬腫瘤醫(yī)院:曹登峰(病理科),陳克能(胸外科),付浩(胸外科)(通訊作者:陳克能,E-mail: chenkeneng@bjmu.edu.cn;方文濤,E-mail: vwtfang@hotmail.com)
當患者被診斷某種疾病后,患者最想知道的信息就是該疾病的預后。預后受多種因素的影響,而對于腫瘤而言,最重要的因素是腫瘤累及的解剖范圍,這就是腫瘤分期。分期系統(tǒng)不應與預后相混淆,腫瘤分期僅為預后的一部分內容。預后還會受治療、患者個體因素(如合并癥)、腫瘤特異相關因素和其他因素的影響,這些都參與構成預后因素。目前,ITMIG聯(lián)合IASLC在UICC和AJCC的領導下,正在著手制定一個實用的正式的分期系統(tǒng)。制定解剖學分期系統(tǒng)的一個必然而重要的環(huán)節(jié)是評估預后因素。通過回顧文獻尋找有用的預后因素是這一過程的第一步。
一般來說,對預后因素進行研究和分類是最基本的。但是人們常常存在疑惑,因為不清楚何種因素與結果有關,如一個因素可能與總生存有關,可能與疾病是否治愈有關,也可能與是否有治療反應有關。在特殊情況下,預后因素可能是特異性的,如某因素只是手術治療的胸腺瘤患者的預后因素,而另一個因素則是放化療患者的預后因素。預后因素可以分為幾類:腫瘤相關因素,也就是最主要的因素,患者個體因素,也就是即使沒有腫瘤,這些因素也存在,和環(huán)境因素,比如能否獲得最佳治療之類的事情。一旦我們確定了某個預后因素,我們會立即開始試圖把結果改變?yōu)槲覀兿肟吹降哪菢樱z驗該預后因素的的真實性)。最后,需要理解,在確定預后因素的過程中,存在很多統(tǒng)計學陷阱和錯誤影響預后因素的準確性,這在另一篇文章中討論[1]。由于對判斷預后因素的經驗存在不足,故急需在此方面投入研究。本文就目前胸腺瘤預后因素的現(xiàn)狀作以下綜述。
檢索1980-01-01至2010-12-31發(fā)表的關于胸腺瘤或胸腺癌的生存或復發(fā)的英文文獻。并追加檢索每篇被檢文獻后面的參考文獻、近期專著的相關章節(jié)和綜述文獻、和作者自己查找的獨立文獻。除了總生存和復發(fā),我們沒有評估其他結局的預后因素,主要是因為僅有幾個單中心研究。
對胸腺惡性腫瘤而言,復發(fā)是評估預后最好的方法,這在近期ITMIG的一篇具有里程碑意義的文章中有討論。遺憾的是,幾乎沒有研究對此加以強調。關于復發(fā)的分析我們納入了無疾病生存的概念,盡管將復發(fā)和死亡視為平等的研究終點存在一定問題,因為容易得到,所以總生存是最常用的研究終點。但是,它不是一個理想的研究終點,因為很多胸腺瘤患者死于其他原因,即使復發(fā)其存活時間也較長[2]。不同的研究使用不同的方法,例如總生存和胸腺瘤特異性生存,這將得出不同的生存結果。但是,因為分析的目的是評估不同因素的預后價值,因此有必要利用不同評估方法來提高結論的可靠性。一個良好的預后因素必須具有獨立意義,而且必須評估與其他因素的交互作用。正因為如此,本文僅納入多因素分析的研究。多因素分析的方法和分析因素的因素數(shù)目或特征不限。僅納入病例數(shù)大于等于75例的研究。因為經過粗略估算至少需要75例患者,才能使3個中等效應的因素達到80%的檢驗效能[2]。
本文納入研究報道的病例范圍很廣泛,多數(shù)病例為接受手術治療者,也包括了除手術外還有輔助治療的患者。為了評估這些患者,加入了不同治療方式的比例(如表所示)。納入研究中未作亞組分析,部分因為各研究的方法不同,同時也因為樣本量較少,達不到統(tǒng)計分析量。此外,報道特殊病例組的研究數(shù)量有限,得不出任何結論,因而未納入分析。另有幾個研究包括了不同治療類型的患者;如上兩種情況我們只選用其中的手術結果。本文排除了重復的文獻,或者同一單位先后兩篇一個樣本量小一個樣本量大的文章。但是本文納入了同是一個單位的病例,雖有重疊但每篇中均有不同特征的病例的文章。本文將研究的數(shù)據提取列表,并將在多因素分析中P值小于等于0.05的因素記錄為陽性因素[2]。因為多因素分析的方法不同,可能會有較高的假陽性率。例如,一個變量被分為兩組選取了最好的界值作分界線,從而導致統(tǒng)計學上過度樂觀的結果,稱之為“雙向挖掘”[1,2]。我們將這些有高假陽性風險的研究列表分析,用這樣的方法是不能分析實際風險的。
對于樣本量有限的研究,因其檢驗效能低,可出現(xiàn)假陰性結果。如果報道的因素P值大于0.05,該因素記錄為陰性。根據研究樣本量、分析因素的數(shù)量和差異的大小能夠進行粗略的估算。我們對研究的陰性結果進行了先驗估計,這種粗略的評估達到中等效應至少需要80%的檢驗效能。最后,我們發(fā)現(xiàn)所有大于75例患者的研究都符合這一要求。
不是所有的研究都分析同樣的因素,有些重要因素漏評會嚴重影響結果,但是本文并沒有試圖對此糾正,因此,我們盡可能全面的搜集了數(shù)據。報道中記錄為陽性、陰性或未評估的數(shù)據,提供了預后因素的總體概況。此外,很多報道選擇二分變量方法,但是選擇的分界值又各不相同,本文努力綜合了這些界值相似的數(shù)據,并在表格下方作了注釋。
一些研究報道了不同的多因素分析,例如,有些包含而另一些不包含一些因素,或使用不同的定義的研究。因為缺乏判斷標準,本文將這些研究分別獨立的列在表中。另外,在一些研究對某些主要因素作了多因素分析以便肯定某一因素的影響或其與其他因素的關聯(lián)[3-8]。這似乎能加強MVA的目的以便找出哪些因素真正影響生存,而哪些又是偏倚造成(假陽性)。在這些研究分析中沒有包含所有研究因素時,我們收集其子集分析數(shù)據(例如,有分期沒有組織學,有組織學沒有分期)。通過收集所有的子集分析,希望呈現(xiàn)出一個較少偏倚的整體概況。然而,這也說明研究過程中會存在潛在的偏倚。本文排除了其中一項研究,因為該研究在分析每個因素時,去除了其他具有潛在意義的因素。同時因為這個研究沒有報道整體的多因素分析,雖然其結果存在偏倚,甚至對于哪個因素加入或去除都沒有詳細報道。
總結數(shù)據時,本文計算了具有顯著差異的多因素研究的比例。對此應該非常謹慎的解釋,因為這篇文獻中可能有我們沒有發(fā)現(xiàn)的許多假陽性和假陰性結果。對于少于5篇總生存研究或少于3篇復發(fā)研究中分析的因素,不列在表中,因為從這些有限的數(shù)據中不能得出有意義的結論。
按照上述檢索和納入標準,共納入29篇有關生存預后因素的多因素研究和12篇復發(fā)預后因素的多因素研究。少數(shù)研究中既包括生存預后又包括了復發(fā)預后因素的分析[4,8,9],按照方法部分的描述將每種分析列在表中。結果見表1和表2,圖1和圖2。
在多數(shù)研究中并沒有患者的詳細資料,但可被粗略看成是為了接受根治性治療,關于接受治療的數(shù)據總結在表中。大多數(shù)患者接受手術治療,約一半的患者接受了放療和約25%的患者接受的化療。其中值得一提的是:de Jong[11]作的隊列研究,Cowen[22]報道中患者僅接受了放療,Lucchi[25]報道的所有患者都患有重癥肌無力。
對于復發(fā)和生存均有確切顯著性意義的因素是分期,多數(shù)研究是比較分期I期+II期與III期+IV期的治療。多數(shù)研究都采用Masaoka或Masaoka-Koga分期,事實上,在所有的分期系統(tǒng)中,這種二分法產生基本相同的兩組患者。應該明確說明的是,這些多因素分析中的大多數(shù)沒有明確I期與II期,II期與III期,III期與IVa期之間預后的差別,或是從I期到IVb期之間預后連續(xù)的變化的過程[35]。但是,多項研究表明復發(fā)和生存逐漸變差,盡管存在是否I期和II期之間有預后差異的問題。盡管這些預后因素研究存在局限性,但是不難看出分期是有用的預后因素。
表 1 預后因素多因素分析Tab 1 Multivariate Analysis of Factors Predicting Better Survival
表 2 復發(fā)率或無疾病生存預后因素的多因素研究Tab 2 Multivariate Analysis of Factors Predicting Lower Rates of Recurrence or Disease-Free Survival
另一個對于復發(fā)和生存相對肯定的預后因素是完全切除,很明顯這只能用于手術治療的亞組患者。盡管完整切除率與腫瘤的分期明確相關,但是經多因素分析得出R0切除似乎是具有獨立意義的預后因素[35]。
胸腺惡性腫瘤的組織亞型也是很重要的預后因素,但很難全面評估。首先,組織分類方法不統(tǒng)一,盡管近來更多的使用了WHO分類系統(tǒng)[37,38]。其次,病理醫(yī)生對于組織分類的標準有差異[39-41]。最大的問題是多數(shù)研究只報道了組織分型的預后價值,而沒有說明具體組織亞型之間的差異。此外,在多數(shù)研究中二分法的使用,首先選擇最大化差異,之后進行顯著性檢驗(即,雙向挖掘)。在這些研究中最佳二分法使用了很多不同的分界值,這使得其結果可信度降低。胸腺癌似乎始終與最差的生存相對應,但是還不能得出是否是獨立的預后因素。本文試圖用多因素分析的方法在包含和不包含胸腺癌的組群中對此進行探索,結果表明包含有胸腺癌的研究與僅包含胸腺瘤的研究相比,總生存之間有差異(67%比42%)。但是,在評估復發(fā)的研究中沒有發(fā)現(xiàn)差異。
圖 1 生存相關因素的多因素分析。提示為陽性預后因素研究占納入多因素分析(1980-01-01至2010-12-31,病例數(shù)>75例的研究)的百分比。*提示老年患者生存差的研究的比例。Hist, 組織類型;MG,重癥肌無力;MVA,多因素分析;N,驗證該因素的研究數(shù)量;St,分期;Thy Ca,胸腺癌;w/o,無。Fig 1 Factors associated with increased survival by multivariate analysis. Percentage of studies finding a factor prognostically significant for survival in multivariate analysis in studies of 75 patients from January 1, 1980, to December 31, 2010. *Percentage of patients showing that older patients had worse (not increased)survival. Hist, histologic typing; MG, myasthenia gravis; MVA,multivariate analysis; N, number of studies examining this factor; St,stage; Thy Ca, thymic carcinoma; w/o, without.
圖 2 復發(fā)相關因素的多因素分析。提示為復發(fā)或無疾病生存良好預后因素的研究占納入多因素分析(1980-01-01至2010-12-31,病例數(shù)>75例的研究)的百分比。Hist, 組織類型;MG,重癥肌無力;MVA,多因素分析;N,驗證該因素的研究數(shù)量;St,分期;Thy Ca,胸腺癌;w/o,無。Fig 2 Factors associated with decreased recurrence by multivariate analysis. Percentage of studies finding a factor prognostically significant for recurrence or disease-free survival in multivariate analysis in studies of75 patients from January 1, 1980, to December 31,2010. Hist, histologic typing; MG, myasthenia gravis; MVA, multivariate analysis; N,number of studies examining this factor; St, stage; Thy Ca,thymic carcinoma; w/o, without.
年齡因素影響很小,年齡似乎不影響復發(fā)。有人可能會作出這樣的預言,如果年齡對復發(fā)沒有影響,那么預測老年患者的生存會更差,因為老年人死于其他原因的風險增加。但是,幾項研究已經發(fā)現(xiàn)對于總生存,年齡是一個良好的預后因素,也有相當?shù)难芯空J為它是一個不良預后因素。但是這些研究中年齡的分界值選取不同。鑒于這樣矛盾的結果,最好不要將年齡視為有效的預后因素。
在少數(shù)研究中,發(fā)現(xiàn)體積小的腫瘤是復發(fā)和生存良好的預后因素。性別和重癥肌無力似乎對復發(fā)或生存不具有預后意義。
僅少數(shù)文獻對其他因素作了研究。有關生存因素包括:時間段[11,13,15,16],復發(fā)的出現(xiàn)與否[8,18,24,31],是否有重癥肌無力之外的副瘤綜合征[14,16,21,24],癥狀輕重[16,23],是否有合并癥[6,15],淋巴樣增生與否[6,28],重癥肌無力的緩解與否[8,42],輔助放療與否[9,42],輔助化療與否[22],放療劑量大小[31],是否有第二原發(fā)腫瘤[23],是否侵犯大血管[17],是否侵犯胸膜[31],是否淋巴結轉移[14],是否遠處轉移[14],重癥肌無力的分級和多學科治療的順序[42],術前是否活檢[23],細胞異型性與強度指數(shù)[16],患者PS評分[32]。所有這些研究因素均未發(fā)現(xiàn)有預后意義,但發(fā)現(xiàn)下列情況,4篇研究時間段的文獻中有1篇表明有預后意義[13],4篇研究復發(fā)時間的文獻中有1篇表明有預后意義[31],2篇研究重癥肌無力緩解的文獻中有1篇表明具有預后意義[42],還有1篇認為大血管侵犯有預后意義[17]。
其他被研究的因素有(3篇以內):復發(fā)時間[15,33],術前治療狀態(tài)[34],輔助化療與否[22],多學科治療順序[31],放療劑量大小[31],是否有合并癥[6,15],除重癥肌無力之外的副瘤綜合征[21,33],淋巴樣增生與否[6,28],血管或周圍結構侵犯與否[33],胸膜侵犯與否[31],和種族[34]。除了胸膜侵犯外(僅一篇研究支持),所有這些因素均不具有預后意義[31]。
總之,目前還沒有整合好的實用的預后系統(tǒng),大家正在思考建立這樣一個系統(tǒng)。盡管檢驗預后因素有效性的統(tǒng)計學方法有了很大發(fā)展,但尚未被廣泛認可。由于急需胸腺瘤的預后判斷系統(tǒng),預后因素的定義不能等到所有的框架構成后才確立。但是,我必須認識到定義預后因素是一個演變的過程,對目前已有的這些預后因素要持懷疑態(tài)度。
本文試圖說明現(xiàn)有研究中統(tǒng)計分析的不足,以便在前瞻性研究中避免,但非常困難??偟膩碚f,在我們獲得的這些研究中,大多數(shù)使用的方法帶有得出假陽性預后因素的風險,這在更嚴格的分析中不能重復。分析發(fā)現(xiàn),在有相似結果的研究中多少包含有強有力的統(tǒng)計方法。關于假陰性結果,多是由于試圖利用有限的數(shù)據評估大量的因素所造成的,我們沒有發(fā)現(xiàn)任何報道分析有非常有限的檢驗效能。但是,需要注意的是,報道研究的樣本僅允許檢驗具有中度或高度效應的預后因素;任何因素都不能排除對預后有低度效應表現(xiàn)。在這些研究中,很多時間跨度有20年甚至更長。僅有少量研究把治療時間段作為預后因素,分析其效應,僅一項研究發(fā)現(xiàn)有統(tǒng)計學意義[11,13,15,16,33]。隨著時間變化的臨床實踐和胸腺惡性腫瘤各方面定義的不同,導致了很多含糊不清問題,這迫使我們對現(xiàn)有預后因素需要從根本上加以認識。
現(xiàn)有數(shù)據表明,分期和完全切除可作為有效的預后因素。性別和重癥肌無力表現(xiàn)沒有預后意義。腫瘤大小的預后意義需要進一步研究,大小的分界值選擇存在一些問題,不規(guī)則腫瘤大小如何測量也存在問題。腫瘤組織分類的影響也需要進一步研究。一些單中心研究中的生存曲線一致表明胸腺癌有著更差的預后,因此,這一病理類型在所有的分期系統(tǒng)都被特別關注。胸腺癌預后差的一致事實表明組織分類具有預后意義,但何時需要排除這些腫瘤尚不清楚。關于胸腺癌的組織學分類問題目前正在討論。因此,在明確其他組織類型是否具有預后意義之前,暫不將胸腺癌視為獨立的預后因素,其預后意義有待于進一步的研究。
由于胸腺腫瘤生長較慢的生物學行為,將復發(fā)作為評估預后的方法要優(yōu)于總生存。一般來講,關于復發(fā)預后因素的數(shù)據(表2)與總生存的數(shù)據是平行的(表1)。因此大多數(shù)研究使用無疾病生存作為研究終點,這至少可以部分的解釋類似的結果。把復發(fā)和死亡視為等同的研究終點是不明智的。僅有4項研究將重點集中在復發(fā)[22,26,33,34],這顯然是要在將來預后研究中必須解決的問題。