李凌巍, 秦俊杰, 賈云龍, 呂 浩
吉林大學第一醫(yī)院樂群院區(qū) a. 消化內科, b. 急救醫(yī)學科, 長春 130021
原發(fā)性肝癌是全球常見的惡性腫瘤之一,據(jù)全球最新癌癥負擔數(shù)據(jù)(Globocan 2020)顯示,其發(fā)病率居惡性腫瘤發(fā)病第6 位,2020 年全球肝癌新增人數(shù)為90.6 萬,年齡標化發(fā)病率約9.5/10 萬;該病預后差,位列全球常見惡性腫瘤死因第3 位,2020 年全球肝癌死亡人數(shù)為83.0 萬,年齡標化死亡率為8.7/10 萬[1]。盡管當前診療技術迅速發(fā)展,但因肝癌起病隱匿、進展迅速,絕大部分患者確診時已進展至肝癌晚期[2]。近些年通過針對肝炎病毒、黃曲霉素食品污染等因素的有效控制,我國肝癌發(fā)病率和死亡率呈下降趨勢,但肝癌患者5 年生存率仍僅為12.1%[3-5]。同時,我國肝癌所致的傷殘壽命年仍占比全球肝癌負擔的近50%[6]。通過探究其與其他因素間的因果關系對揭示肝癌的深層病理機制、采取有效臨床干預措施和制訂公共衛(wèi)生政策具有重要意義[7-9]。
針對疾病因果推斷,隨機對照試驗(RCT)是流行病學研究中最為可靠的方法,但因其本身存在研究周期長、人力物力消耗大、涉及醫(yī)學倫理等問題,很難實現(xiàn)科學性與可行性的統(tǒng)一。隨著統(tǒng)計學與基因技術的更新迭代,基于全基因組關聯(lián)研究(genome-wide association study,GWAS)大數(shù)據(jù)樣本的孟德爾隨機化應運而生,其是以與風險因素相關的遺傳變異作為工具變量,推測風險因素與疾病之間的因果關聯(lián),能夠有效規(guī)避RCT 的束縛及因果推斷中的干擾問題。
腫瘤性疾病的防治迄今仍是困擾醫(yī)學界的難題之一,其錯綜復雜的調控網(wǎng)絡使人們對其發(fā)病機制及病因學研究仍十分受限。近年來,孟德爾隨機化因其特有的優(yōu)勢被越來越多地應用于腫瘤性疾病的病因研究,如探索身體質量指數(shù)與肺癌[10]、乙醇攝入與食管癌[11]、睡眠特征與乳腺癌[12]等的因果效應。本文主要介紹孟德爾隨機化并探討其在肝癌研究中的應用進展,旨在為肝癌的因果關聯(lián)研究提供新思路。
孟德爾隨機化最初是由Katan[13]于1986 年首次提出,是一種以遺傳變異作為工具變量的統(tǒng)計模型,利用工具變量替代暴露因素構建“工具變量-暴露-結局”的因果路徑,通過“工具變量-結局”效應模擬“暴露-結局”的因果關聯(lián)。孟德爾隨機化以孟德爾分離定律為理論基礎,即“影響親本性狀的等位基因在形成配子時,隨減數(shù)分裂隨機分配給子代”,因此工具變量不會受到出生后環(huán)境暴露、社會經(jīng)濟地位、行為因素等傳統(tǒng)混雜因素影響;且出生后保持不變,與結局間具有時間順序合理性,因此具有規(guī)避反向因果的獨特優(yōu)勢。
常用孟德爾隨機化包括獨立樣本孟德爾隨機化、兩樣本孟德爾隨機化、多變量孟德爾隨機化、雙向孟德爾隨機化和網(wǎng)絡孟德爾隨機化等[14],其模型中工具變量的選擇必須滿足3 個核心假設[15-16]。(1)關聯(lián)性假設:工具變量與暴露間必須是穩(wěn)健的強相關關系;(2)獨立性假設:工具變量不能與影響“暴露-結局”的混雜因素有關聯(lián);(3)排他性假設:工具變量只能通過暴露對結局產(chǎn)生效應。若不符合關聯(lián)性假設,就會導致工具變量對暴露因素的解釋強度不足引起弱工具變量問題;倘若違背獨立性/排他性出現(xiàn)多效性效應將會導致無效工具變量的產(chǎn)生。在實際應用中,可采用孟德爾隨機化-Egger[17]、漏斗圖、Q檢驗等敏感性分析以及等位基因加權評分、眾數(shù)評分法等加權法的應用來排除內生性誤差導致的干擾,亦即“偏倚矯正”[18]。
孟德爾隨機化研究雖能有效避免觀察性研究(混雜因素、反向因果關系以及回歸稀釋偏倚等)和RCT(代表性和可行性問題)在進行因果推斷時的限制,但當下仍存在不足:(1)核心假設的合理性是孟德爾隨機化因果關聯(lián)研究的前提,而弱工具變量、遺傳變異多效性、連鎖不平衡、人群分層等易導致核心假設的違背,如弱工具變量偏倚會導致單樣本孟德爾隨機化研究中暴露-結局關聯(lián)被高估,而遺傳多效性可能導致獨立性假設或排他性假設不成立。此外,假設亦受Beavis 效應、發(fā)育代償機制等影響[19-20]。(2)考慮到生物學復雜性的存在,復雜疾病涉及基因組、轉錄組、代謝組等不同層次生物學過程,孟德爾隨機化只能初步判斷暴露-結局間的因果關聯(lián),針對其關聯(lián)機制尚未完全闡明,導致全面檢驗假設并獲得真實的因果效應值還難以實現(xiàn)。(3)成果轉化及應用方面存在困難。目前,孟德爾隨機化研究僅能提供危險因素的終身暴露對結局的影響,難以揭示疾病不同發(fā)展階段的因果效應,仍需更多高質量RCT 證據(jù)的補充與支持。
目前,孟德爾隨機化已經(jīng)在肝癌研究領域有了一定范圍的應用,主要包括腸道菌群、循環(huán)代謝物、特定疾病、生活行為方式及炎癥標志物與肝癌的因果關系,以下就每個領域分別進行闡述。
2.1 腸道菌群與肝癌 腸道菌群作為體內微生物的重要部分,被稱為“人類的第二基因組”[21-22],其組成與結構變化與人類健康及疾病發(fā)生息息相關。近年來研究[23-25]發(fā)現(xiàn)肝癌宿主存在腸道菌群結構與數(shù)量的改變。Ren等[24]通過對早期肝癌、肝硬化患者腸道菌群特征分析,發(fā)現(xiàn)肝癌組和肝硬化組的腸道菌群多樣性對比健康對照組發(fā)生明顯改變,尤以肝癌組改變最為明顯,如產(chǎn)脂多糖菌屬顯著增加,而丁酸鹽產(chǎn)生菌顯著減少。這種特異改變提示可以通過菌群特異性分析作為早期肝癌的非侵入性診斷工具。為了進一步驗證腸道菌群與肝癌發(fā)生發(fā)展的因果關系,Ma 等[26]通過利用腸道微生物組和肝癌的GWAS 匯總數(shù)據(jù)進行兩樣本孟德爾隨機化研究,共篩選出14~21 個單核苷酸多態(tài)性(single nucleotide polymorphism,SNP)(包括2 個科和2 個屬的腸道微生物組)用于孟德爾隨機化分析,研究發(fā)現(xiàn)瘤胃菌科(OR=0.46,95%CI:0.26~0.82,P=0.009)和紫單胞菌屬(OR=0.59,95%CI:0.42~0.83,P=0.003)與肝癌具有保護性因果關系,以及紫單胞菌科(OR=0.36,95%CI:0.14~0.94,P=0.036)和擬桿菌屬(OR=0.55,95%CI:0.34~0.90,P=0.017)與肝癌具有保護性因果關系,并使用臨床病例對照測序數(shù)據(jù)驗證了這一因果關系,得出瘤胃菌科、紫單胞菌科及擬桿菌屬相對豐度增加可以降低肝癌發(fā)生風險,提示該類菌群可能是預防和治療肝癌的潛在手段,對預防和控制肝癌發(fā)生具有重要意義。但由于生物學機制復雜性,腸道菌群與肝癌之間的雙向因果關系仍需更多證據(jù)論證。
2.2 甲狀腺功能減退與肝癌 甲狀腺激素的主要生理作用是促進機體新陳代謝,維持機體的正常生長發(fā)育,而肝臟是其主要代謝場所,在其合成、轉化及滅活中發(fā)揮重要作用。目前臨床研究發(fā)現(xiàn)甲狀腺激素/甲狀腺激素受體參與多種癌癥進展,包括卵巢癌、前列腺癌、乳腺癌、肝癌、肺癌及結直腸癌等[27-31]。Pinter 等[32]研究發(fā)現(xiàn)促甲狀腺激素(thyroid stimulating hormone,TSH)和游離甲狀腺素(free thyroxine,F(xiàn)T4)水平與腫瘤大小高度相關,且高濃度FT4 與不良預后獨立相關。Sahin 等[33]通過對比研究肝硬化后肝癌患者,發(fā)現(xiàn)肝癌組血清游離三碘甲狀腺原氨酸水平顯著高于肝硬化組,提示其與肝癌的發(fā)生發(fā)展有密切關系。Chu 等[34]研究發(fā)現(xiàn)較高水平TSH和FT4與良好的腫瘤無進展期及總體生存率獨立相關,但這種相關性在針對接受索拉非尼治療以及全身化療的晚期肝癌患者中截然相反。Hassan 等[35]和Reddy等[36]通過病例對照研究發(fā)現(xiàn),持續(xù)時間超過3 年的甲狀腺功能減退患者發(fā)生肝癌風險顯著增加,女性患者尤甚,提示甲狀腺功能減退可能是肝癌的獨立危險因素。Bruck 等[37]和Oren 等[38]通過藥理學誘導大鼠甲狀腺功能減退發(fā)現(xiàn)其可改善大鼠肝纖維化,而甲狀腺功能亢進加劇肝硬化進展。以上觀察性研究均表明,異常的甲狀腺激素水平與肝病發(fā)展密切相關。Yuan 等[39]通過孟德爾隨機化研究并沒有發(fā)現(xiàn)甲狀腺激素與肝癌之間存在因果關聯(lián)(OR=0.82,95%CI:0.55~1.23,P=0.336),而Lu等[40]通過擴大研究人群樣本量(337 159名歐洲裔)后發(fā)現(xiàn)甲狀腺功能減退與肝癌之間存在負相關(OR=0.997,95%CI:0.995~0.999,P=0.016),同時發(fā)現(xiàn)TSH 水平和FT4 水平與肝癌風險沒有直接的因果關系,說明甲狀腺功能減退對肝癌的保護作用可能不是通過甲狀腺激素實現(xiàn)的,具體機制還有待進一步研究。值得指出的是,該研究中TSH 和FT4 相關暴露樣本量較少(72 167 個),未來仍需進一步擴大樣本量明確其與肝癌之間的因果關系。
2.3 生活方式因素與肝癌 觀察性研究顯示許多生活方式因素與肝癌風險相關,但這些生活方式與肝癌之間是否存在明確的因果關聯(lián)以及通過改變這些因素是否能降低肝癌的患病風險尚不清楚。肥胖被認為是促進腫瘤發(fā)生的一個因素,吳燕梅[41]在中國人群中首次利用孟德爾隨機化方法探討肥胖與肝癌發(fā)生的因果關聯(lián),發(fā)現(xiàn)肥胖可能為肝癌發(fā)生的危險因素。而Zhang等[42]通過臨床試驗和孟德爾隨機化研究發(fā)現(xiàn)肥胖在女性肝癌患病中起保護作用,通過生物信息學分析確定鈷胺素相關A 代謝基因(metabolism of cobalamin-associated A,MMAA)為肥胖差異基因及肝癌的預后指標,并證明了MMAA 是雌激素受體1 的下游作用靶點,雌激素受體1 通過調控MMAA在肝癌中的過表達抑制癌細胞的增殖、遷移和侵襲,增加細胞凋亡率,并維持了線粒體功能障礙所致的氧化還原平衡,進一步闡明了肥胖可能是女性肝癌患者的保護因素。
目前,眾多研究顯示飲酒是肝癌的危險因素之一[43],盡管大量飲酒與患肝癌的風險有較好的相關性,但低至中度飲酒是否與肝癌患病風險成反比仍存在爭議。Liu等[44]通過前瞻性隊列研究和非線性孟德爾隨機化分析發(fā)現(xiàn),飲酒(僅指葡萄酒)與肝癌患病低風險亞組(如女性、年齡<60 歲,以及ALT 水平正常和無風險基因變異的人群)呈J型相關,這也證實了先前的研究結果[45-46]:低至中度飲酒與肝癌患病風險呈負相關。同時該研究指出針對肝癌患病的高風險亞組(包括男性、年齡≥60 歲、ALT異常以及攜帶PNPLA3 rs738409 和TM6SF2 rs58542926風險等位基因)人群,其飲酒與肝癌風險之間存在線性關系,應完全戒酒。同樣,很多學者[47-50]針對飲食習慣與肝癌的孟德爾隨機化研究發(fā)現(xiàn)曾經(jīng)/從未飲酒和飲酒量與肝癌風險呈正相關(不飲酒者患肝癌的風險增加41%),而咖啡、茶、奶制品等的攝入與肝癌患病風險成反比。
2.4 循環(huán)代謝物與肝癌 目前,維生素D因其抗腫瘤效應在腫瘤病因學研究中備受矚目,但結論不一。多項觀察性流行病學研究[51-52]表示維生素D 水平與多種癌癥風險呈顯著負相關,尤其對肝癌患病風險影響最大。Lange等[53]通過孟德爾隨機化探索維生素D 與肝癌關系的研究卻表明,維生素D 水平降低可能與丙型肝炎患者進展為肝癌的風險有關,但未發(fā)現(xiàn)維生素D 與經(jīng)抗病毒治療后的HCV感染相關肝癌存在因果關聯(lián),提示維生素D 對丙型肝炎相關肝癌發(fā)生有特定的影響。Liu 等[54]應用兩樣本孟德爾隨機化研究發(fā)現(xiàn)血液高水平25(OH)D(≥20 ng/mL 與肝癌患病風險相關(OR=5.48,95%CI:2.91~10.30,P<0.001),且通過循環(huán)中25(OH)D 水平與其相關rs12785878基因的交互作用可以顯著延長肝癌患者的總生存期和無瘤生存期,但并沒有發(fā)現(xiàn)25(OH)D濃度相關的基因變異與肝癌復發(fā)和死亡率之間有關聯(lián)。需指出的是該研究僅篩選出6 個SNP,同時缺少對混雜變量(如戶外活動時間等)的調整。而鐘旋[55]針對我國南方人群使用孟德爾隨機化方法探討維生素D 水平/缺乏與肝癌發(fā)病風險,利用遺傳變異構建遺傳風險評分,代替單一變異作為工具變量,解決了常見變異的弱工具變量問題以及受基因多效性影響等弊端,提高了工具變量的效率,并在此基礎上進行敏感性分析,并未發(fā)現(xiàn)維生素D水平/缺乏對肝癌的發(fā)生風險有影響。未來仍需納入更多遺傳變異、更大規(guī)模的孟德爾隨機化研究進一步去驗證。此外,多項RCT的Meta分析顯示補充維生素D有助于降低癌癥死亡率,而不是癌癥發(fā)病率[56-57],后續(xù)研究或可進一步探討維生素D 與肝癌預后進展或死亡之間的關系。
觀察性研究[58-61]顯示癌癥患者的循環(huán)TGF-β1 濃度明顯高于健康對照組,Lu 等[62]通過選擇TGF-β1 基因C-509T多態(tài)性作為工具變量,檢驗血清TGF-β1與肝癌的因果關系,發(fā)現(xiàn)C-509T多態(tài)性與肝癌沒有關聯(lián),但其與循環(huán)TGF-β1的關聯(lián)具有統(tǒng)計學意義,進一步孟德爾隨機化分析表明,在同種基因型和顯性模式下,循環(huán)TGF-β1 每增加一單位,肝癌風險各增加38%(95%CI:1.03~4.65)和49%(95%CI:1.01~6.06),從而確定了血清TGF-β1升高與肝癌患病風險增加有因果關聯(lián)。
Yuan 等[63]利用兩樣本孟德爾隨機化研究鐵狀態(tài)與癌癥風險,發(fā)現(xiàn)鐵狀態(tài)與肝癌患病風險呈正相關,但其只篩選到3個SNP作為工具變量,存在弱工具變量問題。而Tian 等[8]進一步利用單變量和多變量孟德爾隨機化分析并沒有發(fā)現(xiàn)鐵狀態(tài)(血清鐵、鐵蛋白、轉鐵蛋白)與肝癌風險之間的因果關系,但該項GWAS 數(shù)據(jù)病例規(guī)模較小且病例對照比不平衡,存在統(tǒng)計效能偏差,未來仍需更加完善的GWAS數(shù)據(jù)進一步驗證。
2.5 炎癥標志物與肝癌 炎癥細胞浸潤與腫瘤的發(fā)生、發(fā)展及臨床療效密切相關,有學者[64]發(fā)現(xiàn)白細胞端粒長度與肝癌之間存在U 型因果聯(lián)系,即端粒長度的增加或減少均會導致肝癌患病風險的增加。Pan 等[65]首次利用多變量孟德爾隨機化探究白細胞亞型計數(shù)與肝細胞癌風險之間的因果關系,發(fā)現(xiàn)在歐洲裔人群中,基因預測的低嗜堿性粒細胞總數(shù)與肝細胞癌患病風險存在因果關聯(lián),這一發(fā)現(xiàn)為臨床醫(yī)生診療肝細胞癌提供了新思路,但仍需在不同人群中進一步驗證。
孟德爾隨機化作為一種非常強大的流行病學研究方法,隨著GWAS 數(shù)據(jù)不斷開發(fā)及孟德爾隨機化模型的不斷規(guī)范,被越來越多地應用于探索疾病的危險因素、疾病的中間機制和復雜疾病間的雙向因果關聯(lián)等。然而,由于基因的復雜性,其潛在相關生物學機制仍無法充分闡明,但這無法掩蓋其為疾病間的因果關聯(lián)探索提供的寶貴思路,相信隨著遺傳流行病學的不斷發(fā)展及統(tǒng)計學算法的不斷完善,孟德爾隨機化有望成為傳統(tǒng)觀察性研究與RCT之間因果證據(jù)鏈的重要紐帶。
利益沖突聲明:本文不存在任何利益沖突。
作者貢獻聲明:李凌巍負責課題設計,撰寫論文;李凌巍、秦俊杰、賈云龍參與文獻搜集,修改論文并最后定稿;呂浩負責擬定寫作思路,指導撰寫文章。