田 薇,方 延 ,吳晗恬,吉布強,夏昭林
(1.新疆醫(yī)科大學公共衛(wèi)生學院,新疆烏魯木齊 830011;2.復旦大學公共衛(wèi)生學院,上海 200032;3.山東省臨沂市人民醫(yī)院血液科,山東 臨沂 276100)
急性白血病按照法、美、英分型系統(tǒng)(French-American-British classification systems,F(xiàn)AB)分型,主要分為急性髓性白血病(acute myeloid leukemia,AML)和急性淋巴細胞白血病。其中AML是以骨髓和外周血中未成熟骨髓干細胞惡性增生為特征,并具有高度異質性的惡性腫瘤,發(fā)生機制尚在研究中。由于AML治愈率不高,且存活率低,治療后存在復發(fā)的特點,因此研究和探索其分子生物學機制,發(fā)現(xiàn)新的生物標志極其重要。
近年來長鏈非編碼RNA(long noncoding RNA,lncRNA)逐漸成為表觀遺傳研究熱點。以往認為lncRNA 沒有功能,最新研究表明其在基因組中被廣泛轉錄并在基因調節(jié)中起重要作用,lncRNA可能存在序列和空間結構上的異常、表達水平的異常及與結合蛋白相互作用的異常等,從而導致基因調節(jié)異常而發(fā)生疾病。目前l(fā)ncRNA 最重要的發(fā)現(xiàn)是可能與惡性腫瘤的發(fā)生相關,不少研究顯示在乳腺癌、肝癌、前列腺癌、肺癌中l(wèi)ncRNA的表達水平有明顯變化。
LncRNA 在血液腫瘤發(fā)生過程中所起的作用目前尚不清楚,其分子遺傳及表觀遺傳學機制還需要進一步探討。本研究采用lncRNA 基因芯片篩選AML 患者與健康對照組人群外周血中差異表達的lncRNAs 及mRNAs,并對所篩選出的差異表達lncRNAs和mRNAs進行基因本體(gene ontology,GO)分析和通路分析,探討可能的分子功能及差異表達基因可能所在的細胞通路,對AML中的差異基因進行生物信息學的初步功能分析。
收集AML患者及健康對照組各6例人群外周靜脈血。白血病患者男性4名,女性2名,平均年齡(46.8±9.54)歲;健康對照組男性4 名,女性2 名,平均年齡(47.5±8.09)歲;兩組選取的樣本年齡和性別匹配。
D
(260)/D
(280)值在1.8~2.1 之間認為RNA 樣本質量符合要求。檢測合格的RNA再進行芯片實驗。本實驗樣本由上海伯豪生物技術有限公司采用Agilent 4×180 K lncRNA 芯片(Agilent,US)同時檢測lncRNA 和 mRNA,lncRNA 數(shù)目 63 431,mRNA 數(shù)目39 887。質檢合格并純化后的總RNA 經(jīng)過熒光標記,在滾動雜交爐中進行芯片雜交,掃描并采集信號,最終獲得lncRNA及mRNA表達量。
P
<0.05。1.5.1 散點圖繪制
芯片的原始數(shù)據(jù)經(jīng)過標準化處理,以2 為底數(shù)取對數(shù)值后繪制散點圖,用于評估兩組數(shù)據(jù)總體分布情況。散點圖中的所有點代表芯片上的所有探針,在二維平面中該點的位置由X軸坐標和Y 軸坐標確定。X 軸表示急性髓性白血病組標準化后點的信號值,Y 軸表示對照組標準化后點的信號值。當探針點在兩張芯片中信號值差異倍數(shù)=1時,點落在圖形y
=x
直線即中位線上方;當探針點在兩張芯片中信號值差異差異倍數(shù)>2時,則該點落在圖形中位線兩側45°線之外。1.5.2 火山圖繪制
芯片數(shù)據(jù)進行組間比較,通過篩選FC 以及t
-檢驗得到的P
值來確定顯著性差異的探針?;鹕綀D在同一平面內展示了滿足上述兩條件的探針數(shù)目及分布。在火山圖中,縱坐標為-lgP
值。橫坐標為log(FC),正號代表了基因表達上調,負號代表基因下調。1.5.3 聚類熱圖繪制
對樣本和基因分別進行分級聚類之后,通過熱圖表現(xiàn)基因在不同樣本中表達情況的直觀圖形。對差異表達的基因進行GO 分析和京都基因和基因組百科全書分析(Kyoto Encyclopedia of Genes and Genomes,KEGG)。將差異表達基因上傳至數(shù)據(jù)庫(http://www.geneontology.org)進行GO分析,同時上傳至數(shù)據(jù)庫(http://www.kegg.jp/kegg/pathway.html)進行KEGG分析預測可能的信號通路。
對完成雜交的12個樣本芯片進行掃描,結果每張芯片信號均無邊緣化效應,均勻清晰。
結果顯示,急性髓性白血病組與健康對照組相比,差異表達的lncRNA 有3 256個,其中1 161個表達上調,2 095 個表達下調;差異表達的mRNA 有3 544 個,其中1 950 個表達上調,1 594 個表達下調。表達上調和下調各前20位分別見表1和表2。
表1 急性髓性白血病組表達上調的lncRNAs和mRNAs(前20位)
表2 急性髓性白血病組表達下調的lncRNAs和mRNAs(前20位)
P
值越小,F(xiàn)C值越大,差異越顯著。對白血病組及對照組篩選出的差異表達的lncRNAs 及mRNAs 進行分級聚類,結果見圖3,從圖中可以看到每個基因在不同分組中的表達量差異分布。紅色表示表達上調,綠色表示表達下調。
圖1 LncRNA和mRNA散點圖
圖2 LncRNA和mRNA火山圖
圖3 LncRNA和mRNA聚類熱圖
與對照組比較,急性髓性白血病組的差異表達基因主要富集在化學刺激感受、有絲分裂細胞周期的G1/S轉變、炎癥反應等;差異表達基因富集的前10個GO條目見表3,差異基因的所有富集GO條目見圖4。
急性髓性白血病組與對照組比較的差異表達基因主要富集在移植物抗宿主反應疾病、細胞循環(huán)及人類嗜T淋巴細胞病毒I型感染等通路上,差異表達基因富集的前10 個通路見表4,差異基因的所有富集通路見圖5。
LncRNA 參與了包括X 染色體沉默、基因組印跡、染色質修飾、轉錄激活、轉錄干擾、轉錄后調控、核內運輸?shù)榷喾N重要的調控過程,與細胞內很多生命活動密切相關。研究發(fā)現(xiàn)lncRNA在多種惡性腫瘤中表達異常,如lncRNA HOXA11-AS在肝癌組織中表達上調,lncRNA HOTAIR 在彌漫性大B細胞淋巴瘤中高表達,lncRNA KCNMB2-AS1 在胃癌組織中高表達。多項研究均顯示,腫瘤的發(fā)生與lncRNA異常表達有關。史利歡等在體外細胞試驗中也發(fā)現(xiàn),lncRNA HIT 可通過抑制QKI 蛋白(Quaking QKI)的表達進而上調 Sox2 及 Oct4 的 mRNA 及蛋白表達,從而導致人急性淋巴細胞白血病細胞系SUP-B15對治療該病的常用藥物伊馬替尼產(chǎn)生藥物抵抗。由此可見,lncRNA在白血病發(fā)生及后續(xù)治療過程均可能產(chǎn)生調控作用,因此建立白血病lncRNA 差異表達譜極其重要。
表3 急性髓性白血病與對照組差異表達基因富集的前10個GO條目
圖4 急性髓性白血病組與對照組差異基因GO分析
表4 急性髓性白血病組與對照組差異表達基因富集的前10個通路
圖5 急性髓性白血病組與對照組差異基因的KEGG分析
本研究采用lncRNA 基因芯片篩選急性髓性白血病與健康對照組外周血中l(wèi)ncRNAs和mRNAs的差異表達。結果顯示急性髓性白血病組與健康對照組相比,差異表達的lncRNA 有3 256個,其中1 161個表達上調,2 095個表達下調;差異表達的mRNA有 3 544個,其中1 950個表達上調,1 594個表達下調。此結果提示差異表達基因與急性髓性白血病的發(fā)生可能有關,但仍需進一步的實驗進行探討。
此外,本研究對篩選出的差異表達lncRNAs 和mRNAs進行了GO分析和KEGG分析。GO分析結果顯示,差異表達基因主要富集在化學刺激感受、有絲分裂細胞周期的G1/S轉變、炎癥反應等。表明差異表達基因在急性髓性白血病的發(fā)生過程中,調控細胞有絲分裂過程,對細胞增殖和凋亡產(chǎn)生異常影響,為急性髓性白血病的發(fā)生機制提供基因水平的依據(jù)。研究顯示,lncRNA可能通過調控miRNA進而對細胞增殖和凋亡起到調控作用。白血病的發(fā)生與造血干細胞的增殖和凋亡異常關系密切。KEGG 分析結果顯示急性髓性白血病組與對照組比較的差異表達基因主要富集在移植物抗宿主反應疾病、細胞循環(huán)及人類嗜T 淋巴細胞病毒I 型感染等通路上,為后續(xù)研究提供依據(jù)。目前多項研究發(fā)現(xiàn)lncRNAs 參與腫瘤發(fā)生相關的多種信號通路,如增殖信號通路、抑癌基因信號通路、細胞存活信號通路、運動信號通路等。Trimarchi等研究發(fā)現(xiàn)lncRNA LUNAR1 可能被Notch1 致癌基因誘導從而上調生長因子1 的受體表達,使得細胞異常增生導致急性淋巴細胞白血病的發(fā)生。
綜上所述,惡性血液腫瘤與lncRNA 的異常表達密切相關。本文通過對急性髓性白血病組與健康對照組差異表達lncRNAs和mRNAs進行篩選,建立了差異表達lncRNAs 表達譜;研究結果為探索急性髓性白血病發(fā)生的新標志物及早期診斷提供可靠的線索,為后續(xù)研究奠定了基礎。