肖邦福,李彥超,陳敏(通信作者*),靳蓉,王頔,徐慧,孫永烽,張昌,邵曉珊
(1.貴陽市婦幼保健院,貴州 貴陽 550003;2.畢節(jié)市第一人民醫(yī)院,貴州 畢節(jié) 551700)
囊性纖維化(Cystic fibrosis,CF)是一種常見的致死性常染色體隱性遺傳性疾病,是由于囊性纖維化跨膜傳導(dǎo)調(diào)節(jié)蛋白(Cystic fibrosis transmembrane conductance regulator,CFTR)的 基因發(fā)生突變引起CFTR蛋白的編碼功能缺陷,從而導(dǎo)致外分泌腺功能紊亂,常常累及全身多個(gè)器官,如肺臟、肝臟、汗腺、腸道及胰腺,以呼吸系統(tǒng)損害最為突出,其臨床癥狀主要表現(xiàn)為慢性咳嗽、肺部反復(fù)感染、腹瀉、生長發(fā)育遲緩、男性不育等[5,7]。CFTR蛋白是由環(huán)磷酸腺苷 (cyclic adenosine monophosphate, cAMP) 激活的氯離子 (Cl-) 通道,從而在外分泌腺導(dǎo)管上皮細(xì)胞的頂膜上介導(dǎo)Cl-及HCO3-的跨膜轉(zhuǎn)運(yùn),引起外分泌腺體功能異常,導(dǎo)致汗液中Na+、Cl-濃度異常增高[20]。CF治療的主要目標(biāo)是防止感染,減少肺部分泌物的量和黏稠程度,改善呼吸,維持足夠的營養(yǎng)等[16]。
Citespace是一款由陳超美教授研究、開發(fā)的軟件,通過對數(shù)據(jù)庫相關(guān)文獻(xiàn)的收集,借助Cites pace軟件對其機(jī)構(gòu)、關(guān)鍵詞、作者等內(nèi)容的進(jìn)行可視化分析,探求某一領(lǐng)域的研究熱點(diǎn)及前沿動態(tài)[12]。現(xiàn)已熟練并廣泛地應(yīng)用于醫(yī)學(xué),并不斷研究該領(lǐng)域的研究熱點(diǎn)、演變過程、前沿動態(tài)等。再者,通過R軟件對GSE40445數(shù)據(jù)集進(jìn)行差異性基因的分析,了解CF中相關(guān)基因的表達(dá)情況。本文利用CiteSpace、R軟件的相關(guān)功能,對我國囊性纖維化進(jìn)行分析,以期為了解其發(fā)展、變化情況。
本研究中,中文數(shù)據(jù)來源于中國知網(wǎng)(China Knowledge Network,CNKI)數(shù)據(jù)庫,以“囊性纖維化”為主題進(jìn)行數(shù)據(jù)收集,獲取相關(guān)文獻(xiàn)577篇;英文數(shù)據(jù)來源于Web of Science核心數(shù)據(jù)庫(WoS),以“cystic fibrosis”為主題,并選擇來源于中國的文章,得到相關(guān)文獻(xiàn)1427篇。時(shí)間:2002年1月到2021年12月。
在GEO數(shù)據(jù)庫(gene expression omnibus,GEO)中,以“cystic fibrosis”為關(guān)鍵詞進(jìn)行檢索,數(shù)據(jù)的研究類型為“Expression profiling by array”,種屬為“Homo sapiens”,下載編號為 GSE40445的CF(肺部)相關(guān)基因表達(dá)。數(shù)據(jù)集基于GPL10097平臺(Custom Affymetrix HsAirway array),包含5個(gè)CF和5個(gè)非CF,CF組男性2例,女性3例,平均年齡14歲;非CF組男性3例,女性2例,平均年齡14.8歲。使用GEOquery軟件包獲取這些表達(dá)數(shù)據(jù)集的微陣列信息。
將導(dǎo)出的數(shù)據(jù)以“download_***.txt”的格式存入Citespace指定的文件下,時(shí)間跨度設(shè)置為2001-2021年,每1年為1個(gè)時(shí)間切片,條件設(shè)置為 Pathfinder、Pruning sliced networks,其余設(shè)置均為默認(rèn)設(shè)置,分別選取作者、機(jī)構(gòu)、關(guān)鍵詞等生成各自的可視化圖譜。生成的圖譜中節(jié)點(diǎn)連線的粗細(xì)與共現(xiàn)程度成正相關(guān),節(jié)點(diǎn)大小與出現(xiàn)頻次成正相關(guān),顏色越鮮艷則代表近年研究的成果,節(jié)點(diǎn)圓圈層代表年輪[3,4,8]。聚類模塊值(Modularity Q)>0.3的聚類認(rèn)為是顯著的,聚類平均輪廓值(Mean Silhouette)>0.5的聚類通常認(rèn)為是合理的,而其值(S)>0.7聚類則認(rèn)為令人信服的[8]。
使用R軟件 (R 4.1.0版,https: //www.r-project.org/)中的GEOquery軟件包對GSE40445中的兩組數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理。同一基因有多個(gè)探針時(shí)計(jì)算其均值,根據(jù)注釋信息將探針轉(zhuǎn)換成相應(yīng)的基因,去除沒有對應(yīng)基因的探針。使用R 4.1.0中的limma軟件包,對數(shù)據(jù)進(jìn)行整理、規(guī)范化及注釋轉(zhuǎn)換[11]。并通過用R軟件中“pheatmap”軟件包和“ggplot2”軟件包對差異基因進(jìn)行熱圖和火山圖的繪制。
近20年相關(guān)文獻(xiàn)的發(fā)表雖有波動,總體上呈現(xiàn)出穩(wěn)定增長趨勢,在2005、2006年英文文獻(xiàn)發(fā)表量低于中文文獻(xiàn),其余年份均等于或超過后者,甚至在2018年達(dá)到高峰(約158篇);近三年來,中文文獻(xiàn)在該領(lǐng)域呈現(xiàn)出下滑的趨勢。見圖1。
圖1 2022年-2021年囊性纖維化的發(fā)文量
對“作者”進(jìn)行分析,進(jìn)一步探知該領(lǐng)域主要研究者人員、團(tuán)隊(duì)協(xié)助關(guān)系等特點(diǎn)。該圖譜包含496個(gè)節(jié)點(diǎn)、868條線,網(wǎng)絡(luò)密度0.0071,共納入作者489位,作者間合作尚可,其中發(fā)文量前5的作者為于波、侯婷婷、任閃閃、楊紅及劉?。ú⒘校?、劉燕,發(fā)表文獻(xiàn)數(shù)量分別為25篇、19篇、16篇、14篇、13篇,共101篇;其中發(fā)表文獻(xiàn)數(shù)量≥5篇20位,共202篇。見圖2。
圖2 囊性纖維化主要作者合作關(guān)系網(wǎng)(中文文獻(xiàn))
對納入機(jī)構(gòu)進(jìn)行分析,研究機(jī)構(gòu)主要分布在國內(nèi)各大學(xué)及其附屬醫(yī)院、軍區(qū)醫(yī)院,通過對比各機(jī)構(gòu)文獻(xiàn)發(fā)表量可間接反映出其對該領(lǐng)域內(nèi)的學(xué)術(shù)研究程度。在該領(lǐng)域中,發(fā)文量排前4的機(jī)構(gòu)為中南大學(xué)及其附屬醫(yī)院(79篇)、中國人民解放軍聯(lián)勤保障部隊(duì)第九一〇醫(yī)院呼吸科(19篇)、國家兒童醫(yī)學(xué)中心/首都醫(yī)科大學(xué)附屬北京兒童醫(yī)院呼吸二科(15篇)、株洲市中心醫(yī)院/中南大學(xué)湘雅醫(yī)學(xué)院附屬株洲醫(yī)院產(chǎn)科(13篇)、河南中醫(yī)藥大學(xué)中醫(yī)藥科學(xué)研究院河南省中醫(yī)方證信號傳導(dǎo)重點(diǎn)實(shí)驗(yàn)室(11篇)。該圖譜包含373個(gè)節(jié)點(diǎn)、104條線,網(wǎng)絡(luò)密度0.0015,密度偏低,表示機(jī)構(gòu)間的合作與聯(lián)系關(guān)系欠佳。見圖3。
圖3 囊性纖維化主要機(jī)構(gòu)合作關(guān)系網(wǎng)站(中文文獻(xiàn))
關(guān)鍵詞共現(xiàn)分析是利用可視化知識圖譜,對關(guān)鍵詞的進(jìn)一步分析,明確該領(lǐng)域的研究熱點(diǎn)、發(fā)展趨勢。關(guān)鍵詞聚類圖譜包含513個(gè)節(jié)點(diǎn)、976條線,網(wǎng)絡(luò)密度 0.0074,Modularity Q為 0.74,Mean Silhouette為0.52。主要聚類為囊性纖維化跨膜傳導(dǎo)調(diào)節(jié)因子、肺囊性纖維化、支氣管擴(kuò)張、CRTF等。見圖4。在時(shí)間線視圖中,在同一水平線上顯示相同聚類的文獻(xiàn),其線條越粗表示其文獻(xiàn)越多,更能體現(xiàn)在該領(lǐng)域的地位。通過時(shí)間線視圖可進(jìn)一步體現(xiàn)了囊性纖維化跨膜傳導(dǎo)調(diào)節(jié)因子、肺囊性纖維化、支氣管擴(kuò)張之間的聯(lián)系;在進(jìn)展時(shí)長方面,三者研究主題持續(xù)時(shí)間最長,長20達(dá)年之久,見圖5。近年來該領(lǐng)域突現(xiàn)次有5個(gè),為支氣管擴(kuò)張(5.65)、兒童(5.59)、哮喘(3.70)、非囊性纖維化支氣管擴(kuò)張癥(3.48)、激活劑(3.23)。對于支氣管擴(kuò)張、哮喘等肺部疾病方面的研究越來越多,在兒科疾病的診斷、治療等過程的研究不斷深入,以提高患兒的生存質(zhì)量。見圖6。
圖4 囊性纖維化關(guān)鍵詞主要聚類分析(中文文獻(xiàn))
圖5 囊性纖維化時(shí)間線圖譜(中文文獻(xiàn))
圖6 囊性纖維化關(guān)鍵詞突現(xiàn)(中文文獻(xiàn))
對“作者”進(jìn)行分析,進(jìn)一步探知本領(lǐng)域主要研究者人員、團(tuán)隊(duì)協(xié)助關(guān)系等特點(diǎn)。該圖譜包含715個(gè)節(jié)點(diǎn)、1567條線,網(wǎng)絡(luò)密度0.0061,共納入作者715位,作者間合作尚可,其中發(fā)文量前5位 的 作 者 ChanHsiao Chang、Yang Hong、GuanWeijie、Ma Tonghui、Chen Rongchang 及 Zhong Nanshan(并列),發(fā)文量分別為 53、25、22、20、19,共139篇。其中發(fā)表量≥5篇10位,共588篇。見圖7。
圖7 囊性纖維化主要作者合作網(wǎng)絡(luò)(英文文獻(xiàn))
對納入機(jī)構(gòu)進(jìn)行分析,研究機(jī)構(gòu)主要分布在國內(nèi)外各大學(xué)及其研究機(jī)構(gòu),通過對比各機(jī)構(gòu)文獻(xiàn)發(fā)表量可間接反映出其對該領(lǐng)域內(nèi)的學(xué)術(shù)研究程度。在該領(lǐng)域中,發(fā)文量前5機(jī)構(gòu)分別為中國香港大學(xué)、中國科學(xué)技術(shù)研究院、四川大學(xué)、中山大學(xué)、上海交通大學(xué),該圖譜包含493個(gè)節(jié)點(diǎn)、1375條線,網(wǎng)絡(luò)密度0.0113,密度尚可,表示機(jī)構(gòu)間的合作與聯(lián)系關(guān)系可進(jìn)一步提升。見圖8。
圖8 囊性纖維化主要機(jī)構(gòu)合作網(wǎng)絡(luò)(英文文獻(xiàn))
關(guān)鍵詞聚類圖譜包含673個(gè)節(jié)點(diǎn)、2419條線,網(wǎng)絡(luò)密度0.0107,Modularity Q為0.52,Mean Silhouette為0.66。主要為銅綠假單胞菌、囊性纖維化跨膜調(diào)節(jié)因子、小分子核糖核酸、基因傳遞及表達(dá)等。見圖9。在時(shí)間線視圖中,在同一水平線上顯示相同聚類的文獻(xiàn),其線條越粗表示其文獻(xiàn)越多,更能體現(xiàn)在該領(lǐng)域的地位。在進(jìn)展時(shí)長方面,銅綠假單胞菌、囊性纖維化跨膜調(diào)節(jié)因子、小分子核糖核酸等研究主題持續(xù)時(shí)間最長,有20達(dá)年之久,體現(xiàn)了銅綠假單胞菌在該領(lǐng)域的影響之大;隨著生物信息學(xué)的發(fā)展,基因的傳遞及表達(dá)將進(jìn)一步解釋相關(guān)疾病的發(fā)展。見圖10。排名前5的突現(xiàn)詞為陰離子分泌(7.32)、氯化物通道(6.63)、定 位(4.89)、激 活 劑(3.53)、離 子 運(yùn)輸(3.24)。見圖11。
圖9 囊性纖維化關(guān)鍵詞主要聚類分析(英文文獻(xiàn))
圖10 囊性纖維化時(shí)間線圖譜(英文文獻(xiàn))
圖11 囊性纖維化關(guān)鍵詞突現(xiàn)(英文文獻(xiàn))
從GSE40445數(shù)據(jù)集中共獲得到10個(gè)樣本的芯片檢測數(shù)據(jù)。依據(jù)標(biāo)本不同,分為CF組和非CF組。篩選標(biāo)準(zhǔn)為:|log FC|≥1且調(diào)整后P<0.05的基因作為差異基因(DEGs),分別對其進(jìn)行火山圖及熱圖的繪制。在火山圖中,獲得298個(gè)DEGs,包括122個(gè)上調(diào)基因和176個(gè)下調(diào)基因。在熱圖中,按照調(diào)整后P值大小進(jìn)行排序,前20個(gè)基因 為、EPHX1、FRMD4B、PLD3、BANF1、TJP1、TP53AP1、TETRAN、AES、C2orf17、CUEDC2、NUCB2、GSDMDC1、RPS6KB1、RAB22A、IFNGR2、IFI16、IFRD1、FLNC、MRPL40、INSIG1。見圖12。
圖12 囊性纖維化組與非囊性纖維化差異性表達(dá)基因火山圖和熱圖
相關(guān)文獻(xiàn)發(fā)表量呈現(xiàn)出增長趨勢,而在2014年以后中外文文獻(xiàn)年發(fā)表量均超過100篇,在2018年達(dá)高峰;在作者網(wǎng)絡(luò)分析中,網(wǎng)絡(luò)密度尚可,團(tuán)隊(duì)內(nèi)部合作較為緊密,但各團(tuán)隊(duì)間聯(lián)系相對缺乏,部分優(yōu)秀學(xué)者,如楊紅,在國內(nèi)外期刊均有文章發(fā)表;在機(jī)構(gòu)網(wǎng)絡(luò)分析中,其合作模式相對單一,主要體現(xiàn)在各高校內(nèi)部及附屬醫(yī)院,不同高校間合作相對偏少,在中文文獻(xiàn)中更為突出;在關(guān)鍵詞分析中,中文文獻(xiàn)以支氣管擴(kuò)張、兒童、哮喘及肺囊性纖維化等為主聚類或突現(xiàn),體現(xiàn)了中文文獻(xiàn)以兒童、疾病為主要研究方向,而外文文獻(xiàn)則以陰離子分泌、氯化物通道、激活劑、通路假單胞菌、基因的傳遞與表達(dá)等為主聚類或突現(xiàn),體現(xiàn)其對病原菌、疾病的研究更為深入,如細(xì)胞水平的研究;利用R語言對CF進(jìn)行生物信息學(xué)分析,得到298個(gè)DEGs,包括122個(gè)上調(diào)基因和176個(gè)下調(diào)基因,RAB22A、INSIG1、IFRD1、IFI16等基因可能是加重CF病情進(jìn)展的基因,NUCB2、TETRAN、CUEDC2等基因可能是減緩CF病情進(jìn)展的基因。而近年來對囊性纖維化的病因、機(jī)制及基因?qū)W的研究進(jìn)一步深入。
CF累及呼吸系統(tǒng)引起肺囊性纖維化,呼吸衰竭則是其最主要的并發(fā)癥,也是患兒死亡的主要原因,早期診斷有利于患兒獲得科學(xué)的營養(yǎng)指導(dǎo),促進(jìn)生長發(fā)育,延緩肺功能惡化[2]。
目前肺囊性纖維化的發(fā)病機(jī)制雖尚未完全清楚,但被普遍認(rèn)為是多種因素相互作用的結(jié)果,如遺傳和環(huán)境因素,以反復(fù)發(fā)生的局部肺泡上皮微損傷為關(guān)鍵環(huán)節(jié),而顆粒、粉塵則加劇病程的進(jìn)展[9-10]。遺傳因素:CFTR在上皮細(xì)胞內(nèi)是一種氯離子介導(dǎo)的通道蛋白。正常氣道上皮均表達(dá)出鈉通道、CFTR相關(guān)氯離子通道、鈣離子激活的氯離子通道等,共同作用促進(jìn)鈉離子吸收和氯離子分泌,并使得呼吸道表面液體(ASL)達(dá)到一定的厚度(約7μm),浸潤在ASL中纖毛,有規(guī)律擺動,從而可清除ASL表面的黏液。CF患者位于氣道上皮細(xì)胞的CFTR蛋白發(fā)生突變,使得離子分泌減少、鈉離子吸收增加,從而導(dǎo)致ASL厚度減少,纖毛擺動受到一定程度的影響,黏稠的分泌物不能及時(shí)被排出,容易引起細(xì)菌滋生,繼發(fā)各種感染[15,19]。
有學(xué)者認(rèn)為:肺囊性纖維化以反復(fù)的肺部細(xì)菌感染、氣道壁增厚以及分泌物異常增多為特征[1]。國內(nèi)學(xué)者發(fā)現(xiàn),反復(fù)下呼吸道感染、治療效果欠佳,可考慮特殊病原菌的感染,如銅綠假單胞菌,肺囊性纖維化在兒童易感性,確診主要依賴于基因檢測、汗液試驗(yàn)[16-17]。甚至有學(xué)者認(rèn)為:肺囊性纖維化與自噬有一定的關(guān)系,小鼠模型在肺部感染銅綠假單胞菌后,自噬相關(guān)mRNA的表達(dá)水平在短時(shí)間內(nèi)(1周)可明顯升高,后恢復(fù)正常,說明自噬活動在PCF早期增強(qiáng),但隨著病情進(jìn)展機(jī)體自噬活動被抑制[6]。此外,CFTR與多種疾病的細(xì)胞凋亡關(guān)系密切[14,18]、CFTR可調(diào)節(jié)與氧化應(yīng)激相關(guān)的細(xì)胞凋亡[13]。
本研究通過文獻(xiàn)計(jì)量的可視化分析,展示了近20年囊性纖維化領(lǐng)域發(fā)展情況,掌握該領(lǐng)域的前沿動態(tài)、熱點(diǎn)問題及發(fā)展方向;利用GEO數(shù)據(jù)庫,了解囊性纖維化相關(guān)基因表達(dá)情況,研究引起該病的關(guān)鍵基因及靶點(diǎn);加強(qiáng)疾病認(rèn)知、研究水平,對疾病進(jìn)行早期識別、診斷,減緩疾病的進(jìn)展,延緩患兒的中位生存時(shí)間,提高患兒的生存質(zhì)量等等,可能是該領(lǐng)域未來發(fā)展的趨勢,應(yīng)進(jìn)一步深入。
本文局限:本研究僅僅收集我國學(xué)者在中國知網(wǎng)數(shù)據(jù)庫、Web of Science核心數(shù)據(jù)庫發(fā)表的相關(guān)研究文獻(xiàn),研究具有一定的局限性。