武樂,李益楠,孔德信,周志鵬
1.華中農(nóng)業(yè)大學(xué)信息學(xué)院,武漢 430070;2.華中農(nóng)業(yè)大學(xué)生命科學(xué)技術(shù)學(xué)院,武漢 430070
轉(zhuǎn)錄組測(cè)序(RNA-seq)是一項(xiàng)對(duì)特定組織或細(xì)胞中所有的RNA 進(jìn)行高通量測(cè)序的技術(shù)。近十年來,隨著測(cè)序技術(shù)的發(fā)展、測(cè)序成本的降低以及分析工具的快速開發(fā),RNA-seq 已廣泛應(yīng)用于研究基因表達(dá)調(diào)控、可變剪切甚至RNA 結(jié)構(gòu)等方向,成為生命科學(xué)基礎(chǔ)研究領(lǐng)域中非常重要的技術(shù)[1]。RNAseq最常應(yīng)用于識(shí)別特定條件下差異表達(dá)的基因(dif?ferential gene expression,DGE)并 鑒 定 其 分 子 功能[2]。DGE 的分析流程主要包括5 個(gè)步驟:對(duì)高通量測(cè)序平臺(tái)產(chǎn)生的原始讀段(reads)進(jìn)行質(zhì)量檢測(cè)和控制、將預(yù)處理后的reads比對(duì)到參考基因組、在基因組或轉(zhuǎn)錄組水平上進(jìn)行定量、鑒定樣本間差異表達(dá)的基因,以及表征差異表達(dá)基因的生物學(xué)功能[3]。
目前,RNA-seq 的各個(gè)分析步驟都已有許多成熟的計(jì)算方法。然而,這種分段分析的方法通常會(huì)涉及到不同的操作系統(tǒng)和編程語言,這對(duì)于科研人員的編程能力提出較高的要求。之前已有多項(xiàng)研究將各個(gè)分析步驟集成到自動(dòng)化分析工作流程中,從而降低對(duì)用戶編程能力的要求并有效地提高其工作效率。然而,目前已開發(fā)的RNA-seq 自動(dòng)化分析工作流程中存在著一些不足之處。例如,VIPER[4]與hppRNA[5]等工具只支持少數(shù)幾個(gè)特定物種的數(shù)據(jù)分析,IRIS-EDA[6]與ideal[7]等工具僅適用于差異表達(dá)基因的下游分析和可視化,BioJupies[8]與RNA?Cocktail[9]等工具不支持原始數(shù)據(jù)的預(yù)處理和質(zhì)量控制等步驟,而ARRMOR[10]與RASflow[11]等工具缺乏對(duì)差異基因的功能注釋。
本研究通過Conda 部署環(huán)境以確保整個(gè)工作流程中的軟件快速、平穩(wěn)地安裝,并通過Snakemake 工作流程管理系統(tǒng)集成各個(gè)分析步驟,最終構(gòu)建了1個(gè)流程更完整且更易使用的RNA-seq 自動(dòng)化分析工具——RNApipe,旨在為研究人員快速、簡(jiǎn)便地從大型RNA-seq 測(cè)序數(shù)據(jù)中獲取基本信息提供技術(shù)支持。
對(duì)于編程經(jīng)驗(yàn)有限的用戶,安裝并維護(hù)RNAseq 數(shù)據(jù)分析中必需的工具及其依賴項(xiàng)通常具有挑戰(zhàn)性。Conda作為軟件包和環(huán)境管理系統(tǒng),可以自動(dòng)安裝、運(yùn)行和更新軟件包及其依賴項(xiàng),并且支持虛擬環(huán)境的創(chuàng)建、切換與移植,是確保軟件管理可持續(xù)和可重現(xiàn)的理想工具[12]。因此,RNApipe 使用Conda安裝和運(yùn)行軟件,并創(chuàng)建虛擬環(huán)境。這不僅能夠保證RNApipe 的順利安裝與平穩(wěn)運(yùn)行,還確保了獨(dú)立于操作系統(tǒng)和機(jī)器的數(shù)據(jù)可重復(fù)性分析。
為減少數(shù)據(jù)分析過程中手動(dòng)執(zhí)行的步驟,傳統(tǒng)的工作管道通常使用自定義的腳本將多個(gè)工具進(jìn)行鏈接,然而這種管道通常與本地計(jì)算基礎(chǔ)架構(gòu)高度相關(guān),難以共享與維護(hù),產(chǎn)生的結(jié)果也較難重復(fù)[13]。為此,RNApipe 使用Snakemake 工作流程管理系統(tǒng)將RNA-seq 各個(gè)分析步驟進(jìn)行組合。Snakemake[14]是一個(gè)基于python 的工作流程管理系統(tǒng),它具有以下優(yōu)勢(shì):通過集成Conda包管理器自動(dòng)安裝和配置軟件,以確保不同平臺(tái)的可移植性;通過支持高性能并行計(jì)算和云計(jì)算環(huán)境,以實(shí)現(xiàn)超越本地基礎(chǔ)架構(gòu)的可擴(kuò)展性;通過支持工作流間緩存,避免在管道之間重新運(yùn)行程序而浪費(fèi)時(shí)間和計(jì)算資源;并通過將各個(gè)步驟分解為模塊化規(guī)則(rules),從而降低了代碼的復(fù)雜性,使代碼易讀易維護(hù)易擴(kuò)展。最終,RNApipe 基于Snakemake 管理系統(tǒng),可以實(shí)現(xiàn)通過1條命令執(zhí)行整個(gè)自動(dòng)化分析過程,極大地簡(jiǎn)化了程序的運(yùn)行方式(圖1)。
整個(gè)RNApipe工作流程(圖1)包括:(1)RNApipe啟動(dòng)時(shí),首先使用fastp[15](默認(rèn))或Cutadapt[16]對(duì)每個(gè)樣本進(jìn)行檢測(cè)并修剪接頭、去除低質(zhì)量堿基和reads;隨后使用FastQC[17]檢測(cè)reads 質(zhì)量,質(zhì)檢結(jié)果由MultiQC[18]匯總為一個(gè)可視化報(bào)告。(2)質(zhì)量達(dá)到用 戶 要 求 的reads 會(huì) 被HISAT2[19](默 認(rèn))或STAR[20]比 對(duì) 到 參 考 基 因 組,比 對(duì) 結(jié) 果 由Quali?map2[21]進(jìn)行質(zhì)量評(píng)估,比對(duì)文件以BAM 或Bigwig格式(可選)保存。(3)使用featureCounts[22](默認(rèn))或HTSeq-count[23]對(duì)BAM 文件進(jìn)行定量(count)。(4)其中表達(dá)矩陣(count)用于DESeq2[24]、edgeR[25](可選)或limma[26](可選)鑒定差異表達(dá)的基因。TPM 標(biāo)準(zhǔn)化的表達(dá)矩陣用于樣本間基因的表達(dá)量分析。(5)使用KOBAS-i[27]對(duì)差異基因進(jìn)行GO 功能注釋與KEGG pathway 通路分析,對(duì)所有表達(dá)的基因做GSEA 基因集富集分析。以上每個(gè)步驟都可以輸出高質(zhì)量的可視化圖片或報(bào)告,并保留重要的輸出文件和表格數(shù)據(jù)。
圖1 RNApipe數(shù)據(jù)分析流程圖Fig.1 The workflow chart of RNApipe analysis
RNApipe 的源代碼已經(jīng)上傳至Github 供用戶下載 和 使 用:https://github.com/ywu019/RNApipe.git。以下簡(jiǎn)單介紹RNApipe 的安裝和使用方法,具體使用方法可見Github 中的說明文檔(Documenta?tion.pdf)。
1)下載RNApipe 工具與安裝環(huán)境。首先通過Python3.7 在Linux 系統(tǒng)中安裝miniConda3 環(huán)境,隨后通過以下3 條命令完成RNApipe 工具的安裝與環(huán)境 的 創(chuàng) 建:①從 GitHub 下 載 RNApipe:it clonehttps://github.com/ywu019/RNApipe.git;②創(chuàng)建環(huán)境:conda env create -n RNApipe -f envs/envs.yaml;③激活環(huán)境:conda activate RNApipe。
2)用戶指定輸入文件。在運(yùn)行RNApipe 前需要指定:基因組文件(.fa)、注釋文件(.gtf)與壓縮的測(cè)序文件(.fastq.gz)(圖1A)。其中基因組文件和注釋文件建議從NCBI下載,測(cè)序文件支持單端和雙端測(cè)序,其命名應(yīng)符合“條件_重復(fù)”(或“條件_重復(fù)_雙端”)的形式,例如root_1_R1.fastq.gz。
隨后修改configs/目錄下的樣本表(samples.tsv)和配置文件(config.yaml)。用戶可以根據(jù)實(shí)驗(yàn)條件指定樣本表中的條件列“condition”與重復(fù)列“repli?cate”的信息,并修改配置文件中的基本設(shè)置,配置文件主要包含以下變量:
PROJECT:#項(xiàng)目名稱;
READPATH:#測(cè)序文件fastq.gz的路徑;
END:#測(cè)序數(shù)據(jù)類型是SE(single-end)還是PE(paired-end);
OUTPUTPATH:#輸出文件的路徑;
GENOME:#基因組文件路徑;
ANNOTATION:#注釋文件路徑;
CONTROL:#對(duì)照組名稱,與samples.tsv 中condition一致;
TREAT:#處理組名稱;
SPEICES_ABBREVIATION:物種簡(jiǎn)稱,在speices_abbreviations中查詢;
TRIM:fastp #[fastp,cutadapt]選擇工具執(zhí)行數(shù)據(jù)預(yù)處理;
ADAPTER:AGATCGGAAGAGC # 接 頭序列;
ALIGN:hisat2#[hisat2,STAR]#比對(duì)軟件;
BIGWIG:["no"]#[yes,no]#是否將bam 格式的文件轉(zhuǎn)化為bigwig格式;
DEA:DESeq2 #[DESeq2,edgeR,limma]#差異基因分析軟件;
QUANTIFY:featureCounts #[featureCounts,htseq]#定量軟件;
THREAD:"10"#線程數(shù)目;
TIME:"5"#程序延遲時(shí)間。
3)運(yùn)行工作流程。準(zhǔn)備好所有的輸入文件后,用戶只需要通過一條命令(python main.py)即可在本地或集群環(huán)境中運(yùn)行RNApipe 整個(gè)工作流程。運(yùn)行結(jié)果保存在用戶指定的輸出目錄中,logs/目錄下生成各個(gè)分析步驟的日志文件,其中記錄了程序的運(yùn)行時(shí)間、標(biāo)準(zhǔn)輸出和標(biāo)準(zhǔn)錯(cuò)誤等信息。
為了讓用戶了解RNApipe 的工作原理和基本功能,本研究利用RNApipe 對(duì)來自4 日齡野生型擬南芥根部(root)和芽部(shoot)的單端RNA-seq 完整數(shù)據(jù)集(PRJNA321304;GEO:GSE81332)進(jìn)行自動(dòng)化分析,其中根部設(shè)為對(duì)照組,芽部設(shè)為試驗(yàn)組。
圖2A 展示了用戶從Github 下載的RNApipe 所包含的完整數(shù)據(jù)集。example_data/目錄代表1 個(gè)真實(shí)的測(cè)試數(shù)據(jù)子集(GSE81332),便于用戶在運(yùn)行實(shí)際項(xiàng)目前對(duì)系統(tǒng)和軟件進(jìn)行測(cè)試。Documentation.pdf 文檔對(duì)RNApipe 的安裝、使用方法以及注意事項(xiàng)進(jìn)行了詳細(xì)的介紹。
用戶在運(yùn)行項(xiàng)目時(shí)應(yīng)在project/目錄中設(shè)置類似于example_data/的項(xiàng)目結(jié)構(gòu),并將測(cè)序數(shù)據(jù)、參考基因組和注釋文件分別置于相應(yīng)的子目錄中(圖2A),再根據(jù)實(shí)驗(yàn)條件修改config.yaml文件(圖2B)和sam?ple.tsv文件(圖2C)。當(dāng)輸入文件設(shè)置完畢,只需要1條簡(jiǎn)單的命令(圖1 命令),RNApipe 將根據(jù)config.yaml 文件中的設(shè)置,通過Snakemake 對(duì)main.py 中的規(guī)則自動(dòng)執(zhí)行整個(gè)分析過程。輸出結(jié)果存于trim/、align/、quantify/、DEA/、annotation/、visualize/等目錄,分別對(duì)應(yīng)質(zhì)控、比對(duì)、定量、差異分析、功能注釋和圖形可視化結(jié)果(圖1C)。其余文件則不需要修改,除非用戶需要自定義工作流程。
圖2 RNApipe的文件與目錄結(jié)構(gòu)Fig.2 The file and directory structures of RNApipe
為了保證分析結(jié)果的準(zhǔn)確性,RNApipe 分別對(duì)質(zhì)控后的數(shù)據(jù)和比對(duì)文件進(jìn)行質(zhì)量檢測(cè),并將每個(gè)樣本文件生成的質(zhì)控報(bào)告(html)進(jìn)行匯總(圖3)。通過質(zhì)控報(bào)告檢查當(dāng)前reads 是否仍需要修剪,當(dāng)數(shù)據(jù)質(zhì)量較低時(shí),例如:堿基質(zhì)量差、GC 含量不穩(wěn)定、存在接頭等,則建議繼續(xù)修剪以提高數(shù)據(jù)質(zhì)量。如圖3A 所示,6 個(gè)樣本在質(zhì)控后的堿基質(zhì)量均在Q30以上,表明堿基質(zhì)量較好,可用于后續(xù)數(shù)據(jù)分析。圖3B展示了6個(gè)樣本的詳細(xì)比對(duì)情況。
圖3 數(shù)據(jù)質(zhì)量檢測(cè)報(bào)告Fig.3 Report on data quality inspection
在完成質(zhì)量控制和比對(duì)后,RNApipe 將表達(dá)矩陣(count)進(jìn)行TPM 標(biāo)準(zhǔn)化,以消除測(cè)序深度和基因長(zhǎng)度對(duì)表達(dá)量的影響。設(shè)置閾值(TPM<1)過濾低表達(dá)的基因,得到的表達(dá)量矩陣用于可視化圖表展示(圖4)。
RNApipe 使用cor 函數(shù)與ggplot2 包(v3.3.3)將所有樣本基因表達(dá)譜的成對(duì)相關(guān)性可視化為熱圖,相關(guān)系數(shù)的絕對(duì)值越接近1,表明樣本之間的相關(guān)性越高,這有助于用戶進(jìn)一步識(shí)別相關(guān)性較低的離群值樣本。結(jié)果顯示擬南芥根部或芽部中各個(gè)生物學(xué)重復(fù)間的相關(guān)性較高,而樣本間的相關(guān)性較差(圖4A)。此外,RNApipe 使用FactoMineR(v2.4)和fac?toExtra(v1.0.7)包進(jìn)行主成分分析(PCA),通過將數(shù)據(jù)降為二維,再進(jìn)行K-means 聚類和計(jì)算歐式距離,距離值越小則表示數(shù)據(jù)的相似度越高,用戶可以據(jù)此分離和排除離群值。PCA 結(jié)果同樣顯示組內(nèi)的生物學(xué)重復(fù)聚類良好,而樣本間差異較大(圖4B)。RNApipe還支持使用pheatmap包(v1.0.12)展示樣本中所有表達(dá)基因的聚類圖譜,橫軸頂部的線圖表示樣本的聚類,左側(cè)線圖則表示基因的聚類。此外,RNApipe 使用stat_ecdf 和geom_boxplot 函數(shù)分別繪制累積分布曲線圖(圖4C)與箱線圖(圖4D)以評(píng)估2 組樣本中基因的整體表達(dá)水平。同樣地,這2 種分析方法也都表明擬南芥根部的整體基因表達(dá)水平顯著高于芽部。與圖4A、B 一致,聚類圖譜的結(jié)果同樣表明組內(nèi)重復(fù)的相關(guān)性較高,而組間差異較大(圖4E)。同時(shí),該結(jié)果還表明擬南芥根部的基因總體表達(dá)量高于芽部(圖4E)。
圖4 樣本間基因表達(dá)量的可視化Fig.4 Visualization of gene expression levels among samples
RNA-seq 下游分析的第一步是鑒定樣本間差異表達(dá)的基因。RNApipe 集成了當(dāng)下主流的差異表達(dá)工具:DESeq2、edgeR、limma。這些工具具有不同的模型和優(yōu)勢(shì)(見Documentation.pdf),用戶可以根據(jù)實(shí)驗(yàn)需求在config.yaml 中選擇其中任一工具進(jìn)行分析。RNApipe 默認(rèn)使用DESeq2 軟件在基因水平上執(zhí)行差異基因的鑒定,DESeq2 使用基因表達(dá)的原始豐度而不是標(biāo)準(zhǔn)化豐度進(jìn)行統(tǒng)計(jì)檢驗(yàn)[28]。DESeq2分析的結(jié)果包括:對(duì)數(shù)變化(logFC)、錯(cuò)誤發(fā)現(xiàn)率(FDR)以及調(diào)整后的P值。圖5 展示了擬南芥芽部相較于根部顯著差異基因(|logFC|≥1 且Padj<0.05)的數(shù)目,以及前30 個(gè)變化最大的顯著差異基因的表達(dá)量熱圖。除了可視化圖片,輸出結(jié)果還包括基因表達(dá)矩陣和顯著差異基因列表,以便科研人員進(jìn)一步分析和后續(xù)驗(yàn)證。
圖5 樣本間差異表達(dá)基因的可視化Fig.5 Visualization of differentially expressed genes among samples
差異基因的功能注釋對(duì)于了解特定條件所影響的生物學(xué)過程至關(guān)重要?;虮倔w論(GO)分析[29]與京都基因和基因組百科全書(KEGG)途徑分析[30]是對(duì)差異表達(dá)基因進(jìn)行分類的重要工具。RNApipe通過KOBAS-i 數(shù)據(jù)庫對(duì)差異基因的生物學(xué)功能和參與的通路進(jìn)行注釋(圖6)。GO 分析從分子功能(MF)、生物過程(BP)和細(xì)胞成分(CC)3 個(gè)方面展示,擬南芥根部與芽部間差異基因的GO 分類注釋,表明差異基因主要與氧化還原和脅迫相應(yīng)等過程相關(guān),并顯著富集于葉綠體、質(zhì)體等部位(圖6A)。KEGG 通路分析是探索差異基因的功能和相關(guān)通路的另一個(gè)重要工具。KEGG 氣泡圖展示了根部與芽部間差異基因顯著富集的前30 條KEGG 通路,氣泡的大小代表富集到該通路中基因數(shù)目的多少,氣泡的顏色從紅到藍(lán)代表富集程度越來越顯著。結(jié)果表明差異基因主要富集在代謝和植物激素信號(hào)轉(zhuǎn)導(dǎo)等通路(圖6B)。
圖6 樣本間基因功能注釋的可視化Fig.6 Visualization of gene functional annotations among samples
GO 和KEGG 富集分析往往側(cè)重于識(shí)別兩組間差異表達(dá)顯著的基因,這可能導(dǎo)致遺漏部分差異表達(dá)不顯著卻有重要功能和意義的基因,另外,GO 和KEGG 分析無法判斷差異基因的變化方向是上調(diào)還是下調(diào)。基因集富集分析(GSEA)不需要指定明確的差異閾值,算法會(huì)根據(jù)實(shí)際數(shù)據(jù)的整體趨勢(shì)對(duì)基因的表達(dá)差異進(jìn)行排序,隨后檢驗(yàn)數(shù)據(jù)庫中預(yù)先設(shè)定的基因集富集在該排序列表的頂端或底端,因此,GSEA 檢測(cè)到的是基因集而不是單個(gè)基因的表達(dá)變化。GSEA 圖展示了脂質(zhì)和脂蛋白通路中的基因集的表達(dá)在擬南芥的芽中呈現(xiàn)上調(diào)的趨勢(shì),而卟啉與葉綠素代謝通路中的基因集的表達(dá)在根中呈現(xiàn)下調(diào)的趨勢(shì)(圖6C)。
與現(xiàn)有的自動(dòng)化分析工具對(duì)比(表1),RNApipe通過Conda 虛擬環(huán)境保證了所有軟件的自動(dòng)安裝與運(yùn)行,通過Snakemake 工作流程管理系統(tǒng)整合各個(gè)分析步驟,保證了數(shù)據(jù)的可重復(fù)性與功能的可擴(kuò)展性,并通過用戶指定輸入文件,保證了RNApipe 適用于所有有參物種的分析。先前的工作流程大多到鑒定差異基因就截止,然而差異基因的功能注釋對(duì)于生物學(xué)問題的研究更具有指導(dǎo)意義,因此RNApipe通過KOBAS-i數(shù)據(jù)庫進(jìn)行功能注釋。該數(shù)據(jù)庫目前整合了最新的KEGG 數(shù)據(jù)庫,支持5 944 個(gè)物種的KEGG 注釋和71 個(gè)物種的GO 注釋信息。另外,RNApipe 在各個(gè)分析步驟中集成了多款當(dāng)下主流的軟件,并在log 日志文件中記錄同類型軟件的運(yùn)行情況。通過比較運(yùn)行時(shí)間和所耗硬件資源,我們篩選出一套最優(yōu)軟件組合作為RNApipe 的默認(rèn)流程(FastQC-fastp-HISAT2-featureCounts-DESeq2-KO?BAS-i)。同時(shí),用戶也可以根據(jù)自己的實(shí)驗(yàn)數(shù)據(jù),通過修改config.yaml 中的參數(shù)選擇非默認(rèn)軟件進(jìn)行分析。RNApipe 另一重要的特點(diǎn)是在每一分析階段都提供詳細(xì)的高質(zhì)量圖表供用戶直接使用。
表1 RNApipe與其他自動(dòng)化分析工具的比較Table 1 Comparison of RNApipe with other automated analysis tools
利用RNA-seq 數(shù)據(jù)鑒定差異表達(dá)基因?yàn)檠芯恐匾目茖W(xué)問題提供了思路,若將整個(gè)過程的分析步驟整合為一個(gè)自動(dòng)化、模塊化的流程,將極大地方便科研工作者的使用。為此,本研究開發(fā)了一個(gè)適用于任何有參物種的、流程更加完整的RNA-seq自動(dòng)化分析工作流程:RNApipe。RNApipe工作流程旨在分析來自任何有參物種的RNA-seq數(shù)據(jù)。目前,RNApipe已在以下5個(gè)模式物種的完整數(shù)據(jù)集中完成測(cè)試與評(píng)估:人(PRJNA390636;GEO:GSE100075)、小 鼠(PRJNA630257;GEO:GSE149838)、擬南芥(PRJ?NA321304;GEO:GSE81332)、粗糙脈孢菌(PRJ?NA392079;GEO:GSE100539) 、酵 母(PRJ?NA318684;GEO:GSE80357)。分 析 結(jié) 果 表 明,RNApipe 運(yùn)行穩(wěn)定,功能注釋結(jié)果符合已發(fā)表文獻(xiàn)的數(shù)據(jù)。實(shí)際數(shù)據(jù)集的可視化結(jié)果存放于https://github.com/ywu019/RNApipe_pj.git.,與現(xiàn)有的自動(dòng)化分析工具對(duì)比,RNApipe 具有安裝容易、使用方便、易于擴(kuò)展、功能豐富等特點(diǎn)。RNApipe 將幫助科研工作者以一種簡(jiǎn)單、高效且可重復(fù)的方式從RNAseq數(shù)據(jù)中獲取有價(jià)值的信息。
RNApipe 目前主要適用于對(duì)二代Illumina 測(cè)序平臺(tái)產(chǎn)生的短讀長(zhǎng)(short-read)數(shù)據(jù)進(jìn)行差異基因分析。在RNApipe 的基礎(chǔ)上,用戶可以通過修改rules命令來擴(kuò)展其他功能,例如可變剪切與單核苷酸變異的檢測(cè)等。另外,由于常規(guī)RNA-seq 是對(duì)所有細(xì)胞的RNA 進(jìn)行測(cè)序的技術(shù),因此無法辨別細(xì)胞的類型和空間信息。近年來興起的單細(xì)胞轉(zhuǎn)錄組測(cè)序技術(shù)(scRNA-seq)常應(yīng)用于研究不同組織或器官中(例如正常和癌癥)差異基因的表達(dá),為研究單細(xì)胞水平的基因表達(dá)譜提供了機(jī)會(huì)??臻g轉(zhuǎn)錄組測(cè)序技術(shù)通過將成像技術(shù)與scRNA-seq 相結(jié)合,可以繪制出轉(zhuǎn)錄本在組織中表達(dá)的位置,進(jìn)一步提高組織分辨率。scRNA-seq 技術(shù)與空間轉(zhuǎn)錄組學(xué)技術(shù)的普及同時(shí)伴隨著研究人員在數(shù)據(jù)分析方面面臨的挑戰(zhàn),RNApipe 的結(jié)構(gòu)設(shè)計(jì)則可以為scRNA-seq 自動(dòng)化數(shù)據(jù)分析工具的構(gòu)建提供參考。