張京業(yè),王苗苗,吳克良
[山東大學(xué)生殖醫(yī)學(xué)研究中心(山東大學(xué)附屬生殖醫(yī)院),濟南 250012]
隨著輔助生殖技術(shù)在世界范圍內(nèi)的廣泛應(yīng)用,有關(guān)多胎妊娠的報道逐漸增多。多胎妊娠會帶來許多問題,包括早產(chǎn)、低出生體重、新生兒死亡和殘疾等的概率顯著增加[1]。提高妊娠率的同時降低多胎妊娠的發(fā)生,這就需要一種更有效且更嚴格的移植前胚胎選擇方案。近年來time-lapse(延時攝像)技術(shù)在一定程度上彌補了傳統(tǒng)胚胎觀察方式無法連續(xù)觀察的局限性,大大提高了人們對胚胎發(fā)育過程的認識。time-lapse技術(shù)也越來越多地被用于預(yù)測胚胎的發(fā)育潛能和胚胎染色體的整倍性[2-8]。目前,基于time-lapse技術(shù)建立的預(yù)測胚胎發(fā)育潛能的模型有很多。有根據(jù)胚胎著床數(shù)據(jù)(known implantation data,KID)建立的適用于挑選移植胚胎模型[9-12],也有基于優(yōu)質(zhì)囊胚形成建立的胚胎預(yù)測模型[13-15],但基于胚胎活產(chǎn)數(shù)據(jù)的預(yù)測模型較少[7]。此外,同一個模型在不同IVF實驗室的適用性可能存在差異[16],因各實驗室之間可能有著不同的胚胎培養(yǎng)環(huán)境[17-18],不同的卵巢刺激方案[19],以及不同的患者群體[20-22]等。本研究根據(jù)活產(chǎn)胚胎的早期動力學(xué)參數(shù)和D3形態(tài)學(xué)評分,建立一個新的胚胎預(yù)測模型,為本中心輔助生殖實驗室服務(wù)的同時,也為類似患者條件以及胚胎培養(yǎng)條件的生殖中心提供新思路。
1.1 研究對象 回顧分析2017至2019年在山東大學(xué)附屬生殖醫(yī)院就診的患者。剔除標(biāo)準(zhǔn):非第一周期,年齡>40歲,嚴重男性因素,多囊卵巢綜合征(polycystic ovarian syndrome,PCOS),子宮內(nèi)膜異位癥,身體質(zhì)量指數(shù)(body mass index,BMI)>30kg/m2,胚胎植入前遺傳學(xué)檢測(preimplantation genetic testing,PGT)周期,低反應(yīng)周期和過度刺激周期(成熟數(shù)<5枚或>15枚)。納入標(biāo)準(zhǔn):助孕方式為常規(guī)體外受精(in-vitro fertilization,IVF)或胞漿內(nèi)單精子注射(intracytoplasmic sperm injection,ICSI);在time-lapse培養(yǎng)箱中培養(yǎng),且有完整的胚胎發(fā)育視頻;正常受精優(yōu)胚數(shù)≥2,第三天移植一枚或兩枚胚胎,且每個胚胎的活產(chǎn)結(jié)局是已知的。移植一枚胚胎,其結(jié)局為活產(chǎn)或未活產(chǎn);移植兩枚胚胎,其結(jié)局為兩枚都活產(chǎn)或兩枚都未活產(chǎn)。若移植兩枚胚胎,僅有一枚活產(chǎn),該數(shù)據(jù)將不被采用。
1.2 胚胎培養(yǎng)與移植 所有胚胎均放入time-lapse培養(yǎng)箱(EmbryoScope,Vitrolife)培養(yǎng)。培養(yǎng)條件37℃、6.0% CO2和5.0% O2,序貫培養(yǎng)液為G1,G2(Vitrolife)。培養(yǎng)箱每隔15min在7個層面對胚胎進行拍照。D3移植一枚或兩枚優(yōu)質(zhì)胚胎,胚胎移植后常規(guī)行黃體支持。移植后14d檢測血β絨毛膜促性腺激素(β-HCG),4~6周陰道B超下出現(xiàn)孕囊和胎心為臨床妊娠,并持續(xù)追蹤活產(chǎn)結(jié)局。
1.3 胚胎發(fā)育的評估 由一位經(jīng)驗豐富的胚胎學(xué)家利用Embryo Viewer軟件(Vitrolife)來完成對胚胎發(fā)育的評估。t2-tPNf、t3-tPNf、t4-tPNf、t5-tPNf、t8-tPNf分別為從原核消失到胚胎分裂為2細胞、3細胞、4細胞、5細胞、8細胞的時間點。CC2(t3-t2)、CC3(t5-t3)、S2(t4-t3)、S3(t8-t5)以及t5-t2分別為多個細胞分裂的持續(xù)時間。直接分裂(direct cleavage,DC):胚胎在三次同步分裂過程中發(fā)生的異常分裂行為,一個卵裂球在5h內(nèi)分裂為至少3個卵裂球。68h胚胎的形態(tài)學(xué)評分,依據(jù)本中心一直采用的Puissant評分體系,將胚胎分為1~4分,4分胚胎的標(biāo)準(zhǔn)為卵裂球形態(tài)大小正常均一,沒有或幾乎沒有碎片[23-24]。
1.4 預(yù)測模型的建立、評估與驗證 根據(jù)活產(chǎn)胚胎與非活產(chǎn)胚胎動力學(xué)參數(shù)的差異,篩選出與胚胎活產(chǎn)相關(guān)的參數(shù)。進一步通過各個參數(shù)四分位數(shù)范圍和對應(yīng)的活產(chǎn)率來最終確定用于建立模型的參數(shù)。結(jié)合形態(tài)學(xué)評分建立一個基于決策樹的模型。繪制受試者工作特征曲線(receiver operating characteristic,ROC),并用曲線下面積(Area Under the Curve,AUC)來確定模型的預(yù)測價值。通過五倍交叉驗證法來檢驗上述預(yù)測模型的魯棒性。將所有移植胚胎隨機分成5份,其中4/5胚胎組成校準(zhǔn)組,按建立模型流程圖建立新的模型,剩余1/5胚胎為驗證組,驗證該模型的有效性。校準(zhǔn)-驗證運行五次,統(tǒng)計每次運行的動力學(xué)參數(shù)以及校準(zhǔn)組和驗證組的AUC。
1.5 兩種胚胎挑選模型的定義 KIDScore模型[12]:該模型是一種廣泛使用的模型,旨在避免低植入潛能胚胎而不是選擇高植入潛能胚胎。Embryo Viewer軟件根據(jù)胚胎發(fā)育過程中的多個發(fā)育節(jié)點,可自動對每個胚胎進行1~5分的評分。Liu模型[11]:利用定性參數(shù)DC、RC、ICCP(在4-細胞末期,卵裂球之間小于6個細胞間接觸點)和定量參數(shù)T5_PNF和S2將胚胎分為F、E、D、C、B、A、A+共七個等級。
1.6 統(tǒng)計學(xué)處理 采用SPSS 17.0軟件進行連續(xù)性參數(shù)、比值性參數(shù)之間的比較以及動力學(xué)參數(shù)四分位數(shù)的劃分,P<0.05為差異有統(tǒng)計學(xué)意義。采用MedCalc軟件進行二元邏輯回歸分析以及AUC的比較,P<0.05為差異有統(tǒng)計學(xué)意義。
2.1 患者基本信息 共納入434例患者(IVF患者384例,ICSI患者50例)?;颊叩钠骄挲g(31.2±4.0)歲,平均獲卵數(shù)(10.3±2.0)個?;町a(chǎn)組177例患者,其中173例移植兩枚胚胎均獲得活產(chǎn),4例移植一枚胚胎且獲得活產(chǎn),活產(chǎn)胚胎共350枚。非活產(chǎn)組257例患者,其中238例移植兩枚胚胎均沒有活產(chǎn),19例移植一枚胚胎且沒有活產(chǎn),非活產(chǎn)胚胎共495枚。因此本研究共納入已知活產(chǎn)結(jié)局的胚胎845枚。
2.2 預(yù)測模型的建立 非活產(chǎn)組的異常分裂DC比例顯著高于活產(chǎn)組,見表1。因此,胚胎發(fā)育過程中是否有DC發(fā)生可作為篩選胚胎的重要前提。將發(fā)生DC的103枚胚胎剔除后,分析兩組的定量參數(shù)。結(jié)果顯示,兩組的t3-tPNf、t4-tPNf、t5-tPNf以及t8-tPNf四個參數(shù)比較,差異有統(tǒng)計學(xué)意義(P<0.01)。t4-tPNf、t5-tPNf的前三個四分位數(shù)Q1、Q2和Q3所對應(yīng)的活產(chǎn)率高于最后一個四分位數(shù)Q4,差異有統(tǒng)計學(xué)意義(P<0.05)。t8-tPNf的前兩個四分位數(shù)Q1和Q2所對應(yīng)的活產(chǎn)率高于后兩個四分位數(shù)Q3和Q4,差異有統(tǒng)計學(xué)意義(P<0.05)。見表2。綜合考慮下,t4-tPNf和t8-tPNf被用來構(gòu)建胚胎預(yù)測模型。根據(jù)胚胎發(fā)育過程是否有異常分裂(DC),兩個定量參數(shù)t4-tPNf和t8-tPNf,以及形態(tài)學(xué)評分建立了胚胎預(yù)測模型,見圖1。該模型將所有移植胚胎分為1~4分,分數(shù)高低代表了胚胎的活產(chǎn)潛能。
表1 兩組胚胎定性參數(shù)DC和定量參數(shù)t3-tPNf、t4-tPNf、t5-tPNf、t8-tPNf的比較
表2 定量參數(shù)t3-tPNf、t4-tPNf、t5-tPNf、t8-tPNf的四分位數(shù)范圍和對應(yīng)的活產(chǎn)率
2.3 預(yù)測模型評估 根據(jù)預(yù)測模型評分繪制ROC曲線,AUC為0.664,見圖2。五倍交叉驗證法驗證后發(fā)現(xiàn)建立預(yù)測模型的兩個參數(shù)t4-tPNf和t8-tPNf未發(fā)生大的偏差,且校準(zhǔn)組與驗證組的AUC非常穩(wěn)定,與預(yù)測模型的AUC無顯著差異,見表3。這證明了該預(yù)測模型的魯棒性。
表3 五倍交叉驗證法驗證預(yù)測模型
2.4 預(yù)測模型與外部模型的比較 將兩個廣泛應(yīng)用的胚胎植入預(yù)測模型應(yīng)用到本研究的845枚胚胎中,結(jié)果顯示,3種模型的AUC存在顯著差異,見圖3。KIDScore模型和Liu模型對本中心活產(chǎn)數(shù)據(jù)的預(yù)測能力低于本研究的預(yù)測模型。
基于time-lapse技術(shù)的胚胎模型有很多,一個成熟的胚胎預(yù)測模型在某個實驗室可能需要做出調(diào)整或根本不適用。因此,每個實驗室可根據(jù)KID數(shù)據(jù)制定自己的胚胎挑選模型。本研究借鑒了多個模型[9-12]的建模思路和參數(shù),綜合分析影響胚胎活產(chǎn)的動力學(xué)參數(shù),結(jié)合D3形態(tài)學(xué)評分,建立一個新的胚胎預(yù)測模型。
DC作為一種常見的異常分裂現(xiàn)象,被認為會顯著降低胚胎的著床率[9,25]。本研究中活產(chǎn)組和非活產(chǎn)組的DC比例存在顯著差異。因此,DC被用作挑選胚胎重要的定性參數(shù)。定量參數(shù)在不同模型中差異較大,Meseguer模型采用了t5、S2(t4-t3)和CC2(t3-t2)。Liu模型采用t5-PNF、S2以及68h時是否達到8細胞。KIDScore模型采用t3-tPNF、t3、t5-t3/t5-t2以及66h時是否達到8細胞。本研究中,上述定量參數(shù)在兩組中不存在顯著差異;而兩個新參數(shù)t4-tPNf和t8-tPNf表現(xiàn)出了顯著差異,且有著最合適的四分位數(shù)范圍和對應(yīng)的活產(chǎn)率。本研究選擇t4-tPNf、t8-tPNf代替t4和t8,是考慮到不同胚胎之間精卵結(jié)合的時間可能存在差異。如IVF和ICSI兩種授精方式造成的差異,卵子成熟度不同造成的差異,以及ICSI操作中第一個卵子和最后一個卵子精子注射時間的差異等。為避免這些可能存在的差異對結(jié)果的影響,我們采用了原核消失時間來代替授精時間。本研究將形態(tài)學(xué)評分標(biāo)準(zhǔn)納入了模型,并作為模型的最高評分標(biāo)準(zhǔn)。這是因為在日常工作中使用time-lapse技術(shù)做移植胚胎的最終決定時,形態(tài)學(xué)評分占很高的比重。事實上,目前形態(tài)學(xué)評分仍在胚胎挑選時有著重要的作用[26]。此外,胚胎形態(tài)學(xué)評分也是Liu模型的一個篩選條件[11]。
本研究中患者挑選非常嚴格,盡量排除了影響胚胎著床的其它因素,真正體現(xiàn)了胚胎本身發(fā)育潛能對妊娠結(jié)局的影響。患者的平均年齡為31.2歲,低于多篇已發(fā)表文章中的患者年齡,34.5歲[11]和38.0歲[10]等。體現(xiàn)在臨床結(jié)局上則為活產(chǎn)率(41.4%),高于這些文章中的臨床妊娠率。因此,本研究的預(yù)測模型可以為患者平均年齡較低的生殖中心提供一定的指導(dǎo)意義。已發(fā)表的胚胎預(yù)測模型,對D3胚胎植入的預(yù)測能力往往低于對囊胚形成的預(yù)測能力,它們預(yù)測植入的AUC值都相對溫和,處于0.6~0.7之間[27,7,12,10]。這可能是因為相比于囊胚形成,胚胎植入涉及到更多不可控因素。而本研究的模型則為活產(chǎn)能力預(yù)測模型,它比植入預(yù)測模型有著更多的不可控性;AUC為0.664,表明本研究的預(yù)測模型有著正常的預(yù)測水準(zhǔn)。
KIDScore模型是一種取消選擇的模型,它旨在避免植入低潛能胚胎而不是選擇高植入潛能胚胎的算法。因此評分為5分組包含很大比例的胚胎,將最后移植或凍結(jié)的選擇權(quán)留給胚胎學(xué)家。盡管5分組的胚胎如此之多,其著床率仍顯著高于其它幾組。此模型采用來自24家生殖中心的龐大數(shù)據(jù),利用3275枚已知著床結(jié)局(KID)的胚胎建立模型,并用11218枚胚胎進行了模型驗證。因此是一種有著普遍適用性的模型。Liu模型是一種選擇導(dǎo)向性模型,其評分為A+胚胎的比例很少,但其著床率是所有模型中最高的。該模型能很好地幫助胚胎學(xué)家挑選他們所需要的胚胎。此外Liu模型的形態(tài)學(xué)評分F評分在本文中不適用。Liu模型的0.622和KIDScore模型的0.618在本文中的數(shù)據(jù)中表現(xiàn)出的預(yù)測能力不佳,可能與患者年齡、培養(yǎng)環(huán)境、用藥方案等有關(guān)。這進一步表明每個實驗室應(yīng)制定自己的胚胎預(yù)測模型。
綜上所述,本研究建立的胚胎預(yù)測模型,可為類似患者條件以及胚胎培養(yǎng)條件的生殖中心提供借鑒意義。本文的局限性在于,該預(yù)測模型未經(jīng)前瞻性的數(shù)據(jù)驗證,其有效性也未經(jīng)外部數(shù)據(jù)驗證。接下來的研究方向為建立隨機對照臨床試驗,進一步驗證該模型的適用性。