王孜怡,肖 瀟,黃晨軍,童 林,高春芳,,曹宏偉△
1.海軍軍醫(yī)大學(xué)附屬長(zhǎng)海醫(yī)院信息科,上海 200438;2.上海中醫(yī)藥大學(xué)附屬岳陽(yáng)中西醫(yī)結(jié)合醫(yī)院檢驗(yàn)實(shí)驗(yàn)中心,上海 200437;3.上海東方肝膽外科醫(yī)院檢驗(yàn)科,上海 200438
腫瘤是嚴(yán)重危害人群健康的公共衛(wèi)生問(wèn)題。 根據(jù)最新發(fā)布的美國(guó)2022流行病學(xué)數(shù)據(jù),腫瘤是僅次于心臟病的第二大致死性疾病,是60歲以上人群病死的重要病因。在排名前5位的腫瘤相關(guān)死亡病因中,男性肝癌位列第5位,其中在40~59 歲人群則位列第4,在60~79歲位列第5,提示肝癌是40~79歲這一中老年齡段人群的重要腫瘤相關(guān)死亡病因[1]。全世界新發(fā)肝癌的50%病例在中國(guó)[2],在我國(guó)肝癌是僅次于肺癌的高發(fā)病率和高病死率腫瘤[3]。我國(guó)年齡和性別分層的流行病學(xué)數(shù)據(jù)表明,肝癌在15歲以上男性腫瘤的發(fā)病率和病死率中都位列前茅[3]。我國(guó)80%以上的原發(fā)性肝癌與乙型肝炎病毒(HBV)感染有關(guān),雖然近年來(lái)我國(guó)HBV表面抗原(HBsAg)陽(yáng)性率呈現(xiàn)下降趨勢(shì),但是由于HBsAg攜帶者存量巨大,所以HBV感染作為原發(fā)性肝癌的高危因素在我國(guó)肝癌發(fā)病中仍然長(zhǎng)期占據(jù)高位[4-5]。目前早期肝癌的5年生存率高達(dá)70%以上,而晚期肝癌5年生存率不足10%[6],因此早期發(fā)現(xiàn)、精準(zhǔn)診斷和治療是提高生存率、降低病死率的重要環(huán)節(jié)。微小血管侵犯(MVI)是肝癌具有侵襲性、轉(zhuǎn)移性生物學(xué)行為的組織學(xué)標(biāo)志,可用于預(yù)測(cè)肝癌的預(yù)后、復(fù)發(fā)、生存,發(fā)生肝內(nèi)、肝外轉(zhuǎn)移時(shí),肝癌細(xì)胞沿著血管遷移,故MVI也是臨床上肝癌復(fù)發(fā)的重要病理指標(biāo)[7-9]。通常MVI信息的獲取需通過(guò)手術(shù)標(biāo)本的組織學(xué)分析,有嚴(yán)格的手術(shù)采集要求和標(biāo)準(zhǔn),包括準(zhǔn)確采樣腫瘤與非腫瘤交界面的組織標(biāo)本等。若能術(shù)前精準(zhǔn)預(yù)測(cè),或者對(duì)于未接受手術(shù)治療者進(jìn)行MVI預(yù)測(cè),則對(duì)患者精準(zhǔn)治療方案的制訂和預(yù)后判斷有重要意義。本研究基于臨床常用的3種肝癌標(biāo)志物——甲胎蛋白(AFP)、甲胎蛋白異質(zhì)體(AFP-L3)、異常凝血酶原Ⅱ(PIVKAⅡ),對(duì)檢測(cè)結(jié)果數(shù)據(jù)采用歸一化處理并建模后,用于輔助判斷原發(fā)性肝細(xì)胞癌(HCC)患者是否發(fā)生MVI。
1.1一般資料 本研究納入2016年1月至2017年12月在上海東方肝膽外科醫(yī)院住院并接受HCC手術(shù)治療的患者1 314例,這些患者均經(jīng)術(shù)后病理檢測(cè)證實(shí)為HCC且在未行手術(shù)切除之前完成了AFP、AFP-L3和PIVKAⅡ的檢測(cè),并剔除了正在使用維生素K和華法林治療的研究對(duì)象,以免對(duì)PIVKAⅡ檢測(cè)結(jié)果產(chǎn)生干擾。本研究經(jīng)上海東方肝膽外科醫(yī)院倫理委員會(huì)批準(zhǔn),所有患者知情同意。
1.2儀器與試劑 AFP檢測(cè)方法為電化學(xué)發(fā)光法(Roche),檢測(cè)設(shè)備為羅氏 Cobas e601 全自動(dòng)免疫分析儀,檢測(cè)試劑為羅氏診斷公司原裝配套試劑。AFP-L3采用凝集素親和富集加全自動(dòng)化學(xué)發(fā)光檢測(cè),凝集素親和富集試劑盒為北京熱景生物技術(shù)有限公司產(chǎn)品,富集后得到的核心巖藻糖基化蛋白檢測(cè)方法同上述AFP,作為AFP-L3數(shù)值。計(jì)算AFP-L3/AFP的百分比[10],參考試劑盒說(shuō)明,>10% 定義為AFP-L3 陽(yáng)性。PIVKAⅡ 采用酶化學(xué)發(fā)光法檢測(cè),檢測(cè)設(shè)備為富士瑞必歐的LUMIPULSE G1200全自動(dòng)免疫分析儀,試劑為配套原裝試劑。
1.3方法 對(duì)數(shù)據(jù)進(jìn)行缺失值處理,對(duì)缺失值的處理有3種:刪除記錄、數(shù)據(jù)插補(bǔ)和不處理。本研究中采用刪除記錄的方法。采用邏輯回歸(LR)方法,對(duì)3項(xiàng)常用的肝癌標(biāo)志物AFP、AFP-L3、PIVKAⅡ建模,使用Python進(jìn)行數(shù)據(jù)集7∶3(建模組∶驗(yàn)證組)的劃分并獲得數(shù)據(jù)的MVI預(yù)測(cè)效率。
1.4統(tǒng)計(jì)學(xué)處理 所用數(shù)據(jù)采用Python語(yǔ)言進(jìn)行統(tǒng)計(jì)。歸一化處理則將完整的數(shù)據(jù)縮放在(-1,1)區(qū)間內(nèi)。非正態(tài)分布的計(jì)量資料以M(P25,P75)表示,兩組間比較采用非參數(shù)Mann-Whitney檢驗(yàn)。計(jì)數(shù)資料以例數(shù)或百分率表示,比較采用χ2檢驗(yàn)。以P<0.05為差異有統(tǒng)計(jì)學(xué)意義。在模型參數(shù)方面進(jìn)行了調(diào)整:(1)為防止過(guò)擬合,進(jìn)行正則化處理;(2)使用梯度下降法優(yōu)化損失函數(shù)并調(diào)整標(biāo)本權(quán)重以提高模型預(yù)測(cè)能力。
2.1入組患者的臨床基本信息 依據(jù)入組的原發(fā)性肝癌組織病理學(xué)MVI結(jié)果,將所有入組的1 314例HCC 患者分為以下兩組:無(wú)MVI組(MVI-0組)和存在不同程度MVI的MVI-1+MVI-2組即MVI-1+2組,兩組的基線信息見(jiàn)表1。在納入的1 314例HCC患者中,存在MVI的患者共616例,占46.9%。
表1 入組的HCC患者基本臨床特征
2.2模型與診斷 使用Pycharm軟件建模,自建LR模型公式,即1.08×AFP+0.34×AFP-L3+0.26×PIVKAⅡ。使用Python進(jìn)行數(shù)據(jù)集7∶3(建模組∶驗(yàn)證組)的劃分并預(yù)測(cè)MVI結(jié)果。
2.3模型對(duì)MVI的預(yù)測(cè)價(jià)值 建模組中LR模型診斷MVI的AUC為0.647,與單獨(dú)采用AFP診斷MVI的相同,見(jiàn)表2。但在驗(yàn)證組中,與AFP、AFP-L3、PIVKAⅡ檢測(cè)相比,LR模型診斷MVI的AUC為0.720,AUC高于單獨(dú)應(yīng)用AFP-L3和PIVKAⅡ診斷MVI的AUC(0.651、0.601),也略高于單獨(dú)應(yīng)用AFP診斷MVI的AUC(0.700)。當(dāng)LR模型最佳截?cái)嘀禐?1.16時(shí),診斷MVI的靈敏度為77.1%,準(zhǔn)確度為64.7%。 見(jiàn)表3。
表2 建模組各指標(biāo)對(duì)MVI的診斷性能
表3 驗(yàn)證組各指標(biāo)對(duì)MVI的診斷性能
本研究主要基于目前臨床常用的肝癌標(biāo)志物AFP、AFP-L3、PIVKAⅡ開(kāi)展對(duì)于HCC患者是否存在MVI的非創(chuàng)性預(yù)測(cè),之前已有類(lèi)似的研究[9]。本研究通過(guò)數(shù)據(jù)歸一化處理和LR,建立了多參數(shù)診斷模型,用于HCC患者M(jìn)VI的預(yù)測(cè),預(yù)測(cè)患者是否發(fā)生MVI的AUC達(dá)到0.720,高于單獨(dú)應(yīng)用AFP-L3和PIVKAⅡ(0.651、0.601),也略高于單獨(dú)應(yīng)用AFP(0.700)。術(shù)前MVI的非創(chuàng)性預(yù)測(cè)有助于輔助臨床制訂更為精準(zhǔn)的手術(shù)治療方案,而對(duì)于非手術(shù)治療的MVI預(yù)測(cè),則可輔助臨床判斷HCC復(fù)發(fā)、轉(zhuǎn)移及預(yù)后。
本研究中選用AFP、AFP-L3、PIVKAⅡ的依據(jù)是基于目前國(guó)際和臨床上已獲得一定認(rèn)可用于HCC診斷的GALAD模型。 GALAD模型最初于2014年由JOHNSON等[11]建立,2016年BERHANE等[12]基于國(guó)際多中心隊(duì)列進(jìn)行了充分驗(yàn)證,結(jié)果提示其可用于HCC診斷并具有較單個(gè)指標(biāo)更好的診斷性能。GALAD模型包括性別(G)、年齡(A)以及3種血清學(xué)標(biāo)志物AFP(A)、AFP-L3(L)、PIVKAⅡ(D)共5項(xiàng)。 本團(tuán)隊(duì)在前期國(guó)內(nèi)多中心隊(duì)列研究中證明其對(duì)于HCC的早期診斷具有很好價(jià)值[12-13],但GALAD模型用于MVI的預(yù)測(cè)效果尚有限[13]。本研究在預(yù)實(shí)驗(yàn)中發(fā)現(xiàn),加入性別、年齡并沒(méi)有顯著提升該模型的效率,因此本研究?jī)H針對(duì)臨床常用的指標(biāo)展開(kāi)預(yù)測(cè)MVI的建模性和驗(yàn)證性研究。
本研究采用的建模方法是LR方法,LR是一種線性分類(lèi)器,可以定量地描述某一現(xiàn)象和某些因素之間的函數(shù)關(guān)系,將各變量的已知值代入回歸方程可以求出應(yīng)變量的估計(jì)值,從而可以進(jìn)行預(yù)測(cè)等相關(guān)研究。LR方法是目前臨床多參數(shù)建模性研究中的最常用方法[14]。目前已經(jīng)獲得NMPA注冊(cè)證的微小RNA panel就是采用了LR模型[15],其作為HCC標(biāo)志物已被納入2022版的中國(guó)原發(fā)性肝癌防治指南[5]。
數(shù)據(jù)缺失和數(shù)據(jù)標(biāo)準(zhǔn)化處理是建模性研究中的關(guān)鍵問(wèn)題。數(shù)據(jù)缺失主要包括記錄缺失和字段信息缺失等情況,對(duì)數(shù)據(jù)分析有較大影響,使結(jié)果不確定性增加。通常對(duì)缺失值的處理有3種:刪除記錄、數(shù)據(jù)插補(bǔ)和不處理。本項(xiàng)目采用刪除記錄的方法,最大程度減少了因數(shù)據(jù)缺失對(duì)模型穩(wěn)定性帶來(lái)的影響。在多指標(biāo)評(píng)價(jià)體系中,由于各評(píng)價(jià)指標(biāo)的性質(zhì)不同,通常具有不同的量綱和數(shù)量級(jí)。當(dāng)各指標(biāo)間的水平相差很大時(shí),如果直接用原始指標(biāo)值進(jìn)行分析,就會(huì)突出數(shù)值較高的指標(biāo)在綜合分析中的作用,相對(duì)削弱數(shù)值水平較低指標(biāo)的作用。因此,為了保證結(jié)果的可靠性,需要對(duì)原始指標(biāo)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理。目前數(shù)據(jù)的標(biāo)準(zhǔn)化方法有多種,歸結(jié)起來(lái)可以分為直線型方法(如極值法、標(biāo)準(zhǔn)差法)、折線型方法(如三折線法)、曲線型方法(如半正態(tài)性分布)。不同的標(biāo)準(zhǔn)化方法,對(duì)系統(tǒng)的評(píng)價(jià)結(jié)果會(huì)產(chǎn)生不同的影響,但在數(shù)據(jù)標(biāo)準(zhǔn)化方法的選擇上,還沒(méi)有通用的法則可以遵循。其中最典型的方法就是數(shù)據(jù)的歸一化處理,即將數(shù)據(jù)統(tǒng)一映射到(-1,1)區(qū)間上。歸一化是一種簡(jiǎn)化計(jì)算的方式,即將有量綱的表達(dá)式,經(jīng)過(guò)變換,化為無(wú)量綱的表達(dá)式,成為純量。歸一化是讓不同維度之間的特征在數(shù)值上有一定比較性,可以大大提高分類(lèi)器的準(zhǔn)確性。各個(gè)特征對(duì)結(jié)果做出的貢獻(xiàn)相同時(shí),可以比較出參數(shù)之間分類(lèi)效果的差異。歸一化后有提升模型的收斂速度和精度的優(yōu)勢(shì)。采用歸一化處理數(shù)據(jù)后,本研究中所建立的模型較本團(tuán)隊(duì)前期建立的MVI模型的預(yù)測(cè)效率有了明確提升[16]。在本研究中,其應(yīng)用優(yōu)勢(shì)還在于能縮小由于不同臨床實(shí)驗(yàn)室采用不同檢測(cè)系統(tǒng)可能對(duì)模型穩(wěn)定性帶來(lái)的影響,這也是本研究的亮點(diǎn)之一。
綜上所述,本研究基于臨床常用的3項(xiàng)肝癌標(biāo)志物(AFP、AFP-L3、PIVKAⅡ),通過(guò)數(shù)據(jù)歸一化和LR建模,可輔助臨床進(jìn)行HCC患者發(fā)生MVI的預(yù)測(cè),對(duì)于HCC患者的精準(zhǔn)施治和臨床預(yù)后判斷提供了全新手段。未來(lái)需要進(jìn)一步多中心研究驗(yàn)證該模型的穩(wěn)定性和有效性,并在實(shí)踐中不斷優(yōu)化。
國(guó)際檢驗(yàn)醫(yī)學(xué)雜志2022年24期