岳園芳 劉建井 尹國 濤 戴東 徐文貴,
1 天津市腫瘤醫(yī)院空港醫(yī)院核醫(yī)學(xué)科,天津 300308;2 天津醫(yī)科大學(xué)腫瘤醫(yī)院分子影像與核醫(yī)學(xué)診療科,國家腫瘤臨床醫(yī)學(xué)研究中心,天津市腫瘤防治重點實驗室,天津市惡性腫瘤臨床醫(yī)學(xué)研究中心,天津 300060
近年來,DTC 的發(fā)病率呈逐年上升趨勢,雖然其預(yù)后相對較好,但仍有30%左右的患者會出現(xiàn)復(fù)發(fā),其病死率也呈上升態(tài)勢,因此,給予患者及時且規(guī)范的治療十分必要[1]。TSH 抑制治療是DTC 治療方案中不可或缺的環(huán)節(jié),其可以有效地降低患者復(fù)發(fā)和病死的風險,提高患者的生存率、改善生存質(zhì)量[2]。國內(nèi)外指南皆推薦TSH 抑制治療藥物首選左甲狀腺素(levothyroxine,L-T4)口服制劑,推薦劑量為1.5~2.5 μg/(kg·d),并指出起始劑量視年齡及伴隨疾病而異[3-4]。由于指南對L-T4最佳初始劑量并沒有較為明確的標準,在臨床工作中,醫(yī)師往往根據(jù)個人經(jīng)驗決定,這導(dǎo)致很多患者經(jīng)歷較長的調(diào)藥周期后TSH 水平才能達標。調(diào)藥周期過長會給患者帶來一定的不良反應(yīng),如L-T4劑量不足會導(dǎo)致患者的甲狀腺功能減退,造成患者乏力、嗜睡、水腫、血脂異常,甚至?xí)黾幽[瘤復(fù)發(fā)的風險等[5-6];L-T4 劑量過大會加重患者心血管系統(tǒng)的負擔,引起心絞痛或心律失常,加重絕經(jīng)期女性的骨質(zhì)疏松,進而增加其骨折風險等[7-8]。綜上,構(gòu)建DTC 患者131I 治療后L-T4 最佳初始劑量的預(yù)測模型,對于提高患者生活質(zhì)量、改善預(yù)后都具有重要的臨床意義。然而,截至目前尚未發(fā)現(xiàn)國內(nèi)外有相關(guān)研究和文獻報道。
本研究運用機器學(xué)習(xí)的方法為131I 治療后的DTC 患者構(gòu)建預(yù)測左甲狀腺素鈉片(優(yōu)甲樂)的最佳初始劑量模型,提高首次達標率,有效縮短調(diào)藥周期,以期減輕患者的經(jīng)濟負擔,提高其生存質(zhì)量,改善預(yù)后。
回顧性分析2019 年11 月至2020 年11 月天津市腫瘤醫(yī)院空港醫(yī)院核醫(yī)學(xué)科收治的266 例DTC 患者的臨床資料,其中男性78 例(男性組)、女性188 例(女性組),年齡18~70(40.0±11.5)歲。納入標準:接受131I 治療并行TSH 抑制治療且最終達標的患者。依據(jù)2015 年美國甲狀腺協(xié)會指南,131I 治療后TSH 抑制治療的達標標準:TSH<0.1 mU/L(高危患者)、TSH 0.1~0.5 mU/L(中?;颊撸?,且游離T3、T4在正常范圍即為達標[3]。排除標準:存在影像學(xué)檢查結(jié)果證實的轉(zhuǎn)移病灶;年齡<18 周歲;術(shù)后一年內(nèi)妊娠;合并嚴重心腦血管疾病或嚴重肝腎功能損害。
所有患者均于治療前簽署了知情同意書。本研究符合《赫爾辛基宣言》的原則。
收集臨床、生化指標共16 項,包括年齡、性別、身高、體重、體表面積(body surface area,BSA)、體重指數(shù)(body mass index,BMI)、是否合并消化系統(tǒng)疾?。晕秆谆蚋文懠膊〉龋?、是否絕經(jīng)、收縮壓/舒張壓、血紅蛋白(hemoglobin,HB)、平均紅細胞體積(mean corpuscular volume,MCV)、術(shù)后甲狀旁腺激素水平、是否合并橋本氏甲狀腺炎、是否合并心腦血管疾病、是否有腫瘤家族史、是否合并其他腫瘤病史。所有患者TSH 抑制治療選擇的藥物均為左甲狀腺素鈉片,左甲狀腺素鈉片初始劑量的制定采取經(jīng)驗性給藥的方式,即BMI 在正常范圍內(nèi)按100 μg/d 給藥;超出正常范圍即按1.5~2.2 μg/(kg·d)給藥,老年患者適當減量。出院后患者按照推薦劑量規(guī)律服藥4~6 周后復(fù)查甲狀腺功能,醫(yī)師根據(jù)復(fù)查結(jié)果調(diào)整左甲狀腺素鈉片劑量,直至TSH 水平達標。隨訪的相關(guān)信息通過查閱患者門診病歷及電話隨訪的方式收集。
首先,通過隨機森林模型確定每個基線臨床特征的重要度(數(shù)值越大,重要度越高);然后以整個數(shù)據(jù)集為基礎(chǔ),構(gòu)建并訓(xùn)練另一個包含所有基線臨床特征的隨機森林模型,記錄袋外均方誤差;之后每次剔除重要度最低的基線臨床特征,重新訓(xùn)練模型,記錄袋外均方誤差;最后,選擇袋外均方誤差最小的基線臨床特征組合。由于隨機森林模型構(gòu)建過程中具有一定的隨機性,我們進行了10 次篩選,將10 次篩選中均出現(xiàn)的基線臨床特征用于回歸模型的構(gòu)建。
以篩選出的指標為自變量,以左甲狀腺素鈉片達標劑量為因變量構(gòu)建多種回歸模型,包括線性回歸、泊松回歸、隨機森林回歸、使用徑向基核的支持向量回歸(support vector regression, SVR)、嶺回歸、套索回歸、K 近鄰回歸、伽馬回歸。由于數(shù)據(jù)量有限,構(gòu)建回歸模型采用5 折交叉驗證。規(guī)定左甲狀腺素鈉片預(yù)測劑量與達標時劑量差值的絕對值<12.5 μg 為預(yù)測正確,然后通過交叉訓(xùn)練驗證選取預(yù)測準確率最高的回歸模型。
應(yīng)用SPSS 26.0 軟件進行統(tǒng)計學(xué)分析。符合正態(tài)分布的計量資料以±s表示。計數(shù)資料的組間比較采用獨立樣本的卡方檢驗。P<0.05 為差異有統(tǒng)計學(xué)意義。所有臨床特征的篩選及回歸模型的構(gòu)建均使用基于Python 3.7.6 的scikit-learn 0.23.2 軟件(https://scikit-learn.org/stable)。
266 例DTC 患者中,絕經(jīng)女性45 例(16.9%);合并橋本氏甲狀腺炎71 例(26.7%);合并心腦血管疾病27 例(10.2%),主要包括高血壓、糖尿病、冠心病、腦梗死、心律失常等;存在慢性胃炎或肝炎等19 例(7.1%);合并其他腫瘤病史5 例(1.9%),分別為乳腺癌2 例、腎癌1 例、肺癌1 例、子宮內(nèi)膜癌1 例;存在腫瘤家族史22 例(8.3%),其中存在甲狀腺癌家族史6 例(2.3%)。此外,266 例患者的體重、身高、BMI、BSA、HB、MCV、收縮壓/舒張壓、術(shù)后甲狀旁腺激素、達標時左甲狀腺素鈉片劑量分別為(68.4±12.9) kg、(165.8±12.8) cm、24.6±3.5、(1.9±0.2) m2、(140.1±19.1) g/L、(88.6±5.5) fl、(125.7±18.9) mm Hg/(82.7±12.4) mm Hg、(4.1±2.2) pmol/L、(117.0±30.1) μg/d。隨訪時間為(4.79±3.09)個月,無失訪者。通過查閱門診復(fù)查信息及電話隨訪結(jié)果,采取經(jīng)驗給藥的266 例患者出院后第1 次復(fù)查結(jié)果顯示,僅有40 例無需調(diào)整左甲狀腺素鈉片劑量,即首次達標率為15.0%。
經(jīng)過特征篩選發(fā)現(xiàn),重要度排在前6 位的臨床特征依次為BSA、體重、HB、身高、BMI、年齡。其重要度均數(shù)依次為0.2805、0.1951、0.1315、0.1252、0.1080、0.0819。
套索回歸、K 近鄰回歸、嶺回歸、隨機森林回歸、伽馬回歸、泊松回歸、線性回歸、SVR 模型預(yù)測左甲狀腺素鈉片劑量的準確率依次為35.3%(94/266)、44.0%(117/266)、46.6%(124/266)、47.7%(127/266)、48.1%(128/266)、48.5%(129/266)、48.9%(130/266)、53.4%(142/266)。SVR 模型預(yù)測左甲狀腺素鈉片劑量與真實劑量的分布如圖1 所示,灰色區(qū)域內(nèi)為預(yù)測正確者。
圖1 266 例分化型甲狀腺癌患者支持向量回歸模型預(yù)測左甲狀腺素鈉片劑量與真實劑量分布圖Figure 1 The distribution of actual and predicted levothyroxine sodium tablet dose by support vector regression model in 266 differentiated thyroid cancer patients
SVR 模型在男性組和女性組中的預(yù)測準確率分別為35.9%(28/78)和60.6%(114/188),且兩者之間的差異有統(tǒng)計學(xué)意義(χ2=13.51,P<0.001)。這提示該模型對女性患者的預(yù)測效能更好。SVR 模型在男性組、女性組中預(yù)測左甲狀腺素鈉片劑量與真實劑量分布情況如圖2 所示,灰色區(qū)域內(nèi)為預(yù)測正確者。
圖2 不同性別分化型甲狀腺癌患者支持向量回歸模型預(yù)測左甲狀腺素鈉片劑量與真實劑量分布圖Figure 2 The distribution of actual and predicted levothyroxine sodium tablet dose by support vector regression model in different gender group of differentiated thyroid cancer patients
相關(guān)研究結(jié)果證實,許多因素與甲狀腺疾病患者術(shù)后所需的L-T4 劑量相關(guān),如年齡、體重、去脂體重、身高、藥物的吸收情況、雌激素水平等[9-13]。上述大部分指標反映了機體的代謝水平,影響給予患者的L-T4 劑量。Liwanpo 和Hershman[13]指出,所有影響胃酸分泌的消化功能障礙疾?。ㄈ缏晕秆谆蚋文懠膊。┚鶗档蜋C體對L-T4 的吸收率。女性是否絕經(jīng)即雌激素水平也會影響L-T4 在體內(nèi)的代謝情況[12]。從以上研究結(jié)果可知,患者所需L-T4 劑量與多種因素相關(guān),美國甲狀腺協(xié)會指南推薦的僅基于體重確定的劑量參考區(qū)間在臨床實踐中的指導(dǎo)意義不足。
近年來,隨著醫(yī)療大數(shù)據(jù)的迅猛發(fā)展,越來越多的機器學(xué)習(xí)算法開始被應(yīng)用于醫(yī)療領(lǐng)域中,機器學(xué)習(xí)在處理較為復(fù)雜的問題上有較好的準確率和泛化能力。機器學(xué)習(xí)是通過一些可以讓計算機自動“學(xué)習(xí)”的算法,從我們提供的數(shù)據(jù)中分析獲得規(guī)律,然后利用規(guī)律對新樣本進行預(yù)測。因此,我們可以利用機器學(xué)習(xí)的方法從回顧性數(shù)據(jù)中尋找與L-T4 劑量相關(guān)的指標,建立并訓(xùn)練回歸模型,通過交叉訓(xùn)練驗證其準確率。其實,國外已有多篇關(guān)于預(yù)測TSH 替代治療的L-T4 初始劑量的公式或模型的報道[14-16]。Zaborek 等[15]曾篩選出7 項相關(guān)因素(年齡、性別、體重、BMI、術(shù)前TSH 水平、是否服用鐵劑、是否服用復(fù)合維生素)并運用機器學(xué)習(xí)方法為甲狀腺全切患者構(gòu)建多種回歸模型來預(yù)測L-T4 的最佳初始劑量,該研究得出泊松回歸模型的準確率最高(64.8%),并證實與既往文獻報道的只基于年齡、體重或BMI 計算出的準確率相比,其準確率顯著提高;但遺憾的是,該研究的對象是良性甲狀腺疾病患者,這些患者甲狀腺全切術(shù)后僅需要TSH 替代治療,而替代治療所需的L-T4劑量明顯低于DTC 患者TSH 抑制治療所需的劑量,并且由于人種差異,此模型并不適用于中國人。而國內(nèi)目前僅有1 項針對DTC 患者術(shù)后初始L-T4 劑量的研究[17],但其主要研究對象是DTC 術(shù)后患者,并非131I 治療后的患者。由于131I治療進一步清除了DTC 患者術(shù)后少量殘存甲狀腺組織,因此患者對L-T4 的需求量也相應(yīng)增加,故該研究的模型不適合接受過131I 治療的DTC 患者;其次,該研究納入的病例數(shù)及篩選出的相關(guān)指標較少(只有年齡和BMI),應(yīng)用的左甲狀腺素鈉片(雷替斯)在臨床中的使用率明顯低于本研究使用的左甲狀腺素鈉片(優(yōu)甲樂),采用的數(shù)據(jù)分析方法是單一的Logistic 回歸,因此該研究對臨床的應(yīng)用價值也比較局限。
本研究共納入16 項臨床、生化指標,通過計算隨機森林特征重要度篩選出6 項較為重要的特征,依次為BSA、體重、HB、身高、BMI、年齡。其中BSA、體重、身高、BMI 及年齡均反映了患者的基礎(chǔ)代謝率,這與先前多篇文獻報道的內(nèi)容一致[12-15],但關(guān)于HB 這項指標尚未有文獻報道。Di 等[14]發(fā)現(xiàn),MCV 與L-T4 劑量呈負相關(guān),其基于Liwanpo 和Hershman[13]的觀點(L-T4 的吸收依賴于機體的胃酸水平)猜測鐵的吸收同樣依賴于胃酸水平,而MCV 間接反映了體內(nèi)鐵的水平,因此兩者存在相關(guān)性。在本研究中,我們發(fā)現(xiàn)HB 的重要度明顯高于MCV,這其中的原因并不清楚,仍需進一步探究。本研究構(gòu)建并訓(xùn)練出8 種回歸預(yù)測模型,通過交叉訓(xùn)練的方式驗證出SVR模型的準確率最高。SVR 模型采用結(jié)構(gòu)風險最小化原則和核函數(shù)思想,將低維空間的非線性問題轉(zhuǎn)化成高維空間的線性問題,能夠較好地解決小樣本、高維數(shù)、非線性等問題。本研究在隨訪過程中發(fā)現(xiàn)266 例患者出院后第1 次復(fù)查(4~6 周)左甲狀腺素鈉片劑量達標的僅有40 例,顯然經(jīng)驗給藥的達標率明顯低于SVR 模型的準確率(15.0%對53.4%)。隨后,我們根據(jù)患者性別進行比較,結(jié)果顯示女性組的準確率明顯高于男性組(60.6%對35.9%),這提示該模型對女性患者更適用。分析原因可能與本研究納入的女性患者例數(shù)明顯多于男性,因此構(gòu)建的模型準確率更偏倚于女性患者有關(guān),這需要我們進一步去研究。
本研究為回顧性研究,納入的病例數(shù)較少,且由于影響左甲狀腺素鈉片最佳劑量的因素比較龐雜,本研究納入的臨床指標可能不夠全面,雖然通過交叉驗證初步證實了SVR 模型的準確率明顯高于經(jīng)驗給藥,但我們目前尚缺乏前瞻性的研究進一步驗證,可能有一定的誤差或偏倚。下一步我們將對此模型進行前瞻性驗證,若首次達標率明顯高于經(jīng)驗給藥,即可在此基礎(chǔ)上開展多中心臨床試驗進行外部驗證,若研究結(jié)果理想可將此模型加以推廣,甚至形成行業(yè)共識,進而使廣大的甲狀腺癌患者獲益。
利益沖突 所有作者聲明無利益沖突
作者貢獻聲明 岳園芳負責研究過程的實施、數(shù)據(jù)的采集與統(tǒng)計、論文的撰寫;劉建井負責命題的完善、數(shù)據(jù)的分析、論文的修訂;尹國濤負責數(shù)據(jù)的統(tǒng)計分析;戴東負責論文的修訂;徐文貴負責命題的提出、論文的審閱