楊錦濤, 凌能祥
(合肥工業(yè)大學(xué) 數(shù)學(xué)學(xué)院,安徽 合肥 230601)
近年來,隨著收集和存儲(chǔ)數(shù)據(jù)技術(shù)的進(jìn)步,人們?cè)絹碓蕉嗟厥占骄哂泻瘮?shù)特征的諸如曲線、曲面、圖像等數(shù)據(jù),稱之為函數(shù)型數(shù)據(jù)。函數(shù)型數(shù)據(jù)廣泛存在于生物學(xué)、化學(xué)計(jì)量學(xué)、計(jì)量經(jīng)濟(jì)學(xué)、醫(yī)學(xué)、氣象學(xué)、神經(jīng)科學(xué)等領(lǐng)域,如何進(jìn)行函數(shù)型數(shù)據(jù)分析(functional data analysis,FDA)受到很多學(xué)者的關(guān)注。有關(guān)FDA的背景、建模理論和方法見文獻(xiàn)[1-3]。
分位數(shù)回歸是研究解釋變量與響應(yīng)變量之間關(guān)系的主要統(tǒng)計(jì)方法之一,自文獻(xiàn)[4]的開創(chuàng)性工作以來,很多學(xué)者在此方向開展了研究。這種方法與傳統(tǒng)的最小二乘回歸相比,有許多優(yōu)點(diǎn),對(duì)于異常值的處理比均值回歸更加穩(wěn)健,因此有更好的估計(jì)效率。事實(shí)上,分位數(shù)回歸模型已經(jīng)應(yīng)用于分析函數(shù)型數(shù)據(jù)。例如,在函數(shù)型線性分位數(shù)回歸模型中,文獻(xiàn)[5]利用光滑樣條基重新表示函數(shù)型協(xié)變量,并給出估計(jì)量的收斂速度。同時(shí),主成分逼近方法被廣泛應(yīng)用于研究函數(shù)型回歸模型[6]。此外,非參數(shù)統(tǒng)計(jì)方法在函數(shù)型數(shù)據(jù)方面的研究進(jìn)展見文獻(xiàn)[7]。
在很多實(shí)際情況中,如抽樣調(diào)查、生存分析、藥物追蹤測(cè)試和可靠性測(cè)試等,收集的數(shù)據(jù)可能是不完全的,如響應(yīng)變量隨機(jī)刪失。最近,文獻(xiàn)[8]提出函數(shù)型刪失分位數(shù)模型,擴(kuò)展經(jīng)典截尾分位數(shù)回歸中基于鞅的估計(jì)方法,以適應(yīng)具有截尾響應(yīng)和函數(shù)協(xié)變量的部分函數(shù)線性分位數(shù)回歸模型,并給出估計(jì)量的漸近性質(zhì);文獻(xiàn)[9]提出了響應(yīng)變量刪失時(shí)部分線性分位數(shù)回歸模型。本文基于逆概率加權(quán)的方法,進(jìn)一步研究響應(yīng)變量刪失時(shí)函數(shù)型非參數(shù)分位數(shù)回歸模型的估計(jì),并建立估計(jì)量的漸近正態(tài)性。
對(duì)于給定的分位數(shù)τ∈(0,1),考慮如下的隨機(jī)刪失響應(yīng)函數(shù)型非參數(shù)分位數(shù)回歸模型:
(1)
其中:ρτ(u)=u(τ-I)(u<0))為分位數(shù)損失函數(shù);Kh=K(u/h)。
然而在刪失響應(yīng)變量的機(jī)制下,本文得到不完全的樣本{(Xi,Yi,Δi),1≤i≤n},此處Xi被完全觀測(cè)。本文提出mτ(χ)的逆概率加權(quán)分位數(shù)估計(jì)如下:
其中:Di=I{Y(i)≤y,Δ(i)=0};Δ(i)為對(duì)應(yīng)于Y(i)的刪失示性變量;Y(i)為{Y(i),i=1,2,…,n}的第i個(gè)次序統(tǒng)計(jì)量。
此外,本文提出的估計(jì)涉及到半度量,選取如下半度量[1]:
設(shè)B(χ,h)={y|d(y,x) 假設(shè)2 存在最大值L和常數(shù)c1>0,使得 假設(shè)3 存在c2>0和α>0,對(duì)于任意u,v∈F,有|mτ(u)-mτ(v)|≤c2d(u,v)α。 假設(shè)4 存在c3>0和c4>0,且φ(h)∈(0,∞),對(duì)任意χ∈F,有 0 假設(shè)5 當(dāng)χ∈F時(shí),存在1個(gè)確定的非負(fù)有界函數(shù)f1和趨向于0的非負(fù)的實(shí)函數(shù)φ,滿足 (1)Fχ(t)=φ(t)f1(χ)+o(φ(t)),t→0; 假設(shè)1為核函數(shù)常見的假設(shè)[11];假設(shè)2為刪失數(shù)據(jù)分析中常見的假設(shè)[7],確保對(duì)任意個(gè)體沒有刪失的概率都是正的;假設(shè)3~假設(shè)5為刪失變量函數(shù)型數(shù)據(jù)分析中常見的假設(shè)[12];假設(shè)6為生存函數(shù)G(·)的常用的性質(zhì)[11]。 定理1設(shè)假設(shè)1~假設(shè)6都成立,則有 其中 針對(duì)索拉非尼治療失敗的二線靶向藥物的研究結(jié)果繼續(xù)支持瑞戈非尼可作為肝功基礎(chǔ)及體力狀態(tài)評(píng)分較好晚期肝癌患者的二線靶向治療藥物。美國西奈山醫(yī)學(xué)院Llovet等(摘要270)報(bào)告了兩項(xiàng)使用雷莫蘆單抗(RAM)的全球多中心3期臨床研究,提示RAM作為HCC接受索拉非尼治療后進(jìn)展或不耐受的中晚期HCC且AFP≥400 ng/mL的二線治療藥物,mOS為8.1月,具有良好的安全性和顯著的臨床獲益。瑞戈非尼作為二線治療有效的藥物,mOS為10月。該研究進(jìn)一步支持了上述結(jié)論。 本節(jié)通過蒙特卡洛模擬研究文中所提估計(jì)方法的實(shí)際表現(xiàn)??紤]如下的模型[6]: (2) 表1 不同刪失率下估計(jì)量的偏差和根均方誤差 然后,設(shè) 引理1 設(shè)假設(shè)1~假設(shè)6都成立,則有 φ(h)(Mkf1(χ)+o(1)),k=1,2, 且 M1f(0|χ)+o(1)。 引理1的證明類似于文獻(xiàn)[13]中引理1的證明。通過引理1和Lindeberg-Feller中心極限定理,得到如下引理2。 引理2 設(shè)假設(shè)1~假設(shè)6都成立,則有 N(0,σ2(χ)),n→∞。 其中 (3) 與文獻(xiàn)[12]引理6的證明相似,有如下等式: (4) 根據(jù)文獻(xiàn)[6],可以證明 (5) 由(4)式和(5)式可得: 其中,Wn是均值為0、方差為 的正態(tài)隨機(jī)變量。根據(jù)文獻(xiàn)[14]的理論結(jié)果,有 結(jié)合引理2,得到如下結(jié)論: 其中 本文基于隨機(jī)刪失逆概率加權(quán)的方法,提出響應(yīng)變量隨機(jī)刪失時(shí)函數(shù)型非參數(shù)分位數(shù)回歸模型的一種估計(jì)方法,并且給出估計(jì)量的漸近正態(tài)性,模擬實(shí)驗(yàn)驗(yàn)證了所提出方法的優(yōu)越性和可行性。2.2 主要結(jié)果
3 模擬研究
4 定理證明
5 結(jié) 論