姜 英,袁代林,李裕奇,劉妙妙
(西南交通大學 數(shù)學學院,四川 成都 610031)
基于變系數(shù)非參數(shù)回歸的穩(wěn)健性參數(shù)設(shè)計*
姜 英,袁代林,李裕奇,劉妙妙
(西南交通大學 數(shù)學學院,四川 成都 610031)
利用變系數(shù)的非參數(shù)回歸理論討論多因子試驗過程中因子間相互性對質(zhì)量特性的影響,通過調(diào)節(jié)系數(shù)變量改變其他因子對過程的影響,找到最優(yōu)的因子水平組合,進行穩(wěn)健試驗.提出了在穩(wěn)健性參數(shù)設(shè)計中應(yīng)用變系數(shù)的非參數(shù)回歸模型理論,建立質(zhì)量特性的均值和方差模型,得到最優(yōu)的因子水平組合進行試驗分析.最后,通過油墨打印機的實例說明此理論的可行性.
變系數(shù)模型;非參數(shù)回歸;穩(wěn)健性設(shè)計;交叉驗證
穩(wěn)健性參數(shù)設(shè)計(robust parameter design,RPD)是工程理論中作為提高產(chǎn)品質(zhì)量和過程的最有效的方法.參數(shù)設(shè)計的目的是通過選擇可控因子的水平優(yōu)化質(zhì)量特性,減少系統(tǒng)、產(chǎn)品或過程中對噪聲變化的敏感性,從而減少系統(tǒng)性能波動.對于過程中因子影響的研究通常是內(nèi)外表法,分析各可控因子水平下的質(zhì)量特性的均值和方差,得到穩(wěn)健性的設(shè)計方法.文獻[1]提出了RPD的對偶模型響應(yīng)面法,利用約束優(yōu)化均值和方差模型得到最優(yōu)可控因子水平.如果模型不確定或估計有很高偏差,那么最優(yōu)可控因子就不能被確定.文獻[2]指出傳統(tǒng)的參數(shù)模型是不完備的,特別是方差模型,提出了用非參數(shù)的方法確定方差模型,利用非參數(shù)的局部擬合,對質(zhì)量特性的均值和方差進行分析.然而,當控制因子之間存在相互關(guān)系或受多個控制因子的影響時,非參數(shù)的局部擬合就會產(chǎn)生維數(shù)災(zāi)難的問題.因此,筆者提出用變系數(shù)的半?yún)?shù)回歸思想,通過調(diào)節(jié)一個因子來改變其他控制因子對系統(tǒng)的影響,減少維數(shù)災(zāi)難問題.
1.1模型的建立
變系數(shù)回歸模型[3]是現(xiàn)階段廣泛應(yīng)用和發(fā)展的回歸模型,基于一定程度的非參數(shù)回歸模型的特點,對模型進行改進,避免擬合模型中維數(shù)災(zāi)難的問題,更加靈活和有效地擬合.變系數(shù)回歸模型假定線性模型中系數(shù)是一個未知函數(shù),且是以自變量為U的函數(shù),模型的形式是以非參數(shù)回歸模型和部分線性回歸模型構(gòu)成,減少擬合誤差.建立因變量Y和自變量X1,X2,…,Xp以及U的變系數(shù)回歸模型:
其中:βj(·)(j=1,2,…,p)為未知函數(shù);ε為誤差,且滿足E(ε|U,X1,…,Xp)=0,Var(ε|U,X1,…,Xp)=σ2(U).當X1=1時,模型包含截距項.
其中:
由加權(quán)最小二乘估計模型參數(shù)
(XT(u0)W(u0)X(u0))-1XT(u0)W(u0)Y,
則系數(shù)函數(shù)向量β(u)=(β1(u),β2(u),…,βp(u))T在u=u0處的局部線性估計為
其中Ip和Op分別是p階單位陣和零矩陣.
變系數(shù)回歸模型估計中窗寬對函數(shù)的影響與非參數(shù)回歸類似.在非參數(shù)擬合回歸中,一般選用估計全局參數(shù)的交叉確認方法,當各系數(shù)光滑程度在定義域內(nèi)不同時,常值下的光滑參數(shù)的擬合效果會變得很差.因此,文獻[5]提出了變窗寬的方法,利用逐點確定光滑參數(shù).同時,在系數(shù)函數(shù)之間的光滑度差異比較大時,可以采用變系數(shù)模型的二步估計,使估計的系數(shù)參數(shù)更優(yōu).
對任意給定的u0∈μ,較小光滑參數(shù)h0,系數(shù)函數(shù)βj(u)(j=1,2,…,p-1)具有連續(xù)三階導(dǎo),從而得到局部線性擬合的初值估計.記
因此,變系數(shù)的回歸模型在擬合效果及預(yù)測精度上優(yōu)于常系數(shù)模型,避免了非參數(shù)回歸模型中維數(shù)災(zāi)難的問題.同時,變系數(shù)的二步估計解決了模型中系數(shù)光滑程度差異較大的情況.
1.2窗寬的選擇
K(X)是核函數(shù),Xi=(xi1,xi2,…,xik).
表1 油墨打印數(shù)據(jù)直積表
根據(jù)表1實驗數(shù)據(jù)結(jié)果,利用非參數(shù)的局部曲面擬合和變系數(shù)的非參數(shù)回歸建立對應(yīng)的質(zhì)量特性的均值模型.其步驟如下:
(ⅰ)選取常用的Epanechnikov核函數(shù)K(t)=0.75(1-t2)+;
(ⅱ)由交叉確認方法和Matlab軟件得到最優(yōu)的窗寬h1=0.51,h2=0.46;
(ⅲ)調(diào)節(jié)距離的大小來改變速度和壓力對質(zhì)量特性的影響,建立自變量為X=(X1,X2)及U=X3的變系數(shù)非參數(shù)的質(zhì)量特性均值模型;
(ⅳ)利用平方誤差損失函數(shù)得到最優(yōu)的控制因子水平組合,平方誤差損失(Squared Error Loss,SEL)為SEL=E[y(x)-T]2,其中T是目標均值.
根據(jù)實驗數(shù)據(jù)結(jié)果,利用非參數(shù)常系數(shù)方法和變系數(shù)方法分別進行模型質(zhì)量特性的均值擬合.通過擬合的均值計算均方誤差值(mean square error,MSE)和平均絕對誤差值(mean absolute error,MAE)的結(jié)果見表2.
表2 非參數(shù)方法的2種情況模型擬合的比較
在給定的目標值500的情況下,由平方誤差損失函數(shù)最小,得到非參數(shù)的2種方法在最優(yōu)控制因子水平下的均值見表3.
表3 最優(yōu)控制水平下均值和平方誤差損失值
由表2可以看出,變系數(shù)模型的均方誤差值和平均絕對誤差值都要小于常系數(shù)非參數(shù)模型,擬合效果更優(yōu).同時,由表3可以看出,在最優(yōu)因子水平下由變系數(shù)非參數(shù)方法得到的均值為495.998 5,更接近目標值500且平方誤差損失值相對較小.因此,在文中實例里變系數(shù)非參數(shù)方法比常系數(shù)非參數(shù)方法擬合效果更好、更穩(wěn)定,得到接近目標均值.變系數(shù)非參數(shù)模型方法在實際應(yīng)用中相比常系數(shù)模型有更好的擬合效果,同時解決了常系數(shù)非參數(shù)回歸中引起的維數(shù)災(zāi)難問題.
[1] VINING G G,MYERS R H.Combining Taguchi and Response Surface Philosophies:A Dual Response Approach[J].Quality Technol.,1990,22:38-45.
[2] VINING G G,BOHN L L.Response Surfaces for the Mean and Variance Using a Nonparametric Approach[J].Quality Technol.,1998,30:282-291.
[3] 梅長林,王 寧.近代回歸分析方法[M].北京:科學出版社,2010:104-105.
[4] FAN Jiangqing,ZHANG Wenyang.Statistical Methods with Varying Coefficient Models[J].Statistics and Its Interface,2008(1):179-195.
[5] ZHANG W,LEE S Y.Variable Bandwidth Selection in Varying-Coefficient Models[J].Journal of Multivariate Analysis,2000,74:116-134.
[6] STEPHANIE M,JEFFREY B BIRCH.A Semi-Parametric Approach to Robust Parameter Design[J].Journal of Statistical Planning and Inference,2008,138:114 -123.
(責任編輯 向陽潔)
RobustParameterDesignBasedonVaryingCoefficientNon-ParametricRegressionModel
JIANG Ying,YUAN Dailin,LI Yuqi,LIU Miaomaio
(College of Mathematics,Southwest Jiaotong University,Chengdu 610031,China)
Varying coefficient Regression theory is applied to the discussion on quality characteristic influenced by factors’ mutuality during the process of multifactor test.In order to find the optimal combination of factor levels,the effect of other factors is changed by adjusting the coefficient variable.The paper studies varying coefficient regression theory in robust design,builds quality characteristic mean model and variance model and gets an optimal combination of factor levels.The feasibility of the theory is illustrated by the ink printing.
variable coefficient model;nonparametric regression;robust design;cross validation
1007-2985(2014)05-0022-04
2014-05-07
中央高校基本科研業(yè)務(wù)費專項基金項目(2682013CX037)
姜 英(1987—),女,黑龍江尚志人,西南交通大學數(shù)學學院碩士研究生,主要從事非參數(shù)統(tǒng)計研究;李裕奇,男,西南交通大學數(shù)學學院教授,碩士生導(dǎo)師,主要從事非參數(shù)統(tǒng)計和時間序列研究.
O212.6
A
10.3969/j.issn.1007-2985.2014.05.006
Box和Draper[6]提到的油墨打印實驗例子,用X1,X2,X3分別表示速度、壓力、距離3個控制因素,實驗數(shù)據(jù)由33個全因子設(shè)計進行多次重復(fù)試驗獲得,找到方差最小且均值接近目標值為500的區(qū)域.給出實驗設(shè)計的一次重復(fù)實驗的數(shù)據(jù)結(jié)果見表1.