付云鵬,郭云峰,馬樹才
(1遼寧大學(xué)信息學(xué)院,遼寧沈陽(yáng),110036;2沈陽(yáng)大學(xué)經(jīng)濟(jì)學(xué)院;3遼寧大學(xué)經(jīng)濟(jì)學(xué)院)
線性回歸模型是統(tǒng)計(jì)推理中一類應(yīng)用較為廣泛的模型,在工程技術(shù)、社會(huì)經(jīng)濟(jì)等各個(gè)領(lǐng)域都有著廣泛的應(yīng)用。但是經(jīng)典的線性回歸模型只能討論精確數(shù)據(jù),當(dāng)數(shù)據(jù)稀少、無(wú)統(tǒng)計(jì)意義、數(shù)據(jù)的信息具有不確定性時(shí),經(jīng)典的線性回歸模型無(wú)法解決這類問(wèn)題。模糊集理論的提出為解決這類問(wèn)題奠定了理論基礎(chǔ)。1982年,H.Tanaka等[1]首次提出了模糊線性回歸模型;胡良劍等[2]研究了對(duì)稱三角模糊數(shù)據(jù)的線性回歸模型;王麗軍等[3]采用梯形模糊數(shù)討論了一元模糊線性回歸模型;谷振濤等[4]運(yùn)用模糊線性規(guī)劃模型對(duì)井群系統(tǒng)開采量總和進(jìn)行了測(cè)算。宋業(yè)新等[5]討論了具有模糊不等式約束和模糊等式約束的模糊系數(shù)線性規(guī)劃問(wèn)題的求解方法,將轉(zhuǎn)化為區(qū)間數(shù)規(guī)劃問(wèn)題求解。趙海坤等[6]提出目標(biāo)函數(shù)和約束條件中均含有模糊數(shù)的模糊線性規(guī)劃問(wèn)題,利用模糊數(shù)的排序關(guān)系將其轉(zhuǎn)化為經(jīng)典線性規(guī)劃的方法求解。高淑萍等[7]利用一種新的模糊數(shù)排序關(guān)系解決了含有三角模糊數(shù)的模糊線性規(guī)劃問(wèn)題,并將其應(yīng)用于具有模糊等式約束的運(yùn)輸問(wèn)題。筆者將以區(qū)間模糊數(shù)為研究對(duì)象建立模糊線性回歸模型,并給出最小二乘意義下的參數(shù)估計(jì)方法,最后結(jié)合沈陽(yáng)市的溫度變化情況給出該模型的實(shí)際應(yīng)用。
定義1[8]實(shí)數(shù)域R到區(qū)間[0,1]的映射稱為R上的模糊數(shù),如果滿足:
(1){x|(x)≥α}為閉區(qū)間,(α∈(0,1));(2)存在x0∈R使(x0)=1。
定理1[9](區(qū)間模糊數(shù)的運(yùn)算規(guī)則)設(shè)[a,b],[c,d]是區(qū)間模糊數(shù),則由擴(kuò)展原理可得以下結(jié)論:
(1)加法 [a,b]+[c,d]=[a+c,b+d]
(2)減法 [a,b]-[c,d]=[a-d,b-c]
(3)乘法 [a,b]×[c,d]=[min{ac,bc,ad,bd},max{ac,bc,ad,bd}],特別地,當(dāng)a>0,c>0 時(shí),有[a,b]×[c,d]=[ac,bd]
則稱N(,)為模糊集與的貼近度,稱N為F(R)上的貼近度函數(shù)。
貼近度是對(duì)兩個(gè)模糊集之間接近程度的一種度量,是一個(gè)原則性的概念。其具體規(guī)則可視實(shí)際需要而定,在此只介紹一種測(cè)度貼近度[8]。
上述積分為勒貝格積分,若U為實(shí)數(shù)域R,被積函數(shù)為黎曼可積,且廣義積分收斂,則上述積分化為
設(shè)[a,b],[c,d]是區(qū)間模糊數(shù),則兩個(gè)模糊數(shù)[a,b],[c,d]之間的貼近度為N([a,b],[c,d])為
貼近度刻畫了[a,b],[c,d]之間的接近程度,貼近度越大,則兩個(gè)模糊數(shù)越接近,這等價(jià)與計(jì)算d2([a,b],[c,d])=(c-a)2+(d-b)2,d2越小,則兩個(gè)區(qū)間模糊數(shù)之間的貼近度越大,兩個(gè)模糊區(qū)間數(shù)越接近,于是給出如下定義:
定義4 設(shè)[a,b],[c,d]是區(qū)間模糊數(shù),則為區(qū)間模糊數(shù)[a,b],[c,d]之間的距離。
事實(shí)上,定義4中的距離定義滿足距離的3條公理。
設(shè)[a,b],[c,d],[e,f]為3 個(gè)任意的區(qū)間模糊數(shù),則
綜上所述,定義4中的距離滿足3條公理,因此是一種合理的距離定義。
沈陽(yáng)市1995~2011年的全年最低氣溫和最高氣溫?cái)?shù)據(jù)如表1所示,數(shù)據(jù)具有區(qū)間模糊數(shù)的特點(diǎn)。為研究該城市的溫度隨時(shí)間的變化情況,可建立含有區(qū)間模糊數(shù)的模糊線性回歸模型。其中自變量xi為實(shí)數(shù),因變量為區(qū)間模糊數(shù)立如下模型
將樣本數(shù)據(jù)代入到模型中,按照模型(2)的估計(jì)方法求出各參數(shù)的估計(jì)值為
于是可得模糊線性回歸的估計(jì)模型為
當(dāng)xi=11時(shí),求得=[-24.606 7,35.500 0],即為2011年沈陽(yáng)市氣溫的預(yù)測(cè)值,其真實(shí)值為[-23.8,32.3],真實(shí)值與預(yù)測(cè)值之間的貼近度為0.933 34,說(shuō)明應(yīng)用該模型進(jìn)行預(yù)測(cè)的預(yù)測(cè)效果較好。
表1 沈陽(yáng)市2001~2011年的全年最低氣溫和最高氣溫?cái)?shù)據(jù)
筆者提出含有區(qū)間模糊數(shù)的線性規(guī)劃問(wèn)題,并就不同的系數(shù)類型分別討論了模型的求解方法,給出不同模型的參數(shù)估計(jì)方法,最后結(jié)合沈陽(yáng)市溫度預(yù)測(cè)問(wèn)題給出模型的實(shí)際應(yīng)用。實(shí)證結(jié)果表明:該模型的預(yù)測(cè)精度較高,對(duì)2011年沈陽(yáng)市的最高溫度和最低溫度作為區(qū)間模糊數(shù)進(jìn)行預(yù)測(cè)時(shí),預(yù)測(cè)值與實(shí)際值的貼近度達(dá)到了0.933 34,說(shuō)明該模型有一定的實(shí)際應(yīng)用價(jià)值。
[1] TANAKA H,UEJIMA S,ASAI K.Linear Regression Analysis with Fuzzy Model[J].IEEE Trans System Man Cybernet,1982,12:213-222.
[2] 胡良劍,宗云南.模糊數(shù)據(jù)的線性回歸模型[J].模糊系統(tǒng)與數(shù)學(xué),2002,16(1):87-95.
[3] 王麗軍,馮玉瑚.模糊線性回歸模型的參數(shù)估計(jì)[J].東華大學(xué)學(xué)報(bào):自然科學(xué)版,2006,32(6):38-42.
[4] 谷振濤,潘俊.用模糊線性規(guī)劃計(jì)算井群開采量[J].沈陽(yáng)大學(xué)學(xué)報(bào):自然科學(xué)版,1996(2):16-23.
[5] 宋業(yè)新,姜禮平,陳綿云.一類模糊線性規(guī)劃模型的模糊最優(yōu)區(qū)間值[J].模糊系統(tǒng)與數(shù)學(xué),2002,16(2):86-91.
[6] 趙海坤,郭嗣琮.一類全系數(shù)模糊線性規(guī)劃的求解方法[J].模糊系統(tǒng)與數(shù)學(xué),2009,23(3):139-144.
[7] 高淑萍,劉三陽(yáng).一類模糊線性規(guī)劃的求解方法及應(yīng)用[J].系統(tǒng)工程與電子技術(shù),2005,27(8):1 412-1 415.
[8] 胡寶清.模糊理論基礎(chǔ)[M].武漢:武漢大學(xué)出版社,2006.
[9] 楊綸標(biāo),高英儀.模糊數(shù)學(xué)原理及應(yīng)用[M].廣州:華南理工大學(xué)出版社,2002.
(責(zé)任編輯:朱寶昌)