付云鵬,郭云峰,馬樹才
(1遼寧大學信息學院,遼寧沈陽,110036;2沈陽大學經(jīng)濟學院;3遼寧大學經(jīng)濟學院)
線性回歸模型是統(tǒng)計推理中一類應(yīng)用較為廣泛的模型,在工程技術(shù)、社會經(jīng)濟等各個領(lǐng)域都有著廣泛的應(yīng)用。但是經(jīng)典的線性回歸模型只能討論精確數(shù)據(jù),當數(shù)據(jù)稀少、無統(tǒng)計意義、數(shù)據(jù)的信息具有不確定性時,經(jīng)典的線性回歸模型無法解決這類問題。模糊集理論的提出為解決這類問題奠定了理論基礎(chǔ)。1982年,H.Tanaka等[1]首次提出了模糊線性回歸模型;胡良劍等[2]研究了對稱三角模糊數(shù)據(jù)的線性回歸模型;王麗軍等[3]采用梯形模糊數(shù)討論了一元模糊線性回歸模型;谷振濤等[4]運用模糊線性規(guī)劃模型對井群系統(tǒng)開采量總和進行了測算。宋業(yè)新等[5]討論了具有模糊不等式約束和模糊等式約束的模糊系數(shù)線性規(guī)劃問題的求解方法,將轉(zhuǎn)化為區(qū)間數(shù)規(guī)劃問題求解。趙海坤等[6]提出目標函數(shù)和約束條件中均含有模糊數(shù)的模糊線性規(guī)劃問題,利用模糊數(shù)的排序關(guān)系將其轉(zhuǎn)化為經(jīng)典線性規(guī)劃的方法求解。高淑萍等[7]利用一種新的模糊數(shù)排序關(guān)系解決了含有三角模糊數(shù)的模糊線性規(guī)劃問題,并將其應(yīng)用于具有模糊等式約束的運輸問題。筆者將以區(qū)間模糊數(shù)為研究對象建立模糊線性回歸模型,并給出最小二乘意義下的參數(shù)估計方法,最后結(jié)合沈陽市的溫度變化情況給出該模型的實際應(yīng)用。
定義1[8]實數(shù)域R到區(qū)間[0,1]的映射稱為R上的模糊數(shù),如果滿足:
(1){x|(x)≥α}為閉區(qū)間,(α∈(0,1));(2)存在x0∈R使(x0)=1。
定理1[9](區(qū)間模糊數(shù)的運算規(guī)則)設(shè)[a,b],[c,d]是區(qū)間模糊數(shù),則由擴展原理可得以下結(jié)論:
(1)加法 [a,b]+[c,d]=[a+c,b+d]
(2)減法 [a,b]-[c,d]=[a-d,b-c]
(3)乘法 [a,b]×[c,d]=[min{ac,bc,ad,bd},max{ac,bc,ad,bd}],特別地,當a>0,c>0 時,有[a,b]×[c,d]=[ac,bd]
則稱N(,)為模糊集與的貼近度,稱N為F(R)上的貼近度函數(shù)。
貼近度是對兩個模糊集之間接近程度的一種度量,是一個原則性的概念。其具體規(guī)則可視實際需要而定,在此只介紹一種測度貼近度[8]。
上述積分為勒貝格積分,若U為實數(shù)域R,被積函數(shù)為黎曼可積,且廣義積分收斂,則上述積分化為
設(shè)[a,b],[c,d]是區(qū)間模糊數(shù),則兩個模糊數(shù)[a,b],[c,d]之間的貼近度為N([a,b],[c,d])為
貼近度刻畫了[a,b],[c,d]之間的接近程度,貼近度越大,則兩個模糊數(shù)越接近,這等價與計算d2([a,b],[c,d])=(c-a)2+(d-b)2,d2越小,則兩個區(qū)間模糊數(shù)之間的貼近度越大,兩個模糊區(qū)間數(shù)越接近,于是給出如下定義:
定義4 設(shè)[a,b],[c,d]是區(qū)間模糊數(shù),則為區(qū)間模糊數(shù)[a,b],[c,d]之間的距離。
事實上,定義4中的距離定義滿足距離的3條公理。
設(shè)[a,b],[c,d],[e,f]為3 個任意的區(qū)間模糊數(shù),則
綜上所述,定義4中的距離滿足3條公理,因此是一種合理的距離定義。
沈陽市1995~2011年的全年最低氣溫和最高氣溫數(shù)據(jù)如表1所示,數(shù)據(jù)具有區(qū)間模糊數(shù)的特點。為研究該城市的溫度隨時間的變化情況,可建立含有區(qū)間模糊數(shù)的模糊線性回歸模型。其中自變量xi為實數(shù),因變量為區(qū)間模糊數(shù)立如下模型
將樣本數(shù)據(jù)代入到模型中,按照模型(2)的估計方法求出各參數(shù)的估計值為
于是可得模糊線性回歸的估計模型為
當xi=11時,求得=[-24.606 7,35.500 0],即為2011年沈陽市氣溫的預測值,其真實值為[-23.8,32.3],真實值與預測值之間的貼近度為0.933 34,說明應(yīng)用該模型進行預測的預測效果較好。
表1 沈陽市2001~2011年的全年最低氣溫和最高氣溫數(shù)據(jù)
筆者提出含有區(qū)間模糊數(shù)的線性規(guī)劃問題,并就不同的系數(shù)類型分別討論了模型的求解方法,給出不同模型的參數(shù)估計方法,最后結(jié)合沈陽市溫度預測問題給出模型的實際應(yīng)用。實證結(jié)果表明:該模型的預測精度較高,對2011年沈陽市的最高溫度和最低溫度作為區(qū)間模糊數(shù)進行預測時,預測值與實際值的貼近度達到了0.933 34,說明該模型有一定的實際應(yīng)用價值。
[1] TANAKA H,UEJIMA S,ASAI K.Linear Regression Analysis with Fuzzy Model[J].IEEE Trans System Man Cybernet,1982,12:213-222.
[2] 胡良劍,宗云南.模糊數(shù)據(jù)的線性回歸模型[J].模糊系統(tǒng)與數(shù)學,2002,16(1):87-95.
[3] 王麗軍,馮玉瑚.模糊線性回歸模型的參數(shù)估計[J].東華大學學報:自然科學版,2006,32(6):38-42.
[4] 谷振濤,潘俊.用模糊線性規(guī)劃計算井群開采量[J].沈陽大學學報:自然科學版,1996(2):16-23.
[5] 宋業(yè)新,姜禮平,陳綿云.一類模糊線性規(guī)劃模型的模糊最優(yōu)區(qū)間值[J].模糊系統(tǒng)與數(shù)學,2002,16(2):86-91.
[6] 趙海坤,郭嗣琮.一類全系數(shù)模糊線性規(guī)劃的求解方法[J].模糊系統(tǒng)與數(shù)學,2009,23(3):139-144.
[7] 高淑萍,劉三陽.一類模糊線性規(guī)劃的求解方法及應(yīng)用[J].系統(tǒng)工程與電子技術(shù),2005,27(8):1 412-1 415.
[8] 胡寶清.模糊理論基礎(chǔ)[M].武漢:武漢大學出版社,2006.
[9] 楊綸標,高英儀.模糊數(shù)學原理及應(yīng)用[M].廣州:華南理工大學出版社,2002.
(責任編輯:朱寶昌)