李國平,楊風暴,吉琳娜,王肖霞
(1.中北大學 信息與通信工程學院,山西 太原030051 ;2.中北大學 理學院,山西 太原 030051)
可能性理論是由美國著名控制論專家L.A.Zadeh 于1978年提出的,它可以描述模糊性和認知不確定性,以及能量化不確定性[1].可能性分布是可能性理論中的一個重要概念,它在可能性理論中的作用如同概率分布在概率論中的作用一樣.用可能性分布構造自然語言表示的命題和概念,從而可對它們進行定量分析.因此,可能性分布的構造會直接影響到可靠性分析,產品設計優(yōu)化等的結果.可能性分布的構造方法文獻中常見的是利用構造隸屬函數(shù)的方法直接生成相應的可能性分布函數(shù)[2-3],也有用概率/可能性相容原理利用概率分布轉換為可能性分布[4-9].文獻[10]利用線性回歸得到了梯形模糊數(shù);文獻[11]通過乘冪型分布構造了基于庫水位的壩體安全等級的可能性分布;文獻[12]介紹了基于可能性中值的可能性分布構造方法;文獻[13]詳細描述了三角形和梯形可能性分布的具體情況.
在實際問題中,由于許多可能性分布規(guī)律符合線性回歸模型,且可能性分布一般描述一個自變量與因變量的對應關系,故本文基于一元線性回歸構造可能性分布.若多個自變量同時影響因變量時,可將多元轉化為一元來考慮,因為一元線性回歸模型比多元線性回歸模型更容易建立,且計算復雜度低,在實際問題中更具普適性.然而,并非所有變量之間的關系都是線性的,若問題中觀測值的散點圖大致呈某一曲線,又存在某種變換,可將該曲線轉換成直線,就可以選擇該變換將具有約束條件的非線性回歸問題轉換成線性回歸問題[14],從而利用線性回歸的一些結果來解決這一問題.
可能性分布的構造方法有很多,本文針對近似服從一條直線或曲線的一系列離散數(shù)據(jù),通過一元線性回歸構造這類數(shù)據(jù)的可能性分布.
回歸分析就是建立變量間相關關系的具體的數(shù)學表達形式.在一元線性回歸分析中,通??紤]兩個變量:一個是自變量x,另一個是因變量y.對給定的x 值,y 值不能事先確定,故y 是隨機變量,具有不確定性.
假設y 與x 有如下的相關關系:
式中:a,b 為常數(shù);ε 是一個隨機變量且服從正態(tài)分布N(0,σ2),即ε~N(0,σ2).
式(1)稱為一元線性回歸模型.當x 取固定數(shù)值時,y~N(a+bx,σ2),y 的數(shù)學期望為E(y)=a+bx,回歸方程為
稱此方程為y 關于x 的回歸直線方程,它反映出了E(y)隨x 變化的規(guī)律.
這里,a 和b 的最小二乘估計為
σ2的無偏估計量
在前面的討論中,假設y 關于x 的回歸為x的線性函數(shù),然而在實際應用中還需通過實踐來回答回歸方程所描述變量之間關系的合理性,也可用統(tǒng)計方法對回歸方程進行檢驗.常用的有t檢驗法,F(xiàn) 檢驗法和r 檢驗法,而且這三種檢驗的結果是完全一致的[14].在實際的顯著性檢驗中,任取一種加以應用即可.
在實際問題中,有許多回歸模型中的自變量和因變量的關系并非是線性的,但因變量或因變量的轉換形式與某些未知參數(shù)的關系卻是線性的,可通過適當?shù)淖兞看鷵Q,將非線性模型轉化為一元線性回歸模型.幾種常見的非線性模型及其線性化方法如表1 所示.
表1 幾種常見的非線性模型及其線性化方法Tab.1 Several kinds of common nonlinear model and its linearization method
基于一元線性回歸的可能性分布構造的具體步驟如下:
1)根據(jù)實驗或統(tǒng)計數(shù)據(jù)畫出散點圖.
2)根據(jù)散點圖中散點的分布特點,從表1 幾種模型中選出最佳模型.
3)利用最小二乘法估計最佳模型中的未知參數(shù),進而求出回歸方程.
4)利用上面提到的檢驗法對回歸方程中的參數(shù)進行回歸效果的顯著性檢驗.
5)將回歸方程轉化為可能性分布函數(shù).
設論域X=[0,100],在X 上定義一個“年老”的模糊集A,由于人們對“年老”的理解不一樣,因此選擇不同層次的人進行問卷調查.在說明“年老”的含義后,請他們填調查表.統(tǒng)計結果顯示:不大于50 歲不是年老,大于70 歲人們才會認為是“年老”,而區(qū)間[51,70]則是年齡的一個過渡期[15].人們認為“年老”的可能性程度如表2所示,試求“年老”的可能性分布函數(shù).
表2 年齡[51-70]歲屬于“年老”的可能性程度Tab.2 Possibility degrees of age[51-70]belonging to the“old”
由表2 所給的數(shù)據(jù),可在二維直角坐標系中畫出一個散點圖,如圖1 所示.
圖1 年齡[51-70]歲屬于“年老”的可能性程度散點圖Fig.1 Scatter plot of possibility degrees of age[51-70]belonging to the“old”
由散點圖可以看出,數(shù)據(jù)觀測點大致分布在一條直線附近,并圍繞直線上下波動,具有不確定性,這表明y 與x 之間存在一種線性關系.為此,可設由此可以建立y 對 x 的經驗回歸直線方程=-2.524 3 +0.050 4x.實際上,所謂經驗回歸直線方程,就是一條在最小二乘意義下擬合這些觀測數(shù)據(jù)的最優(yōu)直線.圖1 給出了原始數(shù)據(jù)的散點所擬合的直線.
下面用t 檢驗法檢驗上例中的回歸效果是否顯著(取α=0.05).
在α=0.05 下,檢驗假設
檢驗統(tǒng)計量為
拒絕域為
這里
所以,拒絕H0∶b=0,接受H1∶b ≠0,即認為回歸效果是顯著的.從而“年老”的可能性分布函數(shù)為
式中:x 表示年齡且為自然數(shù).
本例也可用F 檢驗法,r 檢驗法對回歸效果進行顯著性檢驗.通過計算,檢驗結果完全一致.
以上討論了一元線性回歸的問題,在實際中常會遇到更為復雜的回歸問題,在某些情況下,可通過適當?shù)淖兞縼碜儞Q,將它化成一元線性回歸處理,下面舉例說明.
設論域U={打火機},試用模糊統(tǒng)計試驗建立A=“優(yōu)質打火機”的可能性分布函數(shù).由于全國各地工廠的生產規(guī)模、生產水平和技術高低不同,人們對模糊概念“優(yōu)質”的理解也不同,一般認為打火機打火500 次就算質量好了.作者向來自全國各地各階層的150 人進行了問卷調查,在說明優(yōu)質打火機的含義以后,請他們填寫表3.在收回詢問表后作出統(tǒng)計,結果如表4 所示.
表3 “優(yōu)質打火機”含義的調查表Tab.3 Questionnaire of the meaning of“high quality lighter”
表4 150 人對于“優(yōu)質打火機”含義的統(tǒng)計Tab.4 The statistics of the meaning of“high quality lighter”for 150 persons
按表4 的累計頻率可以作出A(優(yōu)質打火機)的可能性分布函數(shù)的散點圖,如圖2 所示.由圖2可以看出,πA(x)隨x 的變化呈現(xiàn)對數(shù)規(guī)律,因此選擇對數(shù)模型πA(x)=a+bln x(b >0).令z=πA(x),t=ln x,則有z=a+bt,按表4 給出的數(shù)據(jù),計算得到表5.
表5 對數(shù)模型變換后的對應值Tab.5 Corresponding values after logarithm model transformation
圖2 “優(yōu)質打火機”的可能性分布散點圖Fig.2 Scatter plot of possibility distribution of“high quality lighter”
由表5 通過計算可得
因此線性回歸方程為
下面在顯著性水平α=0.05 下檢驗假設H0∶b=0,H1∶b ≠0.采用r 檢驗法進行檢驗,現(xiàn)在n=15,n -2=13,查相關系數(shù)臨界值表[14],可得c=0.514,觀測值r=0.997 5,|r|=0.997 5 >0.514,所以拒絕H0∶b=0,即認為z 關于t 的線性回歸效果是顯著的.將z=πA(x),t=ln x 代入=-2.267 2 +0.489 0t中,得到
把這條曲線畫在圖3 中,可見基本上反映了πA(x)與x 之間的變化規(guī)律.
圖3 “優(yōu)質打火機”的可能性分布函數(shù)Fig.3 Possibility distribution function of“high quality lighter”
本例也可用F 檢驗法,t 檢驗法檢驗回歸效果是否顯著.通過計算,檢驗結果完全一致.
構造可能性分布時,若變量間確實存在且在數(shù)量上表現(xiàn)為不確定性的相互依存關系時,就可以考慮利用回歸分析這種統(tǒng)計方法來處理.通過回歸效果的顯著性檢驗,不但能夠盡可能完整地描述信息的認知不確定性,而且能夠盡可能貼切地對認知不確定性進行描述,減小其與真實分布的差異.此外,還可利用回歸方程得到的可能性分布進行預測和控制.
[1]Zadeh L A.Fuzzy sets as a basis for a theory of possibility[J].Fuzzy Sets and Systems,1978,l(1):3-28.
[2]周新宇.基于多源信息不確定性的可能性融合方法研究[D].太原:中北大學,2012.
[3]侯艷華.認知不確定性條件下可能性分布的構造方法研究[D].成都:電子科技大學,2010.
[4]佟欣.基于可能性理論的模糊可靠性設計[D].大連:大連理工大學,2005.
[5]Serrurier M,Prade H.An informational distance for estimating the faithfulness of a possibility distribution,viewed as a family of probability distributions,with respect to data[J].International Journal of Approximate Reasoning,2013,54:919-933.
[6]Masson M,Denoeux T.Inferring a possibility distribution from empirical data[J].Fuzzy Sets and Systems,2006,157(3):247-254.
[7]Mauris G.Infering a possibility distribution from very few measurements[J].ASC,2008,48:92-99.
[8]樊慶英,楊風暴,王肖霞,等.一種尾礦庫風險評估的可能性處理方法[J].計算機與現(xiàn)代化,2012(12):24-26.Fan Qingying,Yang Fengbao,Wang Xiaoxia,et al.Possibility processing method on tailings pond risk assessment[J].Computer and Modernization,2012(12):24-26.(in Chinese)
[9]駱志高,何鑫,胥愛成,等.可能性理論在滾動軸承復合故障診斷中的應用[J].振動與沖擊,2011,30(1):73-76.Luo Zhigao,He Xin,Xu Aicheng,et al.Application of possibility theory in rolling bearing compound fault diagnosis[J].Journal of Vibration and Shock,2011,30(1):73-76.(in Chinese)
[10]Garcia J M,Linares L J,Benitez L R,et al.Fuzzy numbers from raw discrete data using linear regression[J].Information Sciences,2013,233:1-14.
[11]吉琳娜,楊風暴,王肖霞,等.基于庫水位的壩體安全等級的可能性分析方法[J].計算機工程與應用,2013,49(11):224-227.Ji Linna,Yang Fengbao,Wang Xiaoxia,et al.Possibility analysis method on safety levels of tailings dam based on reservoir water level[J].Computer Engineering and Applications,2013,49(11):224-227.(in Chinese)
[12]何俐萍.基于可能性度量的機械系統(tǒng)可靠性分析和評價[D].大連:大連理工大學,2010.
[13]Serrurier M,Prade H.An informational distance for estimating the faithfulness of a possibility distribution,viewed as a family of probability distributions,with respect to data[J].International Journal of Approximate Reasoning,2013,54(7):919-933.
[14]趙穎.應用數(shù)理統(tǒng)計[M].北京:北京理工大學出版社,2008.
[15]謝季堅.模糊數(shù)學方法及其應用[M].武漢:華中科技大學出版社,2013.