李林強 張楠 張靜輝 白斌
摘要:世界睡眠日的確立,引起人們對睡眠重要性和睡眠質量的關注。本文對可能影響睡眠的各種可能指標進行分析,并對相關疾病的產(chǎn)生起到預防作用。首先,將給定指標數(shù)字化,將male用1代替,female用2代替,運用Sperman相關性分析法,排除無關變量Character,然后,建立了多元回歸模型,分析得出Reliability的顯著性大于0.05,即也為無關變量,最后,得出回歸方程。再根據(jù)醫(yī)學判定,將所給診斷出的疾病分為8大類,分別為抑郁癥、心理障礙、焦慮、其他疾病、同時患有焦慮與心理障礙、同時患有抑郁癥和焦慮、同時患有抑郁癥和心理障礙、同時患有抑郁癥,心理障礙和焦慮。將每個類別用數(shù)字代替,運用BP神經(jīng)網(wǎng)絡算法,建立疾病診斷模型。
關鍵詞:精神病學;Sperman相關性分析;多元回歸模型;BP神經(jīng)網(wǎng)絡;
中圖分類號:R749 文獻識別碼:B 文章編號:
0 引言
睡眠問題已經(jīng)成為阻礙人類健康的一個重大問題,引起了包括醫(yī)學專家在內(nèi)的各方學者的高度重視,為引起人們對睡眠的重要性和質量的注意。然而結果卻不盡如人意。據(jù)統(tǒng)計,中國成年人失眠率高達38.2%,失眠率較高。于此同時青少年的失眠率也在逐年上升。
相應的造成失眠問題的原意也是多種多樣的,一般分為主管因素和客觀因素兩大類,主管因素就是在上床睡覺之前環(huán)境變化,如過量飲用茶和咖啡等等。主管因素就是一般的生活壓力 ,情緒喪失,精神興奮以及其他的神經(jīng)移因素。
1各指標與睡眠質量的關系
1.1求解思路
首先對定指標與睡眠質量數(shù)據(jù)進行相關性分析,排除無關變量,然后建立h回歸分析模型,得到給定指標與睡眠質量的相關系數(shù),得到相關系數(shù)方程。
問題一的模型建立與求解
1.2 排除無關變量
首先對數(shù)據(jù)進行數(shù)字化處理,將male用1代替,female用2代替,運用spss對給定指標與睡眠質量分別進行正態(tài)分析,得到該數(shù)據(jù)均不符合正態(tài)分布,則選用Sperman相關性分析。
Spearman秩相關系數(shù)通常被認為是排列后的變量秩次之間的Pearson線性相關系數(shù),若對隨機變量X和Y進行了n次隨機試驗,的到樣本 (X1,Y1)(1=1,2,…,n),設x、Yi的秩次分別為pi和qi且 ,
, ,則隨機變量X和Y對于這組樣本的秩相關系數(shù)ps為:
如果沒有相同的秩次,則ps可以由下式計算
隨著X和Y越來越接近嚴格單調(diào)的函數(shù)關系,Spearman秩相關系數(shù)在數(shù)值上會越來越大,當X,Y有嚴格單調(diào)遞的關時,他們之間的Spearman秩相關系數(shù)為1;反之,當X,Y嚴格單調(diào)遞減的關系時,Spearman秩相關系數(shù)為-1,Spearman秩相關系數(shù)為0表示隨著X的增加,Y沒有增大活著減小的趨勢。
由spss的Spearman相關分析所得相關系數(shù)表如下,從表可知,Character與睡眠質量之間的Sperman的相關系數(shù)為0.20,在ρ=0的原假設下,觀測的顯著性水平為0.108大于0.05,所以接受原假設,以為Character與睡眠質量沒有相關關系。
1.3 疾病診斷模型的建立
1.3.1 數(shù)據(jù)處理
原始指標的量綱、數(shù)量級和對評價體系的影響不同(有正、負之分),對綜合指標有較大影響,在進行多元回歸分析前,需要對原始數(shù)據(jù)進行合理的轉化,所以首先對給定指標的數(shù)據(jù)進行標準化的處理
1.3.2 模型建立
多元線性回歸算法適合分析一個因變量和多個自變量之間的相關關系,將睡眠質量作為因變量,給定的排除無關變量后的指標Age,Sex,Reliability,Psychoticism,Nervousness作為自變量,即有x1,x2,x3,x4,x5,則該回歸模型可以表示為:
其中 服從 ,并且獨立同部分布。
參數(shù)的最小二乘估計
選擇 使得誤差平方和達到最小。
由于 是關于 的非負二次函數(shù),因而必定存在最小值利用微積分的極值求法得
這里 是 的最小二乘法估計,對 求偏導,求得正規(guī)方程組的過程可用矩陣代數(shù)運算,得到正規(guī)方程組的矩陣表示:
1.3.3 運用spss多元回歸分析得出
Reliability的顯著性遠遠大于0.05,所以在排除Reliability與Character兩個指標的情況下,可以得出回歸方程如下:
2神經(jīng)疾病與睡眠的關系
根據(jù)抽象化模型,與享有算法進行比較分析,建立BP神經(jīng)網(wǎng)絡進行歸類統(tǒng)計分析
BP神經(jīng)網(wǎng)絡在本題中設計的基本原理:
圖1給出了第j個神經(jīng)元節(jié)點,它只是模仿了生物神經(jīng)元所具備的三個基本功能:加權,求和與轉移。其中 代表的事第i個傳入神經(jīng)節(jié)點的數(shù)據(jù) 則代表第i個神經(jīng)元與第j個神經(jīng)元連接的強度,即為權重;
為閾值, 為傳遞函數(shù); 為第j個神經(jīng)元的輸出;
第j個神經(jīng)元的凈輸出值為 :
若視 ,即領X及 包括 及 ,則:
于是節(jié)點j的凈輸入值 可以表示為:
通過傳遞函數(shù)(Transfer Function) 后,便得到第j個神經(jīng)元的輸出 :
此時我們設BP神經(jīng)網(wǎng)絡的輸入有n個節(jié)點,隱藏層有q個節(jié)點,輸出層有m個節(jié)點,輸出層與隱層之間額權值為w,則隱層節(jié)點的輸出為(閾值寫入其中求和項):
輸出層節(jié)點的輸出為:
于是我們構建了n維空間向量對m維空間向量的近似映射。在此題目中是6539組數(shù)據(jù)對8個相關屬性的近似映射。
近似的我們提出這樣一個模型:
通過研究所得神經(jīng)元可知,在選定的隱節(jié)點為10的時候,訓練誤差保持在較低水平。且在允許的誤差范圍之內(nèi),作為模型建立的基本要素,完全符合標準。誤差下降梯度在允許范圍之內(nèi),略作調(diào)整之后我們的到了0.00110的誤差下降梯度,基本符合標準。在經(jīng)過6次迭代之后誤差在允許接受的范圍之內(nèi),雖與預設范圍有一定的差距,但是繼續(xù)迭代反而會出現(xiàn)迭代過適的現(xiàn)象,所以此時的Validation Checks穩(wěn)定在6屬于正?,F(xiàn)象。
在迭代10次之后,訓練誤差就達到了0.0000463。并且趨于穩(wěn)定,訓練無差與測試誤差均達到了最好標準。經(jīng)過遺傳優(yōu)化后的權值閥值,在BP網(wǎng)絡訓練中,第五代就能夠達到收斂,可以看出實際曲線與預測值曲線之間存在著很小的誤差,預測值能夠正確反映實際診斷結果。
3 結論
本文給出了相應的數(shù)學模型,通過模型分析可知充足的睡眠對于維持機體的身心健康至關重要。失眠被認定為是許多疾病的的預測性信號和癥狀的表現(xiàn)[1]。失眠會增加工作缺勤和事故的風險[2],也會影到個體的社會功能[3],身心健康[4]和生活質量。[5]