張兆威,滑懷田
(1.神華神東煤炭集團(tuán)公司石圪臺(tái)煤礦,陜西 榆林 719000;2.山西工程技術(shù)學(xué)院,山西 陽(yáng)泉 045000)
我國(guó)許多礦井的水文地質(zhì)條件復(fù)雜,隨著煤層開(kāi)采深度的不斷加大,巖溶承壓水對(duì)工作面安全開(kāi)采的威脅已日益凸顯[1]。因此研究多因素協(xié)同作用下工作面底板的突水規(guī)律,建立精度較高的突水危險(xiǎn)性判別模型,對(duì)于保證工作面的安全回采具有重要的指導(dǎo)意義。
目前數(shù)值模擬手段和數(shù)據(jù)發(fā)掘分類技術(shù)已被廣泛應(yīng)用在煤層底板突水的評(píng)價(jià)和預(yù)測(cè)研究中[2]。文章[3]運(yùn)用FLAC3D數(shù)值模擬方法研究了斷層影響下底板突水通道的演化規(guī)律,文章[4]利用經(jīng)驗(yàn)公式及理論計(jì)算等多種方法分析了灰?guī)r含水層對(duì)工作面底板破壞深度的影響。文章[5]以巖石的強(qiáng)度理論為基礎(chǔ)建立了精度更高的突水系數(shù)計(jì)算公式,文章[6]從煤層底板的充水通道、底板完整性等方面出發(fā),綜合運(yùn)用突水系數(shù)法等多種手段對(duì)煤層帶壓開(kāi)采的可行性進(jìn)行了研究。文章[7]以五礦306中巷的實(shí)際地質(zhì)條件為背景,提出了巖巷掘進(jìn)過(guò)斷層的安全技術(shù)措施。文中將選取18例礦井的實(shí)測(cè)數(shù)據(jù)作為學(xué)習(xí)樣本[8],首先運(yùn)用主成分分析法對(duì)納入研究的6個(gè)自變量進(jìn)行信息濃縮,然后計(jì)算各樣本的主成分得分值,并將其作為中間變量建立判別函數(shù),最后將主成分轉(zhuǎn)變回各原始變量,從而建立以樣本原始數(shù)據(jù)為自變量的底板突水危險(xiǎn)性判別模型。
煤層底板突水是多因素綜合作用的結(jié)果,為了能夠較為全面地反映不同變量對(duì)底板突水的影響,在建模時(shí)往往希望納入較多的自變量,但因部分變量間可能存在著大量的信息重疊,如果直接用它們建立預(yù)測(cè)模型會(huì)由于變量間的強(qiáng)共線性使得模型精度降低。
Pearson相關(guān)系數(shù)是一個(gè)介于-1~1之間的值。它是在協(xié)方差的基礎(chǔ)上除以兩個(gè)隨機(jī)變量的標(biāo)準(zhǔn)差求得的。通過(guò)計(jì)算Pearson相關(guān)系數(shù)值的大小可以定量的反應(yīng)兩變量之間的線性相關(guān)程度,當(dāng)系數(shù)值為0~0.2為無(wú)關(guān)聯(lián),0.2~0.4為弱關(guān)聯(lián),0.4~0.6為中等關(guān)聯(lián),0.6~0.8為強(qiáng)關(guān)聯(lián),0.8~1.0為極強(qiáng)關(guān)聯(lián)。由表1可知含水層水壓與煤層傾角的相關(guān)系數(shù)值分別為0.612、隔水層厚度與采高的系數(shù)值為0.528,表明部分變量間的確存在強(qiáng)關(guān)聯(lián)性。
表1 各突水因素相關(guān)系數(shù)矩陣
主成分分析法屬于信息濃縮方法的一種,其目的是通過(guò)對(duì)原始變量進(jìn)行合理的線性組合,從而減少分析的維度,避開(kāi)多重變量間的共線性。
表2 各主成分解釋的總方差
在進(jìn)行主成分分析時(shí)首先需要對(duì)變量X1~X6進(jìn)行標(biāo)準(zhǔn)化,可記為Zx1~Zx6,從而消除各變量在數(shù)量級(jí)及量綱上對(duì)研究結(jié)果的影響。然后計(jì)算標(biāo)化數(shù)據(jù)的協(xié)方差矩陣。最后求得協(xié)方差矩陣的特征值λ1≥λ2≥…≥λ6及其對(duì)應(yīng)的單位特征向量。
表3 旋轉(zhuǎn)前因子載荷矩陣
圖1 碎石圖
從表3可知對(duì)于當(dāng)前所提取的3個(gè)主成分很難對(duì)其代表的實(shí)際意義做出合理解釋,因此采用最大方差法對(duì)初始因子載荷矩陣進(jìn)行正交旋轉(zhuǎn),見(jiàn)表4。在旋轉(zhuǎn)后F1~F3的方差貢獻(xiàn)率分別為30.075%、26.953%、26.878%,與旋轉(zhuǎn)前相比3個(gè)主成分的方差貢獻(xiàn)率均發(fā)生了變化,并且彼此間的差值也有所減小,但是在轉(zhuǎn)換前后3者的累計(jì)方差貢獻(xiàn)率并未發(fā)生變化仍為83.906%,這說(shuō)明因子旋轉(zhuǎn)只是對(duì)信息量進(jìn)行了重新分配。從旋轉(zhuǎn)后的因子載荷矩陣可知F1在斷層傾角及距斷層距離兩個(gè)自變量上有較大的載荷,因此說(shuō)明F1主要反映的是斷層構(gòu)造對(duì)工作面底板突水的影響。雖然隔水層厚度、采高及含水層水壓、煤層傾角在F2、F3的載荷分布上各有側(cè)重但代表的實(shí)際意義依舊不是特別明確。
表4 旋轉(zhuǎn)后因子載荷矩陣
由表5可知主成分F1~F3的表達(dá)式分別為
表5 主成分得分系數(shù)矩陣
F1=0.352Zx1+0.152Zx2+0.395Zx3-0.082Zx4+0.200Zx5-0.347Zx6
(1)
F2=-0.223Zx1+0.475Zx2-0.197Zx3+0.492Zx4-0.047Zx5+0.331Zx6
(2)
F3=0.287Zx1+0.402Zx2-0.196Zx3-0.304Zx4+0.613Zx5+0.037Zx6
(3)
Fisher判別法是以方差分析原理為基礎(chǔ),試圖找到一個(gè)由原始自變量組成的線性函數(shù),使得組間平方和盡可能的大,而樣本的總離差平方和盡可能的小。
2.3 ER-β 基因Alu I 多態(tài)性與促卵泡激素、黃體生成素和雌孕激素測(cè)量結(jié)果 廣西壯族絕經(jīng)婦女45~50歲5個(gè)ER-β 基因Alu I 酶切基因(AA、Aa、aa、a、A)組的血清雌二醇、孕酮水平中,AA基因組、Aa基因組、a基因組、A基因組,四組間兩兩比較,差異無(wú)顯著性(P>0.05),aa基因組與其它4組之間比較差異有顯著性(P<0.05):aa基因組的雌二醇和孕酮血液水平明顯高于其它4組(P<0.05),而aa基因組的促卵泡激素、黃體生成素明顯低于其它4組(P<0.01),見(jiàn)表3、表4。
y(x)=c1f1+c2f2+c3f3=CTF
(4)
式中:C=(C1,C2,C3)T,F=(f1,f2,f3)T則有
(5)
(6)
運(yùn)用之前介紹的理論,將各樣本的主成分得分值作為自變量,分組變量為突水狀況,建立煤層底板突水的Fisher判別模型。
y=0.918F1+1.175F2-0.058F3+0.123
(7)
將式(1)~式(3)代入式(7)可得以樣本原始數(shù)據(jù)為自變量的判別模型
y=0.07x1+0.07x2+0.04x3+0.09x4-0.01x-3.66
(8)
對(duì)于判別分析只有當(dāng)組均值不相等時(shí),才能建立的有效的判別函數(shù),Wilks的Lamada值是在組內(nèi)平方和的基礎(chǔ)上除以樣本的總平方和求得的,其值越小說(shuō)明組別間的均值差異越大,通過(guò)計(jì)算式(7)的Wilks的Lamada值只有0.4,因此認(rèn)為G1(突水)、G2(不突水)之間的區(qū)分度非常明顯,所以在此基礎(chǔ)上所建立的判別函數(shù)是有統(tǒng)計(jì)學(xué)意義的。
判別得分和自變量間的相關(guān)系數(shù)被稱為模型的結(jié)構(gòu)矩陣,相關(guān)系數(shù)越大表明該自變量對(duì)于判別模型的影響越大,F(xiàn)1、F2、F3與判別得分的相關(guān)系數(shù)值分別為-0.535、0.440、0.737,所以該判別函數(shù)主要與F3有關(guān),而通過(guò)前面的分析可知F3又主要攜帶的是含水層水壓、煤層傾角2個(gè)原始自變量的信息,這提示可能含水層水壓及煤層傾角兩個(gè)變量在判別中起到了主要的作用。事實(shí)上若只用含水層水壓及煤層傾角進(jìn)行判別分析,模型的綜合正確率仍為72.2%。
表7 訓(xùn)練樣本數(shù)據(jù)及Fisher模型判別結(jié)果
突水組重心處的函數(shù)值為1.263,不突水組重心處的函數(shù)值為-1.011。通過(guò)比較每個(gè)樣本點(diǎn)與各組重心的馬氏距離可以確定該案例的分組傾向性。最終的判別結(jié)果見(jiàn)表7,可見(jiàn)對(duì)于8例突水樣本模型成果預(yù)測(cè)出了6例,正確率為75%,對(duì)于10例不突水樣本模型成果預(yù)測(cè)出了9例正確率為90%,雖然2類樣本都存在不同程度的錯(cuò)判但模型的綜合正確率已達(dá)83.3%。
為進(jìn)一步檢驗(yàn)?zāi)P偷木?,將運(yùn)用式(5)對(duì)3例待分組樣本進(jìn)行判別分析,從表8可知對(duì)于3例樣本模型全部取得了與實(shí)際吻合的結(jié)果。
表8 測(cè)試樣本判別分析結(jié)果
(1)通過(guò)主成分分析法提取了F1、F2、F33個(gè)主成分,其累計(jì)方差貢獻(xiàn)率達(dá)到了83.707%,達(dá)到了信息濃縮的目的,并且避免了變量間的多重共線性問(wèn)題。
(2)以主成分得分值為中間變量建立了煤層底板突水的Fisher判別模型,通過(guò)對(duì)18例訓(xùn)練樣本進(jìn)行回代判別,模型的綜合準(zhǔn)確率為83.3%。在對(duì)3例待分組樣本的檢驗(yàn)中誤判率為0,表明模型對(duì)于類似地質(zhì)條件下底板突水危險(xiǎn)性的判別具有一定的參考價(jià)值。
(3)突水組與不突水組在含水層水壓及煤層傾角兩個(gè)變量上存在顯著差異,因此在全面收集樣本數(shù)據(jù)比較困難的情況下,可重點(diǎn)關(guān)注兩者的變化,并將其作為判別分析的主要指標(biāo)。
(4)煤層底板突水是多因素綜合作用的結(jié)果,因此需要廣泛搜集更多具有代表性的突水?dāng)?shù)據(jù)作為訓(xùn)練樣本,從而提高模型的精度和適用性。