王資平, 林 鋒, 丁秀美, 黃星凱, 石廣源, 王 衛(wèi)
(地質(zhì)災(zāi)害防治與地質(zhì)環(huán)境保護(hù)國家重點(diǎn)實(shí)驗(yàn)室(成都理工大學(xué)),成都 610059)
巖體中結(jié)構(gòu)面的發(fā)育特征是影響巖體力學(xué)性狀的主要因素,精細(xì)描述巖體中結(jié)構(gòu)面發(fā)育特征一直是工程地質(zhì)和巖體力學(xué)領(lǐng)域的熱點(diǎn)和難點(diǎn)問題[1-2]。巖體中結(jié)構(gòu)面發(fā)育特征的精細(xì)描述,首先是進(jìn)行結(jié)構(gòu)面分組,完整的分組包括確定分組數(shù)、各組代表性產(chǎn)狀和將測(cè)量的各條結(jié)構(gòu)面歸組。結(jié)構(gòu)面是在巖體建造和改造過程中逐步形成的[1-3],這是結(jié)構(gòu)面分組的地質(zhì)基礎(chǔ),也表明結(jié)構(gòu)面在巖體中的分布并不是完全隨機(jī)的。結(jié)構(gòu)面分組通常依據(jù)結(jié)構(gòu)面產(chǎn)狀[1-4],但也有一些學(xué)者建議分組時(shí)同時(shí)考慮間距、平面度、粗糙度、風(fēng)化程度、長(zhǎng)度和寬度等特征[5-8]。
對(duì)系統(tǒng)測(cè)量(如精測(cè)網(wǎng)法、測(cè)線法等)的大量結(jié)構(gòu)面,常依據(jù)結(jié)構(gòu)面產(chǎn)狀采用極點(diǎn)等密度圖、直方圖和玫瑰花圖進(jìn)行分組[1-4],這些方法簡(jiǎn)單、直觀,但無法直接給出完整的分組結(jié)果,不便于進(jìn)一步的統(tǒng)計(jì)分析。大量結(jié)構(gòu)面的分組問題在數(shù)學(xué)上常概化為聚類分析問題。R.J.Shanley等[9]采用改進(jìn)的一級(jí)模分析法依據(jù)產(chǎn)狀進(jìn)行聚類分析;R.E.Hammah等[5]采用模糊K均值聚類算法,分別依據(jù)“產(chǎn)狀”和“產(chǎn)狀+粗糙度”進(jìn)行自動(dòng)分組分析,但在尋優(yōu)搜索時(shí),較易陷入局部極小點(diǎn)[10];王鵬等[11]引入遺傳算法(GA),與FCM算法一起依據(jù)產(chǎn)狀分組,提高了算法的全局搜索能力;田景元等[12]采用綜合模糊等價(jià)聚類方法分析優(yōu)勢(shì)產(chǎn)狀;周玉新等[10]結(jié)合模糊等價(jià)聚類方法和模糊軟劃分聚類方法,形成綜合模糊聚類方法,提高了分析效果;R.R.Jimenez等[13]采用譜聚類算法依據(jù)產(chǎn)狀進(jìn)行分組,該方法需指定分組數(shù);盧波等[14]將分組問題概化為多目標(biāo)優(yōu)化問題,引入小生境技術(shù)和Pareto支配集理論進(jìn)行求解,算法復(fù)雜;范雷等[15]采用改進(jìn)的動(dòng)態(tài)聚類方法和鄧?yán)^輝等[16]采用改進(jìn)的自組織聚類算法,均需要事先指定分組數(shù);宋金龍等[17]將模糊聚類法與K均值動(dòng)態(tài)聚類算法結(jié)合,改善了計(jì)算效率;徐黎明等[8]提出了基于變尺度混沌優(yōu)化算法的多參數(shù)結(jié)構(gòu)面優(yōu)勢(shì)組劃分方法。綜合分析這些研究成果可見,聚類分析可以用于結(jié)構(gòu)面分組量化分析,但實(shí)現(xiàn)完全的精細(xì)分組還需要改進(jìn)。
在水電開發(fā)等重大工程中,巖體特性現(xiàn)場(chǎng)調(diào)查會(huì)系統(tǒng)采集大量結(jié)構(gòu)面數(shù)據(jù)。實(shí)踐表明,中陡傾結(jié)構(gòu)面在極點(diǎn)等密圖上一般可以清晰分組,而緩傾角結(jié)構(gòu)面難以分組[18],為精細(xì)分析巖體中結(jié)構(gòu)面發(fā)育特征,還需要改進(jìn)聚類分析法。由于結(jié)構(gòu)面產(chǎn)狀與其成因密切相關(guān),而成因決定了結(jié)構(gòu)面其他特征,因此,本文將結(jié)構(gòu)面分組問題抽象為以產(chǎn)狀為基本變量的多目標(biāo)組合優(yōu)化求解問題,引入花授粉算法和Silhouette指標(biāo),建立一種新的聚類算法?;ㄊ诜鬯惴?flower pollination algorithm, FPA)是英國劍橋大學(xué)Yang X.S.提出的一種模擬花朵授粉過程的種群智能優(yōu)化算法[19],隨著該方法的進(jìn)一步改進(jìn)完善[20-23]和在函數(shù)優(yōu)化、無線傳感網(wǎng)、經(jīng)濟(jì)調(diào)度、圖像分析等領(lǐng)域的推廣應(yīng)用[23-24],可以解決多目標(biāo)優(yōu)化問題,具有全局搜索能力顯著、收斂快等特點(diǎn)。
結(jié)構(gòu)面方位相似度d(Pi,Pj)定義為兩結(jié)構(gòu)面Pi和Pj的法線之間銳夾角φ正弦值的平方[8,14],有
φ= arccos(Pi·Pj)
(1)
d(Pi,Pj) = sin2φ
(2)
假定待分組的N個(gè)結(jié)構(gòu)面可劃分為M組,其中任一組Gk(k= 1, 2, …,M)中有nk條結(jié)構(gòu)面,Gk的中心記為Ck,稱為分組中心。根據(jù)d(Pi,Ck)大小來判斷Pi是否歸屬Gk組。用變量mik來描述歸屬關(guān)系
mik=1, (Pi∈Gk)
(3)
mik=0, (Pi?Gk)
(4)
定義結(jié)構(gòu)面分組目標(biāo)函數(shù)(E)
(5)
由式(5)可知,當(dāng)每一條結(jié)構(gòu)面都單獨(dú)成一組時(shí),目標(biāo)函數(shù)值為0;但實(shí)際分組數(shù)M是有限大小,最優(yōu)分組時(shí)E值取最小值,這是一個(gè)組合優(yōu)化問題。
Gk組中任一結(jié)構(gòu)面Pj的輪廓寬度s(j,k)定義為
(6)
式中:a(j,k)為Pj與Gk組中所有其他結(jié)構(gòu)面間方位相似度的均值;b(j) = min[a(j,i)],(i≠k;i=1, 2, …,M)。
全局Silhouette指標(biāo)的計(jì)算公式[25-26]為
(7)
Silhouette指標(biāo)結(jié)合內(nèi)聚度和分離度2種因素,既能評(píng)價(jià)聚類結(jié)果的優(yōu)良程度,也能確定聚類個(gè)數(shù)。由式(7)可見,Gs取值范圍為[-1, 1]。當(dāng)Gs接近于1時(shí),聚類效果較好;當(dāng)Gs值接近于-1,則表示聚類結(jié)果錯(cuò)誤。取Gs最大時(shí)對(duì)應(yīng)的組數(shù),作為最優(yōu)聚類組數(shù)。
花朵授粉的過程分為2種,即異花授粉和自花授粉,前者對(duì)應(yīng)目標(biāo)函數(shù)最優(yōu)求解的全局搜索,后者對(duì)應(yīng)局部搜索[19-22]?;ㄊ诜鬯惴ㄔ谌炙阉髋c局部搜索之間的轉(zhuǎn)換通過轉(zhuǎn)換概率p控制[19],p∈[0, 1]。
a.當(dāng)算法執(zhí)行全局搜索(異花授粉)時(shí),由式(8)實(shí)現(xiàn)花粉位置更新。
(8)
(9)
其中,Г(λ)是標(biāo)準(zhǔn)伽馬函數(shù),并且該分布符合較大步長(zhǎng)s>0的情況,常取λ=1.5。
b.當(dāng)算法執(zhí)行局部尋優(yōu)(自花授粉)時(shí),采用式(10)更新花粉位置。
(10)
根據(jù)上述原理,作者采用MATLAB平臺(tái)編制了計(jì)算程序,主要計(jì)算步驟如下:
第一步:設(shè)定種群數(shù)Fn和最大迭代次數(shù);初始化分組數(shù)M=2,轉(zhuǎn)換概率p在文獻(xiàn)[27]中建議取0.8,但作者通過多次試算發(fā)現(xiàn)p=0.4時(shí)收斂更快;刪除輸入數(shù)據(jù)中的相同數(shù)據(jù),組成樣本數(shù)據(jù)集P。
第二步:從P中任選M個(gè)樣本作為初始聚類中心,據(jù)式(2)計(jì)算Pi與各聚類中心的方位相似度d,并對(duì)結(jié)構(gòu)面歸組,按式(5)計(jì)算目標(biāo)函數(shù)值E。
第三步:尋優(yōu)搜索,如果服從[0,1]均勻分布隨機(jī)數(shù)rand>p,進(jìn)行異花授粉,采用式(8)和(9)來計(jì)算更新解;如果rand
第四步:回到第二步,改變初始聚類中心。
第五步:記錄最優(yōu)解,計(jì)算Silhouette 指標(biāo);M=M+1,回到第二步,直至M>8。
第六步:比較Silhouette指標(biāo),找出Silhouette指標(biāo)中最大的分組數(shù),并輸出最優(yōu)解和所需圖件。
西藏自治區(qū)芒康縣境內(nèi)瀾滄江干流上某大型水電站壩址區(qū)基巖主要為英安巖和花崗巖,巖體中節(jié)理、裂隙十分發(fā)育,根據(jù)傾角大小,可分為中陡傾角結(jié)構(gòu)面和緩傾角結(jié)構(gòu)面,巖體結(jié)構(gòu)類型以鑲嵌結(jié)構(gòu)、似互層狀結(jié)構(gòu)為主[18]。
在右岸平硐PDZ14中采用精測(cè)網(wǎng)法測(cè)量了640條結(jié)構(gòu)面,現(xiàn)場(chǎng)判斷發(fā)育6組,其極點(diǎn)等密度圖見圖1-A,得到的優(yōu)勢(shì)產(chǎn)狀見表1,不能直接給出各組結(jié)構(gòu)面條數(shù)。在左岸壩址區(qū)平硐PDZ11中全洞段測(cè)量了813條緩傾角結(jié)構(gòu)面,現(xiàn)場(chǎng)判斷可以分為4組,其極點(diǎn)等密圖見圖1-B,產(chǎn)狀變化范圍很大,無法精細(xì)分組,得到的優(yōu)勢(shì)產(chǎn)狀為330°∠11°。
圖1 平硐中實(shí)測(cè)結(jié)構(gòu)面的極點(diǎn)等密圖Fig.1 The pole figures showing measurement data from the precision mesh method in adits
采用花授粉算法,對(duì)PDZ14的分析成果如圖2所示,當(dāng)分組數(shù)取6時(shí),全局Silhouette指標(biāo)取得最大值,即最佳分組數(shù)為6組,優(yōu)勢(shì)產(chǎn)狀及各組結(jié)構(gòu)面數(shù)量見表1,優(yōu)勢(shì)產(chǎn)狀與極點(diǎn)等密圖法結(jié)果高度一致;對(duì)PDZ11中緩傾角結(jié)構(gòu)面的分析成果見圖3,Silhouette指標(biāo)最大值對(duì)應(yīng)的分組數(shù)為4,即最佳分組數(shù)為4,優(yōu)勢(shì)產(chǎn)狀分別為191.8°∠14.6°、278.9°∠30.2°、346.0°∠14.7°、84.6°∠26.7°,這與現(xiàn)場(chǎng)判斷確定的測(cè)量結(jié)果高度一致[18]。
圖2 PDZ14中精測(cè)網(wǎng)數(shù)據(jù)基于FPA法的分組成果Fig.2 The grouping results of measurement data from the precision mesh method in PDZ14 by FPA method
圖3 PDZ11中緩傾角結(jié)構(gòu)面基于FPA法的分組成果Fig.3 The grouping results of low inclination structural planes in PDZ11 based on FPA method
綜上,對(duì)于系統(tǒng)測(cè)量的結(jié)構(gòu)面信息,極點(diǎn)等密圖法和FPA法都可以很好地對(duì)中陡傾角結(jié)構(gòu)面進(jìn)行分組;但對(duì)緩傾角結(jié)構(gòu)面,F(xiàn)PA法可以更好地進(jìn)行精細(xì)分組;特別突出的是,F(xiàn)PA法可以實(shí)現(xiàn)對(duì)測(cè)量數(shù)據(jù)的自適應(yīng)最佳分組,并同時(shí)完成結(jié)構(gòu)面自動(dòng)歸組,便于后續(xù)的結(jié)構(gòu)面分組統(tǒng)計(jì)分析。
結(jié)構(gòu)面精細(xì)分組是巖體結(jié)構(gòu)特征量化描述的前提和基礎(chǔ),常用的極點(diǎn)等密圖法難以給出完整的分組結(jié)果,且對(duì)緩傾角結(jié)構(gòu)面無法精細(xì)分組。本文引入花授粉算法(FPA)研究結(jié)構(gòu)面自適應(yīng)精細(xì)分組問題,主要結(jié)論如下:
a.建立了結(jié)構(gòu)面產(chǎn)狀分組問題的數(shù)學(xué)模型,選擇Silhouette指標(biāo)作為判別指標(biāo),引入花授粉算法進(jìn)行自適應(yīng)尋優(yōu)求解,提高了聚類分析的客觀性及算法自主性,可完成大量測(cè)量數(shù)據(jù)的精細(xì)分組工作。
b.對(duì)某水電工程壩基巖體中結(jié)構(gòu)面分組的實(shí)際應(yīng)用效果表明,基于花授粉算法,可以很好完成結(jié)構(gòu)面自適應(yīng)精細(xì)分組:對(duì)中陡傾角結(jié)構(gòu)面,其分組成果與極點(diǎn)等密圖法高度一致;對(duì)緩傾角結(jié)構(gòu)面,能清晰給出分組結(jié)果,克服了極點(diǎn)等密圖法的不足;量化分組成果與現(xiàn)場(chǎng)判斷一致;可同時(shí)完成結(jié)構(gòu)面自動(dòng)歸組,便于分組統(tǒng)計(jì)分析。
基于花授粉算法的結(jié)構(gòu)面自適應(yīng)最優(yōu)分組分析,本質(zhì)上屬于一種數(shù)據(jù)挖掘技術(shù),其結(jié)果的可靠性必然取決于測(cè)量數(shù)據(jù)的系統(tǒng)性和可靠性,因此,實(shí)際應(yīng)用時(shí),務(wù)必要以現(xiàn)場(chǎng)的定性判斷為基礎(chǔ)和依據(jù),并通過系統(tǒng)的測(cè)量獲得可靠的結(jié)構(gòu)面信息。