武欣慧, 劉鐵軍
(1.內(nèi)蒙古農(nóng)業(yè)大學(xué),內(nèi)蒙古呼和浩特 010050;2.水利部牧區(qū)水利科學(xué)研究所,內(nèi)蒙古呼和浩特 010020;3.內(nèi)蒙古大學(xué),內(nèi)蒙古呼和浩特 010025)
?
基于最大熵理論的黑土地土壤風(fēng)蝕主導(dǎo)因子概率密度函數(shù)
武欣慧1, 劉鐵軍2,3
(1.內(nèi)蒙古農(nóng)業(yè)大學(xué),內(nèi)蒙古呼和浩特 010050;2.水利部牧區(qū)水利科學(xué)研究所,內(nèi)蒙古呼和浩特 010020;3.內(nèi)蒙古大學(xué),內(nèi)蒙古呼和浩特 010025)
土壤風(fēng)蝕是一個(gè)復(fù)雜的過(guò)程,影響因素眾多。嚴(yán)重的土壤風(fēng)蝕會(huì)引起土壤質(zhì)地變粗,結(jié)構(gòu)變壞,土壤肥力下降,可持續(xù)生產(chǎn)能力降低,尤其東北黑土地耕作土壤疏松,抗蝕能力弱,水土流失日趨嚴(yán)重。眾多因子對(duì)風(fēng)蝕結(jié)果的影響是一個(gè)隨機(jī)連續(xù)的概率事件,最終結(jié)果反映在風(fēng)蝕量上。一次土壤風(fēng)蝕可看作各變量隨機(jī)組合作用于地表土的連續(xù)分布事件。為了將事件明了化,引入最大熵原理對(duì)風(fēng)蝕變量尋找其熵概率密度函數(shù),而目前運(yùn)用最大熵原理來(lái)研究土壤風(fēng)蝕的相關(guān)成果甚少。該方法對(duì)風(fēng)蝕建模的篩選模型變量具有重要意義。
黑土地;風(fēng)蝕;最大熵
土壤風(fēng)蝕是一個(gè)復(fù)雜的過(guò)程,影響因素眾多,如氣溫、空氣濕度、風(fēng)速、氣壓、地表土壤含水量、土壤質(zhì)地、地表覆蓋度、地表粗糙度等[1]。眾多因子對(duì)風(fēng)蝕結(jié)果的影響是一個(gè)隨機(jī)連續(xù)的概率事件,最終結(jié)果反映在風(fēng)蝕量上。嚴(yán)重的土壤風(fēng)蝕會(huì)引起土壤質(zhì)地變粗,結(jié)構(gòu)變壞,土壤肥力下降,可持續(xù)生產(chǎn)能力降低[2]。我國(guó)北方旱作農(nóng)田土壤風(fēng)蝕問(wèn)題嚴(yán)重,影響范圍較大[3],尤其東北黑土地耕作土壤疏松、抗蝕能力弱[4]。由于降雨、風(fēng)力和長(zhǎng)期以來(lái)人口增加導(dǎo)致的過(guò)度墾殖等不合理開(kāi)發(fā)利用,該區(qū)水土流失日趨嚴(yán)重[5]。一次土壤風(fēng)蝕可看作各變量隨機(jī)組合作用于地表土的連續(xù)分布事件。為了將事件明了化,引入最大熵原理,對(duì)風(fēng)蝕變量尋找其熵概率密度函數(shù),通過(guò)求解得出概率密度函數(shù)方程式,得知在風(fēng)蝕發(fā)生過(guò)程中各因子的概率分布情況,進(jìn)而辨別風(fēng)蝕主要影響因子的影響時(shí)段,最終將風(fēng)蝕系統(tǒng)過(guò)程的混沌狀態(tài)清晰化、數(shù)值化。目前,運(yùn)用最大熵原理來(lái)研究土壤風(fēng)蝕的相關(guān)成果甚少[6]。該方法對(duì)風(fēng)蝕建模的篩選模型變量具有重要意義。
1.1 信息熵的定義及基本性質(zhì)
熵是由Clausius[7]于1865年首次提出的一個(gè)概念,主要用來(lái)衡量一個(gè)系統(tǒng)中分子運(yùn)動(dòng)的混亂程度。它是一個(gè)極其重要的物理量,但又以其抽象隱晦、難以理解而著稱。熵作為一個(gè)狀態(tài)函數(shù),其含義非常豐富。在熱力學(xué)中,它是不可用能的度量;在統(tǒng)計(jì)物理學(xué)中,它是系統(tǒng)微觀態(tài)數(shù)目的度量。在不同場(chǎng)合,針對(duì)不同對(duì)象,熵可以作為系統(tǒng)的混亂性或無(wú)序度。1948年,信息科學(xué)的創(chuàng)始人貝爾實(shí)驗(yàn)室的美國(guó)電氣工程師香農(nóng)(Shannon C.E.)為研究信息的不確定性,依據(jù)熱力學(xué)中熵的概念,把通信過(guò)程中信源信號(hào)的平均信息量稱為熵,使熵概念的應(yīng)用領(lǐng)域又獲得史無(wú)前例的擴(kuò)展。在信息科學(xué)中,熵是衡量系統(tǒng)不確定性程度的一個(gè)量度。信息論中的熵有時(shí)被稱為“信息熵”或“香農(nóng)熵”。信息熵的出現(xiàn)為現(xiàn)代信息論奠定科學(xué)理論基礎(chǔ)[8]。
如果把一個(gè)離散信源表示為
(1)
隨機(jī)變量X取值xi時(shí)的先驗(yàn)概率為pi,其中i=1,2,3,…,n。
p(X=xi∩X=xj)=0 (i≠j)
(2)
(3)
pi≥0
(4)
對(duì)于該信源只有部分知識(shí),即信源具有隨機(jī)不確定性,可用先驗(yàn)概率分布(p1,p2,…,pn)來(lái)描述。若有一函數(shù)(p1,p2,…,pn),則要求它滿足以下條件:①對(duì)于固定的n來(lái)說(shuō),H是p1,p2,…,pn的連續(xù)函數(shù);②如果所有pi相等,則H(1/n,1/n,…,1/n)是n的單調(diào)遞增函數(shù);③若將一試驗(yàn)分解成多個(gè)相繼的試驗(yàn),則原先的H值應(yīng)為分解后多個(gè)試驗(yàn)的各個(gè)相應(yīng)H值的加權(quán)和。
滿足上述3個(gè)條件的測(cè)度H具有唯一形式,即
(5)
上述3個(gè)條件也是對(duì)要描述該樣本窨不確定程度的要求,即信息熵的定義。其中,常數(shù)k取決于所選用的單位,通常取k=1。為了便于數(shù)學(xué)運(yùn)算,常取自然數(shù)e為底,則式(5)可表示為:
(6)
式中,pi為信息源中第i種信號(hào)出現(xiàn)的概率;-lnpi為pi帶來(lái)的信息量。
H(x)具有這樣的意義,即在試驗(yàn)進(jìn)行之前,它是試驗(yàn)結(jié)果不確定性的量度;在試驗(yàn)完成之后,它是從試驗(yàn)中所得到的信息的量度(信息量)。信息熵表征信源整體的統(tǒng)計(jì)特性,是總體的平均不確定性的量度。對(duì)于某一特定的信源,其信息熵只有一個(gè)。若統(tǒng)計(jì)特性不同,則其熵也不同。
對(duì)于連續(xù)信源,X的分布以概率密度函數(shù)p(x)來(lái)描述。仿照式(6)可以寫出X具有連續(xù)分布情況下熵的表達(dá)式為:
(7)
1.2 最大熵原理
熱力學(xué)統(tǒng)計(jì)物理中有熵增加原理,在信息論中也有對(duì)應(yīng)的關(guān)于信息熵的著名定理——最大熵原理。按最大熵原理,筆者從全部相容的分布中挑選這樣的分布。它是在某些約束條件(通常是給定的某些隨機(jī)變量的平均值)下使信息熵達(dá)到極大值的分布。這是因?yàn)樾畔㈧厝〉脴O大值時(shí)對(duì)應(yīng)的一組概率分布出現(xiàn)的概率占絕對(duì)優(yōu)勢(shì)。從理論上可以證明這一點(diǎn)。
任何物質(zhì)系統(tǒng)除了受或多或少的外部約束外,其內(nèi)部總是具有一定的自由度。這種自由度導(dǎo)致系統(tǒng)內(nèi)各元素處于不同的狀態(tài)。而狀態(tài)的多樣性以及狀態(tài)的豐富程度(混亂程度、復(fù)雜程度)的定量計(jì)量標(biāo)尺就是熵。熵最大就是事物狀態(tài)的豐富程度自動(dòng)達(dá)到最大值。換句話說(shuō),事物總是在約束下?tīng)?zhēng)取(或呈現(xiàn))最大的自由權(quán)。人們把這看作是自然界的根本原則。
Shannon解決了不確定性的度量問(wèn)題,但這里還存在如何進(jìn)行概率分配的問(wèn)題。對(duì)于一個(gè)隨機(jī)過(guò)程,概率密度事先是未知的且對(duì)于觀測(cè)值的概率分配,可以有無(wú)限多組。Jaynes提出,當(dāng)根據(jù)部分信息進(jìn)行推理時(shí),必須選擇這樣一組概率分配,它應(yīng)具有最大的熵,并且服從一切已知的信息。這是能夠做出的唯一的無(wú)偏分配;使用任何其他分配,就等于對(duì)原來(lái)所有信息做了隨意假設(shè)。這一統(tǒng)計(jì)推理準(zhǔn)則被稱為最大熵原理[9]。
在數(shù)學(xué)上,最大熵原理可表示為:
(8)
(9)
(10)
pi≥0
(11)
式中,gj(x)為可觀測(cè)的函數(shù)值;E[gj(x)]為相應(yīng)的均值。
Tribus曾證明,正態(tài)分布、伽瑪分布及指數(shù)分布等都是最大熵原理的特殊情況。對(duì)于連續(xù)變量x,該模型為:
(12)
約束條件為:
(13)
(14)
設(shè)拉格朗日函數(shù)為L(zhǎng),拉格朗日乘子為λ0,對(duì)于等式約束的極值問(wèn)題式(12)~式(14),就有
(15)
得出
(16)
式(16)就是最大熵概率密度函數(shù)的解析形式,也就是上述優(yōu)化問(wèn)題的一個(gè)最優(yōu)解。
一般的,拉格朗日乘子法的法則可敘述如下:欲求n元函數(shù)f(x1,x2,…,Xn)在m個(gè)(m>n)約束條件
(17)
下的條件極值,可用常數(shù)λ1,λ2,…,λm依次乘f,ψ1,ψ2,…,ψm,把結(jié)果加起來(lái),得函數(shù)
F(x1,x2,…,xm)=f+λ1φ1+λ2φ2+…+λmφm
(18)
然后,列出F(x1,x2, …,xn)無(wú)約束條件時(shí)具有極值的必要條件。
(19)
這n個(gè)方程與m個(gè)方程聯(lián)立解出n+m個(gè)x1,x2,…Xn,λ1,λ2,…,λm的值,而其中x1,x2,…,xn就是可能的極值點(diǎn),稱為駐點(diǎn)。其中,H(x)是分布函數(shù)f(x)的泛函數(shù)。而對(duì)于給定情況下的隨機(jī)事件,若希望得到其特定意義的解析表達(dá)式,需確定參數(shù)λ0,λ1,λ2,…,λn。這屬于一個(gè)多參數(shù)尋優(yōu)問(wèn)題。
選取2010~2012年在風(fēng)沙運(yùn)動(dòng)頻繁的春季測(cè)量的2 m高風(fēng)速(x1)、氣溫(x2)和空氣濕度(x3)3個(gè)風(fēng)蝕主導(dǎo)因子?;谏鲜隼碚摲治?,利用Matlab編制相應(yīng)的計(jì)算程序,得出主導(dǎo)因子分布規(guī)律的熵概率密度函數(shù)的表達(dá)式。在黑土地風(fēng)蝕過(guò)程中,風(fēng)速、氣溫、空氣相對(duì)濕度的熵概率密度函數(shù)表達(dá)式為:
根據(jù)上述熵概率密度函數(shù),將觀測(cè)變量樣本代入,得出風(fēng)速、氣溫、空氣相對(duì)濕度的熵概率密度函數(shù)分布規(guī)律擬合曲線(圖1)。
應(yīng)用最大熵原理尋找風(fēng)蝕主導(dǎo)因子的概率密度函數(shù),得出概率密度曲線,可以直觀地發(fā)現(xiàn)風(fēng)蝕發(fā)生過(guò)程影響因子數(shù)值區(qū)間出現(xiàn)的概率情況,進(jìn)一步對(duì)試驗(yàn)數(shù)據(jù)的有效性、風(fēng)蝕時(shí)段進(jìn)行辨別。通過(guò)對(duì)最大熵原理在風(fēng)蝕影響因子統(tǒng)計(jì)分布模型中應(yīng)用的研究,突出利用最大熵原理風(fēng)蝕影響因子確定隨機(jī)變量統(tǒng)計(jì)分布模型的優(yōu)越性,同時(shí)為研究土壤的風(fēng)蝕規(guī)律奠定基礎(chǔ)。但是,利用最大熵原理得到的風(fēng)蝕影響因子熵概率密度函數(shù),受樣本容量的影響較大,所以在利用該方法時(shí),要事先采集盡量多的實(shí)測(cè)數(shù)據(jù)資料以提高精度。
[1] 吳正.風(fēng)沙地貌與治沙工程學(xué)[M].北京:科學(xué)出版社,2003.
[2] 麻碩士,陳智.土壤風(fēng)蝕測(cè)試與控制技術(shù)[M].北京:科學(xué)出版社,2010.
[3] 董治寶,董光榮,陳廣庭.以北方旱作農(nóng)田為重點(diǎn)開(kāi)展我國(guó)的土壤風(fēng)蝕研究[J].干旱區(qū)資源與環(huán)境,1996(2):31-37.
[4] 劉鐵軍,趙顯波,趙愛(ài)國(guó),等.東北黑土地土壤風(fēng)蝕風(fēng)洞模擬試驗(yàn)研究[J].水土保持學(xué)報(bào),2013,27(2):67-70.
[5] 謝軍.黑龍江省黑土區(qū)水土流失危害及治理途徑[J].水土保持通報(bào),1991(5):61-64.
[6] 鄒春霞,申向東,李春娥.土壤風(fēng)蝕影響因子分布規(guī)律研究的最大熵方法[J].農(nóng)業(yè)環(huán)境科學(xué)學(xué)報(bào),2007,26(6):2095-2098.
[7] 馮端,馮步云.熵[M].北京:科學(xué)出版社,1992.
[8] 姜丹.信息理論與編碼[M].合肥:中國(guó)科學(xué)技術(shù)大學(xué)出版社,1992.
[9] 吳乃龍,袁素云.最大熵方法[M].長(zhǎng)沙:湖南科學(xué)技術(shù)出版社,1991.
Probability Density Function about the Maximum Entropy Theory of Black Land Soil Wind Erosion Dominating Factor
WU Xin-hui1,LIU Tie-jun2,3
(1. Inner Mongolia Agricultural University, Hohhot, Inner Mongolia 010050; 2.Institute of Water Resources for Pastoral Area, Ministry of Water Resources, Huhhot, Inner Mongolia 010020; 3.Inner Mongolia University, Hohhot, Inner Mongolia 010025)
Soil wind erosion is a complex process,it is affected by many factors.Serious soil wind erosion can cause soil texture,structures deteriorate,soil fertility decline, sustainable production ability to reduce.Especially in the northeast tillage soil loosen, erosion resistance weak,soil and water loss is becoming more and more serious.The results of many factors on wind erosion is a random probability event,the final result reflects on the amount of wind erosion.A soil wind erosion can be combined as the random variables in overburden continuous distribution incident,in order to clear the incident,the introduction of the maximum entropy principle of wind erosion variables to find its entropy probability density function and using the maximum entropy principle to the relevant achievements of research is little on soil wind erosion.This method is of great importance in the screening model of variable wind erosion modeling.
Black soil; Wind erosion; Maximum entropy
國(guó)家自然科學(xué)家基金項(xiàng)目(51579157);內(nèi)蒙古自然科學(xué)基金項(xiàng)目(2015MS0387);中國(guó)水科院科研專項(xiàng)項(xiàng)目(JSJBKY1556)。
武欣慧(1972- )女,內(nèi)蒙古烏拉特前旗人,講師,碩士,從事荒漠化防治與教學(xué)工作。
2015-11-09
S 157.1
A
0517-6611(2015)35-003-02