陳呈超, 焦春碩, 翟金金, 董 勝
(中國海洋大學(xué)工程學(xué)院, 山東 青島 266100)
基于逐時潮位推求設(shè)計水位的統(tǒng)計分布選型研究*
陳呈超, 焦春碩, 翟金金, 董 勝**
(中國海洋大學(xué)工程學(xué)院, 山東 青島 266100)
基于沿海長期觀測的歷時潮位資料,提出了推求設(shè)計高(低)水位的傳統(tǒng)最大熵分布模型。該分布能夠擬合逐時潮位具有雙峰的概率密度曲線,計算所得設(shè)計高(低)水位,與修改的最大熵分布高潮10%和低潮90%的水位值相比,誤差較小。選型的歷時潮位曲線分布為港口工程設(shè)計水位推算提供了更多的選擇,計算精度高,克服了手工方法推算歷時潮位設(shè)計值的不足,有理論和工程意義。
逐時潮位;設(shè)計高水位;設(shè)計低水位;理論分布;傳統(tǒng)最大熵分布
設(shè)計高、低水位是指港口水工建筑物在正常使用條件下的高、低水位。對港口而言,在此水位范圍內(nèi),設(shè)計的最大船舶在各種裝卸作業(yè)條件下,均可以安全地靠泊并進(jìn)行裝卸作業(yè),同時,在各種設(shè)計荷載下,能夠滿足結(jié)構(gòu)以及地基強(qiáng)度和穩(wěn)定性的要求。
具有長期潮汐觀測資料的港口,確定設(shè)計高、低水位有兩種方法:一是根據(jù)歷時潮位資料計算的,一是根據(jù)高潮或低潮資料計算的。中國《港口與航道水文規(guī)范》規(guī)定[1]:對于海岸港和潮汐作用明顯的河口港,設(shè)計高水位采用高潮累積頻率10%的潮位,簡稱高潮10%;設(shè)計低水位采用低潮累積頻率90%的潮位,簡稱低潮90%。如已有歷時累積頻率統(tǒng)計資料,其設(shè)計高(低)潮位也可分別采用歷時累積頻率1%和98%的潮位。對于汛期潮汐作用不明顯的河口港,設(shè)計高、低水位分別采用多年歷時1%和98%的潮位。在進(jìn)行潮位累積頻率統(tǒng)計時,應(yīng)有多年的實(shí)測潮位資料或至少完整一年逐日每小時的實(shí)測潮位資料。
需要指出的是:無論是歷時累積頻率曲線,還是高潮或低潮累積頻率曲線,以往在工程設(shè)計中,多采用手工方法進(jìn)行繪制。2010年董勝和姚艷杰[2]基于逐日高潮和低潮數(shù)據(jù),采用修改的最大熵分布(Modified maximum entropy distribution, MMED)推算了海岸港的設(shè)計高(低)潮位,計算精度較高,克服了傳統(tǒng)方法手繪曲線讀取設(shè)計值的任意性。而采用MMED繪制歷時潮位累積頻率曲線,擬合效果不佳,如圖1所示。
提出適用于設(shè)計高低潮位的隨機(jī)模型,對于快速、準(zhǔn)確計算設(shè)計潮位具有重要工程意義。本文首先簡介了正態(tài)分布(Normal distribution,簡稱NORM),對數(shù)正態(tài)分布(Log-normal distribution, 簡稱LOGN),傳統(tǒng)最大熵分布(Traditional maximum entropy distribution,簡稱TMED),以及修改的最大熵分布,給出未知參數(shù)的估計方法。為了與修改最大熵分布進(jìn)行比較,介紹了K-S統(tǒng)計檢驗(yàn)和最小離差平方和的計算流程。再以連云港潮位觀測資料為例,探討了修改最大熵分布擬合歷時潮位曲線不佳的原因。最后采用傳統(tǒng)最大熵分布計算了設(shè)計高低潮位值,并進(jìn)行了對比,獲得有益的結(jié)論。
關(guān)于設(shè)計潮位理論線型的研究。成果不多。2010年董勝和姚艷杰采用MMED對高潮10%和低潮90%進(jìn)行了統(tǒng)計分析[2]。2011年董勝等探討了乘潮潮位的理論分布[3]。為了擬合歷時潮位曲線,本文采用正態(tài)分布、對數(shù)正態(tài)分布、傳統(tǒng)最大熵分布、修改最大熵分布作為備選分布,通過假設(shè)檢驗(yàn)和頻率離差平方和來確定最優(yōu)線型。
1.1 正態(tài)分布
正態(tài)分布的概率密度函數(shù)如下:
(1)
式中:μ為隨機(jī)變量的均值;σ為隨機(jī)變量的標(biāo)準(zhǔn)差。
1.2 對數(shù)正態(tài)分布
對數(shù)正態(tài)分布的概率密度函數(shù)如下:
(2)
式中:μy和σy分別是y=lnx的均值和標(biāo)準(zhǔn)差。
1.3 傳統(tǒng)最大熵分布
1957年,Jaynes[4]在統(tǒng)計學(xué)中提出最大熵原則,“最少偏見的概率分布是這樣一種分布,它使熵在已知信息的約束條件下最大化”[5]。即最容易出現(xiàn)的事件其復(fù)雜程度或稱不確定性程度最大,熵也最大。傳統(tǒng)最大熵分布模型可表示為[6]:
(3)
(4)
式中:f(x)為概率密度,是待求解的最大熵分布;H為f(x)的熵,熵最大,即表示在滿足已知信息約束下,求出的最大熵分布概率密度函數(shù)最客觀、合理;式(4)為傳統(tǒng)最大熵的約束條件,其中:φi(x),i=0,1,…N為樣本的已知函數(shù),且φ0(x)=1;μi為隨機(jī)變量的各階原點(diǎn)矩,其中μ0=1;模型階數(shù)根據(jù)具體問題確定。
引入Lagrange乘子λi,做目標(biāo)泛函,即
(5)
要使式(5)中的泛函S達(dá)到極值,令S對f(x)的變分為零,即
(6)
解得最大熵的概率密度函數(shù)為[7]:
(7)
式中的Lagrange乘子λi可通過下面的非線性方程組求解:
(8)
i=0,1,…,N。
對式(8)做Taylor展開,得到:
Gi(λ)≌Gi(λ0)+(λ-λ0)t[gradGi(λ)]λ=λ0=μi,
n=0,1,…N。
(9)
式(9)可寫成矩陣的形式:
Gδ=υ。
(10)
(11)
對海岸工程的歷時潮位進(jìn)行統(tǒng)計分析。令φi(x)表示隨機(jī)變量潮位x的冪函數(shù),即
φi(x)=xi,i=0,1,…,N,
(12)
則式(7)、(8)、(11)變化為:
(13)
,
(14)
(15)
聯(lián)立式(13)、(14)和(15),可求解TMED的參數(shù)λ。
1.4 修改最大熵分布
基于最大熵原理,Xu等推導(dǎo)了適用于描述于描述海洋工程環(huán)境條件的最大熵分布密度函數(shù)[8]。其約束條件如下:
(16)
將式(16)代入Euler方程,并令,α′=-1-λ1,β=λ3,γ=-λ2可得最大熵分布的概率密度函數(shù)為[9]:
f(x)=αxγe-βxξ。
(17)
引入位置參數(shù)a0,可得改進(jìn)的最大熵分布
(18)
其中:
(19)
為了求解式(18)的未知參數(shù),Dong等提出了矩法,經(jīng)驗(yàn)適線法,以及極大似然法等[10]來估計最大熵分布的未知參數(shù)。下面簡介極大似然法的求解過程。
最大熵分布函數(shù)的似然函數(shù)為
(20)
對數(shù)似然函數(shù)為
(21)
分別對參數(shù)β,γ,ξ和a0求偏導(dǎo),并令其為零,得
(22)
對式(22)中的4個式子進(jìn)行簡化得
(23)
γ+1=βξAξ,a0,
(24)
式(23-b)可變?yōu)?/p>
(25)
(26)
式(26)化簡可得:
(27)
將式(27)帶入式(25)得
(28)
根據(jù)式(23-d)可得
(29)
由式(24)可知γ=ξβξ,a0Aξ,a0-1,則上式可變?yōu)?/p>
(30)
令
(31)
由于a0∈[0,x(1)],假設(shè)a0值給定,則Aξ,a0僅由ξ確定。將式(27)代入式(28),可得到ξ的數(shù)值解,然后將ξ代入式(27)即可得到β值。將β,ξ和a0代入式(29),可求得γ值。由于a0是在[0,x(1)]遍歷取值,因可以得到很多組(β,γ,ξ,a0),選取使得式(31)中K值最小的那組(β,γ,ξ,a0)作為一維最大熵分布函數(shù)的極大似然參數(shù)估計值。
(a)K-S檢驗(yàn)
假定樣本服從F0(x)的理論分布,采用K-S檢驗(yàn),選取統(tǒng)計量Dn:
(32)
式中:Fn(x)為經(jīng)驗(yàn)概率分布函數(shù)。令
(33)
則K-S檢驗(yàn)的統(tǒng)計量Dn為:
(34)
(b)均方根誤差法
本文采用均方根誤差(Root mean square error, RMSE)法評價各理論分布的擬合優(yōu)度,其表達(dá)式為:
(9)
式中:n為樣本容量;Fthe為理論分布的計算值;Femp為經(jīng)驗(yàn)概率。
《港口與航道水文規(guī)范》規(guī)定[1],確定設(shè)計高(低)潮位時,應(yīng)有完整的一年或多年的實(shí)測潮位資料。本文收集連云港1962—1973年的潮位資料進(jìn)行歷時潮位的統(tǒng)計計算。
(a)連云港設(shè)計潮位
收集連云港高潮數(shù)據(jù)和低潮數(shù)據(jù),采用MMED,繪制高潮與低潮累積頻率曲線(見圖2),得到連云港高潮10%的值,即設(shè)計高水位為518 cm;低潮90%的值,即設(shè)計低水位為57 cm。
圖2 MMED擬合的連云港高(低)潮累積頻率曲線Fig.2 High and low cumulative probability curve by MMED for Lianyungang
(b)連云港歷時潮位曲線
采用正態(tài)分布、對數(shù)正態(tài)分布、修改最大熵分布、傳統(tǒng)最大熵分布,分別繪制歷時潮位累積頻率曲線(見圖3)。各曲線的K-S檢驗(yàn)統(tǒng)計量Dn和擬合曲線的頻率離差平方和如表1。由不同曲線得到的歷時潮位頻率1%和98%的值如表2。論文3.1部分,由高潮和低潮累積分布曲線得到設(shè)計高水位518 cm,設(shè)計低水位57 cm。以此為基準(zhǔn),得到相對誤差列入表2。
圖3 連云港歷時潮位曲線的分布擬合Fig.3 Fitting curve of tide duration at Lianyungang
表1 不同分布擬合檢驗(yàn)結(jié)果Table 1 Fitting test result for different distributions
表2 不同分布所得設(shè)計水位值Table 2 Design tide levels by different distributions
(c)計算結(jié)果比較分析
根據(jù)本文3.1的計算結(jié)果,基于高潮潮位資料,修改最大熵分布得到的10%的潮位值,即設(shè)計高水位為518 cm。采用低潮潮位資料,改進(jìn)最大熵分布得到的90%的潮位值,即設(shè)計低水位為58 cm。由表2可知,基于歷時潮位數(shù)據(jù),4種分布中,傳統(tǒng)最大熵分布計算的歷時1%水位和歷時98%水位,與高潮10%和低潮90%的潮位最為接近。
(d)傳統(tǒng)最大熵分布概率密度曲線
繪制連云港歷時潮位的概率密度直方圖(見圖4),在潮位180~190 cm和410~419 cm區(qū)間各出現(xiàn)一個密度峰值。繪制4種分布的概率密度曲線如圖4。由于正態(tài)分布、對數(shù)正態(tài)分布、修改最大熵分布的概率密度曲線都是單峰的,因此,對應(yīng)的累積分布曲線擬合程度較差;而傳統(tǒng)最大熵分布概率密度是雙峰的,對于歷時潮位曲線擬合得較優(yōu)。
圖4 連云港歷時潮位曲線的概率密度分布Fig.4 Probability density function of tide duration at lianyungang
基于歷時潮位觀測資料,本文選配了統(tǒng)計分布線型。通過計算與對比分析,得到如下結(jié)論:
(1)傳統(tǒng)最大熵分布適用于港口工程歷時潮位設(shè)計高(低)水位的推算。
(2)采用傳統(tǒng)最大熵分布擬合的歷時1%高潮與98%低潮,與修改最大熵分布擬合的高潮10%和低潮90%的潮位精度相當(dāng)。
(3)修改最大熵分布不適用于歷時潮位曲線的擬合,原因是:歷時潮位的概率密度曲線為雙峰型,而修改最大熵分布是單峰型,采用傳統(tǒng)最大熵分布可以克服這一困難。
由于算例有限,傳統(tǒng)最大熵分布對其他海岸港口設(shè)計潮位的適用性有待做更多的計算驗(yàn)證。
[1] 中華人民共和國交通部. 港口與航道水文規(guī)范(JTS145-2015) [S]. 北京: 人民交通出版社, 2015. China Communication Ministry. Code of Hydrology for Harbour and Waterway (JTS145-2015) [S]. Beijing: China Communications Press, 2015.
[2] 董勝, 姚艷杰. 海岸港設(shè)計潮位的最大熵分布統(tǒng)計分析 [J]. 港工技術(shù), 2010, 47(5): 6-8. Dong S, Yao Y J. Statistical analysis of design tide levels for coastal ports with maximum entropy distribution [J]. Port Engineering Technology, 2010, 47(5): 6-8.
[3] 董勝, 曹書軍, 周沖, 等. 乘潮潮位的理論分布探討 [J]. 中國海洋大學(xué)學(xué)報(自然科學(xué)版), 2011, 41(7/8): 154-158. Dong S, Cao S J, Zhou C, et al. Study of theoretical distribution for ridable tidal levels [J]. Periodical of Ocean University of China, 2011, 41(7/8): 154-158.
[4] Jaynes E T. Information theory and statistical mechanics[J]. Physical Review, 1957, 106(4): 620-630
[5] 李繼清, 張玉山, 王麗萍, 紀(jì)昌明. 應(yīng)用最大熵原理分析水利工程經(jīng)濟(jì)效益的風(fēng)險[J]. 水科學(xué)進(jìn)展, 2003, 14(5): 626-630. Li J Q, Zhang Y S, Wang L P, Ji C M. Application of the maximum entropy principle to risk analysis of economic benefits for water projects [J]. Advances in Water Science, 2003, 14(5): 626-630.
[6] Shanon C E. A mathematical theory of communication[J]. The Bell System Technical Journal, 1948, 27: 379-423.
[7] Liu F J, Chang T P. Validity analysis of maximum entropy distribution based on different moment constraints for wind energy assessment[J]. Energy, 2011, 36(3): 1820-1826.
[8] Xu Delun, Zhang Jun and Zheng Guizhen. Maximum entropy estimation of n-year extreme wave heights [J]. China Ocean Engineering, 2004, 18(2): 307-314.
[9] Zhang Lizhen, Xu Delun. A new maximum entropy probability function for the surface elevation of nonlinear sea waves [J]. China Ocean Engineering, 2005, 19(4): 637-646.
[10] Dong S, Tao S S, Lei S H, et al. Parameter estimation of the maximum entropy distribution of significant wave height [J]. Journal of Coastal Research, 2013, 29(3): 597-604.
Abstract: With given data of long-term measured tide elevations, there exist two methods to determine design high water (DHW) or design low water (HLW). One is to determine design water (DW) with tide duration curve. The other is to calculate DW with high and low tide elevation data. According to the Code of Hydrology for Sea Harbor, for harbors at sea coast and river estuary with obvious tidal actions, the DHW shall be the water level with 10% of high water accumulation frequency (HW10%) and the HLW shall be the water level with 90% of low water accumulation frequency (LW90%). For coast harbors and estuary harbors with obvious tidal actions, if statistical data of accumulated frequencyies of water level duartion are available, the water levels with 1% and 98% of accumulated frequencies of duration can be used as the DHW and DLW respectively. For esturay harbors without obvious tidal actions during flood preiod, the water levels with 1% and 98% of accumulated frequencies of duration shall be used as the DHW and DLW respectively. For determination of DHW and DLW, the accumulated frequencies of high waters, low waters and tidal water levels with certain duartion shall be satistically calculated with the tide level data obtained from observation for one or several complete years.
No matter with the accumulated frequencies of high waters and low waters, or with the accumulated frequencies of tidal levels with certain duration, the DW are estimated with the plot curve by hand in port engineering design. Based on daily observed data of both high and low tide levels, Dong and Yao adopted Modified Maximum Entropy Distribution (MMED) to calculate design water levels in 2010. The computation accuracy is higher and the shortage of traditional method is overcome. However, the cumulative curve plotted by MMED does not fit tide duration very well.
It makes sense to put forward a suitable statistical distribution to quickly estimate correct design tide levels. Collecting 12-year observed tide elevation data at Lianyungang Port, 4 kinds of distributions, such as Normal distribution, Log-normal distribution, Traditional maximum entropy distribution, and MMED, are candidate theoretical distributions for frequency analysis. Corresponding estimating approaches are given for the unknown parameters of these distributions. The K-S test and Root Mean Square Error are provided for optimal curve selection.Through statistical calculation and result comparison, the conclusions are given as follows:
(1) TMED is suitable to estimate design high and low tide level for coastal port engineering.
(2) The calculation accuracy by TMED is almost the same as that by MMED.
(3) The histogram of tide duration shows its two peaks, but the probability density function of MMED only has one peak. MMED is not suitable to fit tide duration curve. On the contrary, TMED has a 2-peak probability density function, which can fit tide duration curve very well.
Key words: hourlytidal elevation; design high water; design low water; theoretical distribution; traditional maximum entropy distribution
責(zé)任編輯 龐 旻
Study of Theoretical Curve Type for Design Water Level Estimation Based on Hourly Tide Elevation
CHEN Cheng-Chao, JIAO Chun-Shuo, ZHAI Jin-Jin, DONG Sheng
(College of Engineering, Ocean University of China, Qingdao 266100,China)
U652.3
A
1672-5174(2017)11-117-07
10.16441/j.cnki.hdxb.20170047
陳呈超, 焦春碩, 翟金金, 等. 基于逐時潮位推求設(shè)計水位的統(tǒng)計分布選型研究[J].中國海洋大學(xué)學(xué)報(自然科學(xué)版), 2017, 47(11): 117-123.
CHEN Cheng-Chao, JIAO Chun-Shuo, ZHAI Jin-Jin, et al. Study of theoretical curve type for design water level estimation based on hourly tide elevation[J].Periodical of Ocean University of China, 2017, 47(11): 117-123.
國家自然科學(xué)基金項(xiàng)目(51479183) 資助 Supported by the National Natural Science Foundation of China (51479183)
2017-01-25;修改日期:2017-02-27
陳呈超(1977-),男,博士生。 E-mail: ccc@ouc.edu.cn
** 通訊作者:E-mail: dongsh@ouc.edu.cn