馬婷婷,闕澤勝
(廣東省核工業(yè)地質(zhì)局輻射環(huán)境監(jiān)測(cè)中心, 廣州, 510800)
在土壤氡背景值和異常閾值確定過程中,樣本總體服從正態(tài)分布時(shí),傳統(tǒng)方法在篩選“清潔”土壤樣品時(shí)具有較高效率。由于人為活動(dòng)和自然環(huán)境影響,地球化學(xué)數(shù)據(jù)并非服從完美的正態(tài)分布,一定程度上影響傳統(tǒng)統(tǒng)計(jì)方法剔除異常閾值的效果。因此,部分學(xué)者探索了更為穩(wěn)健的方法。
穩(wěn)健的統(tǒng)計(jì)方法是否對(duì)不同調(diào)查尺度樣本均有較好耐抗性,目前文獻(xiàn)鮮有報(bào)道。為驗(yàn)證穩(wěn)健統(tǒng)計(jì)方法在測(cè)算土壤氡背景值和異常閾值的可靠性,本文在已有研究基礎(chǔ)上[1-4],結(jié)合地理信息系統(tǒng)理論,將地理要素抽象為點(diǎn)、線、面3種尺度,即進(jìn)一步考慮了特點(diǎn)區(qū)域型(近似點(diǎn)型)、線型和區(qū)域型(面型)3種尺度,對(duì)研究區(qū)域調(diào)查空間進(jìn)行細(xì)分。應(yīng)用傳統(tǒng)統(tǒng)計(jì)法[5]、分布形式檢驗(yàn)法[6]、探索性數(shù)據(jù)分析(EDA)法[7]和中位數(shù)絕對(duì)離差(MAD)法[8]等4種方法,對(duì)不同調(diào)查尺度對(duì)象的土壤氡濃度的背景值和異常閾值分別測(cè)算,并對(duì)測(cè)算方法進(jìn)行了穩(wěn)健性分析,最后計(jì)算得到研究區(qū)域土壤氡濃度背景值和異常閾值水平。
研究區(qū)域位于廣東省東部某城市。地形呈“西邊高東邊低”,地貌以平原和丘陵為主。氣候以亞熱帶季風(fēng)氣候、亞熱帶海洋氣候?yàn)橹鲗?dǎo)。研究區(qū)域地質(zhì)構(gòu)造復(fù)雜,地下河網(wǎng)密布。地下水的補(bǔ)給、徑流、排泄主要受降雨、地形地貌、巖性條件、地質(zhì)構(gòu)造等條件的控制,降雨是地下水的主要補(bǔ)給來源。
數(shù)據(jù)來源于廣東省《2021年度省地質(zhì)勘查與城市地質(zhì)專項(xiàng)項(xiàng)目》“某城市區(qū)域放射性地質(zhì)調(diào)查”項(xiàng)目課題的土壤氡成果數(shù)據(jù)[9]。使用的測(cè)氡儀型號(hào)為FD-3017RaA,根據(jù)《氡及其子體測(cè)量規(guī)范》[10]要求采集數(shù)據(jù)信息。測(cè)氡儀通過了“三性(即重復(fù)性、穩(wěn)定性和一致性)”檢測(cè)和儀器標(biāo)定?,F(xiàn)場(chǎng)抽取地表下80 cm處氡氣,高壓設(shè)置為2 min,觀測(cè)時(shí)間為2 min。
土壤氡調(diào)查編號(hào)1~37為區(qū)域型尺度調(diào)查點(diǎn),定義為全區(qū)地質(zhì)體(簡(jiǎn)稱為QQDZT)。土壤氡調(diào)查編號(hào)78~86為點(diǎn)狀型尺度調(diào)查點(diǎn),定義為秋長(zhǎng)空地(簡(jiǎn)稱為QCKD)。選取兩條典型地質(zhì)剖面作為線型尺度,即秋長(zhǎng)構(gòu)造(簡(jiǎn)稱QCGZ),測(cè)點(diǎn)編號(hào)為38~59號(hào);沙田構(gòu)造(簡(jiǎn)稱STGZ),測(cè)點(diǎn)編號(hào)為60~77號(hào))。
研究區(qū)域土壤氡測(cè)量布點(diǎn)如圖1所示。
圖1 研究區(qū)域土壤氡測(cè)量布點(diǎn)圖
傳統(tǒng)統(tǒng)計(jì)法進(jìn)行數(shù)據(jù)處理時(shí),通常以區(qū)域氡濃度的幾何平均值作為背景值,以“均值+2倍標(biāo)準(zhǔn)差”確定氡異常閾值[5]。
分布形式檢驗(yàn)法是通過剔除離群值(一般用算術(shù)平均值±2或3倍標(biāo)準(zhǔn)差)后,使數(shù)據(jù)服從正態(tài)或?qū)?shù)正態(tài)分布。然后將服從正態(tài)或?qū)?shù)正態(tài)分布的樣本數(shù)據(jù),求取算術(shù)平均值作為背景值,算術(shù)平均值±2或3倍標(biāo)準(zhǔn)差作為異常閾值[6]。
分布形式檢驗(yàn)法剔除的數(shù)據(jù)可能隱含重要的信息,不能客觀描述實(shí)際數(shù)據(jù)所隱含的真實(shí)狀況[11]。針對(duì)上述情況,文獻(xiàn)[3]中采用更為穩(wěn)健的統(tǒng)計(jì)分析技術(shù)來計(jì)算異常閾值,包括探索性數(shù)據(jù)分析(EDA)法[7]和中位數(shù)絕對(duì)離差(MAD)法[8]。
(1) 探索性數(shù)據(jù)分析(EDA)法
先求出樣本的中位數(shù),利用中位數(shù)將數(shù)據(jù)分為兩組,最小值到中位數(shù)的一組數(shù)據(jù)為 LH,最大值到中位數(shù)的另一組數(shù)據(jù)為UH,再分別求取兩組數(shù)據(jù)的中位數(shù)XLH和XUH。XLH和XUH之差的絕對(duì)值就是四分位數(shù)間距YIQR[1-2]。通過式(1)、式(2)計(jì)算XLIF和XUIF:
XLIF=XLH-1.5YIQR
(1)
XUIF=XUH+1.5YIQR
(2)
落在XLIF和XUIF的數(shù)據(jù)之外的數(shù)據(jù),即為異常數(shù)據(jù) ,以四分位數(shù)間距作為背景值。
(2) 中位數(shù)絕對(duì)離差(MAD)法
首先求出中位數(shù)XMe,再將中位數(shù)與每一項(xiàng)濃度值做差并求出絕對(duì)值,然后對(duì)求得的絕對(duì)值再求中位數(shù)XMAD[12]:
(3)
XMAD=Median|Xi-XMe|
(4)
異常閾值為第一次求得的原數(shù)據(jù)的中位數(shù)XMe與2倍XMAD之和。首次計(jì)算的中位數(shù),與每一項(xiàng)濃度值做差并求出絕對(duì)值,用求得的絕對(duì)值的算術(shù)平均值作為背景值。
應(yīng)用SPSS 16.0軟件,選擇Analyze模塊下的Descriptive Statistics 工具集里的Explore工具,進(jìn)行土壤氡樣本的統(tǒng)計(jì)分析,結(jié)果列于表1。
表1 土壤氡濃度樣本統(tǒng)計(jì)結(jié)果
由表1可見:QQDZT和QCGZ土壤氡濃度值的峰度和偏度均大于1,樣本不服從近似正態(tài)分布;STGZ和QCKD的土壤氡濃度值的峰度和偏度均小于1,樣本服從近似正態(tài)分布。全區(qū)域土壤氡濃度值的峰度和偏度均大于1,樣本不服從近似正態(tài)分布;經(jīng)對(duì)數(shù)轉(zhuǎn)換后,峰度為-0.105,偏度為-0.673,樣本服從近似對(duì)數(shù)正態(tài)分布。
(1) 傳統(tǒng)方法。剔除異常閾值后計(jì)算平均值和標(biāo)準(zhǔn)差:QCDZT土壤氡測(cè)量值平均值為3 794 Bq/m3,標(biāo)準(zhǔn)差為4 024 Bq/m3;QCGZ土壤氡測(cè)量值平均值為5 975 Bq/m3,標(biāo)準(zhǔn)差為3 288 Bq/m3;STGZ土壤氡測(cè)量值平均值為26 469 Bq/m3,標(biāo)準(zhǔn)差為20 535 Bq/m3;QCKD土壤氡測(cè)量值平均值為4 656 Bq/m3、標(biāo)準(zhǔn)差為2 460 Bq/m3,全區(qū)土壤氡測(cè)量值平均值為9 484 Bq/m3,標(biāo)準(zhǔn)差為13 645 Bq/m3。剔除異常閾值后,算術(shù)平均值為背景值,“均值+2倍標(biāo)準(zhǔn)差”為異常閾值。
(2) 分布形式檢驗(yàn)法。STGZ、QCKD樣本服從近似正態(tài)分布,算術(shù)平均值為背景值,“均值+2倍標(biāo)準(zhǔn)差”為異常閾值;QQDZT、QCGZ、全區(qū)域樣本不服從正態(tài)或近似正態(tài)分布,取對(duì)數(shù)結(jié)果服從近似正態(tài)分布,用對(duì)數(shù)變換結(jié)果按上述方法計(jì)算背景值和異常閾值。
(3) EDA和MAD法。根據(jù)式(1)、式(2)、式(3)、式(4)計(jì)算背景值和異常閾值。
4種方法計(jì)算得到的研究區(qū)域土壤氡樣本背景值和異常閾值列于表2。
表2 不同方法計(jì)算的研究區(qū)域土壤氡樣本背景值和異常閾值結(jié)果(Bq·m-3)
由表2可見,傳統(tǒng)統(tǒng)計(jì)法、分布形式檢驗(yàn)法、EDA法和MAD法在計(jì)算不同尺度的土壤氡背景值和異常閾值時(shí),結(jié)果差異較大。對(duì)特定區(qū)域型的QCKD,土壤氡背景值傳統(tǒng)統(tǒng)計(jì)法、分布形式檢驗(yàn)法和MAD法計(jì)算結(jié)果基本一致,EDA法的結(jié)果較低;異常閾值傳統(tǒng)統(tǒng)計(jì)法、分布形式檢驗(yàn)法和EDA法計(jì)算結(jié)果基本一致,略高于MAD法。對(duì)線型的QCGZ和STGZ地質(zhì)構(gòu)造,土壤氡背景值4種方法計(jì)算結(jié)果基本一致;異常閾值MAD法較穩(wěn)定,其他3種方法波動(dòng)較大。對(duì)區(qū)域型的QQDZT,土壤氡背景值4種方法計(jì)算結(jié)果差異較大。對(duì)全研究區(qū)域,土壤氡背景值傳統(tǒng)統(tǒng)計(jì)法、EDA法和MAD法計(jì)算結(jié)果基本一致,分布形式檢驗(yàn)法計(jì)算結(jié)果偏低;異常閾值傳統(tǒng)統(tǒng)計(jì)法>EAD法>MAD法>分布形式檢驗(yàn)法。
為分析4種方法在不同調(diào)查尺度區(qū)域的土壤氡背景值和異常閾值的計(jì)算穩(wěn)健性,對(duì)各調(diào)查對(duì)象,將4種方法計(jì)算的背景值和異常閾值結(jié)果進(jìn)行排序,排序結(jié)果列于表3。
表3 不同方法計(jì)算的研究區(qū)域土壤氡樣本背景值和異常閾值排序結(jié)果
統(tǒng)計(jì)所有調(diào)查對(duì)象排序出現(xiàn)的次數(shù),定義為位序頻數(shù),結(jié)果列于表4。
表4 不同測(cè)算方法的土壤氡位序頻數(shù)統(tǒng)計(jì)表
計(jì)算方法穩(wěn)健性評(píng)價(jià)標(biāo)準(zhǔn)為:
(1) 背景值和異常閾值值對(duì)應(yīng)中間排名的位序頻數(shù)概率越大,計(jì)算方法越穩(wěn)健且計(jì)算結(jié)果越保守;
(2) 背景值和異常閾值對(duì)應(yīng)名次靠前的位序頻數(shù)概率越大,方法越激進(jìn)且計(jì)算結(jié)果偏大;
(3) 背景值對(duì)應(yīng)名次靠前、異常閾值對(duì)應(yīng)名次靠后,或者背景值對(duì)應(yīng)名次靠后、異常閾值對(duì)應(yīng)名次靠前的位序頻數(shù)概率越大,方法越不穩(wěn)健且計(jì)算結(jié)果不確定;
(4) 背景值和異常閾值對(duì)應(yīng)靠后排名的位序頻數(shù)概率越大,方法穩(wěn)健且測(cè)算結(jié)果偏低;
(5) 背景值或異常閾值對(duì)應(yīng)多個(gè)名次的位序頻數(shù)概率越大,方法越不穩(wěn)健且結(jié)果不確定。
由表3、表4可見:
(1) 用傳統(tǒng)統(tǒng)計(jì)法計(jì)算的5個(gè)調(diào)查對(duì)象土壤氡背景值第1名出現(xiàn)3次,異常閾值第1名出現(xiàn)2次,兩者合計(jì)第1名5次,說明傳統(tǒng)統(tǒng)計(jì)方法計(jì)算的土壤氡背景值和異常閾值結(jié)果均趨于偏大,計(jì)算方法不穩(wěn)健。
(2) 用分布形式檢驗(yàn)法計(jì)算的5個(gè)調(diào)查對(duì)象土壤氡背景值第1名出現(xiàn)2次,異常閾值第4名(D)出現(xiàn)3次,兩者合計(jì)第4名4次、第1名3次,說明分布形式檢驗(yàn)法計(jì)算的土壤氡背景值趨于高值,異常閾值趨于低值,兩者不同步,計(jì)算方法不穩(wěn)健。
(3) 用EDA方法計(jì)算的5個(gè)調(diào)查對(duì)象土壤氡背景值第1名和第2名均出現(xiàn)2次,異常閾值第1名出現(xiàn)3次,兩者合計(jì)第1名5次,說明EDA方法計(jì)算的土壤氡背景值不穩(wěn)定,異常閾值趨于低值,計(jì)算方法不穩(wěn)健。
(4) 用MAD方法計(jì)算的5個(gè)調(diào)查對(duì)象土壤氡背景值和異常閾值第3名各出現(xiàn)3次,兩者合計(jì)第3名6次,說明EDA方法計(jì)算的土壤氡背景值和異常閾值結(jié)果趨于較保守,計(jì)算方法穩(wěn)健。
綜上分析,MAD法在計(jì)算不同調(diào)查尺度對(duì)象的背景值和異常閾值時(shí)穩(wěn)健性較高。因此,選用MAD法計(jì)算研究區(qū)域土壤氡背景值和異常閾值,結(jié)果見表2所列。
城市放射性地質(zhì)調(diào)查是城市地質(zhì)調(diào)查的重要組成部分,城市土壤氡濃度是城市放射性地質(zhì)調(diào)查的重要內(nèi)容。本文從特定區(qū)域型(點(diǎn)型)、線型和區(qū)域型(面型)3種調(diào)查尺度,應(yīng)用傳統(tǒng)統(tǒng)計(jì)法、分布形式檢驗(yàn)法、EDA法和MAD法等4種方法進(jìn)行了土壤氡濃度背景值和異常閾值計(jì)算。應(yīng)用位序頻數(shù)檢驗(yàn)法對(duì)4種方法的穩(wěn)健性進(jìn)行了檢驗(yàn),檢驗(yàn)結(jié)果表明MAD法在計(jì)算不同調(diào)查尺度對(duì)象的背景值和異常閾值時(shí)有較好的穩(wěn)健性。
應(yīng)用MAD法,計(jì)算出區(qū)域型調(diào)查尺度對(duì)象QQDZT的土壤氡背景值和異常閾值分別為1 339、4 469 Bq/m3;線型調(diào)查尺度對(duì)象QCGZ的土壤氡背景值和異常閾值分別為5 975、13 616 Bq/m3;STGZ的土壤氡背景值和異常閾值分別為21 875、56 280 Bq/m3;特定區(qū)域型調(diào)查對(duì)象QCKD的土壤氡背景值和異常閾值分別為4 656、9 422 Bq/m3;不分調(diào)查尺度的全研究區(qū)域土壤氡背景值和異常閾值分別為9 132、13 497 Bq/m3。