黃圣杰
(廣西師范大學(xué) 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,廣西 桂林 541004)
雙參數(shù)指數(shù)分布廣泛應(yīng)用于農(nóng)業(yè)、醫(yī)學(xué)、保險(xiǎn)等領(lǐng)域.例如,在可靠性領(lǐng)域,其可作為壽命函數(shù);在保險(xiǎn)領(lǐng)域,其可作為損失函數(shù),用于健康壽命,災(zāi)情防范,車輛賠付等險(xiǎn)種.在假設(shè)檢驗(yàn)中,大多學(xué)者較為關(guān)注的是第一類錯(cuò)誤,然而在金融保險(xiǎn)等方面,第二類錯(cuò)誤所帶來(lái)的損失往往會(huì)明顯高于第一類.因此,在樣本容量不確定情況下,如何有效地同時(shí)控制雙參數(shù)假設(shè)檢驗(yàn)中犯兩類錯(cuò)誤的概率相當(dāng)重要.雖然,隨著樣本量的增加,兩類錯(cuò)誤都將減小.然而,樣本容量又直接影響著檢驗(yàn)結(jié)果的精確度以及實(shí)際抽樣的成本和效率,因此盲目地通過(guò)增加樣本量來(lái)控制兩類錯(cuò)誤,將大大提高檢驗(yàn)成本.文獻(xiàn)[1]探究了正態(tài)分布下兩類錯(cuò)誤和樣本容量之間的數(shù)量關(guān)系;文獻(xiàn)[2]基于上述結(jié)論探究了正態(tài)分布下均值和方差在假設(shè)檢驗(yàn)中樣本量的確定.文獻(xiàn)[3]探究了雙參數(shù)分布中門限參數(shù)和尺度參數(shù)的分布性質(zhì);文章基于上述研究以及國(guó)內(nèi)外相關(guān)研究現(xiàn)狀,在雙參數(shù)的假設(shè)檢驗(yàn)中,構(gòu)造合理統(tǒng)計(jì)量,證明其分布性質(zhì),確定了樣本容量和兩類錯(cuò)誤之間的數(shù)量關(guān)系,并對(duì)其進(jìn)行數(shù)值模擬,論證結(jié)論.
雙參數(shù)指數(shù)分布的分布函數(shù)為:
記為Exp(μ,θ),其中μ,θ分別稱為門限參數(shù)和尺度參數(shù),且有μ≥0,θ>0.
定理1 設(shè)想X1,X2,…,X n是來(lái)自總體Exp(μ,θ)的簡(jiǎn)單隨機(jī)樣本,X(1),X(2),…,X(n)為該樣本的次序統(tǒng)計(jì)量,則有
證明:根據(jù)次序統(tǒng)計(jì)量的性質(zhì)可知:X(1)的概率密度函數(shù)為
又Ga(α,λ)的概率密度函數(shù)為
顯然
樣本似然函數(shù)為:
可以得到(μ,θ)的MLE為:
結(jié)合定理1,根據(jù)Gamma函數(shù)和χ2函數(shù)之間的關(guān)系可以得到以下結(jié)論:
在假設(shè)檢驗(yàn)中,觀察值是否落在拒絕域內(nèi)將直接影響著原假設(shè)H0或備擇假設(shè)H1的成立.然而,在H0成立的條件下,由于樣本的隨機(jī)性,觀測(cè)值也可能會(huì)落在拒絕域內(nèi),從而做出H0不成立的誤判,即所謂的犯“第一類錯(cuò)誤”,記發(fā)生概率為α;同理,在備擇假設(shè)H1成立的條件下,觀測(cè)值亦有可能未落在拒絕域內(nèi),導(dǎo)致犯“第二類錯(cuò)誤”,記發(fā)生概率為β.當(dāng)選擇統(tǒng)計(jì)量的統(tǒng)計(jì)量服從卡方分布時(shí),可以用圖1來(lái)解釋兩類錯(cuò)誤的原理:
圖1 兩類錯(cuò)誤原理Fig.1 Theory of two types of errors
設(shè)X1,X2,…,X n是來(lái)自總體Exp(μ,θ)的簡(jiǎn)單隨機(jī)樣本 ,針對(duì)如下檢驗(yàn):
.數(shù)真值為μ真,則有(2)成立.
因此
為方便起見,記△=|μ真-μ0|,則樣本容量為:
注:事實(shí)上,μ真是一個(gè)未知數(shù)(若已知,那么假設(shè)檢驗(yàn)也就沒(méi)有意義了),但我們可以將其看作一個(gè)“理想的值”,而△則正反映了“理想值”與“現(xiàn)實(shí)值”的偏差.因此在最大偏差的條件下,我們不妨將其作為△的取值.事實(shí)上,當(dāng)△>|μ0-μ真|的時(shí)候,第二類錯(cuò)誤也就顯得沒(méi)有意義了.
設(shè)X1,X2,…,X n是來(lái)自總體Exp(μ,θ)的簡(jiǎn)單隨機(jī)樣本 ,針對(duì)如下檢驗(yàn):
同樣地,H1成立時(shí)并不服從卡方分布.不妨設(shè)真值為θ真,則有成立.
因此,
當(dāng)n充分大時(shí),根據(jù)中心極限定理可知,故
構(gòu)建密度函數(shù),利用軟件R生成10000個(gè)服從總體分布為Exp(2,4)的隨機(jī)數(shù)列.計(jì)算在最大偏差值為10% 情況下,α為0.08,β為0.05;α為0.05,β為0.05;以及在最大偏差值為6%情況下,α為0.05,β為0.02時(shí)檢驗(yàn)所需的樣本容量.其結(jié)果如表1所示:
表1 10%,6%偏差時(shí)檢驗(yàn)所需樣本容量Tab.1 The Determination of Sample Size with deviation in 10%and 6%
在總體服從雙參數(shù)指數(shù)分布的假設(shè)檢驗(yàn)中,本文構(gòu)造了合適的統(tǒng)計(jì)量,并證明其服從卡方分布.利用卡方分布的性質(zhì)以及兩類錯(cuò)誤的定義,計(jì)算得到了在同時(shí)控制兩類錯(cuò)誤下時(shí)所需的樣本容量.從某種意義上講,在尋找到合適的統(tǒng)計(jì)量后,該方法同樣適用其他分布以及多總體下分布的假設(shè)檢驗(yàn)的樣本容量確定.然而,在實(shí)際應(yīng)用中,除了考慮理論上的精度指標(biāo)之外,還應(yīng)結(jié)合勞動(dòng)成本,科學(xué)性,實(shí)踐性等情況,從多方面協(xié)調(diào)出發(fā),得到最優(yōu)樣本容量.
廣西民族大學(xué)學(xué)報(bào)(自然科學(xué)版)2019年3期