高嘉瞳,王一迪,韓瑞迪
(1.東北電力大學(xué)經(jīng)濟(jì)管理學(xué)院,吉林 吉林 132012;2.南開(kāi)大學(xué)金融學(xué)院,天津 300000)
在決策過(guò)程中,決策信息的搜集和整理工作是整個(gè)過(guò)程的基礎(chǔ),而工作的質(zhì)量好壞會(huì)對(duì)最終決策的質(zhì)量造成影響[1].在最初搜集到信息以后,對(duì)其進(jìn)行進(jìn)一步的整理需要耗費(fèi)大量的時(shí)間和精力,所以在日常工作中,特別是對(duì)數(shù)據(jù)的信息量較大的決策問(wèn)題來(lái)說(shuō),校對(duì)工作則更要求對(duì)人力和費(fèi)用的大量投入,以確保數(shù)據(jù)的真實(shí)可靠,從而得到高質(zhì)量的決策[2-6].在對(duì)數(shù)據(jù)信息進(jìn)行校對(duì)時(shí),假如增加校對(duì)次數(shù),則可以使數(shù)據(jù)更加準(zhǔn)確,同時(shí)也會(huì)提升決策的質(zhì)量,使決策者獲得一定的利益,并且信息整理的費(fèi)用,也會(huì)隨之增多.反之,假如削減校對(duì)的次數(shù),這時(shí)會(huì)伴隨著費(fèi)用的減少,但是決策的質(zhì)量也會(huì)隨之下降,而且,決策的損失也會(huì)因?yàn)殄e(cuò)誤的信息而增多[7-8].本文以考慮到對(duì)錯(cuò)誤數(shù)據(jù)校對(duì)工作給決策帶來(lái)的利益,以及花費(fèi)的費(fèi)用這兩方面因素為前提,將最優(yōu)停止理論作為理論基礎(chǔ),提出了數(shù)據(jù)校對(duì)的最優(yōu)停止次數(shù),并把數(shù)據(jù)信息的校對(duì)問(wèn)題視為隨機(jī)的過(guò)程來(lái)構(gòu)建一個(gè)定量化隨機(jī)模型,有助于決策者在信息搜集整理工作中提出最佳決策.
假設(shè)出現(xiàn)M處錯(cuò)誤在某項(xiàng)決策問(wèn)題所搜集到的數(shù)據(jù)信息里,M是一個(gè)非負(fù)的隨機(jī)變量,M的期望值EM<,即錯(cuò)誤的個(gè)數(shù)不是無(wú)限的.為了使數(shù)據(jù)更加精確,可以采取m次校對(duì)來(lái)尋找和修改數(shù)據(jù)信息里出現(xiàn)的錯(cuò)誤,如果每次找到的錯(cuò)誤都可以修改正確,同時(shí)有助于提高決策的質(zhì)量,那么就可以得到一定的收益,假設(shè)每次找到一個(gè)錯(cuò)誤后修正可以獲取的收益為α,每次校對(duì)需要消耗一些費(fèi)用,假設(shè)第w次校對(duì)工作需要的費(fèi)用為δw(δw>0,w=1,2,3,…).設(shè)經(jīng)過(guò)w次校對(duì)以后,將找出的每個(gè)錯(cuò)誤對(duì)決策造成的損失看作zw(zw>0,w=1,2,3,…).同時(shí)假設(shè),即剩下的每個(gè)錯(cuò)誤在經(jīng)過(guò)w次校對(duì)后所造成的損失為zw,同時(shí)zw里最大的一個(gè)損失小于無(wú)窮大.將zw看作第w次校對(duì)中找出的的之前w-1次沒(méi)找到的數(shù)據(jù)錯(cuò)誤個(gè)數(shù),
以給出M作為前提,通過(guò)x1,x2,x3,…,xw-1次的校對(duì)之后,第w次所找出的數(shù)據(jù)錯(cuò)誤的個(gè)數(shù)xw,服從二項(xiàng)分布的條件概率,即
(xw/x1,x2,x3,…,xw-1)~B(Nw-1,pw),
根據(jù)以上的假設(shè)條件,經(jīng)過(guò)了w次對(duì)決策數(shù)據(jù)信息的校對(duì),可以得到的收益
(1)
設(shè)概率空間(Ω,F(xiàn),P),M是F可測(cè)的.Fm=σ(x1,x2,x3,…,xm),F(xiàn)m?F.假設(shè)對(duì)隨機(jī)變量ψ來(lái)說(shuō),?ψ=m(m=1,2,…)∈Fm,那么稱ψ為停時(shí).
當(dāng)搜集到的信息中的錯(cuò)誤數(shù)據(jù)信息的個(gè)數(shù)M的概率分布,服從參數(shù)為P(λ)的Poisson分布時(shí),設(shè)
pm=p,zw=z<,m=1,2,…,0
令n0=inf{m≥1,(α+z)λp(1-p)m≤Cm+1},對(duì)任意的w≥n0時(shí),
那么σ=m0,σ就是最優(yōu)停時(shí).
即假設(shè)錯(cuò)誤數(shù)據(jù)信息的數(shù)量符合Poisson分布,最優(yōu)的校對(duì)次數(shù)則能夠通過(guò)上式中的σ確定,σ是正整數(shù),則為最佳校對(duì)次數(shù).
于是上述的收益函數(shù)序列(1)式變成
令
通過(guò)得出的結(jié)果可以看出,就錯(cuò)誤信息數(shù)量符合二項(xiàng)分布的問(wèn)題來(lái)說(shuō),能夠通過(guò)σ1唯一確定最佳的校對(duì)次數(shù).
在解決實(shí)際問(wèn)題過(guò)程中,以上給出的數(shù)學(xué)模型約束條件都符合要求,所以此模型擁有一定的實(shí)用價(jià)值.一般來(lái)說(shuō),數(shù)據(jù)信息的總數(shù),在模型中是一定的,隨機(jī)的變量則是錯(cuò)誤數(shù)據(jù)的數(shù)量,因此能夠使用極限逼近法,或者截尾法對(duì)模型的進(jìn)行計(jì)算和求解,使問(wèn)題獲得最佳結(jié)果.具體計(jì)算和操作過(guò)程是:
步驟一:檢驗(yàn)?zāi)P偷募s束條件是否符合要求,并將模型里的錯(cuò)誤數(shù)據(jù)信息的概率分布確定.在解決實(shí)際問(wèn)題過(guò)程中,Poisson分布和二項(xiàng)分布,通常能夠?qū)?wèn)題的情況進(jìn)行較好的描述,所以依據(jù)實(shí)際的問(wèn)題,選擇其中之一對(duì)錯(cuò)誤信息的概率分布進(jìn)行描述,同時(shí)為了更好的解決實(shí)際中的問(wèn)題,也可以采用抽樣的方法,就其分布,進(jìn)行假設(shè)檢驗(yàn).就模型中的約束條件來(lái)說(shuō),錯(cuò)誤的個(gè)數(shù)需要小于無(wú)窮多個(gè),每一次的校對(duì)所消耗的費(fèi)用都會(huì)隨著校對(duì)次數(shù)的增多而遞增,錯(cuò)誤對(duì)決策造成的損失,則需要小于無(wú)窮大,所以,都可以通過(guò)簡(jiǎn)化實(shí)際問(wèn)題而使其獲得滿足.
步驟二:依據(jù)實(shí)際的問(wèn)題,估計(jì)和預(yù)測(cè)模型中的參數(shù).
可以采取抽樣假設(shè)估計(jì)模型里錯(cuò)誤數(shù)據(jù)信息出現(xiàn)的概率,而因校對(duì)對(duì)決策取得的收益,則根據(jù)數(shù)據(jù)的重要程度來(lái)確定.
步驟三:給出起始的錯(cuò)誤校對(duì)次數(shù)m0,迭代計(jì)算的步長(zhǎng)看作z,同時(shí),把它放到收益函數(shù)(1)式中,并計(jì)算出收益值GMo和Gmo+z,如果Gno>Gmo+z,轉(zhuǎn)至步驟四,假設(shè)Gmo 步驟四:使m0=m0+z,轉(zhuǎn)至步驟三. 步驟五:采用后退歸納法進(jìn)行求解,終止計(jì)算. 以考慮到對(duì)錯(cuò)誤數(shù)據(jù)的校對(duì)工作給決策帶來(lái)的利益,以及花費(fèi)的費(fèi)用這兩方面因素為前提,上述模型能夠較好的概括問(wèn)題的本質(zhì),并且發(fā)現(xiàn)最優(yōu)停止時(shí)間,即最優(yōu)的校對(duì)次數(shù),同時(shí)此模型擁有較為廣泛的應(yīng)用領(lǐng)域,其思想能夠用以解決有關(guān)信息加工的其他決策問(wèn)題當(dāng)中去,并且可以將其作為定量化依據(jù),從而做出數(shù)據(jù)信息整理工作的最佳決策.4 結(jié) 論