高 瑩 曹 寧 雒曉東
(1.西京學院 工程技術系,陜西 西安710123;2.西安市政設計研究院有限公司,陜西 西安710000)
總體來說, 貝葉斯理論的發(fā)展經(jīng)歷了以下幾個階段:1736 年Thomas Bayes 提出了重要的貝葉斯定理,1763 年其遺著《論有關機遇問題的求解》被他的朋友Richard Price 整理發(fā)表,貝葉斯理論的價值才被世人認識,貝葉斯理論開始莫基。 隨后,Laplace 等作了進一步的工作,目前以他姓名命名的定理的現(xiàn)代形式實際上歸功于Laplace 。 進入到20 世紀50 年代,貝葉斯理論得到了充分發(fā)展,60、70 年代以來,其發(fā)展達到鼎盛時期。 許多專家學者投身于貝葉斯理論的研究和應用推廣中來,力圖從不同的角度對貝葉斯理論進行進一步的探討和研究,形成了具有多分支的理論系統(tǒng)。
貝葉斯理論系統(tǒng)中的另一個重要分支就是貝葉斯決策理論。貝葉斯決策(Bayesian Decision Theory)就是在不完全情報下,對部分未知的狀態(tài)用主觀概率估計, 然后用貝葉斯公式對發(fā)生概率進行修正,最后再利用期望值和修正概率做出最優(yōu)決策。
貝葉斯統(tǒng)計理論與最優(yōu)決策的結合,首先在商業(yè)和社會科學中得到了很大的成功,其次是在物理、化學、生物等學科領域得到了廣泛的應用,如今其概念和方法在社會許多領域得到了廣泛應用,如在工程技術、管理科學、系統(tǒng)運籌、醫(yī)療診斷等。
貝葉斯決策方法主要包括經(jīng)驗貝葉斯決策、兩階段貝葉斯決策和序貫貝葉斯決策三種方法。
經(jīng)驗貝葉斯決策的主要工具是經(jīng)驗貝葉斯方法, 該方法由VonMises 提出,被Robbins 所廣泛發(fā)展。 其基本思想是在已知狀態(tài)參數(shù)向θ=(θ1,θ2,…,θp)各分量之間結構關系的前提下,使用當前抽樣數(shù)據(jù)及有關歷史數(shù)據(jù)對先驗分布的一些數(shù)字特征進行統(tǒng)計推斷。它在未知θ 是低維還是高維時,處理問題特別有效。 這種方法一般又分為兩種: 一種是假設θ 的先驗分布屬于某一含有未知超參數(shù)的分布族,通過利用觀測數(shù)據(jù)來估計其中的未知參數(shù),這種方法稱為參數(shù)經(jīng)驗貝葉斯方法,簡稱PEB 方法。
兩階段貝葉斯決策是以先驗兩階段確定理論為基礎的。 在第一階段,記π1(θ |λ)為參數(shù)的未知先驗分布,其中λ 為一超參數(shù),這兒我們不直接對參數(shù)兄作估計, 而是代之以元有第二階段的先驗分布π2(λ),它可以是一個合適的正常先驗, 但常常是選擇一個合適的無信息先驗。類似于經(jīng)驗貝葉斯決策,這種方法也可以分為“可交換”和“一般意義下的”兩種情況。
序貫決策是一種多級決策的方法。 該決策過程是序貫進行的,類似于序貫概率比檢驗。它是在每次試驗(或抽樣觀測)之后,進行一次統(tǒng)計推斷,看能否決定采取某種行動,若能,則做出決策,否則,則再進行一次試驗。因此,序貫決策的目的是在試驗次數(shù)隨機的情況下,盡可能利用較小的樣本進行統(tǒng)計推斷。序貫貝葉斯決策根據(jù)不同情況又分為三種:(1)最佳固定容量的序貫貝葉斯決策;(2)序貫貝葉斯因子檢驗法;(3)決策樹法。 決策樹用一些標記符號表示決策者所能采取的各種行動路徑,通過樹枝狀展開,并利用概率表達其中的可能狀態(tài),經(jīng)運算得知采取每種行動路徑后能夠獲得的期望值。
貝葉斯方法屬于風險性決策方法,決策者雖不能控制客觀因素的變化,但卻掌握其變化的可能狀況及各種狀況的分布概率,并利用期望值即未來可能出現(xiàn)的平均狀況作為決策準則。不確定性是生活中的常態(tài),貝葉斯方法不是使決策問題完全無風險,而是通過其他途徑增加信息量使決策中的風險減小。關于貝葉斯理論與方法的研究以深入到各個方面。
在許多復雜情況下.貝葉斯統(tǒng)計方法比經(jīng)典數(shù)理統(tǒng)計方法能更直接解決問題.且可有效整合部分先驗信息.但其需要高強度計算的特性曾限制了其廣泛應用近幾十年來.隨著高速計算機的發(fā)展以及MCMC算法的不斷提出.貝葉斯方法已被用于群體遺傳學、分子進化、連鎖作圖和數(shù)量遺傳學等研究領域.已有許多學者研究了數(shù)量遺傳學中QTL作圖的貝葉斯方法從簡單到復雜的。
貝葉斯網(wǎng)絡在經(jīng)濟和醫(yī)學等領域越來越多的應用日益顯示出其發(fā)展前途,這些應用通過正在建成許多應用模型用于預測石油和股票價格、控制太空飛船和診斷疾病等等不斷地滲人我們的社會和經(jīng)濟生活中。 除此之外貝葉斯網(wǎng)絡還被應用于信息恢復診斷與故障檢測、工業(yè)方面、電訊通信業(yè)、交通管理、文化教育和國防系統(tǒng)等各個領域。 在解決許多實際問題中,我們可以使用貝葉斯網(wǎng)絡這樣的概率推理技術從不完全的、不精確的或不確定的知識和信息中做出推理。
隨著互聯(lián)網(wǎng)絡的發(fā)展, 垃圾郵件越來越多地充斥著人們的郵箱,部分學者開始研究現(xiàn)在反垃圾郵件的技術,研究了用來評價垃圾郵件分類方法的語料庫和評價體系,著重對貝葉斯理論和貝葉斯參數(shù)估計理論進行研究,并取得以下的研究成果:(1)在貝葉斯分類器的工作原理基礎上,設計了基于樸素貝葉斯反垃圾郵件模型;(2)在貝葉斯分類器的工作原理基礎上,提出一種新的郵件分類方法——貝葉斯參數(shù)估計郵件分類,設計實現(xiàn)了基于貝葉斯參數(shù)估計的反垃圾郵件模型;(3)通過對以上兩種方法進行郵件過濾實驗比較,證明在郵件分類中基于貝葉斯參數(shù)估計分類方法比樸素貝葉斯分類方法具有更高的召回率、正確率和F 值?;谪惾~斯參數(shù)估計的郵件分類算法為解決目前困擾人們的垃圾郵件問題提供了一種新的解決方法和途徑。
水文過程的發(fā)生與發(fā)展取決于氣象因素和地理因素,是一個復雜的動態(tài)過程;水文模型接受水文、氣象等多種輸入,運用了許多水文模型與參數(shù),依賴于對輸入、輸出信息進行解釋的專家們的判斷,這些復雜的因素導致了水文預報必然存在不確定性。水文模型不確定性是水文預報不確定性的重要來源之一,該不確定性始終存在并制約著防洪決策的正確性。 水文學家很早就認識到了這一問題,并試圖通過多方面的努力來消除或減少該不確定性。
貝葉斯概率水文預報突破了常規(guī)確定性水文模型在信息利用方面的局限性。 經(jīng)美國國家氣象局的實際應用表明:不管水文預報的不確定性有多大,總可以保證從概率水文預報中獲得正的經(jīng)濟效益。 概率水文預報是水文預報發(fā)展的必然趨勢,作為預報決策系統(tǒng)的重要組成部分,必將引起國內外水文界的興趣和關注。
從1736 年出現(xiàn)貝葉斯理論至今, 貝葉斯理論已經(jīng)發(fā)展的較為成熟并被廣泛應用于各個領域。雖然貝葉斯理論在某些領域的研究中還存在一些局限性和風險性,但是人們越來越感受到貝葉斯理論和方法的重要性。
[1]岳超源.決策理論與方法[M].北京:科學出版社,2005.
[2]徐澤水.不確定多屬性決策方法與應用[M].北京:清華大學出版社,2006.
[3]施錫銓,范正綺.決策與模型[M].上海:上海財經(jīng)大學出版社,2003.
[4]簡禎富.決策分析與管理[M].北京:清華大學出版社,2007.
[5]蘇巖.貝葉斯統(tǒng)計的發(fā)展及其爭鳴[J].保定師范??茖W校學報,2003(02)
[6]陳文強, 李小蕊, 史朋飛.基于貝葉斯決策的先驗分布的選取方法[J].經(jīng)濟研究導刊,2009(04).