• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      逐步貝葉斯判別分析中的變量優(yōu)化方法研究

      2014-09-12 11:17:14胡建鵬陳強黃容
      計算機工程與應(yīng)用 2014年21期
      關(guān)鍵詞:判別函數(shù)貝葉斯總體

      胡建鵬,陳強,黃容

      上海工程技術(shù)大學(xué)電子電氣工程學(xué)院,上海 201620

      逐步貝葉斯判別分析中的變量優(yōu)化方法研究

      胡建鵬,陳強,黃容

      上海工程技術(shù)大學(xué)電子電氣工程學(xué)院,上海 201620

      判別分析中特征變量是影響判別結(jié)果的決定性因素,選取適當(dāng)?shù)奶卣髯兞拷M合可以提高正判率、減少計算量。介紹了貝葉斯判別和逐步判別法的基本原理,分析了目前出現(xiàn)的一些特征變量優(yōu)化方法,以油氣解釋評價中的貝葉斯判別應(yīng)用為例,對于逐步貝葉斯判別中的變量優(yōu)化方法進行了研究和總結(jié),提出了變量的多步優(yōu)化策略和分步多模型優(yōu)化策略,包含了從變量范圍選擇、數(shù)據(jù)預(yù)處理、特征變量提取到初步篩選和逐步判別的完整過程,使得正判率不斷優(yōu)化,最終得到了較為滿意的判別結(jié)果。

      貝葉斯判別;逐步判別;變量優(yōu)化;判別因子;氣測錄井

      1 引言

      貝葉斯(Bayes)判別是經(jīng)典的判別分析方法,既考慮到各個總體出現(xiàn)的先驗概率,又考慮到錯判造成的損失,這是相較于其他判別方法的優(yōu)點所在,其判別效果比較理想,應(yīng)用也非常廣泛,尤其是在地質(zhì)和勘探領(lǐng)域[1-4]。判別分析是要根據(jù)不同類別所提取的特征變量來建立待判樣品歸屬于哪個已知總體的數(shù)學(xué)模型,要對待判樣品做出正確的歸類,首先要獲取樣本總體及待判樣品的特征變量,然后對總體及待判樣品事物的特性進行變量指標(biāo)的描述,進而判別待判樣品的歸屬。由此可知,特征變量的優(yōu)化是判別分析中的一個重要問題,是判別效果優(yōu)劣的關(guān)鍵,例如在某個判別問題中,如果將其中主要的指標(biāo)忽略了,由此建立的判別函數(shù)其效果一定不好;另外在判別分析中,不是特征變量越多越好,較多的變量個數(shù)增大了建立判別函數(shù)需要的計算量,同時,因為特征變量之間的不獨立性及判別方程組的階數(shù)太高,可能導(dǎo)致計算精度下降,甚至出現(xiàn)病態(tài)[5],在排除了變量之間的相關(guān)性之后選擇適當(dāng)?shù)淖兞總€數(shù)是較好的解決方案。因此要獲得理想的判別效果,判別變量的選取和優(yōu)化就顯得非常重要。

      在判別分析的特征變量優(yōu)化問題上,連承波等[2]利用R型因子分析對特征變量進行降維分析,在參數(shù)大部分信息不丟失的情況下,對11個氣測參數(shù)優(yōu)化組合降維,提取了4個氣測解釋綜合參數(shù),然后利用加權(quán)灰色關(guān)聯(lián)分析方法進行儲層含油氣性識別,得到了較高的正判率,該方法R型因子分析模型的精確度對于標(biāo)準(zhǔn)模型庫的代表性要求較高,對最終正判率的影響較大。劉宏杰等[6]利用一種基于粗糙集屬性約簡的方法對特征變量進行優(yōu)化選擇,充分利用粗糙集屬性約簡不需要屬性分布的先驗信息這一特點,再使用貝葉斯判別法來進行油氣儲層預(yù)測,正確率較高,該方法使用了很少的樣本進行屬性約簡,對于樣本的挑選就顯得很重要,在連續(xù)屬性離散化時,臨界值的確定也非常關(guān)鍵,少量樣本的代表性和臨界值的精確度決定了模型的正判率。武曉巖等[7]應(yīng)用隨機森林逐步判別方法,對三類癌癥的基因表達(dá)數(shù)據(jù)進行變量篩選,建立隨機森林模型,僅用較少數(shù)目的基因就可以實現(xiàn)它們的判別分類,這種方法對于成千上萬個基因作為特征變量的判別問題十分有效,計算時間也較長。相較于以上所提及的較新的特征變量優(yōu)化方法,傳統(tǒng)的逐步判別法的應(yīng)用還是最廣泛,同時也是最成熟的[8-11],而同樣是進行基因微陣列數(shù)據(jù)的降維,荀鵬程[12]等使用的三步降維策略來進行判別分析,進一步提高了降維效率和正判率,其中第三步就是使用的逐步判別法。逐步判別分析是一種能自動剔除變量,挑出必要的、較好的指標(biāo)建立判別函數(shù)的方法,有利于判別結(jié)果的穩(wěn)定性和提高判別能力[11];但是如果不加判斷盲目使用此方法或者不聯(lián)系相關(guān)領(lǐng)域知識將問題看作純粹的數(shù)學(xué)問題的話都可能會使判別結(jié)果不夠理想,甚至出現(xiàn)難以解釋的出乎意料的結(jié)果。本文總結(jié)了逐步貝葉斯判別法中變量優(yōu)化的要點,并引入相關(guān)文獻的降維思想,提出多步和分步實施的策略,使得變量優(yōu)化的效果更加明顯。

      2 貝葉斯判別的原理和應(yīng)用

      2.1 基本原理

      貝葉斯判別分析[13]是根據(jù)已掌握的每個類別的若干樣本的數(shù)據(jù)信息,總結(jié)出客觀事物分類的規(guī)律性建立判別函數(shù),然后,根據(jù)總結(jié)的判別函數(shù),就能夠判別新樣本函數(shù)所屬類別,對于一個待判樣品(x1,x2,…,xp),判別它屬于已知m組中何組的方法,是計算樣品屬于其中某一組的條件概率P(l|X)(l=1,2,…,m),比較這m個概率的大小,將該樣品歸入概率最大的一組。設(shè)有總體Gi(i=1,2,…,m),Gi具有概率密度函數(shù)fi(x)。并且根據(jù)以往的統(tǒng)計分析,知道Gi出現(xiàn)的概率為qi。即當(dāng)樣本x0發(fā)生時,求它屬于某一類的概率。判別規(guī)則:若

      則x0判給Gl。在正態(tài)的假定下,fi(x)為正態(tài)分布的概率密度。當(dāng)Gi~Nm(μi,Σi)時有:假設(shè)k個總體的協(xié)方差陣相同,判別函數(shù)可化簡為:

      2.2 貝葉斯判別應(yīng)用于油氣解釋評價

      貝葉斯判別在石油和天然氣勘探領(lǐng)域的應(yīng)用十分活躍,尤其是在儲層流體性質(zhì)識別和預(yù)測的問題上,這是錄井解釋評價的核心,傳統(tǒng)錄井現(xiàn)場油氣評價技術(shù)中多采用人工經(jīng)驗和圖版、圖表分析法。錄井解釋的途徑有很多,氣測、地化、核磁、定量熒光、X射線熒光(XRF)以及綜合錄井分析等方法可以獲取很多原始測量數(shù)據(jù),能提取的特征變量可以達(dá)到上百個,這些變量可以按照獲取途經(jīng)的不同分別進行解釋評價,也可以聯(lián)合起來進行綜合分析,以氣測解釋為例,根據(jù)文獻[1,10]的經(jīng)驗,選擇采用全烴含量TC、全烴背景值Cb、甲烷C1、乙烷C2、丙烷C3、異丁烷iC4、正丁烷nC4這些原始數(shù)據(jù)直接應(yīng)用到貝葉斯判別法中,對湖北江陵探區(qū)一批錄井?dāng)?shù)據(jù)進行判別,原始數(shù)據(jù)如表1所示。

      表1 樣本原始測量數(shù)據(jù)1)

      將30個樣本分為油(氣)層、含烴水層和干層3類總體(各10個樣本),通過訓(xùn)練后求出判別函數(shù),將樣本數(shù)據(jù)回代到判別模型中,得到的綜合正判率只有63.3%,只有水層的正判率達(dá)到了90%,另外兩類總體的正判率都只有50%,這樣的判別效果肯定是不能接受的,究其原因,是因為地質(zhì)條件的不同會導(dǎo)致儲層含油氣性類型對應(yīng)氣測指標(biāo)分布特征的差異,如果直接使用其他地方的判別模型或選取類似的特征變量在錄井解釋領(lǐng)域是絕對行不通的,貝葉斯判別方法本身是沒有問題的,關(guān)鍵是特征變量的優(yōu)化。一般來說,在錄井解釋的實際現(xiàn)場應(yīng)用過程中,合適地使用貝葉斯判別法可以使正判率達(dá)到70%至95%之間。

      3 變量的多步優(yōu)化策略

      逐步判別法是挑選特征變量的最常用方法,其基本原理是在已知預(yù)判別的類型和數(shù)目,并已取得各種類型的一批已知樣品的情況下,根據(jù)各變量在分類判別式中作用的大小進行排序,并逐步地選入判別式中,直到既無變量選入,又無變量剔除為止,最后計算出相應(yīng)的判別函數(shù)和評價對象從屬各類的概率值,實現(xiàn)判別分類[4]。但是特征變量的優(yōu)化不只是逐步挑選變量,應(yīng)采用多個優(yōu)化步驟。

      3.1 特征變量的范圍選擇

      在原始樣本數(shù)據(jù)中,會存在很多可選變量,但并不是所有變量都與判別有關(guān),以氣測解釋數(shù)據(jù)為例,表1中列出了最常用的氣測解釋變量,其中包含相鄰蓋層鉆時ROPn與儲層最小有效鉆時ROPs,另外還包含有異戊烷、正戊烷、硫化氫、氫氣以及二氧化碳的測量值,但是后五種在做油氣解釋評價時意義不大,異戊烷、正戊烷、硫化氫、氫氣經(jīng)常在大部分井段是不能明顯檢出的,而二氧化碳在不同含油氣性儲層類型中的含量都差不多,故不在選擇范圍之內(nèi)。因此,特征變量的范圍選擇要根據(jù)行業(yè)知識和經(jīng)驗進行,將有可能與判別相關(guān)的變量一并選入,第一步選擇范圍可以稍微大一些。

      3.2 特征變量預(yù)處理和特征參數(shù)提取

      樣本原始的測量數(shù)據(jù)有時候并不是直接應(yīng)用與判別,不同變量量綱不同,量級也有很大差別,如表1中各種烴含量均是百分比,其值較小,而ROP鉆時的值均較大,所以有必要將各烴含量值放大,文獻[1]為了消除不同錄井儀器檢測數(shù)據(jù)絕對含量上的差異,也有將數(shù)據(jù)放大的處理方式,同時計算不同烴含量的比值,將絕對含量轉(zhuǎn)化為相對含量,在這里將各烴相對含量的數(shù)據(jù)放大100倍。

      除了數(shù)據(jù)的預(yù)處理以外,根據(jù)行業(yè)知識與經(jīng)驗,還可以引入一些基于原始測量數(shù)據(jù)的特征參數(shù),如文獻[2]將勝利油田樁海地區(qū)的氣測信息轉(zhuǎn)化為11個氣測參數(shù),如烴氣平衡:X1=(C1+C2)/(C3+iC4+nC4)和烴氣濕度比:X2=(C2+C3+iC4+nC4)/C1等參數(shù)。在傳統(tǒng)的氣測解釋評價方法中,流體性質(zhì)識別的最常用的就是交會圖解釋,如鉆時比值與烴對比系數(shù)交會圖和輕烴比值[C1/C2-C1/C3]解釋圖版等,其中用到的重要參數(shù)就有鉆時比值ROPn/s,是指相鄰蓋層鉆時ROPn與儲層最小有效鉆時ROPs之比,反映儲層孔隙性的相對變化;烴對比系數(shù)Kc是指全烴顯示值與基值或背景值之比,反映儲層含油性的相對變化。因此本文按照此類經(jīng)驗,在原始測量數(shù)據(jù)基礎(chǔ)上提取特征參數(shù)ROPn/s、Kc、C23(C2/C3)和niC4(nC4/iC4)作為特征變量,求比值時若分母為零,設(shè)定比值為1。

      3.3 特征變量初步篩選

      將處理過的原始數(shù)據(jù)和提取的特征參數(shù)組合在一起,組成了待選特征變量,需要進行組間均值檢驗,并用Wilk’sλ統(tǒng)計量對每個判別變量單獨檢驗其判別能力;對于顯著性檢驗,可進行普遍使用的F檢驗,檢驗結(jié)果相當(dāng)于分組變量和判別變量間的簡單方差分析[14]。本文對上述所有特征變量進行了組間均值檢驗,結(jié)果如表2所示,Wilk’sλ統(tǒng)計量是組內(nèi)離差平方和與總離差平方和的比,值的范圍在0到1之間,值越小表示組間有很大的差異,值接近1表示沒有組間差異。表2按照Wilk’sλ統(tǒng)計量從小到大排列,說明變量ROPns的單獨判別能力最強,而當(dāng)某個變量的顯著性水平小于常用的置信水平(一般設(shè)為0.05),就有足夠理由拒絕“組間均值沒有差異”的假設(shè),說明組間均值過于接近,很難區(qū)分,這樣的特征變量應(yīng)該考慮剔除掉,如表2中的最后4個變量;但是這也不是絕對的,由于判別變量間可能相互關(guān)聯(lián),盡管某些變量本身具有較小的判別作用,但在與其他變量聯(lián)合后對于判別效果的提高也可能有較大的貢獻。

      另外作為判別分析的特征變量應(yīng)該相互獨立,避免冗余和相互干擾,故應(yīng)該對特征變量進行相關(guān)性分析,尤其是在部分特征參數(shù)的提取過程中,使用了較多的相對比值和原始數(shù)據(jù)混合在一起的情況,若兩個變量之間的相關(guān)系數(shù)大于0.9,則應(yīng)考慮是否二者選其一,這里使用的是合并的組內(nèi)相關(guān)矩陣,是通過計算各組分離的相關(guān)矩陣的平均值而獲得的。表3顯示了特征變量的相關(guān)矩陣,篇幅所限,只列出了部分變量,其他未列出變量的相關(guān)系數(shù)絕對值均沒有超過0.8,其中可以看出ROPn和ROPs相關(guān)系數(shù)達(dá)到了0.94,TC和KC的相關(guān)系數(shù)達(dá)到了0.96,但是TC和KC的獨立判別能力都是比較強的,通過實驗表明二者結(jié)合加入判別時的判別效果更好。

      表3 判別變量相關(guān)矩陣

      綜合組間均值檢驗和變量間相關(guān)性分析的結(jié)果,決定剔除掉ROPn和Cb兩個變量,在進行逐步判別之前保留11個變量。

      3.4 逐步判別挑選變量

      所謂變量擇優(yōu)算法則是采用有進有出的算法,即每一步都要對變量的附加信息進行檢驗,使其優(yōu)勝劣汰。其原理和計算步驟不再贅述,可參照文獻[13-14],挑選變量的依據(jù)是對其判別能力的衡量,有多種準(zhǔn)則可以選擇[15]。

      (1)Wilk’sλ準(zhǔn)則:在每一步挑選使得Wilk’sλ最小的變量進入判別模型,對于每個候選判別變量都要計算F統(tǒng)計量,與Wilk’sλ統(tǒng)計量成反比,即具有最大F值的變量進入判別模型,F(xiàn)值由下式計算:

      公式(3)中,n為樣本數(shù),g為類別數(shù),p為變量個數(shù),λp為添加變量以前的Wilk’sλ值,λp+1為添加變量以后的Wilk’sλ值。

      (2)馬氏距離(Mahalanobis Distance)準(zhǔn)則:在計算的每一步中,使兩個相鄰類別之間最近的馬氏距離最大的變量進入判別模型。組a和組b之間的馬氏距離由下式定義:

      公式(4)中i和j從1到p求和,p為變量個數(shù),g為組數(shù),為第a組第i個變量的均值,為第b組第i個變量的均值,為協(xié)方差矩陣的逆矩陣的元素。

      (3)Rao’s V準(zhǔn)則:每步都是使Rao’s V統(tǒng)計量產(chǎn)生最大增量的變量進入判別函數(shù)??梢詫σ粋€要加入到模型中的變量的V值指定一個最小增量。當(dāng)某變量導(dǎo)致的V值增量大于指定值時才進入判別函數(shù)。Rao’s V又稱為Lawley-Hotelling跡,用下式定義:

      公式(5)中i和j從1到p求和,k從1到g求和,p為變量個數(shù),g為組數(shù),nk為第k組的樣本大小,為第k組第i個變量的均值,為組內(nèi)協(xié)方差矩陣的逆矩陣元素。

      應(yīng)用以上3種準(zhǔn)則分別對含11個變量的30個樣本數(shù)據(jù)和36個待判數(shù)據(jù)進行逐步判別,這里需設(shè)定F門檻值,即對于每一步按照規(guī)則挑選的變量,其判別能力由公式(3)中計算的F值必須大于F門檻值才能引入到判別模型當(dāng)中,F(xiàn)門檻值的設(shè)定直接決定了入選變量的數(shù)量,這里設(shè)定添加變量的F值為2.0,剔除變量的F值為1.8,三種不同規(guī)則的逐步判別結(jié)果如表4所示,Wilk’sλ準(zhǔn)則和Rao’sV準(zhǔn)則挑選出來的變量組合是完全一致的,所以判別結(jié)果也一致,在計算步驟當(dāng)中就可以看出,Rao’sV值基本上與F值成正比,F(xiàn)值最大的變量其Rao’sV值也最大;而馬氏距離準(zhǔn)則挑選了更多的變量,也獲得了更好的判別效果。

      表4 不同判別規(guī)則判別結(jié)果

      上述三種判別準(zhǔn)則主要思想都是建立一個基于這些總體的目標(biāo)函數(shù),然后通過對這個函數(shù)值來判斷總體間的差異程度,除此之外還有利用統(tǒng)計距離定義的總體可分性函數(shù)[16],它的增值可以反映變量區(qū)分總體的顯著程度,一個能顯著區(qū)分總體的變量會帶來大的增值,可以用于判別總體間區(qū)別相對較小的情況。綜合來講,Wilk’sλ準(zhǔn)則使用最為廣泛,在區(qū)分最難判別的組別時可以考慮使用馬氏距離準(zhǔn)則,而對于備選變量存有疑慮的話,可使用Rao’sV準(zhǔn)則,此準(zhǔn)則可以再增加一個門檻值。通過設(shè)置合適的F門檻值,利用多步優(yōu)化策略對本文實例進行判別,最終回代正判率和待判數(shù)據(jù)正判率分別為96.7%和83.3%。

      通過對于特征變量優(yōu)化方法的研究,得出以下結(jié)論:

      (1)特征變量的優(yōu)化對于判別結(jié)果起著至關(guān)重要的作用,特征變量的優(yōu)化不是簡單地使用逐步判別法,而是從范圍選擇、數(shù)據(jù)預(yù)處理、特征變量提取到初步篩選和逐步判別的完整過程。

      (2)特征變量的個數(shù)既不是和正判率成正比也不是成反比,對于確定的訓(xùn)練樣本,特征變量的個數(shù)到達(dá)某個值或是某個區(qū)間時正判率最佳。一般來說,在去除了變量相互影響的前提下,特征變量越多,正判率越高;若特征變量冗余且相關(guān)性較高時,剔除一些特征變量反而能提高正判率。

      (3)逐步判別法使用不同的F門檻值和不同的判別準(zhǔn)則決定了選取特征變量的個數(shù),F(xiàn)門檻值越低,選出的變量個數(shù)越多;不同的判別準(zhǔn)則適用于不同情況,其實質(zhì)是在逐步判別的過程中用不同的方法衡量變量的判別能力,不僅決定著入選的變量個數(shù),也決定了變量的組合,從而影響最終判別結(jié)果。

      (4)逐步判別法篩選出的特征變量組合不一定是相同數(shù)量變量組合中的最優(yōu),因為每次引入新變量都是在保留已引入變量的基礎(chǔ)上進行,然后有些變量還在引入后被剔除了。特征變量的獨立判別能力并不能直接決定其去留,獨立判別能力弱的變量加入組合后也能明顯提高正判率,特征變量的優(yōu)化在于尋找最優(yōu)變量組合。

      4 分步多模型變量優(yōu)化策略

      通過對逐步判別過程的分析,發(fā)現(xiàn)不同的變量區(qū)分不同組別時的能力各有不同,根據(jù)組間最近馬氏距離最大值可以衡量這種能力,表5顯示了在一次逐步判別的最后階段,已入選的9個變量所對應(yīng)的組間馬氏距離最大值,一部分變量更適合區(qū)分第1和第2類總體,另外的則適合區(qū)分第2和第3類總體,依照這種情況,可以考慮將三類總體先合并成兩類總體,例如將上述實例中的總體劃分為油(氣)層和非油氣層,利用一次逐步貝葉斯判別先把油(氣)層從所有樣本中區(qū)分開來,然后在判定為非油氣層的樣本中再用一次判別把干層和含烴水層分開。

      表5 判別變量與組間馬氏距離

      這樣做的實質(zhì)是先用一個貝葉斯判別模型將所有待判樣本劃分為若干子集,然后在各個子集中再用判別模型將各個總體區(qū)分開來,對于3至5個總體來說,兩三步判別即可得出結(jié)果,而且可以在分步實施的各個判別模型中選用對于不同組別判別能力較強的不同判別變量組合,也可以選擇不同的判別準(zhǔn)則,可以得到較好的判別效果。表6顯示了分步判別的結(jié)果數(shù)據(jù),綜合兩步的判別結(jié)果,最終統(tǒng)計36個待判樣本誤判6個,總的正判率也達(dá)到了83.3%。

      表6 分步多模型逐步判別結(jié)果

      表7 優(yōu)化過程中不同階段和不同方法的判別結(jié)果

      5 結(jié)束語

      通過對貝葉斯判別中的特征變量進行不斷的優(yōu)化,使得正判率穩(wěn)步提高,表7顯示了優(yōu)化過程中不同階段和不同方法的判別結(jié)果,比較說明本文提出的多步優(yōu)化策略和分步多模型優(yōu)化策略均具有較好的優(yōu)化效果。多步優(yōu)化策略是在總結(jié)和分析已有的優(yōu)化方法的基礎(chǔ)上提出的一套綜合性較強的變量優(yōu)化方法,包含了從變量范圍選擇、數(shù)據(jù)預(yù)處理、特征變量提取到初步篩選和逐步判別的完整過程,適用于包含油氣解釋在內(nèi)的諸多領(lǐng)域;而分步多模型優(yōu)化策略的提出是利用了變量在判別不同總體分類時各有所長的特點,對于某些特定的總體分類可以取得不低于多步優(yōu)化的正判率,但若總體數(shù)較多,采用分步多模型優(yōu)化策略會增加計算量,此時可考慮部分使用該策略。

      [1]郭暉,駱福貴,倪有利,等.Bayes多母體判別模型在油氣層評價中的應(yīng)用[J].錄井工程,2010,21(2):5-7.

      [2]連承波,鐘建華,李漢林,等.氣測參數(shù)信息的提取及儲層含油氣性識別[J].地質(zhì)學(xué)報,2007,81(10):1339-1443.

      [3]魏治文,方坤河,楊華山,等.貝葉斯(Bayes)判別分析在粉煤灰分類中的應(yīng)用[J].粉煤灰綜合利用,2006(6):11-13.

      [4]陳紅江,李夕兵,劉愛華.礦井突水水源判別的多組逐步Bayes判別方法研究[J].巖土力學(xué),2009,30(12):3655-3659.

      [5]陳輝,郭科.判別分析中的變量擇優(yōu)及其MATLAB實現(xiàn)[J].河南師范大學(xué)學(xué)報:自然科學(xué)版,2004,32(1):12-16.

      [6]劉宏杰,馮博琴,李文捷,等.粗糙集屬性約簡判別分析方法及其應(yīng)用[J].西安交通大學(xué)學(xué)報,2007,41(8):939-943.

      [7]武曉巖,閆曉光,李康.基因表達(dá)數(shù)據(jù)的隨機森林逐步判別分析方法[J].中國衛(wèi)生統(tǒng)計,2007(2):151-154.

      [8]孟凡奇,李廣杰,李明,等.逐步判別分析法在篩選泥石流評價因子中的應(yīng)用[J].巖土力學(xué),2010,31(9):2925-2929.

      [9]段新國,王允誠,李忠權(quán),等.應(yīng)用多組逐步判別分析優(yōu)選油氣層[J].大慶石油地質(zhì)與開發(fā),2007,26(1):68-71.

      [10]龍鑠禺.應(yīng)用逐步判別法建立氣測解釋模型[J].錄井技術(shù),1999(3):22-28.

      [11]畢淑峰,朱顯靈,馬成澤.逐步判別分析在中國烤煙香型鑒定中的應(yīng)用[J].熱帶作物學(xué)報2006,27(4):104-107.

      [12]荀鵬程,錢國華,富春楓,等.判別分析驅(qū)動的微陣列數(shù)據(jù)的降維策略[J].中國衛(wèi)生統(tǒng)計,2009(2):147-149.

      [13]任雪松,于秀林.多元統(tǒng)計分析[M].2版.北京:中國統(tǒng)計出版社,2011.

      [14]Backhaus K,Erichson B,Plinke W,et al.Multivariate statistical analysis[M].Berlin:Springer,2005.

      [15]蘇金明.統(tǒng)計軟件SPSS 12.0 for Windows應(yīng)用及開發(fā)指南[M].北京:電子工業(yè)出版社,2004.

      [16]潘志文,汪國強.判別分析中基于總體可分性的變量選擇[J].華南理工大學(xué)學(xué)報:自然科學(xué)版,2001,29(11):81-84.

      HU Jianpeng,CHEN Qiang,HUANG Rong

      School of Electrical&Electronic Engineering,Shanghai University of Engineering Science,Shanghai 201620,China

      Characteristic variables selection is a critical factor that affects the result of discriminant analysis.Appropriate selection of variable combination can improve the correct rate and reduce the amount of computation.This paper introduces the basic principle of Bayes discriminant and stepwise discriminant method,analyses some methods of characteristic variables optimization at present,takes application of Bayes discriminant in oil gas interpretation and evaluation as an example to research on variable optimization method in stepwise Bayes discriminant analysis,and puts forward a variable step optimization strategy and a multi-model optimization strategy,including variable range selection,data preprocessing,feature extraction,preliminary screening of variables and stepwise discriminant,which makes correct judgement rate optimized gradually,and obtains more satisfactory discriminant result.

      Bayes discriminant;stepwise discriminant;variable optimization;discriminant factor;gas logging

      A

      TP391

      10.3778/j.issn.1002-8331.1211-0277

      HU Jianpeng,CHEN Qiang,HUANG Rong.Study on variable optimization method in stepwise Bayes discriminant analysis.Computer Engineering and Applications,2014,50(21):63-67.

      上海工程技術(shù)大學(xué)科技發(fā)展基金項目(No.2011Q07,No.2011Q06);上海工程技術(shù)大學(xué)學(xué)科專業(yè)建設(shè)項目(No.XKCZ1212)。

      胡建鵬(1980—),男,講師,CCF會員,研究方向:計算機應(yīng)用;陳強,博士,教授,研究方向:數(shù)值分析和計算機圖形學(xué)。E-mail:mr@sues.edu.cn

      2012-11-23

      2013-05-10

      1002-8331(2014)21-0063-05

      CNKI出版日期:2014-01-15,http://www.cnki.net/kcms/doi/10.3778/j.issn.1002-8331.1211-0277.html

      猜你喜歡
      判別函數(shù)貝葉斯總體
      用樣本估計總體復(fù)習(xí)點撥
      2020年秋糧收購總體進度快于上年
      游樂設(shè)施事故與危險量化判別函數(shù)的構(gòu)建
      外匯市場運行有望延續(xù)總體平穩(wěn)發(fā)展趨勢
      中國外匯(2019年6期)2019-07-13 05:44:06
      探究上市公司財務(wù)預(yù)警的數(shù)學(xué)模型
      貝葉斯公式及其應(yīng)用
      直擊高考中的用樣本估計總體
      基于貝葉斯估計的軌道占用識別方法
      一種基于貝葉斯壓縮感知的說話人識別方法
      電子器件(2015年5期)2015-12-29 08:43:15
      基于Fisher判別函數(shù)的酒店員工離職預(yù)警研究
      霍山县| 密云县| 遂宁市| 东乡县| 维西| 南安市| 尼玛县| 凌源市| 墨竹工卡县| 广水市| 论坛| 阿克苏市| 苗栗市| 凉山| 洞口县| 博兴县| 平原县| 永修县| 中西区| 新乡县| 剑河县| 宾阳县| 黄山市| 苗栗县| 金川县| 山阳县| 松阳县| 封丘县| 和平县| 德兴市| 丹阳市| 东安县| 嘉祥县| 绍兴市| 岳西县| 龙江县| 方正县| 婺源县| 华宁县| 石棉县| 雅安市|