姜文哲 中國人民大學(xué)統(tǒng)計(jì)學(xué)院 100025
前言:數(shù)理統(tǒng)計(jì)是一種以概率論為依據(jù),以極大數(shù)量隨機(jī)現(xiàn)象為目標(biāo),進(jìn)行規(guī)律性推論整理統(tǒng)計(jì)的一種方式。在數(shù)據(jù)分析過程中,數(shù)理統(tǒng)計(jì)可以特定問題為核心,進(jìn)行整理、分組、推論,為預(yù)測(cè)、決策、實(shí)施奠定基礎(chǔ)。因此,對(duì)數(shù)據(jù)分析中數(shù)理統(tǒng)計(jì)定義內(nèi)涵、數(shù)理統(tǒng)計(jì)在數(shù)據(jù)分析中的實(shí)際應(yīng)用、數(shù)理統(tǒng)計(jì)的應(yīng)用實(shí)例及正確應(yīng)用方式等方面進(jìn)行適當(dāng)探究具有重要意義。
在數(shù)據(jù)分析中數(shù)理統(tǒng)計(jì)是數(shù)學(xué)的一個(gè)分支學(xué)科,包括描述統(tǒng)計(jì)、推斷統(tǒng)計(jì)兩個(gè)模塊。描述統(tǒng)計(jì)主要是通過文體資料收集,對(duì)相關(guān)資料進(jìn)行整理、組別劃分及次數(shù)分配表編制,可以獲得次數(shù)分配曲線及不同類型特征指標(biāo),確定資料中相關(guān)數(shù)據(jù)分布離散趨勢(shì)、偏斜度、集中趨勢(shì) 而推斷統(tǒng)計(jì)主要是描述統(tǒng)計(jì)的前提下,依據(jù)樣本資料,對(duì)資料變化規(guī)律性進(jìn)行推論。隨后依據(jù)得出的總體特征,進(jìn)行推斷、預(yù)測(cè)【1】。
數(shù)據(jù)分析中數(shù)理統(tǒng)計(jì)主要起源于公元前2250年,最初用于人口統(tǒng)計(jì)、社會(huì)調(diào)查等描述性統(tǒng)計(jì)活動(dòng)。如西周人口分地中土地與戶口統(tǒng)計(jì)、東漢軍事調(diào)查中兵車數(shù)據(jù)統(tǒng)計(jì)等。在現(xiàn)代時(shí)期,由于計(jì)算機(jī)技術(shù)的廣泛應(yīng)用,數(shù)理統(tǒng)計(jì)在數(shù)據(jù)理論分析中不斷向縱深發(fā)展,產(chǎn)生了最優(yōu)設(shè)計(jì)、非參數(shù)統(tǒng)計(jì)推斷等新的邊緣學(xué)科。同時(shí)數(shù)理統(tǒng)計(jì)應(yīng)用范圍逐漸拓展,逐步滲透至股票分析、企業(yè)管理、環(huán)境保護(hù)等多個(gè)領(lǐng)域,成為科學(xué)研究必備的工具之一。
區(qū)間估計(jì)又可稱之為置信區(qū)間估計(jì),其主要是以數(shù)軸上任意一段距離、數(shù)據(jù)區(qū)間為依據(jù)。結(jié)合原有條件,對(duì)可能區(qū)間進(jìn)行的推理論斷。在置信區(qū)間估計(jì)過程中,需要結(jié)合原有數(shù)據(jù)分析情況,盡可能選擇范圍較小的區(qū)間。利用不等式變形的方式,依據(jù)相應(yīng)標(biāo)準(zhǔn),對(duì)某一點(diǎn)進(jìn)行估計(jì)。隨后逐步延伸,進(jìn)行置信空間的科學(xué)計(jì)算。如在投資風(fēng)險(xiǎn)分析過程中,投資人可以期望值作為置信區(qū)間,將紅利、市盈率作為依據(jù),進(jìn)行數(shù)據(jù)剖析。并進(jìn)行股票市場平均數(shù)對(duì)比,為后續(xù)投資操作提供有效指導(dǎo)。
一方面,時(shí)間序列法主要應(yīng)用于多段數(shù)據(jù)處理,注重多段數(shù)據(jù)不同數(shù)據(jù)出現(xiàn)順序調(diào)控。其在實(shí)際應(yīng)用中,首先需要構(gòu)建相應(yīng)模型,確定所研究對(duì)象整體運(yùn)行狀態(tài)。隨后以系統(tǒng)控制預(yù)測(cè)的方式,進(jìn)行數(shù)據(jù)質(zhì)量修正、數(shù)據(jù)計(jì)算統(tǒng)計(jì)。如在人文發(fā)展指數(shù)分析階段,可以出生預(yù)期壽命、成人識(shí)字率、實(shí)際人均GDP為指標(biāo),進(jìn)行統(tǒng)計(jì)分析。并利用宏觀調(diào)控的方式,將上述三項(xiàng)指標(biāo)進(jìn)行適當(dāng)處理,以保證時(shí)間序列處理效果。
另一方面,多元統(tǒng)計(jì)主要針對(duì)某一時(shí)點(diǎn)組成數(shù)據(jù)群處理。其在實(shí)際應(yīng)用中可以幫助管理者從多個(gè)方面出發(fā),研究不同決策對(duì)企業(yè)經(jīng)營發(fā)展的影響,降低決策錯(cuò)誤率。如在企業(yè)管理決策過程中,管理者可以根據(jù)某項(xiàng)決策,以特定應(yīng)用問題概率信息內(nèi)容為憑證,構(gòu)建概率分布模型。在概率分布模型中,從不同視角出發(fā),對(duì)不同決策與企業(yè)經(jīng)營發(fā)展間關(guān)系進(jìn)行適當(dāng)分析,最終確定最佳決策方案【2】。
3、假設(shè)檢驗(yàn)
假設(shè)檢驗(yàn)主要是在置信區(qū)間估計(jì)的基礎(chǔ)上,從原假設(shè)、備選假設(shè)兩個(gè)方面,將某一數(shù)據(jù)集合看做一個(gè)置信區(qū)間。隨后以該數(shù)據(jù)作為置信系數(shù),利用回歸分析的方式,對(duì)整體區(qū)間假設(shè)進(jìn)行檢驗(yàn)論證。如在投資風(fēng)險(xiǎn)置信區(qū)間假設(shè)檢驗(yàn)過程中,投資人可以利用數(shù)理統(tǒng)計(jì)回歸分析方式,對(duì)某一股數(shù)據(jù)進(jìn)行檢驗(yàn)論證,以保證股票價(jià)格走勢(shì)預(yù)判準(zhǔn)確度。
日益嚴(yán)峻的環(huán)境問題對(duì)人類社會(huì)發(fā)展造成了嚴(yán)重的影響,引發(fā)了多數(shù)學(xué)者對(duì)以往資源浪費(fèi)、消耗的生活生產(chǎn)方式的反思。在這一背景下,本文以本科院校學(xué)生綠色消費(fèi)行為研究對(duì)象,從綠色消費(fèi)行為影響因素入手,對(duì)某市在校大學(xué)生綠色消費(fèi)行為影響因素進(jìn)行了適當(dāng)分析。在確定研究主題之后,本文評(píng)論整理了知網(wǎng)、萬方等知名學(xué)術(shù)網(wǎng)站關(guān)于綠色消費(fèi)行為及其影響因素的相關(guān)文獻(xiàn)。隨后利用實(shí)證分析的方式,對(duì)該地本科院校學(xué)生綠色消費(fèi)行為及特征進(jìn)行了分析。結(jié)合計(jì)劃行為理論,構(gòu)建了該地本科院校學(xué)生綠色消費(fèi)行為影響因素模型。如圖1所示:
圖1 某地本科院校學(xué)生綠色消費(fèi)行為影響因素模型
如圖1所示,該地本科院校學(xué)生綠色消費(fèi)行為共涉及了人口統(tǒng)計(jì)特征、環(huán)境知識(shí)、綠色消費(fèi)態(tài)度、綠色感知效力、參照群體等五個(gè)變量。其中人口統(tǒng)計(jì)特征包括政治面貌、專業(yè)類別、家庭背景、月均消費(fèi)水平、性別、年齡等方面因素。
現(xiàn)階段,國際層面已經(jīng)出現(xiàn)了多種類型用于統(tǒng)計(jì)分析的商業(yè)軟件,如Statistical Package for Social Sciences(SPSS)、Statistical Analysis System(SAS)、STATISTICA、BMDP。其中SPSS、SAS軟件主要服務(wù)于社會(huì)科學(xué)研究領(lǐng)域及自然科學(xué)領(lǐng)域 BMDP、STATISTICA軟件主要用于生物學(xué)、醫(yī)學(xué)領(lǐng)域。一般SPSS、SAS軟件專業(yè)水平較高,應(yīng)用較廣泛。本次研究主要采用SPSS3.0數(shù)據(jù)分析軟件【3】。
依據(jù)前期文獻(xiàn)分析結(jié)果,結(jié)合構(gòu)建的該地本科院校學(xué)生綠色消費(fèi)行為模型,可對(duì)置信區(qū)間進(jìn)行合理估計(jì)。首先,多數(shù)研究人員得出人口統(tǒng)計(jì)變量與綠色行為具有緊密的聯(lián)系。即本科院校學(xué)生受教育程度越高、家庭收入越高,綠色消費(fèi)傾向越高。且相較于男性而言,女性綠色消費(fèi)態(tài)度較良好。因此,可作出假設(shè):人口統(tǒng)計(jì)特征對(duì)該地本科院校在校學(xué)生綠色消費(fèi)行為存在一定影響。
其次,仇立通過對(duì)天津市居民綠色食品消費(fèi)行為影響因素進(jìn)行分析得出,在消費(fèi)者面臨重要選擇消費(fèi)決策時(shí)秉承綠色消費(fèi)態(tài)度的消費(fèi)者對(duì)商品本身使用價(jià)值關(guān)注程度較高,且對(duì)相關(guān)商品綠色屬性關(guān)注陳程度較低【6】。因此,可作出假設(shè):綠色消費(fèi)態(tài)度對(duì)該地本科院校在校學(xué)生綠色消費(fèi)行為具有顯著影響。
再次,相關(guān)研究得出:環(huán)境知識(shí)掌握程度對(duì)消費(fèi)者親環(huán)境行為也具有較大的影響。即環(huán)境知識(shí)豐富程度較高者綠色消費(fèi)傾向較高。因此,可假設(shè):環(huán)境知識(shí)對(duì)該市在校學(xué)生綠色消費(fèi)行為具有突出影響。
從次,依據(jù)價(jià)值觀——態(tài)度——行為關(guān)系理論,得出消費(fèi)者感知效力對(duì)消費(fèi)者行為具有一定影響。綠色消費(fèi)感知效力越高的顧客,越容易形成綠色購買動(dòng)機(jī)。因此,可假定綠色感知效力對(duì)該市本科院校在校學(xué)生綠色消費(fèi)行為具有突出的影響。
最后,基于個(gè)體的參照與比較機(jī)制,可得出我國代際消費(fèi)具有較為突出的密切特征,長輩消費(fèi)觀念對(duì)子輩具有較大的影響。因此,可假設(shè)參照群體對(duì)該市本科院校在校大學(xué)生綠色消費(fèi)行為具有較大的影響。
在上述假設(shè)設(shè)置的基礎(chǔ)上,為獲得充足的文本資料,可以借鑒我國內(nèi)部及外國相關(guān)學(xué)科研究經(jīng)驗(yàn)。結(jié)合本文研究課題,開發(fā)統(tǒng)計(jì)量表。并通過語義對(duì)比的方式,反復(fù)測(cè)量、修正量表,以促使其與研究對(duì)象文化環(huán)境相一致。同時(shí)走訪當(dāng)?shù)乇究圃盒#{(diào)查本科院校學(xué)生對(duì)現(xiàn)有測(cè)量語句的認(rèn)識(shí),進(jìn)一步完善量表信息。在確定量表信息之后,本次主要采用以李克特五級(jí)量表為基礎(chǔ)的七級(jí)量表。1表示“非常不贊同” 2表示“不贊同” 3表示“比較不贊同” 4表示“不確定” 5表示“比較贊同” 6表示“贊同” 7表示“非常贊同”【4】。具體量表如表1:
表1 某地本科院校在校學(xué)生綠色消費(fèi)行為統(tǒng)計(jì)量表(局部)
在上述統(tǒng)計(jì)量表開發(fā)的基礎(chǔ)上,構(gòu)建了涵蓋引言、總體、后綴的完善的調(diào)查問卷。該調(diào)查問卷主要包括被調(diào)查者人口統(tǒng)計(jì)特征收集、被調(diào)查者對(duì)環(huán)境知識(shí)認(rèn)識(shí)水平分析、被調(diào)查者實(shí)際綠色消費(fèi)行為、被調(diào)查者家屬及同伴對(duì)其綠色消費(fèi)行為影響程度、被調(diào)查者自身消費(fèi)行為對(duì)他人影響程度等多個(gè)模塊。在調(diào)查問卷設(shè)計(jì)完畢之后,利用問卷發(fā)放的方式,在該地多所本科院校現(xiàn)場發(fā)放調(diào)查問卷【5】。并歷時(shí)15天,共發(fā)放800份,回收800份,問卷回收率為100%。隨后對(duì)回收問卷進(jìn)行檢查分析,剔除錯(cuò)填、一致性存在錯(cuò)誤問題的問卷60份,實(shí)際有效問卷740份,有效率為92.50%。從年齡、政治面貌、專業(yè)類別、月均消費(fèi)水平、性別等方面,得出本次調(diào)查人口統(tǒng)計(jì)特征如下表:
表2 調(diào)查人口統(tǒng)計(jì)特征(局部)
本次數(shù)理統(tǒng)計(jì)主要采用信度與效度分析、相關(guān)分析及回歸分析等數(shù)理統(tǒng)計(jì)分析方法。
首先,在信度分析過程中,主要利用克朗巴哈α系數(shù)作為信度評(píng)判標(biāo)準(zhǔn),α與1越接近,表明信度越高 而在效度分析時(shí),主要利用因子分析法,探究量表效度。即KMO檢驗(yàn)判斷數(shù)據(jù)與1越接近,表明全部變量間相關(guān)性越強(qiáng)。以綠色消費(fèi)行為信度及效度檢驗(yàn)為例,綠色消費(fèi)行為內(nèi)部一致性α系數(shù)值為0.770,信度指標(biāo)較好。綠色消費(fèi)行為整體統(tǒng)計(jì)量各維度項(xiàng)α系數(shù)>0.7,且小于項(xiàng)目整體α系數(shù)0.770,表明其內(nèi)部一致性較為良好 而在效度檢驗(yàn)時(shí),主要采用主成份分析法,對(duì)綠色消費(fèi)行為量進(jìn)行探索。得出其KMO值為0.751,方差解釋為52.336%>50.0%,且因子負(fù)荷均>0.5,表明量表效度良好。同理,對(duì)綠色感知效力、環(huán)境知識(shí)、綠色消費(fèi)態(tài)度、參照群體信度、效度進(jìn)行分析,得出其量表效度、信度較為良好。
其次,相關(guān)分析主要是針對(duì)某兩個(gè)變量,對(duì)其線性關(guān)系強(qiáng)度進(jìn)行分析。本次研究主要利用Pearson相關(guān)系數(shù)(線性相關(guān)系數(shù))。結(jié)合表2數(shù)據(jù),對(duì)人口統(tǒng)計(jì)特征與綠色消費(fèi)行為相關(guān)性進(jìn)行論述。依據(jù)線性相關(guān)系數(shù)定義,得出:其趨近于-1時(shí),兩變量呈負(fù)相關(guān),反之則呈現(xiàn)正相關(guān)【7】。而在線性相關(guān)系數(shù)趨近于0時(shí),兩變量不存在相關(guān)關(guān)系。在SPSS23.0軟件中,得出人口統(tǒng)計(jì)特征與綠色消費(fèi)行為相關(guān)性為:綠色消費(fèi)行為與性別相關(guān)系數(shù)為0.200<0.20,顯著性水平為0.002<0.01,存在較弱的正相關(guān)關(guān)系,同理可得出綠色消費(fèi)行為與月均消費(fèi)水平存在較弱的負(fù)相關(guān)關(guān)系 綠色消費(fèi)行為與年齡相關(guān)系數(shù)為-0.052<0.20,顯著性水平為0.338>0.05,表明兩者不存在相關(guān)關(guān)系。同理,可得出專業(yè)類別、家庭背景、政治面貌與綠色消費(fèi)行為不存在相關(guān)關(guān)系。
最后,回歸分析?;貧w分析主要是以變量間數(shù)量關(guān)系為分析對(duì)象,利用數(shù)學(xué)表達(dá)式的方式,對(duì)各變量間數(shù)量關(guān)系進(jìn)行描述。以環(huán)境知識(shí)與綠色消費(fèi)行為回歸分析為例,依據(jù)前期假設(shè)內(nèi)容,以環(huán)境知識(shí)為自變量,綠色消費(fèi)行為因變量,可得出修正后R2值為0.331,可構(gòu)建回歸方程。環(huán)境知識(shí)非標(biāo)準(zhǔn)化系數(shù)及標(biāo)準(zhǔn)化系數(shù)分別為0.559、0.558,顯著性水平P為0.000<0.001,表明假設(shè)成立。同理,可對(duì)上述假設(shè)進(jìn)行逐一驗(yàn)證分析。
綜上所述,在數(shù)據(jù)分析過程中,能否正確使用不同類型數(shù)理統(tǒng)計(jì)方法直接影響了最終數(shù)據(jù)統(tǒng)計(jì)分析結(jié)果的可信性、客觀性。因此,在數(shù)據(jù)分析過程中,相關(guān)人員應(yīng)在樣本數(shù)據(jù)收集的基礎(chǔ)上,選擇適當(dāng)?shù)臄?shù)據(jù)分析軟件,合理利用信度與效度分析、相關(guān)性分析、回歸分析等數(shù)理統(tǒng)計(jì)方式,研究統(tǒng)計(jì)特征及權(quán)重。并對(duì)前期研究假設(shè)進(jìn)行重新驗(yàn)證,保證最終決策的正確客觀性。