• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于PLS算法的帶缺失值顧客滿意度指數(shù)的測評

      2012-09-26 09:11:02趙富強(qiáng)劉金蘭
      統(tǒng)計與決策 2012年12期
      關(guān)鍵詞:估計值權(quán)重顧客

      趙富強(qiáng)劉金蘭

      0 引言

      顧客滿意度是一個經(jīng)濟(jì)心理學(xué)的概念,是用消費(fèi)者的消費(fèi)經(jīng)驗來衡量產(chǎn)品和服務(wù)的質(zhì)量的。顧客滿意度視為一個不能被直接觀測潛變量,因此在測評中將總體用多重指標(biāo)的方法來測量,測量結(jié)果是潛變量的分?jǐn)?shù),可以用于各個公司、行業(yè)、部門、地區(qū)和國家的顧客滿意度情況的比較。但在進(jìn)行顧客滿意度調(diào)查時,研究人員得到的實際數(shù)據(jù)往往存在丟失的問題。當(dāng)數(shù)據(jù)缺失后,在計算變量間的相關(guān)系數(shù)或協(xié)方差時,需要考慮如何對缺失值進(jìn)行處理。

      1 缺失值產(chǎn)生的原因、方式及處理方法

      缺失值是指在進(jìn)行問卷抽樣調(diào)查或?qū)嶒炐匝芯恐?,?yīng)該從抽樣的樣本單元中得到而實際上卻由于種種原因而未得到所需的數(shù)據(jù),也稱為缺失數(shù)據(jù)。

      在進(jìn)行實驗性研究或問卷抽樣調(diào)查中,數(shù)據(jù)缺失現(xiàn)象經(jīng)常發(fā)生,主要原因包括:①被調(diào)查者不愿提供調(diào)查所需要的信息;②不可人為控制的因素造成數(shù)據(jù)的缺失;③調(diào)研人員本身或調(diào)查系統(tǒng)的原因沒有收集到完全的信息;④信息填報匯總錯誤原因造成數(shù)據(jù)的缺失等。產(chǎn)生缺失數(shù)據(jù)原因多種多樣,實際工作中有時很難判斷和檢測缺失數(shù)據(jù)產(chǎn)生的機(jī)制與方式。為了認(rèn)識和研究缺失的數(shù)據(jù),從形式上將其分為單元缺失與項目缺失兩種。Little和Rubin[2]定義了三種不同的數(shù)據(jù)缺失機(jī)制,即完全隨機(jī)缺失(MCAR)、隨機(jī)缺失(MAR)和不可忽略的缺失(NIM)。整個缺失數(shù)據(jù)的推估過程中,缺失數(shù)據(jù)的情況表現(xiàn)為三種方式[4,5],即單變量缺失、單調(diào)缺失型和任意缺失型。

      缺失值的處理方法主要包括Ad Hoc法和缺失值插補(bǔ)法。Ad Hoc法通常將有缺失值的數(shù)據(jù)整列刪除或成對刪除,它是缺失值處理最常用的方法,盡管簡單,但當(dāng)數(shù)據(jù)缺失率低的情況下,仍具有一定優(yōu)勢,包括如下兩種:

      (1)列刪除法

      列刪除法是指在收集到的樣本中如果含有缺失數(shù)據(jù),則把含有缺失數(shù)據(jù)的記錄刪除。

      (2)成對刪除法

      在計算兩個變量的相關(guān)系數(shù)時,若其中一個變量有缺失數(shù)據(jù),則刪除這條記錄,同時也刪除另一個變量對應(yīng)的記錄(即使該變量數(shù)據(jù)完全)。該方法多用在因子分析、重復(fù)測量設(shè)計、區(qū)組設(shè)計資料分析及回歸與相關(guān)分析中。

      缺失值插補(bǔ)法包括:均值插補(bǔ)法、隨機(jī)插補(bǔ)法和多重插補(bǔ)方法等,在此不作闡述。

      除上述方法外,缺失值處理還有回歸或主成分法、最大似然估計法[5]、相似反應(yīng)模式設(shè)算法和MCMC算法等。

      在文獻(xiàn)[6]中,Lohm?ller’s PLSX對缺失值的處理為:⑴如果所有的顯變量樣本值都缺失,那么該樣本無效,無法估計潛變量。⑵如果該塊的顯變量樣本值不全缺失,那么計算潛變量估計時,缺失的顯變量值由該顯變量的均值替代。⑶如果該潛變量估計值有缺失,那么計算內(nèi)部估計時,缺失值由0替代。⑷權(quán)重的計算:①模式A(Mode A):權(quán)重根據(jù)公式計算;②模式B(Mode B):當(dāng)沒有缺失值按照公式計算;有缺失值時,采用成對刪除法把對應(yīng)的缺失樣本值刪除,即不考慮在內(nèi),然后利用公式來計算權(quán)重。

      2 求解帶缺失值的顧客滿意度指數(shù)

      在ACSI顧客滿意度指數(shù)模型中,ξr為潛(隱)變量,ξ0為潛自變量(外生變量),其他為潛因變量(內(nèi)生變量);xrt為顯變量(觀測變量,r=0,1,2,3,4,5),即為ξr的指標(biāo),t為潛變量對應(yīng)觀測值的個數(shù)(t=1,2…kr,kr為第r個潛變量對應(yīng)觀測值的個數(shù)),LXr分別為潛變量ξr的PLS估計值。

      求解帶缺失值的顧客滿意度指數(shù)步驟如下:

      (1)異常值處理

      所謂異常值是被調(diào)查顧客在回答問卷時,由于各種原因而選擇了“不知道”、“拒絕回答”以及“超出數(shù)值范圍”等選項時系統(tǒng)默認(rèn)的值。問卷采用10分制,從1分到10分供被調(diào)查者選擇,且只能選擇一個。對被調(diào)查者不知道或拒絕的回答,在數(shù)據(jù)庫里進(jìn)行了標(biāo)識(98表示不知道;99表示拒絕;101表示從來不購買)。這些數(shù)據(jù)在進(jìn)行處理時按照缺失值處理。

      (2)數(shù)據(jù)標(biāo)準(zhǔn)化

      使得樣本值的均值為0、方差為1。

      (3)缺失值處理

      對數(shù)據(jù)庫里面的缺失值(在數(shù)據(jù)庫里標(biāo)記為NaN)用0代替。初始化的權(quán)重分別為:v(1,0,0)、w1(1,0,0)、w2(1,0)、w3(1,0,0)、w4(1)、w5(1,0)。在一個塊結(jié)構(gòu)中,只要有一個顯變量的值沒有缺失,那么就不刪除該樣本,處理的方法是“權(quán)重新定”?!皺?quán)重新定”的方法是只要該潛變量對應(yīng)的顯變量中的樣本數(shù)據(jù)不全為0,那么該樣本即代表的被調(diào)查對象對問題的態(tài)度,不能對該樣本做簡單的刪除處理;對顯變量為0的權(quán)重在計算時不考慮在內(nèi),顯變量不為0權(quán)重在原有權(quán)重及總和為1的基礎(chǔ)上進(jìn)行重新計算。

      設(shè)一n維權(quán)重列向量W=(ω1,…,ωn),ω1+…+ωn=1;現(xiàn)在有一個包括n個數(shù)據(jù)的行向量X=(x1,…,xn),其中第i,j個數(shù)據(jù)缺失,“權(quán)重新定”的計算公式為:

      其中,Z是第i,j位置上為0,其余為1,包括n個數(shù)據(jù)的行向量;W’為列向量的轉(zhuǎn)置。

      例如:樣本X=(0,5,10,0),其對應(yīng)權(quán)重W=(1/4,1/2,1/8,1/,LX=(0,5,10,0)(2/5,4/5,1/5,1/5)’=6,即x1=x4=0,其權(quán)重不考慮,對x2,x3的權(quán)重重新計算。

      (4)利用PLS算法來估計模型中各個參數(shù)

      計算過程參見下節(jié),反復(fù)迭代得到潛變量估計值。

      (5)求出顧客滿意度指數(shù)

      根據(jù)第(4)步求得的權(quán)重系數(shù),計算出顧客滿意度指數(shù)[1]。

      3 Wold’s PLS算法模型估計[3]

      需要指出的是,含多個潛變量結(jié)構(gòu)方程模型的塊結(jié)構(gòu)設(shè)定原則是假定塊內(nèi)每個指標(biāo)分別與對應(yīng)的潛變量存在線性關(guān)系。模型設(shè)定詳細(xì)步驟在此不再給出。

      其中,πrt為指標(biāo)xrt的載荷系數(shù)(測量模型系數(shù)),εrt為殘差,πrk0為截距值,kr為第r個潛變量對應(yīng)觀測值的個數(shù)。

      含多個潛變量結(jié)構(gòu)方程模型的內(nèi)部關(guān)系設(shè)定原則是內(nèi)部關(guān)系應(yīng)該構(gòu)成一個線性因果鏈系統(tǒng)(linear causal chain system)。

      權(quán)重關(guān)系利用信息交換過程中的部分信息估計潛變量值。任何一個潛變量均可以通過其指標(biāo)變量的加權(quán)和來估計,而權(quán)重則由所選擇的權(quán)重關(guān)系來確定。每個潛變量權(quán)重關(guān)系可根據(jù)不同的情況包括模式A或模式B。

      模式A權(quán)重關(guān)系為:

      模式B權(quán)重關(guān)系為:

      對ACSI路模型中潛變量ξr的符號權(quán)重和定義為Ur。假設(shè)與ξi鄰接的潛變量是ξj,則公式為:

      其中srj是LXr和LXj的帶符號相關(guān)系數(shù):

      無缺失值時潛變量估計值的計算方法:

      有缺失值時潛變量估計值的計算方法(權(quán)重新定):

      fr的正負(fù)符號選擇取決于期望的相關(guān)關(guān)系。

      以后,就可以利用PLS算法來估計模型中各個參數(shù),進(jìn)而求解出整個結(jié)構(gòu)方程模型。這里取樣本容量為N,指標(biāo)xrt的樣本觀測值分別記為 xrtn,其中n=1…N,并且所有數(shù)據(jù)都已經(jīng)標(biāo)準(zhǔn)化(均值為0,方差為1)。

      模型設(shè)定完成以后,就可以利用PLS算法來估計模型中各個參數(shù),進(jìn)而求解出整個結(jié)構(gòu)方程模型。這里取樣本容量為N,指標(biāo)xrt的樣本觀測值分別記為xrtn,其中n=1…N并且所有數(shù)據(jù)都已經(jīng)標(biāo)準(zhǔn)化(均值為0,方差為1)。

      基于ACSI模型的PLS算法主要分三步。

      第一步,通過反復(fù)迭代得到潛變量估計值。

      ①設(shè)定初始權(quán)重ωrt(s);

      ②利用ωrt(s)根據(jù)公式(9)計算 fr,進(jìn)而根據(jù)公式(9)計算ξr的估計值LXr;

      ③利用LXr由公式(7)計算srj;

      ④利用srj根據(jù)公式(6)計算Ur;

      ⑤利用Ur根據(jù)公式(4)或(5)回歸計算新的權(quán)重

      第二步,將由第一步得出的潛變量估計值LXr分別與對應(yīng)的指標(biāo)觀測值回歸,根據(jù)潛變量的估計值,利用公式(2)計算外部關(guān)系的載荷系數(shù),利用公式(3)計算內(nèi)部關(guān)系的回歸系數(shù)。

      (1)塊結(jié)構(gòu)參數(shù)的估計(外部關(guān)系)

      其中,εrtn為殘差,prt為回歸系數(shù)(測量模型系數(shù))。

      (2)內(nèi)部關(guān)系參數(shù)的估計(內(nèi)部關(guān)系)

      其中,υrn為殘差,b為回歸系數(shù)(結(jié)構(gòu)模型系數(shù))。

      第三步,求出均值,給出最初的關(guān)系式。

      4 模型實例分析

      以某食品公司為研究對象、ACSI為測評模型,利用基于Wold的PLS算法、處理缺失值采用“權(quán)重新定”的方法實現(xiàn)的顧客滿意度測評系統(tǒng)(MyPLS)完成對采集樣本的處理,處理步驟為:

      (1)數(shù)據(jù)的收集采取網(wǎng)上調(diào)查的方式進(jìn)行,參與網(wǎng)上調(diào)查的用戶為252位,因此樣本量為252(見表1)。

      表1 某食品公司顧客滿意度調(diào)查原始數(shù)據(jù)表

      (2)表1中x52表示價格敏感度,包括價格上漲和價格下降,x52最后取值價格上漲+25或價格下降-25;表中的98、99、101用符號“NaN”替換,表示缺失數(shù)據(jù)。

      (3)對原始數(shù)據(jù)標(biāo)準(zhǔn)化處理。

      (4)“權(quán)重新定”的方法處理缺失值,計算潛變量的估計值,用PLS算法反復(fù)迭代求出權(quán)重系數(shù),進(jìn)而得到顧客滿意度指數(shù)。

      通過對帶缺失值的數(shù)據(jù)進(jìn)行實證分析得出:如果其它條件不變,在權(quán)重ω初始值改變,各ω值迭代結(jié)果收斂于一定數(shù)值,即最終的迭代結(jié)果是相同的,表明整個迭代過程是收斂的;Cronbach’sα系數(shù)均大于0.7,均在很可信范圍;測評標(biāo)準(zhǔn)化因子負(fù)荷處于0.6107-0.9675之間,表明指標(biāo)和潛變量間的有足夠的線性等價關(guān)系,滿足偏最小二乘法單一維度的條件;所有概念的AVE值都處于0.7138-0.9308之間,均大于0.5,這表明本文所設(shè)計的量表具有良好的內(nèi)斂效度,見表2。

      表2 模型評價參數(shù)比較

      基于Java開發(fā)的SmartPLS[7]軟件處理同樣的樣本,可以得出:SmartPLS軟件的三種權(quán)重模式質(zhì)心、因子和路徑求解到收斂的迭代次數(shù)分別為9、13和13,本文的PLS算法求解測評模型(簡稱MyPLS)僅僅需要5次。因此,My-PLS系統(tǒng)提高了對模型分析處理速度,在結(jié)構(gòu)模型系數(shù),潛變量估計值相關(guān)系數(shù),權(quán)重系數(shù),測量模型系數(shù)等方面,MyPLS與SmartPLS具有一致性;但在路徑系數(shù)、權(quán)重系數(shù)、公因子方差等個別項中有較大差異,可能是由于在缺失值處理方法不同導(dǎo)致的。

      5 結(jié)論

      本文分析了帶缺失值的顧客滿意度指數(shù)測評步驟:異常值處理、數(shù)據(jù)標(biāo)準(zhǔn)化、缺失值處理、利用PLS算法來估計模型中各個參數(shù)、求出顧客滿意度指數(shù)等;提出了一種缺失值處理方法“權(quán)重新定”;通過對某食品公司的帶缺失值數(shù)據(jù)分析,驗證了“權(quán)重新定”的缺失值處理方法的有效性。

      [1]Fornell C.,劉金蘭.顧客滿意度與ACSI[M].天津:天津大學(xué)出版社,2006.

      [2]Little R J A,Rubin D B.Statistical Analysis with Missing Data[M].New York:John Wiley&Sons,2002.

      [3]Wold H.Soft Modeling:The Basic Design and Some Extensions[A].K G J reskog H Wold,Systems under Indirect Observation[C].North-Holland:Amsterdam,1982.

      [4]Wang Q H,Rao J N K.Empirical Likelihood for Linear Regression Models under Imputation for Missing Response[J].The Canadian Jour?nal Statistics,2001,(29).

      [5]Allison,Paul D.Missingdata Techniquesfor Structural Equation mod?els[J].Journal of Abnormal Psychology,2003,112.

      [6]Tenenhaus,M.,Vinzi,V.E.,Chatelin,Y.M.,Lauro,C.PLSPath Model?ing[J].Computational Statisticsand Data Analysis,2005,48(1).

      [7]Ringle,C.M.,Wende,S.,Will,A.SmartPLS-Version 2.0.Universit?t Hamburg,Hamburg[Z].2005.

      猜你喜歡
      估計值權(quán)重顧客
      “一站式”服務(wù)滿足顧客
      權(quán)重常思“浮名輕”
      一道樣本的數(shù)字特征與頻率分布直方圖的交匯問題
      為黨督政勤履職 代民行權(quán)重?fù)?dān)當(dāng)
      統(tǒng)計信息
      2018年4月世界粗鋼產(chǎn)量表(續(xù))萬噸
      基于公約式權(quán)重的截短線性分組碼盲識別方法
      讓顧客自己做菜
      山東青年(2016年1期)2016-02-28 14:25:27
      以顧客為關(guān)注焦點(diǎn)
      層次分析法權(quán)重的計算:基于Lingo的數(shù)學(xué)模型
      河南科技(2014年15期)2014-02-27 14:12:51
      孙吴县| 蕲春县| 邮箱| 湘西| 治多县| 泰安市| 曲水县| 措美县| 丹东市| 昭通市| 和顺县| 婺源县| 久治县| 淮阳县| 禹州市| 淮滨县| 十堰市| 新巴尔虎右旗| 华蓥市| 天水市| 青州市| 靖西县| 隆回县| 宜黄县| 罗江县| 汉中市| 莎车县| 灵璧县| 芜湖市| 加查县| 呼和浩特市| 京山县| 安康市| 壶关县| 西乌| 威信县| 郸城县| 梓潼县| 古田县| 桐城市| 微博|