張 麗,史 毅,羅小琴
(1.蘭州大學 西北少數(shù)民族研究中心,蘭州 730000;2.中國人口與發(fā)展研究中心,北京 100081)
隨著統(tǒng)計方法和計算機技術(shù)的急速發(fā)展,量化性的大型社會調(diào)查在全世界范圍內(nèi)得到日益廣泛的關(guān)注和開展。調(diào)查數(shù)據(jù)為政府和各類組織、機構(gòu)提供了研究所需要的最基礎(chǔ)也是最關(guān)鍵的信息,在當今社會科學研究中扮演著極為重要的角色。然而,由于一項調(diào)查涉及環(huán)節(jié)較多,從前期設計到后期執(zhí)行再到問卷錄入和數(shù)據(jù)清理,任何一個環(huán)節(jié)都可能產(chǎn)生誤差,以至于我們所使用的調(diào)查數(shù)據(jù)的質(zhì)量到底如何,往往連數(shù)據(jù)的收集者都不能給予一個確切并且肯定的回答。
從誤差來源的角度看,調(diào)查全程中產(chǎn)生的誤差來源主要由抽樣誤差和非抽樣誤差兩部分構(gòu)成,抽樣誤差方面的研究較多且相對成熟,非抽樣誤差的分析因為受到資料收集的局限性影響而較少地開展。非抽樣誤差主要是中期調(diào)查訪問過程和后期數(shù)據(jù)錄入過程中產(chǎn)生的誤差,一部分受被調(diào)查者的個人特征和主觀因素所影響,對于問卷調(diào)查的消極態(tài)度致使應答情況與真實情況差別較大,這部分因素在傳統(tǒng)調(diào)查中可以被很容易地測量。另一部分,非抽樣誤差受到訪問環(huán)境和訪問員的個人特征及主觀因素的影響,這部分因素在傳統(tǒng)調(diào)查中難以測量被觀測,這也是非抽樣誤差的研究積累較少的重要原因之一。
對于非抽樣誤差的研究必須要依賴于調(diào)查過程中所記錄下來的平行數(shù)據(jù),這一要求使得對于調(diào)查執(zhí)行的即時跟蹤變得尤為重要。越來越多的研究者們意識到,應答率以及應答的整個過程是否標準化直接關(guān)系到調(diào)查數(shù)據(jù)的質(zhì)量[1],在大型調(diào)查及數(shù)據(jù)庫的建立過程中研究者們都盡可能全面地將平行數(shù)據(jù)進行記錄和保存[2,3]。然而,雖然國內(nèi)的大型調(diào)查將這些極為重要的數(shù)據(jù)資料進行了保留,但是平行數(shù)據(jù)挖掘技術(shù)進展緩慢[4],同時極少有研究機構(gòu)公布調(diào)查平行數(shù)據(jù),能被國內(nèi)學者充分利用的數(shù)據(jù)極少。對比國外研究機構(gòu)對于平行數(shù)據(jù)的深入挖掘,并利用對平行數(shù)據(jù)的細致分析改善整個調(diào)查過程、提高應答率及操作效率,國內(nèi)社會調(diào)查所做工作顯得尤為不足。
國外降低非抽樣誤差的方法論研究已經(jīng)相對成熟,對于國內(nèi)追蹤調(diào)查的設計、執(zhí)行和質(zhì)量控制等全過程具有重要參考價值和借鑒意義。從非抽樣誤差的產(chǎn)生階段來看,調(diào)查研究的三個階段——定位、征尋、數(shù)據(jù)搜集,都有可能產(chǎn)生非抽樣誤差[5]。根據(jù)非抽樣誤差的產(chǎn)生階段,研究者們繼而對影響非抽樣誤差的因素進行了研究。調(diào)查的內(nèi)容、回答者的性質(zhì)、訪問的時間、調(diào)查前是否預約、訪問次數(shù)、訪問員的素質(zhì)和技能、問卷的設計,另外還有收集數(shù)據(jù)的方法都會影響應答率和調(diào)查數(shù)據(jù)的質(zhì)量。具體來說,對于抽樣設計階段,影響因素包括問卷總體上是否讓人能夠接受,是否有精心設計的調(diào)查方案、簡明的提問內(nèi)容、科學的提問順序。對于尋找被訪者階段,是否清楚地知道聯(lián)系地址或電話號碼,是否有特殊的追蹤努力,以及調(diào)查人員的知識培訓等都是重要影響因素[6]。及數(shù)據(jù)搜集階段,是否預先通知被訪者(提前對調(diào)查加以說明)、是否協(xié)調(diào)選擇不同的訪問時間(如白天或晚上、工作時間或假期),是否有多次訪問嘗試(包括訪問次數(shù)、經(jīng)費、時間、次序和調(diào)查的選派等),訪問的性別(挑選女訪問員,比較容易產(chǎn)生信任感),是否保證保守秘密取得信任,是否有一定的獎勵都在不同程度影響應答情況[7]。
針對降低非抽樣誤差的解決辦法,國內(nèi)外學者也進行了討論。主要是關(guān)于無應答的事前預防和事后補救兩類方法。事前預防方法主要是指要減少統(tǒng)計調(diào)查中的無回答和多次修改現(xiàn)象,首先從事前預防角度入手,Kish(1965)[8]、Warwick(1975)[9]、Mosteller(1977)[10]等都對提高無回答率的措施進行過廣泛的討論;Warner(1965)[11]、Glenn(1967)[12]等人則繼續(xù)就敏感性問題的隨機化模型設計開展了研究;Dohrenwend(1970)[13]、Sudman等(1974)[14]都曾研究過激勵方法對改善無回答率的效果。Madow等Olkin(1983)[15]采用不同的方法來決定訪問調(diào)查中理想的嘗試次數(shù)。盡管現(xiàn)有研究較為豐富,但值得注意的是,事后補救方法主要是加權(quán)調(diào)整和插補法,主要是針對缺失數(shù)據(jù)的處理,而不是對過程控制的研究。
總體而言,社會調(diào)查質(zhì)量的測量一直是方法研究中的難題,衡量數(shù)據(jù)質(zhì)量最常見的方式是使用其他調(diào)查數(shù)據(jù)對關(guān)鍵變量進行比較,但該方法需要大量其他成功調(diào)查的支持,并且只能得到相對結(jié)論。同時,盡管國內(nèi)外已經(jīng)開始重視對平行數(shù)據(jù)的使用,但主要集中于對無應答問題的研究,對于應答時長的分析幾乎是空白。應答時長反映了被訪者對問題的理解程度與應答意愿,對其分析有助于更好地發(fā)揮平行數(shù)據(jù)對于質(zhì)量評估的重要價值,對當前的社會調(diào)查也可以起到指導借鑒的作用。因此,本文依托中國家庭發(fā)展追蹤調(diào)查的并行數(shù)據(jù)和調(diào)查數(shù)據(jù),重點分析了問卷調(diào)查過程中應答時間與調(diào)查質(zhì)量控制之間的關(guān)系,對問卷應答時間的主要影響因素進行量化分析的同時,為問卷調(diào)查質(zhì)量改進提供了具有一定參考價值的建議。
2014年開展的中國家庭發(fā)展追蹤調(diào)查對調(diào)查時間、問題修改次數(shù)等并行數(shù)據(jù)進行了完整的保留,該調(diào)查涉及我國31個?。▍^(qū)、市)的3萬多個家庭戶,調(diào)查問卷分為家庭問卷、個人問卷、村/居問卷三類,個人問卷包含兒童、青少年、成年人和老年人問卷四類。值得注意的是,中國家庭發(fā)展追蹤調(diào)查對并行數(shù)據(jù)進行了完整的保留,同時包括了問卷中問題的應答結(jié)果和應答時間兩類數(shù)據(jù),可以真實地記錄下調(diào)查執(zhí)行的整個過程,質(zhì)量管控的基礎(chǔ)數(shù)據(jù)信息正是來源于并行數(shù)據(jù)。由于家庭問卷的應答時間嚴重受到家庭規(guī)模的影響,村居問卷存在被訪者特征不明確等問題,本文使用樣本量最大的成年人問卷作為研究對象進行分析。在排除無效問題的前提下,成年問卷共涉及調(diào)查問題47道,包含健康與生活、工作與保障、婚育與避孕三個部分。
本文以對關(guān)鍵變量應答時長的影響機制分析為目的,因此主要使用定量分析方法。首先,使用中國家庭追蹤調(diào)查成年問卷的并行數(shù)據(jù)進行描述統(tǒng)計,進行不同問題/不同主體應答時長的比較分析,同時結(jié)合相關(guān)研究探討主要變量的信度測量方法。其次,應答時長作為一個服從正態(tài)分布的連續(xù)性變量符合OLS回歸的基本假設,因此本文使用OLS回歸分析從個體特征、訪問環(huán)境和區(qū)域三個層次對應答時長的影響因素進行分析。
從問題設置的類型、內(nèi)容及被訪者的應答方式看,并結(jié)合問題的應答時間,成年人問卷的問題可劃分為信息應答、邏輯計算、隱私信息和邏輯判斷四類,四類問題進一步可細分為個人信息、就業(yè)信息、時間計算、數(shù)量計算、性與生殖健康、主觀判斷、知識判斷和概念判斷八組。無論是從問題的一級分類,還是二級分組,應答時長均存在較為明顯的差異(見下頁表1)。
3.1.1 基于記憶與認知的信息應答
問題內(nèi)容的熟悉程度是應答時間的主要影響因素之一,而熟悉程度則取決于個體的生活經(jīng)驗記憶和認知水平。信息應答類的問題主要基于個體生活事實提出問題,因此較易于回答,平均應答時間為9.73s。與此同時,個體生活事實存在層次劃分,性別、身高、體重等基本特征更容易理解和回答,平均應答時間為9.1s;找工作、職業(yè)和行業(yè)類型、工作內(nèi)容等就業(yè)信息則需要進一步的信息加工和處理,平均應答時間更長,為10.28s。值得注意的是,信息應答類問題的應答時長因個體的記憶和認知水平而存在差異,如手機號碼需要經(jīng)過一定的記憶反饋,應答時間較長;個體所屬行業(yè)類型則需要對行業(yè)分類存在一定的了解和掌握,平均應答時間遠高于其他的信息類問題。
3.1.2 基于時間與數(shù)量的邏輯計算
相較于信息應答類問題,有些問題不僅需要對問題內(nèi)容的記憶與基本認知,更需要進一步的邏輯計算,因此應答過程較之更長。單位的標準化是邏輯計算效率的重要條件,與閱讀量、年度消費等負責問題相比,時間的計算耗時更短。
3.1.3 隱私信息的應答時長
在不同的文化習俗和社會規(guī)范中,個體對于隱私信息的反映與處理存在不同的態(tài)度和方式。在涉及個人因素的情況下,個體的平均應答時間會存在一定程度的延長,隱私信息類問題平均應答時間為18.19s,高于信息應答和邏輯計算類問題。與此同時,隱私信息的程度不同,個體的反應時間也存在差異,婚姻變動時間、第一次性行為等涉及個體回憶的隱私類問題更難以回答,平均應答時間超過20s;是否有過性行為、懷孕結(jié)果等問題則不需要進一步的信息加工和處理,平均應答時間較短,基本不超過10s。
3.1.4 基于知識與概念的邏輯判斷
在四類問題中,邏輯判斷問題不僅受到被訪者對問題理解程度的影響,而且受到問題設計、調(diào)查過程等前期環(huán)節(jié)的影響,因此平均應答時間最高,超過20s。其中,基于主觀判斷的邏輯問題較易于回答,平均應答時間為9.73s。與此同時,個體生活事實存在層次劃分,性別、身高、體重等基本特征更容易理解和回答,平均應答時間為12.26s;閱讀內(nèi)容、衛(wèi)生健康關(guān)注類型、慢性病類型等需要對相關(guān)內(nèi)容加以了解的知識判斷題較難回答,平均應答時間更長,為14.17s。問題涉及的概念越抽象和書面化,調(diào)查員和被訪者越需要更長的時間進行理解和互動,其應答時間越長。如對于流動經(jīng)歷、范圍和時間的回答,被訪者需要在厘清流動概念的基礎(chǔ)上進行應答,平均應答時間接近40s,遠高于其他的判斷類問題。值得注意的是,在回答流動經(jīng)歷問題之后,被訪者完成了對流動的概念理解,其后的流動范圍和時間的應答時長則呈現(xiàn)遞減的趨勢。
表1 基于應答時間的問題聚類分組結(jié)果 (單位:秒)
問卷的問題內(nèi)容與設計是問卷總體應答時間的內(nèi)部影響因素,而調(diào)查環(huán)境則構(gòu)成了問卷應答時間的外部因素。通過對我國東中西部的問卷應答時間比較(見表2),可以看到調(diào)查地的差異所帶來的重要影響。其中,東部地區(qū)的問卷應答時間最短,平均僅耗費7.82分鐘;中部地區(qū)較高,平均耗費10.73分鐘;西部地區(qū)較之更高,平均耗費11.17分鐘;而東北地區(qū)最高,平均耗費14.9分鐘。同時,從區(qū)域應答時間的內(nèi)部分化程度看,東部地區(qū)分化程度較低,其他地區(qū)的問卷應答時間存在較大的離散性。
表2 不同調(diào)查環(huán)境下的問卷應答時間比較 (單位:分)
除了問卷內(nèi)部設計和外部調(diào)查環(huán)境的影響,調(diào)查員的水平也影響著調(diào)查過程的質(zhì)量(見表3)。總體而言,女性調(diào)查員完成問卷平均所需的時間高于男性,受教育程度較高的調(diào)查員完成問卷的耗時低于受教育程度較低的調(diào)查員。值得注意的是,對調(diào)查操作系統(tǒng)的數(shù)量程度越高,并不意味著調(diào)查耗時越短;從事計生工作的調(diào)查員的調(diào)查耗時反而高于非計生工作者。
表3 不同類型調(diào)查員的問卷應答時間比較 (單位:分)
在討論基于問卷設計、環(huán)境、調(diào)查過程的應答差異之后,被訪者本身的個體特征直接關(guān)系到對問卷內(nèi)容的理解程度和應答意愿,是最不可忽視的重要因素(見下頁表4)。從性別的角度看,男性的平均應答時間低于女性,且組內(nèi)差異較??;從城鄉(xiāng)的差異看,農(nóng)業(yè)戶口的被訪者平均應答時間低于非農(nóng)業(yè)戶口的被訪者,但其應答時間的長短分化嚴重,組內(nèi)差異較大。
表4 基于被訪者層次問卷應答時間的性別和城鄉(xiāng)差異 (單位:分)
被訪者的受教育程度既是其知識水平、認知和理解能力的反映,也很大程度地影響了其知識水平、認知和理解能力。因此,受教育程度越高,調(diào)查耗時越短(見表5)。研究生學歷的被訪者調(diào)查耗時最低,僅為7.5分鐘,遠低于其他受教育程度的被訪者;未上過學的被訪者調(diào)查耗時最高,為10.73分鐘,遠高于其他受教育程度的受訪者。盡管初中水平的被訪者平均調(diào)查耗時低于高中和大專學歷的被訪者,但其組內(nèi)差異較大。
表5 基于被訪者層次問卷應答時間的教育差異 (單位:分)
調(diào)查問卷設計過程中是否足夠考慮了文化敏感性問題,直接影響到不同文化被訪者的應答行為。這一觀點在問卷應答時間的民族差異中可以得到證實(見表6),在樣本量足夠的前提下,大部分少數(shù)民族的調(diào)查耗時遠高于漢族。其中藏族、侗族、土家族等少數(shù)民族的調(diào)查耗時非常高,這與對問卷內(nèi)容的跨文化理解有關(guān)。
表6 基于被訪者層次問卷應答時間的民族差異 (單位:分)
應答時長影響因素的模型設計如圖1所示:
圖1變量應答時長影響因素的模型構(gòu)建
通過描述性的比較分析可見,應答時長作為問卷調(diào)查的最終結(jié)果,受到問卷設計、調(diào)查過程、調(diào)查員和被訪者特征等多重因素的影響,但僅僅通過描述性的分析難以檢驗應答時長影響因素的多元性。因此,本文以問卷應答總時長和問卷中具有代表性的關(guān)鍵變量應答時間作為因變量,如回憶類問題/敏感類問題/反應性問題等,基于被訪者特征、調(diào)查員特征和調(diào)查環(huán)境三個方面的變量,使用OLS回歸分析的方法進行分析。考慮到問卷應答中的跳答問題會通過答題數(shù)量而影響總時長,在模型中同時控制了跳答變量的影響,結(jié)果見下頁表7所示。
從問卷的總應答時間看,男性應答時間顯著低于女性,漢族應答時間顯著低于少數(shù)民族,受教育程度高的被訪者應答時間顯著低于受教育程度低的被訪者。非農(nóng)就業(yè)者的應答時間顯著低于農(nóng)業(yè)從業(yè)者,與此不相應的是,非農(nóng)戶口的被訪者應答時間卻顯著高于農(nóng)業(yè)戶口的被訪者,顯示出非農(nóng)戶口的從業(yè)者更容易停頓或終端中斷,需要更多的時間進行問卷回答。同時,被訪者個人的學習習慣對于應答時長影響顯著,較高的閱讀量和新聞關(guān)注度更容易減少問卷訪問時長。從邏輯計算類問題的應答時間看,退休或失業(yè)人員對于收入問題的反映較快,一方面是由于收入來源單一容易計算,一方面是由于對收入的隱私問題更不關(guān)注。同時,經(jīng)濟壓力較大的被訪者關(guān)于收入的應答時間較長,其需要更多的時間計算收入大小和判斷是否方面方便透露收入問題。從主觀判斷類問題的應答時間看,就業(yè)者和失業(yè)者更容易快速地對經(jīng)濟壓力、工作壓力和工作生活沖突等問題做出反映,而務農(nóng)、學生和退休人員長期缺少相關(guān)生活經(jīng)驗,對這類問題的應答速度較慢。從知識判斷類問題的應答時間看,不同受教育程度的被訪者應答時間因問題不同而存在相反的影響,如關(guān)于慢性病類型的判斷,受教育程度越高應答時間越短;而關(guān)于關(guān)注衛(wèi)生與健康問題的判斷,受教育程度越低應答時間越短。從概念判斷類問題的應答時間看,受教育程度越高,關(guān)于流動經(jīng)歷的應答時間越短;非農(nóng)就業(yè)者、退休者和失業(yè)者需要更多的時間回答關(guān)于流動經(jīng)歷的問題;同時,由于流動概念的專業(yè)性,閱讀量和學習時間的提升并不會減少應答時間,反而會增加應答困擾從而延長應答時間。
從問卷的總應答時間看,男性調(diào)查員的調(diào)查耗時顯著低于女性,受教育程度高的調(diào)查員調(diào)查耗時顯著低于受教育程度低的調(diào)查員。值得注意的是,對調(diào)查系統(tǒng)的熟練程度越高,不僅不會減少調(diào)查耗時,反而會增加調(diào)查耗時。從事計生工作的調(diào)查員調(diào)查耗時顯著高于非計生工作者。從邏輯計算類問題的應答時間看,調(diào)查員的個體特征對于改善被訪者的邏輯計算能力并無幫助,因為未能顯著影響該類問題的應答時間。然而,從事計生工作的調(diào)查員可以顯著減少被訪者關(guān)于性與生殖健康等隱私問題的應答時間。從主觀判斷類問題的應答時間看,調(diào)查員的受教育程度越高,被訪者對經(jīng)濟壓力、工作壓力和工作生活沖突等主觀問題的反應速度越慢,可能與調(diào)查員在調(diào)查過程中對問題的過度解釋有關(guān)。從知識判斷類問題的應答時間看,不同受教育程度的被訪者應答時間因問題不同而存在相反的影響,如關(guān)于慢性病類型的判斷,受教育程度越高應答時間越短;而關(guān)于關(guān)注衛(wèi)生與健康問題的判斷,受教育程度越低應答時間越短。從概念判斷類問題的應答時間看,調(diào)查員的受教育程度和調(diào)查系統(tǒng)熟練程度越高,對于流動概念的解釋速度越快,從而有助于減少被訪者的應答時間。
表7 成人問卷及關(guān)鍵變量應答時長的影響因素
問卷的問題內(nèi)容與設計是問卷總體應答時間的內(nèi)部影響因素,而調(diào)查環(huán)境則構(gòu)成了問卷應答時間的外部因素因素。通過回歸結(jié)果可知,我國東北地區(qū)的問卷應答時間最長,西部地區(qū)次之,中部地區(qū)再次之,東部地區(qū)最短。一方面顯示出不同地域應答反應速度的差異,另一方面也顯示出不同地域應答習慣的差異。對于這一結(jié)果可能的解釋是:相較于較為發(fā)達的東部地區(qū)而言,中西部地區(qū)的時間觀念和對問題的理解程度較低,因而延長了應答時間。而對于平均受教育程度較高的東北地區(qū)而言,時間觀念和文化習慣是導致應答時間延長的重要原因。這一結(jié)論從流動經(jīng)歷問題的應答時長中可以得到佐證,東北地區(qū)在概念判斷問題上的應答時長遠低于其他地區(qū)。
問卷設計中存在的理解阻力是影響應答效率的重要原因,理解阻力主要來自于被訪者理解能力、跨文化表達能力和問題復雜程度三個方面。首先,經(jīng)驗分析結(jié)果顯示,被訪者受教育程度越高,問卷總應答時間越短,各類問題的應答時間也越短,表明不同受教育程度的被訪者對于統(tǒng)一問題的理解能力和反應速度存在顯著差異。其次,跨文化調(diào)查中的文化敏感性問題不利于提高應答效率。少數(shù)民族的應答時間過長,一方面反映出少數(shù)民族被訪者自身對問題的理解能力,另一方面顯示出問卷設計過程中的跨文化問題所產(chǎn)生的不利影響。再次,問題的復雜程度越高,被訪者越難以理解問題內(nèi)容,調(diào)查員也越難以解釋問題內(nèi)容。這一問題在邏輯計算類問題中顯得尤為突出,調(diào)查員和被訪者受教育程度的改善對于減少邏輯計算類問題的應答時長并無顯著影響。從調(diào)查質(zhì)量改進的角度而言,被訪者的受教育程度和文化融合短期內(nèi)難以得到改善,因此通過改善問題的口語化程度、強化文化敏感性問題和簡化問題的邏輯計算程序減少理解阻力,將對于縮減應答時長從而提升應答效率產(chǎn)生積極影響。
從社會調(diào)查方法研究的傳統(tǒng)結(jié)論而言,調(diào)查員的質(zhì)量與調(diào)查效率之間存在正相關(guān)關(guān)系,然而這一結(jié)論僅在一定范圍內(nèi)得以成立。首先,在調(diào)查培訓時選擇熟練和受教育程度較高的調(diào)查員有助于減少邏輯判斷類問題的應答時長,換言之,在處理復雜程度較高的問題上,調(diào)查員的熟練程度和受教育程度與調(diào)查效率之間存在正相關(guān)。其次,選擇熟練和受教育程度較高的調(diào)查員反而增加了主觀判斷類問題的應答時長,這在一定程度上表明,在面對需要被訪者主觀判斷的問題時,調(diào)查員的過度解讀對于提高調(diào)查效率將產(chǎn)生不利影響。因此,如何在保證問題能夠得到充分解釋的同時又不產(chǎn)生過度解讀,是問卷培訓過程中需要重視的主要問題。由于篇幅所限,本文尚未涉及應答時長與調(diào)查質(zhì)量之間的關(guān)系進行展開討論,而這一問題對于調(diào)查質(zhì)量的改進同樣具有現(xiàn)實價值與方法論意義,需要作更加深入地探討。