沈炎軍 劉欣雨 李亞杰
【摘要】抽樣調(diào)查是根據(jù)隨機(jī)的原則從總體中抽取部分實(shí)際數(shù)據(jù)進(jìn)行調(diào)查,根據(jù)樣本數(shù)據(jù)推算總體相應(yīng)的數(shù)量指標(biāo)的一種統(tǒng)計(jì)分析方法,具有經(jīng)濟(jì)性好,實(shí)效性強(qiáng),適應(yīng)面廣,準(zhǔn)確性高等特點(diǎn)。本文在實(shí)際問卷調(diào)查的基礎(chǔ)上,對抽樣調(diào)查中相關(guān)性分析、錯(cuò)誤數(shù)據(jù)處理和信息數(shù)據(jù)化做出了幾點(diǎn)建議。
【關(guān)鍵詞】問卷設(shè)計(jì) 相關(guān)性分析 錯(cuò)誤數(shù)據(jù)處理 信息數(shù)據(jù)化
【基金項(xiàng)目】項(xiàng)目名稱:北京市共建項(xiàng)目。項(xiàng)目編號:1111045148
【中圖分類號】G64 【文獻(xiàn)標(biāo)識(shí)碼】A 【文章編號】2095-3089(2012)06-0002-02
當(dāng)今社會(huì),問卷調(diào)查是一種了解大眾對具體事件態(tài)度的常用手段。一份好的問卷和分析更是能讓調(diào)查者準(zhǔn)確把握調(diào)查對象的真實(shí)想法,甚至預(yù)測事情的發(fā)展趨勢,做出相應(yīng)的調(diào)整。然而,設(shè)計(jì)問卷和分析調(diào)查結(jié)果并不是一件簡單的事情。本文就一份某高校對在校學(xué)生對《概率論》課程學(xué)習(xí)的調(diào)查為例,對問卷的設(shè)計(jì)和分析做出幾點(diǎn)建議。
一、相關(guān)性分析
相關(guān)性分析定義:
在大多數(shù)的問卷中,調(diào)查者都會(huì)有這樣的想法,想找出兩個(gè)或兩個(gè)以上的事件的內(nèi)在聯(lián)系,然而,由于問卷調(diào)查本身的一些特性,這種內(nèi)在聯(lián)系卻很難得到明確的分析。
在問卷中,為了減少浪費(fèi)調(diào)查對象的時(shí)間,調(diào)查者通過選用A、B、C、D等選項(xiàng)的形式讓被調(diào)查者進(jìn)行選擇。這樣的方式的確利于答題者回答問卷,在概率層面的分析上也較為清晰,可以得到準(zhǔn)確的比例數(shù)據(jù),從而知道各類態(tài)度人群的比重??墒窃谙嚓P(guān)性分析的層面上卻失去了這一優(yōu)點(diǎn)。
接下來讓我們看一個(gè)例子,通過對該例子的分析來說明這一問題。
例1:你對大學(xué)期間的數(shù)學(xué)學(xué)習(xí)的興趣是:
A. 很有興趣B. 有興趣C. 一般 D. 不感興趣
例2:你目前對《概率論》系列課程的學(xué)習(xí)狀況是:
A. 很困難 B. 有些困難 C. 能夠應(yīng)付D. 很順利
在實(shí)際做出分析之前,先讓我們對二者的關(guān)系做出一個(gè)估計(jì)。很顯然,大多數(shù)人都應(yīng)會(huì)認(rèn)為,對專業(yè)的熱愛程度與課程學(xué)習(xí)的良好程度應(yīng)該較為明顯的相關(guān)性。那么讓我們來用軟件分析一下統(tǒng)計(jì)的數(shù)據(jù)。
下面兩個(gè)圖形是用SPSS軟件為例1、例2做出的散點(diǎn)圖(如圖1)和Pearson相關(guān)系數(shù)(其中factor1、factor2分別表示例1、例2的選項(xiàng)):
通過分析,我們看到事實(shí)上相關(guān)性結(jié)果的分析結(jié)論與我們預(yù)想的結(jié)果大相徑庭。我們主觀判斷具有非常相關(guān)的問題得到的Pearson相關(guān)系數(shù)僅為0.297,相關(guān)性較低。而散點(diǎn)圖的分析上,盡管可以大致看出有一個(gè)負(fù)相關(guān)的趨勢,但由于選項(xiàng)的跳躍性太強(qiáng),很難具有說服力。
在相關(guān)性分析上,用相關(guān)系數(shù)和散點(diǎn)圖分析是很常用的手段,但是在這種情況下卻很難得到理想的結(jié)果?;谶@一問題本身,我們發(fā)現(xiàn)解決這一現(xiàn)象的根本途徑應(yīng)該從調(diào)查問卷的設(shè)置做起。本文提出兩個(gè)可以作為參考的解決方案。
(1)細(xì)化選項(xiàng)
(2)主觀打分
在問卷答案的設(shè)定上,我們不再選取傳統(tǒng)的A、B、C、D四個(gè)選項(xiàng),而是改換成被調(diào)查者主觀打分制,我們規(guī)定一個(gè)比較寬的范圍,由被調(diào)查者根據(jù)自己的判斷進(jìn)行打分,這樣一是結(jié)果直接通過數(shù)據(jù)形式反映,省去了調(diào)查者將文字信息轉(zhuǎn)化成數(shù)據(jù)的工作;二是數(shù)據(jù)離散程度較之先前較大,無論是散點(diǎn)圖還是相關(guān)性分析都會(huì)有一個(gè)較好的結(jié)果。
在之后的數(shù)字信息化的分析中,對于選項(xiàng)的設(shè)置問題也會(huì)繼續(xù)有較為深入的說明。
二、錯(cuò)誤數(shù)據(jù)處理分析
問卷統(tǒng)計(jì)結(jié)果的分析是問卷調(diào)查過程中極為重要的一個(gè)過程,大多數(shù)調(diào)查者為了調(diào)查數(shù)據(jù)的正確性都會(huì)在隨機(jī)抽取之前對問卷結(jié)果中出現(xiàn)明顯錯(cuò)誤的數(shù)據(jù)進(jìn)行清理。這些清理可以減少因?yàn)殇浫脲e(cuò)誤、答題者不認(rèn)真填寫等因素所造成的無用數(shù)據(jù)的數(shù)量,以達(dá)到增加調(diào)查結(jié)果正確性的目的。
在數(shù)據(jù)的清理中,最常用的是不正常數(shù)據(jù)的清理,即對于一些明顯異常的數(shù)據(jù)進(jìn)行去除。但是,對于調(diào)查過程中出現(xiàn)的答題者不認(rèn)真填寫,敷衍了事的問卷卻很難做出有效的判斷。
為了能有效的解決這一問題,在問卷中通過相似問題或者邏輯一致性問題的設(shè)置來判斷答卷者的認(rèn)真程度。
具體操作是在問卷設(shè)計(jì)時(shí)設(shè)計(jì)2-3道較為類似的題目,例如下面兩個(gè)問題:
例1.你覺得概率論的學(xué)習(xí)是應(yīng)試的嗎?請選擇:
A. 完全為了應(yīng)試
B. 有實(shí)際用途,但應(yīng)試成分多一些
C. 應(yīng)試和實(shí)際用處對半
D. 有應(yīng)試成分,但實(shí)際用途多一點(diǎn)
E. 完全為了實(shí)際用途
例2.你覺得概率論學(xué)習(xí)讓你得到了什么?
A. 僅僅拿到學(xué)分而已
B. 主要是拿學(xué)分,也學(xué)到一些有用的概率知識(shí),請選擇:
C. 學(xué)分和有用的概率知識(shí)對半
D. 主要學(xué)到了概率知識(shí),學(xué)分在其次
E. 非常有用的概率知識(shí)
仔細(xì)閱讀這兩個(gè)題目可以很容易的發(fā)現(xiàn),它們表達(dá)的意思具有很強(qiáng)的相似性。如果答題者認(rèn)真作答的話,這兩個(gè)問題的選擇答案不會(huì)有太大的出入,基本為同一選項(xiàng)或者相鄰選項(xiàng)。那么,我們可以這樣認(rèn)為,如果一份試卷在這兩個(gè)問題的出入較大,那么說明該答題者并沒有認(rèn)真做答,只是在敷衍了事,那么我們可以認(rèn)為他做出的其他選項(xiàng)也是不具有參考性的,可將該問卷內(nèi)容清除。
當(dāng)然,必須要指出的是,相似問題的選擇一定要謹(jǐn)慎,爭取做到本質(zhì)內(nèi)容一致而表述方式不同。若題目太過相似,有可能引起答題者重復(fù)做題不耐煩的心態(tài),反之,題目差異較大時(shí)則不能達(dá)到篩選問卷的作用。同時(shí),相似題目的位置應(yīng)該根據(jù)問卷本身情況安排適當(dāng),不要太近以防答題者對比分辨出來,或者位置不佳影響整體試卷的連貫性。
三、信息數(shù)字化
在對問卷結(jié)果進(jìn)行分析時(shí),我們常常會(huì)簡單地將選項(xiàng)A、B、C、D記為1、2、3、4,但同樣隨之而來的是除了基本的概率分析之外,卻很難對這些數(shù)字進(jìn)行其他的分析,甚至不能做出有效的散點(diǎn)圖。
因此,我們希望所得到的結(jié)果以數(shù)字的形式出現(xiàn),同時(shí),這些數(shù)字不僅僅是簡單的標(biāo)號,而是能代表不同的含義,例如,人們對某一事件的喜好、厭惡程度。這樣,只要我們對這些數(shù)字進(jìn)行相應(yīng)的分析,就可以得到我們想要的結(jié)果。
1.加權(quán)求平均值法
對于調(diào)查多種因素對某一事件的影響時(shí),我們可以選擇通過設(shè)定權(quán)值,然后加權(quán)求均值,用均值來表示影響強(qiáng)弱的程度。
例3:在學(xué)習(xí)《概率論》系列課程中,你對于下列學(xué)習(xí)方法認(rèn)可程度的打分(0表示完全不贊同,10表示完全贊同):
A. 教學(xué)效果太差主要需要自學(xué):()
B. 課堂聽講與課后復(fù)習(xí)、預(yù)習(xí)相結(jié)合:()
C. 主要以課堂認(rèn)真聽講為主:()
分析:設(shè)定A、B、C的權(quán)值分別1、3、5,即最終得到的平均值越大則表明答題者越傾向于上課聽講的來學(xué)習(xí),反之,則越傾向于自學(xué)。
假設(shè)本題A、B、C打分分別為1、4、8,則得到最終均值M=(1*1+3*4+5*8)/6≈9.可見加權(quán)平均是將各種因素的綜合作用做了適當(dāng)?shù)姆糯螅ɑ蛘呖s?。?,使得最主要的因素得到了突出。同時(shí),比起簡單的選擇某項(xiàng)作為學(xué)習(xí)方式,這樣得到的結(jié)果更為綜合,在相關(guān)性分析中能更好的體現(xiàn)出各種因素之間的內(nèi)在關(guān)系。
2.細(xì)化分值法
雖然加權(quán)求平均值法很好地解決了用綜合性的數(shù)字代表答題者態(tài)度的這一問題,然而,卻也使得調(diào)查問卷的題目數(shù)量大大增加,影響了答題者的認(rèn)真程度,尤其在問卷題目較多時(shí),很可能得不償失。
為了彌補(bǔ)這一缺陷,我們可以選用細(xì)化分值的方法,讓答題者直接給出代表其態(tài)度的數(shù)值,這樣的結(jié)果雖然沒有加權(quán)平均得到的更具綜合性和說服力,但是卻直觀簡練,也可以得到很好的結(jié)果。
同以上題為例來簡單說明這一方法的使用。
例4:在學(xué)習(xí)《概率論》系列課程中,你對于課堂學(xué)習(xí)和自學(xué)兩種方法認(rèn)可程度的打分:
(完全自學(xué))0-1-2-3-4-5-6-7-8-9-10(完全課堂學(xué)習(xí))
分析:這樣的出題方式保留了加權(quán)求平均值法將信息數(shù)字化的特征,同時(shí)減少了題目的數(shù)量和答題者的閱讀量,不會(huì)引起答題者的不滿情緒,保證了問卷的質(zhì)量。
但是,要指出的是,在這種方式的問題上題干意思一定要表述清楚,否則答題者因?yàn)槲茨苷_理解0-10的含義,將會(huì)導(dǎo)致結(jié)果的偏差較大。
對于本篇文章中提出的對于問卷的設(shè)計(jì)和分析的改進(jìn)方法,都是在實(shí)際調(diào)查過程中出現(xiàn)的問題,并通過這些方式得到了較好的解決。因此,這些方法針對具體的調(diào)查而言具有很強(qiáng)的實(shí)用性,可以得到較為理想的結(jié)果。