王煥陽 楊睿 陳錚 林子玄 金玥
摘要:對于了解研究大學(xué)生的學(xué)習(xí)狀態(tài)、消費觀念、價值取向等系列問題,離不開調(diào)查研究、而傳統(tǒng)問卷形式只具有短期吸引力,形式也較為分散,回收率低,根據(jù)美國GSS調(diào)查(1972-2002年)傳統(tǒng)問卷調(diào)查的平均回收率僅為76%,且問題的回答質(zhì)量不高。而與傳統(tǒng)問卷調(diào)查相比,采用分組問卷調(diào)查得到的數(shù)據(jù)更易劃分,更集中,問卷的回收率和有效率明顯提高,通過實驗表明分組問卷調(diào)查的回收率達(dá)到86.67%。但與此同時,發(fā)現(xiàn)存在數(shù)據(jù)“選項過度集中”和“固定選項模式”的問卷,對結(jié)論分析造成一定的影響。為進(jìn)一步提升問卷的有效率,決定采用以方差為基礎(chǔ)的數(shù)據(jù)篩選方法,從影響問卷有效率的兩種因素入手,對問題問卷進(jìn)行全面而深入分析,并在此基礎(chǔ)上研究了問卷篩選算法以及問卷篩選系統(tǒng),大大提高了問卷的有效率,客觀的反映出了問卷的真實情況。
關(guān)鍵詞:問卷調(diào)查;學(xué)生調(diào)查;篩選算法;篩選系統(tǒng)
引言
通過對大學(xué)生進(jìn)行問卷調(diào)查,以便得知當(dāng)代大學(xué)生的價值觀,消費觀,學(xué)習(xí)狀態(tài)等一些列問題,通過所得數(shù)據(jù)反饋于大學(xué)生,用于幫助教師教學(xué),企業(yè)提供個性化服務(wù)。本研究主要從如下幾方面進(jìn)行:
1)問卷調(diào)查方式。區(qū)別于傳統(tǒng)的問卷調(diào)查以及網(wǎng)絡(luò)問卷調(diào)查,本研究主要采用面向大學(xué)生的分組調(diào)查方式,根據(jù)已研究的數(shù)據(jù)表明,問卷的回收率達(dá)到86.67%,有效問卷數(shù)據(jù)占總數(shù)的86.15%,大大提高了問卷的回收率與有效率。
2)人工數(shù)據(jù)集的建立。由于調(diào)查力度有限而導(dǎo)致數(shù)據(jù)過少,采用隨機生成數(shù)的方式,建立一個符合實際情況的人工數(shù)據(jù)集以便進(jìn)行數(shù)據(jù)分析。
3)問題數(shù)據(jù)處理。通過對分組得到的數(shù)據(jù)的進(jìn)行分析,發(fā)現(xiàn)存在數(shù)據(jù)“選項過度集中”和“固定選項模式”的問卷。設(shè)計一種算法融合分組調(diào)查的兩種情況(“選項過度集中”與“固定選項模式”問卷),得出最終的分析結(jié)論。
4)問卷篩選系統(tǒng)。將算法與程序相結(jié)合,編寫可執(zhí)行程序,實現(xiàn)問卷篩選功能。
1.對大學(xué)生的研究調(diào)查
1.1 國內(nèi)研究
中國有關(guān)大學(xué)生發(fā)展調(diào)查的實證研究發(fā)展至今已初具規(guī)模。2007年清華大學(xué)引進(jìn)全美大學(xué)生學(xué)習(xí)參與度調(diào)查 NSSE ,并邀請27所院校聯(lián)合組建NSSE-China項目團(tuán)隊,項目發(fā)展至今已經(jīng)擴(kuò)展為“中國大學(xué)生學(xué)習(xí)與發(fā)展追蹤調(diào)查” 2007 。北京大學(xué)教育學(xué)院課題組自2006年開始每年都進(jìn)行“首都高校學(xué)生學(xué)業(yè)發(fā)展?fàn)顩r調(diào)查”,調(diào)查參考了美國的NSSE調(diào)查、UCLA的CSS調(diào)查及日本東京大學(xué)的CRUMP調(diào)查等。北京師范大學(xué)的周作宇于2001年引進(jìn)美國的College Student Experiences Questionnaire CSEQ ,開展“中國大學(xué)生就讀經(jīng)驗調(diào)查”。由杜智敏主持的課題組自2002年起,在北京市高校開展了針對大學(xué)生學(xué)習(xí)狀況的調(diào)查,即“北京市大學(xué)生學(xué)習(xí)狀況調(diào)查”。
1.2 國外研究
世界不同國家和地區(qū)的院校均開展了許多調(diào)查以收集大學(xué)生在校學(xué)習(xí)及發(fā)展的信息。以美國為例, 到目前為止已存在多個針對大學(xué)生群體、以了解本校教育現(xiàn)狀為目的、以提高教育質(zhì)量為目標(biāo)的大學(xué)生發(fā)展調(diào)查, 如NSSE、大學(xué)生學(xué)習(xí)評估 (CLA) 、CSEQ、CIRP等。這些調(diào)查有的關(guān)注大學(xué)生發(fā)展的輸入特征, 有的關(guān)注產(chǎn)出特征, 也有的關(guān)注大學(xué)生的學(xué)習(xí)經(jīng)驗。在研究大學(xué)生發(fā)展?fàn)顩r方面影響最廣的全國性研究主要是NSSE和CLA。澳大利亞主要實施的是大學(xué)生課程體驗調(diào)查 (CEQ) , 它將學(xué)生在課堂上的學(xué)習(xí)體驗作為增值評價的手段, 通過調(diào)查大學(xué)生課程學(xué)習(xí)體驗了解大學(xué)生整體的學(xué)習(xí)發(fā)展?fàn)顩r。
2.問卷調(diào)查方式比較
2.1 傳統(tǒng)調(diào)查方式
傳統(tǒng)調(diào)查模式有舉手表決,投票表決等方式,發(fā)展到現(xiàn)在以問卷調(diào)查為主。但傳統(tǒng)紙質(zhì)問卷調(diào)查投入人力物力較大,調(diào)查成本較高,周期較長,而且問卷回收率低以及效率不高。
隨著科技進(jìn)步,網(wǎng)絡(luò)調(diào)查問卷登上歷史舞臺。國外的調(diào)查網(wǎng)站surveymonkey提供了這種方式,國內(nèi)的問卷網(wǎng)、問卷星、調(diào)查派等網(wǎng)站提供了這種調(diào)查模式。網(wǎng)絡(luò)調(diào)查問卷雖然無地域限制,成本相對低廉,但卻無法保證調(diào)查對象的參與比例,以及問卷的回答質(zhì)量。
2.2 分組問卷調(diào)查
對于大學(xué)生來說,我們進(jìn)行走進(jìn)課堂或班級或者寢室,通過對學(xué)生進(jìn)行分組,采用組內(nèi)成員共做一張問卷的方式進(jìn)行數(shù)據(jù)采集,這樣統(tǒng)計出的數(shù)據(jù)更易劃分,更集中,能通過同學(xué)間的互相帶動收集到更有效的數(shù)據(jù)。根據(jù)已研究的數(shù)據(jù)表明,分組問卷的回收率達(dá)到86.67%,超過了傳統(tǒng)問卷調(diào)查的回收率(美國GSS調(diào)查,1972-2002年,平均回收率76%),有效問卷數(shù)據(jù)占總數(shù)的86.15%,大大提高了問卷的回收率與有效率。
3.人工數(shù)據(jù)集的建立
通過對問卷調(diào)查所獲數(shù)據(jù)的整理分析,我們發(fā)現(xiàn)數(shù)據(jù)符合正態(tài)分布模式(如圖1所示),受問卷調(diào)查對象限制,所得數(shù)據(jù)規(guī)模無法達(dá)到足夠大,我們利用數(shù)據(jù)仿真技術(shù)建立符合調(diào)查數(shù)據(jù)規(guī)律的人工數(shù)據(jù)集,作為進(jìn)一步研究的對象。在MATLAB仿真軟件中用normrnd()函數(shù)生成服從正態(tài)分布的隨機數(shù)(如圖2所示)。在隨機生成的數(shù)據(jù)集中,發(fā)現(xiàn)存在一定數(shù)量的符合“固定選項模式”的數(shù)據(jù)行(如圖3所示)與“選項過度集中”的數(shù)據(jù)行(如圖4所示),證明我們所提出的算法產(chǎn)生的人工數(shù)據(jù)集可以有效仿真真實的問卷。
4.算法建立
建立針對新問卷調(diào)查模式的數(shù)據(jù)處理算法,篩選出新模式下出現(xiàn)的問題問卷。根據(jù)前述,分組問卷調(diào)查可以起到提高問卷回收率和有效率的積極作用,同時也可能會帶來“選項過度集中”和“固定選項模式”等干擾因素,對應(yīng)學(xué)生在問卷作答時的“盲從”和“敷衍”的負(fù)面情緒。對此,本研究通過對符合問卷調(diào)查實際的隨機數(shù)表的模擬問卷數(shù)據(jù)進(jìn)行分析,發(fā)現(xiàn)通過方差的方式可以進(jìn)行數(shù)據(jù)融合完成針對包含多種類型問題數(shù)據(jù)的調(diào)查問卷的篩選工作,以此為基礎(chǔ)設(shè)計了一種解決了分組調(diào)查的兩種干擾情況(“選項過度集中”與“固定選項模式”問卷)的算法。
5.篩選系統(tǒng)建立
將算法與程序相結(jié)合,根據(jù)研究所得篩選算法,使用高級語言來編寫一個可執(zhí)行程序,實現(xiàn)問卷篩選功能,根據(jù)系統(tǒng)基本功能分析,我們得到了系統(tǒng)功能模塊圖(如圖5所示)。設(shè)計采用方便易操作的想法,運行系統(tǒng)后,首先使用數(shù)據(jù)導(dǎo)入功能將處于某一位置的Excel表中數(shù)據(jù)導(dǎo)入后臺數(shù)據(jù)庫(如圖6所示)。導(dǎo)入數(shù)據(jù)后,利用篩選算法對目標(biāo)數(shù)據(jù)進(jìn)行篩選,在主界面顯示含有兩類問題(“選項過度集中”與“固定選項模式”)的數(shù)據(jù)行與問題問卷概況(如圖7所示)。了解數(shù)據(jù)概況后,可進(jìn)一步查看數(shù)據(jù)詳情與問題問卷詳情(如圖4所示)。點擊每行按鈕可查看錯誤詳情:點擊左側(cè)各個“問卷詳情按鈕”,可查看各份錯誤問卷的具體數(shù)據(jù)(如圖8所示);若點擊右側(cè)各個“類型詳情按鈕”,可查看各個錯誤類型的詳情。綜上所述,將目標(biāo)數(shù)據(jù)導(dǎo)入系統(tǒng)中,需導(dǎo)入功能;篩選功能則是系統(tǒng)的重中之重,將目標(biāo)數(shù)據(jù)篩選完成后得到所需數(shù)據(jù)是系統(tǒng)的主要功能;查看各種數(shù)據(jù)詳情則需要詳情查看功能和問題數(shù)據(jù)詳情查看功能。
6.結(jié)語
隨著云計算、移動互聯(lián)網(wǎng)和物聯(lián)網(wǎng)等新一代信息技術(shù)的創(chuàng)新和應(yīng)用普及,21世紀(jì)人類飛速的進(jìn)入大數(shù)據(jù)時代,現(xiàn)在越來越多的企業(yè)需要抓住大學(xué)生市場,將海量碎片化的信息數(shù)據(jù)及時地進(jìn)行篩選、分析,并最終歸納、整理,得出企業(yè)最終需要的信息,以便進(jìn)行面向大學(xué)生的個性化服務(wù)。本研究的群體主要為在校大學(xué)生,大學(xué)生群體作為社會的重要組成部分,越發(fā)受到社會關(guān)注,近年來,大學(xué)生所占消費比例越來越大,已然成為不容忽視的特殊消費群體。例如在餐飲行業(yè),可應(yīng)用問卷調(diào)查分析進(jìn)行餐飲經(jīng)營模式的優(yōu)化,以便提供針對大學(xué)生的特色餐飲。在通信方面,可提供針對大學(xué)生的通信套餐,同時也可以從社會活動方面對大學(xué)生產(chǎn)生針對性政策。無論是從工作、學(xué)習(xí)、生活等各個方面,都能根據(jù)分析所得結(jié)論提供更具體的針對性服務(wù),從而產(chǎn)生更好的影響。而隨著經(jīng)濟(jì)的發(fā)展和科技的進(jìn)步,大學(xué)生的消費支出將會逐年增加,且增幅越來越大,由此看來本研究對于學(xué)校教學(xué)以及企業(yè)個性化服務(wù)都有非常大的借鑒作用。
參考文獻(xiàn):
[1]曾五一, 黃炳藝. 調(diào)查問卷的可信度和有效度分析[J]. 統(tǒng)計與信息論壇, 2005, 20(6):11-15.
[2]鄧娟, 吳菁, 崔靜,等. 基于“雨課堂”的翻轉(zhuǎn)課堂實施的實踐與思考[J]. 護(hù)士進(jìn)修雜志, 2018, 33(2):152-154.
[3]問卷調(diào)查中量表缺失值填補方法的模擬比較研究[D]. 中國醫(yī)科大學(xué), 2018.
[4]劉超. 軟件工程數(shù)據(jù)挖掘研究進(jìn)展[J]. 農(nóng)家參謀, 2018(3):201-201.
[5]何鑫. 大數(shù)據(jù)時代背景下電子商務(wù)的發(fā)展趨勢[J]. 現(xiàn)代商貿(mào)工業(yè), 2018, v.39(21):45-46.
[6]明粉娟. 數(shù)據(jù)透視表在審計工作中的應(yīng)用[J]. 財會學(xué)習(xí), 2018(9):151-151.
[7]Kohavi R, John G, Long R, et al. MLC++: a machine learning library in C++[M]. 1994.
[8]Bradski G, Kaehler A. Learning OpenCV: Computer Vision in C++ with the OpenCV Library[M]. 2013.
基金項目:沈陽師范大學(xué)大學(xué)生科學(xué)研究基金項目“基于考核數(shù)據(jù)的大學(xué)生畫像研究”(L(A)2019309)
沈陽師范大學(xué) 軟件學(xué)院 遼寧 沈陽 110034