滕文惠 葛紫穎 康亞茹
[摘 要]SPSS是世界上最早采用圖形菜單驅(qū)動界面的統(tǒng)計軟件,它集數(shù)據(jù)錄入、整理、分析功能于一身。本文以學(xué)生成績數(shù)據(jù)為例,介紹了SPSS制作4種箱圖的方法和技巧,為教育和科研工作者提供一些參考。
[關(guān)鍵詞]SPSS;箱圖;數(shù)據(jù)描述
doi:10.3969/j.issn.1673 - 0194.2018.14.101
[中圖分類號]G40-03 [文獻標識碼]A [文章編號]1673-0194(2018)14-0-02
隨著云計算等技術(shù)的快速發(fā)展和互聯(lián)網(wǎng)、物聯(lián)網(wǎng)的廣泛應(yīng)用,人類迎來了大數(shù)據(jù)時代,而要管理和利用這些數(shù)據(jù),就需要專門的技術(shù)與工具。常見的統(tǒng)計分析軟件有SAS、SPSS、Minitab和Excel等。這些統(tǒng)計軟件的功能和作用大同小異,各自有所側(cè)重。其中的SAS和SPSS是目前在大型企業(yè)、各類院校以及科研機構(gòu)中較為流行的兩種統(tǒng)計軟件。特別是SPSS,其界面友好、功能強大、易學(xué)、易用,包含了幾乎全部尖端的統(tǒng)計分析方法,具備完善的數(shù)據(jù)定義、操作管理和開放的數(shù)據(jù)接口以及靈活、美觀的統(tǒng)計圖表制作。
1 SPSS軟件介紹
SPSS為IBM公司推出的一系列用于統(tǒng)計學(xué)分析運算、數(shù)據(jù)挖掘、預(yù)測分析和決策支持任務(wù)的軟件產(chǎn)品及相關(guān)服務(wù)的總稱。統(tǒng)計圖可以對數(shù)據(jù)的特征進行分析和描述,在探索的基礎(chǔ)上對數(shù)據(jù)進行更為復(fù)雜的建模分析。利用SPSS軟件可以繪制各種統(tǒng)計圖,主要包括條形圖、線性圖、面積圖等,不同圖形可能有著不同的數(shù)據(jù)要求和適用環(huán)境,使用時一定要考慮每種統(tǒng)計圖的功能和特點。
SPSS中直接繪制統(tǒng)計圖形的功能通過圖形菜單實現(xiàn),下設(shè)的子菜單有:圖形構(gòu)建程序、圖形畫板模板選擇程序和舊對話框,本文主要介紹了舊對話框作圖的方法。
2 箱圖在學(xué)生成績描述中的應(yīng)用
統(tǒng)計圖的使用,首先要滿足的是“準確”。“準確”就是指使用恰當?shù)慕y(tǒng)計圖去描述數(shù)據(jù)。通常在描述定性數(shù)據(jù)時主要使用的有柱狀圖、條形圖、餅圖和環(huán)形圖,反映的是定性變量的各個水平的頻數(shù)分布或者占比;描述定量數(shù)據(jù)時主要使用的是散點圖和箱圖,反映的是數(shù)據(jù)的分布情況,包括對稱性、是否有離群點等;對于時間序列數(shù)據(jù)則常使用折線圖,反映指標隨時間的變化趨勢。同時,寫好描述性文字,畫完圖要有適當?shù)脑u述。撰寫描述性文字可以分為兩個層次:第一個層次叫作客觀陳述,即描述統(tǒng)計圖中的內(nèi)容;第二個層次叫作合理推斷,即解讀統(tǒng)計圖背后的原因,猜測數(shù)據(jù)為什么呈現(xiàn)出某種規(guī)律。本文以箱圖為例,說明SPSS統(tǒng)計圖在數(shù)據(jù)描述中的應(yīng)用。
2.1 箱圖的介紹
箱圖是描述定量數(shù)據(jù)最常用的統(tǒng)計圖之一,主要用來描述一個定性變量和一個定量變量的關(guān)系,用于對比不同組別在某一定量變量上的平均水平、波動水平等的差異。在箱圖中,最上方和最下方的線段分別表示數(shù)據(jù)的最大值和最小值,其中箱圖的上方和下方的線段分別表示第三四分位數(shù)和第一四分位數(shù),箱圖中間的粗線段表示數(shù)據(jù)的中位數(shù)。另外,箱圖中在最上方和最下方的星號和圓圈分別表示樣本數(shù)據(jù)中的極端值。
打開圖形菜單,選擇舊對話框命令下的箱圖命令,SPSS將彈出“箱圖”導(dǎo)航對話框。如圖1所示。
在“箱圖”導(dǎo)航對話框中,可以選擇箱圖的類型,并定義箱圖中數(shù)據(jù)的表達方式。SPSS將箱圖大致分為以下兩種類型:
①簡單,一個圖形中有多個箱,各個箱相互獨立;②復(fù)式條形圖,一個圖形中有多個箱,多個箱之間按照分組變量分成若干組,相同組別的箱集中放置,以方便用戶進行比較。
“圖表中的數(shù)據(jù)為(Data in Chart are)”欄,可以選擇如下的數(shù)據(jù)表達類型。
①個案組摘要。用分類值作圖,箱圖中每一條線代表觀測量的一個分類。②各個變量的摘要。用變量值作圖,箱圖中每一條線代表一個變量。通過以上兩個箱圖類型和兩個數(shù)據(jù)表達方式的不同搭配,SPSS可以生成4種不同的箱圖。
2.2 4種箱圖的具體應(yīng)用
2.2.1 以個案組摘要為數(shù)據(jù)表達類型的簡單箱圖
在圖1中選擇箱圖類型為“簡單”,數(shù)據(jù)表達類型為“個案組摘要”,單擊定義。打開“定義簡單箱圖:個案組摘要設(shè)置對話框”,在該對話框中將數(shù)學(xué)選入“變量”框中,班級選入“類別軸”框中,然后單擊確定,即可在結(jié)果輸出窗口中得到各班級數(shù)學(xué)成績箱圖,如圖2所示。
通過圖2可以看出三班數(shù)學(xué)成績平均水平較低且有離群點,一班和二班相差較小,一班兩極分化較為嚴重。
2.2.2 以各個變量的摘要為數(shù)據(jù)表達類型的簡單箱圖
在圖1中選擇箱圖類型為“簡單”,數(shù)據(jù)表達類型為“各個變量的摘要”,單擊定義。打開“定義簡單箱圖:各個變量的摘要”設(shè)置對話框,在該對話框中將各科成績均選入“框的表征”列表框中,然后單擊確定,即可在結(jié)果輸出窗口中得到各科成績箱圖,如圖3所示。
通過圖3可以看出,英語和歷史成績平均分較高,且歷史成績較集中,物理成績較差且分散。
2.2.3 以個案組摘要為數(shù)據(jù)表達類型的復(fù)式條形圖
在圖1中選擇箱圖類型為“復(fù)式條形圖”,數(shù)據(jù)表達類型為“個案組摘要”,單擊定義。打開“定義復(fù)式箱圖:個案組摘要”設(shè)置對話框,在該對話框?qū)⑽锢磉x入“變量”框中,班級選入“類別軸”,性別選入“X軸上的聚類”,然后單擊確定,即可在結(jié)果輸出窗口中得到各班級男女生物理成績箱圖,如圖4所示。
通過圖4可以看出,三班男生物理成績高于其他班男生,二班女生物理成績高于其他班女生。相比較而言一班物理成績較分散,兩極分化嚴重。
2.2.4 以各個變量的摘要為數(shù)據(jù)表達類型的復(fù)式條形圖
在圖1中選擇箱圖類型為“復(fù)式條形圖”,數(shù)據(jù)表達類型為“各個變量的摘要”,單擊定義。打開“定義復(fù)式箱圖:各個變量的摘要”設(shè)置對話框,在該對話框?qū)?shù)學(xué)、語文、英語選入“框的表征”列表框中,“性別”選入類別軸,然后單擊確定,即可在結(jié)果輸出窗口中得到男女生語數(shù)英成績箱圖,如圖5所示。
通過圖5可以看出,男生數(shù)學(xué)和英語成績均高于女生,而女生語文成績要高于男生。
3 結(jié) 語
數(shù)據(jù)描述是對數(shù)據(jù)最基本的處理方式,難度也不大,但是在完整的分析中又不可或缺。SPSS在數(shù)據(jù)分析和作圖方面都是很好的軟件,本文主要介紹了箱圖作圖方法和技巧,其他類型圖的作圖方法類似。圖形的制作和數(shù)據(jù)分析都需要在實際應(yīng)用中反復(fù)摸索,不斷總結(jié),才能熟能生巧。
主要參考文獻
[1]武松,潘發(fā)明.SPSS統(tǒng)計分析大全[M].北京:清華大學(xué)出版社,2014.
[2]姜忠尉.統(tǒng)計分析軟件SPSS的特點和應(yīng)用分析[J].中國證券期貨,2012(4).