【摘要】《義務教育數(shù)學課程標準(2022年版)》新增了“箱線圖與百分位數(shù)”內(nèi)容,“箱線圖”首次出現(xiàn)在課標中,這給教師和學生都帶來了新的挑戰(zhàn).首先從時代發(fā)展需要、數(shù)學課程需要、學生發(fā)展需要三方面論述了箱線圖與百分位數(shù)的教育價值;其次闡明了百分位數(shù)的定義和算法、箱線圖的定義和畫法;隨后通過《義務教育數(shù)學課程標準(2022年版)》中的例86對箱線圖與百分位數(shù)加以應用說明,發(fā)現(xiàn)按照定義繪制的箱線圖與借助統(tǒng)計軟件繪制的箱線圖存在上邊緣下邊緣取值不一的問題,而相同統(tǒng)計軟件中繪制的箱線圖也存在不同表示形式.
【關鍵詞】統(tǒng)計與概率;箱線圖;百分位數(shù)
數(shù)據(jù)分析是高中數(shù)學六大核心素養(yǎng)之一,無論是義務教育階段還是高中階段均對學生數(shù)據(jù)分析能力有了新要求,《義務教育數(shù)學課程標準(2022年版)》(以下簡稱《課標(2022年版)》)在第四學段“統(tǒng)計與概率”領域中新增內(nèi)容要求“會計算四分位數(shù),了解四分位數(shù)與箱線圖的關系,感悟百分位數(shù)的意義”,《普通高中數(shù)學課程標準(2017年版2020年修訂)》(以下簡稱《高中課標》)在“概率與統(tǒng)計”主題中要求“結合實例,能用樣本估計百分位數(shù),理解百分位數(shù)的統(tǒng)計含義”.顯然高中階段對百分位數(shù)的要求由初中階段的了解提升至理解、能夠,學生在義務教育階段對“箱線圖與百分位數(shù)”的理解程度必然會直接影響高中階段“百分位數(shù)”的學習.那什么是百分位數(shù)?箱線圖又是什么?為什么要在義務教育階段引入“箱線圖與百分位數(shù)”的學習?如何計算百分位數(shù)、繪制箱線圖?如何利用箱線圖與百分位數(shù)分析數(shù)據(jù)?
1箱線圖與百分位數(shù)的教育價值
1.1時代發(fā)展需要
進入21世紀以來,隨著信息技術的飛速發(fā)展和廣泛應用,世界各國越來越重視統(tǒng)計的學習.從商業(yè)決策到科學研究,都需要對大量數(shù)據(jù)進行分析和處理,大數(shù)據(jù)、云計算、人工智能等領域更是依賴數(shù)據(jù)分析的觀念與技術,人們對統(tǒng)計學習的關注度也逐漸提升.箱線圖和百分位數(shù)作為數(shù)據(jù)分析的基礎工具,在金融分析、醫(yī)學研究、質(zhì)量檢測等方面有著廣泛應用,能夠解決不同領域的實際問題.
1.2數(shù)學課程需要
2001年,“統(tǒng)計與概率”就作為獨立領域設置在課標中,并且第一次在小學和初中階段增加了概率的內(nèi)容[1].《課標(2022年版)》和《高中課標》新增了“百分位數(shù)”的內(nèi)容,《課標(2022年版)》更是在附錄部分以一個實例(例86)讓學生感悟箱線圖的學習價值,這反映了教育部門對于統(tǒng)計學教育的重視,也顯示了這些知識在數(shù)學課程中的必要性[2].箱線圖和百分位數(shù)作為統(tǒng)計與概率領域下的重要知識,它的引入不僅能夠豐富數(shù)學課程內(nèi)容,使數(shù)學內(nèi)容更完善,還能使數(shù)學內(nèi)容更貼近學生生活實際,讓學生體會數(shù)學來源于生活又應用于生活.
1.3學生發(fā)展需要
社會的飛速發(fā)展對我國的人才培養(yǎng)提出了新要求,數(shù)學教育的目標不僅僅局限于傳授數(shù)學知識和技能,更在于通過數(shù)學學科培養(yǎng)學生的綜合素質(zhì)和能力.百分位數(shù)和箱線圖作為統(tǒng)計分析的重要工具,不僅能夠有效地幫助學生把握數(shù)據(jù)特征[3]、掌握數(shù)據(jù)分析的基本技能、提升數(shù)學素養(yǎng)和綜合應用能力,還能為他們將來職業(yè)生涯和社會生活中遇到的各類數(shù)據(jù)問題提供處理工具和方法,從而做出更加合理的決策和分析,這對他們未來在數(shù)據(jù)驅(qū)動的世界中取得成功至關重要.
2箱線圖與百分位數(shù)
2.1百分位數(shù)
在了解箱線圖之前,我們要了解什么是百分位數(shù).人教A版普通高中教科書數(shù)學必修第二冊給出了百分位數(shù)的概念:一般地,一組數(shù)據(jù)的第p百分位數(shù)是這樣一個值,它使得這組數(shù)據(jù)中至少有p%的數(shù)據(jù)小于或等于這個值,且至少有(100-p)%的數(shù)據(jù)大于或等于這個值.
因此,初中所學中位數(shù),相當于第50百分位數(shù);除中位數(shù)外,常用的分位數(shù)還有第25百分位數(shù),第75百分位數(shù).這三個分位數(shù)把一組由小到大排列后的數(shù)據(jù)分成四等份,因此稱為四分位數(shù).其中第25百分位數(shù)也稱為第一四分位數(shù)或下四分為數(shù),第75百分位數(shù)也稱為第三四分位數(shù)或上四分位數(shù)[4].
百分位數(shù)在統(tǒng)計學中有著十分重要的計數(shù)地位,是表達統(tǒng)計量、刻畫數(shù)據(jù)信息的重要形式[5].百分位數(shù)的主要意義在于其能提供有關數(shù)據(jù)分布狀況的重要信息.通過了解一個值處于數(shù)據(jù)集的什么位置,能夠?qū)φ麄€數(shù)據(jù)集的分布有一個直觀的認識,能夠快速識別數(shù)據(jù)的集中趨勢與離散程度,而無需查看整個數(shù)據(jù)集.百分位數(shù)還具有識別異常值的作用.在數(shù)據(jù)分析中,異常值可能對分析結果產(chǎn)生重大影響,特別是在計算平均值、標準差等統(tǒng)計量時,而百分位數(shù)可以幫我們確定哪些值是極端值,應當被排除在進一步的分析之外,使得分析更加準確和穩(wěn)定.
對于百分位數(shù)的計算,我們可以通過下面的步驟計算一組n個數(shù)據(jù)的第p百分位數(shù):
第1步:按從小到大排列原始數(shù)據(jù).
第2步:計算i=n×p%
第3步:若i不是整數(shù),而大于i的比鄰整數(shù)為j,則第p百分位數(shù)為第j項數(shù)據(jù);若i是整數(shù),則第p百分位數(shù)為第i項與第(i+1)項數(shù)據(jù)的平均數(shù).
2.2箱線圖
箱線圖又稱盒須圖、盒式圖或箱形圖,1977年由美國著名統(tǒng)計學家約翰·圖基發(fā)明,是一種利用上邊緣、上四分位數(shù)、中位數(shù)、下四分位數(shù)和下邊緣來描述一組數(shù)據(jù)分散情況的統(tǒng)計圖,因形狀如箱子而得名,它主要用于反映原始數(shù)據(jù)特征的分布,并對數(shù)據(jù)的異常值進行標注,還能夠快速地展現(xiàn)出多組數(shù)據(jù)的分布情況和它們的相對差異.
要繪制箱線圖,除了計算前文描述的四分位數(shù)外,還需計算上邊緣(最大值)、下邊緣(最小值)和異常值,其中異常值是指大于上邊緣(最大值)或小于下邊緣(最小值)的值.此外,為了計算這三個特征值,需先計算四分位差(簡稱“IQR”),四分位差(IQR)=上四分位數(shù)(Q1)-下四分位數(shù)(Q3),上邊緣(最大值)=Q1+1.5IQR,下邊緣(最小值)=Q3-1.5IQR.
箱線圖的繪制方法是:先計算出一組數(shù)據(jù)的上邊緣、下邊緣和四分位數(shù);然后連接上四分位數(shù)和下分位數(shù)畫出箱體;再將上邊緣和下邊緣與箱體相連接,中位數(shù)在箱體中間[6];最后標出異常值,異常值常用空心圓表示.箱線圖圖示,如圖1所示.
3箱線圖與百分位數(shù)的應用
下面以《課標(2022年版)》例86“箱線圖與百分位數(shù)”為例,對箱線圖與百分位數(shù)加以應用.
某銀行有A和B兩個理財經(jīng)營團隊.2018—2020年,這兩個理財團隊分別負責經(jīng)營12項理財產(chǎn)品,收益率(單位:%)如下:
A:4.773.986.444.892.153.85
3.643.213.182.024.114.10
B:3.183.843.993.673.403.60
4.104.214.154.443.873.91
試評價A和B兩個團隊的經(jīng)營水平.
學生可以通過計算平均數(shù)和方差來評價兩個團隊的經(jīng)營水平,但僅僅用平均數(shù)和方差評價似乎不夠全面.為挖掘更多數(shù)據(jù)信息,使評價更加全面合理,考慮采納“四分位數(shù)”來進一步評價兩個團隊的經(jīng)營水平.以下將以四分位數(shù)和箱線圖來評價兩團隊經(jīng)營水平.
解:A和B兩個團隊的收益率按從小到大排列為:
A:2.022.153.183.213.643.85
3.984.104.114.774.896.44
B:3.183.403.603.673.843.87
3.913.994.104.154.214.44
由12×25%=3,12×50%=6,12×75%=9,可知樣本數(shù)據(jù)的第25,50,75百分位數(shù)分別為第3項數(shù)據(jù)和第4項數(shù)據(jù)的平均數(shù)、第6項數(shù)據(jù)和第7項數(shù)據(jù)的平均數(shù)、第9項數(shù)據(jù)和第10項數(shù)據(jù)的平均數(shù).
計算出箱線圖所需數(shù)據(jù)后,畫一條能包含所有數(shù)據(jù)的數(shù)軸,在數(shù)軸上描出各組數(shù)據(jù)的上邊緣、四分位數(shù)、下邊緣,連接各組數(shù)據(jù)的Q1和Q3畫出箱體,在Q2、上邊緣、下邊緣處分別畫平行于箱體的短平行線,再將上邊緣、下邊緣與箱體用虛線連接,最后標出兩組數(shù)據(jù)的異常值.兩團隊收益率箱線圖如圖2所示.
基于兩團隊的箱線圖,我們可以獲得兩組數(shù)據(jù)更直觀的數(shù)據(jù)分析.通過觀察箱線圖可以直接得出,兩團隊收益率的中位數(shù)幾乎相等,但B團隊的箱體高度比A團隊箱體高度矮,說明B團隊的經(jīng)營水平波動性小,數(shù)據(jù)更集中;相比而言A團隊的經(jīng)營水平波動性更大,數(shù)據(jù)更分散.此外,從箱線圖中還可以看出A團隊的收益率有1個異常值,說明A團隊的收益率兩極分化更明顯.因此,可以更有把握的說,兩個團隊經(jīng)營效益基本一樣,但B團隊的經(jīng)營水平比A團隊的經(jīng)營水平更平穩(wěn).
4繪制箱線圖存在的問題
4.1上邊緣與下邊緣的不同取值
將按照箱線圖定義繪制出來的箱線圖(圖2)與《課標(2022年版)》中的箱線圖(圖3)對比發(fā)現(xiàn)兩者存在較大差異.差異主要體現(xiàn)在上邊緣和下邊緣的取值大小上,《課標(2022年版)》中的箱線圖是在去掉數(shù)據(jù)異常值后,將剩下數(shù)據(jù)中的最大值作為了上邊緣,最小值作為了下邊緣.
通過查閱資料發(fā)現(xiàn),無論是課標還是教科書,均未給出箱線圖的具體定義,而國內(nèi)不少學者也將上邊緣、下邊緣分別稱為最大值、最小值,因此箱線圖中的上邊緣、下邊緣的取值有兩種情況,一種是按定義計算,另一種是在除去數(shù)據(jù)異常值后,分別取數(shù)據(jù)的最大值、最小值.顯然后一種取值方法更簡便快捷.
4.2統(tǒng)計軟件中箱線圖的不同表示形式
隨著科技的發(fā)展,現(xiàn)代信息技術已經(jīng)走進課堂,百分位數(shù)的計算、箱線圖的繪制都可以借助統(tǒng)計軟件完成,Excel是中學最常見的統(tǒng)計軟件.Excel中箱線圖的上邊緣、下邊緣的取值也是在除去數(shù)據(jù)異常值后,分別取數(shù)據(jù)的最大值、最小值,但進一步比較發(fā)現(xiàn)Excel中的箱線圖也有不同表示形式.
在Excel中有一個函數(shù)專門用于計算一組數(shù)據(jù)的四分位數(shù),即QUARTILE函數(shù).該函數(shù)的表達式包含兩個參數(shù),第1參數(shù)為數(shù)據(jù)區(qū)域,第2參數(shù)為分位點類型,表達式為:=QUARTILE(數(shù)據(jù)區(qū)域,分位點類型).其中第2參數(shù)分位點類型是指通過特定的參數(shù)值,來表示計算不同分位點的結果值,它具體包含5個參數(shù)值,分別是“0表示最小值,1表示下四分位點,2表示中位數(shù),3表示上四分位點,4表示最大值”.將數(shù)據(jù)輸入Excel中,點擊空白處,輸入QUARTILE函數(shù)表達式,分位點類型分別輸入1,2,3,即可求出該組數(shù)據(jù)的四分位數(shù);隨后選中數(shù)據(jù),點擊插入圖表,可以直接插入箱線圖.
按照以上步驟,將A,B兩團隊收益率分別輸入Excel,得出的四分位數(shù)與上文一致;選中兩團隊的數(shù)據(jù),點擊插入箱線圖,其結果如圖4所示.此時箱線圖中的四分位數(shù)與上文計算結果并不相同,并且A團隊的異常值也并未排除.
這是因為Excel中QUARTILE函數(shù)的查詢邏輯與箱線圖內(nèi)置規(guī)則略有不同,箱線圖內(nèi)置規(guī)則有兩種計算方式,一個是包含中值(即中位數(shù)),另一個是排除中值.默認情況下是排除中值,因此圖形中的四分位數(shù)與公式結果不同,一般情況下,我們以函數(shù)公式的結果為準.此外,Excel中箱線圖默認不顯示離群值點(即異常值),一般情況下,我們需選擇顯示離群值點.包含中值、顯示離群值點后的箱線圖如圖5所示.
5結束語
百分位數(shù)為我們提供了一種衡量數(shù)據(jù)集中趨勢和分布狀態(tài)的方法,而箱線圖以簡單直觀的圖形方式表達出數(shù)據(jù)的分布情況,特別是集中趨勢、離散程度和異常值的識別.如果說百分位數(shù)是從“數(shù)”的角度來分析數(shù)據(jù),箱線圖則是從“形”的角度來反映數(shù)據(jù)的分散情況.從教學的角度來看,百分位數(shù)和箱線圖不僅是傳授給學生的重要統(tǒng)計概念,更是培養(yǎng)他們數(shù)據(jù)分析思維和批判性思考能力的有效工具.在箱線圖與百分位數(shù)的教學過程中,教師要確保學生能夠有效地理解和應用這些統(tǒng)計概念,注重理論與實踐的結合,用實際數(shù)據(jù)來演示百分位數(shù)和箱線圖的計算和繪制過程,科學合理使用統(tǒng)計軟件,確保學生不僅理解這些統(tǒng)計工具的原理,還能夠熟練地應用于實際數(shù)據(jù)分析中.
參考文獻
[1]武維民.如何理解和把握“統(tǒng)計與概率”領域內(nèi)容的調(diào)整和變化:馬云鵬教授、吳正憲老師訪談錄(七)[J].小學教學:數(shù)學版,2022(11):9-13.
[2]劉華明.初中數(shù)學統(tǒng)計與概率的新成員:四分位數(shù)與箱線圖[J].中小學數(shù)學:初中版,2023(Z1):116-117.
[3]高凱亮.新課標背景下“統(tǒng)計與概率”的變化:對“四分位數(shù)與箱線圖”的思考[J].中學數(shù)學雜志,2023(10):15-18.
[4]人民教育出版社,課程教材研究所,中學數(shù)學課程教材研究開發(fā)中心.普通高中教科書·數(shù)學(必修):第二冊[M].北京:人民教育出版社,2019.
[5]王勝楠,王羅那.滲透“讀—思—達”教學發(fā)展數(shù)據(jù)分析素養(yǎng):以“四分位數(shù)與箱線圖”教學為例[J].西藏教育,2022(12):40-43,48.
[6]賈俊平,何曉群,金勇.統(tǒng)計學:第四版[M].北京:中國人民大學出版社,2009.
作者簡介鄧樂琪(2000—),女,湖南邵陽人,碩士研究生;主要從事數(shù)學教育教學研究.
孔德宏(1972—),男,云南曲靖人,副教授,碩士研究生導師;主要從事數(shù)學教育教學研究.