DING Lin 申亞琴 張 萍
(1長(zhǎng)江大學(xué)物理與光電工程學(xué)院,湖北 荊州 434023; 2俄亥俄州立大學(xué)教育學(xué)院,美國(guó) 俄亥俄 哥倫布 43210;3北京師范大學(xué)物理學(xué)系,北京 100875)
物理教育研究(Physics Education Research,簡(jiǎn)稱PER)是一種有目的、有計(jì)劃的活動(dòng),研究人員必須依據(jù)研究目的收集數(shù)據(jù)、選擇適合的數(shù)據(jù)分析方法和對(duì)結(jié)果給出合理的解釋。調(diào)查研究(survey research)是物理教育量化研究方法中基礎(chǔ)和常用的方法,其目的是在大樣本的人群中定量描述我們感興趣的方面,調(diào)查研究使用的數(shù)學(xué)工具是描述統(tǒng)計(jì)[1]。這類研究主要是用來描繪或概括在物理教育研究中獲得數(shù)據(jù)的基本情況,顯示其分布特征,研究不涉及因果[2]。
在收集數(shù)據(jù)之前,研究人員必須明確研究問題或假設(shè)。這些問題或假設(shè)應(yīng)該包括感興趣的變量、測(cè)量工具和研究樣本3個(gè)方面。
感興趣的變量反映了一個(gè)研究人員希望觀察或測(cè)量什么。例如研究人員可能希望調(diào)查學(xué)生在一個(gè)物理學(xué)課程的學(xué)習(xí)過程中對(duì)某些物理概念的理解,或者調(diào)查他們對(duì)物理學(xué)本質(zhì)和物理學(xué)習(xí)方法的認(rèn)識(shí)論。這些變量通常是模糊的,不能通過直接觀察得出結(jié)論,因此確定與之相關(guān)的可以直接測(cè)量的變量是非常關(guān)鍵的。例如,研究人員通常使用學(xué)生在物理概念測(cè)試的得分來研究學(xué)生對(duì)物理概念的理解。研究中還需要通過一些理論框架或文獻(xiàn)綜述來獲得一個(gè)基準(zhǔn),確定直觀測(cè)量量(學(xué)生的分?jǐn)?shù))和不可觀察的變量(學(xué)生對(duì)概念的理解)之間的聯(lián)系。
明確了感興趣的變量后,就要尋找適合的測(cè)量工具。PER學(xué)者陸續(xù)開發(fā)出許多測(cè)試工具,涵蓋了非常廣泛的主題,包括:物理概念測(cè)試、科學(xué)推理和物理認(rèn)識(shí)論等[3]。如果沒有合適的調(diào)查工具,就需要研究者按照科學(xué)范式自行開發(fā)新的測(cè)量工具。
調(diào)查研究還需要依據(jù)測(cè)試目標(biāo)合理選擇調(diào)查方法、測(cè)試時(shí)間和抽取樣本。調(diào)查方法包括紙筆測(cè)驗(yàn)、郵寄調(diào)查問卷、網(wǎng)上投票或者訪談等;根據(jù)不同的研究目標(biāo),調(diào)查可以在不同時(shí)間點(diǎn)進(jìn)行,例如在教學(xué)前、教學(xué)中或教學(xué)后。在調(diào)查研究中必須依據(jù)研究目標(biāo)選擇有代表性的樣本,考慮一些重要的因素,包括研究對(duì)象的身份(學(xué)生、教育工作者、家長(zhǎng)、研究人員、管理者、決策者等等)、主體的數(shù)量、學(xué)歷、年齡、性別、種族、國(guó)籍或地區(qū),以及其他可能與試圖研究的問題相關(guān)的因素,使通過樣本獲得的定量結(jié)果可以理想地代表總體。
數(shù)據(jù)收集完成后,研究人員需要謹(jǐn)慎選擇適當(dāng)?shù)臄?shù)據(jù)分析方法。在描述統(tǒng)計(jì)中常用的方法包括分析平均值和中位數(shù)、標(biāo)準(zhǔn)差和標(biāo)準(zhǔn)誤、標(biāo)準(zhǔn)分?jǐn)?shù)、相關(guān)和回歸。相關(guān)和回歸需要兩個(gè)或更多數(shù)據(jù)集,其他統(tǒng)計(jì)方法都用來描述單個(gè)數(shù)據(jù)集。下面我們首先介紹單個(gè)數(shù)據(jù)集的統(tǒng)計(jì)方法,然后再討論以相關(guān)和回歸為代表的多個(gè)數(shù)據(jù)集的分析方法。
對(duì)于單組數(shù)據(jù),進(jìn)行統(tǒng)計(jì)分析時(shí),常常計(jì)算數(shù)據(jù)的一些特征量,包括集中量(measures of central tendency)和差異量(measures of variability),分別用來解釋一組統(tǒng)計(jì)數(shù)據(jù)的集中趨勢(shì)和離散程度。
描述一組數(shù)據(jù)集中量的參數(shù)有:平均數(shù),中位數(shù)和眾數(shù)等。在物理教育研究中,應(yīng)用最為廣泛的是算數(shù)平均數(shù)。只有定距 (interval) 和定比(ratio) 數(shù)據(jù)可以進(jìn)行加減法運(yùn)算[2],對(duì)它們計(jì)算平均數(shù)才有意義。平均數(shù)通常不適用于定類(normial) 或定序(ordinal) 數(shù)據(jù),在實(shí)際應(yīng)用中,如果定序數(shù)據(jù)是正態(tài)分布的,通??梢越瓶闯啥ň鄶?shù)據(jù)。因此在大部分PER研究中,研究人員經(jīng)常將測(cè)試總分(例如大部分的概念測(cè)試工具如FCI,F(xiàn)MCE,BEMA 等測(cè)得的數(shù)據(jù))視為定距數(shù)據(jù)。但是,對(duì)于使用李克特等級(jí)量表(Liket-scale inventory)進(jìn)行問卷調(diào)查時(shí)(例如C-LASS,MPEX),通常不能將其得分看成定距數(shù)據(jù),計(jì)算其平均數(shù)。
對(duì)于定序或定類數(shù)據(jù)的描述統(tǒng)計(jì)往往以頻數(shù)(frequency)分布的形式進(jìn)行。通常的方法是計(jì)算定序或定類數(shù)據(jù)中不同類別所占的百分比。例如,為了檢查不同專業(yè)選學(xué)物理課程學(xué)生人數(shù)中的性別分布,研究人員可以分別計(jì)算每一個(gè)專業(yè)的男、女生數(shù)量,然后計(jì)算百分比,找出分布規(guī)律。
在物理教育研究中,許多教育現(xiàn)象或教和學(xué)的行為之間存在著一定的相互關(guān)系,這實(shí)質(zhì)上涉及兩組數(shù)據(jù)的相互關(guān)系。在描述統(tǒng)計(jì)中使用相關(guān)和回歸分析來研究?jī)山M以上數(shù)據(jù)之間的關(guān)系。
相關(guān)(correlation)的描述統(tǒng)計(jì)方法可以用來分析兩組數(shù)據(jù)集之間的共變關(guān)系,相關(guān)系數(shù)r表征兩個(gè)變量之間變化方向及密切程度。r的取值在-1到+1之間。r為負(fù)表示兩個(gè)變量負(fù)相關(guān),為正表示兩個(gè)變量是正相關(guān)。|r|越高表明兩組數(shù)據(jù)集之間的相關(guān)越高,|r|=1稱完全相關(guān),r=0稱完全不相關(guān)。
由于研究對(duì)象的不同,相關(guān)系數(shù)有多種定義方式。需要研究者根據(jù)研究主題和數(shù)據(jù)類型正確選擇。較為常用是皮爾遜相關(guān)系數(shù)(Pearson coefficient),用于計(jì)算兩組定距或定比數(shù)據(jù)的線性相關(guān)的程度,要求兩組數(shù)據(jù)均滿足正態(tài)分布,并且具有一一對(duì)應(yīng)關(guān)系。在PER中,這種方法經(jīng)常被用于調(diào)查學(xué)生在兩種不同的測(cè)驗(yàn)中的表現(xiàn)是不是彼此相關(guān)。例如,Thornton等人在倫斯勒理工學(xué)院物理課程工作室對(duì)大約2000名學(xué)生進(jìn)行了力的概念測(cè)試(Force Concept Inventory簡(jiǎn)稱FCI)和力與運(yùn)動(dòng)概念評(píng)測(cè)(Force and Motion Conceptual Evaluation簡(jiǎn)稱FMCE)。在這兩個(gè)測(cè)試中,將學(xué)生測(cè)試分?jǐn)?shù)近似為定距數(shù)據(jù),并用其計(jì)算皮爾遜相關(guān)系數(shù)。結(jié)果顯示,盡管在這兩個(gè)測(cè)試中每個(gè)主題在內(nèi)容覆蓋面和題目數(shù)量上有差異,但是FMCE和FCI這兩個(gè)測(cè)試分?jǐn)?shù)之間有相當(dāng)高的正相關(guān)(r=0.78,最大值為1),表明這兩項(xiàng)測(cè)試所測(cè)量的內(nèi)容有很大一部分是重疊的[4]。
對(duì)于定序數(shù)據(jù),乃至非正態(tài)分布的定距或定比數(shù)據(jù),我們需要使用斯皮爾曼秩相關(guān)系數(shù)ρ(Spearman’s correlation coefficient for ranked data)來計(jì)算相關(guān)[5];而對(duì)于定類數(shù)據(jù),如果相關(guān)的計(jì)算超出了描述統(tǒng)計(jì)的范圍,則是推斷統(tǒng)計(jì)的內(nèi)容,但是對(duì)于兩個(gè)定類數(shù)據(jù)集都是二分變量的特殊情況,我們可以使用Phi(φ)系數(shù)來計(jì)算相關(guān),它是皮爾遜相關(guān)系數(shù)對(duì)兩個(gè)二分變量數(shù)據(jù)集的一種簡(jiǎn)化處理。例如,Heller和Huffman用這種方法來計(jì)算FCI項(xiàng)目中的二分變量(得分1或者0)的Phi相關(guān)系數(shù)[6,7];基于這些相關(guān),他們進(jìn)行了數(shù)據(jù)的構(gòu)成分析,用以檢查FCI每個(gè)項(xiàng)目是否能被歸入FCI工具設(shè)計(jì)的六個(gè)主題(維度)之中。
相關(guān)系數(shù)只能說明兩個(gè)變量之間的變化方向及密切程度,不揭示事物內(nèi)在的因果關(guān)系。如果需要分析相關(guān)的兩個(gè)變量之間的內(nèi)在聯(lián)系,研究者必須對(duì)這兩個(gè)變量的本質(zhì)意義進(jìn)行分析。另外,相關(guān)系數(shù)對(duì)樣本規(guī)模是非常敏感的(樣本量越小越容易出現(xiàn)偽相關(guān),最極端情況是只有兩個(gè)數(shù)據(jù)樣本,兩點(diǎn)一線,其相關(guān)系數(shù)為1,但不具有統(tǒng)計(jì)學(xué)意義),因此研究人員在報(bào)告相關(guān)時(shí),需要報(bào)告樣本規(guī)模和相關(guān)的顯著性水平,從而判定這個(gè)樣本是否有統(tǒng)計(jì)學(xué)意義。顯著性檢驗(yàn)超出描述統(tǒng)計(jì),涉及推斷統(tǒng)計(jì),將在后續(xù)文章中詳細(xì)介紹。
回歸分析(regression analysis)是相關(guān)分析的延伸,如果一個(gè)變量(回歸分析中稱為因變量)和另外一個(gè)或多個(gè)變量(自變量)存在顯著相關(guān),說明它們之間有某種共變關(guān)系,如何進(jìn)一步用數(shù)學(xué)模型來描述這種變化關(guān)系,這就涉及回歸分析。粗略地說,回歸分析是尋找相關(guān)關(guān)系中非確定性關(guān)系的某種確定性。按照研究涉及自變量的多少,分為一元回歸分析和多元回歸分析。依據(jù)自變量和因變量之間的函數(shù)關(guān)系分為線性回歸和非線性回歸。線性回歸關(guān)系相對(duì)簡(jiǎn)單,因變量的變化和每個(gè)自變量的變化都成正比。
在物理學(xué)教育研究中,線性回歸經(jīng)常被用來描述一個(gè)感興趣的變量是如何根據(jù)其他變量變化的。所選的自變量和因變量之間具有較強(qiáng)的相關(guān),在理論上具有教育意義和內(nèi)在的可能因果關(guān)系,而不只是形式上的相關(guān)。所選自變量之間的相關(guān)程度不應(yīng)高于自變量與因變量之間的相關(guān)程度,應(yīng)盡可能避免自變量之間高度相關(guān),以免發(fā)生多重共線(multilinearity)問題[8]。
Kortemeyer研究學(xué)生在物理課程期末成績(jī)與他們?cè)诰€學(xué)習(xí)行為之間的關(guān)系[9],研究者將學(xué)生在線學(xué)習(xí)行為分成六種類型,用學(xué)生在線討論時(shí)的表現(xiàn)進(jìn)行測(cè)量。該研究使用FCI后測(cè)(post-FCI)成績(jī)(課程結(jié)束時(shí)進(jìn)行測(cè)量)作為因變量,選擇FCI前測(cè)(pre-FCI)成績(jī)(課程開始前進(jìn)行測(cè)量)為一個(gè)自變量,學(xué)生在線討論時(shí)某一類行為作為另一個(gè)自變量,進(jìn)行回歸分析。例如,在該研究分類中,有一類學(xué)生學(xué)習(xí)行為是:“只關(guān)注問題的解答(solution),對(duì)解決問題過程中的因果推理和涉及的物理本質(zhì)不關(guān)注”,對(duì)于這個(gè)自變量(solution),研究得出的回歸方程為:
該結(jié)果對(duì)于FCI后測(cè)分?jǐn)?shù)而言,其方差(explained variance )的47.9%可被自變量解釋,并且回歸方程中的兩個(gè)系數(shù)在統(tǒng)計(jì)上都是顯著的。學(xué)生的這類行為表現(xiàn)越典型,行為變量得分越高,系數(shù)-0.042(負(fù)斜率)說明:在控制pre-FCI前測(cè)成績(jī)不變的情況下,學(xué)生在該類型行為得分增加10分(占10%),其post-FCI后測(cè)得分減少0.42。在物理教學(xué)中一些教師試圖通過教給學(xué)生解題技巧和記憶題型,幫助學(xué)生直接快速地獲得答案,以此提高學(xué)習(xí)效率。上例中的數(shù)據(jù)表明,學(xué)生以這樣的方式學(xué)習(xí)產(chǎn)生的效果是負(fù)向的,因此在教學(xué)中應(yīng)該避免這樣的做法。所以用科學(xué)方法做物理教育研究,可以更好地幫助教師探索、揭示教育規(guī)律,按照規(guī)律辦事。
在物理教育研究中,非線性回歸分析并不經(jīng)常使用。有一個(gè)典型的例子是Henderson等人做的一項(xiàng)研究[10]。他們采用邏輯回歸的方法尋求物理教師對(duì)基于研究設(shè)計(jì)的教學(xué)方法(Research-Based Instruction Strategy簡(jiǎn)稱RBIS)的認(rèn)知和使用這些方法的情況與哪些因素相關(guān)聯(lián),涉及的因素包括:RBIS方面的知識(shí)、閱讀相關(guān)期刊、參加相關(guān)講座和研討等20個(gè)潛在自變量。感興趣的讀者可以參考原文獻(xiàn)以獲取更多的細(xì)節(jié)。
綜上所述,對(duì)于一組數(shù)據(jù),其每個(gè)數(shù)據(jù)的數(shù)值不同,它們的平均值可以視為這一組數(shù)據(jù)的一個(gè)概括,其代表性如何,就要看這組數(shù)據(jù)的離散程度,離散越小,代表性越強(qiáng)。相關(guān)是兩組數(shù)據(jù)的共變關(guān)系,并非一定揭示事物內(nèi)在的因果關(guān)系,但是可以為進(jìn)一步深入研究指出一個(gè)可能的方向。同樣,回歸方程不是變量之間的剛性刻畫,而只是某種平均性質(zhì)的概括。用回歸方程去刻畫一對(duì)變量之間的關(guān)系,其代表性如何,取決于它們的相關(guān)系數(shù)。由于回歸方程是在樣本數(shù)據(jù)的基礎(chǔ)上得到的,對(duì)于回歸方程是否真實(shí)反映了事物之間的統(tǒng)計(jì)關(guān)系以及它是否能用于預(yù)測(cè)等需要進(jìn)行統(tǒng)計(jì)檢驗(yàn)[8]。
調(diào)查研究與描述統(tǒng)計(jì)是物理教育量化研究方法中最基本的方法,也是其他量化研究方法的基礎(chǔ)。在此我們只概述其中最基本的概念、給出它們?cè)谖锢斫逃芯恐械膽?yīng)用實(shí)例,目的是幫助對(duì)物理教育量化研究感興趣的教師快速入門,然后在實(shí)踐中通過專門化的學(xué)習(xí)提升物理教育量化研究的專業(yè)能力。