• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    國家義務教育質量監(jiān)測小學科學測驗題目數(shù)量對測驗信度的影響

    2024-01-01 00:00:00姜有祥曹郎溫紅博
    考試研究 2024年6期
    關鍵詞:小學科學

    [摘 要] 探討國家義務教育小學科學質量監(jiān)測測驗題目數(shù)量對信度的影響。采用概化理論和完全交叉設計,通過概化研究和決策研究,對各題本和總測驗的信度狀況、題目數(shù)量對信度的影響進行分析。在題本層面,除題本五的測驗信度未達到0.80外,小學科學測驗各題本信度均較高。對于6個題本,題目數(shù)量的增加能夠提高測驗的信度,但信度增長速度逐漸減緩。在題目數(shù)量達到一定水平后,繼續(xù)增加題目數(shù)量對信度的影響較小。當各題本題目數(shù)在45題左右時,能夠很好地保證各題本測驗信度較高??傮w測驗層面,概化系數(shù)和可靠性系數(shù)分別為0.933和0.928,顯示出較好的測驗信度水平。在保證題目質量的前提下,如需縮減題目數(shù)量,可將總測驗題目數(shù)由109題降至98題。

    [關鍵詞] 義務教育質量監(jiān)測;小學科學;題目數(shù)量;測驗信度

    [中圖分類號] G424.74 [文獻標識碼] A

    [文章編號] 1673—1654(2024)06—020—011

    義務教育在國家教育體系中處于基礎地位,是國民素質的基本保障和核心工程。為促進義務教育質量提升,教育部于2021年印發(fā)《國家義務教育質量監(jiān)測方案(2021修訂版)》(以下簡稱“《監(jiān)測方案》”),進一步明確了義務教育質量監(jiān)測的內容和環(huán)節(jié)。

    根據(jù)《監(jiān)測方案》,國家義務教育質量監(jiān)測包括對學生德育、語文、數(shù)學、英語、科學、體育與健康、藝術、勞動和心理健康的監(jiān)測,同時包括對影響學生發(fā)展質量的相關因素的監(jiān)測。

    一、研究背景

    國家義務教育質量監(jiān)測涉及的學科眾多,學科內知識較為龐雜。以小學科學為例,《監(jiān)測方案》指出,科學主要監(jiān)測學生掌握的科學基礎知識和思維方法情況、科學探究能力等。一般情況下,當測驗涉及的知識范圍廣、內容要求多時,必然需要增加測驗長度(test length),以保證測量信度(reliability)。然而,測驗長度并不能無限增加,考生的認知疲勞因素可能對長測驗的信度產生負面影響[1]。因此,如何平衡測驗長度與測驗信度是大規(guī)模教育評估(large-scale educational assessment)必須要考慮的問題。

    (一)大規(guī)模教育評估中題目數(shù)量與信度的關系

    美國考試服務中心(The Educational Testing Service,ETS)將大規(guī)模教育評估定義為在一段時間的教育學習之后,對大量的學生群體實施的內容較為豐富的測驗,通過采集其成就水平方面的作答表現(xiàn)和其它證據(jù),為決策者、社會、學校、學生及家長提供關于其教育成就表現(xiàn)的反饋信息,以便了解學生學業(yè)成就水平和學校、地區(qū)的教育質量,以支持做出正確的決策[2]。

    大規(guī)模教育評估要為決策者提供信息支持,必然涉及到信息的可靠性問題,這也就涉及教育與心理測驗的信度。信度表示測驗結果的可靠性和穩(wěn)定性,是一個測驗測量準確性的評價指標。大規(guī)模教育測量的信度兼具信度的一般性和大規(guī)模測量的特殊性。題目數(shù)量的增多通常能夠提高測驗的信度,如有研究表明,當一份測驗中同質性的題目數(shù)量增多之后,同一心理特質被考查到的次數(shù)就會增多,被試的成績也就越能有效拉開,整個團體的測驗分數(shù)分布就會更廣,從而提高測量的信度[3]。但大規(guī)模測驗信度的特殊性體現(xiàn)在大規(guī)模測驗中的題目設置。大規(guī)模測驗在考查內容上有測試范圍廣、內容多的特點。既要考慮覆蓋范圍的廣度,又要考慮個體作答的時間成本和實施測驗的人力物力成本[4]。如果按照傳統(tǒng)方式增加題目數(shù)量,則個體作答時間增加導致的疲勞效應將會對測試結果產生顯著的負效應[5-7],進而損壞量表質量,降低信度。另外,增加測驗的題目數(shù)量還可能存在邊際效應,即當信度已經達到一定水平時,增加題目數(shù)量對信度的影響變得微乎其微[8-9]。

    可見,大規(guī)模測驗存在著廣泛的測驗內容與有限的測驗成本之間的矛盾,即廣泛的測驗內容需要足夠多的題目承載,但過長的測驗又會與有限的測驗時間、有限的被試注意力以及有限的人力、物力、財力相沖突,并且可能會影響測驗信度。

    (二)矩陣取樣設計

    針對大規(guī)模測驗的這一矛盾特征,國際上的大型測評項目大多采用矩陣取樣(matrix-sampling)設計[10]作為收集科學的、客觀的數(shù)據(jù)的方式[11-12]。矩陣取樣設計先根據(jù)課程設計開發(fā)一套完整的測試題目,然后將題目集劃分為若干套題目,再讓每個學生接受其中一套試題的測試。矩陣取樣設計通過限制學生的作答題目數(shù)來控制作答時間,但同時保證了測驗內容的廣泛覆蓋。

    采用矩陣取樣設計有兩方面的優(yōu)勢。首先,相較于傳統(tǒng)測驗以評估個體差異為測量目標,大規(guī)模測驗以評估團體(性別、地區(qū)等)差異為目標。而矩陣取樣設計得益于其隨機化技術實現(xiàn)了對每個測試團體所有測量內容的測試,更適合于反映團體水平的差異[5-6]。其次,矩陣取樣設計保證了大規(guī)模測驗對考查范圍和題目數(shù)量的要求[7,13-14],同時個體測驗壓力不會過大,可以平衡廣泛的測試內容與有限的測試時間之間的矛盾。

    隨著認識和實踐水平的不斷提升,矩陣取樣設計逐步發(fā)展出不同類型,包括完全矩陣取樣和不完全矩陣取樣。不完全矩陣抽樣技術與完全矩陣抽樣技術的區(qū)別在于題目之間是否有錨題(anchor item),不完全矩陣取樣設計在隨機產生題本之前先選取一部分對評價目標總體更關鍵的題目作為錨題,然后對剩余的題目進行隨機抽樣組成若干題本[15]。其優(yōu)勢在于錨題的存在讓等值技術有了施展之地,實現(xiàn)了不同題本分數(shù)間的可比性。但相同知識內容的問題可能在每個題本中出現(xiàn)在相同位置,題目位置效應將導致學生在題本末尾的掌握水平被高估(練習效應)或低估(疲勞效應)[6]。

    目前應用最廣泛的是不完全矩陣取樣設計的一種變式——平衡不完全組塊設計(balanced incomplete block design,BIB)[12]。BIB設計可以避免產生上述位置效應,其通過簡單隨機抽樣,從測試領域(題庫)中設計若干試題模塊組成題本,交由被試總體中隨機的一個樣本作答[5-6]。該方法保證了題目能夠產生相同的暴露度(題目出現(xiàn)頻次),并且同一學生能夠被分配足夠多的題目[16]。

    目前國家義務教育質量監(jiān)測采用的即為BIB設計。在具體操作上,先將題庫劃分為若干組塊,再將組塊組合成冊(題本);在組合規(guī)則上,每兩個組塊僅組合一次,即只出現(xiàn)在一個題本中;每個組塊在所有題冊中出現(xiàn)的次數(shù)相同;每個題冊的長度相等,由相同個數(shù)的組塊組成;每一對組塊同時出現(xiàn)的頻率相同。表1所示即為國家義務教育質量監(jiān)測四年級科學測驗的組塊組合模式,包括六個題本在三個測驗領域的組塊組合。

    雖然矩陣取樣設計是當前保證測驗內容覆蓋面廣、考生測試時間短的主流手段,但客觀上矩陣取樣設計區(qū)別于傳統(tǒng)測驗,其并未在各個題本內保證對需要測量的知識內容測量足夠多次,以保證對各個知識內容領域的測量信度。加之減少考生作答的題目與作答時間,又勢必會對測量信度產生影響。值得注意的是,這種通過取樣設計來平衡測驗內容與測試時間的方法對測驗信度有多大影響,尚未被研究者深入研究,如何通過量化的方法研究大規(guī)模教育質量監(jiān)測中題目數(shù)量變化對測驗信度的影響,是心理與教育測量研究者亟需解決的問題。

    (三)小學科學教育質量監(jiān)測

    為了提升小學科學教育質量,順應科學學科核心素養(yǎng)和能力指向的要求,許多國家和國際組織展開了包含小學科學教育在內的大規(guī)模教育質量監(jiān)測[17],主要包括國際數(shù)學與科學趨勢研究項目(Trends in International Mathematics and Science Study,TIMSS)、美國國家教育進步評價(National Assessment of Educational Progress,NAEP)、國際學生評估項目(Programme for International Student Assessment,PISA)和我國國家義務教育質量監(jiān)測等。

    如前所述,在大規(guī)模教育質量監(jiān)測活動中,一般采用BIB技術設計測驗以平衡測驗內容和測驗時間。然而,小學科學教育質量檢測中題目數(shù)量與測驗信度的平衡卻尚未得到充分關注。因此,本研究將探究我國的國家義務教育質量監(jiān)測中,小學科學測驗題目數(shù)量與測驗信度的關系,以期為小學科學及其他學科測驗編制和實施中的試卷設計提供參考。

    (四)概化理論在教育測量中的應用

    概化理論(Generalization Theory,GT)是在經典測量理論(Classic Test Theory,CTT)的基礎上,基于實驗設計思想和方差分析方法發(fā)展起來的一種心理測量理論。其主要用于分析測量過程中變異的各種來源及其對總測驗的影響程度,確定測量側面對測量目標的影響程度,從而有效控制其可能產生的誤差[18]。

    GT應用廣泛,常用于教師教學評價、人事面試評測等標準參照性測驗、非標準化測驗、表現(xiàn)型評價中。相對于經典測量理論,概化理論在誤差分析、信度評價和推論決策上更為優(yōu)越,并且能夠在誤差分解的基礎上深入、量化分析特定側面的影響。

    面對復雜設計的大規(guī)模測驗,基于對誤差的分解理念和方差分析方法,GT具有能夠辨識和估計各種測量誤差變異來源的優(yōu)勢。同時,GT通過對測量的誤差側面下水平的調整,能夠找到最佳測驗條件,幫助研究者制定決策[19-21]。

    許多研究者使用GT來研究某一側面對測驗信度的影響:如趙軒等人利用GT研究高考數(shù)學文理卷各題型下題目數(shù)量對信度的影響,發(fā)現(xiàn)當前試卷依然可以通過增加題量來提高信度[22];陳維等人利用GT研究高考語文模擬卷中主客觀題題量和分值對測量信度的影響[23]。

    鑒于GT方法在研究測量誤差來源方面的優(yōu)勢,本研究將采用GT方法,研究矩陣取樣設計下的我國義務教育質量監(jiān)測小學科學測驗中,題目數(shù)量對信度的影響。

    二、研究方法

    (一)研究設計

    概化理論在分析不同側面對測量誤差的影響時,一般采用兩步走策略:概化研究和決策研究。概化研究用以確定測量目標、不同測量側面、測量側面與測量目標的交互作用的方差分量大小,比較不同側面對測量精度的影響。決策研究通過增加側面的水平數(shù)或將側面固定起來等策略,尋找減小誤差、提高精度的良好設計。

    本研究將分別從題本層面和總測驗層面研究題目數(shù)量對測驗信度的影響。針對題本層面,首先在概化研究中使用p×i(考生×題目)的完全交叉設計,分析各變異分量估計值,考察各單題本的信度狀況。其次,在決策研究中分析單題本題目數(shù)量處于不同水平時的信度狀況,探究題目數(shù)量對單題本信度的影響。針對總測驗層面,在概化研究中依據(jù)BIB設計,采用分塊法對各題本進行方差分量合成,考察總測驗的信度狀況。在決策研究中研究題目數(shù)量處于不同水平時總測驗的信度狀況,探究題目數(shù)量對總測驗信度的影響。

    (二)研究對象

    研究數(shù)據(jù)來自國家義務教育質量監(jiān)測小學四年級科學質量監(jiān)測。監(jiān)測的樣本來自全國31個省(自治區(qū)、直轄市)及新疆生產建設兵團中共325個樣本縣(市、區(qū))的3900所小學。全樣本數(shù)據(jù)包括112314名四年級學生。本研究隨機抽取其中30000個樣本作為研究對象,其中有效樣本29983個。

    (三)研究工具

    本研究的研究工具為國家義務教育質量監(jiān)測小學四年級科學測驗。其監(jiān)測內容依據(jù)《義務教育小學科學(3-6年級)課程標準(實驗稿)》編制。題型包括選擇題、組合題和問答題(見表2)。測驗考查的科學素養(yǎng)包括科學理解、科學探究和科學思維。

    國家義務教育小學科學測驗共有109道試題。根據(jù)BIB設計方法,將109道試題劃分為若干組塊,每6個組塊組合成一個題本(如表1)。表3為各題本題目數(shù)與參測考生數(shù)情況,各題本題目數(shù)從35到38不等,各題本參測考生數(shù)從4941到5064不等。

    (四)數(shù)據(jù)分析

    為研究義務教育質量監(jiān)測小學科學測驗各題本的信度狀況,以及各題本和總測驗中題目數(shù)量對信度的影響,研究基于概化理論,以概化系數(shù)([Eρ2])和可靠性系數(shù)(?)作為信度指標,采用p×i的完全交叉設計。先通過方差分析,對6個題本內造成誤差的變異分量進行估計,然后分析各題本測驗的信度狀況。最后,在此基礎上進行決策研究,通過調整題目數(shù)量,分析各題本內題目數(shù)量變化對信度造成的影響,找出兼顧測驗題目數(shù)量與測量信度的最優(yōu)方案。

    在數(shù)據(jù)分析工具方面,本研究使用R4.1.2作為數(shù)據(jù)分析軟件,使用gtheory包[24]進行概化理論分析。

    三、研究結果

    (一)各題本信度與題目數(shù)量的關系

    1. 概化研究

    概化研究(G研究)的任務是盡可能多地估計測驗中涉及到的誤差來源的方差分量。對于各題本而言,測量變異來源包括考生的科學素養(yǎng)水平(記為p)、不同題目對作答的影響(記為i)、考生與題目間的交互作用(記為pi)。國家義務教育質量監(jiān)測小學科學測驗各題本的方差分析結果如表4所示。

    從三個變異來源的方差分量占比上來看,比例最高的成分是學生與題目的交互作用,約占比82%。而題目側面的方差分量均值約為6%,帶來了較小的系統(tǒng)誤差。本次測驗的測量對象,考生科學素養(yǎng)水平對總變異的影響約占11%,比重相對較小,說明測量的準確性仍有提升空間。六個題本內的三種變異來源方差分量的比值相近(均接近1:0.5:7),說明各題本內分數(shù)的誤差來源結構相似,總測驗劃分而成的題本間無明顯區(qū)別。

    一般而言,當概化系數(shù)和可靠性系數(shù)均超過0.8時,測驗可被視為信度水平較高[25]。小學科學測驗各題本的信度狀況如表5所示。從當前信度指標上可以看到,除了題本五的概化系數(shù)和可靠性系數(shù)略低于0.80,其余題本信度均較高,能夠比較準確地反映參與測驗學生的科學素養(yǎng)水平。

    2.決策研究

    決策研究(D研究)的任務是基于G研究對測驗變異來源的認識,重新構建概括全域,探究在各水平上測驗的信度狀況,從而尋找對準確測量更有利的測量條件。

    為了進一步探究各題本下題目數(shù)量對信度狀況的影響,本研究通過調整各題本的題目數(shù)量側面,研究測驗信度的變化趨勢。各題本題目數(shù)均在35至38題,因此研究以5為步長調整題目數(shù),設置了20、25、30、35、40、45、50共7種水平,結果見表6和表7。

    總體上看,提升各題本的題目數(shù)量都能夠有效提升測驗信度。在測驗題目數(shù)較多的情況下,題目數(shù)量繼續(xù)增加對測驗信度的影響較小,且各題本測驗信度變化趨勢一致。

    如前所述,當概化系數(shù)和可靠性指數(shù)均超過0.8時測驗可被視為信度水平較高。以題本一為例,繪制概化系數(shù)與可靠性系數(shù)隨題目數(shù)量增加的變化趨勢如圖1所示。題本一的兩個信度指標(概化系數(shù)和可靠性系數(shù))都隨著題本一題目數(shù)量的增加而增大。當題目數(shù)量大于30時,概化系數(shù)和可靠性系數(shù)均超過0.80。隨著題目數(shù)量的不斷增加,信度指標增長速度降低。如題目數(shù)量從20提升到25時,概化系數(shù)提升0.04,可靠性系數(shù)提升0.04;題目數(shù)量從45提升到50時,概化系數(shù)和可靠性系數(shù)均只提升0.01左右。

    可見,增加題目數(shù)量對提升測驗信度來說存在邊際效應,即題目數(shù)量達到一定數(shù)量之后,繼續(xù)增加題目數(shù)量對測驗信度的影響逐漸變小。綜合六個題本在概化系數(shù)和可靠性系數(shù)上的表現(xiàn),本研究建議控制測驗題目數(shù)量在45左右,以保證各題本均具有較高的測驗信度。

    (二)總測驗信度與題目數(shù)量的關系

    1. 概化研究

    對于小學科學質量監(jiān)測總測驗層面的信度分析,研究依據(jù)BIB設計,采用分塊法對各題本進行方差分量合成,再進行概化系數(shù)和可靠性系數(shù)的計算,結果見表8和表9。

    可以看出,合成的總測驗概化系數(shù)和可靠性系數(shù)都大于0.90,說明總測驗的信度狀況良好,可以較為準確地反映學生團體的科學素養(yǎng)水平。

    2. 決策研究

    為進一步探究題目數(shù)量對總測驗信度的影響,通過決策研究調整總測驗題目數(shù)量,觀測總測驗信度的變化趨勢。

    其中題目數(shù)指根據(jù)BIB 將六個題本合并后的題目,剔除在各題本重復出現(xiàn)的題目。推論的題目數(shù)同理也是根據(jù)BIB方法,組合各組塊并分配到題本后實際的題目數(shù),而非各題本題目數(shù)相加。

    為有效反映和便于觀測題目數(shù)量與測驗信度的關系,題目數(shù)量值選取了當前測驗實際題目數(shù)(109題)。同時,研究采用可重復隨機抽樣選取了109題的0.25倍(27題)、0.5倍(54題)、0.75倍(81題)、1.5倍(163題)和2倍(218題)共6種題目數(shù)量水平,結果見表10和圖2。

    由表10和圖2可以看出,總測驗信度隨題目數(shù)量增多而上升,但當題目達到一定數(shù)量之后,總測驗信度的增速降低。總測驗題目數(shù)為34時,概化系數(shù)和可靠性系數(shù)可大于0.80,題目數(shù)為77時,概化系數(shù)和可靠性系數(shù)超過0.90。

    四、結論與建議

    本研究以國家義務教育質量監(jiān)測小學科學測驗為研究對象,采用概化理論分析方法,以概化系數(shù)和可靠性系數(shù)為信度指標,從題本和總測驗兩個層面,對測驗題目數(shù)量與測驗信度的關系進行了探究。

    (一)小學科學測驗的信度狀況

    在總測驗層面,研究發(fā)現(xiàn)總測驗的概化系數(shù)為0.933,可靠性系數(shù)為0.928,說明國家義務教育質量監(jiān)測小學科學測驗的信度狀況良好,對學生科學素養(yǎng)水平的反映有較好的一致性、穩(wěn)定性和可靠性。

    在題本層面,其中五個題本的概化系數(shù)和可靠性系數(shù)均較高,只有題本五的信度指標低于0.80,研究結果與2017年國家義務教育質量監(jiān)測科學學科的技術報告結果一致(該報告采用經典測驗理論,以內部一致性系數(shù)作為信度指標)。

    根據(jù)BIB設計,信度最低的題本五是由題本四和題本六的各一半題目組合而成,題本四和題本六信度同樣也較低。題本四、五、六與其他題本的題目數(shù)量相當,但信度較低,說明這三個題本中個別題目質量較差。題本五分別吸收了題本四和題本六質量較差的模塊,因此信度指標更低。綜上,測驗編制時應加強對試題質量的審核,對質量較差的模塊和題目加以重點改良,從而提升信度。

    (二)小學科學測驗的題目數(shù)量與測驗信度的關系

    本研究利用概化理論,以題目數(shù)量為核心的編制條件進行決策研究,在大規(guī)模測驗背景下,尋找縮減測驗長度和提升測驗信度之間的平衡。研究參照對應測驗部分的信度指標變動趨勢和幅度,調整各題本和總測驗的題目數(shù)量,試圖尋找更優(yōu)的題目數(shù)量設計方案。

    在國家義務教育質量監(jiān)測中,同一科目涉及知識內容眾多,一般采用BIB設計組合出若干包含較少題目的題本,每個考生只需完成其中一個題本即可。因此,單個題本的測驗信度是保證監(jiān)測活動中準確評估考生總體水平的基礎要求。本研究關注2017年國家教育質量檢測小學科學測驗,首先研究其所包含的6個題本的測驗信度水平,以及測驗信度隨著題目數(shù)量變化的增長趨勢,探討小學科學測驗中適合的題本題目數(shù)量。其次,在總測驗層面研究測驗信度水平,以及測驗信度隨著題目數(shù)量變化的增長趨勢,以檢驗總測驗層面小學科學測驗的可靠性。

    在單個題本的研究中,以每一個題本為研究對象,調整各題本的題目數(shù)量,觀察對應條件下題本測驗信度的水平和變化趨勢。研究發(fā)現(xiàn),各題本信度會隨題本內題目數(shù)的增多而增長。同時,信度的增長出現(xiàn)了邊際效應,即隨著題目數(shù)的增多信度的增速不斷降低,題目增多帶來的收益不斷降低。最后,需重點關注信度不足的題本五,可以通過增加6道試題,即題本增加至42道試題,使概化系數(shù)和可靠性系數(shù)都超過0.80。總體來講,如果控制各題本題目數(shù)在45左右,且各題本內試題質量相當,可以有效保障各題本的高測驗信度。

    對于在實際編制條件下信度水平較高的題本,從大規(guī)模測驗對縮減測驗長度的需要出發(fā),研究試圖對其進行縮減。而在縮減其題目數(shù)量的同時,需要控制其信度指標不低于標準值。研究以題本一為例展示對高信度測驗的簡化。通過調整題目數(shù),使其從實際編制條件的38題開始下降,題本一的信度值隨之下降,并隨著題目數(shù)的逐漸減少加速下降。當題目數(shù)水平為32題時,題本一的概化系數(shù)和可靠性系數(shù)仍可超過0.80;當題目數(shù)下降到31時,可靠性系數(shù)低于0.80,不應再減少題目。因此,題本內題目數(shù)最少應控制在31題以上。

    從現(xiàn)有的題目設計出發(fā),存在兩個提升信度的方法。一是提高試題的質量,尤其需要定位測驗內信度較低的模塊和試題,加以改良,并加強測驗編制時對題目質量的審核。二是增加題目數(shù)量,從現(xiàn)有題目質量的水平看,每個題本內有35題時基本能滿足信度要求,而每套試卷題目數(shù)設置到45題時更為穩(wěn)妥,能夠保證每個題本都能準確反映個體科學素養(yǎng)水平。

    另外,研究在總測驗信度狀況良好的結果基礎上,通過調整總測驗題目數(shù)量,探究總測驗層次題目數(shù)量對信度的影響。結果表明,總測驗信度會隨題目的增加而提升,且存在邊際效應??倻y驗題目數(shù)降低至77題時,概化系數(shù)和可靠性系數(shù)仍可超過0.9;題目數(shù)降至34題時兩個信度指標仍超過0.8。但考慮到題目較少的總測驗下測驗內容過少、知識點覆蓋面不足,且各題本信度會大大降低,因此,在總測驗層面直接精簡題目并不可行。

    綜上,國家義務教育質量監(jiān)測小學科學測驗的各題本信度狀況良好,大部分題本概化系數(shù)和可靠性系數(shù)超過0.80,接近0.83??紤]到兼顧信度要求和對大規(guī)模測驗的時長、成本控制,各題本需要約31~35題。從總測驗層面看,測驗的概化系數(shù)為0.933,可靠性系數(shù)為0.928,測驗具有理想的信度,能夠準確反映學生的科學素養(yǎng)水平。但若要縮減總測驗題目數(shù)還需考慮測驗中各個內容維度的測量信度。本研究對測驗的三個維度進行額外的概化理論分析發(fā)現(xiàn):科學理解維度題目數(shù)可由45降至36題;科學探究維度可由37降至29題;科學思維維度可由36降至33題(受限于篇幅,這里不再呈現(xiàn)具體圖表)。綜合考量總測驗以及總測驗內各維度題目數(shù)量,在總測驗層面題目數(shù)量可由109題降至98題。

    (三)研究結果對其他學科教育質量監(jiān)測的啟示

    面對復雜設計的大規(guī)模測驗,基于對誤差的分解理念和方差分析方法,GT具有能夠辨別和估計各種測量誤差變異來源的優(yōu)勢,有助于我國基礎教育質量監(jiān)測中各學科測驗設計的分析和構建。本研究以小學科學測驗為例,尋找測驗長度和測驗信度的最佳平衡。在其他如數(shù)學、閱讀、英語等學科的教育質量監(jiān)測中,同樣可以采用本研究中的分析步驟對測驗設計的可靠性進行檢驗,同時尋找適合本學科測驗長度與測驗信度的最佳平衡點,為實踐中的測驗編制工作提供數(shù)據(jù)支撐。

    參考文獻:

    [1] 柴省三.標準參照測驗長度研究方法探析[J].教育測量與評價(理論版),2013,(08):9-14+8.

    [2] 王俊民.核心素養(yǎng)視域下國際大規(guī)??茖W學業(yè)評估框架與試題研究[D].西南大學,2018.

    [3] 楊志明,張雷.測評的概化理論及其應用[M].北京:教育科學出版社,2003.

    [4] 戴海崎,張鋒,陳雪楓.心理與教育測量[M].廣州:暨南大學出版社,2011.

    [5] 黃慧靜,辛濤,李珍.矩陣取樣設計中的似真值能力估計方法[J].心理科學,2012,(05):1233-1239.

    [6] 何孟姐,楊濤,辛濤,等.大規(guī)模教育測評的多題本設計[J].中國考試,2017,(02):33-39.

    [7] 李凌艷,辛濤,董奇.矩陣取樣技術在大尺度教育測評中的運用[J].北京師范大學學報(社會科學版),2007,(06):19-25.

    [8] Black P,Wiliam D. Large-scale Assessment Systems Design Principles Drawn from International Comparisons [J]. Measurement,2007,5(1):1-53.

    [9] 戴海琦.基于項目反應理論的測驗編制方法研究[J].考試研究,2006,(04):31-44.

    [10] Lord F M. Estimating Norms by Item-Sampling [J]. Educational and Psychological Measurement, 1962,22(2):259-267.

    [11] Gonzalez J M,Eltinge J L. Multiple Matrix Sampling:A Review. Proceedings of the Section on Survey Research Methods [J],American Statistical Association,2007:3069-3075.

    [12] Thomas N,Raghunathan T E,Schenker N,et al. An Evaluation of Matrix Sampling Methods Using Data from the National Health and Nutrition Examination Survey [J]. Survey Methodology,2006,32:217-231.

    [13] Childs Ruth A,Jaciw Andrew P. Matrix Sampling of Items in Large Scale Assessments [J]. Practical Assessment,Research,and Evaluation,2003,8(8),Article 16.

    [14] 李凌艷,謝敏,辛濤.小學生數(shù)學成就測驗的編制:矩陣取樣設計的途徑[J].基礎教育研究,2009,(18):25-27.

    [15] 李凌艷,張平平.大規(guī)模教育測評中實際運用矩陣取樣技術的基本問題[J].中國考試,2011,(01):16-21.

    [16] Rutkowski L,Gonzalez E,Joncas M,et al. International Large-Scale Assessment Data:Issues in Secondary Analysis And Reporting [J]. Educational Researcher,2010,39(2):142-151.

    [17] 辛濤,李峰,李凌艷.基礎教育質量監(jiān)測的國際比較[J].北京師范大學學報(社會科學版),2007,(06):5-10.

    [18] Shavelson R J,Webb N M.Generalizability Theory:A Primer [J]. Newbury Sage,1991,38(14):1486-1494.

    [19] DeMars,Christine. Estimating Variance Components from Sparse Data Matrices in Large-Scale Educational Assessments [J]. Applied Measurement in Education,2015,28(1):1-13.

    [20] Brennan R L. Generalizability Theory [M]. NewYork:Springer-Verlag,2001.

    [21] Briesch A M,Swaminathan H,Welsh M,et al. Generalizability Theory:A Practical Guide to Study Design,Implementation,and Interpretation [J]. Journal of School Psychology,2014,52(1):13-35.

    [22] 趙軒,任子朝,陳昂.基于多元概化理論的高考數(shù)學文理科試卷質量分析與對比研究[J].數(shù)學通報,2018,057(001):25-30.

    [23] 陳維,何壯,趙守盈.高考語文??荚嚲眍}型結構的多元概化分析[J].教學與管理,2016,(18):116-118.

    [24] Christopher T. Moore. gTheory:Apply Generalizability Theory with R. R package version 0.1,2016.

    [25] 黎光明,張敏強.基于學生評教的多元概化理論分析[J].教育測量與評價(理論版),2013,(07):4-6+17.

    The Influence of the Quantity of Primary School Science Test Questions on the Reliability of the National Compulsory Education Quality Monitoring

    Jiang Youxiang1" Cao Lang2" Wen Hongbo1

    1 China Basic Education Quality Monitoring Collaborative Innovation Center,Beijing Normal University,Beijing,100088

    2 RDFZ Sanya School,Sanya,Hainan,572014

    Abstract:This study aims to investigate the impact of the number of test items in the National Compulsory Education Primary School Science Quality Monitoring Test on reliability. Using the Generalizability Theory and a complete crossover design,an analysis was conducted to examine the reliability of each test form and the effect of the number of test items on reliability through generalizability study and decision study. At the test form level,except for test form 5,the reliability of the 2017 primary school science test forms was generally high,with reliability values above 0.80. For the six test forms,increasing the number of test items improved the test's reliability,although the rate of reliability improvement gradually diminished. Once the number of test items reached a certain level,the impact of further increasing the number of items on reliability became minimal. When the number of items in each test form was around 45,the test form's reliability was maintained at a high level. At the overall test level,the generalizability coefficient and reliability coefficient were 0.933 and 0.928,respectively,indicating good test reliability. On the condition that the quality of test items is ensured,if a reduction in the number of items is necessary,the total number of test items could be reduced from 109 to 98.

    Key words:Monitoring the Quality of Compulsory Education,Elementary Science,Number of Questions,Test Reliability

    (責任編輯:吳茳)

    作者簡介 姜有祥,博士研究生,北京師范大學中國基礎教育質量監(jiān)測協(xié)同創(chuàng)新中心。北京,100088。曹朗,教師,海南省三亞市中國人民大學附屬中學三亞學校。海南三亞,572014。溫紅博,博士,副主任,博士研究生導師,北京師范大學中國基礎教育質量監(jiān)測協(xié)同創(chuàng)新中心。北京,100088。

    猜你喜歡
    小學科學
    小學科學探究活動教學策略探析
    關于小學科學自主探究學習方式的探討
    如何提高小學科學實驗教學的有效性
    小學科學教育發(fā)展現(xiàn)狀研究
    考試周刊(2016年90期)2016-12-01 22:30:15
    淺析小學科學生活化教學策略的運用
    讓有效交流彰顯小學科學課堂的精彩
    以“問”發(fā)展小學生科學學習能力
    基于MOOC的小學科學教學模式的探究
    加強小學科學實驗教學提升學生動手實踐能力
    文理導航(2016年30期)2016-11-12 15:46:59
    談談多媒體在小學科學教學中的應用
    考試周刊(2016年86期)2016-11-11 09:37:04
    国产熟女午夜一区二区三区| 久久精品亚洲熟妇少妇任你| 女人高潮潮喷娇喘18禁视频| 熟女av电影| 国产有黄有色有爽视频| 午夜老司机福利片| 精品少妇内射三级| 国产无遮挡羞羞视频在线观看| 欧美97在线视频| 丝袜美腿诱惑在线| 国产精品亚洲av一区麻豆 | 在线观看www视频免费| 国产高清国产精品国产三级| 亚洲av日韩在线播放| 日本黄色日本黄色录像| 叶爱在线成人免费视频播放| 永久免费av网站大全| 亚洲激情五月婷婷啪啪| 国产高清不卡午夜福利| 国产精品二区激情视频| 午夜免费男女啪啪视频观看| 日韩 欧美 亚洲 中文字幕| 国产亚洲av片在线观看秒播厂| 蜜桃国产av成人99| 国产精品久久久久久久久免| 中文字幕亚洲精品专区| 美女国产高潮福利片在线看| 一边摸一边抽搐一进一出视频| 精品久久久精品久久久| 美国免费a级毛片| 久久精品亚洲熟妇少妇任你| 日韩 亚洲 欧美在线| 亚洲国产欧美日韩在线播放| 亚洲成色77777| 99热国产这里只有精品6| xxxhd国产人妻xxx| 久久久久久久国产电影| 19禁男女啪啪无遮挡网站| 欧美日韩视频精品一区| 国产成人免费无遮挡视频| 激情视频va一区二区三区| 久久毛片免费看一区二区三区| 国产精品 国内视频| 亚洲av福利一区| 欧美人与性动交α欧美软件| 精品人妻在线不人妻| 欧美在线一区亚洲| 美女扒开内裤让男人捅视频| 秋霞在线观看毛片| 日本黄色日本黄色录像| e午夜精品久久久久久久| 精品国产国语对白av| 亚洲美女搞黄在线观看| 最近中文字幕2019免费版| 亚洲伊人久久精品综合| 2021少妇久久久久久久久久久| 精品亚洲成国产av| 纵有疾风起免费观看全集完整版| 国产成人啪精品午夜网站| av女优亚洲男人天堂| 国产色婷婷99| 国产黄色免费在线视频| 久久青草综合色| 老司机靠b影院| 捣出白浆h1v1| 日韩熟女老妇一区二区性免费视频| 亚洲精品日韩在线中文字幕| 综合色丁香网| 人人妻,人人澡人人爽秒播 | 国产探花极品一区二区| 少妇人妻 视频| 毛片一级片免费看久久久久| 一个人免费看片子| 老鸭窝网址在线观看| 国产激情久久老熟女| 97人妻天天添夜夜摸| 欧美黑人精品巨大| 成人黄色视频免费在线看| 日本爱情动作片www.在线观看| 999精品在线视频| 捣出白浆h1v1| 精品久久久久久电影网| 婷婷色综合www| 欧美精品高潮呻吟av久久| 天堂中文最新版在线下载| 可以免费在线观看a视频的电影网站 | 国产亚洲一区二区精品| 久久精品人人爽人人爽视色| 大片电影免费在线观看免费| 日韩中文字幕欧美一区二区 | 蜜桃在线观看..| 视频在线观看一区二区三区| 久久 成人 亚洲| 久久精品国产a三级三级三级| 国产男女超爽视频在线观看| 国产激情久久老熟女| 一级a爱视频在线免费观看| 亚洲视频免费观看视频| 制服诱惑二区| 大片免费播放器 马上看| 18禁动态无遮挡网站| 免费黄频网站在线观看国产| 日韩av不卡免费在线播放| 日韩不卡一区二区三区视频在线| 嫩草影院入口| 日韩一区二区视频免费看| 亚洲精品久久久久久婷婷小说| 天堂8中文在线网| 久久久久久免费高清国产稀缺| 精品少妇黑人巨大在线播放| 最近最新中文字幕免费大全7| 欧美 亚洲 国产 日韩一| 午夜影院在线不卡| 国产黄频视频在线观看| 午夜日韩欧美国产| 久热这里只有精品99| 大香蕉久久成人网| 欧美乱码精品一区二区三区| 亚洲精品久久成人aⅴ小说| 十八禁人妻一区二区| 校园人妻丝袜中文字幕| 免费黄频网站在线观看国产| 1024视频免费在线观看| 色播在线永久视频| 久久久精品免费免费高清| 亚洲精品久久久久久婷婷小说| 啦啦啦中文免费视频观看日本| 久久精品国产a三级三级三级| 你懂的网址亚洲精品在线观看| 国产精品免费大片| 老汉色∧v一级毛片| 亚洲av日韩精品久久久久久密 | 男女国产视频网站| www.自偷自拍.com| 国产伦人伦偷精品视频| √禁漫天堂资源中文www| 黄网站色视频无遮挡免费观看| 日韩,欧美,国产一区二区三区| 成人国产麻豆网| 9191精品国产免费久久| 久久毛片免费看一区二区三区| 日本色播在线视频| 久久精品亚洲熟妇少妇任你| 尾随美女入室| 最新在线观看一区二区三区 | 黑人猛操日本美女一级片| av国产精品久久久久影院| 在线观看免费高清a一片| 老司机影院成人| 国产xxxxx性猛交| 欧美人与善性xxx| 久久女婷五月综合色啪小说| 国产黄色免费在线视频| 亚洲精品乱久久久久久| 久久 成人 亚洲| 久久久精品区二区三区| 欧美在线黄色| 免费高清在线观看日韩| 日韩伦理黄色片| 9色porny在线观看| 9热在线视频观看99| 国产亚洲av片在线观看秒播厂| 精品酒店卫生间| 国产黄频视频在线观看| 伦理电影免费视频| 亚洲欧美中文字幕日韩二区| 亚洲欧美色中文字幕在线| 欧美激情高清一区二区三区 | 不卡视频在线观看欧美| 国产激情久久老熟女| 婷婷成人精品国产| 永久免费av网站大全| 人人澡人人妻人| 老熟女久久久| 免费人妻精品一区二区三区视频| 丰满少妇做爰视频| 精品人妻熟女毛片av久久网站| 亚洲伊人久久精品综合| 久久久久久免费高清国产稀缺| 亚洲成人av在线免费| 夫妻午夜视频| 老熟女久久久| 丝袜人妻中文字幕| 夜夜骑夜夜射夜夜干| 亚洲成人国产一区在线观看 | 咕卡用的链子| 考比视频在线观看| bbb黄色大片| 国产精品久久久久久精品电影小说| 午夜福利,免费看| 青草久久国产| 9色porny在线观看| 久久人人爽人人片av| 亚洲国产看品久久| 亚洲色图 男人天堂 中文字幕| 9191精品国产免费久久| 亚洲成人手机| 国产伦理片在线播放av一区| 国产一区亚洲一区在线观看| 18禁观看日本| 十八禁人妻一区二区| 99九九在线精品视频| 国产精品国产av在线观看| 久久精品久久久久久噜噜老黄| 久久精品亚洲熟妇少妇任你| 成人亚洲精品一区在线观看| 欧美久久黑人一区二区| 极品少妇高潮喷水抽搐| 汤姆久久久久久久影院中文字幕| 99久国产av精品国产电影| 久久亚洲国产成人精品v| 久久久精品国产亚洲av高清涩受| 久久精品久久久久久久性| 精品国产乱码久久久久久男人| 欧美久久黑人一区二区| 秋霞伦理黄片| 少妇人妻久久综合中文| 蜜桃国产av成人99| 丝袜人妻中文字幕| 亚洲国产精品成人久久小说| 久久国产精品大桥未久av| av天堂久久9| 久久久国产欧美日韩av| 日本av免费视频播放| 久久精品亚洲熟妇少妇任你| 亚洲精品美女久久av网站| 精品午夜福利在线看| 国产精品久久久久久久久免| 亚洲人成电影观看| 日韩免费高清中文字幕av| 国产毛片在线视频| 国产成人欧美在线观看 | 久久久精品区二区三区| 国产成人午夜福利电影在线观看| 午夜福利在线免费观看网站| 汤姆久久久久久久影院中文字幕| av天堂久久9| 精品国产超薄肉色丝袜足j| 亚洲第一青青草原| a级毛片在线看网站| 午夜久久久在线观看| 日韩 亚洲 欧美在线| 久久久欧美国产精品| av在线观看视频网站免费| 制服人妻中文乱码| 国产无遮挡羞羞视频在线观看| 亚洲av日韩精品久久久久久密 | 母亲3免费完整高清在线观看| 国产精品欧美亚洲77777| 亚洲五月色婷婷综合| 深夜精品福利| 日韩精品有码人妻一区| 午夜日韩欧美国产| 少妇精品久久久久久久| 免费观看av网站的网址| 亚洲精品国产一区二区精华液| 狂野欧美激情性bbbbbb| 人人妻人人爽人人添夜夜欢视频| 日韩制服骚丝袜av| www日本在线高清视频| 日本欧美视频一区| 伦理电影大哥的女人| av网站免费在线观看视频| 综合色丁香网| 女人被躁到高潮嗷嗷叫费观| 亚洲精华国产精华液的使用体验| 免费女性裸体啪啪无遮挡网站| 亚洲欧洲国产日韩| 又黄又粗又硬又大视频| 精品国产一区二区三区四区第35| 成人毛片60女人毛片免费| www.熟女人妻精品国产| 久久久久国产精品人妻一区二区| 亚洲成人国产一区在线观看 | 少妇人妻 视频| 午夜福利影视在线免费观看| 天天影视国产精品| 久久免费观看电影| 两个人看的免费小视频| 久久久久久久国产电影| 欧美最新免费一区二区三区| 一边亲一边摸免费视频| 如何舔出高潮| 国产免费福利视频在线观看| www.熟女人妻精品国产| 无遮挡黄片免费观看| 免费在线观看黄色视频的| 欧美成人午夜精品| 波野结衣二区三区在线| www.精华液| 日日撸夜夜添| 午夜日本视频在线| 爱豆传媒免费全集在线观看| 一二三四在线观看免费中文在| 亚洲,欧美,日韩| 久久女婷五月综合色啪小说| 久久精品久久久久久噜噜老黄| 国产亚洲最大av| 999精品在线视频| 精品福利永久在线观看| 操出白浆在线播放| 99久国产av精品国产电影| 国产精品二区激情视频| 色综合欧美亚洲国产小说| 建设人人有责人人尽责人人享有的| 深夜精品福利| 十分钟在线观看高清视频www| 另类精品久久| 亚洲中文av在线| 性少妇av在线| 少妇人妻精品综合一区二区| 欧美av亚洲av综合av国产av | 一本色道久久久久久精品综合| 大片免费播放器 马上看| 精品人妻一区二区三区麻豆| 精品国产乱码久久久久久男人| 男女边吃奶边做爰视频| 国产亚洲一区二区精品| 久久久久久久久久久免费av| 18禁裸乳无遮挡动漫免费视频| 侵犯人妻中文字幕一二三四区| 国产探花极品一区二区| 99久久精品国产亚洲精品| 丝袜脚勾引网站| 99re6热这里在线精品视频| 亚洲av男天堂| 一级a爱视频在线免费观看| 不卡视频在线观看欧美| 操美女的视频在线观看| 777久久人妻少妇嫩草av网站| 欧美黑人欧美精品刺激| 各种免费的搞黄视频| 亚洲精品第二区| 天天操日日干夜夜撸| 婷婷色综合www| 国产高清不卡午夜福利| 咕卡用的链子| 精品国产一区二区三区久久久樱花| 国产成人免费无遮挡视频| 精品人妻熟女毛片av久久网站| 9色porny在线观看| 久久精品国产亚洲av涩爱| av天堂久久9| 另类亚洲欧美激情| 国产视频首页在线观看| 国产伦理片在线播放av一区| 91老司机精品| 国产在线视频一区二区| 久久精品久久精品一区二区三区| 熟女av电影| svipshipincom国产片| 亚洲国产看品久久| 国产男女内射视频| 午夜福利乱码中文字幕| 亚洲欧洲精品一区二区精品久久久 | 欧美av亚洲av综合av国产av | 亚洲视频免费观看视频| 9色porny在线观看| 中文字幕人妻丝袜一区二区 | 最近中文字幕2019免费版| 丝袜美足系列| 国产精品.久久久| 最近中文字幕高清免费大全6| 国产毛片在线视频| 亚洲 欧美一区二区三区| 不卡视频在线观看欧美| 午夜福利视频精品| 国产男女超爽视频在线观看| 亚洲综合精品二区| 狠狠婷婷综合久久久久久88av| 啦啦啦视频在线资源免费观看| 看免费成人av毛片| 毛片一级片免费看久久久久| 国产av码专区亚洲av| 丰满少妇做爰视频| 国产精品av久久久久免费| 美国免费a级毛片| 精品国产一区二区三区久久久樱花| 丰满少妇做爰视频| 大话2 男鬼变身卡| 9热在线视频观看99| 电影成人av| 久热爱精品视频在线9| 男女边摸边吃奶| 97精品久久久久久久久久精品| 亚洲一区二区三区欧美精品| 日韩中文字幕欧美一区二区 | 我的亚洲天堂| 精品人妻在线不人妻| 国产97色在线日韩免费| 一区二区三区激情视频| 免费观看av网站的网址| 国产老妇伦熟女老妇高清| 最近最新中文字幕大全免费视频 | 欧美97在线视频| 亚洲av福利一区| 搡老岳熟女国产| 午夜激情久久久久久久| 两个人免费观看高清视频| 多毛熟女@视频| 亚洲视频免费观看视频| 看免费av毛片| 亚洲人成77777在线视频| 亚洲欧美一区二区三区久久| 免费女性裸体啪啪无遮挡网站| 免费日韩欧美在线观看| 老鸭窝网址在线观看| 国产黄色视频一区二区在线观看| 久久性视频一级片| 欧美成人精品欧美一级黄| 99热国产这里只有精品6| 黑人巨大精品欧美一区二区蜜桃| 各种免费的搞黄视频| 男女无遮挡免费网站观看| 一级毛片电影观看| 久久天堂一区二区三区四区| 日本爱情动作片www.在线观看| 成年人免费黄色播放视频| 日日摸夜夜添夜夜爱| 欧美最新免费一区二区三区| 欧美国产精品va在线观看不卡| 欧美精品一区二区大全| 国产亚洲av高清不卡| 免费人妻精品一区二区三区视频| 三上悠亚av全集在线观看| 日韩不卡一区二区三区视频在线| 午夜福利视频在线观看免费| 日本猛色少妇xxxxx猛交久久| 欧美变态另类bdsm刘玥| 我的亚洲天堂| 色网站视频免费| 欧美人与性动交α欧美软件| 电影成人av| 久久精品久久久久久久性| 欧美日韩福利视频一区二区| 丁香六月天网| 欧美另类一区| 在线精品无人区一区二区三| netflix在线观看网站| 中文字幕人妻丝袜制服| 一级a爱视频在线免费观看| 国产黄频视频在线观看| 国产亚洲av片在线观看秒播厂| 亚洲精品乱久久久久久| 欧美变态另类bdsm刘玥| 久久精品久久精品一区二区三区| 国产精品av久久久久免费| 男人爽女人下面视频在线观看| 午夜日本视频在线| 亚洲国产欧美日韩在线播放| 亚洲欧洲国产日韩| 高清av免费在线| av女优亚洲男人天堂| 香蕉丝袜av| 99久久综合免费| av.在线天堂| 午夜激情av网站| 人成视频在线观看免费观看| 久久精品久久久久久久性| 日韩精品有码人妻一区| 国产xxxxx性猛交| 欧美少妇被猛烈插入视频| 一本一本久久a久久精品综合妖精| 亚洲,一卡二卡三卡| 精品国产一区二区三区久久久樱花| 国产片特级美女逼逼视频| 国产精品国产三级专区第一集| 久久久久久人人人人人| 最近最新中文字幕免费大全7| 国产淫语在线视频| 日本av手机在线免费观看| 久久精品人人爽人人爽视色| 亚洲一区中文字幕在线| 青草久久国产| 男女午夜视频在线观看| 黑人猛操日本美女一级片| 男女床上黄色一级片免费看| 久久精品国产综合久久久| 欧美精品一区二区大全| 如何舔出高潮| 久久久久国产一级毛片高清牌| 亚洲精华国产精华液的使用体验| 美女福利国产在线| 久久99一区二区三区| 性色av一级| 亚洲伊人久久精品综合| 在线观看免费视频网站a站| 国产一区二区 视频在线| 欧美激情极品国产一区二区三区| 99久国产av精品国产电影| 欧美亚洲 丝袜 人妻 在线| 亚洲专区中文字幕在线 | 熟女av电影| 热re99久久国产66热| 人成视频在线观看免费观看| 如何舔出高潮| 自拍欧美九色日韩亚洲蝌蚪91| 午夜福利,免费看| 9191精品国产免费久久| 久久久久久久久久久久大奶| 国产欧美日韩一区二区三区在线| xxx大片免费视频| 欧美激情 高清一区二区三区| 99久久综合免费| 老鸭窝网址在线观看| 女人被躁到高潮嗷嗷叫费观| 啦啦啦在线观看免费高清www| 久久亚洲国产成人精品v| 久久国产亚洲av麻豆专区| 精品免费久久久久久久清纯 | 精品少妇黑人巨大在线播放| 嫩草影院入口| 老司机影院毛片| 人妻人人澡人人爽人人| 99久国产av精品国产电影| 日本黄色日本黄色录像| 91老司机精品| 精品酒店卫生间| 久久97久久精品| 在线精品无人区一区二区三| 青青草视频在线视频观看| 亚洲久久久国产精品| 91精品伊人久久大香线蕉| videosex国产| 欧美久久黑人一区二区| 18禁国产床啪视频网站| 丰满乱子伦码专区| 国产成人午夜福利电影在线观看| 中文字幕高清在线视频| 日韩av不卡免费在线播放| 久久久久久人妻| 熟女少妇亚洲综合色aaa.| 亚洲在久久综合| 最近手机中文字幕大全| 久久精品亚洲av国产电影网| 在线观看人妻少妇| 丰满迷人的少妇在线观看| 国产高清不卡午夜福利| 国产精品国产三级国产专区5o| 极品人妻少妇av视频| 蜜桃在线观看..| 亚洲欧美一区二区三区久久| 国产精品国产三级专区第一集| 极品少妇高潮喷水抽搐| 久久影院123| 免费高清在线观看日韩| 亚洲熟女毛片儿| 国产成人免费观看mmmm| 尾随美女入室| av电影中文网址| 欧美精品一区二区免费开放| 日本欧美视频一区| 我的亚洲天堂| 国产女主播在线喷水免费视频网站| 中文字幕制服av| 欧美日韩亚洲国产一区二区在线观看 | 国产精品久久久久久精品电影小说| av福利片在线| 考比视频在线观看| 欧美乱码精品一区二区三区| 亚洲人成电影观看| 久久久国产欧美日韩av| 校园人妻丝袜中文字幕| 男女免费视频国产| 中文字幕制服av| 黑人猛操日本美女一级片| 国产高清不卡午夜福利| 久久精品久久久久久久性| 大码成人一级视频| 黄色视频不卡| 水蜜桃什么品种好| 免费不卡黄色视频| 国产伦理片在线播放av一区| 久久精品亚洲熟妇少妇任你| 哪个播放器可以免费观看大片| 精品国产一区二区三区四区第35| 亚洲,一卡二卡三卡| 日韩av不卡免费在线播放| 男女午夜视频在线观看| 校园人妻丝袜中文字幕| 美女大奶头黄色视频| 日韩制服丝袜自拍偷拍| 欧美精品av麻豆av| 一级毛片黄色毛片免费观看视频| 亚洲精品国产区一区二| 啦啦啦在线观看免费高清www| 伦理电影大哥的女人| 最近的中文字幕免费完整| 最近最新中文字幕免费大全7| 精品人妻熟女毛片av久久网站| 欧美日韩av久久| 精品国产一区二区久久| 午夜福利,免费看| 国产片特级美女逼逼视频| 日本wwww免费看| 午夜免费男女啪啪视频观看| netflix在线观看网站| 制服诱惑二区| 人妻 亚洲 视频| 日韩免费高清中文字幕av| 美女主播在线视频| 免费看不卡的av| 热99国产精品久久久久久7| 国产国语露脸激情在线看| 国产不卡av网站在线观看| 免费在线观看视频国产中文字幕亚洲 | 熟女av电影| 女性被躁到高潮视频| 精品国产一区二区久久| 人人妻人人爽人人添夜夜欢视频| av女优亚洲男人天堂| 国产成人免费观看mmmm| 在线天堂中文资源库| 欧美成人午夜精品| av网站在线播放免费|