• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    PISA中國(guó)試測(cè)研究的評(píng)分者效應(yīng)分析對(duì)高考網(wǎng)上閱卷的啟示

    2012-09-11 06:40:42張文靜
    統(tǒng)計(jì)與信息論壇 2012年6期
    關(guān)鍵詞:編碼效應(yīng)題目

    王 蕾,張文靜

    【統(tǒng)計(jì)應(yīng)用研究】

    PISA中國(guó)試測(cè)研究的評(píng)分者效應(yīng)分析對(duì)高考網(wǎng)上閱卷的啟示

    王 蕾1,張文靜2

    (1.教育部考試中心,北京100084;2.北京師范大學(xué)發(fā)展心理研究所,北京100875)

    針對(duì)PISA 2009中國(guó)試測(cè)研究主觀題評(píng)分環(huán)節(jié)所采用的多重編碼設(shè)計(jì),分析在閱讀、數(shù)學(xué)和科學(xué)領(lǐng)域的評(píng)分中是否存在評(píng)分者效應(yīng)。根據(jù)多側(cè)面Rasch模型方法,分別對(duì)這三個(gè)領(lǐng)域進(jìn)行評(píng)分者主效應(yīng)的分析。結(jié)果顯示:閱讀和科學(xué)領(lǐng)域中,評(píng)分者之間的嚴(yán)苛度/寬松度差異非常顯著;而數(shù)學(xué)領(lǐng)域中,評(píng)分者之間的嚴(yán)苛度/寬松度差異較小。最后,探討了這些結(jié)果的可能原因以及對(duì)高考網(wǎng)上閱卷評(píng)分借鑒的建議。

    評(píng)分者效應(yīng);嚴(yán)苛度/寬松度;PISA;多重編碼;高考網(wǎng)上閱卷

    一、問(wèn)題提出

    Scullen、Mount和Goff將評(píng)分者效應(yīng)(rater effects)界定為“一種導(dǎo)致成績(jī)?cè)u(píng)定等級(jí)系統(tǒng)變異的效應(yīng)類(lèi)別,在某種意義上,評(píng)定的等級(jí)與評(píng)分者相關(guān),而與被評(píng)分者的真實(shí)表現(xiàn)無(wú)關(guān)?!保?]換句話說(shuō),評(píng)分者效應(yīng)與欲評(píng)估的結(jié)構(gòu)或特質(zhì)無(wú)關(guān),從而影響了評(píng)估的信度和效度[2][3]66-70。

    在實(shí)際情境中,評(píng)分者效應(yīng)非常普遍。一旦涉及多個(gè)評(píng)分者評(píng)定被評(píng)分者的表現(xiàn),評(píng)分者效應(yīng)很容易隨之出現(xiàn)。例如,奧運(yùn)會(huì)中多個(gè)裁判員評(píng)價(jià)運(yùn)動(dòng)員的表現(xiàn);企事業(yè)單位或公司的管理者評(píng)判面試申請(qǐng)者與工作崗位的匹配性;大學(xué)根據(jù)申請(qǐng)者的材料判斷其能否獲得獎(jiǎng)學(xué)金;教師根據(jù)學(xué)生對(duì)主觀題的作答進(jìn)行評(píng)分等。研究認(rèn)為在評(píng)分過(guò)程中,有三種潛在的偏差或誤差來(lái)源:評(píng)分量尺(rating scales)、評(píng)分程序(rating procedure)和評(píng)分者(raters)。Cronbach指出,評(píng)分活動(dòng)是“復(fù)雜而又易犯錯(cuò)的認(rèn)知過(guò)程”。Thorndike和Hagen認(rèn)為評(píng)分者的認(rèn)知過(guò)程是“黑箱”(black box):“評(píng)分是一個(gè)評(píng)估總結(jié)的過(guò)程,評(píng)分者使用其‘內(nèi)部計(jì)算機(jī)’即過(guò)去或現(xiàn)在的經(jīng)驗(yàn),對(duì)輸入的數(shù)據(jù)以一種復(fù)雜而又不確定的方式加以處理,從而得到最終的判定”[4]。因此,最大限度地減少評(píng)分偏差是任何評(píng)估項(xiàng)目,特別是大規(guī)模教育考試中需要解決的重要課題之一。通常采用的措施包括嚴(yán)格選拔評(píng)分者、對(duì)評(píng)分者進(jìn)行培訓(xùn)以及監(jiān)控評(píng)分過(guò)程等。

    Myford和Wolfe總結(jié)了四類(lèi)常見(jiàn)的評(píng)分者效應(yīng):嚴(yán)苛度/寬松度(severity/leniency)、暈輪效應(yīng)(halo effect)、中心化趨勢(shì)(central tendency)和全距限制(restriction of range)[4]。除此之外,還有其他一些類(lèi)型的評(píng)分者效應(yīng),由于它們較難被檢測(cè)或測(cè)量,因此甚少提及,如不精確性、邏輯錯(cuò)誤、對(duì)照錯(cuò)誤等。Cronbach認(rèn)為與其他類(lèi)型的評(píng)分者效應(yīng)相比,嚴(yán)苛度/寬松度是評(píng)分者在評(píng)分過(guò)程中的最嚴(yán)重錯(cuò)誤[4]。所謂嚴(yán)苛,指某些評(píng)分者傾向于給出較低的分?jǐn)?shù);相反,寬松的評(píng)分者傾向于給出較高的分?jǐn)?shù)。本研究的關(guān)注對(duì)象是在多個(gè)評(píng)分者存在的情況下,對(duì)考試中的主觀題(需要考生自己用文字寫(xiě)出答案)進(jìn)行評(píng)分的嚴(yán)苛度/寬松度。以高考為例,每個(gè)科目都有大量主觀性試題,它們非常容易受到評(píng)分者的知識(shí)水平、綜合能力、愛(ài)好、情緒、疲勞等主觀因素的影響。不光不同評(píng)分員之間存在差異,同一個(gè)評(píng)分員在不同時(shí)間也具有不穩(wěn)定性。為消除評(píng)分者效應(yīng),常用的辦法是對(duì)評(píng)分者進(jìn)行培訓(xùn),或?qū)τ谙嗤目忌M(jìn)行多人評(píng)分。然而,有研究表明,無(wú)論如何進(jìn)行事前培訓(xùn),評(píng)分者也無(wú)法在嚴(yán)苛度/寬松度上保持一致[5]。也有研究者使用Kendall和諧系數(shù)等考查評(píng)分者之間的一致性,但作用非常有限,因?yàn)檫@類(lèi)評(píng)分者一致性系數(shù)屬于事后檢驗(yàn),對(duì)考生得分不會(huì)產(chǎn)生校正作用[6-7]。因此,實(shí)際考試評(píng)分中非常需要能夠?qū)忌梅旨皶r(shí)進(jìn)行統(tǒng)計(jì)校正的方法。多側(cè)面Rasch模型(many-facet Rasch model)是可以提供解決方案的模型之一。Rasch模型屬于測(cè)量理論中項(xiàng)目反應(yīng)理論(item response theory)的一種,它認(rèn)為考生在某個(gè)題目上的正確作答概率是考生的某種潛在心理特質(zhì)(latent trait)和題目難度的函數(shù)[8]122-125。多側(cè)面Rasch模型是對(duì)Rasch模型的擴(kuò)展,通常適用于在模型中考慮多個(gè)側(cè)面(如評(píng)分者、考試形式等)的情況,該模型所提供的統(tǒng)計(jì)分析框架在估算各個(gè)側(cè)面的測(cè)量值時(shí),將各個(gè)側(cè)面之間的相互作用進(jìn)行了區(qū)分和隔離,因此,可以消除主觀評(píng)分中各個(gè)方面的因素對(duì)于評(píng)分結(jié)果的影響,提高評(píng)分結(jié)果的信度[9]80-85,應(yīng)用這個(gè)框架也可以提高測(cè)量的信度[10]。

    本研究擬使用多側(cè)面Rasch模型考察PISA(Program for International Student Assessment)2009年中國(guó)試測(cè)研究中,主觀題評(píng)分的評(píng)分者嚴(yán)苛度/寬松度是否存在顯著差異。其中多側(cè)面Rasch模型的數(shù)學(xué)表達(dá)式通常為:

    ln(Pnijk/Pnijk-1)=Bn-Dj-Cj-Fk

    其中Pnijk是指作答者n在題目i上被評(píng)分者j評(píng)定為k的概率,Pnijk-1是指作答者n在題目i上被評(píng)分者j評(píng)定為k-1的概率,Bn是指作答者n的潛在特質(zhì)水平,Dj是指題目i的難度,Cj是指評(píng)分者j的嚴(yán)苛度,F(xiàn)k是指量表類(lèi)別k相對(duì)于量表類(lèi)別k-1的難度。

    本研究主要有兩個(gè)目的:一是考察在對(duì)PISA 2009中國(guó)試測(cè)研究的閱讀、數(shù)學(xué)和科學(xué)題目進(jìn)行評(píng)分時(shí),評(píng)分者之間的嚴(yán)苛度/寬松度是否存在差異;二是考察多重編碼和多側(cè)面Rasch模型分析對(duì)高考網(wǎng)上閱卷評(píng)分實(shí)踐的意義。

    二、數(shù)據(jù)

    (一)PISA簡(jiǎn)介

    PISA是經(jīng)濟(jì)合作與發(fā)展組織(OECD)于1997年發(fā)起的一項(xiàng)監(jiān)測(cè)15歲在校學(xué)生學(xué)習(xí)質(zhì)量的比較研究項(xiàng)目,旨在評(píng)價(jià)義務(wù)教育階段結(jié)束時(shí),學(xué)生是否具備參與未來(lái)社會(huì)所必需的知識(shí)和技能。該項(xiàng)目自2000年開(kāi)始每隔三年實(shí)施一次,評(píng)價(jià)領(lǐng)域包括數(shù)學(xué)、閱讀和科學(xué)素養(yǎng),每次側(cè)重一個(gè)領(lǐng)域,依據(jù)評(píng)價(jià)年命名。PISA 2000、PISA 2003和PISA 2006的主評(píng)估領(lǐng)域分別是閱讀、數(shù)學(xué)和科學(xué),PISA 2009的主評(píng)估領(lǐng)域則又回歸到閱讀[11]18-24。

    (二)PISA 2009中國(guó)試測(cè)研究數(shù)據(jù)

    中國(guó)先后于2006年和2009年兩次開(kāi)展PISA試測(cè)研究。PISA的題目類(lèi)型有選擇題和開(kāi)放式簡(jiǎn)答題兩種。開(kāi)放式簡(jiǎn)答題即為主觀題。PISA采用兩種評(píng)分方式,一種稱(chēng)單獨(dú)編碼(single coding),即每個(gè)題目?jī)H由一個(gè)評(píng)分員評(píng)閱;另一種稱(chēng)多重編碼(multiple coding),即每個(gè)題目由多個(gè)評(píng)分員評(píng)閱。多重編碼的目的就是為了考察評(píng)分員使用評(píng)分標(biāo)準(zhǔn)的一致性程度。

    1.抽樣程序

    PISA2009中國(guó)試測(cè)采用三階段分層隨機(jī)抽樣設(shè)計(jì),三個(gè)階段分別是:?。ㄗ灾螀^(qū)、直轄市);學(xué)校;學(xué)生。

    第一階段完成省(自治區(qū)、市)的選擇。在保證全國(guó)15歲學(xué)生代表性的基礎(chǔ)上,兼顧自愿參加的原則,參照各?。ㄗ灾螀^(qū)、市)的綜合人文、經(jīng)濟(jì)及教育指標(biāo),兼顧課改省,在東、中、西部各選擇3~4個(gè)?。ㄗ灾螀^(qū)、市)。最后共10個(gè)?。ㄗ灾螀^(qū)、市)參加了此次研究。第二階段完成學(xué)校層面抽樣,通過(guò)“是否特殊教育學(xué)?!焙汀笆欠穹菨h語(yǔ)教學(xué)”這兩類(lèi)信息將特殊教育學(xué)校和非漢語(yǔ)教學(xué)學(xué)校排除在抽樣范圍之外,然后選取三個(gè)分層變量:學(xué)校的地理位置(城市、縣鎮(zhèn)和農(nóng)村)、學(xué)校的性質(zhì)(公辦學(xué)校、民辦學(xué)校)、學(xué)段(初中、高中和完全中學(xué))。按照這三個(gè)維度設(shè)計(jì)了抽樣框架,10個(gè)?。ㄗ灾螀^(qū)、市)據(jù)此框架上報(bào)了本地區(qū)所有包含15歲學(xué)生學(xué)校的統(tǒng)計(jì)信息。按照PISA抽樣的基本要求,每個(gè)地區(qū)各分配了60所學(xué)校的樣本量。為確保每名學(xué)生被抽取到的概率相同,保證樣本的充分代表性,減少抽樣誤差,采用了PPS抽樣方法,即學(xué)校被抽取到的概率與其所含15歲學(xué)生的數(shù)量成正比,以保證每名學(xué)生被抽取到的概率相同,保證抽樣數(shù)據(jù)的代表性和所得結(jié)論的可推廣性。第三階段完成學(xué)生樣本的抽取。以完全隨機(jī)抽樣的原則從10個(gè)?。ㄗ灾螀^(qū)、市)的587所學(xué)校各自中抽出35名15歲學(xué)生作為學(xué)生樣本,15歲學(xué)生總數(shù)不足35人的學(xué)校中所有15歲學(xué)生全部參加。數(shù)據(jù)還將出生年月不符合要求的學(xué)生、智殘學(xué)生和外籍學(xué)生數(shù)據(jù)排除在抽樣范圍外,最終共有來(lái)自587所中學(xué)的152 265名學(xué)生被納入樣本,有效地代表了10個(gè)?。ㄗ灾螀^(qū)、市)18 550所學(xué)校的6 583 212名15歲在校學(xué)生總體。

    2.研究對(duì)象

    PISA 2009中國(guó)試測(cè)研究抽樣學(xué)生被隨機(jī)分配完成OECD提供的13個(gè)試題冊(cè)中的1個(gè),評(píng)分前從這13個(gè)試題冊(cè)中各抽取100個(gè)拷貝共計(jì)1 300個(gè)試題冊(cè)用于多重編碼。PISA的每個(gè)試題冊(cè)由4個(gè)子題本構(gòu)成,這些子題本來(lái)自三個(gè)領(lǐng)域(其中閱讀共7個(gè)子題本,數(shù)學(xué)和科學(xué)各3個(gè)子題本),根據(jù)矩陣取樣設(shè)計(jì),不同子題本的組合構(gòu)成了13個(gè)試題冊(cè)。多重編碼并不是對(duì)整個(gè)試題冊(cè)進(jìn)行評(píng)分,而是從每個(gè)試題冊(cè)中選取特定子題本的題目由多個(gè)評(píng)分者評(píng)閱。表1是PISA2009中國(guó)試測(cè)研究選用題冊(cè)子題本組成。

    表1 PISA2009中國(guó)試測(cè)研究選用題冊(cè)子題本組成表

    3.評(píng)分者

    共有50名評(píng)分者參與PISA 2009中國(guó)試測(cè)研究的閱卷工作。這些評(píng)分者均為來(lái)自某師范院校教育或心理學(xué)專(zhuān)業(yè)的碩士研究生,其中五分之四為女生,32人參與了多重編碼的工作。之所以選擇他們作為PISA 2009中國(guó)試測(cè)研究的評(píng)分者,出于以下兩個(gè)方面的考慮:首先,本次試測(cè)研究覆蓋范圍較廣,如果由學(xué)科專(zhuān)家或教師評(píng)分將導(dǎo)致成本過(guò)大或時(shí)間過(guò)長(zhǎng),不利于整個(gè)項(xiàng)目的順利開(kāi)展;第二,碩士研究生接受過(guò)較高水平教育,對(duì)新事物(如PISA的評(píng)分方式)有較強(qiáng)的接受和學(xué)習(xí)能力。這些措施和考慮均得到OECD/PISA專(zhuān)家組的認(rèn)同。

    4.評(píng)分設(shè)計(jì)

    評(píng)分前,首先由國(guó)外專(zhuān)家對(duì)評(píng)分者進(jìn)行培訓(xùn)。評(píng)分過(guò)程采用全程質(zhì)量監(jiān)控程序以保證評(píng)分者使用編碼指南的一致性。質(zhì)量監(jiān)控程序?yàn)?,?個(gè)評(píng)分者由一個(gè)學(xué)科教師或?qū)<冶O(jiān)控;每25個(gè)評(píng)分者由2個(gè)高級(jí)學(xué)科專(zhuān)家監(jiān)控;最后,由1個(gè)權(quán)威學(xué)科專(zhuān)家監(jiān)控整個(gè)編碼評(píng)分的質(zhì)量。

    根據(jù)單一編碼設(shè)計(jì),50個(gè)評(píng)分者將評(píng)閱所有三個(gè)領(lǐng)域的題目;而在多重編碼設(shè)計(jì)中,32個(gè)評(píng)分者通過(guò)領(lǐng)域間的鏈接設(shè)計(jì)也將評(píng)閱所有三個(gè)領(lǐng)域的題目,因多重編碼設(shè)計(jì)分組為閱讀1、2和數(shù)學(xué)1、2、3以及科學(xué)。

    三、評(píng)分者效應(yīng)分析及結(jié)果

    (一)分析程序

    分別使用兩個(gè)模型加以分析:(1)無(wú)評(píng)分者效應(yīng)模型;(2)評(píng)分者效應(yīng)模型。所有分析都在ConQuest軟件中完成[12]29-55。PISA試題冊(cè)中分別有(0,1)記分和(0,1,2)記分的題目,適用分步記分(partial credit)的多側(cè)面Rasch模型。無(wú)評(píng)分者效應(yīng)模型即在多側(cè)面Rasch模型中去掉評(píng)分者效應(yīng)參數(shù)Cj,對(duì)PISA數(shù)據(jù)來(lái)說(shuō),該模型即簡(jiǎn)化為Rasch家族模型中的分步記分模型。

    (二)分析結(jié)果

    1.模型比較

    表2和表3分別為閱讀、數(shù)學(xué)和科學(xué)三個(gè)領(lǐng)域無(wú)評(píng)分者效應(yīng)模型和評(píng)分者效應(yīng)模型的比較結(jié)果。

    表2顯示,對(duì)閱讀1和科學(xué)來(lái)說(shuō),與無(wú)評(píng)分者效應(yīng)模型相比,評(píng)分者效應(yīng)模型擬合的更好(p值分別為0.000 7和0.022 3);對(duì)閱讀2來(lái)說(shuō),無(wú)評(píng)分者效應(yīng)模型與評(píng)分者效應(yīng)模型沒(méi)有顯著差異(p=0.254 5)。這說(shuō)明閱讀1和科學(xué)試題上存在顯著的評(píng)分者效應(yīng),但閱讀2的題目上則無(wú)評(píng)分者效應(yīng)。表3說(shuō)明,數(shù)學(xué)2上有顯著的評(píng)分者效應(yīng)(p=0.024 8),而數(shù)學(xué)1和數(shù)學(xué)3上則無(wú)評(píng)分者效應(yīng)(p值分別為0.543 5和0.859 0)。換句話說(shuō),分別評(píng)閱閱讀2、數(shù)學(xué)1和數(shù)學(xué)3的4個(gè)評(píng)分者在使用相應(yīng)的評(píng)分指南時(shí)較為一致,而評(píng)閱閱讀1、科學(xué)和數(shù)學(xué)2的評(píng)分者在使用評(píng)分指南時(shí)差異較大。下面僅以閱讀1的結(jié)果展示評(píng)分者效應(yīng)模型的分析。

    表2 閱讀和科學(xué)無(wú)評(píng)分者效應(yīng)模型和評(píng)分者效應(yīng)模型的比較結(jié)果表

    表3 數(shù)學(xué)無(wú)評(píng)分者效應(yīng)模型和評(píng)分者效應(yīng)模型的比較結(jié)果表

    2.閱讀1的評(píng)分者效應(yīng)

    (1)評(píng)分者的嚴(yán)苛度/寬松度。圖1是表征閱讀1子領(lǐng)域上考生能力、題目難度和評(píng)分者效應(yīng)大小的懷特圖(Wright Map)。表4呈現(xiàn)了18個(gè)評(píng)分者嚴(yán)苛度/寬松度的估計(jì)值(按照從寬松到嚴(yán)苛的順序排列)和相應(yīng)的標(biāo)準(zhǔn)誤??梢钥闯?,評(píng)分者間的嚴(yán)苛度/寬松度存在顯著的差異。評(píng)分者嚴(yán)苛度/寬松度估計(jì)值間的最大差異(即估計(jì)值的最大值與最小值之差)為0.854個(gè)邏輯單位(logit),這個(gè)值接近考生能力測(cè)量分布全域的五分之一。換句話說(shuō),如果與考生潛在能力分布的標(biāo)準(zhǔn)差0.640相比,差異值0.854則意味著,如果忽略評(píng)分者嚴(yán)苛度/寬松度的影響,那么某個(gè)學(xué)生的能力估計(jì)值將在潛在能力分布上移動(dòng)多于一個(gè)標(biāo)準(zhǔn)差的位置。因此,為取得較高的評(píng)分者一致性,盡管之前有嚴(yán)格的培訓(xùn)環(huán)節(jié)和質(zhì)量監(jiān)控,但是對(duì)閱讀1上的評(píng)分者嚴(yán)苛度/寬松度的測(cè)量仍然呈現(xiàn)異質(zhì)性。這一異質(zhì)性也被懷特圖下方的分離統(tǒng)計(jì)量(separation statistics)所驗(yàn)證:(1)卡方檢驗(yàn)的值非常顯著,表明至少有兩個(gè)評(píng)分者的嚴(yán)苛度/寬松度估計(jì)值并不相同(在允許測(cè)量誤差的情況下);(2)評(píng)分者分離的信度(reliability of rater separation)也說(shuō)明評(píng)分者在編碼指南的使用上非常不一致。

    圖1 閱讀1的懷特圖

    如果使用評(píng)分者嚴(yán)苛度/寬松度估計(jì)值的均值作為比較的標(biāo)準(zhǔn)[13],那么則有5名評(píng)分者(28%)的嚴(yán)苛度/寬松度顯著地低于均值,即這些評(píng)分者在評(píng)分過(guò)程中表現(xiàn)得較為寬松;同樣地,也有5名評(píng)分者(28%)的嚴(yán)苛度/寬松度顯著地高于均值,即這些評(píng)分者在評(píng)分過(guò)程中表現(xiàn)得較為嚴(yán)苛。圖2顯示了評(píng)分者參數(shù)估計(jì)值的位置,按照最寬松到最嚴(yán)苛的評(píng)分者進(jìn)行排列,每個(gè)評(píng)分者嚴(yán)苛度/寬松度估計(jì)值伴隨著相應(yīng)的95%的置信區(qū)間。該圖表明,如果評(píng)分者的95%的置信區(qū)間與均值交叉,那么該評(píng)分者與均值無(wú)顯著差異;否則,則存在顯著差異。需要注意的是,評(píng)分者743的95%置信區(qū)間最長(zhǎng),該評(píng)分者在ConQuest估計(jì)中處于最后一個(gè)位置,默認(rèn)為被限制(constrain)的參數(shù),這是程序規(guī)則造成其有如此大的標(biāo)準(zhǔn)誤的原因。

    表4 閱讀1評(píng)分者的嚴(yán)苛度/寬松度表

    圖2 閱讀1評(píng)分者嚴(yán)苛度/寬松度估計(jì)值和95%的置信區(qū)間圖

    (2)評(píng)分者擬合(rater fit)。評(píng)分者擬合指在對(duì)考生的作答進(jìn)行評(píng)分時(shí),評(píng)分者自身在使用編碼指南時(shí)的一致性程度。ConQuest為每個(gè)評(píng)分者提供了兩類(lèi)均方統(tǒng)計(jì)量以表征數(shù)據(jù)——模型擬合程度,即評(píng)分者加權(quán)和未加權(quán)的擬合統(tǒng)計(jì)量。其中,加權(quán)擬合統(tǒng)計(jì)量對(duì)評(píng)分者累積后的不一致評(píng)分較為敏感,而未加權(quán)的擬合統(tǒng)計(jì)量則對(duì)評(píng)分者單個(gè)的不一致評(píng)分較為敏感。這兩個(gè)統(tǒng)計(jì)量的期望值均為1,其值域范圍為0至無(wú)窮大[4,14]。

    如果某個(gè)評(píng)分者的擬合統(tǒng)計(jì)量大于1,則說(shuō)明該評(píng)分者的評(píng)分比模型期望的評(píng)分顯示出更大的變異;由這類(lèi)評(píng)分者提供的數(shù)據(jù)傾向于不擬合(misfit)模型。相反地,如果某個(gè)評(píng)分者的擬合統(tǒng)計(jì)量小于1,則說(shuō)明該評(píng)分者的評(píng)分比模型預(yù)期的評(píng)分顯示出較小的變異;由這類(lèi)評(píng)分者提供的數(shù)據(jù)則傾向于過(guò)分?jǐn)M合(overfit)模型。作為一種經(jīng)驗(yàn)法則,Linacre建議加權(quán)和未加權(quán)的均方統(tǒng)計(jì)量均以0.50和1.50作為其控制下限和控制上限[14],也有研究者建議使用較窄的控制范圍,即0.70(或0.75)到1.30[8]122-150[15]201-203。

    18個(gè)評(píng)分者的加權(quán)和未加權(quán)統(tǒng)計(jì)量按照未加權(quán)統(tǒng)計(jì)量的值加以排序的結(jié)果見(jiàn)表5。加權(quán)和未加權(quán)統(tǒng)計(jì)量的排序非常相似。結(jié)果顯示,評(píng)分者的擬合統(tǒng)計(jì)量均大于1,在使用較寬松的擬合統(tǒng)計(jì)量標(biāo)準(zhǔn)即0.50~1.50時(shí),僅有7個(gè)評(píng)分者(39%)的擬合統(tǒng)計(jì)量的值處在可接受的范圍內(nèi),然而卻有11個(gè)評(píng)分者(61%)的擬合統(tǒng)計(jì)量屬于不擬合的類(lèi)別。因此,在很大程度上,該結(jié)果說(shuō)明評(píng)分者在評(píng)分過(guò)程中體現(xiàn)出內(nèi)部不一致性,且沒(méi)有恰當(dāng)?shù)厥褂镁幋a指南。

    表5 閱讀1的評(píng)分者擬合統(tǒng)計(jì)量表

    四、結(jié)論與討論

    本研究的主要目的是考察PISA 2009中國(guó)試測(cè)研究在閱讀、數(shù)學(xué)和科學(xué)三個(gè)領(lǐng)域的評(píng)分工作中是否存在顯著的評(píng)分者效應(yīng)。結(jié)果顯示,PISA 2009中國(guó)試測(cè)研究的評(píng)分者效應(yīng)分析的結(jié)果在三個(gè)領(lǐng)域上不一致。將閱讀分為兩個(gè)部分加以分析后,閱讀1的18個(gè)評(píng)分者在嚴(yán)苛度/寬松度上存在顯著的差異;閱讀2的4個(gè)評(píng)分者則顯示其較為一致地使用了編碼指南。數(shù)學(xué)被分為三個(gè)部分加以分析后,數(shù)學(xué)2的4個(gè)評(píng)分者在嚴(yán)苛度/寬松度上有較少的差異,只有一名評(píng)分者(727)的嚴(yán)苛度/寬松度顯著地高于均值0;而數(shù)學(xué)1和數(shù)學(xué)3沒(méi)有顯著的評(píng)分者效應(yīng)??茖W(xué)中的9個(gè)評(píng)分者在評(píng)閱考生的反應(yīng)時(shí)存在非常顯著的評(píng)分者嚴(yán)苛度/寬松度效應(yīng)。

    本研究認(rèn)為PISA 2009中國(guó)試測(cè)研究在閱讀、數(shù)學(xué)和科學(xué)均存在評(píng)分者效應(yīng)。該結(jié)論與語(yǔ)言測(cè)驗(yàn)領(lǐng)域和成就測(cè)試領(lǐng)域中的一些相關(guān)研究的結(jié)論是一致的[16]261-287。同時(shí),本研究發(fā)現(xiàn)如果評(píng)分者之間的嚴(yán)苛度或?qū)捤啥炔町愝^大,將導(dǎo)致相當(dāng)一部分考生的真實(shí)能力水平被低估(當(dāng)評(píng)分者較為嚴(yán)苛?xí)r)或被高估(當(dāng)評(píng)分者較為寬松時(shí))。這個(gè)發(fā)現(xiàn)顯示,如果在事關(guān)考生個(gè)人利益的高風(fēng)險(xiǎn)考試中不考慮評(píng)分者效應(yīng),那么對(duì)考生來(lái)說(shuō)是不公平的,為降低評(píng)分者效應(yīng)對(duì)考生能力估計(jì)的影響,多側(cè)面Rasch分析能為每個(gè)考生產(chǎn)生一個(gè)期望的評(píng)分值[17],這個(gè)評(píng)分來(lái)自于一個(gè)假設(shè)的評(píng)分者,該評(píng)分者的嚴(yán)苛度或?qū)捤啥人綖?,即均值水平。這個(gè)“公平均值(fair average)或公平分?jǐn)?shù)(fair score)”能提供一個(gè)與評(píng)分者無(wú)關(guān)的考生能力估計(jì)值。此外,根據(jù)分析結(jié)果,閱讀1和科學(xué)的絕大多數(shù)評(píng)分者的擬合統(tǒng)計(jì)量均屬于不擬合的類(lèi)別,說(shuō)明評(píng)分者展現(xiàn)出的差異比模型所預(yù)期的變異更大。換句話說(shuō),這些評(píng)分者自身不能一致地使用編碼指南。一個(gè)可能的原因是有一些評(píng)分者被要求評(píng)閱所有三個(gè)領(lǐng)域的題目??梢韵胂螅珙I(lǐng)域培訓(xùn)會(huì)給評(píng)分者造成了較大的認(rèn)知負(fù)擔(dān)。另外,評(píng)分過(guò)程中不可避免地會(huì)出現(xiàn)疲勞效應(yīng)以及對(duì)每個(gè)領(lǐng)域編碼指南的理解程度的不同。通過(guò)比較這兩個(gè)研究的結(jié)果可以發(fā)現(xiàn),在今后的評(píng)分設(shè)計(jì)中,我們推薦從有經(jīng)驗(yàn)的教師和學(xué)科專(zhuān)家中選取評(píng)分者,并針對(duì)不同的領(lǐng)域設(shè)計(jì)適當(dāng)?shù)脑u(píng)分程序。在今后的研究中,我們將根據(jù)本分析得到的參數(shù)估計(jì)值作為真值,進(jìn)行模擬研究,以比較實(shí)證分析與模擬分析的結(jié)果,為研究結(jié)果提供更多支持性證據(jù)。

    現(xiàn)在以高考為背景討論一下所獲得的研究結(jié)論在高考中可能的應(yīng)用前景。

    與PISA相比,高考開(kāi)放題的比重大大增加,更為重要的,與PISA開(kāi)放題大部分評(píng)分設(shè)計(jì)被限制在(0,1)和(0,1,2)記分不同,高考各學(xué)科很多開(kāi)放題目的滿(mǎn)分達(dá)12至15之多,更不要說(shuō)作文的滿(mǎn)分要高達(dá)60分。一份48分的作文和一份44分的作文究竟能在多大程度上顯示出差別?是什么樣的人在評(píng)分?有哪些質(zhì)量控制程序?一道開(kāi)放題的滿(mǎn)分以多少為合適?扣分和得分的依據(jù)和標(biāo)準(zhǔn)是什么?凡此種種,如果不能有效地控制評(píng)分者之間和評(píng)分者自己在不同時(shí)間不同場(chǎng)合下評(píng)分的差異和不穩(wěn)定性,評(píng)分結(jié)果的誤差就有極大的可能掩蓋原本精心設(shè)計(jì)的題目的考查功能。

    中國(guó)絕大多數(shù)省的高考已經(jīng)實(shí)現(xiàn)網(wǎng)上閱卷,但目前網(wǎng)上閱卷的組織形式更多地只是把人工閱卷積累起來(lái)的豐富經(jīng)驗(yàn)和計(jì)算機(jī)技術(shù)有機(jī)結(jié)合,從而提高工作效率。事實(shí)上,網(wǎng)上閱卷更大的意義是它使得在傳統(tǒng)的閱卷組織形式下絕無(wú)可能的一種全新的業(yè)務(wù)創(chuàng)新成為可能。在網(wǎng)上閱卷中,計(jì)算機(jī)系統(tǒng)可以將考生和閱卷員的各種個(gè)人信息、答題信息和閱卷信息的海量資料全部詳細(xì)存儲(chǔ)起來(lái)并加以實(shí)時(shí)處理,這就為應(yīng)用教育測(cè)量理論和各種較新的統(tǒng)計(jì)方法來(lái)提高閱卷質(zhì)量、控制評(píng)分誤差提供了可能。從理論上說(shuō),完全可以結(jié)合網(wǎng)上閱卷的管理流程,應(yīng)用現(xiàn)代測(cè)量評(píng)價(jià)技術(shù)和方法,提高評(píng)分的信度和效度,這才是網(wǎng)上閱卷的根本價(jià)值所在。按此思路,至少以下一些方向是值得管理部門(mén)和研究人員思考和改進(jìn)的:為主觀題評(píng)分確定客觀公正的評(píng)分標(biāo)準(zhǔn)和程序,建立并應(yīng)用評(píng)分者質(zhì)量指標(biāo)去挑選和管理高水平的評(píng)分隊(duì)伍,將較為關(guān)鍵和重要的題目分派給較高水平的評(píng)分者,實(shí)時(shí)監(jiān)測(cè)和調(diào)整評(píng)分者效應(yīng),及時(shí)發(fā)現(xiàn)抄襲和雷同等作弊現(xiàn)象并加以懲罰,及時(shí)發(fā)現(xiàn)有創(chuàng)見(jiàn)有新意的答案并給予獎(jiǎng)勵(lì),最大限度地消除評(píng)分者效應(yīng)。PISA中國(guó)試測(cè)研究的實(shí)踐證明這是完全可能的,比如,PISA評(píng)分者效應(yīng)模型中獲得的考生能力已經(jīng)是綜合考慮了評(píng)分人員嚴(yán)苛度差異自動(dòng)調(diào)節(jié)后的結(jié)果。

    [1] Scullen S E,Mount M K,Goff M.Understanding the Latent Structure of Job Performance Ratings[J].Journal ofApplied Pyschology,2000,85(6).

    [2] Messick S.Validity of Psychological Assessment:Validation of Inferences from Persons’Responses and Performances as Scientific Inquiry into Score Meaning[J].American Psychologist,1995,50(9).

    [3] Weir C J.Language Testing and Validation:An Evidence-Based Approach[M].Houndmills,England:Palgrave Macmillan Press,2005.

    [4] Myford C M,Wolfe E W.Detecting and Measuring Rater Effects Using Many-Facet Rasch Measurement:Part I[J].Journal of Applied Measurement,2003,4(4).

    [5] Lunz M E,Wright B D,Linacre J M.Measuring the Impact of Judge Severity on Examination Scores[J].Applied Measurement in Education,1990,3(4).

    [6] 吳志明,張厚粲.結(jié)構(gòu)化面試中的評(píng)分一致性問(wèn)題初探[J].應(yīng)用心理學(xué),1997,3(2).

    [7] 蘇永華.國(guó)家公務(wù)員錄用面試初步分析[J].應(yīng)用心理學(xué),1998,4(1).

    [8] Wilson M.Constructing Measures:An Item Response Modeling Approach[M].Mahwah,NJ:Lawrence Erlbaum Associates Publishers,2005.

    [9] Linacre J M.Many-facet Rasch Measurement[M].Chicago,IL:MESA Press,1994.

    [10]田清源.HSK主觀考試評(píng)分的Rasch實(shí)驗(yàn)分析[J].心理學(xué)探新,2007,27(1).

    [11]OECD.PISA 2009Results:What Students Know and Can Do-Student Performance in Reading,Mathematics and Science(Volume I)[M].Paris:OECD Publishing,2010.

    [12]Wu,Adams,Wilson,et al.ACER ConQuest Version 2.0:Generalized Item Response Modeling Software[M].Melbourne:ACER Press,2007.

    [13]Wolfe E W.Identifying Rater Effects Using Latent Trait Models[J].Psychology Science,2004,46(1).

    [14]Linacre J M.What Do Infit and Outfit,Mean-Square and Standardized Mean?[J].Rasch Measurement Transactions,2002,16(2).

    [15]Bond T G,F(xiàn)ox C M.Applying the Rasch Model:Fundamental Measurement in the Human Sciences[M].Mahwah,NJ:Lawrence Erlbaum Associates Press,2001.

    [16]Engelhard G Jr.Monitoring Raters in Performance Assessments[C]//Tindal G,Haladyna T M.Large-scale Assessment Programs for All Students:Validity,Technical Adequacy,and Implementation.Mahwah,NJ:Lawrence Erlbaum Associates Press,2002.

    [17]Eckes T.Examining Rater Effects in TestDaF Writing and Speaking Performance Assessments:A Many-Facet Rasch Analysis[J].Language Assessment Quarterly,2005,2(3).

    PISA China Trial Rater Effects Analysis for Gaokao Online Rating

    WANG Lei1,ZHANG Wen-jing2
    (1.National Education Examinations Authority,The Ministry of Education,Beijing 100084,China;2.Institute of Developmental Psychology,Beijing Normal University,Beijing 100875,China)

    The aim of this study was to analyze rater effects in reading,math,and science for PISA2009China Trial Study.Based on the many-facet Rasch measurement methodology,the focus was on the rater main effects in the three subjects respectively.Results show that considerably strong rater severity/leniency effects occurred in reading and science,but a relatively weak rater severity/leniency effects for math.The potential reasons about these results were discussed and some implications for National College Entrance Examination(commonly referred to as“Gaokao”))online ratings are provided.

    rater effects;severity/leniency;PISA;multiple coding;online rating of Gaokao

    book=95,ebook=5

    B841

    A

    1007-3116(2012)06-0095-07

    (責(zé)任編輯:王南豐)

    2012-01-20

    全國(guó)教育科學(xué)規(guī)劃2009年度教育考試研究專(zhuān)項(xiàng)課題《學(xué)生能力國(guó)際評(píng)價(jià)PISA的教育評(píng)價(jià)技術(shù)在高考中的應(yīng)用》(GFA097021)

    王 蕾,女,北京人,管理學(xué)博士,副研究員,研究方向:教育管理與評(píng)價(jià);張文靜,女,山東棗莊人,博士生,研究方向:心理測(cè)量與評(píng)價(jià)。

    猜你喜歡
    編碼效應(yīng)題目
    鈾對(duì)大型溞的急性毒性效應(yīng)
    基于SAR-SIFT和快速稀疏編碼的合成孔徑雷達(dá)圖像配準(zhǔn)
    懶馬效應(yīng)
    《全元詩(shī)》未編碼疑難字考辨十五則
    唐朝“高考”的詩(shī)歌題目
    文苑(2020年7期)2020-08-12 09:36:22
    關(guān)于題目的要求
    子帶編碼在圖像壓縮編碼中的應(yīng)用
    電子制作(2019年22期)2020-01-14 03:16:24
    本期練習(xí)類(lèi)題目參考答案及提示
    Genome and healthcare
    應(yīng)變效應(yīng)及其應(yīng)用
    午夜精品一区二区三区免费看| 亚洲自拍偷在线| 亚洲精品一区蜜桃| 亚洲精品影视一区二区三区av| 亚洲18禁久久av| 亚洲怡红院男人天堂| 国产黄色免费在线视频| www.av在线官网国产| 美女被艹到高潮喷水动态| 伊人久久国产一区二区| 青春草国产在线视频| 欧美xxxx黑人xx丫x性爽| 欧美一区二区亚洲| 免费播放大片免费观看视频在线观看| 一区二区三区高清视频在线| 三级男女做爰猛烈吃奶摸视频| 十八禁网站网址无遮挡 | 日日撸夜夜添| 九九久久精品国产亚洲av麻豆| 自拍偷自拍亚洲精品老妇| 免费观看av网站的网址| 人妻一区二区av| 成人欧美大片| 国产大屁股一区二区在线视频| a级毛色黄片| 欧美日韩国产mv在线观看视频 | 国内精品宾馆在线| 狂野欧美激情性xxxx在线观看| 精品一区二区免费观看| 22中文网久久字幕| 特级一级黄色大片| 国产色爽女视频免费观看| 欧美 日韩 精品 国产| 免费黄色在线免费观看| 欧美zozozo另类| 久久97久久精品| 中文字幕av成人在线电影| 亚洲av二区三区四区| 大香蕉久久网| 亚洲,欧美,日韩| 80岁老熟妇乱子伦牲交| 真实男女啪啪啪动态图| 特大巨黑吊av在线直播| 国产美女午夜福利| 欧美xxxx黑人xx丫x性爽| 爱豆传媒免费全集在线观看| 日韩伦理黄色片| 2022亚洲国产成人精品| 天堂中文最新版在线下载 | 男女视频在线观看网站免费| 中国国产av一级| 日韩大片免费观看网站| 汤姆久久久久久久影院中文字幕 | 欧美不卡视频在线免费观看| 精品久久久久久久人妻蜜臀av| 中文字幕人妻熟人妻熟丝袜美| 中文字幕制服av| 国内精品宾馆在线| 国内精品宾馆在线| 麻豆成人午夜福利视频| 欧美成人a在线观看| 嫩草影院入口| 久久综合国产亚洲精品| 欧美bdsm另类| 大话2 男鬼变身卡| 欧美区成人在线视频| 日本熟妇午夜| 日韩电影二区| 久久精品国产鲁丝片午夜精品| 国产精品一二三区在线看| 天天躁日日操中文字幕| 久久午夜福利片| 青春草亚洲视频在线观看| 中文精品一卡2卡3卡4更新| 日韩制服骚丝袜av| 久久99精品国语久久久| av网站免费在线观看视频 | 国产午夜精品久久久久久一区二区三区| 国产男女超爽视频在线观看| 国产亚洲精品av在线| 国产伦精品一区二区三区四那| 91狼人影院| 91狼人影院| 岛国毛片在线播放| 欧美区成人在线视频| 大话2 男鬼变身卡| 亚洲人成网站在线观看播放| 色尼玛亚洲综合影院| 国产精品久久久久久久久免| 青春草国产在线视频| 久久精品久久久久久久性| 日韩一区二区三区影片| 日本免费a在线| 国产黄a三级三级三级人| 日韩欧美精品v在线| 亚洲真实伦在线观看| 国产女主播在线喷水免费视频网站 | 天堂影院成人在线观看| 成人综合一区亚洲| 老女人水多毛片| 亚洲一区高清亚洲精品| 久久99热6这里只有精品| 麻豆精品久久久久久蜜桃| 国产一级毛片在线| 国产单亲对白刺激| 熟妇人妻不卡中文字幕| 18禁动态无遮挡网站| 亚洲精品日本国产第一区| 亚洲欧美中文字幕日韩二区| 少妇熟女欧美另类| 国产老妇伦熟女老妇高清| 一本久久精品| 女人十人毛片免费观看3o分钟| 一级毛片久久久久久久久女| 观看美女的网站| 18禁在线播放成人免费| 九色成人免费人妻av| a级毛片免费高清观看在线播放| 欧美性感艳星| 免费看美女性在线毛片视频| 欧美一区二区亚洲| 久久精品久久精品一区二区三区| 一级毛片久久久久久久久女| 一个人免费在线观看电影| 亚洲精品久久午夜乱码| 日本免费a在线| 亚洲精品中文字幕在线视频 | 国产成人精品福利久久| 亚洲无线观看免费| 色5月婷婷丁香| 国产成人午夜福利电影在线观看| 人人妻人人看人人澡| 国产成人a区在线观看| 中文字幕制服av| 久久久久久久亚洲中文字幕| 精品久久久久久久人妻蜜臀av| 联通29元200g的流量卡| 老师上课跳d突然被开到最大视频| 97精品久久久久久久久久精品| 久久99热这里只频精品6学生| 久久综合国产亚洲精品| 男女视频在线观看网站免费| 五月天丁香电影| 午夜免费激情av| 久久久久性生活片| 国产69精品久久久久777片| 成人二区视频| 国产精品久久久久久久久免| 男女那种视频在线观看| 人人妻人人看人人澡| 色综合色国产| 成年版毛片免费区| 高清午夜精品一区二区三区| 看非洲黑人一级黄片| 精品一区二区免费观看| 国国产精品蜜臀av免费| 欧美性猛交╳xxx乱大交人| 最近视频中文字幕2019在线8| 偷拍熟女少妇极品色| 校园人妻丝袜中文字幕| 91久久精品国产一区二区成人| 一级毛片久久久久久久久女| 成人无遮挡网站| 成人性生交大片免费视频hd| 日韩一区二区三区影片| 99久国产av精品| 国产久久久一区二区三区| 国产精品麻豆人妻色哟哟久久 | 亚洲精品视频女| 汤姆久久久久久久影院中文字幕 | 男女边吃奶边做爰视频| 日韩强制内射视频| 欧美日韩国产mv在线观看视频 | 黄色日韩在线| 男女啪啪激烈高潮av片| 男人狂女人下面高潮的视频| 免费高清在线观看视频在线观看| 真实男女啪啪啪动态图| 久久97久久精品| 丰满少妇做爰视频| 精品国产一区二区三区久久久樱花 | 国产成人aa在线观看| 在线免费观看不下载黄p国产| 麻豆乱淫一区二区| 亚洲天堂国产精品一区在线| 赤兔流量卡办理| 亚洲经典国产精华液单| 边亲边吃奶的免费视频| 亚洲欧美日韩无卡精品| 中文欧美无线码| 丰满人妻一区二区三区视频av| 一级毛片电影观看| 91久久精品国产一区二区成人| 国产精品久久久久久精品电影小说 | 免费看av在线观看网站| 三级毛片av免费| 一级av片app| 成人一区二区视频在线观看| 黄色配什么色好看| 亚洲电影在线观看av| 久久国产乱子免费精品| 高清日韩中文字幕在线| 亚洲国产欧美人成| 日韩强制内射视频| 亚洲精品影视一区二区三区av| 国产黄色视频一区二区在线观看| 午夜激情欧美在线| 欧美成人午夜免费资源| 国产伦理片在线播放av一区| 精品酒店卫生间| 日日啪夜夜撸| 精品一区二区免费观看| 97精品久久久久久久久久精品| 在线免费十八禁| 亚洲国产成人一精品久久久| 国产淫语在线视频| 国产一区二区三区综合在线观看 | 免费黄频网站在线观看国产| 午夜精品国产一区二区电影 | 亚洲精品国产成人久久av| 91在线精品国自产拍蜜月| 婷婷色综合www| 亚洲欧美一区二区三区国产| 成年av动漫网址| 91狼人影院| 久久99精品国语久久久| 亚洲国产欧美人成| 婷婷色综合www| 狠狠精品人妻久久久久久综合| 高清视频免费观看一区二区 | 能在线免费看毛片的网站| 一级黄片播放器| 国产精品麻豆人妻色哟哟久久 | 精品久久久久久久久av| 一级毛片我不卡| 精品久久久久久成人av| 伊人久久精品亚洲午夜| 欧美日韩一区二区视频在线观看视频在线 | 亚洲av电影在线观看一区二区三区 | 国产精品一区二区性色av| av网站免费在线观看视频 | 亚洲国产精品专区欧美| 国产一区二区亚洲精品在线观看| 男人和女人高潮做爰伦理| 亚洲av在线观看美女高潮| 成人一区二区视频在线观看| 高清午夜精品一区二区三区| 精品一区二区免费观看| 校园人妻丝袜中文字幕| 国产乱来视频区| 日韩视频在线欧美| 亚洲成色77777| av在线观看视频网站免费| 午夜激情久久久久久久| 欧美成人a在线观看| 久久草成人影院| 亚洲欧美成人精品一区二区| 亚洲第一区二区三区不卡| 亚洲成人精品中文字幕电影| 久久久国产一区二区| videossex国产| 丝瓜视频免费看黄片| 国产精品.久久久| 亚洲精品成人久久久久久| 国产亚洲午夜精品一区二区久久 | 两个人视频免费观看高清| 乱系列少妇在线播放| 久久久a久久爽久久v久久| 精品酒店卫生间| 国产 一区精品| 97在线视频观看| 非洲黑人性xxxx精品又粗又长| 日韩欧美一区视频在线观看 | 久久久久久久久久久丰满| 久久久精品免费免费高清| 成年女人看的毛片在线观看| 精品一区二区免费观看| 久久韩国三级中文字幕| 国产精品国产三级国产专区5o| 国产午夜精品一二区理论片| 精品一区二区三区人妻视频| 高清日韩中文字幕在线| 日本爱情动作片www.在线观看| 熟女人妻精品中文字幕| 青春草国产在线视频| 一级毛片aaaaaa免费看小| 欧美日韩一区二区视频在线观看视频在线 | 久久人人爽人人爽人人片va| 两个人视频免费观看高清| 久久精品久久久久久久性| 亚洲丝袜综合中文字幕| 成人亚洲欧美一区二区av| 3wmmmm亚洲av在线观看| 一区二区三区四区激情视频| 女人被狂操c到高潮| 亚洲性久久影院| 久久久久久九九精品二区国产| 一级毛片电影观看| 水蜜桃什么品种好| 久久久久久久国产电影| 人妻一区二区av| 亚洲欧美一区二区三区黑人 | 亚洲国产色片| 日韩人妻高清精品专区| 久久久久久久久久黄片| 一区二区三区免费毛片| 亚洲精品乱码久久久v下载方式| .国产精品久久| 亚洲综合色惰| 最近手机中文字幕大全| 乱码一卡2卡4卡精品| 亚州av有码| 亚洲国产欧美在线一区| 一本久久精品| 国产成人精品一,二区| 99视频精品全部免费 在线| 亚洲伊人久久精品综合| 亚洲精品国产av成人精品| 国产一区有黄有色的免费视频 | 黄片wwwwww| 卡戴珊不雅视频在线播放| 精品99又大又爽又粗少妇毛片| 亚洲色图av天堂| 欧美xxⅹ黑人| 日本wwww免费看| av一本久久久久| 欧美xxxx黑人xx丫x性爽| av在线老鸭窝| 三级国产精品欧美在线观看| 一边亲一边摸免费视频| 日韩亚洲欧美综合| 天堂av国产一区二区熟女人妻| 亚洲精品日韩在线中文字幕| 国产精品女同一区二区软件| 九九爱精品视频在线观看| 精品不卡国产一区二区三区| 亚洲av免费在线观看| 国产亚洲av嫩草精品影院| 日韩视频在线欧美| 亚洲精品视频女| 观看美女的网站| 久久精品国产鲁丝片午夜精品| 国产精品1区2区在线观看.| 亚洲av男天堂| 午夜老司机福利剧场| 天堂网av新在线| 日韩av不卡免费在线播放| 久久精品综合一区二区三区| 亚洲欧美中文字幕日韩二区| 亚洲丝袜综合中文字幕| 亚洲精品自拍成人| 听说在线观看完整版免费高清| 国产亚洲一区二区精品| 国产成人精品福利久久| 久久久久久久久大av| 精品久久久久久久末码| 色尼玛亚洲综合影院| 夫妻性生交免费视频一级片| 26uuu在线亚洲综合色| 成人无遮挡网站| 国产亚洲av片在线观看秒播厂 | 欧美bdsm另类| 最近手机中文字幕大全| 国产淫语在线视频| 国产三级在线视频| 丝袜美腿在线中文| 免费黄频网站在线观看国产| 两个人的视频大全免费| 麻豆国产97在线/欧美| 日韩一区二区三区影片| 黄色配什么色好看| 国产精品一及| 三级国产精品片| 欧美激情久久久久久爽电影| 我的女老师完整版在线观看| 午夜福利视频1000在线观看| 欧美潮喷喷水| 美女大奶头视频| 一本久久精品| 国产精品不卡视频一区二区| 最新中文字幕久久久久| 久久久久九九精品影院| 成人午夜精彩视频在线观看| 日本午夜av视频| 99久久精品国产国产毛片| 亚洲人成网站在线观看播放| 久久精品国产自在天天线| 日韩亚洲欧美综合| 黄色一级大片看看| 久久久久精品久久久久真实原创| av国产久精品久网站免费入址| 国产一区有黄有色的免费视频 | 国国产精品蜜臀av免费| 99热这里只有是精品在线观看| av福利片在线观看| 国产成人精品婷婷| 又爽又黄无遮挡网站| 欧美日韩综合久久久久久| 精品久久国产蜜桃| 晚上一个人看的免费电影| 精品不卡国产一区二区三区| av一本久久久久| 欧美成人午夜免费资源| 日韩欧美 国产精品| 一个人免费在线观看电影| 午夜久久久久精精品| 亚洲精品aⅴ在线观看| 欧美性感艳星| 高清在线视频一区二区三区| 午夜福利高清视频| av在线播放精品| 成人美女网站在线观看视频| 亚洲精品视频女| 久久韩国三级中文字幕| 99热这里只有是精品50| 自拍偷自拍亚洲精品老妇| 亚洲aⅴ乱码一区二区在线播放| 丝袜喷水一区| 日韩精品青青久久久久久| 欧美激情在线99| 欧美一级a爱片免费观看看| 美女大奶头视频| 毛片女人毛片| 精品少妇黑人巨大在线播放| 国产男人的电影天堂91| 久久精品久久久久久久性| 大陆偷拍与自拍| 男女边吃奶边做爰视频| 欧美日韩亚洲高清精品| 中文天堂在线官网| 亚洲aⅴ乱码一区二区在线播放| 老师上课跳d突然被开到最大视频| 日韩一本色道免费dvd| 在线观看美女被高潮喷水网站| 日韩欧美国产在线观看| 边亲边吃奶的免费视频| 卡戴珊不雅视频在线播放| 成人午夜精彩视频在线观看| 国产不卡一卡二| 国产精品熟女久久久久浪| 亚洲欧美成人精品一区二区| 菩萨蛮人人尽说江南好唐韦庄| 亚洲成人久久爱视频| 亚洲成人精品中文字幕电影| 精品久久久久久电影网| 久久久久精品性色| 国产成人freesex在线| 2018国产大陆天天弄谢| 亚洲精品国产av蜜桃| 91午夜精品亚洲一区二区三区| 久久6这里有精品| 中文字幕久久专区| 日本午夜av视频| 亚洲欧美一区二区三区国产| 少妇高潮的动态图| 色综合站精品国产| 亚洲精品一区蜜桃| 91aial.com中文字幕在线观看| 一级毛片我不卡| 国产毛片a区久久久久| 精品一区在线观看国产| 亚洲av不卡在线观看| 亚洲激情五月婷婷啪啪| 亚洲欧美清纯卡通| 日本熟妇午夜| 国产av不卡久久| 欧美极品一区二区三区四区| freevideosex欧美| 日韩亚洲欧美综合| 国产男女超爽视频在线观看| 亚洲av电影在线观看一区二区三区 | 男女国产视频网站| 国产大屁股一区二区在线视频| 亚洲乱码一区二区免费版| 麻豆成人午夜福利视频| 国产精品一区二区在线观看99 | 少妇熟女欧美另类| 大陆偷拍与自拍| 91久久精品国产一区二区成人| 国产亚洲av片在线观看秒播厂 | 日日干狠狠操夜夜爽| 国产欧美日韩精品一区二区| 久久99热这里只有精品18| 国产一级毛片在线| 在线观看av片永久免费下载| 午夜老司机福利剧场| 精品久久久久久久久久久久久| 欧美区成人在线视频| 亚洲精品久久午夜乱码| 欧美97在线视频| 婷婷六月久久综合丁香| 99热6这里只有精品| 欧美日韩综合久久久久久| 国产精品女同一区二区软件| 国产亚洲av片在线观看秒播厂 | 亚洲欧洲日产国产| 观看免费一级毛片| 最新中文字幕久久久久| 51国产日韩欧美| 精品熟女少妇av免费看| 丝袜美腿在线中文| 不卡视频在线观看欧美| 成人漫画全彩无遮挡| 成人午夜精彩视频在线观看| 亚洲18禁久久av| 国产在视频线在精品| 26uuu在线亚洲综合色| 国产乱来视频区| 日韩精品青青久久久久久| 人妻少妇偷人精品九色| 国产精品一区二区在线观看99 | a级毛色黄片| 国产免费一级a男人的天堂| 午夜老司机福利剧场| 亚洲成色77777| 日日摸夜夜添夜夜爱| 高清视频免费观看一区二区 | 精品一区二区三卡| 五月玫瑰六月丁香| 成人美女网站在线观看视频| 男女下面进入的视频免费午夜| 国产视频内射| 国产爱豆传媒在线观看| 精品欧美国产一区二区三| 一级毛片黄色毛片免费观看视频| 国产成人a∨麻豆精品| 亚洲最大成人中文| 青青草视频在线视频观看| 麻豆成人av视频| 深爱激情五月婷婷| 亚洲人成网站在线观看播放| 国产成人精品婷婷| 成人美女网站在线观看视频| 国产一区亚洲一区在线观看| 观看免费一级毛片| 草草在线视频免费看| 免费看日本二区| 只有这里有精品99| 国产亚洲一区二区精品| 免费看a级黄色片| 啦啦啦啦在线视频资源| 国产黄色免费在线视频| 久久久久精品性色| 日本黄大片高清| 久久久色成人| 身体一侧抽搐| 一本一本综合久久| 国产有黄有色有爽视频| 久久午夜福利片| 老司机影院毛片| 一区二区三区乱码不卡18| 成人亚洲欧美一区二区av| 丰满少妇做爰视频| 久久久久久久久久人人人人人人| 六月丁香七月| 国产老妇女一区| 午夜老司机福利剧场| 色网站视频免费| 婷婷色综合www| 我的老师免费观看完整版| 成年人午夜在线观看视频 | 最新中文字幕久久久久| 亚洲人成网站在线播| 日韩不卡一区二区三区视频在线| 亚洲美女搞黄在线观看| 九九久久精品国产亚洲av麻豆| 99久久人妻综合| 国产成人91sexporn| 又黄又爽又刺激的免费视频.| 国产一区亚洲一区在线观看| 日韩视频在线欧美| 97在线视频观看| 国产亚洲精品av在线| 国产高清国产精品国产三级 | 国产免费视频播放在线视频 | 国精品久久久久久国模美| 黄色一级大片看看| 91久久精品国产一区二区成人| 亚洲成色77777| 高清欧美精品videossex| 成人毛片a级毛片在线播放| 亚洲精品第二区| 亚洲欧美精品专区久久| 亚洲国产成人一精品久久久| 精品一区二区免费观看| 一级爰片在线观看| 国产一区二区亚洲精品在线观看| 少妇的逼水好多| 国产精品女同一区二区软件| 日韩,欧美,国产一区二区三区| 国精品久久久久久国模美| 国产精品1区2区在线观看.| 久久久久九九精品影院| 我的老师免费观看完整版| 久久久久性生活片| 免费观看a级毛片全部| 久久草成人影院| 精品一区二区免费观看| 成人综合一区亚洲| 淫秽高清视频在线观看| 国产一区二区三区综合在线观看 | av线在线观看网站| 少妇丰满av| 成年免费大片在线观看| 夜夜看夜夜爽夜夜摸| 久久97久久精品| 国产亚洲av片在线观看秒播厂 | 欧美最新免费一区二区三区| 亚洲av成人av| 成人亚洲精品av一区二区| 亚洲av日韩在线播放| 亚洲av一区综合| 99re6热这里在线精品视频| 国产男人的电影天堂91| 精品久久久久久久人妻蜜臀av|