• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    改進(jìn)的認(rèn)知診斷模型項(xiàng)目功能差異檢驗(yàn)方法
    ——基于觀察信息矩陣的Wald統(tǒng)計(jì)量*

    2016-01-09 23:03:32劉彥樓李令青劉笑笑
    心理學(xué)報(bào) 2016年5期
    關(guān)鍵詞:受測者診斷模型錯(cuò)誤率

    劉彥樓 辛 濤, 李令青 田 偉 劉笑笑

    (1北京師范大學(xué)發(fā)展心理研究所,北京 100875) (2中國基礎(chǔ)教育質(zhì)量監(jiān)測協(xié)同創(chuàng)新中心,北京 100875)(3泰山學(xué)院教師教育學(xué)院,山東泰安 271000)

    1 引言

    認(rèn)知診斷模型可以提供關(guān)于受測者知識(shí)或技能掌握程度的細(xì)粒度的、多維診斷性反饋信息,因此,引起了學(xué)生、教師、心理測量學(xué)家以及認(rèn)知心理學(xué)家等的關(guān)注(Greeno,1980;Leighton &Gierl,2007),是當(dāng)前心理測量領(lǐng)域研究的熱點(diǎn)之一。迄今為止,研究者提出了許多認(rèn)知診斷模型,這些模型可以被分為一般性的認(rèn)知診斷模型框架以及特殊的認(rèn)知診斷模型。一般性的認(rèn)知診斷模型框架,主要包括von Davier (2005)的一般診斷模型(

    General Diagnostic Model,

    GDM)、Henson,Templin 和 Willse (2009)提出的對數(shù)線性認(rèn)知診斷模型(

    Log-Linear Cognitive Diagnosis Model,

    LCDM)以及 de la Torre (2011)的G-DINA模型,常見的特殊的認(rèn)知診斷模型有決定性輸入,噪音與門模型(

    Deterministic Input,Noisy And Gate,

    DINA) (de la Torre &Douglas,2004;Haertel,1989;Junker &Sijtsma,2001),補(bǔ)償?shù)闹貐?shù)化統(tǒng)一模型(

    Compensatory Reparameterized Unified Model,

    C-RUM) (e.g.,Hartz,2002)等。

    從統(tǒng)計(jì)上來講,以上這些一般性的認(rèn)知診斷模型與特殊的認(rèn)知診斷模型都屬于有約束的潛在類別模型(von Davier,2009)。這些“約束”主要是通過Q矩陣來實(shí)現(xiàn)的。Q矩陣是一個(gè)設(shè)計(jì)矩陣,其中的元素一般是“0”與“1”,雖然有研究(Chen &de la Torre,2013)已經(jīng)將 Q矩陣擴(kuò)展為多級(jí)的,但在絕大多數(shù)的實(shí)際應(yīng)用中仍假定其是二分的,因此本研究仍假定Q矩陣是二分的。在認(rèn)知診斷模型中一般將受測者的知識(shí)或技能統(tǒng)稱為潛在屬性,簡稱屬性。Q矩陣的功能在于設(shè)定認(rèn)知診斷測驗(yàn)中項(xiàng)目與屬性之間的對應(yīng)關(guān)系,Q矩陣中元素取值為1代表正確作答某一項(xiàng)目需要某一對應(yīng)的屬性,取值為0則代表不需要。將認(rèn)知診斷模型與Q矩陣在項(xiàng)目水平上進(jìn)行組合,可以反映出研究者對于受測者在作答項(xiàng)目時(shí)的潛在認(rèn)知過程或操作的假定。

    在使用認(rèn)知診斷測驗(yàn)對于受測者的屬性掌握狀況進(jìn)行診斷的時(shí)候,研究者面臨的一個(gè)重要的理論及現(xiàn)實(shí)問題是如何進(jìn)行項(xiàng)目功能差異(

    Differential Item Functioning,

    DIF)檢驗(yàn)。因?yàn)楫?dāng)測驗(yàn)中含有功能差異的項(xiàng)目時(shí),不僅會(huì)產(chǎn)生測驗(yàn)公平性的問題,而且也會(huì)影響到受測者屬性掌握模式的判別(王卓然,邊玉芳,郭磊,2015)。在認(rèn)知診斷模型中一個(gè)被廣泛接受的 DIF定義是不同組中具有相同屬性掌握模式的受測者正確作答某一項(xiàng)目的概率不同(Hou et al.,2014;Li,2008)。當(dāng)前研究者們提出了一些不同的方法用于檢驗(yàn)認(rèn)知診斷模型中的DIF (Hou et al.,2014;Li,2008;王卓然,郭磊,邊玉芳,2014;Li &Wang,2015;Zhang,2006)。Zhang (2006)提出使用 MH法(Holland &Thayer,1988;Mantel &Haenszel,1959)以及SIBTEST法(Shealy &Stout,1993),用受測者的測驗(yàn)總分以及屬性掌握模式作為匹配變量去檢驗(yàn) DINA模型中的 DIF。Zhang (2006)所提出的方法中的不足之處在于:目標(biāo)組以及對照組的項(xiàng)目參數(shù)以及屬性掌握模式參數(shù)是作為一個(gè)整體被同時(shí)估計(jì)出來的,因此會(huì)導(dǎo)致其估計(jì)值不準(zhǔn)確;另外,MH法以及SIBTEST法只能檢驗(yàn)一致性DIF。Hou(2013)的研究中指出邏輯斯蒂克回歸法(

    Logistic Regression,

    LR) (Swaminathan &Rogers,1990),MH法以及 SIBTEST法的統(tǒng)計(jì)檢驗(yàn)力都受到測驗(yàn)中DIF項(xiàng)目比例的影響。Li (2008)使用改進(jìn)的高階DINA模型(de la Torre &Douglas,2004)去檢驗(yàn)DIF,然而,Li研究的不足之處在于:在某些模擬條件下,經(jīng)驗(yàn)一類錯(cuò)誤率(指的是在實(shí)際模擬中所觀察到的一類錯(cuò)誤)過高或者過低;另外這一方法只適用于高階模型而非一般性的模型。Hou等人(2014)提出使用 Wald統(tǒng)計(jì)量檢驗(yàn)項(xiàng)目功能差異,并且認(rèn)為Wald統(tǒng)計(jì)量的檢驗(yàn)方法的效果接近或者是優(yōu)于MH以及SIBTEST方法,然而,Hou等人所提出的Wald統(tǒng)計(jì)量存在以下不足:首先是一類錯(cuò)誤率過高,不符合預(yù)先設(shè)置的顯著性水平;其次,統(tǒng)計(jì)功效研究中,正確拒絕率是使用的每個(gè)模擬條件下的10,000次重復(fù)所獲得統(tǒng)計(jì)量的經(jīng)驗(yàn)分布來計(jì)算的,這使得其研究結(jié)果無法推廣到一般性的模型以及實(shí)際應(yīng)用中。另外,需要指出,Hou等人(2014)在計(jì)算Wald統(tǒng)計(jì)量時(shí)使用的是de la Torre (2009,2011)所提出認(rèn)知診斷模型信息矩陣的計(jì)算方法。王卓然等人(2014)的研究發(fā)現(xiàn)盡管 Wald方法的檢驗(yàn)力要高于LR法與MH法,但是也存在一類錯(cuò)誤率膨脹的問題。Li和Wang (2015)比較了使用馬爾可夫鏈蒙特卡羅(

    Markov chain Monte Carlo,

    MCMC)法計(jì)算項(xiàng)目參數(shù)時(shí),LCDM-DIF方法以及Wald方法在評價(jià)項(xiàng)目功能差異時(shí)的表現(xiàn)。Li和Wang發(fā)現(xiàn),他們所使用的LCDM-DIF方法以及Wald統(tǒng)計(jì)量具有較好的一類錯(cuò)誤控制率(僅有稍許的膨脹),并且當(dāng)被比較的組數(shù)為 3時(shí),Wald統(tǒng)計(jì)量的統(tǒng)計(jì)功效要優(yōu)于LCDM-DIF。

    通過以上文獻(xiàn)綜述我們可以發(fā)現(xiàn),盡管研究者們一致地認(rèn)為Wald統(tǒng)計(jì)量在檢驗(yàn)DIF時(shí)有著高的統(tǒng)計(jì)檢驗(yàn)力,但是不同的研究對于 Wald統(tǒng)計(jì)量的一類錯(cuò)誤控制率的表現(xiàn)卻有著不同的結(jié)果。澄清不同的方法構(gòu)建的Wald統(tǒng)計(jì)量為什么在一類錯(cuò)誤控制率的表現(xiàn)不同這個(gè)問題,不僅在理論上具有重要意義,而且對于測驗(yàn)實(shí)踐也有重要意義。Hou等人(2014)以及王卓然等人(2014)所使用Wald統(tǒng)計(jì)量,均是基于de la Torre (2009,2011)所提出的項(xiàng)目參數(shù)的經(jīng)驗(yàn)交叉相乘信息矩陣而構(gòu)建的,而非基于全部的模型參數(shù)(即模型中所有自由估計(jì)的參數(shù))。然而,相關(guān)研究指出(Tian,Cai,Thissen,&Xin,2013;Paek&Cai,2013)通過對信息矩陣求逆計(jì)算誤差—協(xié)方差矩陣時(shí),信息矩陣應(yīng)該包括全部的模型參數(shù),而非僅僅是項(xiàng)目參數(shù);并且研究發(fā)現(xiàn)當(dāng)模型的參數(shù)是通過EM (Expectation-Maximization)方法(de la Torre,2009,2011)所估計(jì)獲得時(shí),應(yīng)該通過對觀察信息矩陣(基于樣本觀測數(shù)據(jù)所計(jì)算的信息矩陣,有些研究中也將其簡稱為觀察矩陣)求逆的方法計(jì)算誤差—協(xié)方差矩陣(Kenward &Molenberghs,1998;Louis,1982)。已有研究發(fā)現(xiàn)在項(xiàng)目反應(yīng)理論中觀察信息矩陣的逆可以很好的漸近誤差—協(xié)方差矩陣(Paek &Cai,2013)。

    針對以往研究中Wald統(tǒng)計(jì)量構(gòu)建方法的局限,解決在認(rèn)知診斷模型中更加準(zhǔn)確地估計(jì)Wald統(tǒng)計(jì)量這一重大理論問題,促進(jìn)認(rèn)知診斷測驗(yàn)在實(shí)踐中的運(yùn)用,本研究擬將觀察信息矩陣的計(jì)算方法引入到認(rèn)知診斷模型中,期望獲得一個(gè)好的誤差—協(xié)方差矩陣的估計(jì)方法,從而改進(jìn) Wald統(tǒng)計(jì)量在檢驗(yàn)DIF時(shí)的表現(xiàn)。研究包括主要包括以下3個(gè)部分:首先,介紹用于檢驗(yàn)認(rèn)知診斷模型中 DIF的 Wald統(tǒng)計(jì)量的構(gòu)建,重點(diǎn)強(qiáng)調(diào)誤差—協(xié)方差矩陣在構(gòu)建中所起的重要作用;其次,介紹認(rèn)知診斷模型中經(jīng)驗(yàn)交叉相乘信息矩陣以及觀察信息矩陣的計(jì)算方法;第三,采用模擬的方法,探索本研究所提出的改進(jìn)后的Wald統(tǒng)計(jì)量在計(jì)算DIF時(shí)的一類錯(cuò)誤控制率以及統(tǒng)計(jì)檢驗(yàn)力的表現(xiàn),并且與通過經(jīng)驗(yàn)交叉相乘信息矩陣而構(gòu)建的Wald統(tǒng)計(jì)量所獲得的結(jié)果進(jìn)行比較;為了更好的說明本研究中的研究結(jié)果,我們也將本研究的結(jié)果與其他采用相同實(shí)驗(yàn)設(shè)計(jì)的研究的結(jié)果(如,Hou et al.,2014;Li &Wang,2015)進(jìn)行了直接的比較。

    2 改進(jìn)的Wald統(tǒng)計(jì)量的計(jì)算方法

    在本研究中,我們將使用LCDM作為例子,說明在認(rèn)知診斷模型中如何應(yīng)用改進(jìn)后的Wald統(tǒng)計(jì)量進(jìn)行DIF檢驗(yàn)。LCDM是一個(gè)廣義的認(rèn)知診斷模型,對于其中的參數(shù)進(jìn)行約束,便可以獲得一些特殊的模型,如DINA以及C-RUM等(Henson et al.,2009)。

    LCDM 假定在給定屬性掌握模式α的條件下,受測者

    i

    在各個(gè)項(xiàng)目上的作答是獨(dú)立的,其反應(yīng)向量X的似然函數(shù),可以表示如下,

    反應(yīng)向量X的邊際概率,可以表示為:

    在公式(5)中,

    p

    (α)是屬性掌握模式 α的概率,在LCDM中,所有屬性掌握模式的概率之和為1。為滿足這一約束,本研究參考 Rupp,Templin和 Henson(2010)所使用的概念,設(shè)η=(η,…,η)′為模型的結(jié)構(gòu)參數(shù)(

    structural parameters

    ),用以描述任一受測者來自特定屬性掌握模式的概率,使用以下表達(dá)式,

    并且對結(jié)構(gòu)參數(shù)η施加約束,固定其中任一參數(shù)為0,一般而言,可以選擇固定最后一個(gè)模型參數(shù)η為0。

    再進(jìn)一步假定,受測者之間的作答都是獨(dú)立的,因此所有受測者作答X的似然函數(shù)為可以用如下公式來表示,

    從公式(8)可以發(fā)現(xiàn)方差—協(xié)方差矩陣估計(jì)的準(zhǔn)確性,對于 Wald統(tǒng)計(jì)量會(huì)產(chǎn)生重大的影響,這也就是說LCDM中信息矩陣的估計(jì)會(huì)對Wald統(tǒng)計(jì)量的計(jì)算產(chǎn)生重大影響。

    EM算法(Dempster,Laird,&Rubin,1977)對于心理測量學(xué)產(chǎn)生了非常大的影響,它將復(fù)雜的計(jì)算非完整數(shù)據(jù)似然函數(shù)最大值問題轉(zhuǎn)換為較為簡單的一系列偽完整數(shù)據(jù)問題,在認(rèn)知診斷模型分析軟件中得到了廣泛的應(yīng)用。然而,在通過EM算法計(jì)算參數(shù)時(shí),信息矩陣(或者是其逆方差—協(xié)方差矩陣)并不是伴隨產(chǎn)生的,因此,需要去進(jìn)行專門的計(jì)算。研究發(fā)現(xiàn),當(dāng)使用期望—最大化算法去計(jì)算模型的極大似然估計(jì)值時(shí),使用觀察信息矩陣能夠很好的去漸近模型的方差—協(xié)方差矩陣(Louis,1982),感興趣的研究者可以參考 Kenward和 Molenberghs(1998)的研究。對于 LCDM 而言,包含所有自由估計(jì)參數(shù)的經(jīng)驗(yàn)交叉相乘信息矩陣的公式可以表達(dá)如下:

    3 方法

    3.1 研究設(shè)計(jì)

    采用 Monte Carlo的方法進(jìn)行研究,受測者的作答反應(yīng)、模型的參數(shù)估計(jì)以及Wald統(tǒng)計(jì)量的計(jì)算均采用

    R

    語言(R Core Team,2015)編程實(shí)現(xiàn)。每種實(shí)驗(yàn)條件均重復(fù)1000次,以獲得穩(wěn)定的結(jié)果。為了便于與以往研究結(jié)果進(jìn)行直接的比較,本研究所采用Hou等人(2014)所設(shè)計(jì)的實(shí)驗(yàn)條件,這些實(shí)驗(yàn)條件也被Li和Wang (2015)所采用。與Hou等人(2014)研究不同的是,本研究中 Wald統(tǒng)計(jì)量的計(jì)算是通過包含全部模型參數(shù)的觀察信息矩陣或者是經(jīng)驗(yàn)交叉相乘信息矩陣所計(jì)算獲得的。

    本研究中所采用Q矩陣中包含30個(gè)測驗(yàn)項(xiàng)目,5個(gè)屬性,并且限制每個(gè)項(xiàng)目所包含的屬性數(shù)量最多為3。Q矩陣采用平衡設(shè)計(jì),每個(gè)屬性被項(xiàng)目所測量的次數(shù)相等,同樣使包含 1、2、3個(gè)屬性的項(xiàng)目數(shù)量也相等即包含1、2、3個(gè)屬性的項(xiàng)目分別有10個(gè)。具體的Q矩陣設(shè)計(jì)見表1。

    為方便與以往研究結(jié)果進(jìn)行直接對比,本研究設(shè)計(jì)中的數(shù)據(jù)生成模型也同樣采用DINA模型,對照組中的猜測以及滑動(dòng)參數(shù)設(shè)置為相等,且有三個(gè)水平:0.1,0.2以及0.3,猜測以及滑動(dòng)參數(shù)值設(shè)置的越小,說明項(xiàng)目越能夠區(qū)分出受測者是否掌握了所測的屬性(Templin &Henson,2006)。DIF類型有兩個(gè)水平:一致性DIF以及非一致性 DIF。一致性 DIF指的是對于某一個(gè)組而言,正確作答某個(gè)項(xiàng)目的概率在所有可能的屬性掌握模式下均一致性地高或者是低;非一致性DIF指的是正確作答某個(gè)項(xiàng)目的概率在一些屬性掌握模式下高,在另外一些屬性掌握模式下低,或者是相反,即正確作答的概率具有非一致性。DIF大小有兩個(gè)水平:0.05與0.1,當(dāng)項(xiàng)目參數(shù)值為0.1時(shí)僅考慮了0.05這一水平的DIF大小,以防項(xiàng)目參數(shù)值等于 0。樣本大小有兩個(gè)水平:500與1000。在認(rèn)知診斷模型中樣本的大小會(huì)對模型參數(shù)估計(jì)值的精確性產(chǎn)生影響,進(jìn)而也會(huì)影響到Wald統(tǒng)計(jì)量的計(jì)算,因此,樣本大小也是一個(gè)需要考慮的重要因素。

    表1 Q矩陣

    3.2 評價(jià)指標(biāo)

    本研究中所采用的評價(jià)指標(biāo)為經(jīng)驗(yàn)一類錯(cuò)誤率以及統(tǒng)計(jì)檢驗(yàn)力。經(jīng)驗(yàn)一類錯(cuò)誤率是通過 1000次模擬中,錯(cuò)誤地檢驗(yàn)出每個(gè)項(xiàng)目出現(xiàn)DIF的百分比,然后參照以往研究結(jié)果的呈現(xiàn)方式(Hou et al.,2014),分別對包含一個(gè)、兩個(gè)以及三個(gè)屬性的項(xiàng)目求平均。統(tǒng)計(jì)檢驗(yàn)力指的是在這1000次循環(huán)中正確拒絕原假設(shè)的比例。當(dāng)認(rèn)知診斷測驗(yàn)中不存在 DIF時(shí),如果我們所構(gòu)建 Wald統(tǒng)計(jì)量是漸近卡方分布的,那么它觀察到的一類錯(cuò)誤率應(yīng)該符合預(yù)先設(shè)置的理論上的一類錯(cuò)誤控制率,如0.05;如果在認(rèn)知診斷測驗(yàn)中存在 DIF,那么 Wald統(tǒng)計(jì)量正確拒絕的比例越高,說明它能夠檢驗(yàn)出DIF項(xiàng)目的能力越強(qiáng)。

    4 研究結(jié)果

    4.1 經(jīng)驗(yàn)一類錯(cuò)誤率

    表2呈現(xiàn)了各個(gè)實(shí)驗(yàn)條件下的使用觀察信息矩陣估計(jì)方法的Wald統(tǒng)計(jì)量獲得的平均經(jīng)驗(yàn)一類錯(cuò)誤率。計(jì)算一類錯(cuò)誤控制率所使用的參照分布為自由度為2的卡方分布。通過表2可以發(fā)現(xiàn)當(dāng)項(xiàng)目的猜測以及滑動(dòng)參數(shù)都比較小的時(shí)候,即項(xiàng)目能夠較為有效的區(qū)分受測者是否掌握所測屬性的時(shí),一類錯(cuò)誤控制率能夠很好的接近預(yù)先設(shè)置的顯著性水平。隨著樣本量的增大,一類錯(cuò)誤控制率的表現(xiàn)也越好。另外,不論是包含一個(gè)、兩個(gè)還是三個(gè)屬性的項(xiàng)目,其觀察一類錯(cuò)誤率均能較好的接近0.05這一顯著性水平。另外需要指出的是,盡管在當(dāng)樣本量較小(

    N

    =500)且項(xiàng)目的猜測參數(shù)以及滑動(dòng)參數(shù)較大的情況下(

    g

    =

    s

    =0.3),平均的經(jīng)驗(yàn)一類錯(cuò)誤率表現(xiàn)較差,但根據(jù) Bradley (1978)的健壯寬松準(zhǔn)則(當(dāng)顯著性水平為 0.05時(shí)經(jīng)驗(yàn)一類錯(cuò)誤控制率在0.025與 0.075之間),仍然可以認(rèn)為是得到了較好的控制??梢园l(fā)現(xiàn),本研究中所提出的改進(jìn)的Wald統(tǒng)計(jì)量計(jì)算方法所獲得的結(jié)果并不存在過度膨脹的現(xiàn)象,這與 Hou等人(2014)以及王卓然等人(2015)的結(jié)果恰好相反,說明本研究中所提出的Wald統(tǒng)計(jì)量的計(jì)算方法明顯優(yōu)于以上兩個(gè)研究所使用的 Wald統(tǒng)計(jì)量的計(jì)算方法。通過比較表2與表3中的一類錯(cuò)誤控制率可以發(fā)現(xiàn)基于觀察信息矩陣計(jì)算的Wald統(tǒng)計(jì)量的表現(xiàn)要優(yōu)于基于經(jīng)驗(yàn)交叉相乘信息矩陣而計(jì)算的Wald統(tǒng)計(jì)量?;诮?jīng)驗(yàn)交叉相乘矩陣而獲得的Wald統(tǒng)計(jì)量的一類錯(cuò)誤控制率較為保守,但是表3的結(jié)果同樣顯示包含一個(gè)、兩個(gè)以及三個(gè)屬性的項(xiàng)目的一類錯(cuò)誤控制率仍大致相等。Li和 Wang (2015)在 MCMC框架下采用LCDM-DIF以及Wald統(tǒng)計(jì)量對于DIF檢驗(yàn)方法進(jìn)行了研究,在其研究一中同樣采用了 Hou等人(2014)的研究設(shè)計(jì),因此本研究的研究結(jié)果同樣也是可以直接與 Li等人的結(jié)果進(jìn)行比較。通過對比研究結(jié)果可以發(fā)現(xiàn),本研究中所提出基于觀察信息矩陣計(jì)算的Wald統(tǒng)計(jì)量與Li等人的研究中所使用的LCDM-DIF以及Wald統(tǒng)計(jì)量均具有較好的一類錯(cuò)誤控制率。一個(gè)非常有意思的現(xiàn)象是在本研究中的一些實(shí)驗(yàn)條件下(見表2)Wald統(tǒng)計(jì)量一類錯(cuò)誤率有細(xì)微的保守而Li等人研究結(jié)果中的LCDM-DIF以及 Wald統(tǒng)計(jì)量在某些實(shí)驗(yàn)條件中一類錯(cuò)誤率卻有稍許膨脹。從公式(8)中可以發(fā)現(xiàn)Wald統(tǒng)計(jì)量的準(zhǔn)確性,依賴于模型參數(shù)估計(jì)值的準(zhǔn)確性。當(dāng)受測者數(shù)量較少(如

    N

    =500時(shí))或者是模型中的“噪音”過大時(shí)(如項(xiàng)目的猜測與滑動(dòng)參數(shù)均為 0.3時(shí)),模型參數(shù)估計(jì)值的準(zhǔn)確性會(huì)受到相對較大的影響,因此,在本研究的

    N

    =500以及

    g

    =

    s

    =0.3這兩種條件下Wald統(tǒng)計(jì)量一類錯(cuò)誤率有細(xì)微的保守。

    表2 基于觀察信息矩陣的平均的經(jīng)驗(yàn)一類錯(cuò)誤率(α=0.05)

    表3 基于經(jīng)驗(yàn)交叉相乘信息矩陣的平均的經(jīng)驗(yàn)一類錯(cuò)誤率(α=0.05)

    4.2 統(tǒng)計(jì)檢驗(yàn)力

    表4中呈現(xiàn)的是當(dāng)認(rèn)知診斷測驗(yàn)中存在一致性DIF時(shí)的考察一個(gè)、兩個(gè)以及三個(gè)屬性項(xiàng)目在1000次循環(huán)中的基于觀察信息矩陣計(jì)算的 Wald統(tǒng)計(jì)量的平均經(jīng)驗(yàn)拒絕比例,所使用的參照分布同樣為自由度為2的卡方分布。從表4中可以看出,隨著DIF的增大,Wald統(tǒng)計(jì)量的統(tǒng)計(jì)檢驗(yàn)力也會(huì)隨之增大,并且當(dāng)項(xiàng)目的猜測以及滑動(dòng)參數(shù)都為 0.2的時(shí)候,總平均的拒絕率要大于同為0.3時(shí)的項(xiàng)目參數(shù)值的條件。這是由于同項(xiàng)目參數(shù)值0.3相比,DIF大小為0.1時(shí),這一值對于項(xiàng)目參數(shù)值0.2而言相對更大。隨著樣本量的增加,Wald統(tǒng)計(jì)量的統(tǒng)計(jì)檢驗(yàn)力也在變大,即樣本量的大小對用于檢驗(yàn)DIF的Wald統(tǒng)計(jì)量而言也是一個(gè)重要因素。因?yàn)殡S著樣本量的增加,模型參數(shù)估計(jì)值的準(zhǔn)確性也會(huì)增加,進(jìn)而會(huì)使得參數(shù)估計(jì)值的標(biāo)準(zhǔn)誤變小,因此,在對照組與目標(biāo)組項(xiàng)目參數(shù)差異相等的情況下,更傾向于獲得一個(gè)大的Wald統(tǒng)計(jì)量的值。另外,通過觀察平均值可以發(fā)現(xiàn),當(dāng)目標(biāo)組具有負(fù)向的 DIF時(shí),同正向 DIF相比,Wald統(tǒng)計(jì)量的統(tǒng)計(jì)檢驗(yàn)力更大。比較表4與表5,可以發(fā)現(xiàn)基于觀察信息矩陣的Wald統(tǒng)計(jì)量的統(tǒng)計(jì)檢驗(yàn)力均要明顯優(yōu)于基于經(jīng)驗(yàn)交叉相乘信息矩陣的Wald統(tǒng)計(jì)量的統(tǒng)計(jì)檢驗(yàn)力。這也說明基于經(jīng)驗(yàn)交叉相乘信息矩陣的Wald統(tǒng)計(jì)量存在保守的問題。

    表4 基于觀察信息矩陣的一致性DIF的平均經(jīng)驗(yàn)統(tǒng)計(jì)檢驗(yàn)力(α=0.05)

    表6中呈現(xiàn)的是非一致性DIF條件下采用觀察信息矩陣的Wald統(tǒng)計(jì)量的1000次模擬結(jié)果,計(jì)算統(tǒng)計(jì)檢驗(yàn)力所使用的參照分布同樣為自由度為2的卡方分布。從表6中同樣可以發(fā)現(xiàn)隨著DIF的增大,Wald統(tǒng)計(jì)量的統(tǒng)計(jì)檢驗(yàn)力也在增大。隨著樣本量的增加,Wald統(tǒng)計(jì)量的統(tǒng)計(jì)檢驗(yàn)力同樣是在增大的。而且在DIF大小相同條件下,當(dāng)項(xiàng)目的猜測以及滑動(dòng)參數(shù)相對較小時(shí),Wald統(tǒng)計(jì)量的統(tǒng)計(jì)檢驗(yàn)力會(huì)相對較大。比較表6與表7同樣可以發(fā)現(xiàn),在非一致性DIF條件下,采用觀察信息矩陣計(jì)算的Wald統(tǒng)計(jì)量的統(tǒng)計(jì)檢驗(yàn)力均高于采用經(jīng)驗(yàn)交叉相乘信息矩陣而計(jì)算獲得的Wald統(tǒng)計(jì)量的統(tǒng)計(jì)檢驗(yàn)力。

    表5 基于經(jīng)驗(yàn)交叉相乘信息矩陣的一致性DIF的平均經(jīng)驗(yàn)統(tǒng)計(jì)檢驗(yàn)力(α=0.05)

    表6 基于觀察信息矩陣的非一致性DIF的平均經(jīng)驗(yàn)統(tǒng)計(jì)檢驗(yàn)力(α=0.05)

    表7 基于經(jīng)驗(yàn)交叉相乘信息矩陣的非一致性DIF的平均經(jīng)驗(yàn)統(tǒng)計(jì)檢驗(yàn)力(α=0.05)

    5 討論

    認(rèn)知診斷模型能夠提夠關(guān)于受測者屬性掌握模式的較為詳盡的診斷性信息,它不僅能為老師的教以及學(xué)生的學(xué)提供有針對性的建議,而且也有助于教育者深入理解受測者的認(rèn)知心理。在使用這一模型來解釋受測者的作答之前,研究者需要確定認(rèn)知診斷測驗(yàn)項(xiàng)目的參數(shù)對于所有受測者都是不變的,否則會(huì)對受測者的屬性掌握模式的估計(jì)帶來不良的影響(王卓然等,2015),進(jìn)而導(dǎo)致錯(cuò)誤的診斷性信息。DIF檢驗(yàn)可以用以確認(rèn)不同組的受測者在同一個(gè)項(xiàng)目的作答上是否存在差異,即除了屬性掌握模式外,受測者所在的組會(huì)影響到他們對于項(xiàng)目的反應(yīng)。為保證測驗(yàn)的效度,在使用認(rèn)知診斷模型來擬合受測者的作答數(shù)據(jù)前,需要進(jìn)行DIF檢驗(yàn)。先前研究者發(fā)現(xiàn)Wald統(tǒng)計(jì)量在檢驗(yàn)DIF時(shí),有著許多其他統(tǒng)計(jì)量所不具備的優(yōu)點(diǎn),然而前人研究中對于Wald統(tǒng)計(jì)量在檢驗(yàn)DIF時(shí)的一類錯(cuò)誤率的表現(xiàn),存在明顯的結(jié)論沖突。如,Hou等人(2014)以及王卓然等人(2014)的模擬研究發(fā)現(xiàn) Wald統(tǒng)計(jì)量會(huì)存在一類錯(cuò)誤控制率膨脹的問題,Li和Wang (2015)的模擬研究卻發(fā)現(xiàn),其研究中所用的 LCDM-DIF以及Wald統(tǒng)計(jì)量在使用MCMC計(jì)算時(shí)有著良好的一類錯(cuò)誤控制率。本研究采用Hou等人以及Li等人研究中所使用的同等條件通過模擬發(fā)現(xiàn),這些差異主要是由于 Wald統(tǒng)計(jì)量計(jì)算方法的差異引起的。因此,我們認(rèn)為本研究提出的改進(jìn)的 Wald統(tǒng)計(jì)量的計(jì)算方法解決了 DIF研究中一直困擾研究者的Wald統(tǒng)計(jì)量在檢驗(yàn)DIF時(shí)的一類錯(cuò)誤率的表現(xiàn)不同這一重要問題,具有重大的理論意義。

    5.1 Wald統(tǒng)計(jì)量在檢驗(yàn)DIF時(shí)的一類錯(cuò)誤控制率

    在模型正確設(shè)定的前提下,如果統(tǒng)計(jì)量能夠很好的服從漸近分布,那么,它的一類錯(cuò)誤控制率應(yīng)該能夠較好的接近預(yù)先設(shè)定好的顯著性水平。本研究中所提出改進(jìn)的 Wald統(tǒng)計(jì)量的計(jì)算方法具有這一特征,從結(jié)果中可以發(fā)現(xiàn),本研究的一類錯(cuò)誤控制率均較好地接近預(yù)先設(shè)定的 0.05這一顯著性水平。因此,我們認(rèn)為在Hou等人(2014)以及王卓然等人(2014)研究中所產(chǎn)生的 Wald統(tǒng)計(jì)量一類錯(cuò)誤膨脹的問題,是由于不恰當(dāng)?shù)男畔⒕仃嚬烙?jì)方法而引起的。本研究的這一結(jié)果明確地解釋了為什么 Wald統(tǒng)計(jì)量在不同研究中有不同表現(xiàn)的問題,對于認(rèn)知診斷模型的理論發(fā)展有一定的推動(dòng)作用。另外,相對于MCMC參數(shù)估計(jì)方法,MMLE/EM具有運(yùn)算量小、耗時(shí)短等優(yōu)點(diǎn),本研究所提出的改進(jìn)的 Wald統(tǒng)計(jì)量正是基于 MMLE/EM,因此,本研究不僅具有重大的理論意義,而且對于認(rèn)知診斷實(shí)踐也具有重要的現(xiàn)實(shí)意義。

    5.2 Wald統(tǒng)計(jì)量在檢驗(yàn)DIF時(shí)的統(tǒng)計(jì)檢驗(yàn)力

    當(dāng)確認(rèn)統(tǒng)計(jì)量的一類錯(cuò)誤控制率能夠較好的接近預(yù)先設(shè)定的顯著性水平后,接下來所要考慮的另外一個(gè)重要問題是當(dāng)認(rèn)知診斷測驗(yàn)中的項(xiàng)目中存在 DIF時(shí),這一統(tǒng)計(jì)量能否有效地拒絕不存在DIF的原假設(shè)而選擇備擇假設(shè)。通過表4與表6中的結(jié)果,可以發(fā)現(xiàn)在樣本量較大時(shí)(

    N

    =1000),改進(jìn)后的Wald統(tǒng)計(jì)量在檢驗(yàn)DIF時(shí)的統(tǒng)計(jì)檢驗(yàn)力均明顯的高于樣本量比較小時(shí)(

    N

    =500)的統(tǒng)計(jì)檢驗(yàn)力。因此,本研究建議在應(yīng)用Wald統(tǒng)計(jì)量進(jìn)行DIF檢驗(yàn)的時(shí)候,如果想要達(dá)到較高的統(tǒng)計(jì)檢驗(yàn)力,應(yīng)保證較大的樣本量。因?yàn)镠ou等人(2014)發(fā)現(xiàn),其研究中所采用的 Wald統(tǒng)計(jì)量計(jì)算方式,會(huì)導(dǎo)致一類錯(cuò)誤率膨脹,因此,在計(jì)算統(tǒng)計(jì)檢驗(yàn)力的時(shí)候,她們采用了兩種方式進(jìn)行。第一種方式是直接用 Wald統(tǒng)計(jì)量的理論分布即自由度為2的卡方分布的理論值來計(jì)算,由于其開發(fā)的 Wald統(tǒng)計(jì)量的計(jì)算方式的一類錯(cuò)誤率膨脹會(huì)使得原本不存在 DIF的項(xiàng)目被誤判為存在 DIF,因此計(jì)算結(jié)果不夠可靠;她們所采用的第二種方式是計(jì)算當(dāng)不存在 DIF項(xiàng)目時(shí)Wald統(tǒng)計(jì)量在每種實(shí)驗(yàn)條件組合下10,000次模擬的經(jīng)驗(yàn)分布,然后通過獲得的顯著性水平的臨界值,來計(jì)算Wald統(tǒng)計(jì)量的統(tǒng)計(jì)檢驗(yàn)力,這種計(jì)算方式雖然保證了模擬實(shí)驗(yàn)結(jié)果具有較高的可靠性,但是不具備現(xiàn)實(shí)的可操作性,因此,對于其研究目的而言只能算是一種不完整解決的方案。因?yàn)镠ou等人(2014)的第二種計(jì)算方式具有較高的理論上的結(jié)果可靠性,因此可以作為研究結(jié)果的一個(gè)參考。通過研究結(jié)果對照我們發(fā)現(xiàn),本研究所采用的自由度為2的卡方分布理論值所計(jì)算獲得的研究結(jié)果與 Hou等人(2014)的第二種計(jì)算方式所獲結(jié)果具有很高的一致性,這也能夠間接的表明,本研究所使用的改進(jìn)后的Wald統(tǒng)計(jì)量計(jì)算方式具有準(zhǔn)確性及可靠性的特點(diǎn)。

    5.3 以后的研究方向

    由于本研究關(guān)注的重點(diǎn)在于,在EM算法框架下提出一個(gè)恰當(dāng)?shù)?Wald統(tǒng)計(jì)量的計(jì)算方式,用以準(zhǔn)確有效地來檢驗(yàn)認(rèn)知診斷測驗(yàn)中可能存在的DIF項(xiàng)目,澄清以往研究中所用de la Torre (2009,2011)所提出的信息矩陣方法計(jì)算Wald統(tǒng)計(jì)量時(shí)所產(chǎn)生的令人困惑的結(jié)果。因此,本研究僅采用了Hou等人(2014)的研究設(shè)計(jì),通過結(jié)果對比的方式來證明本研究所提出的改進(jìn)的Wald統(tǒng)計(jì)量在檢驗(yàn)DIF時(shí)具有準(zhǔn)確性可靠性等特點(diǎn)。具體而言,研究者可以就以下幾方面進(jìn)行后續(xù)研究:首先,樣本大小對于 Wald統(tǒng)計(jì)量有重要影響,因此,后續(xù)研究中可以使用本研究中所用Wald統(tǒng)計(jì)量考察這一因素對于DIF的影響;其次,目前的研究中普遍采用 DINA或者是高階DINA作為例證模型,本研究出于結(jié)果比較的因素考慮,也是以DINA模型為例,在其他認(rèn)知診斷模型中Wald統(tǒng)計(jì)量用以檢驗(yàn)DIF時(shí)的表現(xiàn),也是一個(gè)非常有意思的研究方向。由于本研究所采用的是對于LCDM模型進(jìn)行約束而獲得的DINA模型,因此,可以很方便的進(jìn)行擴(kuò)展;第三,本研究所采用的項(xiàng)目數(shù)量為 30,且受測者組的數(shù)量為 2,在不同項(xiàng)目數(shù)量下以及不同的受測者組數(shù)量數(shù)下,Wald統(tǒng)計(jì)量的表現(xiàn)也值得研究者關(guān)注;第四,在認(rèn)知診斷模型中,除了Wald統(tǒng)計(jì)量可以進(jìn)行DIF檢驗(yàn)之外,還有一些其他的統(tǒng)計(jì)量也可以進(jìn)行 DIF檢驗(yàn)(Li,2008;Sünbül &Sünbül,2015,July),雖然目前研究表明,Wald統(tǒng)計(jì)量在檢驗(yàn)DIF時(shí),具有一些其他統(tǒng)計(jì)量所不具有的優(yōu)點(diǎn),但是,在另外的應(yīng)用情景中,這些DIF檢驗(yàn)方法的優(yōu)缺點(diǎn),仍然值得研究者的關(guān)注。

    6 結(jié)論

    本研究中所提出的改進(jìn)的 Wald統(tǒng)計(jì)量的計(jì)算方法,在認(rèn)知診斷測驗(yàn)中不存在DIF項(xiàng)目時(shí),有著良好的一類錯(cuò)誤控制率,能夠較為準(zhǔn)確地接近預(yù)先設(shè)定的顯著性水平,即當(dāng)認(rèn)知診斷模型為DINA時(shí),改進(jìn)的Wald統(tǒng)計(jì)量服從自由度為2的卡方分布;在認(rèn)知診斷測驗(yàn)中存在DIF時(shí),改進(jìn)的Wald統(tǒng)計(jì)量能夠準(zhǔn)確有效的鑒別出存在DIF的項(xiàng)目。本研究同樣發(fā)現(xiàn)樣本量對于 Wald統(tǒng)計(jì)量的一類錯(cuò)誤控制率及統(tǒng)計(jì)檢驗(yàn)力存在重要影響。另外,我們建議認(rèn)知診斷模型的研究者與使用者,當(dāng)采用EM算法進(jìn)行參數(shù)估計(jì)時(shí),在確認(rèn)認(rèn)知診斷模型正確設(shè)定后,使用本研究中所使用觀察信息矩陣的方法計(jì)算項(xiàng)目參數(shù)的標(biāo)準(zhǔn)誤。

    Bradley J.V.(1978).Robustness?.

    British Journal of Mathematical and Statistical Psychology,31

    ,144-152.Chen,J.S.,&de la Torre,J.(2013).A general cognitive diagnosis model for expert-defined polytomous attributes.

    Applied Psychological Measurement,37

    ,419-437.de la Torre,J.(2009).DINA model and parameter estimation:A didactic.

    Journal of Educational and Behavioral Statistics,34

    ,115-130.de la Torre,J.(2011).The generalized DINA model framework.

    Psychometrika,76

    ,179-199.de la Torre,J.,&Douglas,J.A.(2004).Higher-order latent trait models for cognitive diagnosis.

    Psychometrika,69

    ,333-353.Dempster,A.P.,Laird,N.M.,&Rubin,D.B.(1977).Maximum likelihood estimation from incomplete data via the EM algorithm.

    Journal of the Royal Statistical Society,Series B,39

    ,1-38.Greeno,J.G.(1980).Trends in the theory of knowledge for problem solving.In D.T.Tuma &F.Reif (Eds.),

    Problem solving and education: Issues in teaching and research

    (pp.9-23).Hillsdale,NJ:Erlbaum.Haertel,E.H.(1989).Using restricted latent class models to map the skill structure of achievement items.

    Journal of Educational Measurement,26

    ,301-321.Hartz,S.M.(2002).

    A Bayesian framework for the unified model for assessing cognitive abilities: Blending theory with practicality

    (Unpublished doctorial dissertation).Department of Statistics,University of Illinois at Urbana-Champaign.Henson,R.A.,Templin,J.L.,&Willse,J.T.(2009).Defining a family of cognitive diagnosis models using log-linear models with latent variables.

    Psychometrika,74

    ,191-210.Holland,P.W.,&Thayer,D.T.(1988).Differential item functioning and the Mantel-Haenszel procedure.In H.Wainer &H.I.Braun (Eds.),

    Test validity

    (pp.129-145).Hillsdale,NJ:Lawrence Erlbaum.Hou,L.K.,de la Torre,J.,&Nandakumar,R.(2014).Differential item functioning assessment in cognitive diagnosis modeling:Applying Wald test to investigate DIF for DINA model.

    Journal of Educational Measurement,51

    ,98-125.Junker,B.W.,&Sijtsma,K.(2001).Cognitive assessment models with few assumptions,and connections with nonparametric item response theory.

    Applied Psychological Measurement,25

    ,258-272.Kenward,M.G.&Molenberghs,G.(1998).Likelihood based frequentist inference when data are missing at random.

    Statistical Science,13

    ,236-247.Leighton,J.,&Gierl,M.(2007).

    Cognitive diagnostic assessment for education: Theory and applications

    .Cambridge:Cambridge University Press.Li,F.M.(2008).

    A modified higher-order DINA model for detecting differential item functioning and differential attribute functioning

    (Unpublished doctorial dissertation).University of Georgia.Li,X.M.,&Wang,W.C.(2015).Assessment of differential item functioning under cognitive diagnosis models:The DINA model example.

    Journal of Educational Measurement,52

    ,28-54.Louis,T.A.(1982).Finding the observed information matrix when using the EM algorithm.

    Journal of the Royal Statistical Society,Series B,44

    ,226-233.Mantel,N.,&Haenszel,W.(1959).Statistical aspects of the analysis of data from retrospective studies of disease.

    Journal of the National Cancer Institute,22

    ,719-748.Paek,I.,&Cai,L.(2013).A comparison of item parameter standard error estimation procedures for unidimensional and multidimensional item response theory modeling.

    Educational and Psychological Measurement,74

    ,58-76.R Core Team (2015).

    R: A language and environment for statistical computing.

    R foundation for statistical computing,Vienna,Austria.Retrieved July 2,2015,from http://www.R-project.orgRupp,A.A.,Templin,J.,&Henson,R.A.(2010).

    Diagnostic measurement: Theory,methods,and applications

    .New York,NY:Guilford.Shealy,R.,&Stout,W.(1993).A model-based standardization approach that separates true bias/DIF from group ability differences and detects test bias/DTF as well as item bias/DIF.

    Psychometrika,58

    ,159-194.Sünbül,?.,&Sünbül,S.?.(2015,July).

    Evaluating performance of differential item functioning detection methods for DIF data in DINA model

    .Paper presented at the meeting of the annual meeting of the International Meeting of the Psychometric Society,Beijing,China.Swaminathan,H.,&Rogers,H.J.(1990).Detecting differential item functioning using logistic regression procedures.

    Journal of Educational Measurement,27

    (4),361-370.Templin,J.L.,&Henson,R.A.(2006).Measurement of psychological disorders using cognitive diagnosis models.

    Psychological Methods,11

    ,287-305.Tian,W.,Cai,L.,Thissen,D.,&Xin,T.(2013).Numerical differentiation methods for computing error covariance matrices in item response theory modeling:An evaluation and a new proposal.

    Educational and Psychological Measurement,73

    ,412-439.von Davier,M.(2005).

    A general diagnostic model applied to language testing data (ETS Research Report RR-05-16).

    Princeton:Educational Testing Service.von Davier,M.(2009).Some notes on the reinvention of latent structure models as diagnostic classification models.

    Measurement:Interdisciplinary Research and Perspectives, 7

    ,67-74.Wang,Z.R.,Bian,Y.F.,&Guo,L.(2015).The impact of DIF on estimating accuracy of cognitive diagnostic test.

    Psychological Exploration,35

    ,272-278.[王卓然,邊玉芳,郭磊.(2015).項(xiàng)目功能差異對于認(rèn)知診斷測驗(yàn)估計(jì)準(zhǔn)確性的影響.

    心理學(xué)探新,35

    ,272-278.]Wang,Z.R.,Guo,L.,&Bian,Y.F.(2014).Comparison of DIF detecting methods in cognitive diagnostic test.

    Acta Psychologica Sinica,46

    ,1923-1932.[王卓然,郭磊,邊玉芳.(2014).認(rèn)知診斷測驗(yàn)中的項(xiàng)目功能差異檢測方法比較.

    心理學(xué)報(bào),46

    ,1923-1932.]Zhang,W.(2006).

    Detecting differential item functioning using the DINA model

    (Unpublished doctorial dissertation).University of North Carolina at Greensboro.

    猜你喜歡
    受測者診斷模型錯(cuò)誤率
    多源領(lǐng)域自適應(yīng)的往復(fù)壓縮機(jī)在線診斷方法
    限制性隨機(jī)試驗(yàn)中選擇偏倚導(dǎo)致的一類錯(cuò)誤率膨脹*
    怒氣沖沖 或因睡不好
    CD4細(xì)胞計(jì)數(shù)聯(lián)合IGRA預(yù)測AIDS/Ⅲ型TB影像診斷模型分析
    甘肅科技(2020年20期)2020-04-13 00:30:56
    新媒體科研環(huán)境下自發(fā)式科研協(xié)同行為機(jī)制研究
    一種電網(wǎng)通信網(wǎng)絡(luò)的故障檢測方法及系統(tǒng)
    正視錯(cuò)誤,尋求策略
    教師·中(2017年3期)2017-04-20 21:49:49
    解析小學(xué)高段學(xué)生英語單詞抄寫作業(yè)錯(cuò)誤原因
    降低學(xué)生計(jì)算錯(cuò)誤率的有效策略
    淘寶排行榜
    他把我摸到了高潮在线观看| netflix在线观看网站| x7x7x7水蜜桃| x7x7x7水蜜桃| 亚洲第一欧美日韩一区二区三区| 狂野欧美白嫩少妇大欣赏| 后天国语完整版免费观看| av福利片在线| 在线观看免费日韩欧美大片| 免费搜索国产男女视频| 亚洲五月天丁香| 国产成人影院久久av| 啪啪无遮挡十八禁网站| 亚洲五月天丁香| 午夜免费激情av| 成人手机av| 久久久久九九精品影院| 国产亚洲av嫩草精品影院| 久久精品成人免费网站| 俺也久久电影网| 成年人黄色毛片网站| 91国产中文字幕| 成人av在线播放网站| 老司机午夜十八禁免费视频| 欧美黄色淫秽网站| 久久久久国内视频| 日本 欧美在线| 亚洲aⅴ乱码一区二区在线播放 | 校园春色视频在线观看| 午夜福利成人在线免费观看| 欧美极品一区二区三区四区| 午夜福利成人在线免费观看| 亚洲国产中文字幕在线视频| 欧美丝袜亚洲另类 | 午夜免费观看网址| 黄片小视频在线播放| 亚洲男人天堂网一区| 深夜精品福利| 亚洲精品国产精品久久久不卡| 国产午夜精品久久久久久| 琪琪午夜伦伦电影理论片6080| 欧美一区二区国产精品久久精品 | 亚洲人成电影免费在线| 黄色片一级片一级黄色片| 国产视频内射| 欧美一级毛片孕妇| 国产精品永久免费网站| 国产精品一区二区免费欧美| 脱女人内裤的视频| 人人妻人人看人人澡| 国产精品亚洲美女久久久| 亚洲午夜精品一区,二区,三区| 亚洲精品一卡2卡三卡4卡5卡| 夜夜看夜夜爽夜夜摸| 国产黄片美女视频| 一边摸一边抽搐一进一小说| 岛国在线免费视频观看| 亚洲一码二码三码区别大吗| 欧美三级亚洲精品| 亚洲av五月六月丁香网| 亚洲 欧美 日韩 在线 免费| 人妻夜夜爽99麻豆av| 好男人电影高清在线观看| www.自偷自拍.com| 少妇人妻一区二区三区视频| 亚洲国产看品久久| 99热只有精品国产| 色综合站精品国产| 91av网站免费观看| 最近最新免费中文字幕在线| 欧美成狂野欧美在线观看| 精品无人区乱码1区二区| 国产精品亚洲av一区麻豆| 日韩欧美在线二视频| 两个人看的免费小视频| 成人一区二区视频在线观看| 国产熟女xx| 婷婷精品国产亚洲av| 999精品在线视频| 男女午夜视频在线观看| 男女做爰动态图高潮gif福利片| 久久久久久久久久黄片| 精品国产乱码久久久久久男人| 啪啪无遮挡十八禁网站| 久久香蕉激情| 欧美3d第一页| 成人18禁在线播放| 国产1区2区3区精品| 两性午夜刺激爽爽歪歪视频在线观看 | 看免费av毛片| 九色国产91popny在线| 国产精品电影一区二区三区| 看免费av毛片| 一本综合久久免费| 日本成人三级电影网站| 日韩欧美 国产精品| 亚洲自拍偷在线| 欧美午夜高清在线| 一二三四社区在线视频社区8| 天堂√8在线中文| 国产精品日韩av在线免费观看| 听说在线观看完整版免费高清| 欧美黑人巨大hd| 午夜免费激情av| 免费人成视频x8x8入口观看| 亚洲一码二码三码区别大吗| 欧美人与性动交α欧美精品济南到| 在线看三级毛片| √禁漫天堂资源中文www| 窝窝影院91人妻| 国产精品乱码一区二三区的特点| 一二三四在线观看免费中文在| 国产精品综合久久久久久久免费| 欧美av亚洲av综合av国产av| 久久99热这里只有精品18| 十八禁网站免费在线| 叶爱在线成人免费视频播放| а√天堂www在线а√下载| 嫁个100分男人电影在线观看| 给我免费播放毛片高清在线观看| 久久久精品国产亚洲av高清涩受| 熟女少妇亚洲综合色aaa.| 成人18禁在线播放| 欧美成狂野欧美在线观看| 久99久视频精品免费| 一进一出抽搐动态| 黄色片一级片一级黄色片| 老司机福利观看| 成人一区二区视频在线观看| 特级一级黄色大片| 一级黄色大片毛片| 日本免费一区二区三区高清不卡| 国产一区二区在线观看日韩 | 狂野欧美白嫩少妇大欣赏| 亚洲国产精品久久男人天堂| 50天的宝宝边吃奶边哭怎么回事| 好看av亚洲va欧美ⅴa在| 久久久久久免费高清国产稀缺| 精品人妻1区二区| 国产精品av视频在线免费观看| 十八禁网站免费在线| 久久精品国产亚洲av高清一级| 久9热在线精品视频| 亚洲欧美精品综合久久99| 欧美久久黑人一区二区| 日日摸夜夜添夜夜添小说| 手机成人av网站| 又粗又爽又猛毛片免费看| 国产精品香港三级国产av潘金莲| 亚洲精品美女久久久久99蜜臀| 亚洲狠狠婷婷综合久久图片| 久久天躁狠狠躁夜夜2o2o| 日本一区二区免费在线视频| 日本在线视频免费播放| 成人精品一区二区免费| 精品不卡国产一区二区三区| 757午夜福利合集在线观看| 又紧又爽又黄一区二区| 欧美+亚洲+日韩+国产| 免费无遮挡裸体视频| 亚洲欧美精品综合一区二区三区| av免费在线观看网站| 精品国产亚洲在线| 色噜噜av男人的天堂激情| 久久香蕉国产精品| 欧美成狂野欧美在线观看| 91大片在线观看| 在线十欧美十亚洲十日本专区| 国产精品98久久久久久宅男小说| 伊人久久大香线蕉亚洲五| 美女黄网站色视频| 一个人免费在线观看电影 | 成人手机av| 亚洲avbb在线观看| 波多野结衣巨乳人妻| 三级男女做爰猛烈吃奶摸视频| 神马国产精品三级电影在线观看 | 法律面前人人平等表现在哪些方面| 丁香六月欧美| 一级黄色大片毛片| 99re在线观看精品视频| 亚洲国产欧洲综合997久久,| 国产高清有码在线观看视频 | 国产1区2区3区精品| 亚洲中文字幕日韩| 午夜福利欧美成人| 久久久久久久午夜电影| 欧美黑人巨大hd| 成人国语在线视频| 国产激情偷乱视频一区二区| 老司机在亚洲福利影院| 日韩精品青青久久久久久| 精品乱码久久久久久99久播| 大型av网站在线播放| 99热6这里只有精品| 国产av一区在线观看免费| 国产精品亚洲美女久久久| 老熟妇仑乱视频hdxx| 国产精品久久久人人做人人爽| 男女之事视频高清在线观看| 成人av在线播放网站| 中文字幕最新亚洲高清| 不卡av一区二区三区| 成人av一区二区三区在线看| 久久这里只有精品中国| 久久中文字幕一级| 好男人在线观看高清免费视频| 精品久久久久久成人av| 人人妻人人看人人澡| 色哟哟哟哟哟哟| 久久精品国产亚洲av香蕉五月| 国产亚洲精品久久久久5区| 后天国语完整版免费观看| 国产精品永久免费网站| www日本在线高清视频| 午夜福利在线在线| 国产精品一区二区三区四区久久| 免费人成视频x8x8入口观看| www国产在线视频色| 日日摸夜夜添夜夜添小说| 亚洲一区二区三区色噜噜| 婷婷六月久久综合丁香| 国产亚洲精品久久久久5区| 18禁黄网站禁片午夜丰满| 久久人妻av系列| 亚洲一区中文字幕在线| 国产三级在线视频| 亚洲av日韩精品久久久久久密| 日本一二三区视频观看| 国产久久久一区二区三区| 香蕉久久夜色| 一进一出抽搐gif免费好疼| 亚洲成人国产一区在线观看| av视频在线观看入口| 国产精品美女特级片免费视频播放器 | 两个人免费观看高清视频| 亚洲精品一区av在线观看| 亚洲美女视频黄频| 俄罗斯特黄特色一大片| 午夜免费激情av| 人妻久久中文字幕网| 国产亚洲精品一区二区www| 999久久久国产精品视频| 亚洲,欧美精品.| 国产精品久久久久久人妻精品电影| 老司机午夜十八禁免费视频| 99国产精品99久久久久| 午夜视频精品福利| 国产私拍福利视频在线观看| 色播亚洲综合网| 欧美一级毛片孕妇| 又黄又粗又硬又大视频| 久久精品人妻少妇| 天堂动漫精品| 成年人黄色毛片网站| 两个人看的免费小视频| 久热爱精品视频在线9| 一a级毛片在线观看| 国产精品av久久久久免费| 操出白浆在线播放| 窝窝影院91人妻| 成人av一区二区三区在线看| 十八禁网站免费在线| 中国美女看黄片| 欧美国产日韩亚洲一区| 国内精品一区二区在线观看| 最好的美女福利视频网| 女生性感内裤真人,穿戴方法视频| 欧美乱妇无乱码| 操出白浆在线播放| 久久热在线av| 久久久久久免费高清国产稀缺| 国产精品香港三级国产av潘金莲| 一夜夜www| 欧美3d第一页| 日韩欧美在线乱码| 国产高清视频在线播放一区| 波多野结衣高清作品| 两性夫妻黄色片| 天堂影院成人在线观看| 亚洲色图av天堂| 久久精品aⅴ一区二区三区四区| 国产成人精品无人区| 色av中文字幕| 成年版毛片免费区| 久久精品aⅴ一区二区三区四区| 亚洲aⅴ乱码一区二区在线播放 | 无遮挡黄片免费观看| 精品久久久久久久毛片微露脸| 国产成人av教育| 亚洲中文日韩欧美视频| 精品人妻1区二区| 国产一区二区三区在线臀色熟女| 国产真实乱freesex| 看免费av毛片| 91字幕亚洲| 90打野战视频偷拍视频| 操出白浆在线播放| 色综合婷婷激情| 精华霜和精华液先用哪个| 日韩大码丰满熟妇| 午夜精品一区二区三区免费看| 欧美一区二区精品小视频在线| 一个人免费在线观看的高清视频| 可以免费在线观看a视频的电影网站| 国产精品98久久久久久宅男小说| 免费高清视频大片| 免费在线观看成人毛片| 亚洲av五月六月丁香网| 波多野结衣高清作品| 国产视频内射| av福利片在线观看| av有码第一页| 国产单亲对白刺激| 亚洲成人免费电影在线观看| 国产精品九九99| www国产在线视频色| av福利片在线观看| 变态另类丝袜制服| 久久久久久亚洲精品国产蜜桃av| 国语自产精品视频在线第100页| 天堂动漫精品| 亚洲一区高清亚洲精品| av免费在线观看网站| АⅤ资源中文在线天堂| e午夜精品久久久久久久| 成年版毛片免费区| 99在线人妻在线中文字幕| 最新在线观看一区二区三区| 亚洲色图av天堂| 天堂√8在线中文| www国产在线视频色| 亚洲中文字幕日韩| or卡值多少钱| 日本三级黄在线观看| 久久婷婷成人综合色麻豆| 香蕉丝袜av| 伦理电影免费视频| 午夜福利高清视频| 男女之事视频高清在线观看| 最近最新中文字幕大全电影3| 久久婷婷成人综合色麻豆| 极品教师在线免费播放| av福利片在线| netflix在线观看网站| 久久天堂一区二区三区四区| 免费在线观看黄色视频的| 少妇熟女aⅴ在线视频| 国产成年人精品一区二区| 成年免费大片在线观看| 三级男女做爰猛烈吃奶摸视频| 久久久久久久午夜电影| 国产精品久久电影中文字幕| 99久久久亚洲精品蜜臀av| 搡老妇女老女人老熟妇| 久久热在线av| 在线视频色国产色| 久久午夜亚洲精品久久| 欧美性长视频在线观看| 亚洲国产欧洲综合997久久,| 中出人妻视频一区二区| 国产一区二区三区视频了| 免费看美女性在线毛片视频| 国产高清videossex| 99国产极品粉嫩在线观看| 午夜福利在线观看吧| 国产亚洲精品综合一区在线观看 | 国产成人啪精品午夜网站| 亚洲专区中文字幕在线| √禁漫天堂资源中文www| 午夜激情av网站| 国产一区二区激情短视频| 国产精品久久电影中文字幕| av福利片在线观看| 亚洲国产欧美人成| 色尼玛亚洲综合影院| 精品人妻1区二区| 亚洲五月婷婷丁香| 成人永久免费在线观看视频| 欧美黑人精品巨大| 成人手机av| 成人高潮视频无遮挡免费网站| 99久久国产精品久久久| 国产亚洲精品av在线| 欧美又色又爽又黄视频| а√天堂www在线а√下载| 脱女人内裤的视频| 日韩欧美精品v在线| videosex国产| 午夜成年电影在线免费观看| 日韩国内少妇激情av| 男女床上黄色一级片免费看| 搡老妇女老女人老熟妇| 50天的宝宝边吃奶边哭怎么回事| 日本成人三级电影网站| 亚洲av成人av| 久久精品成人免费网站| 可以在线观看毛片的网站| 成人av一区二区三区在线看| 国产精品,欧美在线| 亚洲人成伊人成综合网2020| 亚洲一区二区三区色噜噜| 日韩欧美 国产精品| 中文字幕熟女人妻在线| 午夜久久久久精精品| 国产熟女xx| 久久精品aⅴ一区二区三区四区| 午夜a级毛片| 狂野欧美白嫩少妇大欣赏| 国产精品98久久久久久宅男小说| 久久久久亚洲av毛片大全| 中国美女看黄片| 日日夜夜操网爽| 精品少妇一区二区三区视频日本电影| 男女床上黄色一级片免费看| 亚洲最大成人中文| 岛国在线观看网站| 精品久久久久久,| 俺也久久电影网| 色尼玛亚洲综合影院| 国产精品99久久99久久久不卡| 午夜两性在线视频| 亚洲成人精品中文字幕电影| cao死你这个sao货| 99热这里只有精品一区 | 欧美黑人欧美精品刺激| a在线观看视频网站| 久久精品成人免费网站| av视频在线观看入口| 天堂av国产一区二区熟女人妻 | 国产伦人伦偷精品视频| 日本一区二区免费在线视频| 波多野结衣巨乳人妻| 国产精品av视频在线免费观看| 国产高清有码在线观看视频 | 久久草成人影院| 欧美一区二区精品小视频在线| 嫩草影视91久久| 十八禁人妻一区二区| 国产精品电影一区二区三区| 国产在线观看jvid| 精品免费久久久久久久清纯| 国内精品久久久久精免费| 国产亚洲精品久久久久久毛片| 天天躁狠狠躁夜夜躁狠狠躁| 国产成人一区二区三区免费视频网站| 亚洲专区字幕在线| 好男人电影高清在线观看| 国产91精品成人一区二区三区| 在线观看免费午夜福利视频| 国产亚洲精品av在线| 777久久人妻少妇嫩草av网站| 欧美黑人精品巨大| 18禁黄网站禁片免费观看直播| 两个人免费观看高清视频| 亚洲五月婷婷丁香| 国产伦在线观看视频一区| 国产一区二区在线观看日韩 | 国产伦人伦偷精品视频| 国产成人精品久久二区二区免费| 久久久精品欧美日韩精品| 天堂影院成人在线观看| 国产午夜精品久久久久久| 特大巨黑吊av在线直播| 少妇被粗大的猛进出69影院| 欧美3d第一页| 黄色女人牲交| aaaaa片日本免费| 无限看片的www在线观看| 久久久久久人人人人人| 午夜免费观看网址| 午夜精品在线福利| 韩国av一区二区三区四区| 日本一区二区免费在线视频| 日本在线视频免费播放| 国内精品一区二区在线观看| 欧美一区二区国产精品久久精品 | 亚洲人成电影免费在线| 亚洲专区字幕在线| 久久香蕉国产精品| 在线观看免费午夜福利视频| 亚洲国产精品久久男人天堂| 国产精品日韩av在线免费观看| 欧美丝袜亚洲另类 | 一区二区三区国产精品乱码| 久久午夜亚洲精品久久| e午夜精品久久久久久久| 成人18禁高潮啪啪吃奶动态图| 国产熟女xx| 人人妻人人看人人澡| 久久久久国产精品人妻aⅴ院| 亚洲中文字幕日韩| 19禁男女啪啪无遮挡网站| 欧美zozozo另类| 99久久国产精品久久久| 两个人看的免费小视频| ponron亚洲| 亚洲五月天丁香| 免费无遮挡裸体视频| 亚洲精品粉嫩美女一区| 欧美最黄视频在线播放免费| 日本 av在线| 91国产中文字幕| 午夜两性在线视频| 黄片小视频在线播放| 两人在一起打扑克的视频| 亚洲av熟女| 国产1区2区3区精品| 午夜影院日韩av| 亚洲人与动物交配视频| 午夜日韩欧美国产| 啦啦啦免费观看视频1| 99精品久久久久人妻精品| 欧美日本视频| 亚洲熟妇中文字幕五十中出| 久久亚洲真实| 日韩大尺度精品在线看网址| 亚洲成人国产一区在线观看| aaaaa片日本免费| 精品国产超薄肉色丝袜足j| 在线观看美女被高潮喷水网站 | 999久久久精品免费观看国产| 宅男免费午夜| svipshipincom国产片| 人妻夜夜爽99麻豆av| 日日干狠狠操夜夜爽| 精品久久久久久久人妻蜜臀av| 村上凉子中文字幕在线| 日本免费a在线| 蜜桃久久精品国产亚洲av| 无遮挡黄片免费观看| 最近最新免费中文字幕在线| 黄色a级毛片大全视频| 午夜免费观看网址| 日韩有码中文字幕| 一二三四在线观看免费中文在| 一夜夜www| 国产又黄又爽又无遮挡在线| 男人舔奶头视频| 无人区码免费观看不卡| 国内精品一区二区在线观看| 日韩三级视频一区二区三区| 人妻丰满熟妇av一区二区三区| 免费看a级黄色片| 精品久久久久久久末码| 国产精品98久久久久久宅男小说| 亚洲精品国产精品久久久不卡| 啦啦啦观看免费观看视频高清| 亚洲国产精品999在线| 在线观看免费日韩欧美大片| 亚洲欧美精品综合一区二区三区| 黄色视频不卡| 精品午夜福利视频在线观看一区| 日韩欧美国产一区二区入口| 免费人成视频x8x8入口观看| 成人一区二区视频在线观看| 欧美+亚洲+日韩+国产| 国产伦人伦偷精品视频| 亚洲人成网站高清观看| 欧美一区二区精品小视频在线| 麻豆成人午夜福利视频| 91在线观看av| 色在线成人网| 亚洲色图 男人天堂 中文字幕| 日本熟妇午夜| 黄频高清免费视频| 国产在线精品亚洲第一网站| 午夜福利欧美成人| 成人亚洲精品av一区二区| 少妇粗大呻吟视频| 午夜亚洲福利在线播放| 亚洲最大成人中文| 国产精品久久久久久精品电影| 别揉我奶头~嗯~啊~动态视频| 91老司机精品| 免费看a级黄色片| 精品熟女少妇八av免费久了| 亚洲国产日韩欧美精品在线观看 | 午夜福利在线观看吧| 一二三四在线观看免费中文在| 亚洲国产欧美人成| 天堂影院成人在线观看| 99re在线观看精品视频| 真人一进一出gif抽搐免费| 观看免费一级毛片| 在线免费观看的www视频| 国内精品久久久久久久电影| 国产亚洲精品一区二区www| 久久精品aⅴ一区二区三区四区| 欧美成狂野欧美在线观看| 精品一区二区三区视频在线观看免费| 听说在线观看完整版免费高清| 国产精品一区二区免费欧美| 亚洲av美国av| 久久久精品国产亚洲av高清涩受| 亚洲人成网站在线播放欧美日韩| cao死你这个sao货| 久久 成人 亚洲| 在线免费观看的www视频| xxx96com| 亚洲国产精品999在线| 国产欧美日韩一区二区精品| 午夜视频精品福利| 一级片免费观看大全| 欧美不卡视频在线免费观看 | 麻豆成人午夜福利视频| 国产熟女xx| 波多野结衣高清作品| 国产精品 欧美亚洲| 国产私拍福利视频在线观看| 亚洲一区高清亚洲精品| 久久婷婷成人综合色麻豆| 亚洲人成电影免费在线| 成人高潮视频无遮挡免费网站| 黄片小视频在线播放|