• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    認知診斷測驗Q矩陣估計方法比較

    2015-07-06 00:36:40涂冬波
    中國考試 2015年5期
    關(guān)鍵詞:界定測驗矩陣

    劉 永 涂冬波

    1 引言

    近年來,隨著認知心理學(xué)、心理測量學(xué)和計算機技術(shù)的飛速發(fā)展,認知診斷以微觀認知角度對被試做出準確評估與反饋的優(yōu)勢在心理與教育測量領(lǐng)域展現(xiàn)出巨大發(fā)展?jié)摿?。然而,編制一份?yōu)良的認知診斷測驗并非易事。正如Tatsuoka所言,認知診斷是一項復(fù)雜的工程,它至少包括“Q矩陣理論”和“診斷分類”兩大部分[1]。Q矩陣是對測驗項目與認知屬性關(guān)系的描述,是診斷分類的基礎(chǔ)。以往許多研究中,一般均假設(shè)所界定的測驗Q矩陣是正確的,并在此基礎(chǔ)上進行診斷分類。但是,合理界定測驗Q矩陣并非易事,典型的例子就是國外許多研究者[2-9]對Tatsuoka的分數(shù)減法測驗的屬性界定就爭論了二十多年,到目前為止仍未有定論。以至于DeCarlo曾感嘆測驗屬性界定的復(fù)雜性,并認為它是導(dǎo)致目前認知診斷在實際應(yīng)用中受限的主要原因之一[6,10]。研究表明錯誤界定的測驗Q矩陣會嚴重影響模型參數(shù)估計及被試分類準確性[11]。因此,對高質(zhì)量認知診斷測驗而言,合理界定測驗Q矩陣十分必要。

    縱觀國內(nèi)外相關(guān)研究[7,10,12-14],目前界定測驗Q矩陣有三種基本思路:

    (1)項目的簡單檢查(Simple inspection of the items):該界定思路比較普遍,其主要做法是在測驗Q矩陣界定之初,依據(jù)編制者自身在該領(lǐng)域內(nèi)的經(jīng)驗確定項目所測屬性。運用該思路Henson等人對1999年 TIMSS(Third International Mathematics and Science Study)化學(xué)測驗的題目屬性進行界定[13]。

    (2)多評分者法(Multiple Rater Methods):該思路主要是邀請領(lǐng)域內(nèi)若干經(jīng)驗豐富的專家,通過討論或發(fā)放調(diào)查表來確定測驗項目所測的屬性。運用該思路界定測驗Q矩陣比較廣泛,比如Li等人就運用該方法對MELAB(Michigan English Language Assessment Battery)閱讀測驗的Q矩陣進行界定[12]。

    (3)基于項目參數(shù)的迭代過程(Iterative procedures based on item parameters),該方法是在Q矩陣界定后進行模型參數(shù)估計,然后修正項目參數(shù)存在異常的項目屬性,最后將修正后的Q矩陣重新納入?yún)?shù)估計直到項目參數(shù)不再出現(xiàn)異常為止。判斷項目參數(shù)是否存在異常的方法包括:MCMC估計結(jié)果是否收斂;被試屬性類別的概率是否太低;擬合檢驗結(jié)果是否理想等[13,14]?;谶@種思路de la Torre提出測驗Q矩陣修正的δ法[7]、涂冬波等人提出γ法[10]。

    不難發(fā)現(xiàn),上述三種思路存在缺陷:第一,項目的簡單檢查和多評分者法采用研究者或?qū)<乙庖娊缍y驗Q矩陣雖然可以確保界定結(jié)果的可解釋性,但是,不同專家知識經(jīng)驗間的差異及專家的遴選標準是這兩種思路必須面對的問題,目前而言對這些問題的回答并沒有統(tǒng)一的結(jié)論;第二,基于項目參數(shù)的迭代過程較前兩種雖有一定客觀性,但該方法往往以測驗編制初期已經(jīng)界定好的Q矩陣為基礎(chǔ),前期界定的Q矩陣的正確與否會嚴重影響模型的參數(shù)估計進而影響后續(xù)對Q矩陣修正的效果;第三,錯誤界定的Q矩陣對診斷模型擬合也比較敏感[11],一旦模型發(fā)生改變修正所得的結(jié)果往往也千差萬別。

    既然對高質(zhì)量認知診斷測驗而言合理構(gòu)建Q矩陣十分必要,而上述三種界定思路又存在著諸多缺陷,那么可否存從被試作答反應(yīng)入手估計出測驗Q矩陣為專家界定測驗Q矩陣提供參考呢?本文以Chiu[2]對Q矩陣估計方法分類為基礎(chǔ)①Chiu(2013)按是否涉及參數(shù)估計過程將Q矩陣估計分為參數(shù)化法和非參數(shù)化法,她將數(shù)據(jù)驅(qū)動學(xué)習(xí)法歸為非參數(shù)化法,但本文認為數(shù)據(jù)驅(qū)動學(xué)習(xí)法要對模型參數(shù)進行MLE估計,應(yīng)屬參數(shù)化法。,從參數(shù)化與否出發(fā)介紹6種基于被試作答反應(yīng)的Q矩陣估計方法的思想、步驟及應(yīng)用情況,總結(jié)這些方法的特點并展望未來研究方向,為認知診斷研究及應(yīng)用提供借鑒和基礎(chǔ)。

    為表述方便,現(xiàn)對基本符號做統(tǒng)一規(guī)定:N、J分別為被試數(shù)和項目數(shù);U為被試作答反應(yīng)矩陣,uij為被試i對項目j的作答(1答對,0答錯);K為測驗考核的屬性數(shù)目,qjk為項目j對屬性k的考核狀況(1考核,0未考核);α為被試的知識狀態(tài)(Knowledge State,KS),αik為被試i對屬性k的掌握狀況(1掌握,0未掌握)。

    2 Q矩陣非參數(shù)化估計法

    非參數(shù)化估計法(Nonparametric estimation method)特點是使用統(tǒng)計聚類技術(shù),以距離最短為原則確定測驗Q矩陣元素,包括爬山法[15-17]和統(tǒng)計提純法[2]。

    2.1 爬山法(hill-climbing algorithm)② Barnes(2003,2005,2010)在其論文中稱該方法為Q矩陣法(Q-matrix Method),為避免引起誤解,本文以該方法所運用的爬山算法(hill-climbing algorithm)進行命名。

    該法源于Tatsuoka等人提出的規(guī)則空間法(Rule Space Method,RSM)[1,18,19]。RSM認為如果由某一理想掌握模式(Ideal Mastery Pattern,IMP)對應(yīng)的理想項目反應(yīng)模式(Ideal Response Pattern,IRP)所確定的純規(guī)則點與由被試作答反應(yīng)向量(Response Vector,RV)確定的規(guī)則點之間距離最短,那么該IMP就為被試的屬性掌握模式。爬山法沿襲這一思路,不同之處在于計算IRP上。對屬性數(shù)目K已知的測驗,該法具體描述如下:

    (1)隨機生成一個J行K列元素值在0,1之間的Q矩陣,同時生成2k個長度為K的IMP;

    (2)由Q矩陣和IMP計算IRP,其第j個分量的計算公式如下:

    (3)計算每個被試RV與所有IRP間的距離d,即:

    (4)將最小的d作為該被試的誤差,對所有被試誤差求和作為Q矩陣總誤差;

    (5)給單個Q矩陣元素加或減很小的值(如0.1),計算變化后Q矩陣總誤差,如果總誤差降低則將該元素值保存,繼續(xù)下一個元素估計;

    (6)重復(fù)(2)到(5)直到Q矩陣總誤差小于預(yù)設(shè)值(也稱終止規(guī)則)為止。

    當屬性數(shù)目K未知時,可依次增加屬性個數(shù)直到符合終止規(guī)則①Barnes(2003,2010)認為有兩種終止規(guī)則:(1)預(yù)先設(shè)定的值;(2)取Q矩陣總誤差相對較小的那個Q矩陣。為止。

    Barnes[15]使用該方法對北卡萊羅納州立大學(xué)2002年秋季離散代數(shù)課程(Discrete Mathematics Course at North Carolina State University in Fall 2002)的數(shù)據(jù)進行分析,結(jié)果發(fā)現(xiàn):(1)由專家定義的Q矩陣和估計的Q矩陣存在很大差異,差異主要表現(xiàn)在較難或較復(fù)雜項目上;(2)當項目數(shù)量較多時,估計Q的矩陣更準確;(3)如果被試作答涉及高猜測或失誤,則需要大量被試,屬性個數(shù)也比低猜測或低失誤時要小。

    該法初次嘗試基于被試作答反應(yīng)估計測驗Q矩陣,結(jié)果雖粗糙且有不確定性,但它為后來研究提供了新思路。

    2.2 統(tǒng)計提純法(statistical refinement of the QMatrix)

    Chiu認為基于模型的Q矩陣修正或估計的方法的缺點是當模型發(fā)生改變或模型—數(shù)據(jù)不擬合或擬合較差時,效果會大打折扣[2]。此外,隨著屬性、測驗項目及樣本量的增加,估計所耗費的時間也成倍增加。因此,Chiu提出非參數(shù)化Q矩陣估計方法——統(tǒng)計提純法。

    該方法認為如果某一項目的被試作答反應(yīng)與理想反應(yīng)間的殘差平方和(Residual Sum of Squares,RSS)達到最小,就表明該項目的q向量被正確指定。具體可用下式表示:

    公式3中,RSSj為所有被試在項目j的殘差平方和;ηij為被試i在項目j上的理想反應(yīng)(對于DINA模型,但是,現(xiàn)實情況下被試屬性向量α一般是未知的,不能直接得到ηij,需對公式3作如下變換:

    其中,Cm為第m類潛在掌握類別(Latent Proficiency-class)被試的集合;ηmj表示第m類被試對項目j的理想反應(yīng)。盡管采用潛在類別m替代單個被試i,但屬性分類依舊困難。Chiu(2013)指出該法以一種非參數(shù)分類法為基礎(chǔ),通過計算加權(quán)的Hamming距離(Weighted Hamming Distance)對被試進行分類[20]。該方法可以理解為:若屬性模式αi對應(yīng)的ηj能使dwh(ui,ηi)最小,那么αi就為該被試的屬性掌握模式。公式表述如下:

    為使該法成為可能,Chiu(2013)開發(fā)了Q矩陣提純算法(The Q-matrix Refinement Algorithm),該算法的詳細步驟如下:

    (1)將S(0)={1,...,J}和Q(0)②一般而言,Q(0)為測驗編制之初由專家界定的Q矩陣。分別作為搜索項目池(Item Pool)和輸入Q矩陣(Input Q-matrix);

    (2)基于Q(0)使用非參數(shù)分類法獲取被試屬性掌握模式α;

    (3)使用 α 和Q(0)計算理想項目反應(yīng) η(DINA模型中

    (4)使用η和觀察項目反應(yīng)u計算每個項目上所有被試的平均RSS(mean RSS across examinees),選擇項目池S(0)中最大RSS的項目,將其q向量記為;

    (7)在S(0)中刪除項目j并更新為S(1);

    (8)用 Q(1)和 S(1)替換 Q(0)和 S(0),重復(fù)(2)至(7)步,直到所有項目都被更新;

    (9)重復(fù)(1)至(8)直到每個項目的RSS不再變化為止。

    Chiu模擬考察了樣本量、屬性個數(shù)、被試屬性分布、項目參數(shù)上限、Q矩陣錯誤率、誤設(shè)類型及診斷模型等對該法的影響,結(jié)果發(fā)現(xiàn):(1)Q矩陣平均判準率(Mean q-entry Recovery Rate,MRR)隨樣本量和測驗長度增加而增加;(2)屬性個數(shù)及項目參數(shù)上限與MRR呈反比;(3)被試屬性掌握模式呈離散均勻分布(Discrete Uniform Distribution)和高階分布(Higher Order Model)比多元正態(tài)分布(Multivariate Normal Threshold Model)的MRR要高;(4)無論何種Q矩陣錯誤率、誤設(shè)類型及診斷模型,MRR都比較高。此外,她還對Tatsuoka分數(shù)減法的數(shù)據(jù)進行分析證實了模擬研究的結(jié)論[2]。

    該方法的優(yōu)勢在于:(1)該方法較少受Q矩陣錯誤率及誤設(shè)類型的影響;(2)它可以拓展到任意一種應(yīng)用屬性掌握模式和Q矩陣的診斷模型中,適用性比較廣;(3)與參數(shù)化估計方法相比,該方法只需要少量被試(200人以上)就可以達到很好的效果,適用于中小樣本的教育測驗項目。但是,該法也有不足之處:(1)該方法以非參數(shù)分類為基礎(chǔ),由于非參數(shù)分類無法處理屬性數(shù)目不確定的情況,因此屬性數(shù)目不確定或錯誤設(shè)定會嚴重影響該方法的估計效果;(2)雖然不同診斷模型(如DINA和NIDA)對該方法的效果沒有影響,但它不能識別診斷模型誤設(shè),必須以模型—數(shù)據(jù)擬合為前提。

    3 Q矩陣參數(shù)化估計法

    參數(shù)化估計法(Parametric Estimation Method)是將Q矩陣視為模型參數(shù),用極大似然估計(Maximum Likelihood Estimation,MLE)或貝葉斯抽樣確定未知Q矩陣元素。包括數(shù)據(jù)驅(qū)動學(xué)習(xí)法[21-23]、貝葉斯法、因素分析法和非線性懲罰估計法。

    3.1 數(shù)據(jù)驅(qū)動學(xué)習(xí)法(Data-Driven of Q-Matrix)

    研究表明錯誤界定的Q矩陣會導(dǎo)致模型資料嚴重失擬,進而出現(xiàn)屬性識別錯誤[2,11,14,24]。因此,開發(fā)能夠偵測Q矩陣誤設(shè)及從作答數(shù)據(jù)獲取Q矩陣的方法是值得探討的。基于此Liu等人提出數(shù)據(jù)驅(qū)動學(xué)習(xí)法(也稱Q矩陣自學(xué)習(xí)理論[21])。

    Liu等人認為:若Q矩陣被正確指定,隨著被試人數(shù)增加,由Q矩陣確定反應(yīng)向量的分布與觀察反應(yīng)向量的分布趨于一致。其邏輯可以采用下式表示:

    公式(6)中,Q'為待考慮Q矩陣(也可以稱為Q矩陣估計值);Qtrue為Q矩陣真值;P(u|Q',p,s,g)表示由參數(shù)(Q',p,s,g)確定的反應(yīng)向量u的分布;P?(u)為作答向量u的觀察分布。即:

    其中,u為作答向量;Pα為P的分量,表示屬性向量α在所有屬性向量中的比例;ui為項目j作答;ui為被試i作答向量。

    為使該邏輯具有實際意義,Liu等人引入T陣(T-matrix)的概念。T陣反映的是觀察反應(yīng)分布公式(8)與模型結(jié)構(gòu)公式(7)間的關(guān)系,它數(shù)據(jù)驅(qū)動學(xué)習(xí)的核心。其構(gòu)建過程大致如下:

    (1)對于單個項目而言,令BQ',s,g(j)表示長度為2K包含P(uj=1|Q',p,s,g)有序排列的行向量,根據(jù)DINA模型,公式(7)可表示為:

    (2)就項目對(Pair of Items)而言,公式(9)可以表示為:

    (3)同理,構(gòu)建T陣如下:

    公式(11)中的 BQ',s,g(J)與公式(1)中的 BQ',s,g(j)區(qū)別在于J表示的是多個項目的組合而非單個項目。依據(jù)公式(9),T陣可表示為:

    令 β為與公式(12)對應(yīng)的列向量,其分量為該項目組合的人數(shù)比,即:當N→∞且β=Ts,g(Q')p時,Q'就為正確指定的Q矩陣。此時,可建立目標函數(shù)(Objective Function)如下:

    (1)確定初始Q矩陣(稱為Q0),在實際應(yīng)用中可用專家判斷得到的Q矩陣代替。對于每個Q'而言,令Ωj(Q')為除Q'中第J行(項目)外的J×K個矩陣系列。

    (2)將Q0作為迭代初值,即Q(0)=Q0。對于第m次迭代,Q0從前一次迭代Qm-1中得到;

    (6)重復(fù)(2)到(4)直到Q(m)=Q(m-1)。

    對于每一次迭代m,算法都要更新J個項目中的一個。如果第j個項目得到更新,那么下一次迭代的Q陣就包含了項目j的屬性向量,記為Qj。由于對(3)步中目標函數(shù)S的優(yōu)化估計最多需要2K次,因此,每一次迭代對目標函數(shù)S的優(yōu)化估計(Optimization Evaluating)需要J×2K次,這大大低于將整個Q陣進行優(yōu)化所需的2J×K次。

    Liu等人模擬考察樣本量、屬性個數(shù)、被試屬性分布等因素對該方法的影響,結(jié)果發(fā)現(xiàn):屬性無結(jié)構(gòu)、小樣本(500人)且項目數(shù)固定(20題),估計Q矩陣與原始Q矩陣不一致率隨屬性個數(shù)增加而增加,K=5,不一致率達62%;早期終止規(guī)則①Liu等人建議設(shè)定為0.045,具體可參考Liu等人(2012)的研究。(early stopping rule)可降低小樣本的高不一致率;屬性α為非均勻分布(屬性間存在相關(guān)),樣本量影響隨屬性間相關(guān)程度降低而變小[22]。

    樣本足夠多情況下應(yīng)用該方法是不錯的選擇。但若違反“猜測參數(shù)已知”和“Q矩陣必須是完備的”①“Q陣必須是完備的”指對于無結(jié)構(gòu)型的屬性層級而言,測驗Q矩陣必須包含單位陣。假設(shè)將導(dǎo)致Q矩陣無法識別,實際中能否滿足還存在疑問。此外,其計算復(fù)雜度隨樣本量、項目和屬性數(shù)目增多而變難,對大規(guī)模測驗而言是不可接受的。

    3.2 貝葉斯法(Bayesian extension method)

    絕大多數(shù)診斷模型需要正確的測驗Q矩陣,但正確界定測驗Q矩陣所有元素是異常困難的。因此,Templin和Henson提出將Q矩陣若干(非全部)不確定元素視為該項目考核已知屬性的主觀概率,通過抽樣獲取這些元素的后驗分布,用后驗均值替代這些未知元素[24]。這是貝葉斯思想用于Q矩陣估計的雛形。

    DeCarlo在Templin和Henson的基礎(chǔ)上進行了深入研究,DeCarlo認為:允許Q矩陣某些元素是隨機而不是固定的,將這些元素視為某一概率參數(shù)的Bernoulli變量,通過貝葉斯抽樣來獲取這些元素[4]。具體步驟如下:

    (1)定義未知參數(shù)的先驗分布:Q矩陣未知元素服從以Beta分布為先驗分布的共軛分布(conjugate prior),即

    (2)由先驗分布對未知元素進行抽樣,得到后驗分布并計算后驗均值。公式如下:

    (3)將后驗均值作為 pjk帶入(1)步得到未知元素qjk。

    DeCarlo模擬考察Q矩陣元素缺失率、已知元素錯誤率及屬性數(shù)目未知等因素對該法的影響,結(jié)果發(fā)現(xiàn):估計準確率隨Q矩陣元素缺失率增加而下降;估計準確率隨已知元素錯誤率增加而降低;屬性個數(shù)未知,估計準確率降低。隨后,他分析Tatsuoka分數(shù)減法數(shù)據(jù)得到Q矩陣估計結(jié)果與前人研究不相上下的結(jié)論。這表明相比de la Torre的方法,該法更簡便。但它在Q矩陣其他元素(非未知元素)都正確時才具有很好的效果,即它不能處理Q矩陣其他元素確定性不高或所有元素都缺失的情形。

    3.3 因素分析法(Exploratory Technique)

    該方法源于因素分析技術(shù),用成分(component)表示測驗涉及的技能或技能系列(skills or skill sets),通過專家對這些成分進行分析來獲取Q矩陣[5]。包含兩步:

    (1)因素分析過程:用因素分析中主成分分析法(Principal Components Analysis,PCA)從被試作答矩陣中抽取成分矩陣和成分間相關(guān)系數(shù)矩陣;

    (2)專家判斷過程:邀請領(lǐng)域內(nèi)專家對成分矩陣和成分間相關(guān)系數(shù)矩陣進行分析,得到最終Q矩陣。

    為便于理解主成分分析過程,Close(2012)將DINA模型變換為符合主成分模型的形式。即:

    其中,M為項目涉及的技能或技能系列數(shù)目(相當于主成分分析模型的成分數(shù)目);λjm為項目j在技能系列m的標準負荷;fim為被試i在技能系列m的標準得分。一般不能直接獲取λjm和fim,需用下式得到:

    Close模擬發(fā)現(xiàn):使用該法得到技能系列數(shù)目與原始Q矩陣中技能組合數(shù)目一致。隨后,她以項目參數(shù)及被試分類的準確性為指標交叉驗證(crossvalidation)了 Tatsuoka分數(shù)減法數(shù)據(jù)、NEAP(National Assessment of Educational Progress)2003年8年級數(shù)學(xué)測驗數(shù)據(jù)和MDE(Minnesota Department of Education)2006年4年級數(shù)學(xué)測驗數(shù)據(jù),結(jié)果表明該法得到的Q矩陣無論項目參數(shù)精度還是被試分類準確性都要優(yōu)于原始Q矩陣。

    該方法有兩個優(yōu)點:第一,它可用于屬性數(shù)目未知的測驗,而這是其他方法達不到的;第二,計算簡便,一般采用SPSS軟件就可完成主成分提取。但該方法也有缺點:首先,它不適用于項目較少的測驗,它要求每種技能或技能系列必須被多個項目考核,現(xiàn)實情況下這一前提很難得到滿足;其次,它并不能直接獲取Q矩陣,需專家判定才能得到,仍擺脫不了專家意見不一致及專家遴選標準不一致的困難;最后,該方法只開發(fā)出DINA模型主成分形式,在其他模型日益應(yīng)用的今天略顯單薄。

    3.4 非線性懲罰估計法(Nonlinear Penalized Estimation)

    該方法是針對Liu等人數(shù)據(jù)驅(qū)動學(xué)習(xí)法缺點提出來的。Xiang認為數(shù)據(jù)驅(qū)動學(xué)習(xí)法“Q矩陣必須是完備的”假設(shè)很難滿足,當項目少而考核屬性多時,它無法對Q矩陣進行準確估計[3]。此外,離散二分變量估計耗時較長,對項目較多的測驗而言是不可接受的。

    Xiang沿用Barnes對項目屬性間關(guān)系的描述,用概率表示項目考核該屬性的可能性。他認為屬性掌握模式為αi的被試答對考核模式為qj項目的概率等同于該項目未考核且被試未掌握的概率見公式(19)[3,15]。具體步驟如下:

    (1)令 P(uij=1|αi,qj)為屬性掌握模式 αi的被試答對項目考核模式qj的概率,其公式表示如下:

    (2)根據(jù)條件獨立性假設(shè),可以構(gòu)建被試i在J道題上作答概率的似然為:

    (3)為了使qjk∈(0,1),需要對qjk進行指數(shù)變換,用替換qjk,即:

    (4)由于被試的屬性向量αi無法直接獲取,需要用潛在掌握模式進行替換,更具條件獨立性假設(shè),可以構(gòu)建項目反應(yīng)函數(shù)的似然函數(shù)如下式:

    其中,P(ui|αl,γj)與公式(20)含義相同;Pαl表示屬性掌握模式為αl的被試占總?cè)藬?shù)的比例。

    (5)為了使結(jié)果加精確和穩(wěn)健,Xiang引入懲罰函數(shù)(penalty function),具體表示如下:

    上式中,λ為懲罰因子,λ越大懲罰力度越大。經(jīng)Xiang驗證當λ取值為9時,懲罰力度比較合適。

    (6)結(jié)合公式(21)和公式(22)構(gòu)建懲罰似然函數(shù)(Penalized Log-Likelihood function,LPenalized)并取對數(shù),即:

    (7)對目標函數(shù)-2log(LPenalized)進行極大似然估計(maximum likelihood estimate,MLE),得到估計Q矩陣。

    (8)①如果沒有專家定義的Q矩陣,該步可省略。計算專家定義Q矩陣(記為QExpert,元素為qjk)與估計Q矩陣(記為 QEstimate,元素為 q?jk)間差異距離(discrepancy distance),通過距離最小匹配QEstimate的元素的列,即:

    (9)以分界點(cut-off point)將估計Q矩陣離散化,得最終Q矩陣。

    Xiang模擬考察了項目數(shù)量、懲罰力度和分界點對該法的影響,結(jié)果發(fā)現(xiàn):判準率隨項目數(shù)量增加(15題增至30題)而提高;λ取9或11,判準率最高(30題為91.3%,15題為88%);以0.5為分界點的判準率最大但誤判概率也比較高。隨后,他分析Tatsuoka(1990)分數(shù)減法數(shù)據(jù)發(fā)現(xiàn):估計Q矩陣與de la Torre(2008)[7]界定的Q矩陣略有差異。究其原因可能與多種解題策略有關(guān),de la Torre等人認為Tatsuoka(1990)分數(shù)減法數(shù)據(jù)存在多種解題策略[26]。

    使用該法有兩個明顯的優(yōu)勢:第一,當專家無法給出合理Q矩陣或不同專家給出Q矩陣差異較大時,該方法可獲取估計Q矩陣,為專家界定Q矩陣提供借鑒;第二,它可為事后修改Q矩陣提供數(shù)據(jù)支撐。但該方法也有缺陷:第一,包含較強數(shù)理分析導(dǎo)致步驟復(fù)雜難懂嚴重阻礙該方法應(yīng)用;第二,λ沒有固定標準,需進一步討論分析;第三,以0.5為分界點可能導(dǎo)致(9)步中的Q矩陣元素出現(xiàn)誤判現(xiàn)象。此外,Xiang的研究將項目參數(shù)s和g固定為0.1,而現(xiàn)實情境中這一條件很難得到滿足。

    4 小結(jié)與展望

    認知診斷以結(jié)合認知心理學(xué)與心理測量學(xué)的優(yōu)勢在心理與教育領(lǐng)域展現(xiàn)出巨大發(fā)展?jié)摿?,但目前?yīng)用認知診斷理論編制的測驗不多,其主要困難在于反映項目和屬性間關(guān)系的Q矩陣無法合理界定。傳統(tǒng)的專家評估和基于項目參數(shù)的迭代過程雖可用于界定Q矩陣但結(jié)果較粗糙,易出現(xiàn)專家意見不一致、專家遴選標準難確定、模型失擬和參數(shù)誤差較大等問題[11,13,14]。本文從參數(shù)化與否的角度出發(fā)對現(xiàn)有基于被試作答反應(yīng)的Q矩陣估計方法的思想、步驟及實際應(yīng)用進行闡述,以期為認知診斷研究及應(yīng)用提供借鑒。上述6種方法:爬山法和統(tǒng)計提純法屬于非參數(shù)化估計法,其他四種屬于參數(shù)化估計法;爬山法、因素分析法和非線性懲罰估計法不需要提前界定Q矩陣,其他3種則需要;爬山法、因素分析法和非線性懲罰估計法可處理屬性個數(shù)未知情況,其他3種則不能;爬山法和統(tǒng)計提純法可用于除DINA模型外的其他診斷模型,其他4種則不能。值得注意的是:上述6種方法得到的Q矩陣并不表示完全排除專家意見,而是為專家判斷提供數(shù)據(jù)支撐。下面以表格形式給本文涉及的6種Q矩陣估計方法作總體描述(見表1)。

    Q矩陣是認知診斷的基礎(chǔ),正確界定Q矩陣對測驗編制者至關(guān)重要,出于發(fā)展角度,本文對Q矩陣估計方法未來研究作以下五點展望。

    第一,未來可用Monte Carlo模擬或?qū)嵶C綜合比較各種估計方法的優(yōu)劣?,F(xiàn)有研究僅僅只是對各自提出的方法進行闡述并加以驗證,鮮有對這些估計方法進行系統(tǒng)比較,也未有研究探討每種方法的特點及其適用條件,這都不利于推動Q矩陣估計方法的研究。今后的研究應(yīng)著重探討如樣本量、測驗長度、屬性個數(shù)及分布、項目參數(shù)分布、Q矩陣錯誤率和誤設(shè)類型等因素對方法選擇的影響,并開發(fā)出Q矩陣估計方法的應(yīng)用軟件,為實際應(yīng)用者提供借鑒。

    表1 Q矩陣估計方法的特點概覽

    第二,未來可將現(xiàn)有估計方法拓展到其他模型。上述6種方法只有統(tǒng)計提純法和爬山法能處理除DINA模型外其他模型,而其他方法則不能。雖然DINA模型淺顯易懂且估計簡便,但相比其他模型(如RUM),它對被試知識狀態(tài)與作答反應(yīng)間關(guān)系描述相對比較簡單[12,27,28]。因此,有必要將現(xiàn)有估計方法拓展到其他模型。此外,隨著實踐應(yīng)用不斷深入,認知診斷實踐將日益關(guān)注那些多級評分項目,而上述6種方法并未涉及多級評分項目。今后研究也可將這些方法拓展到多級評分項目中。

    第三,未來可結(jié)合這些方法優(yōu)缺點開發(fā)新方法。如將非線性懲罰估計法不需要提前界定Q矩陣的優(yōu)勢與貝葉斯法準確率高的優(yōu)勢結(jié)合,開發(fā)一種既不需要提前界定Q矩陣又能保證高準確率的新方法。

    第四,優(yōu)化現(xiàn)有算法的運算效率。任何一種估計方法其算法的運算效率嚴重制約著該方法的應(yīng)用范圍,不論是基于參數(shù)化的方法還是基于非參數(shù)化的方法,這些估計方法都沒能解決參數(shù)過多和計算耗時的問題。Chiu指出基于MLE方法的Q矩陣估計方法其面臨著估計技術(shù)復(fù)雜和收效甚微的問題,反復(fù)迭代也會使計算過程耗時過長進一步限制了參數(shù)化估計方法的應(yīng)用[2];相比于參數(shù)化法非參數(shù)估計法計算較為簡單,但是也不能避免參數(shù)化所面臨的隨著屬性個數(shù)的增加計算負擔也將加劇的問題。因此,減輕估計方法的計算負擔也應(yīng)該是今后研究中應(yīng)該注意的問題。

    第五,未來可將這些方法應(yīng)用于計算機化自適應(yīng)診斷測驗(cognitive diagnostic computerized adaptive testing,CD-CAT)屬性標定。隨著心理與教育測量理論與計算機技術(shù)的飛速發(fā)展,CD-CAT引起國內(nèi)外學(xué)者的廣泛關(guān)注[29-36]。與CAT一樣,CD-CAT也涉及題庫建問題甚至比CAT更復(fù)雜,除進行項目參數(shù)等值外還需對新題進行屬性標定[33,37]。上述6種方法能否應(yīng)用于CD-CAT新題屬性標定呢?未來研究可著重探討將當前Q矩陣估計方法與CDCAT屬性標定相結(jié)合。

    [1] Tatsuoka K K.Cognitive assessment:An introduction to the rule space method[M].Routledge,2009.

    [2] Chiu C.Statistical Refinement of the Q-matrix in Cognitive Diagnosis[J].Applied Psychological Measurement,2013,37(8):598-618.

    [3] Xiang R.Nonlinear penalized estimation of true Q-matrix in cognitive diagnostic models[D].Columbia University,2013.

    [4] DeCarlo L T.Recognizing Uncertainty in the Q-Matrix via a Bayesian Extension of the DINA Model[J].Applied Psychological Measurement,2012,36(6):447-468.

    [5] Close C N.An exploratory technique for finding the Q-matrix for the DINA model in cognitive diagnostic assessment:Combining theory with data[D].UNIVERSITY OF MINNESOTA,2012.

    [6] DeCarlo L T.On the analysis of fraction subtraction data:The DINA model,classification,latent class sizes,and the Q-matrix[J].Applied Psychological Measurement,2010,35(1):8-26.

    [7] de la Torre J.An Empirically Based Method of Q-Matrix Validation for the DINA Model:Development and Applications[J].Journal of Educational Measurement,2008,45(4):343.

    [8] de la Torre J,Douglas J A.Higher-order latent trait models for cognitive diagnosis[J].Psychometrika,2004,69(3):333-353.

    [9] Tatsuoka K K.Toward an integration of item-response theory and cognitive error diagnosis[J].Diagnostic monitoring of skill and knowledge acquisition,1990:453-488.

    [10] 涂冬波,蔡艷,戴海琦.基于DINA模型的Q矩陣修正方法[J].心理學(xué)報,2012,44(4):558-568.

    [11] Rupp A A,Templin J.The effects of Q-matrix misspecification on parameter estimates and classification accuracy in the DINA model[J].Educational and Psychological Measurement,2008,68(1):78-96.

    [12] Li H,Suen H K.Constructing and Validating a Q-Matrix for Cognitive Diagnostic Analyses of a Reading Test[J].Educational Assessment,2013,18(1):1-25.

    [13] Henson R.Q-Matrix Development[R].Annual meeting of National Council on Measurement in Education,2009.

    [14] Henson R,Templin J.Q-Matrix Construction[R].Annual meeting of National Council on Measurement in Education,2007.

    [15] Barnes T.Novel derivation and application of skill matrices:The q-matrix method[J].Handbook on educational data mining,2010:159-172.

    [16] Barnes T.The q-matrix method:Mining student response data for knowledge[R].American Association for Artificial Intelligence,2005.

    [17] Barnes T M.The q-matrix method of fault-tolerant teaching in knowledge assessment and data mining[D].North Carolina State University,2003.

    [18] Birenbaum M,Kelly A E,Tatsuoka K K.Diagnosing knowledge states in algebra using the rule-space model[J].Journal for Research in Mathematics Education,1993:442-459.

    [19] Tatsuoka K K.Rule space:An approach for dealing with misconceptions based on item response theory[J].Journal of Educational Measurement,1983,20(4):345-354.

    [20] Chiu C,Douglas J.A nonparametric approach to cognitive diagnosis by proximity to ideal response patterns[J].Journal of Classification,2013,30(2):225-250.

    [21] Liu J,Xu G,Ying Z.Theory of the self-learning Q-matrix[J].Bernoulli:official journal of the Bernoulli Society for Mathematical Statistics and Probability,2013,19(5A):1790.

    [22] Liu J,Xu G,Ying Z.Data-driven learning of Q-matrix[J].Applied psychological measurement,2012,36(7):548-564.

    [23] Liu J,Xu G,Ying Z.Learning Item-Attribute Relationship in QMatrix Based Diagnostic Classification Models[J].arXiv preprint arXiv:1106.0721,2011.

    [24] Stout W.Skills Diagnosis Using IRT Based Continuous Latent Trait Models[J].Journal of Educational Measurement,2007,44(4):313-324.

    [25] Templin J,Henson R A.A Bayesian method for incorporating uncertainty into Q-matrix estimation in skills assessment[R].Annual meeting of National Council on Measurement in Education,2006.

    [26] de la Torre J,Douglas J A.Model evaluation and multiple strategies in cognitive diagnosis:An analysis of fraction subtraction data[J].Psychometrika,2008,73(4):595-624.

    [27] DiBello L V,Roussos L A,Stout W.Review of cognitively diagnostic assessment and a summary of psychometric models[J].Handbook of statistics,2007,26:979-1030.

    [28] Fu J,Li Y.An integrative review of cognitively diagnostic psychometric models[R].Annual meeting of National Council on Measurement in Education,2007.

    [29] 駱聰,王霞,鐘陽,等.CD—CAT選題策略及其應(yīng)用[J].心理研究,2014,7(2):23-27.

    [30] 汪文義,丁樹良,宋麗紅.兼顧測驗效率和題庫使用率的CD—CAT 選題策略[J].心理科學(xué),2014,37(001):212-216.

    [31] 駱聰,王霞,鐘陽,等.CD—CAT選題策略及其應(yīng)用[J].心理研究,2014,7(2):23-27.

    [32] 涂冬波,蔡艷,戴海琦.認知診斷CAT選題策略及初始題選取方法[J].心理科學(xué),2013,36(2),469-474.

    [33] 陳平,張佳慧,辛濤.在線標定技術(shù)在計算機化自適應(yīng)測驗中的應(yīng)用[J].心理科學(xué)進展,2013,21(10):1883-1892.

    [34] Cheng Y.Improving cognitive diagnostic computerized adaptive testing by balancing attribute coverage:the modified maximum global discrimination index method[J].Educational and Psychological Measurement,2010,70(6):902-913.

    [35] Cheng Y.When cognitive diagnosis meets computerized adaptive testing:CD-CAT[J].Psychometrika,2009,74(4):619-632.

    [36] Xu X,Chang H,Douglas J.A simulation study to compare CAT strategies for cognitive diagnosis[R].Annual meeting of the American Educational Research Association,2003.

    [37] 陳平.認知診斷計算機化自適應(yīng)測驗的項目增補:以DINA模型為例[D].北京師范大學(xué),2011.

    A Comparison of Q-matrix Estimation Method for the Cognitive Diagnosis Test

    LIU Yong&TU Dongbo

    猜你喜歡
    界定測驗矩陣
    我國首次對“碰瓷”作出明確界定
    《新年大測驗》大揭榜
    趣味(語文)(2018年7期)2018-06-26 08:13:48
    兩個處理t測驗與F測驗的數(shù)學(xué)關(guān)系
    考試周刊(2016年88期)2016-11-24 13:30:50
    高血壓界定范圍
    金色年代(2016年4期)2016-10-20 17:40:14
    初等行變換與初等列變換并用求逆矩陣
    對“衛(wèi)生公共服務(wù)”的界定仍有疑問
    矩陣
    南都周刊(2015年4期)2015-09-10 07:22:44
    矩陣
    南都周刊(2015年3期)2015-09-10 07:22:44
    矩陣
    南都周刊(2015年1期)2015-09-10 07:22:44
    “供犯罪所用的本人財物”的界定
    色婷婷久久久亚洲欧美| 一本—道久久a久久精品蜜桃钙片| 国产有黄有色有爽视频| 日韩三级视频一区二区三区| 一区二区日韩欧美中文字幕| 久久狼人影院| 精品一品国产午夜福利视频| 一区二区三区激情视频| 老司机亚洲免费影院| 成人精品一区二区免费| 丰满人妻熟妇乱又伦精品不卡| 桃花免费在线播放| 免费在线观看黄色视频的| 麻豆国产av国片精品| a在线观看视频网站| 51午夜福利影视在线观看| 在线天堂中文资源库| 在线永久观看黄色视频| 日本欧美视频一区| 亚洲精品久久成人aⅴ小说| 午夜精品国产一区二区电影| 在线观看66精品国产| 欧美人与性动交α欧美软件| 在线观看舔阴道视频| 热re99久久国产66热| 日日摸夜夜添夜夜添小说| 脱女人内裤的视频| 亚洲情色 制服丝袜| 免费av中文字幕在线| 国产精品免费大片| 午夜久久久在线观看| 久久久国产一区二区| 亚洲精品乱久久久久久| 法律面前人人平等表现在哪些方面| 国产黄色免费在线视频| 国产福利在线免费观看视频| 久久精品国产亚洲av高清一级| 天天添夜夜摸| 日韩欧美三级三区| 考比视频在线观看| 午夜福利乱码中文字幕| 午夜福利欧美成人| 日本欧美视频一区| 亚洲第一av免费看| av在线播放免费不卡| 啦啦啦免费观看视频1| 国产男靠女视频免费网站| 男女午夜视频在线观看| 欧美av亚洲av综合av国产av| 久久国产精品男人的天堂亚洲| 欧美+亚洲+日韩+国产| 亚洲伊人色综图| 人人妻,人人澡人人爽秒播| 天天躁夜夜躁狠狠躁躁| 男人舔女人的私密视频| 三上悠亚av全集在线观看| 少妇粗大呻吟视频| 国产亚洲一区二区精品| 精品国产亚洲在线| 国产视频一区二区在线看| 国产精品一区二区精品视频观看| 久久久精品区二区三区| 亚洲伊人色综图| 国产不卡av网站在线观看| 国产欧美日韩一区二区三| 成年动漫av网址| 在线观看一区二区三区激情| 波多野结衣av一区二区av| 天天躁狠狠躁夜夜躁狠狠躁| 亚洲专区中文字幕在线| 男人舔女人的私密视频| 伊人久久大香线蕉亚洲五| 天天躁夜夜躁狠狠躁躁| 在线观看人妻少妇| 国产精品麻豆人妻色哟哟久久| 日韩成人在线观看一区二区三区| 啦啦啦免费观看视频1| 热99久久久久精品小说推荐| 欧美黄色片欧美黄色片| 男女床上黄色一级片免费看| 国产精品免费一区二区三区在线 | 波多野结衣一区麻豆| a在线观看视频网站| 成年人黄色毛片网站| 成年人黄色毛片网站| 精品一区二区三区四区五区乱码| av片东京热男人的天堂| aaaaa片日本免费| 日本一区二区免费在线视频| 免费不卡黄色视频| 国产极品粉嫩免费观看在线| 日本wwww免费看| 亚洲一卡2卡3卡4卡5卡精品中文| 又大又爽又粗| 久久午夜亚洲精品久久| 成年人黄色毛片网站| 国产av又大| 一进一出抽搐动态| 两人在一起打扑克的视频| 可以免费在线观看a视频的电影网站| 成人国语在线视频| 女人精品久久久久毛片| 日韩一卡2卡3卡4卡2021年| 一进一出抽搐动态| 国产成人欧美在线观看 | 久久久精品国产亚洲av高清涩受| 亚洲人成电影免费在线| 成人国语在线视频| 欧美另类亚洲清纯唯美| 亚洲精品国产色婷婷电影| 久久久久久久久免费视频了| 国产精品电影一区二区三区 | 亚洲国产中文字幕在线视频| 国产高清国产精品国产三级| 久久人妻av系列| 无限看片的www在线观看| 热99国产精品久久久久久7| 又黄又粗又硬又大视频| 黄色视频在线播放观看不卡| 国产亚洲一区二区精品| 天天躁夜夜躁狠狠躁躁| 欧美av亚洲av综合av国产av| 一区二区日韩欧美中文字幕| 99精品欧美一区二区三区四区| 极品教师在线免费播放| 在线观看免费午夜福利视频| 色婷婷av一区二区三区视频| 久久久久精品国产欧美久久久| 国产99久久九九免费精品| 久久精品国产综合久久久| 日韩免费高清中文字幕av| 麻豆成人av在线观看| 免费av中文字幕在线| 亚洲成a人片在线一区二区| 欧美成人免费av一区二区三区 | 90打野战视频偷拍视频| 亚洲九九香蕉| 母亲3免费完整高清在线观看| 久久久久国内视频| 亚洲国产av新网站| 精品午夜福利视频在线观看一区 | 99国产精品一区二区三区| 精品福利观看| 久久久久久人人人人人| 韩国精品一区二区三区| 少妇精品久久久久久久| 欧美午夜高清在线| 久久精品人人爽人人爽视色| 男女之事视频高清在线观看| av超薄肉色丝袜交足视频| 99精品久久久久人妻精品| 夜夜夜夜夜久久久久| 成人18禁在线播放| 丁香六月欧美| 欧美 亚洲 国产 日韩一| 国产亚洲av高清不卡| 在线观看www视频免费| 日本五十路高清| 国产91精品成人一区二区三区 | 久久久久久久久免费视频了| 王馨瑶露胸无遮挡在线观看| 老司机亚洲免费影院| 成人av一区二区三区在线看| videos熟女内射| 久久中文看片网| 国产精品自产拍在线观看55亚洲 | 国产av精品麻豆| a级毛片在线看网站| 亚洲人成电影免费在线| 国产区一区二久久| 欧美另类亚洲清纯唯美| 色视频在线一区二区三区| 日日摸夜夜添夜夜添小说| 国产精品国产高清国产av | 在线观看免费视频日本深夜| 亚洲熟女毛片儿| 亚洲av成人不卡在线观看播放网| 国产精品麻豆人妻色哟哟久久| 久久毛片免费看一区二区三区| 国产精品.久久久| 国产av精品麻豆| 十八禁人妻一区二区| 自拍欧美九色日韩亚洲蝌蚪91| 老司机深夜福利视频在线观看| 中文亚洲av片在线观看爽 | 999精品在线视频| 午夜免费成人在线视频| 精品视频人人做人人爽| 99在线人妻在线中文字幕 | 久久久久精品人妻al黑| 少妇裸体淫交视频免费看高清 | 国产精品.久久久| 欧美在线一区亚洲| 后天国语完整版免费观看| 日韩一卡2卡3卡4卡2021年| www.熟女人妻精品国产| 亚洲欧美日韩高清在线视频 | av有码第一页| 亚洲一码二码三码区别大吗| 这个男人来自地球电影免费观看| 久久久精品国产亚洲av高清涩受| 夫妻午夜视频| 淫妇啪啪啪对白视频| 成人永久免费在线观看视频 | 99riav亚洲国产免费| 一本色道久久久久久精品综合| 丰满迷人的少妇在线观看| www日本在线高清视频| 欧美人与性动交α欧美软件| 免费日韩欧美在线观看| 两性午夜刺激爽爽歪歪视频在线观看 | 欧美变态另类bdsm刘玥| 国产精品.久久久| 又大又爽又粗| 首页视频小说图片口味搜索| 日日爽夜夜爽网站| 老司机在亚洲福利影院| 大型黄色视频在线免费观看| 蜜桃在线观看..| 人成视频在线观看免费观看| 一区二区av电影网| 国产日韩一区二区三区精品不卡| 美国免费a级毛片| 天堂俺去俺来也www色官网| 99re在线观看精品视频| 亚洲精品国产精品久久久不卡| 亚洲av国产av综合av卡| netflix在线观看网站| 国产视频一区二区在线看| 啦啦啦免费观看视频1| 十八禁网站免费在线| 免费人妻精品一区二区三区视频| 国产亚洲欧美精品永久| 王馨瑶露胸无遮挡在线观看| 久久久久久人人人人人| 他把我摸到了高潮在线观看 | 搡老熟女国产l中国老女人| 老汉色∧v一级毛片| 久久毛片免费看一区二区三区| cao死你这个sao货| 一本色道久久久久久精品综合| 成人精品一区二区免费| 亚洲三区欧美一区| av视频免费观看在线观看| 免费观看av网站的网址| 国产欧美日韩一区二区精品| 亚洲国产中文字幕在线视频| 我要看黄色一级片免费的| 男人舔女人的私密视频| 国产精品免费一区二区三区在线 | 日韩成人在线观看一区二区三区| 女人久久www免费人成看片| 国产精品偷伦视频观看了| 免费av中文字幕在线| 不卡av一区二区三区| 亚洲美女黄片视频| 99在线人妻在线中文字幕 | 国产黄色免费在线视频| 可以免费在线观看a视频的电影网站| 久久 成人 亚洲| 欧美 日韩 精品 国产| 人人妻人人爽人人添夜夜欢视频| 男女下面插进去视频免费观看| 亚洲第一欧美日韩一区二区三区 | 建设人人有责人人尽责人人享有的| 精品一区二区三卡| 高清黄色对白视频在线免费看| 国产一区二区在线观看av| 脱女人内裤的视频| 国产视频一区二区在线看| 久久精品国产亚洲av香蕉五月 | 黄色视频,在线免费观看| 欧美人与性动交α欧美精品济南到| 男女高潮啪啪啪动态图| 女人爽到高潮嗷嗷叫在线视频| 少妇粗大呻吟视频| www.999成人在线观看| 十八禁人妻一区二区| 欧美国产精品一级二级三级| 一边摸一边抽搐一进一出视频| 99久久人妻综合| 欧美日韩中文字幕国产精品一区二区三区 | 亚洲av片天天在线观看| 国产精品久久久久久精品古装| 日韩欧美三级三区| 国产精品偷伦视频观看了| 久久热在线av| 少妇 在线观看| 欧美黑人精品巨大| 最近最新免费中文字幕在线| 婷婷丁香在线五月| 无限看片的www在线观看| 精品亚洲成国产av| 国产午夜精品久久久久久| 亚洲天堂av无毛| 久久影院123| 妹子高潮喷水视频| 国产高清激情床上av| 免费观看人在逋| 国产av又大| 无人区码免费观看不卡 | 午夜福利在线观看吧| 99九九在线精品视频| 亚洲精品在线观看二区| 飞空精品影院首页| 亚洲第一av免费看| 久久久国产精品麻豆| 中文字幕人妻熟女乱码| 午夜免费鲁丝| 欧美亚洲日本最大视频资源| 亚洲成av片中文字幕在线观看| 成年人黄色毛片网站| 丰满迷人的少妇在线观看| 黑人巨大精品欧美一区二区mp4| 午夜福利一区二区在线看| 欧美精品一区二区大全| 亚洲精品国产一区二区精华液| 一级a爱视频在线免费观看| 久久狼人影院| 亚洲国产欧美一区二区综合| 99精品在免费线老司机午夜| 亚洲中文字幕日韩| 国产又爽黄色视频| 日韩人妻精品一区2区三区| 2018国产大陆天天弄谢| 欧美激情久久久久久爽电影 | 精品亚洲成国产av| 国产精品一区二区在线观看99| 在线观看免费午夜福利视频| 免费在线观看日本一区| 成人av一区二区三区在线看| 视频区欧美日本亚洲| 精品国产一区二区久久| 亚洲国产欧美网| 一个人免费看片子| 国产伦人伦偷精品视频| 亚洲精品国产一区二区精华液| 久久精品亚洲精品国产色婷小说| 少妇粗大呻吟视频| 美女高潮到喷水免费观看| 性少妇av在线| 热99国产精品久久久久久7| 欧美黑人精品巨大| 一边摸一边抽搐一进一小说 | 多毛熟女@视频| 亚洲欧美激情在线| 国产在线视频一区二区| 中文字幕人妻熟女乱码| 日日夜夜操网爽| 老熟女久久久| 国产成人精品久久二区二区91| 老司机福利观看| 国产精品亚洲一级av第二区| 一本一本久久a久久精品综合妖精| 99精品久久久久人妻精品| 在线观看免费高清a一片| 亚洲少妇的诱惑av| 日本a在线网址| √禁漫天堂资源中文www| 悠悠久久av| 91成年电影在线观看| av又黄又爽大尺度在线免费看| 黄色视频在线播放观看不卡| 中文字幕人妻丝袜一区二区| 热99re8久久精品国产| 无限看片的www在线观看| 在线观看免费视频网站a站| 亚洲国产欧美一区二区综合| 亚洲精品国产色婷婷电影| 国产成人欧美| 久久久水蜜桃国产精品网| 18禁裸乳无遮挡动漫免费视频| 成年人午夜在线观看视频| 日韩欧美一区二区三区在线观看 | 久久毛片免费看一区二区三区| 麻豆av在线久日| 丁香六月欧美| 日本欧美视频一区| 久久免费观看电影| 两个人看的免费小视频| 日韩欧美国产一区二区入口| 亚洲av第一区精品v没综合| 在线播放国产精品三级| 另类精品久久| 黑丝袜美女国产一区| 亚洲欧洲日产国产| 精品一区二区三区视频在线观看免费 | 成年动漫av网址| 久久九九热精品免费| 欧美日韩国产mv在线观看视频| 精品人妻在线不人妻| 欧美精品一区二区免费开放| netflix在线观看网站| 精品一区二区三卡| tocl精华| 免费在线观看视频国产中文字幕亚洲| h视频一区二区三区| 99精品久久久久人妻精品| 老司机深夜福利视频在线观看| 欧美午夜高清在线| 亚洲国产av影院在线观看| 757午夜福利合集在线观看| 国产91精品成人一区二区三区 | 又黄又粗又硬又大视频| 欧美变态另类bdsm刘玥| 久久久国产成人免费| 精品少妇内射三级| 少妇精品久久久久久久| 99riav亚洲国产免费| 高潮久久久久久久久久久不卡| 亚洲 国产 在线| 纵有疾风起免费观看全集完整版| 多毛熟女@视频| 国产成人欧美| 99国产精品一区二区蜜桃av | 久久午夜亚洲精品久久| 亚洲欧美一区二区三区久久| 一个人免费看片子| 国产黄频视频在线观看| 50天的宝宝边吃奶边哭怎么回事| 天天躁夜夜躁狠狠躁躁| 交换朋友夫妻互换小说| 啦啦啦中文免费视频观看日本| 91成人精品电影| 1024视频免费在线观看| 亚洲国产欧美网| 80岁老熟妇乱子伦牲交| 亚洲伊人久久精品综合| 五月天丁香电影| 99re6热这里在线精品视频| 黄色片一级片一级黄色片| 岛国在线观看网站| 日本精品一区二区三区蜜桃| 欧美精品人与动牲交sv欧美| 高清毛片免费观看视频网站 | 精品乱码久久久久久99久播| 老司机福利观看| 成人国产一区最新在线观看| 亚洲熟女精品中文字幕| 午夜福利影视在线免费观看| 国产亚洲精品第一综合不卡| 国产福利在线免费观看视频| 午夜免费鲁丝| 精品亚洲成a人片在线观看| 欧美精品人与动牲交sv欧美| 脱女人内裤的视频| videos熟女内射| 青草久久国产| 王馨瑶露胸无遮挡在线观看| 欧美在线黄色| 麻豆国产av国片精品| 欧美性长视频在线观看| 视频区欧美日本亚洲| 久久久精品94久久精品| 蜜桃国产av成人99| 一夜夜www| 免费在线观看日本一区| 国产真人三级小视频在线观看| 国产精品电影一区二区三区 | 国产精品影院久久| 久久久久久久精品吃奶| 午夜福利视频精品| 他把我摸到了高潮在线观看 | 纯流量卡能插随身wifi吗| 啪啪无遮挡十八禁网站| 国产99久久九九免费精品| 成年动漫av网址| 国产麻豆69| 国产日韩欧美视频二区| 99国产综合亚洲精品| 久久人人爽av亚洲精品天堂| 美女午夜性视频免费| 国产精品偷伦视频观看了| 欧美日韩国产mv在线观看视频| 老汉色av国产亚洲站长工具| 午夜激情久久久久久久| 在线观看www视频免费| 纵有疾风起免费观看全集完整版| 久久 成人 亚洲| 国产又色又爽无遮挡免费看| 日韩有码中文字幕| 国产精品亚洲一级av第二区| 香蕉丝袜av| 亚洲精品av麻豆狂野| 他把我摸到了高潮在线观看 | 嫩草影视91久久| 日本av免费视频播放| 又黄又粗又硬又大视频| 亚洲精品国产精品久久久不卡| 欧美精品av麻豆av| 国产精品久久久av美女十八| 人人妻人人澡人人看| 精品少妇一区二区三区视频日本电影| 精品国产一区二区三区久久久樱花| 青青草视频在线视频观看| 国产高清激情床上av| 精品久久久久久电影网| 一边摸一边做爽爽视频免费| 亚洲av第一区精品v没综合| 亚洲精品av麻豆狂野| 少妇被粗大的猛进出69影院| 国产97色在线日韩免费| 少妇粗大呻吟视频| 国产97色在线日韩免费| 不卡一级毛片| 久久精品国产亚洲av高清一级| 美女福利国产在线| 99精品欧美一区二区三区四区| 亚洲国产欧美在线一区| 精品亚洲乱码少妇综合久久| 99香蕉大伊视频| 国产精品久久久久久精品古装| 日韩人妻精品一区2区三区| 亚洲va日本ⅴa欧美va伊人久久| 成人亚洲精品一区在线观看| 两个人看的免费小视频| 热99久久久久精品小说推荐| 成人三级做爰电影| 国产精品久久久av美女十八| 精品国产乱码久久久久久小说| 老汉色∧v一级毛片| 中亚洲国语对白在线视频| 亚洲午夜精品一区,二区,三区| 国产成人精品在线电影| xxxhd国产人妻xxx| 亚洲av美国av| 欧美中文综合在线视频| h视频一区二区三区| 首页视频小说图片口味搜索| 国产精品影院久久| tocl精华| 另类精品久久| 十八禁人妻一区二区| 国产精品99久久99久久久不卡| 亚洲七黄色美女视频| 亚洲情色 制服丝袜| a级片在线免费高清观看视频| 美女扒开内裤让男人捅视频| 搡老岳熟女国产| 国产区一区二久久| 十八禁高潮呻吟视频| 操出白浆在线播放| 女人被躁到高潮嗷嗷叫费观| 嫁个100分男人电影在线观看| 久热爱精品视频在线9| 国产精品久久久久久人妻精品电影 | 国产精品久久久久久精品电影小说| 人人妻人人澡人人爽人人夜夜| 日日爽夜夜爽网站| 高清视频免费观看一区二区| av一本久久久久| 午夜福利欧美成人| 久久久久视频综合| tube8黄色片| 十分钟在线观看高清视频www| 韩国精品一区二区三区| 久9热在线精品视频| 欧美日韩黄片免| 黄片大片在线免费观看| 国产亚洲精品一区二区www | 美女高潮到喷水免费观看| 久久99热这里只频精品6学生| 久久久水蜜桃国产精品网| 精品一区二区三区av网在线观看 | 99国产精品一区二区蜜桃av | 777久久人妻少妇嫩草av网站| 日韩人妻精品一区2区三区| 一边摸一边抽搐一进一出视频| 免费观看av网站的网址| 女人爽到高潮嗷嗷叫在线视频| 久久人妻福利社区极品人妻图片| 丝袜美足系列| 成在线人永久免费视频| 色播在线永久视频| 老司机影院毛片| 丝袜美足系列| 久久精品人人爽人人爽视色| 我的亚洲天堂| 日韩三级视频一区二区三区| 久久99热这里只频精品6学生| 日本精品一区二区三区蜜桃| 制服人妻中文乱码| 亚洲,欧美精品.| 高潮久久久久久久久久久不卡| 亚洲成av片中文字幕在线观看| 天堂8中文在线网| 久久av网站| av国产精品久久久久影院| 久久久水蜜桃国产精品网| 精品少妇内射三级| 国产免费现黄频在线看| 精品国产国语对白av| 极品教师在线免费播放| 两性午夜刺激爽爽歪歪视频在线观看 | 国产一区二区三区视频了| 超色免费av| 黄网站色视频无遮挡免费观看| 又大又爽又粗| 欧美日韩黄片免| 久9热在线精品视频| 中文字幕制服av| 免费在线观看黄色视频的| 91字幕亚洲| 女警被强在线播放| 成人国产一区最新在线观看| 99精品久久久久人妻精品| 黑人巨大精品欧美一区二区蜜桃| 精品久久久久久电影网| 涩涩av久久男人的天堂| 桃花免费在线播放| 巨乳人妻的诱惑在线观看| 狂野欧美激情性xxxx| 欧美黑人精品巨大| 国产高清videossex| 中文字幕人妻丝袜一区二区|