• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于Rasch模型的參數(shù)估計(jì)方法比較研究

    2017-12-13 05:49:15王佶旻李瀟
    中國(guó)考試 2017年9期
    關(guān)鍵詞:標(biāo)準(zhǔn)實(shí)驗(yàn)能力

    王佶旻 李瀟

    (1.北京語(yǔ)言大學(xué),北京 100083;2.北京師范大學(xué),北京 100875)

    基于Rasch模型的參數(shù)估計(jì)方法比較研究

    王佶旻1李瀟2

    (1.北京語(yǔ)言大學(xué),北京 100083;2.北京師范大學(xué),北京 100875)

    本研究的目的是基于Rasch模型,比較聯(lián)合極大似然估計(jì)法、邊際極大似然估計(jì)法和EM算法、邊際貝葉斯估計(jì)法參數(shù)估計(jì)結(jié)果的準(zhǔn)確程度。實(shí)驗(yàn)數(shù)據(jù)為2 185名被試在HSK試卷170道試題中的作答矩陣,考慮到初值和收斂精度對(duì)參數(shù)估計(jì)結(jié)果的影響,將三種參數(shù)估計(jì)方法按照初值設(shè)置和收斂精度不同分別進(jìn)行參數(shù)估計(jì),然后通過(guò)計(jì)算項(xiàng)目參數(shù)估計(jì)標(biāo)準(zhǔn)誤判斷參數(shù)估計(jì)方法的準(zhǔn)確度。

    項(xiàng)目反應(yīng)理論;參數(shù)估計(jì);聯(lián)合極大似然估計(jì)法;邊際極大似然估計(jì)法和EM算法;邊際貝葉斯估計(jì)法

    1 引言

    1952年,美國(guó)測(cè)量學(xué)家Frederic M.Lord在自己的博士論文中將能力與答對(duì)率之間的函數(shù)關(guān)系用雙參數(shù)正態(tài)拱形曲線模型(Two-parameter Normal Ogive Model)描述出來(lái),并基于這一模型建立了一套項(xiàng)目反應(yīng)理論(Item Response Theory,簡(jiǎn)稱為IRT),同時(shí)提出了相應(yīng)的參數(shù)估計(jì)方法[1]。

    至今,項(xiàng)目反應(yīng)理論模型在不斷發(fā)展演變,參數(shù)估計(jì)方法也是層出不窮。目前應(yīng)用最廣泛的參數(shù)估計(jì)方法有聯(lián)合極大似然估計(jì)法、邊際極大似然估計(jì)法和EM算法以及邊際貝葉斯估計(jì)法。從算法的角度分析,Mislevy R.J和Stocking M.L認(rèn)為貝葉斯估計(jì)法更為精確;Baker和Kim也認(rèn)為由于邊際貝葉斯估計(jì)法利用了更多參數(shù)的先驗(yàn)信息,因此估計(jì)結(jié)果會(huì)更加穩(wěn)定和精確[2]。

    目前運(yùn)用實(shí)證數(shù)據(jù)對(duì)這三種參數(shù)估計(jì)方法進(jìn)行比較的研究并不多,基本都采用現(xiàn)成的商業(yè)軟件來(lái)估計(jì)模擬作答矩陣的各項(xiàng)參數(shù),再進(jìn)行方法的比較。缺點(diǎn)顯而易見(jiàn),首先,蒙特卡洛模擬數(shù)據(jù)概率分布過(guò)于規(guī)則化,無(wú)法代表真實(shí)的作答反應(yīng);其次,進(jìn)行參數(shù)估計(jì)的各種商業(yè)軟件的功能以及默認(rèn)的參數(shù)設(shè)置并不統(tǒng)一,這將給實(shí)驗(yàn)結(jié)果帶來(lái)不可避免的系統(tǒng)誤差。

    有鑒于此,本文采用漢語(yǔ)水平考試(HSK)[初、中等]真實(shí)考生數(shù)據(jù)作為實(shí)驗(yàn)材料,運(yùn)用VFP6.0[3]自行編制的程序進(jìn)行參數(shù)估計(jì)。這樣可以將三種方法的初值、迭代次數(shù)和精度,先驗(yàn)信息的分布參數(shù)都控制好,以保證參數(shù)估計(jì)方法的可比性。為了降低編程難度,本研究選擇最簡(jiǎn)單的Rasch模型進(jìn)行參數(shù)估計(jì)。Rasch模型如下:

    P表示能力為θ的被試答對(duì)難度為b的題目的概率[4]。

    2 參數(shù)估計(jì)方法

    2.1 聯(lián)合極大似然估計(jì)法

    Birnbaum在1968年提出聯(lián)合極大似然估計(jì)法的概念。

    假設(shè)被試作答模式相互獨(dú)立,同一被試對(duì)各個(gè)項(xiàng)目的作答相互獨(dú)立,Uaj表示a個(gè)被試在第j個(gè)項(xiàng)目上的反應(yīng)。似然函數(shù)如公式①所示,對(duì)數(shù)似然函數(shù)如公式②所示。

    其中Paj為被試a在第j個(gè)項(xiàng)目上的答對(duì)概率;Qaj=1-Paj。

    接下來(lái)對(duì)θ參數(shù)(或b參數(shù))設(shè)置初始值,求取使似然函數(shù)最大化的b參數(shù),再代入b參數(shù),求取新的θ參數(shù),循環(huán)往復(fù),直到似然函數(shù)最大值收斂。

    聯(lián)合極大似然估計(jì)法幫助項(xiàng)目反應(yīng)理論完成了從理論向?qū)嵺`的飛躍,但是,仍然暴露了很多問(wèn)題。首先,如果一個(gè)被試答對(duì)或者答錯(cuò)了全部題目,那么被試的能力就無(wú)法被估計(jì);其次,當(dāng)被試的能力所對(duì)應(yīng)的項(xiàng)目難度出現(xiàn)斷層時(shí),似然函數(shù)在極值點(diǎn)附近就會(huì)顯得比較平坦,從而造成迭代無(wú)法收斂于定值,當(dāng)然對(duì)于題目的難度估計(jì)也是如此;再次,難以確定合理的初值;最后,能力參數(shù)的個(gè)數(shù)依賴于樣本量的變化,但是項(xiàng)目參數(shù)永遠(yuǎn)固定,隨著樣本量的增加無(wú)法保證項(xiàng)目參數(shù)估計(jì)的恒定性[5]。

    2.2 邊際極大似然估計(jì)法和EM算法

    邊際極大似然估計(jì)與聯(lián)合極大似然估計(jì)最大的不同點(diǎn)在于,前者假設(shè)已知被試的能力先驗(yàn)分布,將被試看成從這一能力總體中抽取的樣本,然后根據(jù)貝葉斯定理,將似然函數(shù)中的能力參數(shù)通過(guò)積分去掉,得到僅含有項(xiàng)目參數(shù)的邊際似然函數(shù),然后再用邊際似然函數(shù)導(dǎo)出項(xiàng)目參數(shù)的邊際似然估計(jì)。

    由于邊際似然估計(jì)法的計(jì)算量過(guò)大,需要通過(guò)EM算法來(lái)真正得以實(shí)現(xiàn)。EM算法實(shí)際上也是極大似然估計(jì)法中求參數(shù)的一種迭代方法。它分為兩個(gè)步驟,分別是期望步驟E步和最大化步驟M步。我們將EM算法應(yīng)用在項(xiàng)目反應(yīng)理論中,那么就是未觀察數(shù)據(jù),反應(yīng)矩陣U為可觀察數(shù)據(jù)。為的聯(lián)合概率密度函數(shù),其中ζ為項(xiàng)目參數(shù)。我們先給項(xiàng)目參數(shù)ζ設(shè)定一個(gè)初值,代入這個(gè)值計(jì)算出似然函數(shù)條件分布的期望值,這樣就使得大量含有未知參數(shù)的表達(dá)式變成了期望常數(shù)。通過(guò)最大化步驟M步得到第一次估出的項(xiàng)目參數(shù)后,把參數(shù)再代入期望步驟E步,調(diào)整期望值,繼續(xù)修正項(xiàng)目參數(shù),直到參數(shù)收斂為止。采用這種算法,大大簡(jiǎn)化了邊際極大似然估計(jì)的計(jì)算,同時(shí)消除了能力參數(shù)的影響。

    邊際極大似然估計(jì)法和EM算法仍然存在很多不足。首先,這種方法仍然無(wú)法估計(jì)特殊的反應(yīng)模式;其次,在迭代求項(xiàng)目參數(shù)時(shí),有些特定數(shù)據(jù)會(huì)使得區(qū)分度被估計(jì)得過(guò)大,而接近于零的區(qū)分度又會(huì)導(dǎo)致難度的絕對(duì)值增大;再次,EM算法的迭代速度很慢,而且是想要的結(jié)果越精確,迭代的速率就越慢。

    2.3 邊際貝葉斯估計(jì)

    如前所述,在邊際極大似然估計(jì)法中,得滿分或得零分的被試都無(wú)法估計(jì)其能力,而所有被試都答對(duì)或答錯(cuò)的題目也無(wú)法估計(jì)其難度。邊際貝葉斯估計(jì)法則解決了這個(gè)難題。

    貝葉斯參數(shù)估計(jì)法其實(shí)是對(duì)邊際極大似然估計(jì)法的延伸,因此也被稱為邊際貝葉斯參數(shù)估計(jì)法。它與后者的最顯著區(qū)別是后者不僅要給出被試的能力先驗(yàn)分布,同時(shí)還要給出所有待估參數(shù)的先驗(yàn)分布。

    由貝葉斯定理可知:

    其中g(shù)(θ|τ)為能力參數(shù)的先驗(yàn)分布;為項(xiàng)目參數(shù)的先驗(yàn)分布;為基于U的似然函數(shù)。

    邊際貝葉斯估計(jì)法的參數(shù)估計(jì)步驟與邊際極大似然估計(jì)法基本是一樣的,只是在似然函數(shù)中加入了項(xiàng)目參數(shù)和能力參數(shù)的先驗(yàn)信息,將參數(shù)值自動(dòng)限制在可接受的范圍內(nèi)。因此,即使測(cè)試中出現(xiàn)一個(gè)被試在所有項(xiàng)目全部正確作答或錯(cuò)誤作答的情況,也不會(huì)被無(wú)限估計(jì)。

    3 實(shí)驗(yàn)

    3.1 算法評(píng)價(jià)標(biāo)準(zhǔn)

    我們?cè)O(shè)計(jì)了三個(gè)參數(shù)估計(jì)實(shí)驗(yàn),每個(gè)實(shí)驗(yàn)使用一種參數(shù)估計(jì)方法得到能力參數(shù)和難度參數(shù),再通過(guò)計(jì)算項(xiàng)目參數(shù)估計(jì)標(biāo)準(zhǔn)誤作為評(píng)價(jià)參數(shù)估計(jì)精確度的指標(biāo)。標(biāo)準(zhǔn)誤越小,表示估計(jì)越精確。項(xiàng)目參數(shù)估計(jì)標(biāo)準(zhǔn)誤[6]是由Lord提出的,是從測(cè)驗(yàn)信息函數(shù)演變而來(lái)的衡量參數(shù)估計(jì)精確度的指標(biāo)[7-8]。

    bi的項(xiàng)目參數(shù)估計(jì)標(biāo)準(zhǔn)誤表示為:

    其中,

    在Rasch模型中,a=1,c=0。

    需要說(shuō)明的是,求標(biāo)準(zhǔn)誤的前提條件是我們假定能力參數(shù)為真值且已知。因此,在實(shí)際應(yīng)用的過(guò)程中,由于能力參數(shù)也是被估計(jì)出來(lái)的,會(huì)導(dǎo)致項(xiàng)目參數(shù)的標(biāo)準(zhǔn)誤被低估。但是只要樣本量足夠大(>2 000人),被低估的現(xiàn)象就可以被忽略[7]。

    3.2 篩選被試

    由于參加HSK[初、中等]考試的31 648名考生原始總分呈明顯的負(fù)偏態(tài)分布(如圖1所示),為了滿足極大似然估計(jì)法的要求,盡量保證每道題目的難度和每個(gè)被試的能力能夠相互匹配,我們?cè)趯?shí)驗(yàn)之前對(duì)全部考生數(shù)據(jù)進(jìn)行了分層抽樣和極端值剔除。

    圖1全體被試的原始總分分布

    第一步:分層抽取被試樣本

    在剔除極端值被試樣本(分?jǐn)?shù)為0分和170分)之后,根據(jù)正態(tài)分布表每段分?jǐn)?shù)所占全部分?jǐn)?shù)的百分比進(jìn)行抽樣,得到基本符合正態(tài)分布的2 301人被試樣本,如圖2所示。

    圖2抽樣被試原始總分分布

    第二步:為避免能力異常值出現(xiàn),剔除答對(duì)率在猜測(cè)概率(25%)以下的被試(共116人),得到最終參加實(shí)驗(yàn)的被試人數(shù)為2 185人。

    3.3 初值和收斂精度

    本實(shí)驗(yàn)分別對(duì)相同樣本采取兩種初值計(jì)算方法:第一種方法是Lord提出的初值設(shè)定方法,我們簡(jiǎn)稱Z分?jǐn)?shù)法。能力初值為被試原始分?jǐn)?shù)的標(biāo)準(zhǔn)分?jǐn)?shù)Zj,難度初值為Zi/rbi(Zi為每道題答對(duì)率的標(biāo)準(zhǔn)分?jǐn)?shù),rbi為每道題的雙列相關(guān)值);第二種方法首先根據(jù)漆書清和戴海琦提出的能力初值計(jì)算方法得到能力初值[7],我們簡(jiǎn)稱對(duì)數(shù)法:

    其中,Xj為被試j在測(cè)試中答對(duì)題數(shù)的個(gè)數(shù),n為題目總數(shù)。

    接下來(lái),設(shè)定難度初值為:

    經(jīng)過(guò)參數(shù)預(yù)估后發(fā)現(xiàn),難度初值設(shè)為Zi/rbi時(shí),三個(gè)實(shí)驗(yàn)均出現(xiàn)了參數(shù)無(wú)法收斂的現(xiàn)象。我們只好對(duì)Z分?jǐn)?shù)法中的難度初值作出調(diào)整,也采用對(duì)數(shù)法進(jìn)行計(jì)算。因此,本實(shí)驗(yàn)中“Z分?jǐn)?shù)法”和“對(duì)數(shù)法”的初值計(jì)算差異僅體現(xiàn)在能力上。

    本實(shí)驗(yàn)設(shè)置兩個(gè)收斂精度分別是0.01和0.001。

    3.4 實(shí)驗(yàn)一

    3.4.1 實(shí)驗(yàn)設(shè)計(jì)

    實(shí)驗(yàn)一對(duì)Rasch模型進(jìn)行聯(lián)合極大似然估計(jì),根據(jù)初值和收斂精度的不同,設(shè)計(jì)了四個(gè)子實(shí)驗(yàn),如表1所示。

    表1子實(shí)驗(yàn)分類

    表2各子實(shí)驗(yàn)的迭代次數(shù)和項(xiàng)目參數(shù)估計(jì)標(biāo)準(zhǔn)誤

    3.4.2 結(jié)果分析

    我們對(duì)四個(gè)子實(shí)驗(yàn)基本收斂(收斂率在95%以上)所需要的迭代次數(shù)以及在達(dá)到最大收斂率時(shí)各個(gè)子實(shí)驗(yàn)的全卷項(xiàng)目參數(shù)估計(jì)標(biāo)準(zhǔn)誤進(jìn)行了統(tǒng)計(jì),具體數(shù)值如表2所示。

    由表2可以看出,以Z分?jǐn)?shù)法作為初值的聯(lián)合A、B子實(shí)驗(yàn)收斂效率均較高,都是10次迭代后收斂率就達(dá)到了95%以上。其次是聯(lián)合D子實(shí)驗(yàn),迭代次數(shù)為11次。收斂效率最低的是利用對(duì)數(shù)法計(jì)算初值且收斂精度為0.001進(jìn)行參數(shù)估計(jì)的聯(lián)合C子實(shí)驗(yàn)。而四個(gè)實(shí)驗(yàn)的項(xiàng)目參數(shù)估計(jì)標(biāo)準(zhǔn)誤最低的是聯(lián)合A子實(shí)驗(yàn),數(shù)值為12.518,最高的是聯(lián)合C子實(shí)驗(yàn),數(shù)值為13.322。

    接下來(lái),我們就初值、收斂精度對(duì)收斂率和項(xiàng)目參數(shù)估計(jì)標(biāo)準(zhǔn)誤的影響做進(jìn)一步的分析。

    (1)初值和收斂精度對(duì)收斂率的影響

    從圖3我們可以看出,四個(gè)子實(shí)驗(yàn)由于初值不同,收斂精度不同,收斂率與迭代次數(shù)相對(duì)應(yīng)的變化趨勢(shì)還是有一些差別的:聯(lián)合D子實(shí)驗(yàn)由于精度設(shè)置較低,收斂效率明顯高于聯(lián)合C子實(shí)驗(yàn)。相對(duì)而言,聯(lián)合A、B子實(shí)驗(yàn)并沒(méi)有在收斂效率上呈現(xiàn)太大的差異(不明原因?qū)е侣?lián)合A子實(shí)驗(yàn)在第12次迭代時(shí)收斂率極低,我們認(rèn)為屬于偶然現(xiàn)象),它們的收斂趨勢(shì)也是比較相近的。

    就收斂的效果而言,聯(lián)合D子實(shí)驗(yàn)和聯(lián)合A子實(shí)驗(yàn)都是比較理想的。不僅從第五次迭代開(kāi)始就有較高的收斂率,收斂率的最大值也分別達(dá)到了100%和99.41%的高水平。

    從實(shí)驗(yàn)結(jié)果來(lái)看:收斂精度對(duì)聯(lián)合極大似然估計(jì)法的收斂效率產(chǎn)生影響,收斂精度越高,收斂效率越低,反之亦然。而初值則對(duì)參數(shù)估計(jì)收斂率的變化趨勢(shì)和收斂效率均有較大影響(對(duì)參數(shù)是否收斂也起到重大作用,如難度初值設(shè)為Zi/rbi時(shí),迭代根本無(wú)法收斂)??傮w來(lái)說(shuō),利用Z分?jǐn)?shù)法設(shè)定能力初值相比于利用對(duì)數(shù)法計(jì)算能力初值收斂效率更高,迭代效果更好一些。

    表3各實(shí)驗(yàn)在不同迭代次數(shù)下的收斂比率

    圖3各子實(shí)驗(yàn)的收斂概率變化趨勢(shì)

    (2)項(xiàng)目參數(shù)估計(jì)標(biāo)準(zhǔn)誤

    我們將四個(gè)子實(shí)驗(yàn)的參數(shù)估計(jì)結(jié)果利用自編的VFP程序進(jìn)行了項(xiàng)目參數(shù)估計(jì)標(biāo)準(zhǔn)誤的計(jì)算。根據(jù)收斂率和迭代次數(shù)的關(guān)系,我們分別取迭代次數(shù)為10、迭代次數(shù)為15,以及四個(gè)實(shí)驗(yàn)各自收斂率達(dá)到最大的迭代次數(shù)所對(duì)應(yīng)的參數(shù)估計(jì)結(jié)果計(jì)算了項(xiàng)目參數(shù)估計(jì)標(biāo)準(zhǔn)誤。

    由表4可以看出,在迭代10次之后,項(xiàng)目參數(shù)估計(jì)標(biāo)準(zhǔn)誤最低的是聯(lián)合B子實(shí)驗(yàn),數(shù)值為12.722。標(biāo)準(zhǔn)誤最高的是聯(lián)合C子實(shí)驗(yàn),數(shù)值為14.099。聯(lián)合A、D子實(shí)驗(yàn)的標(biāo)準(zhǔn)誤基本相同,分別是13.018和12.976。結(jié)合標(biāo)準(zhǔn)差來(lái)看,聯(lián)合C子實(shí)驗(yàn)的標(biāo)準(zhǔn)差最高,為0.065,聯(lián)合D子實(shí)驗(yàn)的標(biāo)準(zhǔn)差最低,為0.047。由此來(lái)看,聯(lián)合C子實(shí)驗(yàn)所估計(jì)的參數(shù)值無(wú)論是從準(zhǔn)確性還是穩(wěn)定性來(lái)看都是四個(gè)子實(shí)驗(yàn)中最差的。而聯(lián)合B子實(shí)驗(yàn)參數(shù)估計(jì)的準(zhǔn)確性最高,但穩(wěn)定性稍差。其次是聯(lián)合D子實(shí)驗(yàn)的結(jié)果,雖然準(zhǔn)確性不如聯(lián)合B子實(shí)驗(yàn),但是標(biāo)準(zhǔn)差最低,說(shuō)明參數(shù)估計(jì)準(zhǔn)確度的穩(wěn)定性相對(duì)高一些。

    如表5所示,我們更換成迭代15次的數(shù)據(jù)后,各個(gè)實(shí)驗(yàn)的項(xiàng)目參數(shù)估計(jì)標(biāo)準(zhǔn)誤與參數(shù)估計(jì)標(biāo)準(zhǔn)差出現(xiàn)了變化。總體來(lái)說(shuō),在換成迭代15次的數(shù)據(jù)之后,聯(lián)合A子實(shí)驗(yàn)無(wú)論是在參數(shù)估計(jì)的準(zhǔn)確度還是穩(wěn)定性來(lái)看都是最好的,相比而言聯(lián)合B、C子實(shí)驗(yàn)的結(jié)果則不太理想。

    表4迭代10次后計(jì)算項(xiàng)目參數(shù)估計(jì)標(biāo)準(zhǔn)誤的統(tǒng)計(jì)量數(shù)據(jù)

    表5迭代15次后計(jì)算項(xiàng)目參數(shù)估計(jì)標(biāo)準(zhǔn)誤的統(tǒng)計(jì)量數(shù)據(jù)

    表6取最大收斂率的迭代次數(shù)計(jì)算項(xiàng)目參數(shù)估計(jì)標(biāo)準(zhǔn)誤的統(tǒng)計(jì)量數(shù)據(jù)

    最后,我們分別選擇各個(gè)子實(shí)驗(yàn)中收斂率最大的迭代次數(shù)中的參數(shù)值計(jì)算項(xiàng)目參數(shù)估計(jì)標(biāo)準(zhǔn)誤。得到的數(shù)據(jù)如表6所示。我們發(fā)現(xiàn),與“迭代10次”和“迭代15次”的數(shù)據(jù)相比,四個(gè)子實(shí)驗(yàn)的項(xiàng)目參數(shù)估計(jì)標(biāo)準(zhǔn)誤以及標(biāo)準(zhǔn)誤的標(biāo)準(zhǔn)差均有所下降。相比而言,聯(lián)合C子實(shí)驗(yàn)的標(biāo)準(zhǔn)誤是全部實(shí)驗(yàn)中最高的,達(dá)到了13.322。

    我們將各個(gè)實(shí)驗(yàn)的項(xiàng)目參數(shù)估計(jì)標(biāo)準(zhǔn)誤以及收斂率的變化趨勢(shì)繪成圖表如圖4和圖5所示。

    我們從圖4中可以看出,利用對(duì)數(shù)法計(jì)算初值,且精度設(shè)為0.001(高精度)的聯(lián)合C子實(shí)驗(yàn)基本都處于高標(biāo)準(zhǔn)誤的水平;利用Z分?jǐn)?shù)法計(jì)算初值,且精度設(shè)為0.001(高精度)的聯(lián)合A子實(shí)驗(yàn)以及利用對(duì)數(shù)法計(jì)算初值且精度設(shè)為0.01(低精度)的聯(lián)合D子實(shí)驗(yàn)的項(xiàng)目參數(shù)標(biāo)準(zhǔn)誤走勢(shì)很相似且都處于數(shù)值較低的水平;而利用Z分?jǐn)?shù)法計(jì)算初值,且精度設(shè)為0.01(低精度)的聯(lián)合B子實(shí)驗(yàn)在收斂率的影響下標(biāo)準(zhǔn)誤的數(shù)值波動(dòng)較大。

    我們比較圖4和圖5不難發(fā)現(xiàn),收斂率和項(xiàng)目參數(shù)估計(jì)標(biāo)準(zhǔn)誤的變化趨勢(shì)基本呈水平對(duì)稱。也就是說(shuō),收斂率會(huì)直接影響項(xiàng)目參數(shù)估計(jì)標(biāo)準(zhǔn)誤,且收斂率越高,項(xiàng)目參數(shù)估計(jì)標(biāo)準(zhǔn)誤越低。

    圖4各個(gè)子實(shí)驗(yàn)的項(xiàng)目參數(shù)估計(jì)標(biāo)準(zhǔn)誤變化趨勢(shì)

    圖5各個(gè)子實(shí)驗(yàn)的收斂率變化趨勢(shì)

    3.5 實(shí)驗(yàn)二

    3.5.1 實(shí)驗(yàn)設(shè)計(jì)

    本實(shí)驗(yàn)對(duì)Rasch模型利用邊際極大似然估計(jì)法和EM算法進(jìn)行參數(shù)估計(jì)。與實(shí)驗(yàn)一不同的是,邊際極大似然估計(jì)法和EM算法只需要求取難度參數(shù)初值。由于“Z分?jǐn)?shù)法”和“對(duì)數(shù)法”求難度初值的過(guò)程是相同的。因此本實(shí)驗(yàn)只根據(jù)收斂精度的差異設(shè)計(jì)了2個(gè)子實(shí)驗(yàn),如表7所示。

    表7子實(shí)驗(yàn)分類

    實(shí)驗(yàn)過(guò)程中,我們運(yùn)用BILOG軟件估計(jì)全體被試能力值,以及全體被試能力的求積節(jié)點(diǎn)和權(quán)重。

    從理論上講,被試能力的先驗(yàn)分布是先前無(wú)數(shù)次測(cè)驗(yàn)信息積累得到的結(jié)果。但是由于客觀條件限制,我們無(wú)法得到測(cè)驗(yàn)分布累積的數(shù)據(jù)。因此決定采用全部被試(31 648人)的能力分布代替這2 185人的能力先驗(yàn)分布。利用SPSS計(jì)算得出被試總體的能力參數(shù)分布直方圖,如圖6所示。

    圖6全體被試能力值分布

    根據(jù)SPSS的統(tǒng)計(jì)結(jié)果來(lái)看,被試能力值基本呈現(xiàn)均值為0、標(biāo)準(zhǔn)差為1的標(biāo)準(zhǔn)正態(tài)分布。

    我們根據(jù)被試總體的能力分布利用BILOGMG軟件計(jì)算出10個(gè)能力求積節(jié)點(diǎn)和相應(yīng)的權(quán)重,如表8所示。

    3.5.2 結(jié)果分析

    與聯(lián)合極大似然估計(jì)法相比,邊際極大似然估計(jì)法和EM算法最大的優(yōu)點(diǎn)就是收斂效率非常高。聯(lián)合極大似然估計(jì)法一共迭代了16次,而邊際極大似然估計(jì)法和EM算法都是估計(jì)兩次就可以成功收斂。并且每次估計(jì)的運(yùn)算速度也相比前者要快很多。

    但需要說(shuō)明的是,邊際極大似然估計(jì)法和EM算法在估計(jì)出難度參數(shù)之后,只能估計(jì)出能力參數(shù)的后驗(yàn)分布概率,而無(wú)法得到確切的能力參數(shù)值。因此,在實(shí)踐中,這種方法只用來(lái)估計(jì)項(xiàng)目參數(shù),能力參數(shù)的估計(jì)還要依靠聯(lián)合極大似然估計(jì)法或邊際貝葉斯估計(jì)法來(lái)實(shí)現(xiàn)。

    我們對(duì)兩個(gè)子實(shí)驗(yàn)的項(xiàng)目參數(shù)估計(jì)標(biāo)準(zhǔn)誤進(jìn)行了描述性統(tǒng)計(jì)分析,結(jié)果如表9所示(統(tǒng)一采用對(duì)數(shù)法迭代15次的能力參數(shù)值計(jì)算項(xiàng)目參數(shù)估計(jì)標(biāo)準(zhǔn)誤)。

    我們可以看出,邊際A子實(shí)驗(yàn)和邊際B子實(shí)驗(yàn)受收斂精度的影響并不大,數(shù)值基本相同,標(biāo)準(zhǔn)差也基本趨于一致。

    3.6 實(shí)驗(yàn)三

    3.6.1 實(shí)驗(yàn)設(shè)置

    實(shí)驗(yàn)三采用邊際貝葉斯估計(jì)法進(jìn)行參數(shù)估計(jì)。邊際貝葉斯估計(jì)法是邊際極大似然估計(jì)法和EM算法以及聯(lián)合極大似然估計(jì)法相結(jié)合的產(chǎn)物。在估計(jì)項(xiàng)目參數(shù)時(shí)算法與前者基本一致,在估計(jì)能力參數(shù)時(shí),算法與后者基本一致。本實(shí)驗(yàn)根據(jù)收斂精度和初值設(shè)置差異分為四個(gè)子實(shí)驗(yàn)(與實(shí)驗(yàn)一相同),如表10所示。

    表8 10個(gè)能力求積點(diǎn)和相應(yīng)的權(quán)重

    表9項(xiàng)目參數(shù)估計(jì)標(biāo)準(zhǔn)誤的統(tǒng)計(jì)量數(shù)據(jù)

    表10子實(shí)驗(yàn)分類

    在邊際貝葉斯估計(jì)法中不僅需要得到被試能力參數(shù)的先驗(yàn)分布,還要求得到項(xiàng)目難度參數(shù)的先驗(yàn)分布。我們根據(jù)全體被試樣本(共31 648人)的作答矩陣,利用BILOG-MG軟件,對(duì)170道題的難度參數(shù)進(jìn)行估計(jì),并利用SPSS軟件得到難度參數(shù)的分布如圖7所示。

    圖7難度參數(shù)先驗(yàn)分布

    SPSS軟件的統(tǒng)計(jì)數(shù)據(jù)顯示:難度參數(shù)基本服從平均值為-0.3282、標(biāo)準(zhǔn)差為0.5767的正態(tài)分布。我們以此作為難度參數(shù)的先驗(yàn)分布。

    3.6.2 結(jié)果分析

    由于邊際貝葉斯估計(jì)法在求取能力參數(shù)時(shí)不需要反復(fù)迭代,因此在統(tǒng)計(jì)收斂精度和迭代次數(shù)的關(guān)系時(shí)無(wú)須考慮能力初值的影響。經(jīng)過(guò)計(jì)算我們發(fā)現(xiàn),邊際貝葉斯估計(jì)法無(wú)論在高精度還是低精度的情況下,兩次收斂率均達(dá)到100%,項(xiàng)目參數(shù)估計(jì)標(biāo)準(zhǔn)誤則隨著初值和收斂精度設(shè)置不同略有差異。表11為四組子實(shí)驗(yàn)的項(xiàng)目參數(shù)估計(jì)標(biāo)準(zhǔn)誤的描述統(tǒng)計(jì)量。

    從表11可以看出,四組子實(shí)驗(yàn)的項(xiàng)目參數(shù)估計(jì)標(biāo)準(zhǔn)誤差異是很細(xì)微的。在高精度水平上,貝葉斯C子實(shí)驗(yàn)比A子實(shí)驗(yàn)的標(biāo)準(zhǔn)誤略低;在低精度水平上,貝葉斯D子實(shí)驗(yàn)比B子實(shí)驗(yàn)的標(biāo)準(zhǔn)誤略低。這說(shuō)明在同一收斂精度下,利用對(duì)數(shù)法計(jì)算初值比利用Z分?jǐn)?shù)法代替能力初值所得參數(shù)結(jié)果要準(zhǔn)確一些;在以Z分?jǐn)?shù)求取初值的貝葉斯A、B子實(shí)驗(yàn)中,收斂精度高的A實(shí)驗(yàn)的標(biāo)準(zhǔn)誤低于收斂精度低的B實(shí)驗(yàn);在以對(duì)數(shù)法求取初值的貝葉斯C、D子實(shí)驗(yàn)中,收斂精度高的C實(shí)驗(yàn)的標(biāo)準(zhǔn)誤高于收斂精度低的D實(shí)驗(yàn)。這說(shuō)明以Z分?jǐn)?shù)法計(jì)算初值時(shí),高收斂精度估計(jì)結(jié)果更準(zhǔn)確,而以對(duì)數(shù)法計(jì)算初值時(shí),低收斂精度估計(jì)結(jié)果反而更理想。這一點(diǎn)與聯(lián)合極大似然估計(jì)法的實(shí)驗(yàn)結(jié)果是一致的。

    表11項(xiàng)目參數(shù)估計(jì)標(biāo)準(zhǔn)誤的統(tǒng)計(jì)量數(shù)據(jù)

    3.7 三組實(shí)驗(yàn)數(shù)據(jù)匯總

    我們將聯(lián)合極大似然估計(jì)法實(shí)驗(yàn)(取最大收斂率所對(duì)應(yīng)的迭代次數(shù)計(jì)算標(biāo)準(zhǔn)誤)、邊際極大似然估計(jì)法和EM算法實(shí)驗(yàn)、邊際貝葉斯估計(jì)法實(shí)驗(yàn)共10個(gè)子實(shí)驗(yàn)的項(xiàng)目參數(shù)估計(jì)標(biāo)準(zhǔn)誤進(jìn)行橫向?qū)Ρ?,?shù)據(jù)如表12所示。

    由表12和圖8可以看出,三種實(shí)驗(yàn)方法中聯(lián)合極大似然估計(jì)法參數(shù)估計(jì)的準(zhǔn)確性最低;邊際貝葉斯估計(jì)法的標(biāo)準(zhǔn)誤均值為5.658,參數(shù)估計(jì)的準(zhǔn)確性最高。

    表12各實(shí)驗(yàn)項(xiàng)目參數(shù)估計(jì)標(biāo)準(zhǔn)誤對(duì)比

    圖8各實(shí)驗(yàn)項(xiàng)目參數(shù)估計(jì)標(biāo)準(zhǔn)誤變化趨勢(shì)

    初值和收斂精度不同對(duì)于聯(lián)合極大似然估計(jì)法影響最大,而對(duì)于邊際貝葉斯估計(jì)法以及邊際極大似然估計(jì)法和EM算法的影響是非常微弱的。

    從A、B、C、D四組子實(shí)驗(yàn)項(xiàng)目參數(shù)估計(jì)標(biāo)準(zhǔn)誤的均值來(lái)看,收斂精度對(duì)標(biāo)準(zhǔn)誤的影響隨著初值設(shè)置的改變而有所不同。

    4 結(jié)論

    從參數(shù)估計(jì)方法的準(zhǔn)確性和穩(wěn)定性來(lái)看,聯(lián)合極大似然估計(jì)法的參數(shù)估計(jì)結(jié)果不僅精度低,而且容易受到初值和收斂精度的影響,穩(wěn)定性也比較差。導(dǎo)致這一結(jié)果的原因可能是:(1)似然函數(shù)在構(gòu)建的過(guò)程中沒(méi)有充分利用被試總體和項(xiàng)目總體的先驗(yàn)信息分布,導(dǎo)致在估計(jì)能力過(guò)高或過(guò)低的被試(難度過(guò)難或過(guò)易的項(xiàng)目)時(shí)容易出現(xiàn)異常值;(2)在迭代求取非線性方程的未知參數(shù)時(shí),由于多個(gè)駐點(diǎn)的存在,我們無(wú)法保證選取的初值就在最大值所在定義域范圍內(nèi),因此導(dǎo)致收斂于偽值或不收斂的概率大大增加;(3)聯(lián)合極大似然估計(jì)法要求每個(gè)能力值和難度值的被試與項(xiàng)目匹配,當(dāng)某個(gè)能力的被試找不到適合他難度的試題時(shí),參數(shù)估計(jì)精度就會(huì)降低。

    相比于聯(lián)合極大似然估計(jì)法,邊際極大似然估計(jì)法和EM算法以及邊際貝葉斯估計(jì)法則在準(zhǔn)確度方面體現(xiàn)出比較大的優(yōu)勢(shì)。主要原因是這兩種方法都在計(jì)算的過(guò)程中充分利用到了被試總體的能力先驗(yàn)分布,尤其是邊際貝葉斯估計(jì)法,在構(gòu)造似然函數(shù)時(shí)又加入了項(xiàng)目參數(shù)先驗(yàn)分布的表達(dá)式。先驗(yàn)分布可以把異常值收縮到參數(shù)均值附近,從而提高參數(shù)估計(jì)的準(zhǔn)確性和穩(wěn)定性。

    從初值設(shè)置對(duì)參數(shù)估計(jì)結(jié)果的影響來(lái)看,利用原始分?jǐn)?shù)的Z分?jǐn)?shù)值代替能力初值更適用于聯(lián)合極大似然估計(jì)法。原因可能是Z分?jǐn)?shù)值與被試能力參數(shù)的正常范圍比較吻合;而通過(guò)對(duì)數(shù)法計(jì)算的初值基本與正常能力值相差較遠(yuǎn),對(duì)最終的參數(shù)估計(jì)結(jié)果產(chǎn)生不利影響;而在邊際貝葉斯估計(jì)法中,先驗(yàn)分布函數(shù)起到了收縮能力初值的作用,因此最終的參數(shù)估計(jì)結(jié)果并不會(huì)受到很大影響。

    收斂精度和初值設(shè)置會(huì)對(duì)參數(shù)估計(jì)結(jié)果產(chǎn)生交互影響。遺憾的是,我們還不清楚產(chǎn)生交互影響的真正原因。這是一個(gè)值得進(jìn)一步深入分析和研究的問(wèn)題。

    [1]LORD F M.A theory of test scores[J].Psychometric Monograph,1952(7).

    [2]FRANK B BAKER,SEOCK-HO KIM.Item Response Theory Parameter Estimation Techniques[M].New York:Marcel Dekker,Inc,2004.

    [3]魯俊生.VFP程序設(shè)計(jì)簡(jiǎn)明教程[M].西安:西安電子科技大學(xué)出版社,2010.

    [4]漆書清,戴海琦,丁樹(shù)良.現(xiàn)代教育與心理測(cè)量學(xué)原理[M].北京:高等教育出版社,2003.

    [5]NEYMAN J,SCOTT E L.Consistent estimates based on partially consistent observations[J].Econometrica,1948(16):1-32.

    [6]LORD F M.Applications of item response theory to practical testing problems[M].Hillsdale,NJ:Erlbaum,1980.

    [7]漆書清,戴海琦.項(xiàng)目反應(yīng)理論及其應(yīng)用研究[M].南昌:江西高校出版社,1992.

    [8]HAMBLETON R K,SWAMINATHAN H,ROGERS H J.Fundamentals of item response theory[M].Newbury Park,CA:Sage Publications,1991.

    (責(zé)任編輯:周黎明)

    The Comparison between the Method of MLE,MLE/EM and BMES under the Rasch Model

    WANG Jimin1,LI Xiao2
    (1.Beijing Language and Culture University,Beijing 100083,China;2.Beijing Normal University,Beijing 100875,China)

    The objective of this article is to assess the accuracy of the Joint Maximum Likelihood Estimation(JMLE),the Marginal Maximum Likelihood Estimation/EM algorithm(MMLE/EM),Marginalized Bayesian Parameter Estimation(BMEs)based on the single parameter logistic model.Experimental subject is the answer matrix of 2 185 examinees,who were tested in the HSK examination(including 170 questions)on Dec 9th,2005.We assessed the accuracy of parameter estimation by comparing the standard errors from each estimation method.This study also conducted the parameter estimation under different initial values and convergence precisions for each approach,taking into account the effects of initial value and convergence precision setting for parameter estimation results.

    IRT;Parameter Estimation;JMLE;MMLE/EM;BMEs

    G405

    A

    1005-8427(2017)09-0011-11

    10.19360/j.cnki.11-3303/g4.2017.09.002

    本研究得到北京市社科規(guī)劃項(xiàng)目“首都留學(xué)生跨文化適應(yīng)研究”(項(xiàng)目號(hào):13WYB014)和北京語(yǔ)言大學(xué)院級(jí)項(xiàng)目(項(xiàng)目號(hào):17YJ050011)的資助。

    王佶旻(1974—),女,北京語(yǔ)言大學(xué)漢語(yǔ)考試與教育測(cè)量研究所,教授,博士生導(dǎo)師;李 瀟(1987—),女,北京師范大學(xué)中國(guó)基礎(chǔ)教育質(zhì)量監(jiān)測(cè)協(xié)同創(chuàng)新中心,講師。

    猜你喜歡
    標(biāo)準(zhǔn)實(shí)驗(yàn)能力
    記一次有趣的實(shí)驗(yàn)
    消防安全四個(gè)能力
    2022 年3 月實(shí)施的工程建設(shè)標(biāo)準(zhǔn)
    做個(gè)怪怪長(zhǎng)實(shí)驗(yàn)
    忠誠(chéng)的標(biāo)準(zhǔn)
    美還是丑?
    大興學(xué)習(xí)之風(fēng) 提升履職能力
    你的換位思考能力如何
    NO與NO2相互轉(zhuǎn)化實(shí)驗(yàn)的改進(jìn)
    實(shí)踐十號(hào)上的19項(xiàng)實(shí)驗(yàn)
    太空探索(2016年5期)2016-07-12 15:17:55
    青春草亚洲视频在线观看| 欧美色视频一区免费| 亚洲精品,欧美精品| 99热精品在线国产| 免费在线观看成人毛片| 校园人妻丝袜中文字幕| 久久久久久久久久黄片| 欧美bdsm另类| 午夜福利网站1000一区二区三区| 美女脱内裤让男人舔精品视频| 青春草国产在线视频| 免费搜索国产男女视频| 亚洲国产欧洲综合997久久,| 日本与韩国留学比较| 亚洲成人av在线免费| 久久精品熟女亚洲av麻豆精品 | 男人舔奶头视频| 国产精品1区2区在线观看.| 国产午夜精品论理片| 精品国内亚洲2022精品成人| 一本久久精品| 日日撸夜夜添| 亚洲经典国产精华液单| 干丝袜人妻中文字幕| 一区二区三区免费毛片| 国产精品爽爽va在线观看网站| 亚洲内射少妇av| 99九九线精品视频在线观看视频| 长腿黑丝高跟| 免费观看人在逋| 亚洲av电影在线观看一区二区三区 | 国产老妇女一区| 欧美变态另类bdsm刘玥| 国产精品永久免费网站| 桃色一区二区三区在线观看| a级毛色黄片| 乱系列少妇在线播放| 国内精品宾馆在线| 一本久久精品| 男人和女人高潮做爰伦理| 国产黄片视频在线免费观看| 激情 狠狠 欧美| 日韩精品有码人妻一区| 哪个播放器可以免费观看大片| 高清午夜精品一区二区三区| 亚洲国产日韩欧美精品在线观看| 亚洲丝袜综合中文字幕| 色综合色国产| 国产精品一区二区三区四区免费观看| 欧美不卡视频在线免费观看| 免费av不卡在线播放| 人妻夜夜爽99麻豆av| 国产一级毛片七仙女欲春2| 久久久亚洲精品成人影院| 一区二区三区高清视频在线| 国产三级中文精品| 国产又色又爽无遮挡免| 九九爱精品视频在线观看| 最近的中文字幕免费完整| av在线亚洲专区| 国产精品伦人一区二区| 老司机影院成人| 亚洲av免费高清在线观看| 99久久无色码亚洲精品果冻| 一个人观看的视频www高清免费观看| 色播亚洲综合网| 我要搜黄色片| 深爱激情五月婷婷| 丰满乱子伦码专区| 看非洲黑人一级黄片| 午夜福利网站1000一区二区三区| 两个人的视频大全免费| 内射极品少妇av片p| 中文在线观看免费www的网站| 免费在线观看成人毛片| 日本一二三区视频观看| 亚洲国产最新在线播放| 精品免费久久久久久久清纯| 乱人视频在线观看| 色哟哟·www| 一边亲一边摸免费视频| 美女黄网站色视频| 亚洲怡红院男人天堂| 婷婷色综合大香蕉| 天天躁夜夜躁狠狠久久av| 亚洲国产高清在线一区二区三| 欧美不卡视频在线免费观看| 亚洲,欧美,日韩| 亚洲av中文字字幕乱码综合| 午夜精品一区二区三区免费看| 亚洲不卡免费看| 超碰97精品在线观看| 国产美女午夜福利| 日本欧美国产在线视频| av国产久精品久网站免费入址| 日韩成人av中文字幕在线观看| 99九九线精品视频在线观看视频| 噜噜噜噜噜久久久久久91| 亚洲最大成人av| 国产国拍精品亚洲av在线观看| 日本wwww免费看| 黄片wwwwww| 国产精品无大码| 亚洲伊人久久精品综合 | 日产精品乱码卡一卡2卡三| 大话2 男鬼变身卡| 国产乱人视频| 我的老师免费观看完整版| 日本黄大片高清| 国产av码专区亚洲av| www.av在线官网国产| 秋霞伦理黄片| 国产精品不卡视频一区二区| 在线播放无遮挡| 男女那种视频在线观看| av线在线观看网站| 极品教师在线视频| 女人被狂操c到高潮| 日本黄色片子视频| 最近2019中文字幕mv第一页| 最近2019中文字幕mv第一页| 免费看av在线观看网站| 韩国高清视频一区二区三区| 非洲黑人性xxxx精品又粗又长| 色视频www国产| 国产精品伦人一区二区| 国产精品国产三级国产专区5o | 日韩视频在线欧美| 亚洲美女搞黄在线观看| 精品无人区乱码1区二区| 欧美成人午夜免费资源| 色尼玛亚洲综合影院| 国产色婷婷99| 免费人成在线观看视频色| 丝袜喷水一区| 乱码一卡2卡4卡精品| 日本三级黄在线观看| 99热这里只有精品一区| 亚洲国产成人一精品久久久| av在线老鸭窝| 国产伦精品一区二区三区四那| 99久久精品一区二区三区| 国产伦理片在线播放av一区| 免费看光身美女| 国产毛片a区久久久久| 全区人妻精品视频| 日本免费在线观看一区| 大话2 男鬼变身卡| 日本五十路高清| 久久99精品国语久久久| 国内少妇人妻偷人精品xxx网站| 国产免费一级a男人的天堂| 国产极品精品免费视频能看的| 亚洲成人av在线免费| 欧美高清成人免费视频www| 亚洲人成网站高清观看| 欧美日韩综合久久久久久| 久久精品夜夜夜夜夜久久蜜豆| 国产高清国产精品国产三级 | 乱人视频在线观看| 国产免费视频播放在线视频 | 久久久久久久国产电影| 九九爱精品视频在线观看| 免费人成在线观看视频色| 日本熟妇午夜| 中文天堂在线官网| 国产伦精品一区二区三区视频9| a级毛片免费高清观看在线播放| 国产成人a∨麻豆精品| 久久人人爽人人片av| 乱码一卡2卡4卡精品| 内射极品少妇av片p| ponron亚洲| 久久久成人免费电影| 乱人视频在线观看| 好男人在线观看高清免费视频| 蜜桃亚洲精品一区二区三区| 免费人成在线观看视频色| .国产精品久久| 亚洲欧美精品专区久久| 国产av不卡久久| 美女内射精品一级片tv| 国产视频内射| 亚洲在线观看片| 亚洲av二区三区四区| 国产三级在线视频| 少妇的逼好多水| 欧美成人一区二区免费高清观看| 麻豆乱淫一区二区| 啦啦啦观看免费观看视频高清| 网址你懂的国产日韩在线| 久久99精品国语久久久| 亚洲国产欧洲综合997久久,| 天天躁日日操中文字幕| 男人狂女人下面高潮的视频| 一级爰片在线观看| 伦精品一区二区三区| 边亲边吃奶的免费视频| 九九久久精品国产亚洲av麻豆| 听说在线观看完整版免费高清| 春色校园在线视频观看| 亚洲久久久久久中文字幕| 亚洲成av人片在线播放无| 永久网站在线| 成人国产麻豆网| 欧美精品国产亚洲| 最后的刺客免费高清国语| 18禁动态无遮挡网站| 尾随美女入室| 天天躁夜夜躁狠狠久久av| 我的女老师完整版在线观看| 69人妻影院| 午夜激情欧美在线| 99热这里只有是精品50| 夫妻性生交免费视频一级片| 91aial.com中文字幕在线观看| 国产男人的电影天堂91| 少妇猛男粗大的猛烈进出视频 | 看非洲黑人一级黄片| 国产精品精品国产色婷婷| 1024手机看黄色片| 国产综合懂色| 久久久久国产网址| 国产爱豆传媒在线观看| 免费不卡的大黄色大毛片视频在线观看 | 日日啪夜夜撸| 国产一区二区在线av高清观看| 国产亚洲av嫩草精品影院| 在线播放国产精品三级| 久久鲁丝午夜福利片| 国产极品天堂在线| 97在线视频观看| 在现免费观看毛片| 乱码一卡2卡4卡精品| 亚洲成色77777| 日韩中字成人| 亚洲av一区综合| 韩国高清视频一区二区三区| 免费一级毛片在线播放高清视频| 三级男女做爰猛烈吃奶摸视频| 男人舔女人下体高潮全视频| 99九九线精品视频在线观看视频| 三级毛片av免费| 免费人成在线观看视频色| 国产成人精品久久久久久| 亚洲av男天堂| 亚洲高清免费不卡视频| 国产精品久久久久久久久免| 色5月婷婷丁香| 人人妻人人澡欧美一区二区| 变态另类丝袜制服| 男人和女人高潮做爰伦理| 又黄又爽又刺激的免费视频.| 一级黄色大片毛片| 亚洲av成人精品一二三区| 一夜夜www| 成人二区视频| 久久精品国产亚洲av涩爱| 欧美日本亚洲视频在线播放| 有码 亚洲区| 人妻少妇偷人精品九色| 国产伦精品一区二区三区四那| 日韩欧美 国产精品| 一本—道久久a久久精品蜜桃钙片 精品乱码久久久久久99久播 | 一级毛片久久久久久久久女| 69人妻影院| 亚洲欧美清纯卡通| 久久久午夜欧美精品| 国产av在哪里看| av免费观看日本| 亚洲av男天堂| 一级毛片电影观看 | 亚洲成人久久爱视频| 亚洲一区高清亚洲精品| 99久久人妻综合| 99热精品在线国产| 亚洲中文字幕一区二区三区有码在线看| 国产成人精品婷婷| 欧美色视频一区免费| 一卡2卡三卡四卡精品乱码亚洲| 欧美潮喷喷水| 欧美不卡视频在线免费观看| 亚洲av中文av极速乱| 亚洲av.av天堂| 青青草视频在线视频观看| 亚洲国产精品成人久久小说| 久久精品国产亚洲av天美| 亚洲精华国产精华液的使用体验| 日本黄色视频三级网站网址| 亚洲成人中文字幕在线播放| 久久久精品94久久精品| 春色校园在线视频观看| 99久国产av精品| kizo精华| 人妻夜夜爽99麻豆av| 国产精品久久久久久精品电影| 免费大片18禁| 熟女人妻精品中文字幕| 真实男女啪啪啪动态图| 白带黄色成豆腐渣| 黄片无遮挡物在线观看| 色哟哟·www| 国产亚洲精品久久久com| 亚洲国产精品久久男人天堂| av在线亚洲专区| 在线观看av片永久免费下载| 日韩大片免费观看网站 | 嘟嘟电影网在线观看| 免费一级毛片在线播放高清视频| 熟女电影av网| 国产伦精品一区二区三区视频9| 综合色丁香网| 国产中年淑女户外野战色| 午夜精品一区二区三区免费看| av天堂中文字幕网| 少妇被粗大猛烈的视频| 国产精品女同一区二区软件| 少妇人妻精品综合一区二区| 国产成人精品一,二区| 在线a可以看的网站| 久久精品久久久久久噜噜老黄 | 免费一级毛片在线播放高清视频| 成年女人看的毛片在线观看| 亚洲av成人精品一二三区| 日日干狠狠操夜夜爽| 国产69精品久久久久777片| 免费一级毛片在线播放高清视频| 午夜福利在线观看免费完整高清在| 99久久精品热视频| 岛国在线免费视频观看| 美女高潮的动态| 日韩在线高清观看一区二区三区| 午夜福利高清视频| 国产av不卡久久| 男人和女人高潮做爰伦理| 国产综合懂色| 欧美区成人在线视频| 国产成人91sexporn| 美女内射精品一级片tv| 内地一区二区视频在线| 欧美激情久久久久久爽电影| 亚洲国产精品sss在线观看| 国产精品女同一区二区软件| 麻豆精品久久久久久蜜桃| 欧美高清成人免费视频www| 日韩精品青青久久久久久| 久久久久久国产a免费观看| 国产精品一区www在线观看| 成人一区二区视频在线观看| 永久网站在线| 国产精品女同一区二区软件| 热99re8久久精品国产| 国产精品一二三区在线看| 国产亚洲精品av在线| 婷婷色麻豆天堂久久 | 国产精品野战在线观看| 在线观看av片永久免费下载| 色哟哟·www| 最近的中文字幕免费完整| 午夜免费男女啪啪视频观看| 午夜福利在线在线| 嫩草影院精品99| 色视频www国产| 国产探花极品一区二区| 3wmmmm亚洲av在线观看| 色播亚洲综合网| 国产乱人偷精品视频| 日本免费在线观看一区| 亚洲18禁久久av| 能在线免费观看的黄片| 亚洲av中文字字幕乱码综合| 久久欧美精品欧美久久欧美| 听说在线观看完整版免费高清| 成人鲁丝片一二三区免费| 国产精品乱码一区二三区的特点| 在线观看一区二区三区| 久久久久久久午夜电影| 亚洲综合精品二区| 99久久成人亚洲精品观看| 美女被艹到高潮喷水动态| 国产爱豆传媒在线观看| 国产视频首页在线观看| 久久精品夜色国产| 久久久久免费精品人妻一区二区| 中文欧美无线码| 日韩av在线大香蕉| 亚洲人成网站在线观看播放| eeuss影院久久| 久99久视频精品免费| 亚洲av成人精品一区久久| 国产精品久久久久久久电影| 亚洲精品色激情综合| 亚洲aⅴ乱码一区二区在线播放| 久99久视频精品免费| 波多野结衣巨乳人妻| 欧美又色又爽又黄视频| 亚洲av电影在线观看一区二区三区 | 精品久久久久久久久久久久久| 国产老妇女一区| 狠狠狠狠99中文字幕| 99热这里只有精品一区| 久久久午夜欧美精品| 免费看美女性在线毛片视频| 欧美丝袜亚洲另类| 在线播放无遮挡| 美女大奶头视频| 69av精品久久久久久| 在线播放国产精品三级| 日本黄色视频三级网站网址| 中文精品一卡2卡3卡4更新| 成人性生交大片免费视频hd| 国产精品一区二区三区四区免费观看| 久久久久久久久久黄片| 久久久久九九精品影院| 男女那种视频在线观看| 国产一级毛片七仙女欲春2| 亚洲国产欧洲综合997久久,| 欧美色视频一区免费| 欧美潮喷喷水| 中文天堂在线官网| 国产亚洲午夜精品一区二区久久 | 亚洲色图av天堂| 久久这里只有精品中国| 91久久精品国产一区二区成人| 真实男女啪啪啪动态图| av播播在线观看一区| 视频中文字幕在线观看| 99热这里只有精品一区| 男的添女的下面高潮视频| 毛片一级片免费看久久久久| 国产免费又黄又爽又色| 国产三级在线视频| 日本av手机在线免费观看| 亚洲国产成人一精品久久久| 国产黄片美女视频| 免费不卡的大黄色大毛片视频在线观看 | 亚洲av日韩在线播放| 亚洲精品国产成人久久av| 婷婷色av中文字幕| 伦理电影大哥的女人| 色吧在线观看| 能在线免费观看的黄片| 高清视频免费观看一区二区 | 又粗又爽又猛毛片免费看| 久久久精品94久久精品| 婷婷色av中文字幕| 在线播放国产精品三级| 国内少妇人妻偷人精品xxx网站| 国产黄片视频在线免费观看| 真实男女啪啪啪动态图| 自拍偷自拍亚洲精品老妇| 日韩高清综合在线| 亚洲成av人片在线播放无| 日韩制服骚丝袜av| 午夜激情欧美在线| 亚洲av二区三区四区| 国国产精品蜜臀av免费| 免费黄网站久久成人精品| 国产高潮美女av| 欧美激情在线99| 亚洲在线自拍视频| 哪个播放器可以免费观看大片| 国产精华一区二区三区| 欧美+日韩+精品| 国产精品人妻久久久影院| 一级av片app| 精品一区二区三区人妻视频| 69人妻影院| 国产淫语在线视频| 精华霜和精华液先用哪个| 久久久久网色| 黄色一级大片看看| 亚洲国产欧美人成| 国产在线一区二区三区精 | 色综合站精品国产| 日本三级黄在线观看| 久久欧美精品欧美久久欧美| 成人无遮挡网站| 中文资源天堂在线| 国产一区亚洲一区在线观看| 极品教师在线视频| 国产免费一级a男人的天堂| 久久6这里有精品| 国产在线男女| 国产精品,欧美在线| 麻豆av噜噜一区二区三区| 亚洲欧美精品自产自拍| 亚洲欧美日韩卡通动漫| 精品久久久久久久人妻蜜臀av| 美女国产视频在线观看| 亚洲一区高清亚洲精品| 免费观看在线日韩| 一二三四中文在线观看免费高清| 成人午夜精彩视频在线观看| 日韩av在线免费看完整版不卡| 国产精品女同一区二区软件| 丝袜喷水一区| 三级国产精品欧美在线观看| 一级二级三级毛片免费看| 国产成人a区在线观看| 国产一区二区在线观看日韩| 99热6这里只有精品| 成年女人看的毛片在线观看| 毛片女人毛片| 国产一级毛片七仙女欲春2| 99久久精品国产国产毛片| 91狼人影院| 美女xxoo啪啪120秒动态图| 国产精品人妻久久久久久| 淫秽高清视频在线观看| 一级毛片aaaaaa免费看小| 亚洲综合色惰| 亚洲久久久久久中文字幕| 欧美变态另类bdsm刘玥| av国产免费在线观看| 少妇熟女欧美另类| 国产成人精品久久久久久| 国产成人a∨麻豆精品| 国产成人一区二区在线| 国产精品三级大全| 又黄又爽又刺激的免费视频.| av免费观看日本| 国产精品国产三级国产专区5o | 丰满少妇做爰视频| 亚洲国产精品合色在线| 国产精品精品国产色婷婷| 精品国内亚洲2022精品成人| 麻豆国产97在线/欧美| 国产高清三级在线| 国产亚洲5aaaaa淫片| 乱系列少妇在线播放| 欧美三级亚洲精品| 久久午夜福利片| 色综合色国产| 亚洲av熟女| 久久精品国产亚洲av涩爱| 听说在线观看完整版免费高清| 美女被艹到高潮喷水动态| 亚洲国产欧美在线一区| 亚洲人成网站在线播| 亚洲精品日韩av片在线观看| 韩国av在线不卡| 久久热精品热| 中文乱码字字幕精品一区二区三区 | 大香蕉97超碰在线| 一级黄色大片毛片| 亚洲欧美日韩卡通动漫| 亚洲无线观看免费| 成人特级av手机在线观看| 成人美女网站在线观看视频| av免费在线看不卡| 级片在线观看| 精品久久久久久电影网 | 只有这里有精品99| 午夜激情欧美在线| 精品人妻偷拍中文字幕| 1024手机看黄色片| 日本黄大片高清| 国内精品宾馆在线| 夜夜看夜夜爽夜夜摸| 国产精品久久视频播放| 女人久久www免费人成看片 | 日韩欧美在线乱码| 国产亚洲最大av| 亚洲丝袜综合中文字幕| 长腿黑丝高跟| 久久久久久久亚洲中文字幕| 久久久久久久久大av| 久久精品国产鲁丝片午夜精品| 国内揄拍国产精品人妻在线| 蜜桃亚洲精品一区二区三区| 国产 一区精品| 男人狂女人下面高潮的视频| 村上凉子中文字幕在线| 桃色一区二区三区在线观看| av在线观看视频网站免费| a级毛色黄片| 日产精品乱码卡一卡2卡三| 日韩一区二区三区影片| 只有这里有精品99| 韩国高清视频一区二区三区| 人人妻人人澡欧美一区二区| 狂野欧美白嫩少妇大欣赏| 久久久亚洲精品成人影院| 狂野欧美白嫩少妇大欣赏| 久久精品人妻少妇| 三级国产精品片| 2021天堂中文幕一二区在线观| 非洲黑人性xxxx精品又粗又长| 日韩av在线免费看完整版不卡| 最近的中文字幕免费完整| 日日啪夜夜撸| 建设人人有责人人尽责人人享有的 | 久久国内精品自在自线图片| 免费观看在线日韩| 中文乱码字字幕精品一区二区三区 | 18禁动态无遮挡网站| 男人舔女人下体高潮全视频| 亚洲久久久久久中文字幕| 免费播放大片免费观看视频在线观看 | 一级黄片播放器| 自拍偷自拍亚洲精品老妇| 又爽又黄无遮挡网站| 免费观看a级毛片全部| 淫秽高清视频在线观看| 亚洲国产精品成人综合色| 欧美最新免费一区二区三区| 国产在视频线精品| 久久久久久九九精品二区国产| 热99re8久久精品国产| 国产精品国产三级专区第一集| 国产精品国产三级国产专区5o | 一本一本综合久久| 国产爱豆传媒在线观看| 韩国高清视频一区二区三区|