• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    效度論證范式下的ECD測試設計框架
    ——我國教育考試國家題庫的升級路徑之一

    2016-06-05 14:19:55戴一飛
    中國考試 2016年11期
    關鍵詞:題庫效度證據(jù)

    戴一飛

    效度論證范式下的ECD測試設計框架
    ——我國教育考試國家題庫的升級路徑之一

    戴一飛

    進入效度整體觀時期,測試效度研究衍變?yōu)橛帽M可能多的“證據(jù)”支持考試的有效性,效度論證成為檢驗效度的基礎?!耙宰C據(jù)為中心的測試設計”(ECD)本著一切服務于效度論證的宗旨,依托計算機技術與思維,以教育測量與統(tǒng)計原理為方法,將測試設計過程模塊化,最大程度地使圍繞測試效度的全部證據(jù)聯(lián)系在一起,成就測試的“證據(jù)鏈”。我國教育考試國家題庫的升級可參考ECD的效度論證框架,以效度為重、以證據(jù)為先,建立被試思維和模塊思維,從根本上提高教育考試的科學性。

    效度;效度驗證;ECD;題庫

    題庫是個舶來品,20世紀60年代誕生于英國,是目前世界各大考試機構(gòu)普遍接受和采用的心理測量技術與工作方式。題庫,同樣也是改革我國考試事業(yè),改進評價機制,提升理論創(chuàng)新的“抓手”,是改造考試的“器”[1]。我國教育考試國家題庫建設始于2006年①我國從20世紀80年代開始關注題庫,初期研究以題庫的技術原理與方法介紹為主,在醫(yī)學、計算機科學、外語等具體學科的教學實踐中,嘗試建立小規(guī)模題庫,這一階段的理論與實踐積累為國家題庫建設奠定了基礎。,以教育部考試中心承擔國家題庫建設項目為標志。截至目前,包括高考、研究生考試、自考、成人高考在內(nèi)的國家教育統(tǒng)一考試的全部科目都被列入題庫建設當中,已經(jīng)形成了一定規(guī)模的以試題形式儲存的A類題庫和以試卷形式儲存的B類題庫[2]29。不少考試項目的題庫儲備初具規(guī)模,命題已實現(xiàn)日常化管理,風險應對能力有明顯提升[2]2。然而,受政治、社會、安全等多方面因素制約,以高考為代表的高利害大規(guī)模教育考試,依舊采用傳統(tǒng)的“入闈”命題方式,命題者非到考試結(jié)束,不得“出闈”,“泄題”的風險管控以封閉為主??陀^地講,我國的題庫建設仍在初級階段,距離集管理試題、組配試卷和報告分數(shù)于一體的現(xiàn)代題庫還有一定距離。嚴格說來,題庫若缺乏效度標準,其輸出的考試產(chǎn)品是解釋不了分數(shù)含義的,而我國題庫在效度方面的設計,確有提升空間。新一輪高考改革要求考試主要服務于本科院校的招生,突出能力和素養(yǎng)考查,調(diào)整科目數(shù)量,外語實現(xiàn)一年多考;研究生考試、自考等大規(guī)模教育考試目前也都處于改革期,調(diào)整思路正在醞釀,頂層設計一觸即發(fā);網(wǎng)絡媒體迅猛發(fā)展,老百姓對于國家教育考試關注度之高前所未有,社會監(jiān)督的力量不容小覷。面對這些挑戰(zhàn),國家題庫究竟能做些什么?又該怎樣做?

    筆者認為,改良與升級國家題庫,突破點不再是硬件的更新?lián)Q代或追求入庫試卷的倍量,而應該回歸理論建構(gòu)上來,將效度、信度、等值、分數(shù)解釋等重要的心理測量概念整合進題庫,這之中,尤以效度觀念的建立最為迫切。一項沒有效度做保證的考試,其使用風險是極大的。關注效度,關注教育測量的統(tǒng)計屬性,關注以分數(shù)解釋為出發(fā)點的論證過程,建設“理論驅(qū)動”[3]的國家題庫,是下一階段教育考試題庫升級的目標與意義所在,也正是本文研究的著眼點。效度理論目前已發(fā)展到新的階段,效度整體觀影響下的效度論證范式,引發(fā)眾多測試模型的提出,本文擬選擇目前指導美國教育考試服務中心(Educational Testing Service,ETS)考試與評價工作的以證據(jù)為中心的測試設計框架(Evidence-Centered Design,ECD)作為研究對象,通過分析其工作方式,剖析這一框架對于效度論證的作用,指出ECD所蘊含的思想方法對于升級國家題庫的意義。

    1 發(fā)展中的效度理論

    一項測試是否有效測量了它所想要測量的東西,是評價這項測試最重要的指標,稱之為效度(va?lidity),而那個“東西”,即某種“概念或?qū)傩浴?,被稱為構(gòu)念(construct)①對于construct的翻譯有多種,除“構(gòu)念”外,也常被譯為“構(gòu)想”“結(jié)構(gòu)”以及“建構(gòu)”。[4]11。如今,心理測量學的話語體系中已不再簡單地描述“一項考試的效度”是多少,是高還是低,因為在沒有前提、也未加限定的情況下,這種討論既不正確,也無意義。效度更多地與“程度”“評價”和“判斷”這些關鍵詞聯(lián)系在一起,效度驗證(validation)逐步取代對靜態(tài)意義上效度的觀察?;仡櫺Ф壤碚摰陌l(fā)展,大體經(jīng)歷了三個階段:20世紀50年代以前的單一效度觀時期,20世紀50年代至80年代中期的分類效度觀時期,以及20世紀80年代中期至今的效度整體觀時期[5]87。

    持單一效度觀者,把效度等同于相關系數(shù),系數(shù)越大,預測能力越強,效度也就越好。美國標準化考試運動期間,以GRE、LSAT等教育考試為對象的研究,通常都會報告被試得分與其一年級期末成績的相關度,以此說明考試的有效性[6]。效度在當時是以系數(shù)呈現(xiàn)出的客觀概念。20世紀50年代起,對效度的認識進入到“三分說”(Trinitarian doc?trine)時期,效度被定義為內(nèi)容效度、效標效度和構(gòu)念效度三種類型。其中,效標效度是對早先提出的預測效度和同時效度兩個概念的整合。“構(gòu)念”第一次被作為效度類型的識別標準。分類效度觀對效度理論的后續(xù)發(fā)展影響頗為深遠,三種“效度類型”沿用至今。20世紀80年代中后期,對于效度的理解,進入整體觀時期。起先,構(gòu)念效度在“三分說”中占據(jù)上風,進而,構(gòu)念又將構(gòu)念效度取而代之。克隆巴赫(Lee J.Cronbach)在第二版《教育測量》(Educational Measurement)中指出,“效度印證的不是測試本身,而是對具體施測過程中所形成數(shù)據(jù)的解釋”[7]。從此,效度內(nèi)涵已從單純的“某項考試的效度”轉(zhuǎn)為“分數(shù)解釋的效度”。在1985年版《教育與心理測試標準》(Standards for Educational and Psychological Testing,下文簡稱《標準》)中,效度的定義被修訂為“依據(jù)分數(shù)所做的推理是否適恰、是否富有意義、是否具備實用性??荚嚨男Ф闰炞C就是搜集證據(jù)來支持上述推理的過程”[8]。值得注意的是,此時的“效度類型”被“證據(jù)類型”所取代,內(nèi)容證據(jù)與效標證據(jù)被看作是對“與構(gòu)念有關的證據(jù)”的補充,信度也成為效度證據(jù)的一種。梅西克(Samuel J.Messick)是持效度整體觀的代表人物,他提出“經(jīng)驗證據(jù)和理論依據(jù)在多大程度上指出基于測驗分數(shù)或是其他評估方式所做的推斷或采取的行動是否充分和適當?對這個問題的綜合評價性判斷就是效度”[9][5]89。這一定義與2014版《標準》對效度的闡釋——“在具體使用測驗時,證據(jù)與理論的積累對分數(shù)解釋的支持程度”[4]225已十分接近。從此,效度研究的邏輯衍變?yōu)椤坝帽M可能多的證據(jù)去支持考試”[10]。

    2 以論證為基礎的效度驗證

    用盡可能多的“證據(jù)”證明考試的有效性,成為效度驗證的基礎,證據(jù)即為效度。在這種效度觀的影響下,效度驗證的內(nèi)容也發(fā)生著變化:單一效度觀下的效度驗證,是對相關系數(shù)的計算;分類效度觀下的效度驗證是多重標準的效度證明過程,有經(jīng)驗意義上的,也有實證意義上的;整體效度觀下的效度驗證則體現(xiàn)為對作為統(tǒng)一整體的效度的論證過程,關注的不僅是形式邏輯與數(shù)理推理,還包括對前提可接受性的反復拷問與證成。

    如果說梅西克在第三版《教育測量》中對于效度的定義是效度理論的重大突破,那么第四版《教育測量》中,凱恩(Michael T.Kane)使用“效度驗證”而非“效度”為標題解釋效度理論,可以說是對梅西克將效度問題落腳到“評價”(evaluation)的進一步發(fā)展[11],即強調(diào)證據(jù)收集的過程性。凱恩指出,效度驗證包含兩種論證,一是解釋性論證(interpretive argument),二是效度論證(validity argument),前者運用“如果-那么”(If-Then)規(guī)則,對證據(jù)所支持的分數(shù)解釋與運用作出具體說明,而后者則是對解釋性論證的評價,欲確認對分數(shù)的解釋或運用是有效的,需首先認定其解釋性論證具有相關性,推理依據(jù)具有合理性,假設前提具有可接受性[12]23。從形式邏輯來看,只要結(jié)論是按照邏輯規(guī)則得出的,推理就有效,解釋性論證運用的就是這種推理邏輯,但問題是解釋性論證論據(jù)的成立卻不僅僅依賴于形式邏輯,有時還會依據(jù)假設性推理或非形式邏輯推理[12]23。據(jù)此,效度驗證則不僅要關照“分數(shù)的合理解釋”,還需要考慮“分數(shù)解釋的可接受性”[13],對那些看似為真的前提作出論證。效度驗證不再是一個封閉的步驟或環(huán)節(jié),而是不斷收集多種證據(jù),在結(jié)論與證據(jù)之間“來回審視”[14]的效度論證過程①在一定意義上,效度論證與法律論證有相似之處。此處借用德國法學家卡爾·恩吉施(Karl Engisch)對法律判斷形成中等置的描述:“等置是事實與規(guī)范相互關照,在事實與規(guī)范之間來回審視。”。

    基于效度驗證中存在非形式邏輯的現(xiàn)實,心理測量學界開始尋找效度論證的方法。非形式邏輯創(chuàng)始人圖爾敏(Stephen E.Toulmin)提出的論證模型為效度論證提供了依據(jù)。凱恩運用圖爾敏模型構(gòu)建出具體的效度論證模型,嘗試解決證明推論理據(jù)本身的成立問題[12]27-28。圖爾敏認為,在作出某種結(jié)論之前,必須充分證成這種結(jié)論,且當結(jié)論受到挑戰(zhàn)時,能夠?qū)ζ渥鞒鲛q護。圖1展示的是圖爾敏模型的六個基本要素及其相互關系。

    圖1

    數(shù)據(jù)(Datum)是運用該模型推衍結(jié)論(Claim)的起點,對考生作答情況的記錄即為數(shù)據(jù),分數(shù)即為結(jié)論。在考生的作答情況與分數(shù)之間,存在一個正當化的過程(Warrant),為正當化提供支持的證據(jù)就是支援(Backing)。這一過程中,一方面需要通過限定(Qualifier)增強結(jié)論的可接受度,另一方面需要排除例外情形對結(jié)論造成的反駁(Rebuttal)。效度論證中的每一項解釋性論據(jù)都經(jīng)歷著若干次從數(shù)據(jù)到結(jié)論的論證過程,且前一次論證的結(jié)論將成為下一次論證的數(shù)據(jù)。

    在凱恩等人所描繪的效度驗證論據(jù)鏈基礎上[15],語言測試專家巴赫曼(Lyle F.Bachman)增加了一項推論,即基于分數(shù)的決策。在此,借用巴赫曼延伸后的論證鏈(圖2)[16-17]來說明圖爾敏論證模型在效度論證中的具體運用。

    如何證明從考生作答情況的數(shù)據(jù)觀察推導出分數(shù)以及分數(shù)的使用是正當?shù)模繌挠^察分數(shù)概括出全域分數(shù)的正當化理由,是統(tǒng)計意義上的從樣本均值到期望值的概括過程,對這一過程的支援包括具有代表性的樣本所提供的證據(jù)。從全域分數(shù)外推出目標分數(shù)的正當化理由,是回歸方程(regres?sion equation),對回歸方程的支援包括對于測試分數(shù)與效標分數(shù)之間相互關系的實證研究。解釋分數(shù)時的推理往往需要明確的限定,如標準誤差和置信區(qū)間,二者表明從觀察分數(shù)到全域分數(shù)推理過程的不確定性,再如從測試分數(shù)到標準分數(shù)的推演伴隨著相關系數(shù)的標準誤差?;谀繕朔謹?shù)的決策往往會通過限定來增強說服力,例如為擇業(yè)提供的測試,同分班測試或是升學測試所需的限定就有很大差異。而在某些情況下,即使給出了限定,也無法實現(xiàn)從數(shù)據(jù)、正當化再到結(jié)論的跳躍,于是反駁發(fā)生了[18]。從數(shù)據(jù)到結(jié)論的正當化過程,即便已經(jīng)加了限定,依然不能被接受,此時對于分數(shù)的解釋性論證就無法成立。

    效度內(nèi)涵在不斷發(fā)展,以論證的方式進行效度驗證是未來的必然趨勢[16-17]。然而,僅有論證模型與概念性術語,并不足以具體設計和實施測試,考試機構(gòu)需要更加明確具體的“工具”,即用某種結(jié)構(gòu)或框架來整合論證模型和術語,使整個測試從設計到評價的全部過程更為清晰、操作性更強[19]1。ECD正是這樣一種框架性的方案選擇和思想方法。

    圖2

    3 ECD:效度論證的實施框架

    ECD起初是ETS于1997年設立的一個研發(fā)項目,由梅斯雷弗(Robert J.Mislevy)、斯坦伯格(Lin?da S.Steinberg)以及阿蒙德(Russell G.Almond)三人負責[20]。該項目最直接的理論基礎來自1994年梅斯雷弗本人對于測試中證據(jù)與推理問題所做的闡釋,他指出無論何種類型的教育評價,本質(zhì)上關注的是對學生知識、技能和成就作出一定的推理,評價可以看作“基于證據(jù)進行推理”的過程[21-22]。隨后幾年,梅斯雷弗等人陸續(xù)發(fā)表針對該框架的研究成果,并作出更為系統(tǒng)的闡釋[19,23]。目前,ECD已成為美國教育評價領域主要的應用模型之一[24],也是指導ETS開發(fā)和實施具體考試評價產(chǎn)品的平臺。梅西克以構(gòu)念為中心的效度觀對梅斯雷弗開發(fā)ECD有直接影響,證據(jù)推理、統(tǒng)計模型、概率推理等理論發(fā)展,計算機技術在心理測量領域的應用,令ECD的出現(xiàn)成為可能和必要。在整體效度觀的影響下,ECD試圖整合眾多證據(jù),協(xié)調(diào)不同證據(jù)的銜接,以便讓所有證據(jù)都指向效度驗證這個終極目標。微觀上,ECD包含一個概念性框架和四個具體發(fā)布環(huán)節(jié),概念性框架是六種模型的組合,發(fā)布環(huán)節(jié)是對各模型動態(tài)嵌入不同測試運行階段的描述;宏觀上,ECD還意味著由五部分組成的層級關系,以及將上述各項步驟與各種信息結(jié)合在一起的測試循環(huán)(Delivery Cycle)。

    3.1 運行方式①此部分內(nèi)容主要是指計算機輔助環(huán)境下的測試設計。

    3.1.1 概念性測試框架

    概 念性 測試 框架(Conceptual Assessment Framework,CAF)[23]6-13反映的是一項測試的設計藍圖,具體包括六種模型,即考生模型(Student Mod?el)、證據(jù)模型(Evidence Model)、任務模型(Task Model)、組卷模型(Assembly Model)、呈現(xiàn)模型(Pre?sentation Model)和交付系統(tǒng)模型(Delivery SystemModel)。CAF的每個模型都是圍繞著“要測量什么”“怎樣測量所想要測量的東西”這兩個問題展開的。

    考生模型是眾多無法直接觀察到的變量的集合,這些變量來自考生作答情況在概率上的實時調(diào)整??忌趹嚑顟B(tài)下對不同試題作出不同反饋,計算機再根據(jù)最新的反饋,給出下一個任務。考生模型提供了考生在作答方面的數(shù)據(jù),體現(xiàn)為概率分布。

    證據(jù)模型包含證據(jù)規(guī)則(Evidence Rules)與測量模型(Measurement Model)兩部分。證據(jù)規(guī)則規(guī)定如何從考生當下的作答情況(可觀察變量)歸納考生的水平,屬于應答評分的數(shù)據(jù)。測量模型提供的是有關考生模型變量與可觀察變量之間的關聯(lián)性信息。經(jīng)典測量理論、項目反應理論、認知診斷模型等都屬于測量模型,這些模型指導了總結(jié)性評分的過程,是對整個測試任務中各項證據(jù)的積累與整合。

    任務模型解決的是如何向證據(jù)模型提供證據(jù)的問題。考生將看到怎樣的測試任務、作答后將產(chǎn)生怎樣的結(jié)果都由任務模型來完成。任務模型包含不同的任務模型變量,體現(xiàn)為各項任務的屬性,以及這些屬性如何同考生看到的測試任務和作答后的反饋相關聯(lián)。任務模型可以幫助命題者寫入試題內(nèi)容,幫助測量專家調(diào)配題量。不同的任務模型產(chǎn)生不同的任務組合,呈現(xiàn)出不同的試卷內(nèi)容。這種將任務模塊化的做法,系統(tǒng)控制了提供一套試卷所需試題的證據(jù)材料和統(tǒng)計參數(shù),其優(yōu)勢在于,可以直接對這些任務組合進行評價,并提供了開放性設置任務組合的途徑。

    組卷模型是將考生模型、證據(jù)模型和任務模型串接在一起。該模型以精準測量考生模型變量為目的,在協(xié)調(diào)不同任務間相互關系的同時,恰當?shù)胤从晨己藘?nèi)容的深度與廣度。該模型可以幫助計算機回答“需要對被試測量到什么程度”的問題。

    呈現(xiàn)模型規(guī)定了試卷的呈現(xiàn)方式。相同的考試內(nèi)容,既可以紙筆方式呈現(xiàn),也可以通過計算機網(wǎng)絡呈現(xiàn),區(qū)別在于前者只需要向打印機發(fā)出指令,而后者卻需要編寫代碼來實現(xiàn)。

    交付系統(tǒng)模型集學生、證據(jù)、任務、組卷以及呈現(xiàn)模型于一體,對各個模型的共性內(nèi)容做了統(tǒng)一規(guī)定,如平臺、安全以及時間控制等,協(xié)助不同類別的模型進行搭配,以實現(xiàn)不同的測試目的。

    依梅斯雷弗等人看來,這六種模型是溝通測試的效度論證與實操環(huán)節(jié)的橋梁。通過這些模型,一項考試所考核的知識水平與技能、測量條件、各種證據(jù)都得以具象化。圖3是交付系統(tǒng)模型的示意圖,直觀反映了各模型之間的關聯(lián)。

    3.1.2 發(fā)布環(huán)節(jié)

    圖3 交付系統(tǒng)模型示意圖

    如果說上述模型屬于測試設計的靜態(tài)框架,發(fā)布環(huán)節(jié)(Four-process Delivery Architecture for As?sessment Delivery)[19]25就是把靜態(tài)框架串聯(lián)起來的動態(tài)過程。一項計算機自適應測試的運行離不開以下四個環(huán)節(jié),即呈現(xiàn)(Presentation Process)、證據(jù)識別(Evidence Identification,又稱Response Process?ing)、證據(jù)匯總(Evidence Accumulation,又稱Sum?mary Scoring)以及活動選擇(Activity Selection),各環(huán)節(jié)同時與任務/證據(jù)合成庫(Task/Evidence Com?posite Library)發(fā)生聯(lián)系——接納數(shù)據(jù)和輸出數(shù)據(jù)?;顒舆x擇環(huán)節(jié)負責從任務庫中選擇考試任務,然后將呈現(xiàn)該題目的指令發(fā)送給呈現(xiàn)環(huán)節(jié),由該環(huán)節(jié)將試題展現(xiàn)給考生,而這些考試任務是由任務模型設計好的。呈現(xiàn)環(huán)節(jié)收集到考生的作答情況之后,將其傳遞給證據(jù)識別環(huán)節(jié),由該環(huán)節(jié)根據(jù)證據(jù)模型所規(guī)定的方法來完成應答過程,把所識別的作答結(jié)果通過證據(jù)模型定義的評價程序給出可觀察變量的值。這個值傳遞給證據(jù)匯總環(huán)節(jié),由其通過考生模型變量的值更新概率分布,得到總結(jié)性評分反饋,立即儲存后用于下一次分數(shù)報告。證據(jù)匯總向活動選擇環(huán)節(jié)提供信息,幫助其判斷選擇何種考試任務。圖4反映了這四個環(huán)節(jié)的相互關系。

    3.1.3 ECD層級

    圖4 計算機自適應測試的四個發(fā)布環(huán)節(jié)

    表1 ECD層級匯總

    ECD層級(ECD Layers)[19]6是2005年梅斯雷弗等人在ECD概念性測試框架和四個發(fā)布環(huán)節(jié)的基礎上提出的新概念,是對ECD框架的完善與拓展。根據(jù)表1,CAF與發(fā)布環(huán)節(jié)只是ECD層級中的兩個層級,CAF之前增加了內(nèi)容分析與內(nèi)容模型兩個層級,在CAF與測試發(fā)布之間,增加了測試實施這個層級。從表1所反映的各層級作用與核心內(nèi)容來看,內(nèi)容分析與內(nèi)容模型是同構(gòu)念效度以及效度論證理論相呼應的,也間接同分數(shù)的解釋發(fā)生關聯(lián)。內(nèi)容分析具體表現(xiàn)在考核內(nèi)容方面,由各專業(yè)領域的專家、學者作出規(guī)定,而內(nèi)容模型則主要由測試設計者負責,二者協(xié)同合作,確定測試的內(nèi)容與結(jié)構(gòu)。測試實施是將CAF所描繪的測試各個部分實際制造出來,包括命題者撰寫考試任務、測試模型的匹配、評分細則的制定、仿真程序的編制等內(nèi)容。

    3.2 設計特點

    3.2.1 以證據(jù)為中心,一切設計服務于效度論證

    在證據(jù)即效度這一觀念的影響下,對于測試效度的“計算”,轉(zhuǎn)變?yōu)閷τ跍y試相關證據(jù)的收集、整理、解釋、論證,ECD的設計完全圍繞這個主題。ECD處理和整理證據(jù)的方式并非截然分開,而是彼此支持,互為因果,為效度論證提供了完整的證據(jù)鏈。ECD是一種問題導向的設計,即不斷地去解答以下這些問題:最終要形成怎樣的成績報告?如何用分數(shù)來說明和解釋這份報告?說明與解釋的理由是什么?證據(jù)有哪些?如何收集和處理這些證據(jù)?這些證據(jù)如何能支持結(jié)論?證據(jù)是否可靠?在不斷回答這些問題的過程中,形成ECD的工作模型。

    2014版《標準》列舉了五種效度證據(jù):考試內(nèi)容(Test Content)、應答過程(Response Processes)、試卷的內(nèi)部結(jié)構(gòu)(Internal Structure)、與其他變量的關系(Relations to Other Variables)以及測試的效度與社會效應(Validity and Consequences of Testing)[4]14-21。ECD巧妙地將這五種證據(jù)關聯(lián)起來,并為每一種證據(jù)都提供了嵌入模型。

    考試內(nèi)容是關于測量對象即構(gòu)念的證據(jù),主要體現(xiàn)在任務模型當中??荚嚈C構(gòu)將規(guī)定好各種屬性的試題放入題庫,根據(jù)具體需求,對試題在數(shù)量上和類型上進行組合,向考生呈現(xiàn)試卷內(nèi)容??荚噧?nèi)容能否充分反映某一類專業(yè)能力,由專家進行研判,與構(gòu)念形成對應關系,在一定程度上反映與內(nèi)容有關的證據(jù)的有效性,但尚不足以建立起分數(shù)解釋和效度論證的證據(jù)鏈。

    ECD的證據(jù)模型可以提供應答過程中產(chǎn)生的證據(jù)以及與試卷內(nèi)部結(jié)構(gòu)相關的證據(jù)??忌膽疬^程反映出考生能力表現(xiàn)與構(gòu)念之間的匹配關系[4]15。具體來說,考試收集的證據(jù)不是考生能否答對某一道試題,而是其究竟能否把試題所希望考查的能力水平體現(xiàn)出來。應答環(huán)節(jié)可以收集包括寫作習慣、作答時間、視線活動的分配等證據(jù),目前的計算機技術可以輕易地記錄下這些痕跡。應答過程還可以佐證閱卷質(zhì)量,通過記錄閱卷習慣,判斷閱卷者是否嚴格按照評分標準打分。與試卷內(nèi)部結(jié)構(gòu)相關的證據(jù)體現(xiàn)為各試題之間以及試卷各部分的組合在多大程度上與分數(shù)解釋的依據(jù)(即構(gòu)念)相符合[4]16。當測試目的單一、構(gòu)念指向明確時,題目的同質(zhì)化程度相對就高,反之亦然。

    基于考試同其他變量之間的關系獲得的證據(jù),反映了這些關系同解釋分數(shù)的構(gòu)念相一致的程度,主要包括聚合證據(jù)與區(qū)別證據(jù)(convergent and dis?criminant evidence)、與效標之間的關聯(lián)性以及效度概化(validity generalization)。效度和社會效應方面的證據(jù)主要體現(xiàn)為考試產(chǎn)生的社會后果是否同預期相吻合。ECD的應答環(huán)節(jié)和總結(jié)性評分環(huán)節(jié)在測試實際運行時,不斷收集即時性證據(jù)與結(jié)論性證據(jù),各種數(shù)據(jù)的處理過程被完整記錄下來,當需要同外部變量做相關分析時,可隨時調(diào)用。

    3.2.2 以計算機技術與思維為依托,測試的設計過程模塊化

    專家系統(tǒng)、軟件設計以及法律論證是ECD框架的主要技術與理論基礎[19]1。ECD是基于計算機輔助測試技術的設計框架,對于考試各個方面的理解都需要考慮計算機的應用問題。傳統(tǒng)上,考試工作包含命題、考務和評價三個方面。在命題環(huán)節(jié),由命題者寫題、組卷、保管;在考務環(huán)節(jié),由考務人員儲存、運送、監(jiān)考、回收、閱卷、發(fā)布成績;在評價環(huán)節(jié),由評價者對試卷質(zhì)量做分析與評估。此種模式是按照工作性質(zhì)劃分的。ECD提供的是另一種測試設計思路,一開始就以效度驗證為工作核心,然后圍繞這個目標將任務拆分為六大模塊,這些模塊是建立在計算機技術基礎之上的,命題、考務與評價三部門都可以使用不同的模塊進行工作,也可以從不同的模塊中獲取數(shù)據(jù)與資源。由于考試設計任務已被盡可能細化為一個個計算機指令或程序,當考試的某些方面修訂或更新時,只需要修改相應模塊的具體內(nèi)容即可,不會影響到其他模塊的運行,有利于更加便捷和高效地將各種新數(shù)據(jù)、新資料納入修訂后的考試當中。ECD的效度驗證過程基于不同的工作模塊展開,具有開放性與持續(xù)性。

    4 ECD與我國教育考試國家題庫的升級

    曾有專家在我國恢復高考30年時對考試技術的變革做過述評,總結(jié)出四項考試手段和技術方面的革新,即網(wǎng)上報名技術的興起、網(wǎng)上閱卷的實施、網(wǎng)絡化考試的實施以及電子考場監(jiān)控技術的運用[25]。如今,高考恢復已近40年,我國在考試技術方面的發(fā)展仍然停留在這四個方面。在這四個方面當中,網(wǎng)上報名、網(wǎng)上閱卷以及電子考場監(jiān)控都屬于考務技術,與命題、評價相關的僅有網(wǎng)絡化考試一項。盡管目前我國已有相當多考試采用了網(wǎng)考技術,積攢了豐富的經(jīng)驗,但以高考為代表的高利害的大規(guī)模教育考試幾乎無一采用網(wǎng)絡化考試技術。當前,教育考試題庫已初具規(guī)模,高考等國家重大教育考試都在題庫技術的支持范圍之內(nèi),如能真正地將計算機輔助考試、網(wǎng)絡化考試以及作為技術支持的題庫運用到這些考試當中,將從實質(zhì)上提升考試的質(zhì)量。

    美國ETS所運用的ECD測試設計框架,嚴格說來,并不是題庫建設本身,而是在架構(gòu)上高于題庫的測試設計框架和統(tǒng)領測試設計的范式與思想。它將題庫納入其中,讓題庫在一個測試網(wǎng)或是測試循環(huán)[19]27中發(fā)揮作用。ECD框架與運行方式可為我國的國家題庫建設提供以下三方面的啟示。

    首先,建立效度思維,將效度論證納入題庫升級的設計考量。在現(xiàn)代教育和心理測量學中,效度是一個統(tǒng)一的概念,它需要有多方面的證據(jù)來支持根據(jù)考試結(jié)果對考生心理結(jié)構(gòu)所作出的推測;它關注的是考試結(jié)果的解釋,不是考試本身;它包含了對考試結(jié)果使用所產(chǎn)生的社會后果的評價[26]33。效度是教育心理測量的基本要求,也是大規(guī)模教育考試科學屬性的基本要素之一[26]31。效度論證既是考試質(zhì)量的求證,也是考試質(zhì)量的說明[27]。在分分必爭的今天,分數(shù)以及分數(shù)解釋的效力如何,要看考試的效度。題庫可以做很多事情,但最核心的功能是輔助命題,命題質(zhì)量的高低應以效度為衡量標準,因而題庫的設計不僅應該確保存儲試題的安全性,更應該為確保試題的分數(shù)可解釋性與可接受性服務。

    其次,建立被試思維,題庫設計要從一元視角轉(zhuǎn)變?yōu)槎暯?。題庫的使用者是考試機構(gòu),但題庫的服務對象卻絕非只是考試機構(gòu)。從手段來看,題庫是運用科技手段命題的好方法,但從目的來看,題庫幫助下產(chǎn)出的試題,依然要面對考生,面對考生家長,面對整個社會,這就不單單是一個方法問題。如果題庫建設只站在考試機構(gòu)這一元的施考者視角,那么往往采用的是以效率與安全優(yōu)先的價值判斷,尤其是在我國的教育體制之下,考試的效度問題容易被忽略。這種一元視角帶來的最大隱憂就是,經(jīng)不起社會的拷問,一旦有人質(zhì)疑試卷的有效性,如何應對會成為最為棘手的事情。且不說完整地將整個效度論證的證據(jù)鏈連接起來,就連分數(shù)意義的解釋都難以完成。建立施考者與被試的二元視角,對于題庫的升級非常關鍵。任何考試最終都要向被試報告成績或結(jié)果,這個結(jié)果對于考試機構(gòu)而言,往往最容易被忽略,卻恰恰是考生最為看重的。如果不能建立起被試思維,不從考生角度看待考試,考試恐怕只能稱得上是一種行政任務,而非真正意義上的心理測量、教育評價。二元視角要求考試機構(gòu)在設計考試之初,就必須明確如何向考生解釋分數(shù)以及怎樣使用分數(shù)這些問題。

    第三,建立模塊思維,讓命題過程在題庫中模塊化。沒有科學的統(tǒng)計與測量分析功能支持的題庫并不是一個有價值的題庫[28]。ECD給出了一種用模塊思維來構(gòu)筑題庫的路徑選擇。正如前述所分析的,題庫所包含的各種模型,將測試設計的各個環(huán)節(jié)分解,一方面最大限度地將計算機技術應用到心理測量領域,另一方面也將整個測試設計的思維過程換算為具體的運行步驟,將對于測試效度的種種證明過程,都融入到了計算機運算模型當中。模塊思維的建立,對于應對科技發(fā)展向考試機構(gòu)提出的挑戰(zhàn)具有特殊意義。

    5 結(jié)語

    如果說,以高考為首的大規(guī)模教育考試目前依舊采用“入闈”來規(guī)避風險,命題者背對背預測試題難度,采用原始分數(shù)“一刀切”劃定分數(shù)線,以評價會的形式請專家論證考試的內(nèi)容效度,用輿論引導的方式疏通社會對于考試公平性的質(zhì)疑,那么,我們的考試仍舊難以稱為科學的考試,我們的考試機構(gòu)也難以專業(yè)化考試機構(gòu)自居。西方的教育測量學已經(jīng)走了很遠,從一開始的相關系數(shù)到后來的幾種效度類型,再到構(gòu)念的出現(xiàn)與整體效度觀的建立,人們對于考試的認識已經(jīng)不再是一個分數(shù),而是整個考試過程,人們需要了解的是分數(shù)背后的意義以及意義的有效性與可靠性,考試過程意味著證據(jù)積累的過程。ECD框架就是圍繞證據(jù)的收集設計的。之所以說ECD框架可為我國的教育考試國家題庫建設所借鑒,在于其表達了一種以效度為重、以證據(jù)為先的測試設計思想方法,是一種從構(gòu)念出發(fā),從考生出發(fā),從目的出發(fā)的命題方式,一切以分數(shù)最后的解釋力為核心,這些正是當前國家題庫建設最需要樹立的觀念。

    [1]劉芃.另一個角度看題庫[J].中國考試,2013(11):4.

    [2]李光明,等.教育考試國家題庫理論與實踐[M].北京:高等教育出版社,2014.

    [3]楊向東.理論驅(qū)動的心理與教育測量[M].上海:華東師范大學出版社,2014.

    [4]AERA,APA,NAME.Standards for Educational and Psychological Testing[S].Washington,DC:American Educational Research Asso?ciation,2014.

    [5]李清華.語言測試之效度理論發(fā)展五十年[J].現(xiàn)代外語,2006(1).

    [6]CRAWFORD A B,GORHAM T J.The Yale Legal Aptitude Test[J]. The Yale Law Journal,1940,49(7):1237-1249.

    [7]THORNDIKE R L.Educational Measurement[C].Washington,DC: American Council on Education,1971:447.

    [8]AERA,APA,NAME.Standards for Educational and Psychological Testing[S].Washington,DC:American Educational Research Asso?ciation,1985:9.

    [9]MESSICK S J.Validity[A]//LINN R L.Educational Measurement. New York:Macmillan,1989:13.

    [10]謝小慶.測驗效度概念的新發(fā)展[J].考試研究,2013(3):58.

    [11]趙琪鳳.效度理論發(fā)展述評——基于四版《教育測量》異同的比較分析[J].中國考試,2012(7):10.

    [12]KANE M T.Validation[A]//BRENNAN R L.Educational Measure?ment.Lanham:Rowman&Littlefield Publishers,2006.

    [13]謝小慶.效度:從分數(shù)的合理解釋到可接受解釋[J].中國考試,2013(7):7-8.

    [14]鄭永流.法律判斷形成的模式[J].法學研究,2004(1):147.

    [15]KANE M T,CROOKS T,COHEN A.Validating Measures of Per?formance[J].Educational Measurement:Issues&Practice,1999, 18(2).

    [16]BACHMAN L F.Building and Supporting a Case for Test Use[J]. Language Assessment Quarterly,2005,2(1).

    [17]胥云.語言測試中基于論證的效度驗證模式述評[J].外語教學理論與實踐,2011(4):13.

    [18]楊寧芳.圖爾敏論證邏輯思想研究[M].北京:人民出版社, 2012:71.

    [19]MISLEVY R J,RICONSCENTE M M.Evidence-Centered Assess?ment Design:Layers,Structures,and Terminology[R/OL].[2016-09-01].http://padi.sri.com/downloads/aera/2005/symposium2/pa?pers/MislevyRicLayers.pdf.

    [20]MISLEVY R J,STEINBERG L S,ALMOND R G.Evidence-Cen?tered Assessment Design[EB/OL].[2016-09-01].http://www.edu?cation.umd.edu/EDMS/mislevy/papers/ECD_overview.html.

    [21]MISLEVY R J.Evidence and Inference in Educational Assessment [EB/OL].[2016-09-01].http://files.eric.ed.gov/fulltext/ED390888. pdf.

    [22]馮翠典.“以證據(jù)為中心”的教育評價設計模式簡介[J].上海教育科研,2012(8):12.

    [23]MISLEVY R J,ALMOND R G,LUKAS J F.A Brief Introduction to Evidence-Centered Design[EB/OL].[2016-09-01].http://www. ets.org/Media/Research/pdf/RR-03-16.pdf.

    [24]柏毅,呂澤恩.美國教育評估系統(tǒng)的ECD模型[J].教育測量與評價,2016(1):35.

    [25]王后雄,何家軍.恢復高考30年考試技術的變革述評[J].中國考試,2007(8).

    [26]雷新勇.大規(guī)模教育考試科學屬性之理論和實踐思考[J].教育與考試,2007(1).

    [27]陳寧.Toulmin推斷模型在考試效度論證中的應用[J].中國考試,2012(4):20.

    [28]楊志明.題庫建設之統(tǒng)計與測量分析系統(tǒng)[J].教育測量與評價, 2016(3):4.

    ECD as the Assessment Design Framework under the Paradigm of Validity Argument:An Approach to Upgrade National Educational Item Bank

    DAI Yifei

    Validity nowadays refers to the degree to which evidence support the interpretations of test scores for proposed uses of tests.Validity argument is the foundation of validation.Evidence-Centered Design(ECD),guided by educational measurement and statistics,focuses on collecting validity evidence through computer technologies and divides test design into models which identify all kinds of evidence.ECD is to achieve an evidence chain for each test.To build a scientific and valid Chinese national educational item bank,it is essential to build the way of thinking tests as a process of evidence collection.Besides,the practice of ECD of modeling different evidence sets up a successful example to design the item bank technically and scientifically.

    Validity;Validation;ECD;Item Bank

    G405

    A

    1005-8427(2016)11-0028-10

    (責任編輯:陳睿)

    戴一飛,女,博士,教育部考試中心,助理研究員(北京 100084)

    猜你喜歡
    題庫效度證據(jù)
    “勾股定理”優(yōu)題庫
    “軸對稱”優(yōu)題庫
    “軸對稱”優(yōu)題庫
    “整式的乘法與因式分解”優(yōu)題庫
    慈善募捐規(guī)制中的國家與社會:兼論《慈善法》的效度和限度
    對于家庭暴力應當如何搜集證據(jù)
    紅土地(2016年3期)2017-01-15 13:45:22
    手上的證據(jù)
    “大禹治水”有了新證據(jù)
    被看重感指數(shù)在中國大學生中的構(gòu)念效度
    心理學探新(2015年4期)2015-12-10 12:54:02
    手上的證據(jù)
    精品不卡国产一区二区三区| 亚洲精品456在线播放app| 亚洲七黄色美女视频| av卡一久久| 午夜免费激情av| 毛片女人毛片| 麻豆成人午夜福利视频| 精品欧美国产一区二区三| 最近视频中文字幕2019在线8| 九九久久精品国产亚洲av麻豆| 久久精品夜夜夜夜夜久久蜜豆| 色综合亚洲欧美另类图片| 黑人高潮一二区| 男女边吃奶边做爰视频| 最近中文字幕高清免费大全6| 热99re8久久精品国产| 国产精品一区二区免费欧美| av天堂中文字幕网| 久久婷婷人人爽人人干人人爱| 国产av不卡久久| 色av中文字幕| 国产精品嫩草影院av在线观看| 禁无遮挡网站| 国产精华一区二区三区| 最近中文字幕高清免费大全6| 一夜夜www| 我要看日韩黄色一级片| 精品久久国产蜜桃| 国产精品久久久久久亚洲av鲁大| 国产高清不卡午夜福利| av天堂中文字幕网| 日韩一本色道免费dvd| 国产精品久久久久久久电影| 国产精品1区2区在线观看.| 国产精品福利在线免费观看| 成人漫画全彩无遮挡| 最近的中文字幕免费完整| 国内精品久久久久精免费| 九九在线视频观看精品| 91麻豆精品激情在线观看国产| 天天躁日日操中文字幕| 久久精品国产鲁丝片午夜精品| 国内精品一区二区在线观看| 成人国产麻豆网| 日韩一区二区视频免费看| 大香蕉久久网| 少妇丰满av| 精品免费久久久久久久清纯| 国产亚洲欧美98| 中文资源天堂在线| 97人妻精品一区二区三区麻豆| 俄罗斯特黄特色一大片| 欧美成人精品欧美一级黄| av在线亚洲专区| av天堂在线播放| 淫秽高清视频在线观看| 成人鲁丝片一二三区免费| 中国美白少妇内射xxxbb| 人人妻,人人澡人人爽秒播| 久久久久久久午夜电影| 成人鲁丝片一二三区免费| 伦精品一区二区三区| 村上凉子中文字幕在线| 亚洲aⅴ乱码一区二区在线播放| 特大巨黑吊av在线直播| 婷婷精品国产亚洲av| 久久精品久久久久久噜噜老黄 | 国产伦一二天堂av在线观看| 日本五十路高清| 日韩强制内射视频| 免费看av在线观看网站| 国产精品一区二区三区四区免费观看 | 国产黄a三级三级三级人| 日本欧美国产在线视频| 一级毛片aaaaaa免费看小| 麻豆久久精品国产亚洲av| 免费高清视频大片| 日韩 亚洲 欧美在线| 老师上课跳d突然被开到最大视频| aaaaa片日本免费| 搡老岳熟女国产| 亚洲自拍偷在线| 亚洲av成人av| 女生性感内裤真人,穿戴方法视频| 有码 亚洲区| 亚洲精品国产成人久久av| 中文字幕熟女人妻在线| 日本免费a在线| 少妇人妻精品综合一区二区 | 天堂影院成人在线观看| 午夜福利在线观看免费完整高清在 | 国产精品,欧美在线| 男插女下体视频免费在线播放| 又爽又黄a免费视频| 亚洲中文字幕日韩| 国产黄a三级三级三级人| 久久精品夜色国产| 色综合色国产| 国产精品一区二区三区四区久久| 麻豆精品久久久久久蜜桃| 亚洲精华国产精华液的使用体验 | 乱人视频在线观看| 欧美3d第一页| 三级男女做爰猛烈吃奶摸视频| 我的女老师完整版在线观看| 亚洲人与动物交配视频| 国产午夜精品论理片| 亚洲欧美日韩无卡精品| 久久午夜福利片| 真实男女啪啪啪动态图| 亚洲精品日韩在线中文字幕 | 成年免费大片在线观看| 国产白丝娇喘喷水9色精品| 久久这里只有精品中国| 男人和女人高潮做爰伦理| 免费人成在线观看视频色| 此物有八面人人有两片| 免费人成视频x8x8入口观看| 国产高清三级在线| 日日啪夜夜撸| 欧美成人a在线观看| 精品人妻一区二区三区麻豆 | 亚洲国产精品成人综合色| 蜜桃久久精品国产亚洲av| 欧美日韩综合久久久久久| 精品乱码久久久久久99久播| 非洲黑人性xxxx精品又粗又长| 伦精品一区二区三区| 午夜a级毛片| 男插女下体视频免费在线播放| 国产精品电影一区二区三区| 欧美bdsm另类| 最后的刺客免费高清国语| 久久久久久久亚洲中文字幕| 国产精品综合久久久久久久免费| 一区二区三区四区激情视频 | 99久国产av精品国产电影| 天天躁日日操中文字幕| 免费观看人在逋| 99riav亚洲国产免费| 日本撒尿小便嘘嘘汇集6| 成人永久免费在线观看视频| 日韩精品有码人妻一区| 禁无遮挡网站| 国产伦一二天堂av在线观看| 亚洲一级一片aⅴ在线观看| 一本久久中文字幕| 一级毛片我不卡| 日日啪夜夜撸| 久久国产乱子免费精品| 欧美一区二区国产精品久久精品| 一级毛片久久久久久久久女| 噜噜噜噜噜久久久久久91| 亚洲精品国产成人久久av| 观看美女的网站| 最近在线观看免费完整版| 蜜桃久久精品国产亚洲av| 亚洲,欧美,日韩| 国内精品美女久久久久久| 久久久精品94久久精品| 国产久久久一区二区三区| 亚洲第一区二区三区不卡| 一级毛片电影观看 | 国产亚洲精品久久久久久毛片| 国产一区亚洲一区在线观看| 干丝袜人妻中文字幕| 波野结衣二区三区在线| 亚洲性夜色夜夜综合| 少妇熟女欧美另类| 伊人久久精品亚洲午夜| 丰满的人妻完整版| 亚洲国产精品成人久久小说 | 亚洲精品日韩av片在线观看| 亚洲av免费高清在线观看| 免费av观看视频| 久久精品久久久久久噜噜老黄 | 亚洲av熟女| 国产又黄又爽又无遮挡在线| 久久国产乱子免费精品| 简卡轻食公司| 婷婷精品国产亚洲av| 国产成人福利小说| 亚洲不卡免费看| 99久久久亚洲精品蜜臀av| 综合色丁香网| 最近最新中文字幕大全电影3| 国产精品综合久久久久久久免费| 日日摸夜夜添夜夜爱| 日本一本二区三区精品| 日韩人妻高清精品专区| 校园人妻丝袜中文字幕| 国产精品电影一区二区三区| 精品一区二区免费观看| 亚洲四区av| 成人永久免费在线观看视频| 国产一区亚洲一区在线观看| 亚洲人成网站在线播| 亚洲欧美精品自产自拍| 18禁在线播放成人免费| 欧美一级a爱片免费观看看| 午夜影院日韩av| 久久午夜福利片| 午夜免费男女啪啪视频观看 | 黄色欧美视频在线观看| 一级a爱片免费观看的视频| 男插女下体视频免费在线播放| 日日摸夜夜添夜夜添av毛片| 国产精品一区二区三区四区久久| 亚洲国产精品久久男人天堂| 日本与韩国留学比较| 日韩欧美精品免费久久| 国产亚洲精品av在线| www.色视频.com| 国产麻豆成人av免费视频| 三级经典国产精品| 久久精品综合一区二区三区| 国产综合懂色| 色噜噜av男人的天堂激情| 男人和女人高潮做爰伦理| 精品少妇黑人巨大在线播放 | 国产真实伦视频高清在线观看| 春色校园在线视频观看| 人妻制服诱惑在线中文字幕| 久久久久久久午夜电影| 成人美女网站在线观看视频| 草草在线视频免费看| 精品人妻熟女av久视频| 熟女电影av网| 国产黄色小视频在线观看| 亚洲人成网站高清观看| 男人舔女人下体高潮全视频| 国产真实乱freesex| 又黄又爽又免费观看的视频| av在线天堂中文字幕| 真实男女啪啪啪动态图| 久久这里只有精品中国| 亚洲成a人片在线一区二区| 你懂的网址亚洲精品在线观看 | 哪里可以看免费的av片| 在线播放国产精品三级| 男人舔奶头视频| 久久午夜福利片| 搡老熟女国产l中国老女人| 日韩三级伦理在线观看| 久久久国产成人精品二区| 亚洲第一区二区三区不卡| 最近中文字幕高清免费大全6| 免费人成在线观看视频色| 国产高清激情床上av| 久久久久性生活片| 12—13女人毛片做爰片一| 99久久无色码亚洲精品果冻| 欧美绝顶高潮抽搐喷水| 中文字幕熟女人妻在线| a级一级毛片免费在线观看| 99热网站在线观看| 亚洲av不卡在线观看| 亚洲激情五月婷婷啪啪| 亚洲国产精品成人久久小说 | 久久99热这里只有精品18| 99热全是精品| 久久热精品热| 精品一区二区三区视频在线| 你懂的网址亚洲精品在线观看 | 色综合站精品国产| 青春草视频在线免费观看| 国产伦精品一区二区三区视频9| 国产日本99.免费观看| 国产毛片a区久久久久| 22中文网久久字幕| 一卡2卡三卡四卡精品乱码亚洲| 亚洲久久久久久中文字幕| 日韩大尺度精品在线看网址| 全区人妻精品视频| av免费在线看不卡| 男人和女人高潮做爰伦理| 国产激情偷乱视频一区二区| 午夜福利高清视频| 国产精品爽爽va在线观看网站| 久久草成人影院| 小说图片视频综合网站| 久久久久久久久久黄片| 人妻少妇偷人精品九色| 免费av观看视频| 91av网一区二区| 国产成人a∨麻豆精品| 老师上课跳d突然被开到最大视频| 国产精品一区二区性色av| 淫秽高清视频在线观看| 老司机午夜福利在线观看视频| 国产精品1区2区在线观看.| 国产精品人妻久久久影院| 可以在线观看的亚洲视频| 波多野结衣巨乳人妻| 97超视频在线观看视频| 国产av一区在线观看免费| 少妇人妻一区二区三区视频| aaaaa片日本免费| 国产女主播在线喷水免费视频网站 | 少妇裸体淫交视频免费看高清| 久久久久九九精品影院| 深夜精品福利| 搡老妇女老女人老熟妇| 亚洲四区av| av卡一久久| 成人亚洲精品av一区二区| 99久久九九国产精品国产免费| 亚洲美女黄片视频| 69人妻影院| videossex国产| 国产精品永久免费网站| 亚洲av五月六月丁香网| 久久久久久伊人网av| 美女cb高潮喷水在线观看| 亚洲av中文字字幕乱码综合| www日本黄色视频网| 国产成人影院久久av| 精品久久久久久久末码| 亚洲国产欧美人成| 国产成人影院久久av| 简卡轻食公司| 乱码一卡2卡4卡精品| 在线天堂最新版资源| 日韩欧美三级三区| 久久精品国产亚洲网站| 99久久九九国产精品国产免费| 天堂动漫精品| 最近2019中文字幕mv第一页| 中文亚洲av片在线观看爽| 91久久精品国产一区二区成人| 日韩成人伦理影院| a级毛片免费高清观看在线播放| 国产成人a区在线观看| 久久99热这里只有精品18| 午夜精品国产一区二区电影 | 网址你懂的国产日韩在线| 免费大片18禁| 国产成人一区二区在线| 欧美一区二区亚洲| 内射极品少妇av片p| 我要看日韩黄色一级片| 97超碰精品成人国产| 国产精品日韩av在线免费观看| 久久久精品大字幕| 欧美精品国产亚洲| 啦啦啦观看免费观看视频高清| 97超视频在线观看视频| 黄色欧美视频在线观看| 少妇的逼好多水| 日本一本二区三区精品| 亚洲av成人av| 久久久精品大字幕| 亚洲精品粉嫩美女一区| 日日摸夜夜添夜夜添小说| 五月玫瑰六月丁香| 国产在线精品亚洲第一网站| 长腿黑丝高跟| 国产av麻豆久久久久久久| 亚洲熟妇熟女久久| 可以在线观看毛片的网站| 国产欧美日韩精品亚洲av| 精品久久久噜噜| 亚洲av免费在线观看| 一本精品99久久精品77| 久久久久久伊人网av| av黄色大香蕉| 丰满人妻一区二区三区视频av| 国产大屁股一区二区在线视频| 婷婷六月久久综合丁香| 一本精品99久久精品77| 国产精品一区二区三区四区久久| 人妻丰满熟妇av一区二区三区| 亚洲一级一片aⅴ在线观看| 国产 一区 欧美 日韩| 国产精品久久久久久精品电影| 亚洲国产精品国产精品| 高清日韩中文字幕在线| 国产aⅴ精品一区二区三区波| 99久久中文字幕三级久久日本| 国产大屁股一区二区在线视频| 美女黄网站色视频| 欧美最黄视频在线播放免费| 国产一区二区亚洲精品在线观看| 在线播放无遮挡| 乱人视频在线观看| 少妇熟女aⅴ在线视频| 成人午夜高清在线视频| 波野结衣二区三区在线| 免费观看的影片在线观看| 全区人妻精品视频| 国产淫片久久久久久久久| 成人毛片a级毛片在线播放| 成人av在线播放网站| 在线观看av片永久免费下载| 非洲黑人性xxxx精品又粗又长| 婷婷精品国产亚洲av在线| 99热这里只有是精品在线观看| 国产三级在线视频| 特大巨黑吊av在线直播| www.色视频.com| 观看免费一级毛片| 变态另类丝袜制服| av专区在线播放| 一级毛片电影观看 | 99热6这里只有精品| 91午夜精品亚洲一区二区三区| 美女 人体艺术 gogo| 亚洲激情五月婷婷啪啪| 国产单亲对白刺激| 日韩制服骚丝袜av| 精品一区二区三区av网在线观看| 久久久久久久午夜电影| 熟妇人妻久久中文字幕3abv| 毛片一级片免费看久久久久| 精品熟女少妇av免费看| 51国产日韩欧美| 99国产极品粉嫩在线观看| 久久久国产成人精品二区| 3wmmmm亚洲av在线观看| 午夜久久久久精精品| 日韩三级伦理在线观看| 国产在线男女| 日本爱情动作片www.在线观看 | 国产淫片久久久久久久久| 男女啪啪激烈高潮av片| 老司机午夜福利在线观看视频| 最新中文字幕久久久久| 午夜久久久久精精品| 长腿黑丝高跟| 日日摸夜夜添夜夜添av毛片| 丝袜美腿在线中文| 在线天堂最新版资源| 麻豆国产av国片精品| 日韩精品青青久久久久久| 夜夜夜夜夜久久久久| 欧美bdsm另类| 久久久久久久亚洲中文字幕| 亚洲无线在线观看| 欧美绝顶高潮抽搐喷水| 国模一区二区三区四区视频| 黄片wwwwww| 亚洲人成网站在线播| 国产精品一及| 精品久久久久久久人妻蜜臀av| 成人漫画全彩无遮挡| 又黄又爽又免费观看的视频| 美女cb高潮喷水在线观看| 欧美一区二区精品小视频在线| a级毛色黄片| 国产不卡一卡二| 久久久久久久久久久丰满| av免费在线看不卡| 少妇的逼水好多| 一夜夜www| 在线观看66精品国产| 99久国产av精品国产电影| 97碰自拍视频| 亚洲av电影不卡..在线观看| 99热只有精品国产| 波多野结衣巨乳人妻| 国产黄色小视频在线观看| 欧美最新免费一区二区三区| 99在线视频只有这里精品首页| 国产精品久久久久久亚洲av鲁大| 国产精品久久久久久久久免| 久久久久久伊人网av| 亚洲丝袜综合中文字幕| 嫩草影院新地址| 亚洲专区国产一区二区| 能在线免费观看的黄片| 18禁黄网站禁片免费观看直播| 又爽又黄a免费视频| 变态另类丝袜制服| 不卡视频在线观看欧美| 男人的好看免费观看在线视频| 国产高清视频在线播放一区| 麻豆av噜噜一区二区三区| 久久精品国产亚洲av香蕉五月| 内地一区二区视频在线| 日韩中字成人| 日本欧美国产在线视频| 一进一出抽搐动态| 波野结衣二区三区在线| 免费观看人在逋| 久久久久久久久久久丰满| 亚洲欧美成人综合另类久久久 | 又粗又爽又猛毛片免费看| 精品一区二区三区视频在线| av.在线天堂| 毛片女人毛片| 精品熟女少妇av免费看| 午夜老司机福利剧场| 亚洲中文字幕日韩| 日韩高清综合在线| 中文字幕av在线有码专区| 国产精品一区二区三区四区久久| 国产综合懂色| 久久久久久伊人网av| 欧洲精品卡2卡3卡4卡5卡区| 美女免费视频网站| 一级av片app| 日本与韩国留学比较| 久久99热6这里只有精品| 波多野结衣高清无吗| 亚洲人与动物交配视频| 在线观看av片永久免费下载| 久99久视频精品免费| 国产乱人视频| 亚洲成人久久爱视频| 99久久久亚洲精品蜜臀av| 最近在线观看免费完整版| 国内精品美女久久久久久| 美女cb高潮喷水在线观看| 成人特级黄色片久久久久久久| 亚洲va在线va天堂va国产| 变态另类成人亚洲欧美熟女| 丝袜美腿在线中文| 精品福利观看| 美女内射精品一级片tv| 亚洲专区国产一区二区| 99riav亚洲国产免费| 亚洲中文字幕日韩| 亚洲四区av| 一区二区三区高清视频在线| 欧美成人一区二区免费高清观看| 亚洲电影在线观看av| 成年免费大片在线观看| 日韩欧美三级三区| 国产精品99久久久久久久久| 最后的刺客免费高清国语| 国产乱人视频| 久久精品国产亚洲av天美| 国产一区二区激情短视频| 又黄又爽又免费观看的视频| 简卡轻食公司| 亚洲欧美成人综合另类久久久 | 亚洲图色成人| 一级毛片电影观看 | 99热这里只有精品一区| 男女边吃奶边做爰视频| 一个人看的www免费观看视频| 亚洲最大成人手机在线| 搡老岳熟女国产| 亚洲三级黄色毛片| 欧美在线一区亚洲| 日本免费一区二区三区高清不卡| 高清毛片免费看| 成人特级av手机在线观看| 成年版毛片免费区| 午夜激情欧美在线| 免费av毛片视频| 人人妻人人看人人澡| 在线观看午夜福利视频| 日日啪夜夜撸| 丝袜喷水一区| 日本爱情动作片www.在线观看 | 成人二区视频| 黑人高潮一二区| 亚洲欧美日韩东京热| 在线免费十八禁| 精品国产三级普通话版| 午夜视频国产福利| 一区二区三区免费毛片| 亚洲精品在线观看二区| 精品人妻一区二区三区麻豆 | 国产精品电影一区二区三区| 卡戴珊不雅视频在线播放| 天天躁夜夜躁狠狠久久av| 亚洲av电影不卡..在线观看| 久久久精品94久久精品| 欧美区成人在线视频| 女人被狂操c到高潮| 免费高清视频大片| 三级经典国产精品| 亚洲va在线va天堂va国产| 国产高清视频在线播放一区| 99热这里只有是精品在线观看| 午夜日韩欧美国产| 久久久久久久久久黄片| 亚洲国产精品成人综合色| 成人特级黄色片久久久久久久| 少妇人妻精品综合一区二区 | 18禁裸乳无遮挡免费网站照片| 插逼视频在线观看| 午夜激情福利司机影院| 少妇丰满av| 欧美一级a爱片免费观看看| 精华霜和精华液先用哪个| 老师上课跳d突然被开到最大视频| 亚洲av成人av| 欧美绝顶高潮抽搐喷水| 亚洲欧美清纯卡通| 亚洲一区二区三区色噜噜| a级毛色黄片| 菩萨蛮人人尽说江南好唐韦庄 | 国产伦精品一区二区三区视频9| 最近最新中文字幕大全电影3| 综合色av麻豆| 日韩精品中文字幕看吧| 天天躁日日操中文字幕| 国内精品美女久久久久久| 久久久久性生活片| 成人三级黄色视频| 欧美高清性xxxxhd video| 变态另类丝袜制服| 天天一区二区日本电影三级| 国产黄色小视频在线观看| 尾随美女入室| 一级毛片我不卡| 在线天堂最新版资源| 在线看三级毛片| 色综合亚洲欧美另类图片| 天堂av国产一区二区熟女人妻| 69人妻影院| 成年女人看的毛片在线观看|