• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    自動作文評閱系統(tǒng)評分效度驗證及教學(xué)啟示①

    2020-02-02 06:14:52張?zhí)僖?/span>
    語言與文化論壇 2020年1期
    關(guān)鍵詞:人機效度機器

    ◎王 建 張?zhí)僖?/p>

    1 引 言

    寫作是英語學(xué)習(xí)的重要組成部分。但寫作評估費時費力,尤其在中國EFL(English as a Foreign Language)教學(xué)環(huán)境下,大學(xué)公共外語教師一學(xué)期所教學(xué)生數(shù)量可多達(dá)數(shù)百名。限于時間和精力,教師們不得不減少學(xué)生的寫作練習(xí),以減輕作文評閱的繁重工作,結(jié)果導(dǎo)致學(xué)生寫作訓(xùn)練機會減少,獲得及時和詳細(xì)反饋的機會減少,學(xué)生的英語寫作水平不能得到實質(zhì)性的提高。近年來,為解決這一棘手的問題,教育技術(shù)開發(fā)商基于文本分類技術(shù)、自然語言處理、人工智能和潛在語義分析的,在自動作文評分(Automated Essay Scoring, 如 PEGTM,Intelligent Essay Assessor,IntelliMetric,Electronic Essay Rater等)引擎發(fā)展的基礎(chǔ)上,研發(fā)出作文自動評價(Automated Writing Evaluation,簡稱AWE)系統(tǒng)(Deane,2013)。國外著名的AWE系統(tǒng)如Criterion, MY Access! 及WriteToLearn已被廣泛運用于寫作教學(xué)中,不但增加了學(xué)生練習(xí)的機會,而且還在內(nèi)容、組織結(jié)構(gòu)、詞匯和語法等方面提供及時、詳細(xì)的反饋和指導(dǎo),從而將系統(tǒng)的功用從純粹的評分引擎轉(zhuǎn)變?yōu)橛嬎銠C輔助語言教學(xué)工具(Ranalli,2018;Sarré et al.,2019)。

    中國AWE系統(tǒng)的研發(fā)相對較晚,但是近十年來,商業(yè)性的系統(tǒng)如批改網(wǎng)、iWrite、冰果智能評閱系統(tǒng)等已廣泛運用在中國大學(xué)英語寫作教學(xué)中。如開發(fā)商所言,機器評閱在及時性、高效性和客觀性等方面具有優(yōu)勢,學(xué)生可利用系統(tǒng)提供的“支架性(scaffolding)”反饋激活相關(guān)的英語知識,從而促進學(xué)生二語的發(fā)展,教師亦可在最近發(fā)展區(qū)(Zone of Proximal Development)理論指導(dǎo)下,引導(dǎo)學(xué)生進行同伴反饋。(張珊珊、徐錦芬,2019)但值得一提的是,在機器評分的有效性和真實性仍然撲朔迷離的情況下,一些教師完全依賴系統(tǒng)對學(xué)生的書面產(chǎn)品進行評分,并將機器分?jǐn)?shù)直接納入形成性評估中,這極有可能導(dǎo)致公平性問題。此外,為了獲取高的分?jǐn)?shù),學(xué)生傾向于迎合機器的評價標(biāo)準(zhǔn)欺騙系統(tǒng),然而這些標(biāo)準(zhǔn)可能與人工評閱者的標(biāo)準(zhǔn)大相徑庭,或與寫作構(gòu)念(writing construct)毫無關(guān)聯(lián)。(Powers et al. 2002)

    盡管國內(nèi)開發(fā)者高度評價系統(tǒng)的可靠性,聲稱自動寫作評閱系統(tǒng)能夠?qū)崿F(xiàn)語言、內(nèi)容、篇章結(jié)構(gòu)及技術(shù)規(guī)范四個維度的智能評閱,但這些系統(tǒng)打出的分?jǐn)?shù)是否真實有效,機器分?jǐn)?shù)與人工分?jǐn)?shù)是否高度一致,尚未廣泛引起研究者及英語教師的注意。因此,本研究對國內(nèi)某寫作評閱系統(tǒng)的評分有效性進行初步研究,并探討相關(guān)的教學(xué)啟示。

    2 相關(guān)研究

    2.1 AWE效度研究框架

    效度是心理測量學(xué)中的一個廣義術(shù)語。效度最早反映的是測試所要測量的構(gòu)念是否被測到一定的程度(Kelly 1927),后來該術(shù)語指測量工具或手段的有效性,即能夠準(zhǔn)確測出所需要測量的事物的程度。目前國內(nèi)有關(guān)AWE系統(tǒng)的研究更多關(guān)注的是自動系統(tǒng)對課堂教學(xué)輔助作用,如自動反饋對提高學(xué)生寫作水平的作用、學(xué)生利用系統(tǒng)反饋的情況或?qū)W生對系統(tǒng)使用的認(rèn)知,鮮有研究者從事AWE的效度研究,這是國內(nèi)研究不足之處,因為在投入使用任何工具之前,使用者一般都希望知悉該工具的可靠性及有效性。相比,國外對AWE系統(tǒng)的效度研究較多,涉及的范圍也較全面。影響較大的是Kane構(gòu)建的自動評分系統(tǒng)效度論證(validity argument)框架,包括四個維度:評分(scoring)、泛化(generalization)、外推(extrapolation) 和 影 響(implication)。(Kane,2013;Elliot and Williamson,2013)效度論證的具體方面較廣,從人機評分的一致性、機器評分的穩(wěn)定性、機器分?jǐn)?shù)帶來的影響到機器評分帶來的后撥效應(yīng)(wash-back effect)不等,詳細(xì)的論證框架見表1。

    表1 AWE系統(tǒng)效度論證框架

    表1中的效度論證框架較為全面地概括了國外自動作文評分系統(tǒng)效度研究領(lǐng)域的主要研究方向,總體來說,系統(tǒng)的評分效度受到研究人員更多的關(guān)注。

    2.2 國內(nèi)外AWE評分效度研究

    有關(guān)AWE的評分效度研究始于20世紀(jì)末,至今依舊受到國外研究人員廣泛關(guān)注。國外研究者對于該領(lǐng)域的研究大多集中討論人機評分是否相匹配。例如,Deane(2013)報告稱,AWE系統(tǒng)注重文章的結(jié)構(gòu)、語言結(jié)構(gòu)等淺層特征,鮮有提供關(guān)于文章論證或修辭有效性的直接證據(jù),這與人工評閱者差異很大。在現(xiàn)有文獻中,研究者檢驗AWE評分有效性最直接的方式就是比較自動評分和人工評分是否一致,且普遍采用量化指標(biāo),如相鄰吻合一致率(exact-plus-adjacent agreement rate)以及皮爾遜相關(guān)系數(shù)r。不同于國內(nèi)寫作考試(如全國大學(xué)英語四、六級考試),國外寫作考試(如雅思、托??荚嚕懽鞣?jǐn)?shù)一般低于10分,人機評分相差1分則相差一個等級,因此相鄰吻合一致率主要計算系統(tǒng)評分和人工評分的分?jǐn)?shù)差小于等于1分的文章比例。皮爾遜相關(guān)系數(shù)用于統(tǒng)計人機評分的相關(guān)程度,系數(shù)越大說明兩者的分?jǐn)?shù)越趨向一致。由于分制的原因,國外研究報道的相鄰吻合一致率和相關(guān)系數(shù)普遍較高,如有研究報道IntelliMetric的相鄰吻合一致率高達(dá)97%,相關(guān)系數(shù)為0.83。(Rudner et al.,2006)

    盡管國外研究大多報道AWE系統(tǒng)效度、信度均較高,但由于多數(shù)結(jié)果由開發(fā)者提供,鮮有獨立的學(xué)者給出,因此結(jié)果的真實性不得而知。國內(nèi)某系統(tǒng)開發(fā)者也驗證了其開發(fā)的AWE系統(tǒng)的評分效度,比較了1456篇15分制作文的機器分和人工分的結(jié)果,發(fā)現(xiàn)92.03%的作文的分?jǐn)?shù)差在3分以內(nèi),換言之,其相鄰吻合一致性在90%以上。但這一結(jié)果亦是由開發(fā)者提供,真實情況如何,有待獨立研究的進一步證實。

    國內(nèi)大型考試中作文模塊的評閱工作仍由人工評閱者完成,因此大多數(shù)研究者對系統(tǒng)的評分效度關(guān)注不多,更多探討系統(tǒng)反饋對提高學(xué)生寫作水平的作用。國內(nèi)文獻中只有為數(shù)不多的獨立研究人員進行了此領(lǐng)域的探索。萬鵬杰(2005)對某AWE系統(tǒng)的研究結(jié)果顯示人機間的相關(guān)系數(shù)為0.324,遠(yuǎn)遠(yuǎn)低于開發(fā)者提供的系數(shù)。何旭良(2013)對句酷批改網(wǎng)的評分效度進行了研究,結(jié)果顯示系統(tǒng)分?jǐn)?shù)顯著高于人工分?jǐn)?shù)。另外值得一提的是,兩個研究的樣本均太小,前者為85篇文章,后者僅為30篇,研究結(jié)果的可靠性難以保證。此外,隨著自然語言處理等技術(shù)日積月累地發(fā)展,AWE系統(tǒng)的評分效度也有可能隨之提高,萬鵬杰及何旭良的研究可能會低估機器的能力。而且兩項研究都沒有揭示人機評分差異的分布情況及相鄰吻合一致性,因而在研究廣度和深度上存在不足。李艷玲、田夏春(2018)以“國際人才英語考試”的 645 篇實考作文為研究樣本對 iWrite 2.0的評分進行了研究,結(jié)果顯示皮爾遜相關(guān)系數(shù)(五分打分公式人機分?jǐn)?shù)r=0.566)、克隆巴赫系數(shù)(Cronbach’s Alpha=0.721)、完全吻合率(38.45%)、完全及相鄰吻合率(97.98%)和卡帕系數(shù)(0.3518)都較高,據(jù)此得出結(jié)論iWrite 2.0評分較為理想。然而,白麗芳、王建(2018)對某作文評分系統(tǒng)的評分有效性進行了詳細(xì)研究,除了收集人機相關(guān)系數(shù)、完全及相鄰吻合一致性,還使用了最大分?jǐn)?shù)差,指出系統(tǒng)無法可靠地評閱大學(xué)英語考試作文,容易誤判人工高分作文。為解釋人機評分差異成因,該研究還收集了研究語料在詞匯、句法、篇章及錯誤等方面的量化特征并分別對人工、機器分?jǐn)?shù)建立回歸模型,結(jié)果表明系統(tǒng)評分效度低可能是因其內(nèi)部缺陷所致,機器評分主要依據(jù)淺層文本特征,不能像人工評閱那樣分析深層文本特征,機器無法真正閱讀、欣賞和判斷文章,并且在分析深層句型結(jié)構(gòu)或詞匯搭配方面的能力不足。

    國內(nèi)AWE系統(tǒng)開發(fā)者在不同場合多次提到系統(tǒng)在英語作文評閱方面十分可靠,因此大部分高校都將此類系統(tǒng)融入寫作教學(xué)中。但是,一個不容忽視的問題是:這些自動系統(tǒng)打出的分?jǐn)?shù)與人工評閱者給出的分?jǐn)?shù)是否真的高度一致?現(xiàn)有的研究結(jié)果并不一致。因此本研究將對國內(nèi)某AWE系統(tǒng)的評分效度進行驗證,以豐富該領(lǐng)域的研究,并探討研究結(jié)果對大學(xué)英語寫作教學(xué)的啟示。

    3 研究設(shè)計

    3.1 研究問題

    本文旨在回答:

    (1)作文機器評分與人工評分是否一致;

    (2)AWE系統(tǒng)是否會誤判特定類型的作文。

    3.2 研究樣本

    本研究通過分層取樣的方法,從“中國學(xué)習(xí)者英語語料庫(Chinese Learner English Corpus)”中抽取150篇大學(xué)英語四級作文作為研究樣本,所有作文均有人工原始分,分?jǐn)?shù)從6分至15分不等。因語料庫中1到5分作文量較少,本研究不予抽取,選取的各分?jǐn)?shù)段的作文數(shù)量比例與整個語料庫相當(dāng)(表2)。抽取四級作文為研究樣本的另一個原因是,大學(xué)英語四級考試為高風(fēng)險考試,人工評閱者在閱卷前須詳細(xì)解讀評分標(biāo)準(zhǔn)并接受打分訓(xùn)練,評分過程會受到監(jiān)督,因此人工分?jǐn)?shù)相對客觀、權(quán)威。四級作文評分標(biāo)準(zhǔn)將考生作文劃分為5個檔次:2分檔、5分檔、8分檔、11分檔、14分檔,每檔之間相差三分。

    表2 四級樣本作文各分?jǐn)?shù)段分布

    3.3 數(shù)據(jù)收集及分析

    將從語料庫中抽取的150篇文章按序排列(4001至4150),并提交系統(tǒng)進行自動打分。目前該AWE系統(tǒng)的打分公式可人為選擇,為充分保證人機評分的可比性,本研究選擇四級打分公式(即滿分為15分)作為該系統(tǒng)的評分依據(jù)。然后將機器打出的分?jǐn)?shù)輸入excel表格,利用excel及SPSS18.0計算三大指標(biāo):最大分?jǐn)?shù)差指人機分?jǐn)?shù)差絕對值的最大值;相鄰吻合一致率指人機評分差絕對值小于等于3的文章數(shù)量與文章總量之比(四級作文每個檔次相差三分);皮爾遜相關(guān)系數(shù)檢驗人機評分的相關(guān)性。前者值越大,機器評分效度越低;后兩者值越高,機器評分效度越高。有關(guān)人工、機器評分的描述性統(tǒng)計數(shù)據(jù)也由SPSS18.0算出,顯著性設(shè)為p<.05。

    4 結(jié)果和討論

    4.1 作文人機評分的一致性程度

    表3顯示,該自動評閱系統(tǒng)給出的最高分和最低分均低于人工分。配對樣本T檢驗表明機器分顯著低于人工分(p=.000<.01)。150篇樣本作文的機器平均分為8.049,顯著低于人工平均分8.77分(p=.000<.01)。

    表3 人機平均分比較 (n=150)

    表4列出了人機分?jǐn)?shù)差及相鄰吻合一致率的分布。所有作文樣本中,人機分?jǐn)?shù)差為零的作文數(shù)量只有3篇,即完全一致率僅為2%,人機分?jǐn)?shù)完全匹配度(exact agreement)較低;117篇文章的人機分?jǐn)?shù)差小于等于3分,即人機評分相鄰吻合一致率為78%。國外研究指出自動評分系統(tǒng)與人工評閱間的相鄰吻合一致性基本上要達(dá)到75%~80%這個水平(Burstein et al.,2004),按照這一標(biāo)準(zhǔn),機器評分滿足了這一要求。其余33篇的人機分?jǐn)?shù)差均超過3分,這些文章極有可能被機器誤判。國外大部分研究結(jié)果的相鄰吻合一致率較高,甚至高達(dá)90%,完全一致性在48%到58%甚至達(dá)到80%(Ramineni and Williamson,2013),而本研究得出的結(jié)果偏低,究其原因,可能是由于樣本量或者作文分?jǐn)?shù)檔存在一定差異,國外研究的樣本量更大,而且作文通常為1分一檔,而四級作文為3分一檔。研究表明,分制的不同可能會導(dǎo)致這一差異,分制越低,相鄰吻合一致性往往會越高。(Ramineni and Williamson,2013)比如以3分制進行評分時,若人工評閱者給出的分?jǐn)?shù)為2分,機器給的1分、2分和3分都與人工分相鄰吻合,所以人機間理論上可以達(dá)到100%一致。

    此外,本研究與國內(nèi)多數(shù)AWE系統(tǒng)的人機一致性研究結(jié)果也存在很大的差異,這有可能是由于樣本的差異以及所研究的系統(tǒng)之間存在的不同導(dǎo)致的。比如目前各個系統(tǒng)具體的評分過程、評分標(biāo)準(zhǔn)并不透明,也未見詳細(xì)說明,各個系統(tǒng)是否采用同樣的評分方式不得而知,這些方面需要得到進一步的澄清。

    表4 人機分?jǐn)?shù)差及相鄰吻合一致率分布

    人機分?jǐn)?shù)差異較大的是編號為4048、4110和4127三篇人工高分作文,分?jǐn)?shù)差分別為6.4分、7分和4.6分。值得一提的是,四級作文的滿分為15分,最大分?jǐn)?shù)差如此之大,可見該自動評閱系統(tǒng)評分可信度需要引起使用者的注意。

    本研究利用SPSS18.0對人機分?jǐn)?shù)進行了相關(guān)分析,結(jié)果顯示人機分?jǐn)?shù)不顯著相關(guān),相關(guān)系數(shù)僅為0.122(p=.136>.05,見表5),而國外相關(guān)領(lǐng)域研究通常將相關(guān)系數(shù)設(shè)為0.7(Ramineni and Williamson,2013),本研究結(jié)果遠(yuǎn)未達(dá)到這一起點值。研究結(jié)果的差異同樣可能受分制的影響,也有研究表明不同分制的情況下,皮爾遜相關(guān)系數(shù)存在差異,分制越低,r值越高。(Shermis,2014)然而,分制與系數(shù)的關(guān)系尚不明確,需要更多的研究證明。

    表5 人機分?jǐn)?shù)相關(guān)性

    總的來說,該AWE系統(tǒng)的評分效度不盡如人意。描述性統(tǒng)計數(shù)據(jù)及三大效度指標(biāo)都表明人機評分之間存在巨大差異,這就警示AWE系統(tǒng)開發(fā)者應(yīng)著力提高機器的評分效度,同時教師應(yīng)謹(jǐn)慎使用機器分?jǐn)?shù)作為學(xué)業(yè)評估的一部分。

    4.2 人機評分差異較大的作文類型及其成因

    為進一步分析分?jǐn)?shù)差的分布情況,本研究按照樣本作文的人工分?jǐn)?shù)將作文分為低(1~6分)、中(7~9分)、高(10~15分)三類,統(tǒng)計分析顯示三類作文平均分存在顯著差異(p<.01),然后分別比較其相鄰吻合一致性和平均分?jǐn)?shù)差(見表6)。結(jié)果表明,人機分?jǐn)?shù)相鄰吻合一致性在6~8分?jǐn)?shù)段較高,為92.85%;在9~11分?jǐn)?shù)段為中等,為81.37%;12~15分?jǐn)?shù)段較低,僅為36.95%。人機分?jǐn)?shù)差的均值也隨分?jǐn)?shù)段的上升而上升,單因素方差(One-way ANOVA)分析顯示,三類作文的分?jǐn)?shù)差存在顯著差異(p=.000)。事后多重比較分析(Post hoc Turkey’s test)表明:低、中檔作文的分?jǐn)?shù)差不存在顯著差異(p>.05),但均與高分檔作文存在顯著差異(p<.05)。不同等級作文平均分?jǐn)?shù)差分布情況表明,該作文評閱系統(tǒng)有可能誤判了人工判定的高分作文。

    表6 作文各分?jǐn)?shù)段評分的一致性

    國內(nèi)外文獻得出過類似的結(jié)論。如有研究比較了E-rater(以6分制評分)和人工評分的一致性,發(fā)現(xiàn)在5分和6分兩個高分檔自動評分與人工評分的差異最大。(Burstein et al.,1998)也有研究指出Criterion(以6分制評分)打出的低分比較可靠,打出的高分問題較大,并不能反映學(xué)生寫作的真實水平。(Li et al.,2014)同樣的現(xiàn)象在葛詩利、陳瀟瀟(2007)的研究中也有提及。

    AWE系統(tǒng)能夠較為準(zhǔn)確評價人工低分作文,可能主要是因為這類文章的語言和內(nèi)容質(zhì)量都較差。機器可以基于淺層的可量化的特征或語言錯誤給出客觀的分?jǐn)?shù)。在評價低質(zhì)量的文章時,評分過程可以依靠可量化的特征或錯誤,但是在評分高質(zhì)量的文章時,必須考慮文章的內(nèi)容。由于機器無法理解一篇文章,它無法對文章的邏輯和思想做出任何判斷,只能依靠一些可量化的特征來評估文章質(zhì)量,而這些特征可能與一篇好文章毫無關(guān)聯(lián)。(Condon,2013)因此這些量化特征可能不利于機器評分,進而導(dǎo)致對人工高分作文的誤判。本研究語料來自大學(xué)英語四級考試作文,大學(xué)四級考試為高風(fēng)險考試,在構(gòu)建篇章時考生通常會選擇簡單的單詞或常見的表達(dá)方式,少使用低頻詞或表達(dá)以避免出現(xiàn)錯誤,而這類文章有雖在詞匯的復(fù)雜性方面較低,但文章的結(jié)構(gòu)、邏輯、思想表達(dá)、語言的流暢度等方面可能做得很到位,人工評閱者在評閱作文時考慮的因素可能更為全面,不僅看詞匯等淺層指標(biāo),還要考慮邏輯、內(nèi)容等,但這些都是機器無法欣賞的,故有可能誤判此類文章。限于文章篇幅,本研究并未對文章的量化特征進行統(tǒng)計分析,未來的研究可以利用語料分析軟件收集樣本作文在詞匯、句法、篇章、錯誤等方面的量化特征,深入分析文本量化特征對人工評分及機器評分的影響及解釋二者存在的差異。

    4.3 研究結(jié)果對于大學(xué)英語寫作教學(xué)的啟示

    不可否認(rèn)的是,自動評閱系統(tǒng)可以為廣大師生帶來諸多便利。教師不用將大量時間用于評閱學(xué)生習(xí)作,而用于精心備課。AWE系統(tǒng)打破了時空的限制,學(xué)生可以獲得及時的寫作反饋,學(xué)習(xí)自主性也可以提高。但是,本文通過定量分析的方法發(fā)現(xiàn)人機評分差異較大:機器分顯著低于人工分,所有定量指標(biāo)都不盡如人意;在無法理解文章內(nèi)容的情況下,機器極有可能誤判人工高分作文。這與之前白麗芳、王建(2018)報道的系統(tǒng)評分效度存在的問題如出一轍。究其原因,目前用于機器評分的技術(shù)無法完全欣賞文章的邏輯、結(jié)構(gòu)及修辭特征等方面。此外,目前機器仍無法與人工評閱者相比,人機評分所關(guān)注的方面可能存在差異,且評閱的方式也不盡相同,但存在何種差異需要更多的研究證明。因此,大學(xué)英語教師在使用機器分?jǐn)?shù)時需要考慮到系統(tǒng)目前仍存在的種種缺陷。

    必須指出的是,多數(shù)大學(xué)英語教師限于寫作評估的壓力將平時作文僅交由機器評閱,將機器分納入學(xué)生最終的成績中,但此時學(xué)生可能會質(zhì)疑:機器分?jǐn)?shù)是否真的可靠?僅利用自動反饋(缺乏教師反饋)是否真的有利于寫作水平的提升? 若學(xué)生作文僅由機器評閱,學(xué)生的寫作熱情無疑會受到影響。眾所周知,目前機器還無法從真正意義上理解人的思維,還無法真正實現(xiàn)人機互動。最重要的是,目前自動系統(tǒng)評分的效度尚不明確,也并未引起廣泛關(guān)注。如果機器分被納入期末成績中,有可能導(dǎo)致公平性的問題,因為機器可能會低估學(xué)生的寫作能力,甚至誤判高質(zhì)量的作文。在英語寫作教學(xué)中,各教師應(yīng)合理運用機器評閱,可以采用人機結(jié)合的評閱方式,吸收二者評閱作文的優(yōu)勢。比如,限于技術(shù)的限制,目前機器評閱可以僅限于拼寫、標(biāo)點、大小寫等技術(shù)規(guī)范方面,識別基本的語法錯誤(如主謂一致、冠詞使用等);教師應(yīng)將寫作視為真正意義上的互動交流,需要閱讀學(xué)生寫作的內(nèi)容、結(jié)構(gòu)、搭配、修辭等機器不太擅長的方面,給予學(xué)生寫作建設(shè)性的反饋,給出適當(dāng)合理的分?jǐn)?shù);教師還可以利用寫作平臺分配同儕協(xié)作的寫作任務(wù),相互給予深層次的交流與反饋,提高學(xué)生的寫作積極性及寫作興趣。

    總之,大學(xué)英語教師應(yīng)順應(yīng)時代潮流突破傳統(tǒng)的教學(xué)模式,但又不可完全依賴現(xiàn)代教育技術(shù),不可完全忽視傳統(tǒng)寫作教學(xué)的作用,應(yīng)在二者間尋求平衡。

    5 結(jié) 語

    本研究報道了國內(nèi)某AWE系統(tǒng)的評分效度,結(jié)果表明該系統(tǒng)的評分效度相對較低,可能需要開發(fā)者進一步驗證并不斷提高。我們建議教育技術(shù)人員應(yīng)與大學(xué)英語教師通力合作,進一步完善系統(tǒng)的評分機制,因為由于目前技術(shù)等方面的局限,教師還無法完全依賴機器。我們認(rèn)為該領(lǐng)域需要引起國內(nèi)更多獨立研究者和使用者的注意。

    本研究只是初步探討了該系統(tǒng)的評分效度,還存在一些不可避免的缺陷。首先,較之國外同類研究,本研究樣本數(shù)量相對較??;其次,未探討人機在不同文本特征方面(詞匯、句法、篇章等)對文章的評閱是否存在差異,因此對人機評分差異的解釋深度不夠;最后,未分析人機分?jǐn)?shù)差大于三分的文章的特征,也未進一步研究可能被機器誤判的人工高分作文在詞匯、句法、篇章、錯誤等方面的特征。這些問題是未來AWE系統(tǒng)開發(fā)者和研究人員可以關(guān)注和解決的方向。但值得肯定的是,本研究對于寫作教學(xué)融入AWE系統(tǒng)以及將機器分?jǐn)?shù)納入學(xué)生最終成績起到了一定的警示作用,對大學(xué)英語寫作教學(xué)有一定的參考價值。

    猜你喜歡
    人機效度機器
    人機“翻譯員”
    機器狗
    機器狗
    從內(nèi)到外,看懂無人機
    南都周刊(2021年3期)2021-04-22 16:43:49
    慈善募捐規(guī)制中的國家與社會:兼論《慈善法》的效度和限度
    未來機器城
    電影(2018年8期)2018-09-21 08:00:06
    “人機大戰(zhàn)”人類智慧遭遇強敵
    海外星云(2016年7期)2016-12-01 04:17:50
    未來深空探測中的人機聯(lián)合探測
    太空探索(2016年5期)2016-07-12 15:17:58
    被看重感指數(shù)在中國大學(xué)生中的構(gòu)念效度
    外語形成性評估的效度驗證框架
    欧美精品一区二区免费开放| 18在线观看网站| 91国产中文字幕| 又大又黄又爽视频免费| 亚洲av福利一区| 成人影院久久| 亚洲国产最新在线播放| 女人精品久久久久毛片| 国产人伦9x9x在线观看| 丝袜美足系列| 欧美日韩精品网址| 国产野战对白在线观看| 久久精品熟女亚洲av麻豆精品| 高清视频免费观看一区二区| 中文字幕人妻丝袜制服| 色精品久久人妻99蜜桃| 日韩大片免费观看网站| 黑人欧美特级aaaaaa片| 亚洲av电影在线观看一区二区三区| 欧美日韩视频高清一区二区三区二| 国产激情久久老熟女| 亚洲精品av麻豆狂野| 中文字幕精品免费在线观看视频| 久久久久久人人人人人| 美女午夜性视频免费| 日韩,欧美,国产一区二区三区| 国产有黄有色有爽视频| 欧美日韩一级在线毛片| 激情五月婷婷亚洲| 国产精品熟女久久久久浪| 美女视频免费永久观看网站| 一区福利在线观看| 国产熟女欧美一区二区| 欧美日韩福利视频一区二区| 两个人看的免费小视频| 老司机影院成人| 又黄又粗又硬又大视频| 中文字幕av电影在线播放| 少妇精品久久久久久久| 另类亚洲欧美激情| 亚洲国产精品999| 精品少妇黑人巨大在线播放| 高清视频免费观看一区二区| 99re6热这里在线精品视频| 国产成人午夜福利电影在线观看| 热99久久久久精品小说推荐| 国产午夜精品一二区理论片| 日本欧美国产在线视频| 欧美日韩视频高清一区二区三区二| 狂野欧美激情性xxxx| 在线观看免费午夜福利视频| 亚洲av国产av综合av卡| 国产免费福利视频在线观看| 波野结衣二区三区在线| 成年av动漫网址| 亚洲精品日本国产第一区| 日韩免费高清中文字幕av| av国产久精品久网站免费入址| 国产欧美日韩综合在线一区二区| 伦理电影免费视频| 国产精品久久久久成人av| 另类精品久久| 国产精品久久久人人做人人爽| 亚洲av日韩精品久久久久久密 | bbb黄色大片| 国产成人免费无遮挡视频| 黄色毛片三级朝国网站| 亚洲欧美一区二区三区久久| 亚洲综合精品二区| 亚洲综合色网址| 丝瓜视频免费看黄片| 欧美人与性动交α欧美软件| 亚洲一区二区三区欧美精品| 国产又色又爽无遮挡免| 亚洲精品国产av蜜桃| 亚洲综合精品二区| 久久97久久精品| 制服人妻中文乱码| 哪个播放器可以免费观看大片| 国产探花极品一区二区| 1024香蕉在线观看| 婷婷色综合www| 久久免费观看电影| 秋霞在线观看毛片| 久久国产精品大桥未久av| 免费人妻精品一区二区三区视频| 韩国av在线不卡| 国产精品偷伦视频观看了| 亚洲一码二码三码区别大吗| 男女无遮挡免费网站观看| 亚洲精品成人av观看孕妇| 国产精品免费大片| 成人黄色视频免费在线看| 国产成人精品久久久久久| 亚洲男人天堂网一区| 人人妻,人人澡人人爽秒播 | 男人操女人黄网站| av有码第一页| 国产成人精品久久二区二区91 | 99久久99久久久精品蜜桃| 国产片特级美女逼逼视频| 蜜桃国产av成人99| 麻豆乱淫一区二区| 国产午夜精品一二区理论片| 高清黄色对白视频在线免费看| 日日撸夜夜添| 亚洲精品av麻豆狂野| 亚洲国产最新在线播放| 高清在线视频一区二区三区| 亚洲在久久综合| 大话2 男鬼变身卡| 国产人伦9x9x在线观看| av女优亚洲男人天堂| 男人舔女人的私密视频| 欧美激情高清一区二区三区 | 久久韩国三级中文字幕| 亚洲精品国产av蜜桃| 免费看不卡的av| 午夜福利网站1000一区二区三区| 中国三级夫妇交换| 嫩草影院入口| 国产日韩欧美在线精品| 欧美日韩亚洲综合一区二区三区_| 99国产综合亚洲精品| 国产精品秋霞免费鲁丝片| 青春草亚洲视频在线观看| 国产精品熟女久久久久浪| 国产精品国产三级国产专区5o| 免费看不卡的av| 大话2 男鬼变身卡| 久久久精品国产亚洲av高清涩受| 老司机影院成人| 18禁动态无遮挡网站| 国产免费现黄频在线看| av免费观看日本| 免费久久久久久久精品成人欧美视频| 亚洲精品国产区一区二| 男女无遮挡免费网站观看| 人体艺术视频欧美日本| 国产精品三级大全| 一区二区av电影网| 亚洲情色 制服丝袜| 国语对白做爰xxxⅹ性视频网站| 亚洲欧美精品综合一区二区三区| 欧美人与善性xxx| 哪个播放器可以免费观看大片| 少妇猛男粗大的猛烈进出视频| 性色av一级| 精品人妻熟女毛片av久久网站| 制服诱惑二区| av国产久精品久网站免费入址| 丝袜在线中文字幕| 午夜福利在线免费观看网站| 自拍欧美九色日韩亚洲蝌蚪91| 嫩草影院入口| 成人午夜精彩视频在线观看| 伊人亚洲综合成人网| 在线观看免费日韩欧美大片| 搡老乐熟女国产| 好男人视频免费观看在线| www.自偷自拍.com| 伦理电影大哥的女人| 亚洲国产av影院在线观看| 中文精品一卡2卡3卡4更新| 91精品国产国语对白视频| av线在线观看网站| 大香蕉久久网| 女人精品久久久久毛片| 天天躁日日躁夜夜躁夜夜| 侵犯人妻中文字幕一二三四区| 久久99精品国语久久久| 国产精品免费大片| 狠狠精品人妻久久久久久综合| 欧美在线黄色| 午夜av观看不卡| 熟女少妇亚洲综合色aaa.| 天堂8中文在线网| 狠狠精品人妻久久久久久综合| 亚洲欧美成人精品一区二区| 制服丝袜香蕉在线| 国产成人av激情在线播放| 一级黄片播放器| 国产毛片在线视频| 日韩av在线免费看完整版不卡| 美女主播在线视频| 在线 av 中文字幕| 97在线人人人人妻| 亚洲av日韩精品久久久久久密 | 电影成人av| 日韩大片免费观看网站| 亚洲三区欧美一区| www.av在线官网国产| 亚洲自偷自拍图片 自拍| 午夜免费鲁丝| 18禁观看日本| 视频在线观看一区二区三区| 亚洲欧洲精品一区二区精品久久久 | 日韩制服丝袜自拍偷拍| 人人妻人人澡人人爽人人夜夜| 国产成人欧美在线观看 | 久久99一区二区三区| 国产亚洲最大av| 国产片特级美女逼逼视频| 国产伦理片在线播放av一区| 国产精品一国产av| 国产日韩一区二区三区精品不卡| 国产亚洲精品第一综合不卡| 在线观看一区二区三区激情| 另类亚洲欧美激情| 日日撸夜夜添| 欧美国产精品va在线观看不卡| 国产乱人偷精品视频| 人人妻人人澡人人爽人人夜夜| 视频在线观看一区二区三区| 777米奇影视久久| 亚洲欧美激情在线| 熟女av电影| 久久久亚洲精品成人影院| 夫妻午夜视频| 热re99久久国产66热| 99久久人妻综合| 成人毛片60女人毛片免费| 99热国产这里只有精品6| 国产精品久久久久成人av| 女性被躁到高潮视频| 国产精品二区激情视频| 亚洲国产av影院在线观看| 久久 成人 亚洲| 日韩电影二区| 青草久久国产| 亚洲一区中文字幕在线| 另类亚洲欧美激情| 99精国产麻豆久久婷婷| 亚洲精品国产一区二区精华液| 国产精品久久久久久久久免| 在线天堂最新版资源| 亚洲七黄色美女视频| 亚洲精品视频女| 18禁动态无遮挡网站| 黄网站色视频无遮挡免费观看| 悠悠久久av| tube8黄色片| 十八禁高潮呻吟视频| 在线观看国产h片| 男女高潮啪啪啪动态图| 久久久久人妻精品一区果冻| 久久人人爽人人片av| 在线免费观看不下载黄p国产| 国产亚洲欧美精品永久| 国产精品 欧美亚洲| 多毛熟女@视频| 丝袜在线中文字幕| 另类亚洲欧美激情| 欧美日韩一区二区视频在线观看视频在线| 色综合欧美亚洲国产小说| 9色porny在线观看| 精品卡一卡二卡四卡免费| 欧美国产精品va在线观看不卡| 国产爽快片一区二区三区| 丁香六月天网| av视频免费观看在线观看| 亚洲av国产av综合av卡| 七月丁香在线播放| 两个人看的免费小视频| 热re99久久精品国产66热6| 搡老岳熟女国产| 午夜福利免费观看在线| 久久天躁狠狠躁夜夜2o2o | 午夜日本视频在线| 午夜久久久在线观看| 97人妻天天添夜夜摸| 在线观看免费视频网站a站| 久久性视频一级片| 国语对白做爰xxxⅹ性视频网站| 亚洲在久久综合| 七月丁香在线播放| 观看美女的网站| 在线观看人妻少妇| 国产免费福利视频在线观看| 精品卡一卡二卡四卡免费| 欧美av亚洲av综合av国产av | 中文字幕最新亚洲高清| 国产色婷婷99| 国产一区二区三区av在线| 99久国产av精品国产电影| 赤兔流量卡办理| av免费观看日本| 一级a爱视频在线免费观看| 日韩,欧美,国产一区二区三区| 久久久久国产一级毛片高清牌| 亚洲熟女毛片儿| 日本欧美视频一区| 性少妇av在线| 国产亚洲av高清不卡| 久久99一区二区三区| 人人澡人人妻人| 日韩精品免费视频一区二区三区| 亚洲精品,欧美精品| 亚洲精品久久午夜乱码| 黄片小视频在线播放| 一区在线观看完整版| 一级黄片播放器| 看十八女毛片水多多多| 国产精品一区二区在线不卡| 国产在线一区二区三区精| 免费高清在线观看视频在线观看| av电影中文网址| 美女午夜性视频免费| 亚洲美女视频黄频| 久久人人爽人人片av| 亚洲精品aⅴ在线观看| 久久久久久久精品精品| 热99久久久久精品小说推荐| 色婷婷av一区二区三区视频| 欧美日韩亚洲高清精品| 麻豆av在线久日| 国产精品熟女久久久久浪| 一本一本久久a久久精品综合妖精| 视频在线观看一区二区三区| 午夜日韩欧美国产| 精品视频人人做人人爽| xxx大片免费视频| 韩国av在线不卡| av网站免费在线观看视频| 青青草视频在线视频观看| 亚洲第一av免费看| 国产熟女午夜一区二区三区| 亚洲欧美一区二区三区久久| 成人亚洲欧美一区二区av| 免费av中文字幕在线| 国产成人系列免费观看| 久久久久精品久久久久真实原创| 在线观看www视频免费| 欧美最新免费一区二区三区| 久久久久视频综合| 热re99久久精品国产66热6| 亚洲激情五月婷婷啪啪| 婷婷色综合www| 一区二区日韩欧美中文字幕| 久久这里只有精品19| av卡一久久| www.av在线官网国产| 女人精品久久久久毛片| 无遮挡黄片免费观看| 制服丝袜香蕉在线| 色婷婷久久久亚洲欧美| 女性生殖器流出的白浆| 中文字幕高清在线视频| 久久精品熟女亚洲av麻豆精品| 色吧在线观看| 蜜桃国产av成人99| 国产精品偷伦视频观看了| 亚洲欧美清纯卡通| 午夜福利在线免费观看网站| 天堂8中文在线网| 亚洲欧美成人精品一区二区| av网站在线播放免费| 一级黄片播放器| 午夜日本视频在线| 午夜日韩欧美国产| av有码第一页| 国产男女内射视频| 少妇被粗大的猛进出69影院| 欧美精品一区二区免费开放| 亚洲国产最新在线播放| 国产一区二区三区综合在线观看| 久久久精品94久久精品| 亚洲成人一二三区av| 狠狠婷婷综合久久久久久88av| 午夜日韩欧美国产| 亚洲成av片中文字幕在线观看| 国产高清国产精品国产三级| 国产一区有黄有色的免费视频| 女人精品久久久久毛片| 妹子高潮喷水视频| 欧美激情高清一区二区三区 | 久久精品国产a三级三级三级| 日本一区二区免费在线视频| 成年人午夜在线观看视频| 51午夜福利影视在线观看| 国产一区二区 视频在线| 亚洲第一青青草原| 亚洲国产欧美在线一区| 国产精品久久久av美女十八| 精品国产一区二区久久| 涩涩av久久男人的天堂| av福利片在线| 久久人人97超碰香蕉20202| 视频在线观看一区二区三区| 日韩一区二区三区影片| 满18在线观看网站| 国产老妇伦熟女老妇高清| 大香蕉久久网| 91老司机精品| 午夜福利一区二区在线看| 中文字幕色久视频| 国产精品久久久久久久久免| 黄频高清免费视频| 午夜福利视频精品| 夫妻性生交免费视频一级片| 国产成人av激情在线播放| 亚洲精品美女久久久久99蜜臀 | 亚洲欧美一区二区三区国产| 美女脱内裤让男人舔精品视频| 国产99久久九九免费精品| 日韩精品免费视频一区二区三区| svipshipincom国产片| 乱人伦中国视频| 成年美女黄网站色视频大全免费| 国产精品人妻久久久影院| 亚洲精品国产av成人精品| 黄网站色视频无遮挡免费观看| 在线天堂中文资源库| 亚洲综合色网址| 性色av一级| 成年人免费黄色播放视频| 久久久久精品久久久久真实原创| 少妇人妻精品综合一区二区| 精品视频人人做人人爽| 久久人妻熟女aⅴ| 少妇人妻久久综合中文| 涩涩av久久男人的天堂| 成人国产麻豆网| 日韩制服丝袜自拍偷拍| 一区在线观看完整版| 男人舔女人的私密视频| 如何舔出高潮| 亚洲av成人精品一二三区| 超碰97精品在线观看| 亚洲色图 男人天堂 中文字幕| 中文乱码字字幕精品一区二区三区| 母亲3免费完整高清在线观看| 咕卡用的链子| 亚洲第一青青草原| 啦啦啦视频在线资源免费观看| 亚洲人成网站在线观看播放| 美女扒开内裤让男人捅视频| 美女午夜性视频免费| 男人操女人黄网站| av线在线观看网站| 操出白浆在线播放| 国产亚洲精品第一综合不卡| 国产精品秋霞免费鲁丝片| 在线观看人妻少妇| 欧美少妇被猛烈插入视频| 亚洲视频免费观看视频| 国精品久久久久久国模美| 午夜福利免费观看在线| 欧美国产精品va在线观看不卡| 日韩一本色道免费dvd| 又黄又粗又硬又大视频| 亚洲国产欧美一区二区综合| 精品久久久精品久久久| 国产成人精品久久二区二区91 | 少妇精品久久久久久久| 最新在线观看一区二区三区 | www日本在线高清视频| 日本黄色日本黄色录像| 亚洲精品久久午夜乱码| 一区二区日韩欧美中文字幕| 天美传媒精品一区二区| 欧美黑人精品巨大| 亚洲情色 制服丝袜| 欧美av亚洲av综合av国产av | 亚洲欧美中文字幕日韩二区| 久久久精品国产亚洲av高清涩受| 在线观看www视频免费| 国产一区二区三区综合在线观看| 咕卡用的链子| 90打野战视频偷拍视频| 色婷婷久久久亚洲欧美| 99精国产麻豆久久婷婷| 欧美精品亚洲一区二区| 精品国产一区二区三区久久久樱花| 老司机影院成人| 亚洲av国产av综合av卡| 国产亚洲av高清不卡| 中文字幕人妻熟女乱码| 国产精品久久久久久久久免| 中国三级夫妇交换| 男女午夜视频在线观看| 男女边吃奶边做爰视频| 久久久久久人妻| 一区在线观看完整版| 黄片无遮挡物在线观看| 男女国产视频网站| 丰满饥渴人妻一区二区三| 亚洲av国产av综合av卡| 嫩草影院入口| 色94色欧美一区二区| 中文字幕最新亚洲高清| 蜜桃国产av成人99| 日本色播在线视频| 曰老女人黄片| 国产成人精品久久二区二区91 | 青春草亚洲视频在线观看| 久久久欧美国产精品| 成人国产麻豆网| 夜夜骑夜夜射夜夜干| 黑丝袜美女国产一区| 国产亚洲最大av| 1024香蕉在线观看| 亚洲免费av在线视频| 97在线人人人人妻| 国产精品无大码| 亚洲精品中文字幕在线视频| 香蕉丝袜av| 国产成人av激情在线播放| 国产精品二区激情视频| 一级片'在线观看视频| 精品视频人人做人人爽| 免费人妻精品一区二区三区视频| 天堂8中文在线网| 国产不卡av网站在线观看| 久久ye,这里只有精品| 男女午夜视频在线观看| 国产 一区精品| 黄色视频在线播放观看不卡| 最近最新中文字幕大全免费视频 | 精品一区在线观看国产| 亚洲视频免费观看视频| 精品一区二区免费观看| 热99国产精品久久久久久7| 51午夜福利影视在线观看| 国产日韩一区二区三区精品不卡| 中文字幕亚洲精品专区| 国产成人精品久久二区二区91 | 国产成人欧美在线观看 | 精品久久蜜臀av无| 国产精品女同一区二区软件| 最近的中文字幕免费完整| 黄片小视频在线播放| 久久精品亚洲av国产电影网| 色视频在线一区二区三区| 丝瓜视频免费看黄片| 亚洲av男天堂| 精品少妇一区二区三区视频日本电影 | 午夜老司机福利片| 久久 成人 亚洲| 国产野战对白在线观看| 国产熟女午夜一区二区三区| 国产精品久久久久成人av| 欧美激情 高清一区二区三区| 久久久久久久久免费视频了| 在线观看一区二区三区激情| 色视频在线一区二区三区| 国产又爽黄色视频| 国产精品女同一区二区软件| 国产精品国产av在线观看| 99久久综合免费| 亚洲国产日韩一区二区| 老司机亚洲免费影院| 肉色欧美久久久久久久蜜桃| 久久精品亚洲熟妇少妇任你| 最新的欧美精品一区二区| 黄网站色视频无遮挡免费观看| 免费不卡黄色视频| 国产又爽黄色视频| 亚洲 欧美一区二区三区| 国产在线免费精品| 一二三四在线观看免费中文在| 欧美在线一区亚洲| 欧美日韩亚洲高清精品| 中文字幕人妻熟女乱码| 亚洲精品久久成人aⅴ小说| 亚洲一级一片aⅴ在线观看| 一级爰片在线观看| 啦啦啦中文免费视频观看日本| 精品酒店卫生间| 曰老女人黄片| 国语对白做爰xxxⅹ性视频网站| 欧美亚洲 丝袜 人妻 在线| 极品少妇高潮喷水抽搐| 视频在线观看一区二区三区| 女人高潮潮喷娇喘18禁视频| 国产极品粉嫩免费观看在线| 亚洲精品一区蜜桃| 亚洲国产精品一区三区| 久久鲁丝午夜福利片| 国产老妇伦熟女老妇高清| 日韩av不卡免费在线播放| 日韩制服丝袜自拍偷拍| 日本vs欧美在线观看视频| 亚洲第一青青草原| 熟女少妇亚洲综合色aaa.| 90打野战视频偷拍视频| 日韩一区二区三区影片| 哪个播放器可以免费观看大片| 日韩精品免费视频一区二区三区| 丰满乱子伦码专区| 成人亚洲欧美一区二区av| 国产亚洲一区二区精品| 欧美日韩福利视频一区二区| 国产精品久久久人人做人人爽| 国产人伦9x9x在线观看| av.在线天堂| 免费在线观看视频国产中文字幕亚洲 | 日韩av免费高清视频| 色94色欧美一区二区| av电影中文网址| 免费观看a级毛片全部| 精品视频人人做人人爽| 成人漫画全彩无遮挡| 天堂中文最新版在线下载| 亚洲一区中文字幕在线| 久久久精品国产亚洲av高清涩受| 1024香蕉在线观看| 黄色毛片三级朝国网站| 欧美日韩成人在线一区二区| 老司机靠b影院| 男女国产视频网站| 久久久国产精品麻豆| 亚洲国产精品成人久久小说| 国产麻豆69| 在线观看一区二区三区激情|