摘要:隨著智能技術(shù)的快速發(fā)展,生成式人工智能不斷與英語教學(xué)相融合,加快了教育轉(zhuǎn)型和教學(xué)手段的革新。研究基于互動假說,考察了生成式人工智能技術(shù)對100名中國英語學(xué)習(xí)者的口語復(fù)雜性、準(zhǔn)確性和流利性的影響。結(jié)果表明,生成式人工智能技術(shù)輔助口語教學(xué)對學(xué)生的詞匯復(fù)雜度和句法復(fù)雜度、流利度有積極影響,但對準(zhǔn)確度的影響不大。研究證實了生成式人工智能技術(shù)所創(chuàng)造的互動環(huán)境有助于學(xué)習(xí)者獲得更多真實性的互動,有助于提高學(xué)習(xí)者的語言表達(dá)能力,為英語口語教學(xué)提供新路徑。
關(guān)鍵詞:生成式人工智能;口語復(fù)雜度;口語準(zhǔn)確度;口語流利度;大學(xué)英語
中圖分類號:G434 文獻(xiàn)標(biāo)識碼:A
本文系浙江省第一批省級課程思政教學(xué)研究項目“新時期高職公共英語課程思政的教學(xué)改革與實踐”(項目編號:076)、浙江省教育廳高等學(xué)校訪問學(xué)者教師專業(yè)發(fā)展項目“語料庫語言學(xué)視閾下基于詞匯搭配的職教本科英語寫作教學(xué)模式研究”(項目編號:FX2023146)階段性研究成果。
① 曹超為本文通訊作者。
隨著科技的快速發(fā)展,生成式人工智能(Artificial Intelligence Generated Content,AIGC)引起了各界的熱議,為教育行業(yè)帶來了不少機遇和挑戰(zhàn)。2023年7月10日,國家互聯(lián)網(wǎng)信息辦公室等7部門聯(lián)合公布了《生成式人工智能服務(wù)管理暫行辦法》[1]。該辦法明確鼓勵生成式人工智能技術(shù)在各行業(yè)、各領(lǐng)域的創(chuàng)新應(yīng)用,生成積極健康、向上向善的優(yōu)質(zhì)內(nèi)容,探索優(yōu)化應(yīng)用場景,構(gòu)建應(yīng)用生態(tài)體系。在這新一輪的教學(xué)變革中,如何將生成式人工智能運用于教學(xué)中,創(chuàng)造教學(xué)新生態(tài),培養(yǎng)新時代下國家所需要的人才,是每一位英語教育者需要思考的重要問題。
在與外語教學(xué)不斷的深度融合下,AIGC開辟了新應(yīng)用場景,尤其是OpenAI 公司推出的一款大型語言模型——ChatGPT?;趯Υ罅繉υ挃?shù)據(jù)的深度學(xué)習(xí),ChatGPT能迅速理解和響應(yīng)人類的語言輸入,進(jìn)行人機對話。在傳統(tǒng)的口語教學(xué)中,通常是老師提問、學(xué)生回答。而在人工智能輔助教學(xué)的過程中,學(xué)習(xí)者必須先進(jìn)行提問,機器才能給予反饋。如此一來,學(xué)生成為了學(xué)習(xí)的主體,激發(fā)了學(xué)生主動性和創(chuàng)造力[2][3]。
作為一種“智慧工具”,AIGC為教育轉(zhuǎn)型提供新技術(shù)、新方法和新方案。近幾年來,國內(nèi)外關(guān)于AIGC和英語教學(xué)相結(jié)合的研究逐漸增多,主要有兩大研究視角:(1)AIGC技術(shù)在教學(xué)中的應(yīng)用,主要集中在利用ChatGPT探索寫作、翻譯的教學(xué)方法[4-8];(2)AIGC技術(shù)對語言習(xí)得的作用[9-12]。第一類研究較為聚焦于書面教學(xué)活動,大多是從理論上構(gòu)建新教學(xué)模式,為AIGC輔助教學(xué)提供了豐富的研究路徑。第二類研究大多為質(zhì)性分析,探索AIGC對語言的影響。然而,目前的研究缺少對AIGC輔助英語口語教學(xué)的實證量化分析,對其影響語言作用的探討有待深入。因此,本研究選取大學(xué)英語學(xué)習(xí)者為研究對象,依托生成式人工智能平臺,進(jìn)行了一個學(xué)期的教學(xué)實踐,收集了學(xué)生英語口語人機交互的在線數(shù)據(jù)。通過對比兩組學(xué)生口語的復(fù)雜度、準(zhǔn)確度和流利度指標(biāo),以探究生成式人工智能賦能口語教學(xué)的有效性,構(gòu)建口語教學(xué)的新路徑,提升外語教學(xué)的信息化水平,為同行提供借鑒。
“互動”是二語習(xí)得領(lǐng)域的一個重要概念,最早可追溯到20世紀(jì)70年代。 基于Krashen的輸入假說,Long對“外國式語言”提出質(zhì)疑,從而提出互動假說。在假說確立的初期,Long明確區(qū)分了輸入和互動是兩個不同的概念。后續(xù),Long進(jìn)一步提出了互動調(diào)整這一概念,并完整提出互動假說的模型,包括輸入、互動和輸出三部分。其中,互動是核心環(huán)節(jié)。如今,互動假說逐漸發(fā)展成熟為一個綜合型的理論框架,包括Hatch關(guān)于話語分析的思想、Krashen[13]的輸入假說和Swan的輸出假說。Hatch的話語分析思想強調(diào)語言習(xí)得是依賴于語言的交互活動。Krashen的輸入假說認(rèn)為可理解輸入(i+1)是二語習(xí)得的唯一條件,而使得輸入可理解需要簡化、語境和語言外線索的輔助。在此基礎(chǔ)上,Long[14]進(jìn)一步提出交互式輸入比非交互式輸入更重要。交互式輸入即意義協(xié)商(Negotiation of Meaning)。意義協(xié)商即在互動活動中,交流雙方遇到交際困難或障礙時,雙方會通過不斷的調(diào)整、核準(zhǔn)、澄清請求等方式,從而達(dá)到交際的目的?;蛹僬f的核心是語言互動的結(jié)構(gòu)調(diào)整,也就是意義協(xié)商基礎(chǔ)上的形式協(xié)商。
目前,大學(xué)口語英語課程的突出問題是學(xué)生口語練習(xí)的機會較少,積極性較差,并且無法獲得有效的反饋。借助AIGC的技術(shù)支撐,互動假說理論能有效的解決上述問題,使其得以在現(xiàn)實中運用。在AIGC輔助口語教學(xué)的過程中,人機互動發(fā)揮著至關(guān)重要的作用。ChatGPT依靠大量語言模型,能與學(xué)習(xí)者進(jìn)行真實場景的互動交流。因此,本研究擬在互動假說的理論指導(dǎo)下,依托AI中文站,制定口語課程實施方案,旨在通過輸入、互動、反饋和輸出等手段,有效提高中國英語學(xué)習(xí)者口語水平。
(一)增加語言輸入
根據(jù)Krashen提出的輸入理論(Input Hypothesis),可理解性輸入是二語習(xí)得的充分必要條件。只要學(xué)習(xí)者接觸大量略高于自己現(xiàn)有水平的輸入,即可習(xí)得一門語言。更新后的互動假說認(rèn)為可理解性輸入是二語習(xí)得的必要而非充分的條件。在AIGC的輔助下,教師可以在開展口語練習(xí)之前,教授學(xué)生特定的指令語讓ChatGPT提供相關(guān)話題的文章等學(xué)習(xí)資源,增加可理解性輸入內(nèi)容的豐富度和趣味性,以提高口語內(nèi)容的多樣性。例如,在ChatGPT的輸入框中輸入“Can you give me some words and sentence patterns about describing an unforgettable memory ”同時,根據(jù)自身的水平,學(xué)習(xí)者還可以進(jìn)一步調(diào)整學(xué)習(xí)資源的難度。例如,發(fā)出指令“Can you offer more difficult articles ”。通過上述方式,學(xué)生可以盡可能的找到適合自己的可理解輸入材料,增大有效的語言輸入。
(二)真實互動,增加學(xué)生參與度
互動假說中的“互動”指的是語言形式的交際功能[15],同時也是結(jié)合可理解輸入、注意力和可理解輸出的有效途徑?;蛹僬f認(rèn)為只有當(dāng)學(xué)習(xí)者在不斷的進(jìn)行互動調(diào)整,才能提高對語言問題的注意,這必然會促進(jìn)學(xué)習(xí)者對可理解輸入的吸收和可理解輸出的準(zhǔn)確性。因此,互動是銜接可理解輸入和可理解性輸出的重要環(huán)節(jié),為語言習(xí)得奠定基礎(chǔ)。
本研究中,教師首先需要根據(jù)交際的目的,教授學(xué)生調(diào)試ChatGPT成為特定的對話者。以雅思口語考試為例,學(xué)習(xí)者首先需要語音輸入“Can you pretend yourself as an IELTS speaking test interviewer ”其次,學(xué)生可以根據(jù)自己的反應(yīng)速度,調(diào)整與ChatGPT對話的節(jié)奏。例如,學(xué)習(xí)者可以語音輸入“Please ask me one question at a time and wait for me to answer before asking a second question?!痹谶@個階段中,ChatGPT能模擬各種真實的生活場景與學(xué)習(xí)者進(jìn)行交互。同時,ChatGPT還能根據(jù)學(xué)習(xí)者的回答進(jìn)行對話調(diào)整,增加真實感。
(三)及時反饋
通常,ChatGPT會總結(jié)學(xué)習(xí)者的語言輸入,再進(jìn)行提問。在這個語言交流過程中,學(xué)習(xí)者需要有意識的注意到自己的語言表達(dá)和ChatGPT的表達(dá)之間存在不匹配,從而推動ChatGPT產(chǎn)出反饋。ChatGPT能夠給予學(xué)習(xí)者及時且個性化的反饋,推動意義協(xié)商,促使學(xué)習(xí)者對語言輸入進(jìn)行反思,從而使學(xué)生對話語結(jié)構(gòu)做出調(diào)整,最終達(dá)到形式協(xié)商,提高語言習(xí)得的水平。
例如,學(xué)生可以輸入提示語“Can you assess my vocabulary and grammar ”。ChatGPT接收到語音后,可以為學(xué)生的語言輸入提供個性化的反饋。反饋內(nèi)容主要包括三部分:綜合型反饋、內(nèi)容型反饋、修正性反饋。同時,它還可以為特定的句子提供詞匯、語體、邏輯、發(fā)音等方面的反饋。例如,輸入提示語“Can you evaluate the first paragraph on vocabulary, grammar, logic and pronunciation ”。
(四)增加語言輸出,提高口語技能
更新后的互動假說認(rèn)為,可理解輸入只是語言習(xí)得的一個重要環(huán)節(jié)。根據(jù)輸出假說[16],二語習(xí)得既需要可理解輸入,也需要可理解輸出,因為可理解性輸出是檢驗學(xué)習(xí)者是否真正內(nèi)化輸入的有效途徑。Swan提出可理解輸出主要有三大功能:(1)注意或誘發(fā)功能(A Noticing/ Triggering Function);(2)假設(shè)驗證功能(A Hypothesistesting Function); (3)元語言功能(A Metalinguistic Function),即反思功能。在輸出目標(biāo)語言的過程中,學(xué)習(xí)者可能會出現(xiàn)不會表達(dá)或者表達(dá)錯誤的現(xiàn)象,迫使他們注意到自己的語言問題。當(dāng)學(xué)習(xí)者意識到問題后,會進(jìn)行有意識的反思和內(nèi)化語言規(guī)則。然后,學(xué)習(xí)者不斷和ChatGPT進(jìn)行對話來驗證新的語言輸出,從而提高語言輸出的準(zhǔn)確性。
本研究中,教師利用AI中文站平臺創(chuàng)設(shè)一些真實的、貼近日常生活的對話,盡可能讓學(xué)生增加語言輸出。同時,該平臺可以提供語音轉(zhuǎn)寫功能。教師要求學(xué)習(xí)者和ChatGPT完成對話后,將語音轉(zhuǎn)寫成文本,以便學(xué)習(xí)者反思在輸出過程中存在的語言問題。結(jié)合教師和ChatGPT的輔助下,學(xué)習(xí)者對語言形式進(jìn)行系統(tǒng)的分析,修正錯誤,從而提高語言的準(zhǔn)確性。
總之,在互動假說的理論支撐下,AIGC可以有針對性的解決大學(xué)口語英語課程的矛盾點,滲透到口語教學(xué)的全過程,幫助教師營造真實、個性化的教學(xué)環(huán)境,提供可理解性輸入、增強互動感,提高學(xué)習(xí)者的積極性,更好的滿足學(xué)生個性化的口語需求,圖1為AIGC輔助口語教學(xué)的模型圖。
(一)研究目的與研究問題
本文旨在利用AIGC技術(shù)創(chuàng)造英語口語教學(xué)的新場景,為英語教學(xué)的新路徑提供新方案。從口語的復(fù)雜度、準(zhǔn)確度和流利度三個維度,分析AIGC技術(shù)對中國英語學(xué)習(xí)者口語能力的影響。具體包括以下研究問題:
研究問題1:使用AIGC輔助口語教學(xué)的學(xué)生是否比使用傳統(tǒng)教學(xué)法的學(xué)生具有更復(fù)雜的口語產(chǎn)出?
研究問題2:使用AIGC輔助口語教學(xué)的學(xué)生是否比使用傳統(tǒng)教學(xué)法的學(xué)生具有更準(zhǔn)確的口語產(chǎn)出?
研究問題3:使用AIGC輔助口語教學(xué)的學(xué)生是否比使用傳統(tǒng)教學(xué)法的學(xué)生具有更流利的口語產(chǎn)出?
(二)實驗對象
本文的研究對象為浙江某學(xué)院兩個非英語專業(yè)的班級。每個班級50名學(xué)生,受試者的年齡在19—21歲之間(M=20.2,SD=2.23),學(xué)員平均英語學(xué)習(xí)年限為9.2年,所有受試者均未使用過人工智能進(jìn)行口語練習(xí)。
為了盡可能避免教師、教材、學(xué)時等外界因素對實驗的干擾,實驗組和控制組的授課任務(wù)由同一教師完成。同時,兩組每周進(jìn)行兩次共計90分鐘的面授,為期16周,以確保教學(xué)內(nèi)容和教學(xué)進(jìn)度一致。唯一不同的是,控制組按照傳統(tǒng)的雙人對話、小組討論、代表匯報等傳統(tǒng)口語課堂教學(xué)模式開展教學(xué),而實驗組使用AI中文站(https://chat.7jm.cn/index.html),這款A(yù)I在線平臺以ChatGPT4.0為內(nèi)核。學(xué)習(xí)者先通過手機或電腦免費下載該軟件,再利用語音插件進(jìn)行交互活動,完成口語教學(xué)任務(wù)。此外,它還可以實時記錄語音并將其轉(zhuǎn)錄為文本。本研究采用該應(yīng)用程序的原因主要有兩個方面:首先,該應(yīng)用程序是最先進(jìn)的AI語言模型之一,注冊簡單且使用方便。其次,它可以創(chuàng)造真實的口語環(huán)境,還能進(jìn)行個性化的對話和及時反饋。因此,該軟件可以有效的解決傳統(tǒng)的口語教學(xué)中教師與學(xué)生互動不足,學(xué)生的積極性不高等問題。
(三)實驗設(shè)計流程
該實驗研究時長共16周,由七個主題單元組成。在課程開始之前,所有學(xué)生都接受了課前英語的口語前測,兩組未呈現(xiàn)顯著性差異,確保英語口語能力水平相當(dāng)。
第1周是課程先導(dǎo)課,目的是為了教導(dǎo)學(xué)生下載并熟悉AI中文站的使用方法。第2周至第15周為7個單元的教學(xué)實踐(如下頁圖2所示)。每周,任課教師向?qū)W生布置一個特定話題的口語任務(wù),并給出明確的任務(wù)目標(biāo)。實驗組學(xué)生利用AI中文站搜集各種學(xué)習(xí)資源,進(jìn)行輸入型學(xué)習(xí),控制組學(xué)生則利用課本教材進(jìn)行學(xué)習(xí)。在每節(jié)課上,兩組學(xué)生都要完成對話任務(wù)和口語匯報任務(wù)。在執(zhí)行上述任務(wù)中,控制組通過同伴和教師進(jìn)行練習(xí),而實驗組需要使用AI中文站進(jìn)行人機對話,目的是為了激發(fā)學(xué)生的產(chǎn)出和提升口語表達(dá)能力。第16周,所有學(xué)生都參加了實驗后測,以評估和對比英語口語復(fù)雜度、準(zhǔn)確性和流利度。在課程結(jié)束后,研究者將口語錄音轉(zhuǎn)錄。同時,為準(zhǔn)確的評估句法復(fù)雜度,研究者對語音進(jìn)行剪切和合并,以避免錯誤地測量復(fù)雜句子。
(四)研究指標(biāo)
1.復(fù)雜度指標(biāo)
口語復(fù)雜性主要包括詞匯和句法兩個組成部分。詞匯復(fù)雜度,通常也被稱為詞匯豐富度。根據(jù)前人的相關(guān)研究[17][18],詞匯豐富度的指標(biāo)通常包括詞匯變化、詞匯密度、詞匯復(fù)雜性、詞匯獨創(chuàng)性和詞匯錯誤。由于本研究考察的是口語,詞匯獨創(chuàng)性和詞匯錯誤難以測量。因此,我們確定了以下三個指標(biāo)用于測量詞匯復(fù)雜性(如下頁表1所示)。詞匯變化,又稱詞匯多樣性,是指語言使用中的詞匯范圍[19],衡量詞匯變化最常用的方法是形符類符比(TTR)。詞匯復(fù)雜度是指文本中高級詞匯的比例,詞匯密度是指實詞總數(shù)占總單詞總數(shù)的比例[20]。
基于Lu[21]所提出的句法復(fù)雜度指標(biāo),本研究從中選取了適用于測量口語的句法復(fù)雜度的四個指標(biāo):單元長度、從屬從句的使用、并列結(jié)構(gòu)的使用以及特定短語結(jié)構(gòu),如表2所示。
2.準(zhǔn)確度指標(biāo)
準(zhǔn)確性是指學(xué)習(xí)者能否按照目標(biāo)語言規(guī)則產(chǎn)出正確的語言[22]。根據(jù)測量的內(nèi)容,測量指標(biāo)可以分為具體指標(biāo)和一般指標(biāo)。具體指標(biāo)包括形態(tài)句法和詞匯準(zhǔn)確性等,一般指標(biāo)通常利用無差錯AS單位衡量。一般指標(biāo)的計算方法較為便捷,故被廣泛使用[23][24](如表3所示)。研究者利用上述指標(biāo),計算每個學(xué)生錄音文本中的AS單位數(shù)量和誤差錯AS單位數(shù)量。
3.流利度指標(biāo)
從狹義上講,流利度是指說話者在產(chǎn)出語言時,平穩(wěn)而流暢,沒有停頓、重復(fù)和修補,能夠反映出語言的熟練程度[25][26]。Tavakoli Skehan[27]從速度流利度、停頓流利度和修復(fù)流利度三方面對流利度進(jìn)行考察。速度流利度是指產(chǎn)出語言單位的速度,通常用語速進(jìn)行測量。停頓流利度是指停頓的時長和數(shù)量,通常用平均停頓時長進(jìn)行測量。修復(fù)流利度是指自我糾錯或重復(fù)的次數(shù)。此外,Towell等人[28]和Ogawa的研究發(fā)現(xiàn),發(fā)音時間比(Phonation/Time Ratio,PTR)、平均語流長度(Mean Length of Runs,MLR)和發(fā)音速率(Articulation Rate,AR)這三個指標(biāo)對口語流利度也能進(jìn)行強有力的解釋。因此,本研究選取以下六個指標(biāo)測量口語流利度(如表4所示)。
(五)數(shù)據(jù)收集和分析
在口語后測中,根據(jù)研究者給出的口語演講題目,每一位被試均有五分鐘的準(zhǔn)備時間,然后進(jìn)行2分鐘的演講。兩組學(xué)生產(chǎn)生的語料全部錄音保存。在數(shù)據(jù)預(yù)處理的過程中,實驗組和對照組各有五人因錄音時長不足、缺席課程而從語料庫中刪除。因此,本研究對90名學(xué)生(45名實驗組和45名控制組)的錄音進(jìn)行了轉(zhuǎn)寫。轉(zhuǎn)寫成文本后,研究者與參與者共同校對了錄音轉(zhuǎn)錄,以確保他們的語言被準(zhǔn)確轉(zhuǎn)錄。本研究采用ELAN(https://tla.mpi.nl/tools/tla-tools/elan)對口語準(zhǔn)確性和流利性指標(biāo)進(jìn)行編碼。ELAN是一個多媒體轉(zhuǎn)寫標(biāo)注工具,被廣泛運用于話語分析和搭建口語語料庫。兩位研究者對編碼進(jìn)行了交叉核對,兩位編碼者在交叉核對中出現(xiàn)的任何分歧都通過討論解決,直至達(dá)成共識。在數(shù)據(jù)分析的過程中,本研究使用R語言將實驗組和對照組的數(shù)據(jù)進(jìn)行復(fù)雜度、準(zhǔn)確度和流利度的獨立樣本t檢驗。
(一)口語復(fù)雜度對比
從詞匯復(fù)雜性的角度來看,結(jié)果顯示實驗組在LV、LS和LD三個維度上的平均值高于對照組,且兩組之間在LV和LS上存在顯著性差異(p<0.05)。但是,兩組在LD上不存在顯著性差異(p>0.05)。在標(biāo)準(zhǔn)差上,對照組在LV和LD兩個維度上更為分散。但LS維度上,兩組的個體差異不大,如表5所示。
從句法復(fù)雜性的角度來看,表6中的結(jié)果顯示,實驗組的均值在所有指標(biāo)上高于對照組,這說明AIGC輔助口語教學(xué)有助于提高句法復(fù)雜性。從標(biāo)準(zhǔn)差指標(biāo)上看,對照組的離散程度更高,這說明在傳統(tǒng)教學(xué)環(huán)境中,學(xué)習(xí)者習(xí)得知識的個體差異較大。從p值上分析,實驗組和對照組僅在CN/T指標(biāo)上不存在顯著性差異。
(二)口語準(zhǔn)確度對比
研究結(jié)果顯示,實驗組和對照組的平均值相差無幾,且p>0.05,這意味著兩組學(xué)生在統(tǒng)計學(xué)上不存在顯著差異。從標(biāo)準(zhǔn)差可以看出,在實驗組的參與者中存在較大的個體差異。如表7所示。
(三)口語流利度對比
本研究對實驗組和對照組進(jìn)行了獨立樣本t檢驗,對比兩個組學(xué)生在語速、語音占時間比、平均語段長度、平均停頓長度、發(fā)音速度、錯誤更正次數(shù)等6個方面的差異性,結(jié)果如表8所示。
語速(SR):實驗組的平均值為125.43音節(jié)/分鐘,而對照組的平均值為104.21音節(jié)/分鐘。對比數(shù)據(jù)發(fā)現(xiàn),實驗組平均產(chǎn)出的音節(jié)高于對照組,且兩組達(dá)到了顯著水平(p=0.034<0.05)。從標(biāo)準(zhǔn)差來看,對照組的離散程度更高。
語音占時間比(PTR):實驗組和對照組的語音占時間比分別為67.76%和54.92%,p值小于0.05,證明兩組之間存在顯著性差異。以上數(shù)據(jù)說明,通過使用ChatGPT技術(shù)進(jìn)行口語訓(xùn)練后,學(xué)生在口語規(guī)劃上所需要的時間縮短,從而提高口語產(chǎn)出的效率。
平均語段長度(MLR):實驗組和對照組的平均值分別為5.41和5.01,p=0.03<0.05,具有統(tǒng)計學(xué)意義。然而,實驗組的標(biāo)準(zhǔn)值(0.85)高于對照組(0.73),表明實驗組個體之間存在較大差異。
平均停頓長度(APL):對照組的平均停頓長度為1.45秒,實驗組的平均停頓長度為1.05秒,這說明實驗組思考時間少于對照組。此外,p<0.05在置信水平上顯著。然而,實驗組的標(biāo)準(zhǔn)差高于對照組,表明實驗組的個體差異性較大。
發(fā)音速度(PS):對照組的平均值為2.12音節(jié)/秒,標(biāo)準(zhǔn)差為0.39音節(jié)/秒。實驗組的平均值為2.89音節(jié)/秒,標(biāo)準(zhǔn)差為0.44,p<0.05。以上數(shù)據(jù)表明,在置信水平上,兩組具有顯著性差異。
錯誤更正次數(shù)(F):實驗組的平均值(9.45次)顯著低于對照組(11.39次)。
本研究基于ChatGPT4.0內(nèi)核的AI中文站,探索生成式人工智能對中國英語學(xué)習(xí)者口語復(fù)雜度、準(zhǔn)確度和流利度的影響。經(jīng)分析發(fā)現(xiàn):(1)在生成式人工智能技術(shù)的輔助下,實驗組能產(chǎn)出更多樣、更復(fù)雜的詞匯。在詞匯復(fù)雜度方面,實驗組在三個指標(biāo)上的表現(xiàn)均優(yōu)于對照組。這表明,人工智能創(chuàng)造的口語課堂引導(dǎo)學(xué)習(xí)者在口語輸出中使用了更復(fù)雜的高級詞匯。值得注意的是,AIGC能提升實驗組的詞匯密度(LD),但是兩組之間不存在顯著性差異。究其原因,有以下兩點:首先,由于口語是一項輸出型任務(wù),口語的詞匯密度在短期口語訓(xùn)練中相對穩(wěn)定且難以提升;其次,從互動假說理論來看,學(xué)生將可理解性輸入轉(zhuǎn)化為口語輸出需要較長的內(nèi)化過程。(2)在句法復(fù)雜度上,實驗組比對照組的句型更長且更加復(fù)雜。但是,實驗組在復(fù)雜名詞短語數(shù)(CN/T)上的發(fā)展并不明顯。使名詞短語復(fù)雜化的途徑主要有兩種:一種是增加前置修飾詞,另一種則是增加后置修飾詞。結(jié)果發(fā)現(xiàn),兩組學(xué)生大多都采用后置修飾語,尤其是通過介詞短語修飾名詞。這與Biber等人[29]的研究一致,他發(fā)現(xiàn)介詞結(jié)構(gòu)是早期習(xí)得的結(jié)構(gòu)之一。本研究發(fā)現(xiàn)學(xué)習(xí)者在口語表達(dá)中較少使用前置修飾詞,從認(rèn)知加工的角度看,這可能是因為前置成分太長會加重學(xué)習(xí)者處理加工信息的負(fù)擔(dān),最終導(dǎo)致產(chǎn)出失敗。(3)在準(zhǔn)確度指標(biāo)上,實驗組與對照組沒有呈現(xiàn)顯著性差異,這一結(jié)果與Mehnert[30]的研究發(fā)現(xiàn)一致。Mehnert發(fā)現(xiàn)學(xué)習(xí)者在同時確保語言復(fù)雜性和準(zhǔn)確性方面存在困難。有研究表明[31][32],口語產(chǎn)出的準(zhǔn)確度與工作記憶容量大小顯著相關(guān)。當(dāng)認(rèn)知負(fù)荷超過工作記憶容量的限制時,學(xué)習(xí)者的加工能力和存儲能力會減弱,導(dǎo)致注意力資源分配不均,語言產(chǎn)出的準(zhǔn)確度、流利度和復(fù)雜度之間就會產(chǎn)生競爭效應(yīng)。權(quán)衡假說(Trade-off Hypothesis)[33]也證實,當(dāng)較多的注意力資源分配給復(fù)雜度和流利度時,可能會對準(zhǔn)確性產(chǎn)生負(fù)面影響。本研究中準(zhǔn)確度與流利度之間的權(quán)衡與Jiang等人的結(jié)果恰恰相反。他們發(fā)現(xiàn)一款人工智能軟件能有效的提高實驗組的準(zhǔn)確性,但無法提高流利度。結(jié)果的差異可能是因為測量指標(biāo)的顆粒度不一致,Jiang等人是從詞匯和語法兩個具體的維度考察準(zhǔn)確度,而本研究是從一般指標(biāo)進(jìn)行考察。(4)相比對照組,實驗組在六個流利度指標(biāo)上均顯示出顯著性差異。上述實驗結(jié)果表明,生成式人工智能技術(shù)對第二語言學(xué)習(xí)者的口語流暢度產(chǎn)生了積極影響。筆者推測,實驗組流暢度較高的原因可能與情感因素有關(guān)。根據(jù)Krashen提出的情感過濾假說(The Affective Filter Hypothesis),學(xué)習(xí)者的動機、自信心、焦慮程度以及師生之間的情感因素都會影響語言的習(xí)得。如果學(xué)習(xí)者在口語交流中過于焦慮或與教師關(guān)系不佳,情感過濾器就會關(guān)閉,那么語言輸入就無法順利地通過過濾得以習(xí)得,最終造成一種可理解輸入的心理障礙,無法流利地的產(chǎn)出語言。在AIGC輔助口語教學(xué)的環(huán)境中,學(xué)習(xí)者沉浸在與生成式人工智能技術(shù)的深度對話中,他們不會因為不敢開口而感到焦慮,也不必?fù)?dān)心師生關(guān)系。如此一來,他們在口語交流中,情感過濾器就會打開,語言輸入會順利地通過過濾,最終習(xí)得語言。因此,本文發(fā)現(xiàn)利用AIGC能有效提高學(xué)習(xí)體驗,克服學(xué)習(xí)者緊張、焦慮的心情,促使其學(xué)習(xí)產(chǎn)出流利的語言。
綜上所述,通過對實驗組和對照組的口語進(jìn)行一系列獨立樣本測試,本研究發(fā)現(xiàn)實驗組的口語具有以下特點:(1)更多樣化、更復(fù)雜的詞匯;(2)更復(fù)雜的句子結(jié)構(gòu);(3)口語的流利度增加。本研究的主要貢獻(xiàn)在于表明AIGC有助于提高學(xué)生的口語復(fù)雜度和流利度,對口語教學(xué)具有理論和實踐意義。在理論上,本研究證實了互動假說的有效性,即互動會對語言習(xí)得和語言產(chǎn)出有積極影響。語言習(xí)得和產(chǎn)出是一項較為復(fù)雜的認(rèn)知行為,受到諸多因素的制約。在語言的實際產(chǎn)出過程中,學(xué)習(xí)者需要將可理解輸入吸收、內(nèi)化再轉(zhuǎn)為輸出。同時,還需要保證發(fā)音準(zhǔn)確流利且語義連貫。AIGC技術(shù)通過創(chuàng)造獨特的外語學(xué)習(xí)環(huán)境,增加人機互動,使得學(xué)習(xí)者在互動、意義協(xié)商中習(xí)得語言知識。在實踐上,本研究利用AIGC技術(shù)輔助口語教學(xué)提供了新思路?;贏IGC輔助口語的教學(xué)實踐中,教師首先需要關(guān)注如何通過AIGC構(gòu)建口語情境以增加可理解性輸入,從而促進(jìn)學(xué)習(xí)者獲取更多的學(xué)習(xí)資源。其次,教師需要創(chuàng)造更多情境化的口語環(huán)境、參與式學(xué)習(xí)活動和實踐機會,給予學(xué)生更多的口語輸出的機會,如擴展討論的話題,增加對話時長、增加口語任務(wù)的復(fù)雜性和多樣性等,以此給學(xué)習(xí)者更多互動的機會和內(nèi)化語言知識的時間。
參考文獻(xiàn):
[1] 國家網(wǎng)信辦.生成式人工智能服務(wù)管理暫行辦法[EB/OL].https://www. gov.cn/zhengce/zhengceku/202307/content_6891752.htm,2023-07-10.
[2] 馮建軍.我們?nèi)绾慰创鼵hatGPT對教育的挑戰(zhàn)[J].中國電化教育,2023,(7):1-6+13.
[3] Huang J,Saleh S,et al.A review on artificial intelligence in education [J]. Academic Journal of Interdisciplinary Studies,2021,10(3):206.
[4] 郭茜,馮瑞玲等.ChatGPT在英語學(xué)術(shù)論文寫作與教學(xué)中的應(yīng)用及潛在問題[J].外語電化教學(xué),2023,(2):18-23+107.
[5] 王律,王湘玲.ChatGPT時代機器翻譯譯后編輯能力培養(yǎng)模式研究[J].外語電化教學(xué),2023,(4):16-23+115.
[6] Gayed J M,Carlon M K,et al.Exploring an AI-based writing Assistant’s impact on English language learners [J].Comput.Educ.Artif. Intell.,2022,3:100055.
[7] Alshater,M.M.Exploring the Role of Artificial Intelligence in Enhancing Academic Performance:A Case Study of ChatGPT [J].SSRN Electronic Journal,2022.
[8] Hockly N.Artificial Intelligence in English language teaching:The good, the bad and the ugly [J].RELC Journal,2023,54(2):445-451.
[9] Huang W,Hew K F,F(xiàn)ryer L K.Chatbots for language learning-are they really useful A systematic review of chatbot-supported language learning [J].Journal of Computer Assisted Learning,2022,38(1):237-257.
[10] Haristiani N.Artificial intelligence (AI) chatbot as language learning medium:an inquiry [J].Journal of Physics:Conference Series,2019,1387:012020.
[11] Kohnke L.A Pedagogical Chatbot:A Supplemental Language Learning Tool [J].RELC Journal,2023,54(3):828-838.
[12] Yin Q,Satar M.English as a foreign language learner interactions with chatbot:Negotiation for meaning [J].International online Journal of Education and Teaching,2020,7(2):390-410.
[13] Krashen S.The input hypothesis:Issues and complications [M]. London:Longman,1985.
[14] Long M H.The role of linguistic environment in second language acquisition [A].W.Ritchie and T. K. Bhatia (Eds.),Handbook of second language acquisition [C].San Diego:Academic Press,1996.413-468.
[15] Long M H.Input,interaction,and second language acquisition [J].Annals of the New York Academy of Sciences,1981,379(1):259-278.
[16] Swain M.Three functions of output in second language learning [A]. G.Cook and B.Seidhofer. Principle and practice in applied linguistics [C]. Cambridge:Cambridge University Press,1995.125-144.
[17] Read,J.Assessing vocabulary [M].Cambridge:Cambridge University Press,2000.
[18] Laufer B,Nation P.Vocabulary Size and Use:Lexical Richness in L2 Written Production [J].Applied Linguistics,1995,16(3):307-322.
[19] Crystal,D.Profiling Linguistic Disability [M].London:Edward Arnold,1982.
[20] Ure,Jean.Lexical density and register differentiation [A].G.E.Perren and J.L.M.Trim(Eds.).Applications of linguistics.Selected papers of the Second International Congress of Applied Linguistics,Cambridge [C]. Cambridge:Cambridge University Press,1971.443-452.
[21] Lu X F.Automatic Analysis of Syntactic Complexity in Second Language Writing [J].International Journal of Corpus Linguistics,2010,15(4):474-496.
[22] Bui G,Skehan P.Complexity,Accuracy,and Fluency [J].The TESOL Encyclopedia of English Language Teaching,2018:1-7.
[23] Ogawa,C.CAF indices and human ratings of oral performances in an opinion-based monologue task [J].Lang Test Asia,2022,12(1):1-18.
[24] Jiang,M.Y.,Jong,M.S.,et al.Exploring the effects of automatic speech recognition technology on oral accuracy and fluency in a flipped classroom [J].J.Comput.Assist. Learn.,2022,39(1):125-140.
[25] De Jong,N.H.,Hulstijn,J.H.et al.Second language fluency:Speaking style or proficiency Correcting measures of second language fluency for first language behavior [J].Applied Psycholinguistics,2015,36(2):223-243.
[26] De Jong,N.H.Fluency in second language assessment [A].D.Tsagari J.Banerjee.Handbook of second language assessment [C].Berlin:De Gruyter,2016.203-218.
[27] Tavakoli P,Skehan P.Strategic planning,task structure,and performance testing [A].R.Ellis.Planning and task-performance in a second language [C].Amsterdam:Benjamins,2005.239-273.
[28] Towell R,Hawkins R,et al.The development of fluency in advanced learners of French [J]. Applied linguistics,1996,(17):84-115.
[29] Biber D,Gray B,et al.Should we use characteristics of conversation to measure grammatical complexity in L2 writing development [J].TESOL Quarterly,2011,45(1):5-35.
[30] Mehnert U.The effects of different lengths of time for planning on second language performance [J].Studies in Second Language Acquisition,1998,20(1):83-108.
[31] 金霞.工作記憶容量限制對二語學(xué)習(xí)者口語產(chǎn)出的影響[J].外語教學(xué)與研究,2012,(4):523-535.
[32] 韓亞文.工作記憶容量對中國英語學(xué)習(xí)者口語準(zhǔn)確度、復(fù)雜度和流利度的影響[J].外語教學(xué),2015,36(5):65-68.
[33] Skehan P.Modelling Second Language Performance:Integrating Complexity,Accuracy,F(xiàn)luency,and Lexis [J].Applied Linguistics,2009,30 (4):510-532.
作者簡介:
吳堅豪:講師,研究方向為語料庫語言學(xué)、計算機輔助語言教學(xué)。
周婉婷:在讀碩士,研究方向為語料庫語言學(xué)、話語分析。
曹超:教授,研究方向為計算機輔助語言教學(xué)。
An Empirical Study on Empowering Oral Teaching with AIGC
Wu Jianhao1,2, Zhou Wanting3, Cao Chao3
1.Culture and Art School, Zhejiang Technical Institute of Economics, Hangzhou 310018, Zhejiang 2.School of International Studies, Zhejiang University, Hangzhou 310058, Zhejiang 3.School of Foreign Languages, Zhejiang University of Finance and Economics, Hangzhou 310018, Zhejiang
Abstract: With the rapid development of intelligent technology, AIGC continues to integrate with English language teaching, accelerating the transformation of education and the revolution of teaching methods. Based on the interaction hypothesis, the study examined the effects of generative AI technology on the speaking complexity, accuracy and fluency of 100 Chinese English learners. The results showed that generative AI technology-assisted speaking instruction had a positive effect on students’ lexical and syntactic complexity and fluency, but had little effect on accuracy. The study confirms that the interactive environment created by generative AI technology helps learners to get more authentic interactions, which helps to improve learners’ language expression and provides a new path for English speaking teaching.
Keywords: AIGC; oral complexity; oral accuracy; oral fluency; college English
責(zé)任編輯:李雅瑄