【摘 要】對(duì)話式大語(yǔ)言模型等AI技術(shù)促進(jìn)了出版領(lǐng)域的顛覆式變革。人工智能生成內(nèi)容(AIGC)在給出版行業(yè)帶來顯著效率提升的同時(shí),也伴隨著一系列不容忽視的風(fēng)險(xiǎn)和挑戰(zhàn)?;谛聲r(shí)代外語(yǔ)教材建設(shè)的需求,系統(tǒng)梳理大語(yǔ)言模型(LLMs)輔助外語(yǔ)教材編審工作的主要應(yīng)用場(chǎng)景,深入剖析語(yǔ)言檢測(cè)和生成內(nèi)容套路化、話題處理局限、版權(quán)歸屬與數(shù)據(jù)隱私等常見問題,提出建構(gòu)多級(jí)審核驗(yàn)證機(jī)制、開發(fā)垂類工具、強(qiáng)化把關(guān)、完善版權(quán)管理策略等建議,以構(gòu)建技術(shù)賦能與人文價(jià)值平衡的教材編審新生態(tài)。
【關(guān)" 鍵" 詞】AIGC;大語(yǔ)言模型;外語(yǔ)教材編審;編輯數(shù)字素養(yǎng)
【作者單位】蔣璜,上海外語(yǔ)教育出版社,上海外國(guó)語(yǔ)大學(xué)外語(yǔ)教材研究院。
【中圖分類號(hào)】G230.7 【文獻(xiàn)標(biāo)識(shí)碼】A 【DOI】10.16491/j.cnki.cn45-1216/g2.2025.05.017
隨著AI技術(shù)的快速發(fā)展和廣泛應(yīng)用,出版領(lǐng)域正在經(jīng)歷一場(chǎng)顛覆式變革。對(duì)話式大語(yǔ)言模型(Large Language Models,LLMs)等技術(shù)作為內(nèi)容生產(chǎn)的新質(zhì)生產(chǎn)力,正在深刻改變出版業(yè)的內(nèi)容生產(chǎn)范式和供給模式[1]。大語(yǔ)言模型強(qiáng)大的語(yǔ)言處理和生成能力,可以輔助編輯進(jìn)行選題策劃、內(nèi)容審查、文字潤(rùn)色、大數(shù)據(jù)分析、宣傳推廣等工作,優(yōu)化審稿和編輯流程,大幅提升編輯的工作效率。然而,人工智能生成內(nèi)容(AIGC,Artificial Intelligence Generated Content)也存在一些不可忽視的局限性和風(fēng)險(xiǎn)性。學(xué)界對(duì)生成式AI在出版界的應(yīng)用所帶來的機(jī)遇和挑戰(zhàn)展開了一系列宏觀維度的討論,主要集中在AIGC在著作版權(quán)、學(xué)術(shù)倫理、文化安全、價(jià)值觀審核等方面的風(fēng)險(xiǎn)和對(duì)編輯能力形成的新挑戰(zhàn)[2-4],以及AIGC深度介入出版流程帶來的主體地位危機(jī)、出版生態(tài)環(huán)境失衡、知識(shí)生產(chǎn)規(guī)范性[5-7]等,鮮少對(duì)大語(yǔ)言模型在教材編審等具體出版工作中的運(yùn)用展開研究。
新時(shí)代背景下,教材建設(shè)作為國(guó)家事權(quán),承擔(dān)著全面貫徹教育方針和落實(shí)立德樹人根本任務(wù)的關(guān)鍵職責(zé)。外語(yǔ)教材作為外語(yǔ)教育的重要載體,不僅是語(yǔ)言學(xué)習(xí)的工具,也是學(xué)生了解世界、塑造價(jià)值觀的重要渠道[8]。外語(yǔ)教材不僅要具備思想性、科學(xué)性、系統(tǒng)性、規(guī)范性等教材的普遍特征,還要具備外語(yǔ)教材的語(yǔ)言文化特色[9],融入國(guó)際視野,展現(xiàn)多元文化,反映時(shí)代特征。然而,傳統(tǒng)的外語(yǔ)教材主要關(guān)注外語(yǔ)的工具性,模態(tài)較為單一,偏重語(yǔ)言知識(shí)和語(yǔ)言技能的學(xué)習(xí),在人文性、思想性和時(shí)代性方面存在不足,難以滿足當(dāng)前教育需求[10]。因此,新時(shí)代外語(yǔ)教材建設(shè)的重點(diǎn)應(yīng)包括強(qiáng)化價(jià)值屬性、促進(jìn)跨學(xué)科融合以及適應(yīng)技術(shù)發(fā)展等。外語(yǔ)教材編輯需要在編審流程中協(xié)同編寫團(tuán)隊(duì),保證思想價(jià)值引領(lǐng)、創(chuàng)新語(yǔ)言學(xué)習(xí)模式、提升內(nèi)容質(zhì)量、對(duì)接數(shù)智技術(shù)發(fā)展,以應(yīng)對(duì)新時(shí)代的挑戰(zhàn)?;诖?,本文聚焦大語(yǔ)言模型工具在外語(yǔ)教材編審工作中的實(shí)際應(yīng)用,探討其中存在的風(fēng)險(xiǎn)問題,并提出相應(yīng)對(duì)策。
一、大語(yǔ)言模型輔助外語(yǔ)教材編審的主要應(yīng)用場(chǎng)景
大語(yǔ)言模型基于深度學(xué)習(xí)技術(shù),經(jīng)過大規(guī)模文本數(shù)據(jù)訓(xùn)練,能理解并生成自然語(yǔ)言文本。其中典型代表有國(guó)外OpenAI的ChatGPT系列、谷歌的Bard、Gemini,國(guó)內(nèi)的DeepSeek、訊飛星火、Kimi、文心一言、通義千問等。這些通用大語(yǔ)言模型具備強(qiáng)大的語(yǔ)言理解能力、文本生成能力和多語(yǔ)言支持等特點(diǎn),在輔助教材選題策劃和編輯加工方面可以發(fā)揮重要作用。
1.輔助教材選題策劃
選題策劃環(huán)節(jié)是外語(yǔ)教材出版過程中至關(guān)重要的部分,它決定了教材的編寫理念、目標(biāo)受眾和內(nèi)容導(dǎo)向。大語(yǔ)言模型在選題策劃環(huán)節(jié)可以有以下幾方面應(yīng)用場(chǎng)景。
一是進(jìn)行市場(chǎng)需求調(diào)研。編輯可以利用大語(yǔ)言模型進(jìn)行全方位的信息搜集和分析。一方面,生成問卷調(diào)查模板,收集教師、學(xué)生對(duì)于教材內(nèi)容、形式、難度等方面的意見和期望;另一方面,利用其文本分析功能,對(duì)市場(chǎng)上同類型教材進(jìn)行分析,找出其優(yōu)勢(shì)及不足之處,為編輯挖掘新的教材編寫視角提供參考。
二是制定教學(xué)目標(biāo)與大綱。編輯可以借助大語(yǔ)言模型的文獻(xiàn)歸納能力,分析最新的外語(yǔ)專業(yè)政策文件、教學(xué)指南和具體的課程大綱,生成教材編寫指導(dǎo)原則和參考框架,明確教材的教學(xué)目標(biāo)并生成具體細(xì)化的目標(biāo)描述。根據(jù)教學(xué)目標(biāo),大語(yǔ)言模型還可以生成初步的教學(xué)大綱草案,包括各單元、各章節(jié)的教學(xué)內(nèi)容、重點(diǎn)和難點(diǎn)等。
三是規(guī)劃內(nèi)容和選材。大語(yǔ)言模型可以生成符合教學(xué)目標(biāo)和學(xué)生興趣的主題與話題列表,并提供相關(guān)素材推薦,以及生成符合教學(xué)要求的語(yǔ)料,調(diào)整語(yǔ)料知識(shí)點(diǎn)分布與難度梯度;針對(duì)課程思政和文化意識(shí)培育的要求,大語(yǔ)言模型還可生成文化背景信息介紹,提供相關(guān)案例和教學(xué)活動(dòng)設(shè)計(jì)建議。編輯可以根據(jù)需要進(jìn)行選擇和整合,形成教材內(nèi)容選材的樣章結(jié)構(gòu)和示例供編者參考。
四是設(shè)計(jì)教材呈現(xiàn)形式。大語(yǔ)言模型可以生成版面設(shè)計(jì)、排版的建議和示例供編輯參考,以豐富教材的多模態(tài)設(shè)計(jì)。編輯可以讓大語(yǔ)言模型提供教材多媒體和交互設(shè)計(jì)方面的創(chuàng)意,助力策劃出符合新時(shí)代要求的新形態(tài)教材。
2.輔助教材編輯加工
編輯加工是提高稿件質(zhì)量的關(guān)鍵環(huán)節(jié)。大語(yǔ)言模型在外語(yǔ)教材編輯加工中的應(yīng)用場(chǎng)景主要包括以下幾個(gè)方面。
一是內(nèi)容審查。大語(yǔ)言模型可用于審查教材內(nèi)容的政治性、思想性、知識(shí)性、科學(xué)性和常識(shí)性錯(cuò)誤。由于教材中許多選文和練習(xí)可能選自外刊原文,編輯可以利用大語(yǔ)言模型的信息檢索能力查證核對(duì)背景知識(shí)內(nèi)容,通過智能語(yǔ)義分析檢測(cè)敏感詞和常識(shí)性錯(cuò)誤;利用大語(yǔ)言模型輔助評(píng)估語(yǔ)言和語(yǔ)法規(guī)范,以免教材中出現(xiàn)不地道的表達(dá)和錯(cuò)誤的語(yǔ)法解釋。對(duì)于修訂版教材,編輯可以利用大語(yǔ)言模型進(jìn)行內(nèi)容溯源和知識(shí)檢索,確認(rèn)其編寫時(shí)代背景,補(bǔ)充相應(yīng)的注釋,確保教材所涉及的數(shù)據(jù)、文化現(xiàn)象等信息得到更新。
二是語(yǔ)言校對(duì)與潤(rùn)色。編輯不僅可以利用大語(yǔ)言模型強(qiáng)大的語(yǔ)言處理能力快速檢查教材中的語(yǔ)法、拼寫、標(biāo)點(diǎn)等語(yǔ)言錯(cuò)誤,并讓其提供修改建議,還可以根據(jù)教材使用對(duì)象的情況和教學(xué)目標(biāo)的要求對(duì)教材素材進(jìn)行語(yǔ)言潤(rùn)色,調(diào)整語(yǔ)言難度,統(tǒng)一語(yǔ)言風(fēng)格,使教材內(nèi)容更易于理解和學(xué)習(xí)。
三是內(nèi)容優(yōu)化與補(bǔ)充。大語(yǔ)言模型可用于優(yōu)化和補(bǔ)充教材練習(xí)與活動(dòng)、譯文與注釋、教學(xué)資源等內(nèi)容,并根據(jù)教材內(nèi)容生成不同類型的題目和答案解析,豐富練習(xí)題類型,全面覆蓋教材中的知識(shí)點(diǎn)。同時(shí),對(duì)于教材內(nèi)容的相關(guān)譯文、知識(shí)點(diǎn)注釋等,大語(yǔ)言模型還可進(jìn)行準(zhǔn)確性分析并提供優(yōu)化建議。
四是文化元素的融入與調(diào)整。大語(yǔ)言模型可生成不同的內(nèi)容創(chuàng)意,豐富外語(yǔ)教材中的中外文化元素融入與呈現(xiàn)形式。例如,設(shè)計(jì)幫助學(xué)生理解中外文化差異的互動(dòng)活動(dòng),提供相關(guān)的跨文化案例分析,優(yōu)化教材內(nèi)容編排等。與此同時(shí),編輯可以讓大語(yǔ)言模型檢查文本中是否存在文化偏見或歧視性內(nèi)容,分析不同文化背景下文化元素的適用性和可能產(chǎn)生的誤解,并提供相應(yīng)的調(diào)整建議,增強(qiáng)教材的文化適應(yīng)性和跨文化交際效果。
二、大語(yǔ)言模型輔助外語(yǔ)教材編審的常見問題
作為一種新的工具和手段,大語(yǔ)言模型雖然在一定程度上重新定義了編輯工作,但也存在各種局限和風(fēng)險(xiǎn)。加上其不具備主體性,始終需要為人所主導(dǎo),如果編輯對(duì)其過度依賴或不合理使用,就會(huì)給工作帶來負(fù)面影響。根據(jù)筆者自身工作經(jīng)驗(yàn),主要有以下幾類常見問題。
1.語(yǔ)言檢測(cè)、生成內(nèi)容套路化
盡管大語(yǔ)言模型可以高效生成內(nèi)容,對(duì)文本進(jìn)行快速處理,但在對(duì)文本進(jìn)行語(yǔ)言檢測(cè)時(shí)會(huì)產(chǎn)生“套路化生成”的問題,其本質(zhì)上是基于概率的上下文匹配機(jī)制與語(yǔ)言檢測(cè)所需的“精確事實(shí)核查”之間存在底層邏輯沖突。
外語(yǔ)教材編審工作中常見的一種情況是,在處理拼寫統(tǒng)一性、錯(cuò)誤問題定位等需要精確匹配的任務(wù)時(shí),模型可能會(huì)為滿足用戶指令而“偽造”數(shù)據(jù)。例如,編輯使用訊飛星火檢測(cè)長(zhǎng)篇英文閱讀材料文本中是否存在單詞英式拼寫和美式拼寫同時(shí)存在的問題,并要求其定位到具體的原文位置。模型雖列出了7組單詞“英式—美式”拼寫對(duì)照,但僅前2組真實(shí)存在于原文,而虛構(gòu)了5組詞。模型在定位時(shí)為其中3詞編造了原文未出現(xiàn)的語(yǔ)境,剩下2詞則直接承認(rèn)“未在原文中找到對(duì)應(yīng)內(nèi)容”。這種“先結(jié)論后補(bǔ)證”的生成邏輯,暴露了大語(yǔ)言模型為追求回答完整性的套路化問題。
類似的語(yǔ)言檢測(cè)套路化問題在各類大語(yǔ)言模型工具中經(jīng)常出現(xiàn),脫離文本事實(shí)生成虛假結(jié)果(如虛構(gòu)原文句子、錯(cuò)誤匹配拼寫差異)或輸出邏輯混亂的錯(cuò)誤建議(如機(jī)械組合近義詞導(dǎo)致語(yǔ)義矛盾)等,導(dǎo)致編輯需花費(fèi)額外精力去驗(yàn)證,無(wú)形中降低了工作效率。
為了提高編輯效率,編輯常常會(huì)利用互聯(lián)網(wǎng)等工具輔助查證內(nèi)容。大語(yǔ)言模型工具雖為編輯查證工作提供了便捷,但在信息查證與生成可信度方面存在風(fēng)險(xiǎn),主要表現(xiàn)為數(shù)據(jù)質(zhì)量參差與時(shí)效性缺失兩方面。
一方面,由于大語(yǔ)言模型的算法邏輯、訓(xùn)練數(shù)據(jù)來源和語(yǔ)言處理策略的不同,同類問題不同模型的輸出結(jié)果常常出現(xiàn)矛盾。例如,在查證某大學(xué)英語(yǔ)教材中“For an artist, if he can break the rules, completely free to create, the achievement is often amazing.”一句的出處時(shí),不同大語(yǔ)言模型工具呈現(xiàn)顯著分歧,同一工具用中文和英文提問,給出的答案也會(huì)出現(xiàn)不一致的情況:Kimi認(rèn)為該句可能是Pablo Picasso的觀點(diǎn);ChatGPT在用英文提問時(shí)回答該句出自王羲之之口,用中文提問時(shí)則稱無(wú)明確出處;訊飛星火在用英文提問時(shí)回答該句沒有具體出處,用中文提問時(shí)則回答出自愛因斯坦。這一案例暴露出模型對(duì)非結(jié)構(gòu)化文本(如名人名言)的溯源能力較為薄弱,其答案本質(zhì)是基于概率的“最佳猜測(cè)”,而非真正事實(shí)的檢索結(jié)果。
另一方面,大語(yǔ)言模型的訓(xùn)練數(shù)據(jù)通常截止到特定時(shí)間點(diǎn),因此無(wú)法處理動(dòng)態(tài)更新的現(xiàn)實(shí)事件,進(jìn)而影響了回答的準(zhǔn)確性,有時(shí)甚至?xí)谶^時(shí)的邏輯生成虛假內(nèi)容。以更新教材聽力練習(xí)中有關(guān)美國(guó)2024大選的新聞材料為例,編輯給出指令要求ChatGPT生成一篇英文報(bào)道,模型很快輸出了一篇語(yǔ)言上符合規(guī)范的新聞?wù)Z篇,但內(nèi)容卻是拜登贏得大選,并報(bào)道了詳細(xì)選票情況,與當(dāng)時(shí)剛結(jié)束的大選實(shí)際結(jié)果完全相悖。這種滯后性在教材編審中尤為危險(xiǎn),若直接采用模型生成的時(shí)效性內(nèi)容(如科技前沿、政策動(dòng)態(tài)、國(guó)際事件等),可能導(dǎo)致教材收錄過時(shí)或錯(cuò)誤信息,誤導(dǎo)學(xué)習(xí)者。
2.話題處理存在局限
在教材編審過程中,編輯需要處理內(nèi)容中涉及的各類話題,有時(shí)需要對(duì)話題語(yǔ)篇進(jìn)行語(yǔ)言和內(nèi)容優(yōu)化,有時(shí)需要對(duì)語(yǔ)句段落進(jìn)行翻譯注釋、詞匯講解,有時(shí)則需要針對(duì)語(yǔ)篇設(shè)計(jì)閱讀理解及語(yǔ)言操練習(xí)題。大語(yǔ)言模型在很多時(shí)候都能夠提供一定輔助,但也會(huì)出現(xiàn)局限性。這可能受制于領(lǐng)域知識(shí)邊界與敏感內(nèi)容管控機(jī)制,也可能存在深度語(yǔ)義加工能力的結(jié)構(gòu)性缺失。
在涉及政治、文化等敏感領(lǐng)域的語(yǔ)篇處理中,國(guó)內(nèi)大語(yǔ)言模型(如訊飛星火、Kimi等)普遍采用“關(guān)鍵詞觸發(fā)式過濾”機(jī)制。當(dāng)輸入文本包含模型預(yù)設(shè)敏感詞時(shí),對(duì)話會(huì)直接終止,或者提示“換個(gè)話題聊”。如編輯上傳涉及政治性議題的閱讀材料時(shí),可能會(huì)遇到即使內(nèi)容僅為客觀事件描述,但因關(guān)鍵詞匹配被誤判為“敏感內(nèi)容”的情況。對(duì)于無(wú)明確敏感詞但涉及價(jià)值觀沖突的話題,大語(yǔ)言模型可能因?yàn)橛?xùn)練數(shù)據(jù)缺乏多元語(yǔ)境標(biāo)注,或者現(xiàn)階段訓(xùn)練尚未涉及該話題的學(xué)習(xí)而生成模糊化表述,或提示無(wú)法處理這個(gè)話題。這反映了大語(yǔ)言模型對(duì)現(xiàn)實(shí)語(yǔ)義語(yǔ)境缺乏真實(shí)理解,其“黑箱化”風(fēng)控機(jī)制與教材編審中對(duì)話題“精準(zhǔn)化處理”需求之間形成沖突。
在專業(yè)內(nèi)容加工場(chǎng)景(如閱讀理解題設(shè)計(jì)、語(yǔ)篇思想性解析)中,大語(yǔ)言模型也會(huì)暴露其對(duì)話題處理的局限性,主要體現(xiàn)為對(duì)一些話題處理不具體,生成膚淺文本,沒有深入或詳細(xì)地解決問題等。例如,當(dāng)編輯要求針對(duì)語(yǔ)篇生成閱讀理解題時(shí),大語(yǔ)言模型工具提供的多為針對(duì)事實(shí)性信息的問題,而較難生成需要語(yǔ)義推理、邏輯關(guān)聯(lián)性的問題。因此,對(duì)于一些基礎(chǔ)性的習(xí)題設(shè)計(jì)和編輯優(yōu)化,如詞匯操練、事實(shí)信息查找類習(xí)題,大語(yǔ)言模型確實(shí)可以輔助編寫和優(yōu)化,但對(duì)于深層次的閱讀理解和思想性的考查,則不能太依賴大語(yǔ)言模型來優(yōu)化。
此外,在外語(yǔ)教材編審中,價(jià)值取向的精準(zhǔn)把控直接關(guān)系到文化傳播的正確性與育人功能的實(shí)現(xiàn),但目前大語(yǔ)言模型對(duì)于文化符號(hào)的處理在深層價(jià)值邏輯構(gòu)建方面還不夠成熟,處理相關(guān)話題的能力也存在局限性。以中華優(yōu)秀傳統(tǒng)文化內(nèi)容的呈現(xiàn)為例,當(dāng)編輯使用大語(yǔ)言模型輔助設(shè)計(jì)“中國(guó)傳統(tǒng)節(jié)日”主題的英語(yǔ)閱讀材料時(shí),由于訓(xùn)練數(shù)據(jù)的局限性,模型往往只能提供春節(jié)、中秋等節(jié)日的基礎(chǔ)習(xí)俗介紹,如“春節(jié)吃餃子、放鞭炮”“中秋賞月、吃月餅”等,生成內(nèi)容多停留在物質(zhì)層面的描述,難以將節(jié)日背后蘊(yùn)含的團(tuán)圓和睦的家庭觀等深層思考融入其中。
3.版權(quán)歸屬與數(shù)據(jù)隱私問題
AI生成內(nèi)容的版權(quán)歸屬模糊以及相關(guān)的數(shù)據(jù)隱私問題一直為業(yè)界所關(guān)注,但目前法律尚未明確大語(yǔ)言模型生成的內(nèi)容是否具有版權(quán),以及版權(quán)歸屬于誰(shuí)。編輯在外語(yǔ)教材編審過程中使用生成內(nèi)容時(shí),很難區(qū)分哪些內(nèi)容是AI獨(dú)立生成的,哪些是基于受版權(quán)保護(hù)的訓(xùn)練數(shù)據(jù)生成的,如果在設(shè)計(jì)教材多模態(tài)內(nèi)容時(shí),采用的AI生成圖片或視頻涉及對(duì)版權(quán)作品的引用或改編,就會(huì)造成侵權(quán)行為。當(dāng)編輯使用大語(yǔ)言模型生成學(xué)術(shù)類教材的文獻(xiàn)綜述時(shí),模型可能直接復(fù)制訓(xùn)練數(shù)據(jù)中的段落表述(如某篇期刊論文的核心觀點(diǎn)),而編輯難以通過“反向檢索”識(shí)別這些內(nèi)容是否源于受保護(hù)的版權(quán)作品。在教材編審過程中,編輯上傳至大語(yǔ)言模型的教材文本(含未出版內(nèi)容、編寫思路等)可能被平臺(tái)服務(wù)器長(zhǎng)期存儲(chǔ),存在“數(shù)據(jù)二次利用”風(fēng)險(xiǎn)。在建設(shè)數(shù)字教材時(shí),如果接入大語(yǔ)言模型進(jìn)行“個(gè)性化”定制服務(wù)(如AI答疑、學(xué)習(xí)行為分析等),則需要收集用戶的個(gè)人信息和行為數(shù)據(jù),而我國(guó)現(xiàn)行法律對(duì)于AI數(shù)據(jù)收集的邊界和使用范圍尚無(wú)明確規(guī)定。因此,在知識(shí)產(chǎn)權(quán)不透明、缺乏對(duì)“合理使用”清晰界定的情況下,在外語(yǔ)教材中使用大語(yǔ)言模型生成內(nèi)容,可能會(huì)面臨法律風(fēng)險(xiǎn)問題。
三、大語(yǔ)言模型輔助外語(yǔ)教材編審的對(duì)策建議
針對(duì)外語(yǔ)教材出版編審工作中使用大語(yǔ)言模型面臨的風(fēng)險(xiǎn),我們應(yīng)從行業(yè)、企業(yè)、編輯等多個(gè)層面作出應(yīng)對(duì),以確保技術(shù)服務(wù)于出版產(chǎn)業(yè)的健康可持續(xù)發(fā)展。
1.建立“AI初檢—人工復(fù)核—多源驗(yàn)證”三級(jí)機(jī)制
針對(duì)大語(yǔ)言模型在語(yǔ)言檢測(cè)中可能出現(xiàn)的套路化回答,以及生成內(nèi)容信息不準(zhǔn)確的問題,編輯工作流程應(yīng)建立“AI初檢—人工復(fù)核—多源驗(yàn)證”的三級(jí)審核與驗(yàn)證機(jī)制。在語(yǔ)言檢測(cè)環(huán)節(jié),盡管大語(yǔ)言模型能夠快速生成答案,但鑒于AI算法的復(fù)雜性和低透明度,編輯不能完全依賴其結(jié)果,在利用大語(yǔ)言模型進(jìn)行語(yǔ)言校對(duì)初檢后,必須對(duì)檢測(cè)結(jié)果進(jìn)行人工復(fù)核。例如,對(duì)于 AI 生成的拼寫、語(yǔ)法檢測(cè)結(jié)果,編輯應(yīng)進(jìn)行100%原文比對(duì),重點(diǎn)核查 AI 標(biāo)注的“問題位置”是否真實(shí)存在。在信息查證環(huán)節(jié),對(duì)名人名言、時(shí)效性數(shù)據(jù)等關(guān)鍵內(nèi)容,編輯應(yīng)采用多源驗(yàn)證的方式,結(jié)合兩個(gè)以上其他權(quán)威數(shù)據(jù)庫(kù)或信息渠道(如學(xué)術(shù)期刊、政府官網(wǎng)等)進(jìn)行交叉驗(yàn)證,杜絕單一AI模型的結(jié)論,從而有效提升教材編審的質(zhì)量和準(zhǔn)確性。
2.開發(fā)垂類AI工具,強(qiáng)化編輯把關(guān)
鑒于通用大語(yǔ)言模型在處理外語(yǔ)教材編審工作中存在的專業(yè)性短板,需進(jìn)一步優(yōu)化技術(shù)工具和人工審核的協(xié)同機(jī)制。一方面,出版單位可以與技術(shù)公司合作開發(fā)垂類AI工具,解決處理專業(yè)話題時(shí)存在的針對(duì)性不足等問題。出版單位可利用豐富的內(nèi)容資源和專業(yè)的編輯團(tuán)隊(duì)提供高質(zhì)量的內(nèi)容數(shù)據(jù)用于模型訓(xùn)練,技術(shù)公司可采用“大模型+小樣本”的技術(shù)路徑,針對(duì)外語(yǔ)教材編審的語(yǔ)言模式、專業(yè)術(shù)語(yǔ)和內(nèi)容要求對(duì)模型進(jìn)行深度優(yōu)化。例如,使用外語(yǔ)教材高頻語(yǔ)料(如課標(biāo)詞匯、跨文化話題、習(xí)題設(shè)計(jì)模板等)訓(xùn)練模型,能更好地理解和處理外語(yǔ)教材的語(yǔ)言風(fēng)格和知識(shí)體系,尤其是中外文化差異、學(xué)術(shù)規(guī)范、敏感話題分級(jí)處理等專業(yè)需求,彌補(bǔ)通用模型在推理性習(xí)題設(shè)計(jì)、政治文化內(nèi)容處理上的不足,為外語(yǔ)教材編審工作提供更有力的支持。
另一方面,編輯在使用 AI 工具編審教材時(shí),需加強(qiáng)對(duì)政治方向、價(jià)值取向的把關(guān),對(duì)內(nèi)容進(jìn)行深度審查與重構(gòu)。在涉及中國(guó)文化元素和價(jià)值觀念的內(nèi)容編寫上,編輯應(yīng)確保 AI 生成內(nèi)容能夠準(zhǔn)確傳遞社會(huì)主義核心價(jià)值觀。例如,當(dāng)編輯使用AI工具生成關(guān)于“工匠精神”的外語(yǔ)素材時(shí),要審查生成內(nèi)容是否流于表面,并根據(jù)需要進(jìn)一步豐富內(nèi)容,強(qiáng)調(diào)其蘊(yùn)含的精益求精、敬業(yè)奉獻(xiàn)等精神內(nèi)核,以及在當(dāng)代中國(guó)建設(shè)發(fā)展中的重要作用。
3.加強(qiáng)版權(quán)管理與數(shù)據(jù)安全保護(hù)
針對(duì)大語(yǔ)言模型輔助外語(yǔ)教材編審過程中存在的知識(shí)產(chǎn)權(quán)不透明問題,出版單位和編輯需強(qiáng)化版權(quán)管理意識(shí),采取有效措施保護(hù)數(shù)據(jù)安全。出版單位應(yīng)建立健全版權(quán)審查機(jī)制,對(duì)使用大語(yǔ)言模型生成的教材內(nèi)容進(jìn)行出版前的合規(guī)審查,避免潛在的法律風(fēng)險(xiǎn)。同時(shí),加強(qiáng)數(shù)據(jù)安全管理,與大語(yǔ)言模型服務(wù)商簽訂《數(shù)據(jù)保密協(xié)議》,明確教材文本、用戶信息的儲(chǔ)存期限與使用范圍。在數(shù)字教材個(gè)性化服務(wù)中,出版單位應(yīng)遵守相關(guān)法律法規(guī),規(guī)范收集使用者的個(gè)人信息,對(duì)數(shù)據(jù)進(jìn)行加密處理,避免觸犯?jìng)惱砗碗[私保護(hù)問題。編輯應(yīng)提高自身數(shù)字素養(yǎng),重視AI生成內(nèi)容的版權(quán)問題。對(duì)于改編自版權(quán)作品的圖片、文本等素材,編輯應(yīng)要求模型提供原始數(shù)據(jù)授權(quán)證明,或者改為使用無(wú)版權(quán)素材庫(kù)進(jìn)行AI創(chuàng)作。同時(shí),還要注意在AI生成內(nèi)容中標(biāo)注“AI輔助創(chuàng)作”,在教材版權(quán)頁(yè)標(biāo)注 AI 輔助創(chuàng)作比例,提高知識(shí)產(chǎn)權(quán)的透明度。
四、結(jié)語(yǔ)
大語(yǔ)言模型輔助外語(yǔ)教材編審工作既是技術(shù)賦能出版業(yè)的變革性實(shí)踐,也是對(duì)編輯數(shù)字素養(yǎng)、價(jià)值判斷能力的系統(tǒng)性考驗(yàn)。這一過程本質(zhì)上反映的是技術(shù)工具理性與教育人文價(jià)值之間的深層互動(dòng),編輯工作的核心也需要轉(zhuǎn)向技術(shù)與人文的平衡,實(shí)現(xiàn)人機(jī)的協(xié)同與競(jìng)合[11]。本文思考的對(duì)策不只是對(duì)當(dāng)前問題的響應(yīng),更指向出版業(yè)智能化轉(zhuǎn)型的深層命題:如何在享受技術(shù)紅利的同時(shí),堅(jiān)守教材作為“文化載體”和“育人媒介”的本質(zhì)屬性。
大語(yǔ)言模型的迭代速度遠(yuǎn)超制度與認(rèn)知更新,其挑戰(zhàn)也將隨著應(yīng)用的深化持續(xù)演變。但無(wú)論技術(shù)如何演進(jìn),外語(yǔ)教材編審的核心始終是對(duì)知識(shí)準(zhǔn)確性的苛求、對(duì)文化傳播責(zé)任的擔(dān)當(dāng),以及對(duì)培養(yǎng)兼具中國(guó)情懷與國(guó)際視野人才這一教育目標(biāo)的執(zhí)著。未來研究可圍繞外語(yǔ)教材編審專用模型優(yōu)化、編輯 AI 素養(yǎng)培養(yǎng)、跨文化價(jià)值觀審核標(biāo)準(zhǔn)等方向展開,提供更有針對(duì)性的解決方案。出版行業(yè)需盡快就AIGC的使用規(guī)范達(dá)成共識(shí),加強(qiáng)技術(shù)監(jiān)管,制定相關(guān)行為框架和指南,在擁抱AI技術(shù)帶來的效率革新的同時(shí),筑牢人工審核的質(zhì)量防線[12]。只有堅(jiān)守以內(nèi)容為本、以價(jià)值為綱的初心,才能讓大語(yǔ)言模型真正服務(wù)于打造培根鑄魂、啟智增慧的教材。
|參考文獻(xiàn)|
[1] 譚春林,王建平. AIGC在學(xué)術(shù)研究和出版中的使用邊界、透明度與倫理 [J]. 編輯學(xué)報(bào),2024(6):661-666.
[2]趙凱. 版權(quán)、倫理與價(jià)值觀審核 :人工智能生成內(nèi)容(AIGC)對(duì)編輯職業(yè)能力的新挑戰(zhàn). [J]. 科技與出版,2023(8):62-68.
[3]方卿,丁靖佳. 人工智能生成內(nèi)容(AIGC)的三個(gè)出版學(xué)議題 [J]. 出版科學(xué),2023 (2):5-10.
[4]劉珍,趙云澤. 技術(shù)邏輯、實(shí)現(xiàn)方式與現(xiàn)實(shí)邊界 :生成式 AI 對(duì)出版業(yè)的深層影響 [J]. 中國(guó)出版 ,2023(15):11-16.
[5]李麗萍. AIGC 嵌入出版生態(tài)系統(tǒng)演化進(jìn)程、機(jī)理變革及風(fēng)險(xiǎn)化解 [J]. 中國(guó)出版,2024(4):35-40.
[6]王鵬濤. AIGC出版背景下知識(shí)生產(chǎn)合規(guī)化困境與調(diào)適[J]. 編輯之友,2024(3):14-22.
[7]王飚,魏婧. “人—技”關(guān)系視域下 AI 在出版行業(yè)的創(chuàng)新應(yīng)用 [J]. 出版廣角,2024(13):16-20.
[8]何蓮珍. 新時(shí)代大學(xué)英語(yǔ)教學(xué)的新要求:《大學(xué)英語(yǔ)教學(xué)指南》修訂依據(jù)與要點(diǎn) [J]. 外語(yǔ)界,2020(4):13-18.
[9]文秋芳. 構(gòu)建大學(xué)外語(yǔ)教材編寫理論體系 [J]. 外國(guó)語(yǔ),2023(6):2-11.
[10]徐錦芬. 新時(shí)代高校外語(yǔ)教材建設(shè)路徑 [J]. 外語(yǔ)教材研究,2023(0):1-11.
[11]李莎,鄭偉. 生成式人工智能在學(xué)術(shù)期刊出版中的應(yīng)用研究 [J]. 出版廣角,2025(2):123-128.
[12]鄭泉,賴明東. AIGC驅(qū)動(dòng)學(xué)術(shù)出版變革的挑戰(zhàn)與應(yīng)對(duì) [J]. 出版廣角,2024(23):57-61.