【摘 要】在政府部門的高度重視下,融合出版成為出版業(yè)新的增長點,出版企業(yè)逐漸展開應(yīng)用新技術(shù)的探索。2023年大模型技術(shù)爆發(fā)式發(fā)展,在語音識別、圖像識別、自然語言處理等領(lǐng)域取得了很好的效果,適合應(yīng)用于教育融合出版產(chǎn)品的生產(chǎn)。探討將大模型技術(shù)應(yīng)用于教育融合出版產(chǎn)品的路徑,分析教育融合出版產(chǎn)品的開發(fā)現(xiàn)狀,展望大模型技術(shù)在教育融合出版產(chǎn)品的發(fā)展中發(fā)揮的作用,能夠為教育出版單位的融合發(fā)展提供有益參考。
【關(guān)" 鍵" 詞】大模型;教育融合;出版產(chǎn)品;ChatGPT
【作者單位】程秦豫,廣西教育出版社有限公司。
【中圖分類號】G237.9 【文獻(xiàn)標(biāo)識碼】A 【DOI】10.16491/j.cnki.cn45-1216/g2.2023.21.014
2022年4月,中共中央宣傳部印發(fā)《關(guān)于推動出版深度融合發(fā)展的實施意見》,要求緊盯技術(shù)發(fā)展前沿,用好信息技術(shù)革命成果,強化大數(shù)據(jù)、云計算、人工智能、區(qū)塊鏈等技術(shù)應(yīng)用,創(chuàng)新驅(qū)動出版深度融合發(fā)展。按照國家對出版行業(yè)的部署安排,出版行業(yè)要想高質(zhì)量發(fā)展,就必須要走融合發(fā)展的道路,必須強化出版融合發(fā)展內(nèi)容建設(shè),充分發(fā)揮技術(shù)的支撐作用,這就要求出版行業(yè)對新技術(shù)高度關(guān)注,積極以先進(jìn)技術(shù)賦能出版產(chǎn)業(yè)鏈,成為運用先進(jìn)技術(shù)的主要用戶,同時關(guān)注技術(shù)的可操作性和普遍性。2023年,大模型技術(shù)爆發(fā)式發(fā)展,未來該技術(shù)將在教育融合出版產(chǎn)品的發(fā)展中發(fā)揮怎樣的作用,是許多教育出版人關(guān)心的問題。
一、大模型技術(shù)介紹
大模型是指具有大量參數(shù)的深度學(xué)習(xí)或機器學(xué)習(xí)模型,可對客觀存在的事物與系統(tǒng)進(jìn)行模仿,描述客觀事物與系統(tǒng)的內(nèi)部結(jié)構(gòu)、關(guān)系和法則[1]。大模型包括很多層神經(jīng)網(wǎng)絡(luò)和訓(xùn)練參數(shù),這些模型可以有數(shù)億個甚至數(shù)十億個參數(shù)量,相對于傳統(tǒng)的小型模型來說具有更強的表現(xiàn)力和更高的準(zhǔn)確率。大模型的訓(xùn)練和推理需要大量的計算資源和存儲空間,在實踐中通常需要使用高性能計算和分布式訓(xùn)練等技術(shù)來應(yīng)對這些問題。目前,大模型在語音識別、圖像識別、自然語言處理等領(lǐng)域已經(jīng)取得了很好的效果。
當(dāng)前,廣泛流行的大模型應(yīng)用為人工智能對話聊天機器人ChatGPT。ChatGPT是由OpenAI開發(fā)的一種基于GPT(Generative Pre-trained Transformer)模型的聊天助手,它是使用大規(guī)模數(shù)據(jù)集進(jìn)行預(yù)訓(xùn)練的語言生成模型,可以回答用戶的問題。ChatGPT自推出后不僅得到學(xué)術(shù)界、產(chǎn)業(yè)界的廣泛關(guān)注,在非技術(shù)領(lǐng)域的普通民眾中也引起了較大反響,更推動了人工智能生成技術(shù)的快速發(fā)展。由于在處理各種主題和任務(wù)時表現(xiàn)出色,能夠與用戶進(jìn)行連貫的交互,能夠理解上下文、生成流暢的文本,并且可以通過多輪對話與用戶進(jìn)行更深入的交流,ChatGPT已被廣泛應(yīng)用于教育、醫(yī)療、商務(wù)、司法等領(lǐng)域,甚至深入民眾的普通生活。
ChatGPT于2022年底推出,被許多科學(xué)家認(rèn)為是宣告大模型時代到來的一個標(biāo)志。自此,大模型技術(shù)發(fā)展速度陡然加快,各種產(chǎn)品紛至沓來:百度推出“文心一言”;阿里巴巴推出“通義千問”;字節(jié)跳動發(fā)布大模型訓(xùn)練云平臺;金山辦公推出生成式人工智能應(yīng)用;華為推出“盤古大模型”[2]。2023年5月28日,中國科學(xué)技術(shù)信息研究所所長趙志耘在2023中關(guān)村論壇“人工智能大模型發(fā)展”平行論壇上發(fā)布的《中國人工智能大模型地圖研究報告》顯示,目前中國大模型產(chǎn)業(yè)發(fā)展迅猛,其中,北京擁有38個AI大模型,廣東擁有20個,產(chǎn)品數(shù)量居全國前兩位,我國10億參數(shù)規(guī)模以上的AI大模型有79個,14個省市開展了 AI大模型研究[3]。
許多大模型產(chǎn)品已在各行各業(yè)中廣泛落地使用:用AI預(yù)測用電的高峰波谷從而為電網(wǎng)調(diào)度提供建議;為汽車提供人工智能基礎(chǔ)設(shè)施平臺,為用戶提供更好的智能汽車體驗;為交通領(lǐng)域提供智能交通解決方案,監(jiān)控車流量自動調(diào)節(jié)紅綠燈,緩解擁堵狀況[4];利用大模型技術(shù)的政務(wù)智慧助手,可將民眾的話語轉(zhuǎn)換為政務(wù)辦事語言,從而理解民眾咨詢意圖,提供更加便捷、準(zhǔn)確的政務(wù)服務(wù);利用礦山大模型,覆蓋煤礦的采、掘、機、運、通、洗選等業(yè)務(wù)流程下的1000多個細(xì)分場景,讓更多的煤礦工人能夠在地面上作業(yè),提高作業(yè)安全系數(shù);利用鐵路大模型,精準(zhǔn)識別多種貨車及故障,提高貨運檢查效率[5]??梢哉f,大模型已在不知不覺中深入社會生活的方方面面。
二、教育融合出版產(chǎn)品開發(fā)現(xiàn)狀
黨的二十大報告強調(diào)“推進(jìn)教育數(shù)字化,建設(shè)全民終身學(xué)習(xí)的學(xué)習(xí)型社會、學(xué)習(xí)型大國”,標(biāo)志著推進(jìn)教育數(shù)字化已經(jīng)成為普遍共識。教育融合出版是教育數(shù)字化的重要組成部分,即將教育資源與先進(jìn)科技手段相結(jié)合,通過融合出版的形式將教育融合出版產(chǎn)品提供給學(xué)生和教師使用。教育融合出版產(chǎn)品形態(tài)通常包括以紙質(zhì)圖書、音視頻、互動內(nèi)容、應(yīng)用程序、VR/AR等富媒體形式展現(xiàn)的教材、教輔、課程、課件等,能夠為學(xué)生提供更豐富、更靈活的學(xué)習(xí)資源和學(xué)習(xí)方式,為教師提供多種場景、多種手段、多種內(nèi)容的教學(xué)輔助。教育融合出版旨在增強學(xué)生的學(xué)習(xí)效果,提高教師的教學(xué)效率,滿足不同學(xué)生的個性化需求。
教育出版企業(yè)作為從事黨的宣傳思想文化工作的重要組成部分,必然要承擔(dān)起“舉旗幟、聚民心、育新人、興文化、展形象”的使命任務(wù),充分發(fā)揮其在教育融合出版工作中的作用。教育出版企業(yè)具有開展教育融合出版工作的先天的優(yōu)勢。首先,教育出版企業(yè)具有大量的實體產(chǎn)品作為內(nèi)容支撐,如教材、教輔等。此類產(chǎn)品一般標(biāo)準(zhǔn)明確,結(jié)構(gòu)較為完整,內(nèi)容成體系,表達(dá)嚴(yán)謹(jǐn)且規(guī)范,達(dá)到符合政策、關(guān)注基礎(chǔ)、內(nèi)容科學(xué)的標(biāo)準(zhǔn),是教學(xué)活動中的基礎(chǔ)性產(chǎn)品和核心產(chǎn)品。以此類實體產(chǎn)品作為支撐形成的教育融合出版產(chǎn)品,風(fēng)險相對較小,具備內(nèi)容優(yōu)勢。其次,教育出版企業(yè)一般都具備獨有的作者資源優(yōu)勢,擁有專業(yè)的作者資源,如各地教研所的研究員、優(yōu)秀教師、相關(guān)部門的教育專家等。這些作者的教學(xué)知識儲備及教學(xué)經(jīng)驗豐富,能更好地與教育融合出版產(chǎn)品開發(fā)團(tuán)隊合作,加強產(chǎn)品的適用性、實用性。最后,教育出版企業(yè)一般納入國資或宣傳部門管理,對政策理解深、執(zhí)行力強,重視社會效益,較之于技術(shù)公司、社會教育機構(gòu)等,社會形象更好,公信力更強,推出的教育融合出版產(chǎn)品權(quán)威性、推廣性更強。
雖然具備以上優(yōu)勢,但是教育出版企業(yè)在開發(fā)教育出版融合產(chǎn)品時也存在許多實際困難。首先,教育出版企業(yè)大多不具備信息技術(shù)開發(fā)能力,其從業(yè)人員多集中在編校、內(nèi)容、發(fā)行等方面,融合產(chǎn)品的信息技術(shù)開發(fā)工作通常交由相關(guān)的技術(shù)公司負(fù)責(zé)。由于市場信息不對稱以及教育出版企業(yè)天然的信息技術(shù)劣勢,教育出版企業(yè)常常要付出較高的開發(fā)成本,且需求內(nèi)容常常出現(xiàn)偏差。其次,在教育融合出版產(chǎn)品的生產(chǎn)過程中,教育出版企業(yè)需要面對海量的內(nèi)容組稿和審核工作。比如制作學(xué)科類數(shù)字教材或課件,需要對不同年級、不同版本的內(nèi)容進(jìn)行審核,耗費大量人力、物力和時間。再次,在利用教材、教輔等實體產(chǎn)品的內(nèi)容資源開發(fā)教育融合出版產(chǎn)品時,教育出版企業(yè)現(xiàn)有的技術(shù)在內(nèi)容資源的構(gòu)建和自動生成方面仍有較大不足,欠缺將內(nèi)容資源加工整理、挖掘提升、形態(tài)轉(zhuǎn)換的能力,導(dǎo)致生產(chǎn)的教育融合出版產(chǎn)品大多由內(nèi)容的簡單整理或數(shù)字化而來。最后,教育出版企業(yè)整體對產(chǎn)品的融合不充分,應(yīng)用簡單,開發(fā)成本高。當(dāng)前,各種各樣的技術(shù)、概念進(jìn)入教育融合出版領(lǐng)域,這些技術(shù)的融入促使教育融合出版領(lǐng)域更新了產(chǎn)品的呈現(xiàn)形態(tài),但未能在更深層次上完成產(chǎn)品的融合出版,未能貫穿“教、學(xué)、評、測、管”各個維度,也未能從根本上實現(xiàn)教學(xué)方式、教學(xué)場景、個性化教學(xué)等方面的本質(zhì)提升[6]。
三、大模型對教育融合出版產(chǎn)品發(fā)展的影響展望
大模型技術(shù)擁有強大的語音識別、圖像識別、自然語言處理能力,十分適合應(yīng)用于教育融合出版產(chǎn)品的生產(chǎn)。作為教育數(shù)字化的重要組成部分,教育融合出版與大模型技術(shù)的深度融合已是行業(yè)趨勢。利用大模型技術(shù),可基于海量信息挖掘教育出版選題、基于學(xué)科資源生成教學(xué)資源、基于教學(xué)數(shù)據(jù)采集提供個性化教育出版發(fā)行服務(wù)等,對教育融合出版產(chǎn)品的發(fā)展產(chǎn)生深遠(yuǎn)影響。
1.降低教育融合出版產(chǎn)品開發(fā)成本
大模型技術(shù)的飛速發(fā)展將迅速推動大模型的技術(shù)成本轉(zhuǎn)向固定成本。有學(xué)者以信息生態(tài)系統(tǒng)為例進(jìn)行過論證,以地圖為例,20世紀(jì)90年時人們出去旅游還需要購買地圖,但現(xiàn)在不會有人再購買旅游地圖,因為有百度地圖、高德地圖等多種地圖應(yīng)用產(chǎn)品。對用戶來說,使用此類產(chǎn)品幾乎沒有成本,但成本并沒有消失,只是技術(shù)的發(fā)展促使用戶獲取和分發(fā)地圖信息的成本降低。對提供地圖服務(wù)的谷歌等公司來說,每次用戶的使用成本不到1美分,但谷歌在一年時間內(nèi)大約花了10億美元的固定成本才開發(fā)了這個產(chǎn)品。也就是說,獲取地圖信息的技術(shù)成本轉(zhuǎn)向了固定成本,同理,其他的信息服務(wù)也是如此,這讓信息服務(wù)無處不在[7]??梢灶A(yù)見的是,教育出版類的通用大模型將像電能、汽車、交通、政務(wù)、金融、制造、礦山、氣象等領(lǐng)域的大模型產(chǎn)品一樣迅速出現(xiàn)并迭代,廣泛應(yīng)用于教育出版領(lǐng)域,而且在信息技術(shù)飛速發(fā)展的今天,大模型產(chǎn)品的技術(shù)成本轉(zhuǎn)向固定成本的速度將會遠(yuǎn)遠(yuǎn)高于信息生態(tài)系統(tǒng)產(chǎn)品的固定成本轉(zhuǎn)換速度。這將會大幅度降低教育出版企業(yè)應(yīng)用大模型技術(shù)的難度和成本,從而降低教育融合出版產(chǎn)品的開發(fā)成本。
2.為教育融合出版產(chǎn)品提供高質(zhì)量的內(nèi)容生成
大模型技術(shù)的機器學(xué)習(xí)模型參數(shù)量巨大,相較于傳統(tǒng)的小型模型,具有更強的表現(xiàn)力和更高的準(zhǔn)確率,因此其自然語言處理能力和文本生成能力更強,可以生成質(zhì)量高且具有豐富細(xì)節(jié)的教育內(nèi)容。因此,人工智能生成內(nèi)容在教育融合出版領(lǐng)域已成為一種新型內(nèi)容生產(chǎn)和創(chuàng)作方式,這能夠為教育融合出版領(lǐng)域提供更豐富、多樣化的教學(xué)資源,滿足教師和學(xué)生的需求。利用大模型技術(shù)可以順利地幫助教師開展教學(xué)活動:生成教學(xué)大綱、課程計劃等教師備課資源;幫助教師迅速鎖定課程的核心知識點并同步生成相關(guān)教學(xué)內(nèi)容;可以按照教師要求的知識點形成試卷等資源。目前,已有部分出版機構(gòu)布局了內(nèi)容生成相關(guān)項目,如人民教育出版社專門建立“人教數(shù)字AIGC實驗室”項目,對ChatGPT等大模型進(jìn)行測試,評估人工智能生成文本、圖片、音視頻等的應(yīng)用可行性,以便更好地用人工智能來輔助教育出版物的內(nèi)容創(chuàng)作[8]。
3.推進(jìn)教育融合出版產(chǎn)品的個性化
大模型能夠根據(jù)不同學(xué)生的需求和學(xué)習(xí)風(fēng)格生成獨特的“大模型教師”,配備個性化的學(xué)習(xí)內(nèi)容和學(xué)習(xí)方案,實現(xiàn)教育融合出版產(chǎn)品的個性化。例如,利用大模型技術(shù),教育融合出版產(chǎn)品可采集學(xué)生作業(yè)、考試等學(xué)習(xí)數(shù)據(jù),智能分析學(xué)生學(xué)習(xí)情況,為每個學(xué)生生成個性化的學(xué)習(xí)計劃,做到因材施教,甚至可以生成學(xué)生的個人模型。比如,網(wǎng)易有道發(fā)布了英語教育領(lǐng)域垂直大模型“子曰”,可實現(xiàn)外語口語、翻譯、語法、作文等領(lǐng)域的個性化分析和指導(dǎo)[9]。
4.加強教育融合出版產(chǎn)品的互動性
大模型的對話能力可以用于構(gòu)建智能化的學(xué)習(xí)工具和交互系統(tǒng),如ChatGPT已被廣泛應(yīng)用于知識學(xué)習(xí)領(lǐng)域。教師、學(xué)生可以與教育融合出版產(chǎn)品對話,加強教育融合出版產(chǎn)品的互動性。例如,利用大模型技術(shù),教師可以通過與教育融合出版產(chǎn)品的多次對話,不斷查找教學(xué)方案存在的不足,完善教學(xué)內(nèi)容,提高教學(xué)質(zhì)量。教師甚至可以在備課階段使用學(xué)生的個人模型,獲取教學(xué)反饋,不斷提高教學(xué)水平。學(xué)生不僅可以與教育融合出版產(chǎn)品對話,獲取相關(guān)知識,還可以通過產(chǎn)品采集自身學(xué)習(xí)數(shù)據(jù)從而形成學(xué)習(xí)報告,了解自身知識掌握的薄弱點,更有針對性地提高學(xué)習(xí)成績。比如,華東師范大學(xué)近日宣布了教育領(lǐng)域大語言模型產(chǎn)品EduChat的開源,該模型將作文批改、基于對話的學(xué)習(xí)輔導(dǎo)和情感支持等功能融入聊天機器人中,具備即時回答、反饋的功能,甚至可以用啟發(fā)式教學(xué)、心理疏導(dǎo)的方式與用戶交互,且可通過育人過程中與用戶的互動、反饋來不斷迭代升級[10]。
5.改善教育融合出版產(chǎn)品的教學(xué)評估與反饋能力
大模型技術(shù)可以生成教學(xué)評估工具,改善教育融合出版產(chǎn)品的教學(xué)評估能力與反饋能力。比如,在采集學(xué)生的學(xué)習(xí)數(shù)據(jù)生成有針對性的作業(yè)后,大模型技術(shù)可以通過作業(yè)批改生成學(xué)習(xí)評估報告并及時反饋給學(xué)生,幫助教師更好地了解學(xué)生的學(xué)習(xí)進(jìn)度并提供個性化的指導(dǎo)、教學(xué)。此外,大模型技術(shù)強大的語音識別能力、圖像識別能力及分析能力,可對教育教學(xué)場景進(jìn)行自動解析、評價并反饋至教師,幫助教師完成教學(xué)評估。上文提到的EduChat可理解教育場景下多樣化的用戶問題和需求,實現(xiàn)教、學(xué)、考、評、管等各方面的智能化,具備即時反饋能力和評估能力,服務(wù)教師、學(xué)生和家長群體。
6.提高教育融合出版產(chǎn)品的生產(chǎn)效率
傳統(tǒng)教育融合出版產(chǎn)品的生產(chǎn)一般要經(jīng)歷產(chǎn)品策劃、內(nèi)容組織、編輯審校、產(chǎn)品制作及投放等,每個環(huán)節(jié)都離不開編輯、作者和技術(shù)人員的高度參與,需要人工完成大量的信息收集、分析等工作。在產(chǎn)品策劃、內(nèi)容組稿階段,大模型技術(shù)可以通過強大的學(xué)習(xí)能力,收集、分析海量信息,提出可供參考的選題方向及產(chǎn)品內(nèi)容;在編輯審校階段,大模型強大的自然語言分析處理能力,能夠?qū)崿F(xiàn)語義分析、語義理解,在一定程度上完成部分編校工作;在產(chǎn)品投放后,大模型可以分析業(yè)務(wù)數(shù)據(jù),從而對未來產(chǎn)品的迭代方向提供參考[11]。目前已有部分模型產(chǎn)品,如EditAI可預(yù)先設(shè)計傳統(tǒng)編??赡苄枰臉I(yè)務(wù)場景或者允許編校人員搭建自己的場景,提供各種“工具集”,輔助用戶完成圖書選題推薦、圖書調(diào)研報告、圖書取名、審稿、內(nèi)容生產(chǎn)、圖書營銷推廣等工作。
教育出版企業(yè)在利用大模型技術(shù)時也需要考慮一些潛在風(fēng)險,如模型設(shè)計帶來的數(shù)據(jù)偏見問題、資源生成過程中可能產(chǎn)生的知識產(chǎn)權(quán)問題[12]、模型的自我學(xué)習(xí)和迭代過程中可能發(fā)生的各種內(nèi)容風(fēng)險。但總體來看,大模型技術(shù)將深刻地影響教育融合出版產(chǎn)品的底層設(shè)計、產(chǎn)品形態(tài)及功能實現(xiàn),對產(chǎn)品的發(fā)展產(chǎn)生積極影響,助推教育出版深度融合發(fā)展。
|參考文獻(xiàn)|
[1]龍瀛,吳康,王江浩,等. 大模型:城市和區(qū)域研究的新范式[J]. 城市規(guī)劃學(xué)刊,2014(6):52-60.
[2]程曉琳,張宣. “國產(chǎn)GPT”如何走穩(wěn)突圍之路[N]. 新華日報,2023-05-08.
[3]黃哲. 聚焦AI大模型[N]. 中國計算機報,2023-06-05.
[4]黃哲. 應(yīng)用AI大模型[N]. 中國計算機報,2023-07-17.
[5]張華橋,虞清萍,殷昌盛. 華為云盤古大模型3.0在東莞重磅發(fā)布[N]. 東莞日報,2023-07-08.
[6]雷朝滋. 智能技術(shù)支撐教學(xué)改革與教育創(chuàng)新[J]. 中小學(xué)數(shù)字化教學(xué),2021(1):5-7.
[7]陸奇最新演講審定版:大模型帶來的新范式和新機會[EB/OL]. (2023-05-13)[2023-09-14]. https://www.thepaper.cn/newsDetail_forward_23057456.
[8]本刊編輯部,黃強. 人工智能:教育出版轉(zhuǎn)型升級的方法論:本刊編輯部就“教育出版轉(zhuǎn)型”專訪人教社社長黃強先生[J]. 數(shù)字出版研究,2023(4):8-14.
[9]王峰. 國內(nèi)首個教育大模型落地規(guī)避AIGC惰化學(xué)生思維能力[N]. 21世紀(jì)經(jīng)濟報道,2023-07-28.
[10]教育對話大模型EduChat1. 0版本正式開源[EB/OL]. (2023-07-27)[2023-11-01]. https://zhuanlan.zhihu.com/p/642723912.
[11]薛東海. 人工智能與教育出版融合發(fā)展探析[J]. 中國出版,2022(14):46-49.
[12]盧宇,余京蕾,陳鵬鶴,等. 多模態(tài)大模型的教育應(yīng)用研究與展望[J]. 電化教育研究,2023(6):38-44.