摘 要:知識封裝技術(shù)的發(fā)展推動了出版形態(tài)的更新,從數(shù)據(jù)庫技術(shù)、搜索引擎再到大語言模型技術(shù),知識表示、提取、生成和傳播的方式不斷演化。生成式AI可對各類數(shù)據(jù)文本進行學(xué)習(xí)并推理預(yù)測,進而生成知識性內(nèi)容輸出。一方面,生成式AI技術(shù)因其知識生成的潛在效果而被普遍用于知識封裝產(chǎn)品之中;另一方面,也必須關(guān)注生成式AI可能帶來的一些問題,如數(shù)據(jù)可耗盡性、輸入依賴性、不平等性、解釋性不足及穩(wěn)健性不足等。生成式AI通過對話式知識提取、多模態(tài)知識表達和知識智能體等方式,正在深層重塑知識傳播形態(tài),理解其演進特征將有助于更好地駕馭這一新型知識系統(tǒng)。
關(guān)鍵詞:生成式AI;知識封裝;出版形態(tài);知識傳播;大語言模型
DOI:10.3969/j.issn.2097-1869.2024.02.011 文獻標識碼:A
著錄格式:易龍.生成式AI驅(qū)動下的知識封裝與知識傳播新形態(tài)研究[J].數(shù)字出版研究,2024,3(2):84-93.
*基金項目:2023年度湖南省教育廳科學(xué)研究優(yōu)秀青年項目“生成式人工智能背景下的知識封裝與傳播形態(tài)研究”(項目編號:23B0019)。
出版活動包含了知識封裝(Packaging)和知識傳播(Dissemination)這兩個重要并置功能。知識封裝貫穿紙質(zhì)出版到AI出版的各個發(fā)展階段。紙質(zhì)出版和電子出版階段,更多地將封裝視為出版物固態(tài)化的過程或狀態(tài)。張志強等[1]區(qū)分了網(wǎng)絡(luò)型出版物和封裝型出版物,強調(diào)了兩者之間存在的差異。徐麗芳[2]通過辨析數(shù)字出版與電子出版、網(wǎng)絡(luò)出版,指出了封裝型載體變化導(dǎo)致的概念趨同。隨著出版形態(tài)的進一步演化,封裝被賦予了更多內(nèi)涵。張新雯等[3]探討了將資源封裝成不同產(chǎn)品形態(tài)結(jié)構(gòu)的可能性。馮宏聲等[4]認為在數(shù)字出版語境里,“容器”并非物理形態(tài)的介質(zhì),而是“以數(shù)字形態(tài)封裝內(nèi)容的符號”。周葆華[5]認為,人類傳統(tǒng)的知識媒介由專家系統(tǒng)生產(chǎn)和把關(guān),知識生產(chǎn)遵循特定的專業(yè)法則和審核標準,凝結(jié)成確定的知識產(chǎn)品形態(tài),保存于固定的“本質(zhì)性資料庫”中。常江等[6]提到,在數(shù)字媒介邏輯的支配下,整個出版業(yè)的“操作系統(tǒng)”完全被打開了,各種類型的出版物與其說是某一知識產(chǎn)品的最終形態(tài),不如說是流行性、網(wǎng)絡(luò)化的知識生產(chǎn)過程中的某一個“凝固的瞬間”,是用戶生活經(jīng)驗與知識獲取實踐的一個語境化的交叉點。綜合以上觀點,不難發(fā)現(xiàn),學(xué)者大多認同封裝是將知識凝結(jié)固定的技術(shù)實現(xiàn)和形態(tài)結(jié)構(gòu)的塑造過程。
進入智能出版階段,知識的封裝與傳播實現(xiàn)了功能同步。生成式AI技術(shù)展現(xiàn)了其在大規(guī)模知識挖掘、組織、表示與傳播方面的能力,推動了出版新形態(tài)和新業(yè)態(tài)的不斷涌現(xiàn)。生成式AI作為一種AI技術(shù),能夠通過學(xué)習(xí)已有數(shù)據(jù)集生成新的文本、聲音、圖形、視頻、虛擬現(xiàn)實等多模態(tài)內(nèi)容。方卿等[7]從出版作為一個以知識內(nèi)容選擇、傳播、傳承為內(nèi)在追求的內(nèi)容產(chǎn)業(yè)出發(fā),指出“類人”的智能和出版的系統(tǒng)化封裝與傳播,使得人工智能生成內(nèi)容(Artificial Intelligence Generated Content,AIGC)產(chǎn)生巨大的影響力和破壞力。劉珍等[8]指出AI的內(nèi)容生成功能和出版行業(yè)的深度融合將實現(xiàn)知識封裝過程中的全流程互動性和個性化,并更好地整合多模態(tài)的出版內(nèi)容,實現(xiàn)更完整、優(yōu)質(zhì)的內(nèi)容出版。考慮到出版業(yè)知識組織的核心功能與生成式AI封裝知識的內(nèi)在勾連,可以將知識封裝視為基于用戶信息使用行為習(xí)慣,利用不同的媒介技術(shù)系統(tǒng)對知識內(nèi)容進行產(chǎn)品化組織并為用戶提供知識服務(wù)的實現(xiàn)形式[9]。出版是知識密集型、智力密集型的行業(yè),也是對媒介技術(shù)敏感的行業(yè)。出版業(yè)圍繞知識的組織不斷地革新媒介應(yīng)用方式和出版物封裝形態(tài),以求更好地進行知識傳播。生成式AI表現(xiàn)出的知識生成和處理能力,對出版業(yè)的核心能力帶來了直接的沖擊。為了應(yīng)對,部分出版機構(gòu)積極擁抱生成式AI以提升競爭力。考慮到生成式AI應(yīng)用所需要的開發(fā)能力、算力成本和數(shù)據(jù)資源,出版行業(yè)鮮少能夠直接開發(fā)通用大語言模型,故將生成式AI技術(shù)與出版業(yè)態(tài)相結(jié)合成為主流路徑,應(yīng)用場景選擇和產(chǎn)品形態(tài)設(shè)計成為出版智能化過程中需優(yōu)先考慮的因素。出版業(yè)擁有優(yōu)質(zhì)內(nèi)容和數(shù)據(jù)供給,生成式AI則是數(shù)據(jù)和知識挖掘的先進技術(shù),兩者能有效結(jié)合的關(guān)鍵在于能夠產(chǎn)生符合新技術(shù)條件下用戶使用行為習(xí)慣的出版產(chǎn)品形態(tài)。因此,考慮著眼于產(chǎn)品化的知識封裝和著眼于用戶接受的知識傳播是需要重點討論的問題。
1 封裝技術(shù)對出版形態(tài)的形塑
媒介技術(shù)固有的物質(zhì)結(jié)構(gòu)及與生俱來的對信息符號的重構(gòu)力量,使其對傳播形態(tài)發(fā)揮著重要的限定性作用,一旦與內(nèi)容結(jié)合便可固化為特定的出版物形態(tài)。封裝不總是意味著出版內(nèi)容物的凝固和編輯開放性的終結(jié),相反,通過梳理封裝技術(shù)與出版形態(tài)的關(guān)系可以發(fā)現(xiàn),與以完成態(tài)為目標的出版物封裝技術(shù)不同,生成式AI技術(shù)對知識的封裝是在與用戶共生的知識交互中完成的,是一種更關(guān)注個性化知識獲取的封裝方式。
1.1 封裝技術(shù)與內(nèi)容物的組合共同塑造了出版形態(tài)
出版是文化傳承、知識傳播和信息傳遞的重要方式,而這些目標的實現(xiàn)離不開出版物這一重要載體,因此文化、知識、信息的封裝方式在一定程度上決定了出版價值的實現(xiàn)。對文化、知識和信息的封裝方式,是根據(jù)不同的出版目標選擇特定內(nèi)容組織方式形成不同出版物形態(tài)的過程。數(shù)據(jù)庫和大數(shù)據(jù)技術(shù)的發(fā)展,加上數(shù)據(jù)作為重要生產(chǎn)要素發(fā)揮的經(jīng)濟社會價值,使得數(shù)據(jù)這一知識來源的初始形態(tài)成為相對獨立的一種內(nèi)容物,發(fā)展為數(shù)據(jù)出版形態(tài)。組織理論家羅素·艾可夫(Russell L. Ackoff)最早提出了“數(shù)據(jù)—信息—知識—智慧”層次結(jié)構(gòu),揭示了知識的本質(zhì),成為知識組織理論的重要基礎(chǔ)[10]。數(shù)據(jù)庫技術(shù)(包括大數(shù)據(jù)技術(shù))、搜索引擎技術(shù)、大模型技術(shù)三類知識封裝技術(shù)與知識的層次結(jié)構(gòu)模型相結(jié)合,產(chǎn)生了數(shù)據(jù)出版、信息檢索、知識服務(wù)等各類出版形態(tài)的發(fā)展。
1.1.1 數(shù)據(jù)庫技術(shù)與數(shù)據(jù)封裝
數(shù)據(jù)封裝的目標是提供一定規(guī)模數(shù)據(jù)集的存儲、查詢和分析,追求存儲記錄和檢索利用價值,并不直接提供知識挖掘和深入見解,涉及數(shù)據(jù)庫及大數(shù)據(jù)技術(shù)。早期的知識以高度結(jié)構(gòu)化的方式進行存儲,通過關(guān)系型數(shù)據(jù)的方式來表示人類知識,通過數(shù)據(jù)庫語言來檢索、訪問、調(diào)用知識,具備較高的使用門檻。后來則出現(xiàn)了專門存儲非結(jié)構(gòu)化數(shù)據(jù)的數(shù)據(jù)庫技術(shù),通過數(shù)據(jù)挖掘和機器學(xué)習(xí)等技術(shù)可用于處理使用非結(jié)構(gòu)化數(shù)據(jù)。
1.1.2 搜索引擎技術(shù)與信息封裝
以滿足資訊獲取等淺閱讀需求為目標的封裝形態(tài),是知識封裝的初級加工形態(tài),往往知識密度低、技術(shù)復(fù)雜度低、折舊速度快。隨著因特網(wǎng)的誕生,大量的碎片化知識分布在不同的網(wǎng)站中,搜索引擎成為獲取知識的關(guān)鍵技術(shù)。關(guān)鍵詞輸入作為提取知識的基本使用方式,基本為單向操作。通用搜索引擎以滿足信息需求為主要目標,知識結(jié)構(gòu)化程度較低。搜索引擎通過互聯(lián)網(wǎng)頁面信息的抓取、索引及排序算法等技術(shù)對信息進行封裝,并以關(guān)鍵詞匹配響應(yīng)信息需求。信息封裝的主要目標是消除不確定性,因此以事實性內(nèi)容提供為主要方式,早期搜索引擎索引的信息來源類型包括在線新聞、社交媒體文章、電子書籍等,本身通常不被視為一種數(shù)字出版形態(tài)。但是,搜索引擎作為一種信息封裝方式,為互聯(lián)網(wǎng)用戶提供了一種統(tǒng)一的信息或知識獲取的交互界面和訪問入口,其作為信息提取與表示的主要方式,具備強大的控制信息流動的權(quán)力,信息索引和頁面排序算法等則是這種信息分配權(quán)力的具體實現(xiàn)。
1.1.3 大語言模型與知識封裝
大語言模型(Large Language Model,LLM)是生成式AI的重要類型,主要用于自然語言的理解和生成任務(wù)。大語言模型以從信息和數(shù)據(jù)中提煉結(jié)構(gòu)化認知為目標,可提供有組織和可解釋的信息,需要AI、深度學(xué)習(xí)等技術(shù)輔助實現(xiàn)知識挖掘的功能,通常具備良好的穩(wěn)定性和較長期的價值。大模型時代首次以最自然的方式使用人類知識,通過對話即可提取知識,知識的組織圍繞人類提示詞而進行預(yù)測式生成,知識傳遞在對話協(xié)同中完成。
考慮到三種封裝方式各有其優(yōu)缺點(見表1),未來封裝技術(shù)的發(fā)展有可能融合數(shù)據(jù)庫技術(shù)、搜索引擎技術(shù)、大語言模型技術(shù)三者的優(yōu)勢,以保證知識封裝在知識時效性、密度、精確度、準確度等方面的可靠性,并減少機器幻覺和信息偏見所帶來的危害。
1.2 基于生成式AI技術(shù)的知識封裝產(chǎn)品
生成式AI技術(shù)的出現(xiàn),推動出版行業(yè)應(yīng)用AI從傳統(tǒng)的知識挖掘升級為知識生成。知識模型基于大模型的訓(xùn)練機制,可以在某種意義上認為大模型學(xué)到了人類知識,并通過生成模式實現(xiàn)知識的重新表達和傳播。因此,可以說大模型即出版,大模型是集成性的、新形態(tài)的出版物[11]。從公開數(shù)據(jù)來看(見表2),開發(fā)相應(yīng)產(chǎn)品、工具或平臺是出版機構(gòu)應(yīng)用生成式AI的主要方式。通過對現(xiàn)有部分出版機構(gòu)的生成式AI產(chǎn)品的定位、功能和發(fā)展目標等方面的梳理,發(fā)現(xiàn)現(xiàn)階段出版相關(guān)企業(yè)的生成式AI產(chǎn)品部署主要用于增強傳統(tǒng)優(yōu)勢業(yè)務(wù)板塊,進一步服務(wù)核心客戶,最終提升企業(yè)的市場競爭力。在金融、法律、科研等知識密集型行業(yè)及新聞等信息密集型行業(yè),生成式AI得到了廣泛應(yīng)用。
2 生成式AI知識封裝及知識處理方式
傳統(tǒng)數(shù)字出版一般采用元數(shù)據(jù)封裝模式,通過統(tǒng)一的制作規(guī)格保證出版物的交付質(zhì)量,產(chǎn)品具備很高的標準化程度和結(jié)構(gòu)穩(wěn)定性,給知識的組織、檢索、存儲和利用帶來了很大的便利。生成式AI封裝模式則依賴于提示詞,通過單次或多輪對話提取知識,知識的組織圍繞人類提示詞而進行預(yù)測式提供。因此其相對元數(shù)據(jù)封裝模式而言是非標準化封裝,其形態(tài)因提示詞而異,具備知識供給的靈活性,是一種個性化的知識供給模式,需要人機協(xié)同才能共同完成知識的生產(chǎn)與獲取。元數(shù)據(jù)封裝模式和生成式封裝模式,在知識交付方式、封裝形態(tài)等方面都存在差異(見表3)。
2.1 生成式AI知識封裝特性
2.1.1 數(shù)據(jù)可耗盡性:大語言模型數(shù)據(jù)需求增長快而高質(zhì)量語料有限
大語言模型對人類所有可獲得的、可數(shù)據(jù)化的知識進行封裝,使其具有知識存儲方面的完備性,并且?guī)缀醪淮嬖谥R上的盲區(qū)和短板。按照計算機專家陸奇博士的觀點,它幾乎封裝了全世界所有的知識,內(nèi)嵌了足夠的學(xué)習(xí)能力和推理能力[12]。ChatGPT在不同版本中接入了GPT-3.5和GPT-4兩個模型:前者的參數(shù)數(shù)量達1 750億,訓(xùn)練集的token數(shù)量達4 990億,其數(shù)據(jù)源來自Common Crawl數(shù)據(jù)庫、WebText數(shù)據(jù)集、英文維基百科、書籍期刊,其中僅蘊含在書刊內(nèi)的知識就已超出一般個人的知識水平[13]。按照目前大模型的發(fā)展速度,很有可能在不遠的將來耗盡現(xiàn)有可獲得的高質(zhì)量文本。由于知識生成的效果依賴于訓(xùn)練所使用的數(shù)據(jù)集,一旦包含了人類存量知識的高質(zhì)量語料被學(xué)習(xí)完畢,大模型的知識邊界便會暴露出來。
2.1.2 輸入依賴性:提示詞和知識輸出之間的聯(lián)動
應(yīng)用生成式AI產(chǎn)品進行知識輸出和提取,嚴重依賴于提示詞的質(zhì)量及其使用方式??梢酝ㄟ^一個提示詞實驗來觀察提示詞與知識輸出的關(guān)聯(lián)。通過讓ChatGPT就一個主題進行提問并作答,建立問題與輸出之間的問題序列。例如,給出的提示詞如下:“請就‘數(shù)字出版這一主題給出5個問題,要求這5個問題是同一個問題按抽象程度分為具體、稍微抽象、一般抽象、高度抽象、最高抽象5個層級逐級遞增的不同表達;給出參考答案;并請對你自己回答的每道題依次進行評價?!盋hatGPT輸出的結(jié)果整理后見表4,當提示詞的抽象層級不斷提升時,答案的抽象程度也隨之提升,知識密度相應(yīng)增加。
2.1.3 不平等性:算法的放大器效應(yīng)強化了提示詞輸入者之間的既有“知溝”
一方面,生成式AI是新“知溝”產(chǎn)生的主要推動力量。由于知識的易獲得性,盡管目前還不可靠,生成式AI仍然一度被認為是知識普惠的代表性技術(shù)。但事實可能正好相反,受限于用戶認知水平、經(jīng)濟狀況、地區(qū)分布、大模型存在的偏好迎合傾向等諸多因素,使得生成式AI并不能帶來信息和知識平權(quán),甚至在一定程度上會放大兩者之間的差異,造成知識獲取的“剪刀差”?,F(xiàn)以“剪刀模型”(見圖1)假設(shè)來描述生成式AI應(yīng)用過程中所存在的個體間知識獲取差異:由于并非每個人都能平等地接入和使用大語言模型,造成了大模型采納過程的進度差異,最先使用大模型技術(shù)的用戶更有可能獲得技術(shù)帶來的知識獲取便利,因而可以更早積累知識,并受惠于此。對大模型技術(shù)的理解差異、語言表達水平、認知水平差異等也造成了輸入提示詞水平的差異,這導(dǎo)致了知識生成結(jié)果的差異。對輸出結(jié)果的使用評價能力則進一步導(dǎo)致了后續(xù)影響,例如在知識驗證、偏見防范等方面進一步造成了不平衡。大模型技術(shù)有時并不是解決知識平權(quán)問題的良方,相反它會放大原本存在的個體間知識獲取方面的不平等問題,即個體間固有條件差異越大,經(jīng)過大模型的放大后,其導(dǎo)致的知識獲取效果差異也越大。人類的提示詞輸入細微差異經(jīng)過Transformer模型放大后,機器會給出不同水平的輸出。
另一方面,英語知識生產(chǎn)的中心地位被強化。當前大模型數(shù)據(jù)集主要為英文,其他語料則相對偏少。中國工程院院士高文曾公開表示,全球通用50億大模型數(shù)據(jù)訓(xùn)練集里,中文語料占比僅為1.3%[14]。這種源自語料層面的不平等,對文化安全等層面也將帶來深刻影響。哈爾濱工業(yè)大學(xué)長聘教授劉挺認為,語言成為輿論戰(zhàn)武器,而今的大模型能夠自動回答問題、發(fā)表評論、撰寫文章,使語言武器自動化了,其帶來的風(fēng)險難以估量[15]。另外,牛津大學(xué)的一項研究表明,由于開放AI(OpenAI)等服務(wù)所采用的服務(wù)器成本衡量和計費的方式,英語輸入和輸出的費用要比其他語言低得多,其中簡體中文的費用大約是英語的2倍,西班牙語是英語的1.5倍,而緬甸的撣語(Shan)則是英語的15倍[16]。
2.1.4 弱可解釋性:智能涌現(xiàn)決定AI可預(yù)見性較弱
“涌現(xiàn)”(Emergence)一詞的概念是由劉易斯(George Henry Lewes)于1875年在《生命與心靈問題》(Problems of Life and Mind)著作中首次提出的。心理學(xué)家勞埃德·摩根(C. Lloyd Morgan)指出,類似的概念在邏輯學(xué)家密爾(J. S. Mill)和心理學(xué)家文特(W. Wundt)的理論中也能找到,他們普遍認同涌現(xiàn)是對無法從構(gòu)成先前狀態(tài)的元素中預(yù)測出來的新現(xiàn)象的描述?!坝楷F(xiàn)”不同于“結(jié)果”,它通常無法根據(jù)現(xiàn)有元素進行預(yù)測,是一種突現(xiàn),這些對涌現(xiàn)的定義與現(xiàn)代的定義和討論非常接近[17]。
ChatGPT之類的大語言模型被認為具備一定的涌現(xiàn)特征,也是機器智能的重要標志。但也有研究認為,大模型所謂的涌現(xiàn)能力是由于研究者選擇的度量標準而產(chǎn)生的,而不是模型行為在規(guī)模擴展中發(fā)生了根本變化。所謂的涌現(xiàn)能力會隨著不同的度量或更好的統(tǒng)計學(xué)而消失,并且可能不是縮放AI模型的基本屬性[18]。智能涌現(xiàn)一方面導(dǎo)致了AI生成知識的可解釋性弱,進而降低了機器生成內(nèi)容的可信度;但另一方面也可能是知識發(fā)現(xiàn)與知識創(chuàng)新的源泉。
考慮到機器輸出知識的精確性和穩(wěn)定性直接關(guān)乎出版行業(yè)對其生成內(nèi)容的采納程度,因此必須解決機器生成知識的可驗證、可預(yù)見及可靠性。出版行業(yè)是具有高質(zhì)量標準要求的知識處理行業(yè),只有經(jīng)過嚴格編校程序的知識才能最終面向公眾進行發(fā)布。
2.1.5 弱穩(wěn)健性:知識輸出結(jié)果的可靠性受制于模型幻覺程度
大模型輸出的幻覺(Hallucination)問題和穩(wěn)健性(又稱魯棒性)是影響AI生成知識可靠性中的重要影響因素,也是目前阻礙其在出版領(lǐng)域廣泛應(yīng)用的原因之一,尚未找到徹底解決機器幻覺以提升知識系統(tǒng)穩(wěn)健性的方法。因此,大模型應(yīng)用于知識生成,需要經(jīng)過人工環(huán)節(jié)進行驗證才可用于發(fā)布。大模型幻覺可分為事實性幻覺(Factuality Hallucination)和忠實性幻覺(Faithfulness Hallucination)兩類,前者指模型生成內(nèi)容與可驗證的現(xiàn)實世界事實之間的不一致,后者指生成內(nèi)容與用戶指令或輸入提供的上下文的偏離,以及生成內(nèi)容本身的自洽性。大模型幻覺來自預(yù)訓(xùn)練數(shù)據(jù)中的錯誤信息和偏見,本身的知識邊界也導(dǎo)致存在領(lǐng)域知識缺陷和過時的事實知識[19]。
大模型的幻覺問題與其模擬大腦的學(xué)習(xí)模式也有關(guān)系。心理學(xué)的研究揭示了大腦具備兩類思考系統(tǒng),即系統(tǒng)1和系統(tǒng)2?!半p過程理論(Dual Process Theory)”也指出了大腦存在兩個思考系統(tǒng),最早由心理學(xué)家基思·斯坦諾維奇(Keith Stanovich)和理查德·韋斯特(Richard F. West)率先提出[20],后來諾貝爾經(jīng)濟學(xué)獎得主丹尼爾·卡內(nèi)曼在其著作《思考,快與慢》(Thinking, Fast and Slow)對其進一步闡發(fā)。系統(tǒng)1的運行是無意識且快速的,不怎么費腦力,沒有感覺,完全處于自主控制狀態(tài)。系統(tǒng)2將注意力轉(zhuǎn)移到需要費腦力的大腦活動上來,例如復(fù)雜的運算[21]。系統(tǒng)1依賴情感、記憶和經(jīng)驗對外界做出迅速判斷,但也容易“上當”并產(chǎn)生錯覺。大模型的幻覺問題的產(chǎn)生與其所采取的自監(jiān)督學(xué)習(xí)進行預(yù)訓(xùn)練的技術(shù)路徑有關(guān),后者接近大腦系統(tǒng)1的學(xué)習(xí)模式。麻省理工學(xué)院綜合計算神經(jīng)科學(xué)(ICoN)中心的研究人員發(fā)現(xiàn),當他們使用特定類型的自我監(jiān)督學(xué)習(xí)來訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型時,所得模型生成的活動模式與執(zhí)行相同任務(wù)的動物大腦中看到的活動模式非常相似[22]。解決大模型幻覺問題的厚望被寄予在大模型和知識圖譜技術(shù)的協(xié)同發(fā)展上,知識圖譜技術(shù)被認為是建立可解釋的AI的重要路徑,與大模型技術(shù)具有很好的互補性,正如大腦的兩個系統(tǒng)相互補充一樣。
2.2 大模型知識處理方式
人腦通過從環(huán)境中習(xí)得、加工和生成信息,最終將其作為適應(yīng)環(huán)境的一種方式。在這個過程中,人作為目標,而知識則成為實現(xiàn)這一目標的手段。大腦的生物神經(jīng)網(wǎng)絡(luò)自帶編解碼能力,大腦既是知識的生產(chǎn)者也是知識的獲取者。大模型則借助機器神經(jīng)網(wǎng)絡(luò)將知識輸出作為目標,以人類反饋作為增強機器知識能力的手段。知識生產(chǎn)就是模型應(yīng)用和結(jié)果調(diào)取的過程。大模型基于自注意力機制的深度神經(jīng)網(wǎng)絡(luò)模型處理人類發(fā)布的存量文本并進行知識發(fā)現(xiàn)與生成,其對齊能力、泛化能力和更新能力仍然存在一定局限性(見表5)。
3 生成式AI賦能的知識傳播新形態(tài)
知識封裝更多是從媒介技術(shù)對出版產(chǎn)品帶來的影響出發(fā)考慮生成式AI出版產(chǎn)品的新形態(tài)和新業(yè)態(tài),而知識傳播更多從用戶知識獲取的視角來考慮在生成式AI技術(shù)中介下所形成的用戶獲取知識和媒介知識供給的新變化??紤]到OpenAI在產(chǎn)品化方面的豐富經(jīng)驗及其帶來的示范效應(yīng)將波及各行各業(yè),其中也包括出版業(yè)。其已開發(fā)的ChatGPT、Sora及正在開發(fā)的智能體(AI Agents)等產(chǎn)品類型將預(yù)示著未來生成式AI應(yīng)用于知識傳播場景的三個重要方向,分別是對話式知識服務(wù)產(chǎn)品、多模態(tài)知識大模型及知識智能體。
3.1 信息交互方式:基于對話的知識提取
像ChatGPT之類的生成式AI產(chǎn)品是以對話形式封裝的信息和知識系統(tǒng),自然語言成為人機知識互動的基礎(chǔ),人機交流始于提示詞(Prompt),終于答案輸出(Output)。類人對話能力的背后是大模型對海量文本語料的學(xué)習(xí),包括語言學(xué)知識和世界性知識。將大模型視為知識庫,人類通過設(shè)計提示詞,可以很好地提取其中蘊含的豐富知識。有學(xué)者認為,AI產(chǎn)品ChatGPT作為數(shù)字智能界面,絕不僅是提供了一個“類人性”對話主體,而是實現(xiàn)了超大語言模型系統(tǒng)與人類感官系統(tǒng)史無前例的交互,這是一個嶄新的交互界面,也是一種新型主體樣態(tài),ChatGPT“類人性”形式表面所隱藏的,是超越人類的新型認知系統(tǒng)[23]。
在AI對話式生成系統(tǒng)誕生前,傳統(tǒng)的人機交互界面大多是圖形用戶界面(Graphical User Interface,GUI),雖然圖形界面設(shè)計一直強調(diào)用戶體驗優(yōu)化,但依然不如自然語言使用來得直接和普遍。生成式AI采取自然用戶界面(Natural User Interface,NUI),不需要借助圖形交互工具和行為便能夠應(yīng)對廣泛的知識交互場景??紤]到自然語言本身可能存在的表達局限性,目前并不能完全替代圖形交互?!敖涣鞯臒o奈”“一圖勝千言”現(xiàn)象的存在更是提醒人們不要把通過自然用戶界面進行信息交互看成萬能的交流方式。通過自然用戶界面能夠從大模型中提取知識,意味著大模型被封裝為一種動態(tài)供給的知識庫,知識主要以文本形式加以存儲。
3.2 多模態(tài)知識傳播:知識虛擬可視化與多模態(tài)表示
比斯克(Yonatan Bisk)等[24]曾構(gòu)建了一個“世界范圍(World Scope)”五層次模型來表示自然語言處理所需要的不同文本來源,分別是小規(guī)模語料庫(世界1)、互聯(lián)網(wǎng)文本(世界2)、多模態(tài)文本(世界3)、具身(世界4)、社交互動(世界5),我們正處在世界2向世界3轉(zhuǎn)換的進程中,未來將進一步發(fā)展到世界4和世界5。在世界3中,知識以多模態(tài)的形式生成、傳播和獲取。多模態(tài)生成式AI將加速虛擬出版時代的到來,知識的空間可視化表達、知識的演化仿真設(shè)計和知識的多模態(tài)獲取將成為知識傳播形態(tài)創(chuàng)新的方向。虛擬化技術(shù)賦能的知識空間化存儲、空間化計算和空間化表達,成為多模態(tài)知識傳播未來發(fā)展的重要方向。數(shù)字博物館、多模態(tài)計算[25]及新形態(tài)出版物成為未來知識多模態(tài)組織和多模態(tài)傳播的重要形態(tài)。生成式AI技術(shù)與虛擬現(xiàn)實技術(shù)將進一步融合推動虛擬內(nèi)容智能生成。
3.3 知識智能體:從被動應(yīng)答到自主行動
如果說對話式生成還停留在人機知識交流的層面,那么基于大模型的AI智能體(Agents)則超越對話,目標進一步指向機器決策乃至自主行動,即具身智能(Embodied Artificial Intelligence)。AI智能體將大模型作為大腦,通過信息交互來感知外界變化,最終作出自主行動,實現(xiàn)特定的任務(wù)。智能體這一概念起源于哲學(xué),其根源可追溯到亞里士多德和休謨等思想家,它描述了擁有欲望、信仰、意圖和采取行動能力的實體。在AI研究領(lǐng)域,智能體是用來描述展示智能行為并具有自主性、反應(yīng)性、主動性和社會能力等特質(zhì)的實體,AI智能體通常被認為是實現(xiàn)通用AI(Artificial General Intelligence,AGI)的重要步驟[26]。OpenAI公司AI應(yīng)用研究主管翁麗蓮(Lilian Weng)在一篇關(guān)于AI智能體的網(wǎng)絡(luò)文章中提出了基于大模型構(gòu)建自主智能體的應(yīng)用框架:智能體包括LLM、記憶(Memory)、規(guī)劃技能(Planning)和工具使用(Tool Use)等要素,其中大模型是智能體的大腦,其他是關(guān)鍵的組成部分[27]。大模型未來將逐漸向大腦功能逼近,在虛擬環(huán)境中成長并與現(xiàn)實環(huán)境交互,成為自主適應(yīng)復(fù)雜環(huán)境甚至自主行動的智能體。未來的知識智能體將可能以自主方式開展知識傳播活動,進而改變?nèi)祟惖闹R交流方式。
4 結(jié)語
生成式AI是一種知識封裝技術(shù),它以全面性的知識占有、自然的人機交流模式和強大的知識推理能力改變著人類知識傳播的形態(tài),將人類帶進了生成式傳播的時代。以知識傳遞為重要使命的出版業(yè),將不可避免地遭受生成式AI技術(shù)帶來的沖擊。積極探索生成式AI背景下的新出版方式和新傳播形態(tài),不斷改進知識生產(chǎn)與傳播效果,將為出版業(yè)轉(zhuǎn)型升級帶來歷史性重要機遇。
作者簡介
易龍,男,博士,中南大學(xué)人文學(xué)院傳媒系主任,副教授。研究方向:數(shù)字出版、智能傳播。
參考文獻
[1]張志強,唐舸.網(wǎng)絡(luò)出版研究綜述[J].出版科學(xué),2002(S1):66-73.
[2]徐麗芳.數(shù)字出版:概念與形態(tài)[J].出版發(fā)行研究,2005(7):5-12.
[3]張新雯,陳丹.微版權(quán)概念生成的語境分析及其商業(yè)模式探究[J].出版發(fā)行研究,2016(3):30-32.
[4]馮宏聲,王樞.變革與重塑:出版業(yè)與AI共創(chuàng)未來[J].數(shù)字出版研究,2023,2(4):1-7.
[5]周葆華.或然率資料庫:作為知識新媒介的生成智能ChatGPT[J].現(xiàn)代出版,2023(2):21-32.
[6]常江,朱思壘.作為知識生產(chǎn)的數(shù)字出版:媒介邏輯與文化生態(tài)[J].現(xiàn)代出版,2021(5):19-24.
[7]方卿,丁靖佳.AI生成內(nèi)容(AIGC)的三個出版學(xué)議題[J].出版科學(xué),2023,31(2):5-10.
[8]劉珍,趙云澤.技術(shù)邏輯、實現(xiàn)方式與現(xiàn)實邊界:生成式AI對出版業(yè)的深層影響[J].中國出版,2023(15):11-16.
[9]易龍.從數(shù)字出版到智能出版:知識封裝方式的演進[J].出版科學(xué),2023,31(1):81-90.
[10]ACKOFF R L. From data to wisdom[J]. Journal of Applied Systems Analysis,1989,16(1):3-9.
[11]毛文濤.出版的當下與未來[J].出版與印刷,2023(6):26-31.
[12]邵文,方曉.陸奇最新演講審定版:大模型帶來的新范式和新機會[EB/OL].(2023-05-13)[2024-01-20].https://www.thepaper.cn/newsDetail_forward_23057456.
[13]陳昌鳳,黃陽坤.ChatGPT的知識功能與人類的知識危機[J].現(xiàn)代出版,2023(6):10-18.
[14]羅云鵬.大模型發(fā)展亟需高質(zhì)量“教材”相伴[N].科技日報,2024-01-15(06).
[15]劉挺.從ChatGPT談大語言模型及其應(yīng)用[J].語言戰(zhàn)略研究,2023,8(5):14-18.
[16]PETROV A, LA MALFA E, TORR P, et al. Language model tokenizers introduce unfairness between languages[EB/OL]. (2023-10-20)[2024-04-09]. https://arxiv.org/ftp/arxiv/papers/2305/2305.15425.pdf.
[17]EMMECHE C, K?PPE S, STJERNFELT F.Explaining emergence: Towards an ontology of levels[J].Journal for General Philosophy of Science,1997(28):83-117.
[18]SCHAEFFER R, MIRANDA B, KOYEJO S. Are emergent abilities of large language models a mirage?[EB/OL].(2023-05-22)[2024-04-09]. https://arxiv.org/pdf/2304.15004.pdf.
[19]HUANG L, YU W, MA W, et al. A survey on hallucination in large language models: Principles, taxonomy, challenges, and open questions[EB/OL].(2023-11-09)[2024-04-09]. https://arxiv.org/pdf/2311.05232.pdf.
[20]STANOVICH K E, WEST R F. Advancing the rationality debate[J]. Behavioral and brain sciences,2000,23(5):701-717.
[21]丹尼爾·卡尼曼.思考,快與慢[M].胡曉姣,李愛民,何夢瑩,譯.北京:中信出版社,2012:5.
[22]TRAFTON A. The brain may learn about the world the same way some computational models do[EB/OL]. (2023-10-30) [2024-01-28]. https://news.mit.edu/2023/brain-self-supervised-computational-models-1030.
[23]孫瑋,程陶然.AI界面:系統(tǒng)交互的革新[J].新聞記者,2023(8):3-12,61.
[24]BISK Y, HOLTZMAN A, THOMASON J, et al. Experience grounds language[EB/OL].(2020-11-01)[2024-04-09].https://arxiv.org/pdf/2004.10151.pdf.
[25]周葆華,吳雨晴.超越單一模態(tài):多模態(tài)計算傳播研究的進展與前瞻[J].傳媒觀察,2024(1):16-27.
[26]XI Z, CHEN W, GUO X, et al. The rise and potential of large language model based agents: A survey[EB/OL].(2023-09-19)[2024-04-09]. https://arxiv.org/pdf/2309.07864.pdf.
[27]WENG L. LLM powered autonomous agents[EB/OL].(2023-06-23)[2024-01-26].https://lilianweng.github.io/posts/2023-06-23-agent.
Research on New Forms of Knowledge Packaging and Dissemination Driven by Generative Artificial Intelligence
YI Long
School of Humanities, Central South University, 410012, Changsha, China
Abstract: Development of knowledge packaging technology has driven the renewal of publishing forms. Ways in which knowledge is represented, extracted, generated and disseminated continue to evolve from database and search engine technologies to large language model technology. Generative artificial intelligence (GAI) can learn from various data texts and make inferential predictions, thereby outputting knowledge-based content. On the one hand, GAI is widely used in knowledge-packaging products due to its potential for knowledge generation; on the other hand, issues such as data exhaustibility, input dependency, inequality, weak interpretability, and weak robustness highlight the need to pay attention to the potential consequences of GAI. It is profoundly reshaping knowledge dissemination form through dialogical knowledge extraction, multimodal knowledge expression and knowledge agents. Understanding its evolutionary characteristics may lend a hand to better navigate this new type of knowledge system.
Keywords: Generative artificial intelligence; Knowledge packaging; Publishing form; Knowledge dissemination; Large language model