摘 要 數(shù)字化發(fā)展正在塑造語言生活和辭書生活的融媒體化、智能化、開放性、多元性等現(xiàn)代化新樣態(tài)。文章主要從三個方面探討如何推動辭書生活的開放式發(fā)展:一是數(shù)字化轉(zhuǎn)型為當代辭書生活帶來的新變化;二是開放科學背景下開放式辭書生活的內(nèi)涵、目標和挑戰(zhàn);三是根據(jù)維基百科、GoldenDict詞典、“生僻字征集”微信小程序、對話式AI輔助釋義等案例,探索可用于我國數(shù)字時代開放式辭書生活的模式和經(jīng)驗。開放式辭書生活有助于形成以辭書為紐帶的趣緣群體和文化認同,從現(xiàn)實維度實現(xiàn)中華優(yōu)秀語言文化的集體構建,在提升我國辭書編纂水平、知識管理與服務水平、文化傳播能力和世界辭書影響力等方面做出重要貢獻。
關鍵詞 辭書生活 融媒辭書 數(shù)字化 開放科學 語言智能
一、 引言
數(shù)字化、智能化發(fā)展正在塑造人們當代社會生活的新形態(tài),也為語言學、數(shù)字人文等學科的建設發(fā)展指明了新方向。國務院辦公廳在2020年發(fā)布了《關于全面加強新時代語言文字工作的意見》,強調(diào)基于語言文字信息技術“支持數(shù)字經(jīng)濟發(fā)展”,“提供優(yōu)質(zhì)學習資源和信息服務資源”。2021年,《“十四五”規(guī)劃和2035年遠景目標綱要》繼續(xù)指出,我國已轉(zhuǎn)向高質(zhì)量發(fā)展階段,迎接數(shù)字時代、建設數(shù)字中國,將加大公共服務資源的開放共享和應用力度,營造開放、健康、安全的數(shù)字生態(tài)。以人工智能、云計算、大數(shù)據(jù)、物聯(lián)網(wǎng)、虛擬現(xiàn)實等為代表的新一代信息技術,深刻改變著人們的生產(chǎn)方式、生活場景和行為模式,也在不斷推動語言生活和辭書生活的開放式發(fā)展。與此同時,“數(shù)字鴻溝”、信息過載、數(shù)據(jù)安全等問題也引發(fā)了人們對數(shù)字生活的持續(xù)擔憂。
“開放”是數(shù)字時代背景下國內(nèi)國際都致力探索的重要議題。2021年,聯(lián)合國教科文組織第41屆大會通過《開放科學建議書》(2022年出版),倡導對科學知識的開放獲取。ChatGPT、文心一言、訊飛星火等大語言模型的發(fā)展,再次向公眾視野凸顯了促進語言數(shù)據(jù)開放共享的必要性和緊迫性。中華優(yōu)秀傳統(tǒng)文化一直蘊含著開放、合作、共享的思想,如“助之視聽者眾,則其所聞見者遠矣”(《墨子·尚同》)、“獨思則滯而不通,獨為則困而不就”(《中論·治學第一》)、“人相聚得言,皆有益也,則此甚善”(《經(jīng)學理窟·學大原下》)。1949年以來,馬克思主義群眾史觀與群眾路線、建言獻策的民主生活方式和自下而上的基層治理模式,傳承并體現(xiàn)了先進的開放理念與治理智慧。我國語言生活中,《漢字簡化方案》《漢語拼音方案》《國家通用規(guī)范漢字表》等語言文字規(guī)范的研制過程會廣泛征求“各領域、多層次的意見”(李宇明 2020b),學界及語言產(chǎn)業(yè)界也嘗試提出《漢語大詞典》“在線修訂”“動態(tài)修訂”模式(汪維輝 2013,2019)、研發(fā)“聚典數(shù)據(jù)開放平臺”(毛文濤 2023)等。但總體來看,開放式辭書生活的理論與實踐尚處于起步階段。
從《爾雅》《說文解字》《康熙字典》,到新中國成立以來的《現(xiàn)代漢語詞典》《辭?!返龋覈霓o書發(fā)展歷經(jīng)變遷,既記載歷史,也反映了我國不同時代的知識管理水平。進入21世紀,在數(shù)字時代與融媒體時代背景下,傳統(tǒng)的紙媒辭書正迎來變革。與時俱進地探索建設開放式辭書生活,能夠及時回應數(shù)字時代的機遇和挑戰(zhàn),助力從現(xiàn)實維度實現(xiàn)中華優(yōu)秀語言文化的集體構建。
二、 數(shù)字化轉(zhuǎn)型對當代辭書生活的影響
(一) 辭書生活的概念及關系
“辭書生活”是我國辭書學研究貢獻的特色理念。查閱辭書是人們語言生活的一部分。像《新華字典》和《現(xiàn)代漢語詞典》這樣的語文辭書,不僅可以提供各種知識信息,還可以為掃盲識字、推廣普通話、語文教學、語言文字規(guī)范、漢語國際推廣、減貧脫貧等提供服務。2019年,中國辭書學會討論認為,辭書學應把辭書生活作為研究對象,實現(xiàn)由辭書編纂向辭書生活研究的轉(zhuǎn)變。(戴宗杰 2019)辭書生活的概念可以從兩個關系層面進行理解,如圖1所示。一是辭書生活和辭書編纂的關系。辭書編纂(dictionary compilation)是辭書學(lexicography)的一項重要實踐內(nèi)容,包括語言數(shù)據(jù)的調(diào)查、收集、分析和辭書條目的選擇、描述、編輯、排列等。(Zgusta 1971;Hartmann 2003;Atkins amp; Rundell 2008)傳統(tǒng)辭書學在實踐上圍繞辭書的編纂與出版,在理論上關注辭書的類型、結構、用途、評價、歷史等,整體上更傾向編纂者(lexicographer)視角。而辭書生活的特點是以讀者、用戶為核心角色(李宇明,王東海 2020;陳雪 2022),側重觀察用戶與辭書之間的互動。二是辭書生活和語言生活的關系。辭書生活已逐漸成型,成為語言生活的重要組成部分,并與之“互映”。根據(jù)李宇明(2022)的定義,語言生活是“運用語言、學習語言、研究語言而形成的社會生活”。在此觀照之下,我們可以將辭書生活界定為與編纂辭書、出版辭書、應用辭書、研究辭書相關的社會生活,關注從辭書研發(fā)到生產(chǎn)、從生產(chǎn)到應用、再從應用回到研究的全鏈路 過程。
可見,辭書生活融合了辭書編纂和用戶生活的邊界,天然地蘊含著“開放”屬性。而在辭書數(shù)字化轉(zhuǎn)型發(fā)展過程中,這一屬性得以從技術層面具象化實現(xiàn)。
(二) 數(shù)字化轉(zhuǎn)型產(chǎn)生的影響
數(shù)字化是從信息化到智能化的過渡階段。在語言文字信息化建設的基礎上,辭書領域的數(shù)字化轉(zhuǎn)型正在引發(fā)當代辭書生活的深刻變革,從辭書數(shù)據(jù)、媒介、類型、出版等方面產(chǎn)生結構性影響。
1. 辭書數(shù)據(jù)呈現(xiàn)為多源異構數(shù)據(jù)的集成
用于辭書編纂的語言數(shù)據(jù)具有多種來源、類型和結構,這是由辭書知識內(nèi)容決定的。以語文詞典為例:語文詞典幾乎包括所有的語言知識,可以說是語言知識的“詞典化”。詞典編寫既要吸收文字、語音、詞匯、語法、語用等方面的研究成果,又要運用語言類型學、語言交際、語言習得等理論方法來研究問題,還要從“詞義與例句關系”“社會文化對詞語用法的影響”“社會變化對詞語意義的影響”這些專題研究中獲得有力的 支撐。
紙媒詞典的結構比較固定,能夠表達的語言知識有限。數(shù)字詞典支持的數(shù)據(jù)格式更加多元,不僅是詞形、拼音、詞類、釋義、配例等基礎文本數(shù)據(jù),還有詞頻表、分級詞匯表、知識圖譜等結構化數(shù)據(jù)以及基于語義關聯(lián)的圖解、音頻、視頻、超鏈接等多模態(tài)數(shù)據(jù)。多源異構數(shù)據(jù)是辭書實現(xiàn)數(shù)字化轉(zhuǎn)型的基礎,據(jù)此可以擴展更多的融媒體應用和創(chuàng)新功能,例如語音朗讀、情景視頻查詢等。
2. 辭書媒介呈現(xiàn)融合趨勢
在移動互聯(lián)網(wǎng)普及、語言智能技術快速發(fā)展的今天,人們的數(shù)字素養(yǎng)和信息檢索能力得到極大提升,詞典查檢需求、方式和習慣也發(fā)生了重大變化。人們越來越偏好“碎片化”“跟隨性”的在線即時查檢,(李宇明 2020a;杜翔 2023)作為獨立工具的紙媒辭書已經(jīng)無法滿足用戶需求,辭書電子化、融媒體化是大勢所趨。《中國大百科全書》《辭?!贰洞筠o海》《新華字典》《現(xiàn)代漢語詞典》《英漢大詞典》《唐詩鑒賞詞典》等系列辭書,都已經(jīng)推出或正在開發(fā)各種類型的數(shù)字版、網(wǎng)絡版以及App、小程序等移動端產(chǎn)品;《全球華語大詞典》更是在2020年啟動了融媒體版的開發(fā)。
融媒體是辭書實現(xiàn)數(shù)字化轉(zhuǎn)型的關鍵,不同媒體的融合能夠充分利用多源異構數(shù)據(jù),促進辭書與相關資源的融合,為人們的辭書生活帶來顛覆性改變。圖像識別是目前對融媒辭書建設貢獻較大的一項人工智能技術,能夠在用戶和辭書之間創(chuàng)造更立體的交互模式和認知體驗。例如,“網(wǎng)易有道詞典”“微軟必應詞典”等在線詞典設有屏幕取詞、截圖翻譯等功能;“植物智”“識花君”等應用程序支持拍照識別植物,進而檢索植物百科知識和植物圖像、植物標本、植物志書等內(nèi)容。
融媒辭書也更容易獲取物聯(lián)網(wǎng)技術的支持,在“萬物互聯(lián)”的基礎上實現(xiàn)“辭書萬物載體”。物聯(lián)網(wǎng)可以通過網(wǎng)絡為用戶鏈接空間環(huán)境中的物品,在人與環(huán)境之間進行信息交互。融媒辭書能夠更好地適應、搭載物聯(lián)網(wǎng)平臺,除了安裝在電腦和手機上之外,目前還可以在汽車、手表、眼鏡、臺燈等物品上應用。物聯(lián)網(wǎng)技術方興未艾,未來的融媒辭書可能出現(xiàn)在衣服、帽子、餐桌等任意物品上,為人們的所見所感提供隨時隨地的辭書知識服務,從“按需求連接萬物”升級為“按需求認知萬物”。
3. 辭書類型呈現(xiàn)綜合性發(fā)展取向
辭書可以按照五個不同的標準來劃分類型:(1) 按用途,例如常見辭書可分為語文辭書、百科辭書和專科辭書三類;(2) 按所起的規(guī)范作用,如語文辭書可分為查檢型和規(guī)范型(張書巖 2023);(3) 按所包含的語言種類,如單語詞典、雙語詞典等;(4) 按歷史原則,例如根據(jù)反映詞義的歷時演變情況來劃分古代漢語詞典、近代漢語詞典、現(xiàn)代漢語詞典;(5) 按條目排列的方式,例如按音序排列或按部首排列等。
區(qū)分辭書類型進行編纂,是紙媒時代傳承的一種知識管理方式,既保證了在媒體資源有限的情況下合理組織辭書內(nèi)容,也便于人們根據(jù)不同的知識需求來分類查檢。而在融媒體時代,數(shù)字化技術為辭書知識的組織與管理重新賦能。以數(shù)據(jù)庫形式存儲辭書條目,不僅用“一鍵”檢索的方式取代了按音序、部首等查檢,還在辭書分類編纂和多源數(shù)據(jù)集成的基礎上實現(xiàn)了“一次滿足多種需求”的綜合查檢,使用途、語種、歷史等辭書分類標準轉(zhuǎn)變?yōu)殚_放性的知識類別選擇。例如:“國學大師網(wǎng)”匯總了字典、詞典、成語、詩詞、書法、中醫(yī)等類別,字典中又囊括字形、字源、拼音、部首、漢字編碼、筆順及演示動畫、歷時詞義變化及例句、辭書來源等綜合信息;“維基詞典”支持輸入字形或詞形的跨語言(方言)查檢,對字形提供在不同語言中的發(fā)音、釋義、字源、衍生字、相關字、辭書來源等信息,對詞形提供在不同語言中的發(fā)音、釋義、模板用法、衍生詞、派生詞、翻譯等信息;“歐路詞典”除了導入多種來源的詞典之外,還提供中文百科和英文百科作為參考。綜合性的數(shù)字辭書,有助于人們降低查檢成本,更全面地構建知識體系,享受便捷豐富的辭書 生活。
4. 辭書出版向辭書知識服務轉(zhuǎn)型
辭書數(shù)字化可以促進“編纂系統(tǒng)化和使用個性化”(章宜華 2021)。在傳統(tǒng)的辭書學實踐中,辭書出版是辭書從編纂到應用必經(jīng)的一個獨立活動,也是編纂者和用戶這兩個角色的“一墻之隔”?;ヂ?lián)網(wǎng)的發(fā)展使辭書知識的傳播媒介、發(fā)布平臺和獲取途徑更加多元,大數(shù)據(jù)、人工智能等技術使辭書研發(fā)能夠?qū)崿F(xiàn)內(nèi)容的融通提質(zhì),辭書正在由實體產(chǎn)品向數(shù)字化、智能化產(chǎn)品轉(zhuǎn)型(呂海春 2023);相應地,單向的辭書出版也正在向互動性更強的辭書知識服務轉(zhuǎn)型升級。一方面,用戶的個性化辭書需求得以凸顯,可以在多源異構數(shù)據(jù)、多種媒介、不同知識類別中自主選擇。例如,越來越多的在線學習詞典支持用戶進行詞典庫管理、自建詞庫和例句庫,WantWords(萬詞王)、WantQuotes(據(jù)意查句)等網(wǎng)站還可以通過描述語義來反向查詢字詞或名言名句。另一方面,辭書條目的收集、編輯、評價等權限也呈現(xiàn)公開化趨勢,編纂者和用戶之間的“墻”在逐漸打破,二者的角色分工不再鮮明地二元對立。這在一定程度上消解了部分辭書的權威性,同時也引發(fā)了虛假、錯誤辭書知識泛濫的風險。
以上幾項發(fā)展趨勢,促使數(shù)字時代的辭書編纂邏輯和應用場景發(fā)生深刻變化,保障辭書資源能夠公開獲取、使用、傳播、編輯與評價。因此,開放式辭書生活具備了現(xiàn)實意義上的技術基礎和探索條件。
三、 開放式辭書生活的內(nèi)涵及其帶來的挑戰(zhàn)
(一) 開放式辭書生活的內(nèi)涵
開放式辭書生活的內(nèi)涵至少有三個層級:
首先,辭書知識內(nèi)容應保持開放,及時反映社會變化導致的字、詞、語變化。以中文詞“視頻”為例:“視頻”原本只是一個通信術語,指圖像信號頻段(頻率范圍),對應的英文術語是video frequency?!冬F(xiàn)代漢語詞典》第7版對該詞條的釋義反映了這一點:
視頻 shìpín 名在電視或雷達等系統(tǒng)中,圖像信號所包括的頻率范圍,一般在零到幾兆赫之間。
但在當代數(shù)字生活中,人們更常用“視頻”來指動態(tài)影像本身,或者借助互聯(lián)網(wǎng)設備實現(xiàn)“面對面”交流的行為。為了反映這些新的詞義,建議將“視頻”的釋義修 改為:
視頻 shìpín ①名動態(tài)的影像:看~|制作~。②動依靠網(wǎng)絡在手機、電腦上面對面地交流:跟孩子~。③名在電視或雷達等系統(tǒng)中,圖像信號所包括的頻率范圍,一般在零到幾兆赫之間。
其次,在保持內(nèi)容開放的基礎上,開放式辭書生活應盡量保證辭書資源的公開獲取和使用,促成辭書知識共享和辭書產(chǎn)品及服務的普惠應用。如前文所述,隨著語言文字信息化、數(shù)字化發(fā)展,許多辭書都已經(jīng)推出或正在開發(fā)各種類型的數(shù)字產(chǎn)品,我國開放式辭書生活在這一層級上已初步實現(xiàn)。
最后,辭書生活的各項活動應面向社會公眾開放,鼓勵多元主體協(xié)同參與辭書建設和知識共創(chuàng)。辭書生活包含辭書編纂、辭書出版、辭書應用、辭書研究等幾項基本活動,在傳統(tǒng)的辭書學實踐過程中,各項活動環(huán)環(huán)相扣但相對獨立,編纂、出版等辭書生產(chǎn)活動具有一定的封閉性,從編纂者發(fā)現(xiàn)變化到用戶能夠查檢到變化需要經(jīng)歷較長的周期。面對數(shù)字時代的“知識爆炸”與海量信息,適應辭書內(nèi)容和資源的開放需求,也需要進一步探索群策群力、協(xié)作共享的開放式辭書活動。
綜上所述,我們把開放式辭書生活的建設目標描述為:鼓勵社會公眾嘗試辭書生活中的多元角色,通過協(xié)同參與辭書編纂、出版、研究等活動,共同促進辭書知識內(nèi)容的動態(tài)更新、辭書資源的共建共享、辭書產(chǎn)品及服務的普惠應用。從開放科學與語言治理的角度看,數(shù)字時代的開放式辭書生活仍面臨著諸多挑戰(zhàn)。
(二) 開放式辭書生活所帶來的挑戰(zhàn)
在聯(lián)合國教科文組織(2022)的《開放科學建議書》中,開放科學被定義為“人人皆可公開使用、獲取和重復使用多種語言的科學知識”“增進科學合作和信息共享”“向傳統(tǒng)科學界以外的社會行為者開放科學知識的創(chuàng)造、評估和傳播進程”的包容性架構,并且重視與其他知識體系的開放式對話。從開放科學背景出發(fā),開放式辭書生活必須應對知識產(chǎn)權、數(shù)據(jù)安全、數(shù)據(jù)隱私、語言倫理、語言規(guī)范等方面的挑戰(zhàn)。
第一,知識產(chǎn)權和數(shù)據(jù)安全問題。一部成熟的辭書,往往是編纂團隊代際接力、多次修訂的知識產(chǎn)品,具有重大的教育、學術和經(jīng)濟價值。辭書領域的數(shù)字化轉(zhuǎn)型,必然形成規(guī)?;恼Z言產(chǎn)業(yè)和數(shù)字經(jīng)濟。數(shù)字辭書資源的開放,不僅關涉到集體智力勞動的知識產(chǎn)權問題,也可能觸及軍事、經(jīng)濟、民生等關鍵領域的數(shù)據(jù)安全問題。
第二,數(shù)據(jù)隱私和語言倫理問題。數(shù)字化手段可用于輔助研判、修訂辭書知識內(nèi)容。例如基于語言監(jiān)測平臺的詞形、詞頻、語料等數(shù)據(jù)實時更新條目、配例、義項及順序等,廣泛吸收“大眾的日常生活經(jīng)驗”對辭書進行動態(tài)修訂。(李仕春 2021)但是,關于社會語言生活的觀測數(shù)據(jù)涉及人們的偏好和隱私,應在合法、合理的基礎上謹慎開放使用。語言智能,特別是大語言模型的發(fā)展,離不開大規(guī)模、高質(zhì)量的語言數(shù)據(jù),其中也包括辭書數(shù)據(jù)。能否對辭書數(shù)據(jù)的來源和去向進行有效監(jiān)管,則關系到語言倫理 問題。
第三,規(guī)范問題。引導社會公眾參與辭書編纂、出版等活動,還要格外注意規(guī)范問題。一是語言文字規(guī)范,辭書生活語言應符合《中華人民共和國國家通用語言文字法》等法律法規(guī)和語言文字規(guī)范標準;二是內(nèi)容規(guī)范,應尊重法律和公序良俗;三是程序規(guī)范,提供的條目、注音、釋義、例證等信息應符合編纂規(guī)則、出版規(guī)范、數(shù)據(jù)規(guī)范和文獻引用 規(guī)范。
辭書生活應當開放,更應安全、規(guī)范、高質(zhì)量開放。應對開放式辭書生活的挑戰(zhàn),宏觀層面需要重視辭書規(guī)劃和辭書生活治理,推動制定辭書產(chǎn)業(yè)規(guī)范標準。本文聚焦微觀層面,考察開放式辭書生活的一些已有探索,從中歸納出適用于我國數(shù)字時代開放式辭書生活的建設經(jīng)驗。
四、 開放式辭書生活的探索模式及案例
(一) 眾源編纂:從《牛津英語詞典》到“維基百科”
“眾源”(crowdsourcing)是一個管理科學概念,指組織機構將內(nèi)部任務以自愿參與的方式外包給非特定的個人或群體。眾源模式的興起與互聯(lián)網(wǎng)發(fā)展有關,但在辭書學領域可以追溯到一些早期的眾源編纂實踐。
《德語大辭典》《牛津英語詞典》《朗文英語發(fā)音詞典》等紙媒辭書在編纂過程中嘗試過號召志愿者來分擔閱讀文獻、收集詞條引文、辨別詞匯發(fā)音等任務,當時主要通過郵寄資料等方式傳遞關于詞典編纂的意見。(金丹 2019)進入互聯(lián)網(wǎng)時代,“維基百科”作為一個具有全球影響力的開放式在線百科全書,本質(zhì)上還是沿襲眾源編纂的核心思路,但編纂權限進一步放開:用戶不僅限于提供引文例證,還可以通過自發(fā)創(chuàng)建或維護條目等行為來協(xié)同 編輯。
基于互聯(lián)網(wǎng)平臺的眾源編纂,最大特點是融合了編纂者和用戶的邊界,使“編輯”也成為一類使用行為,從而動員更多人廣泛參與到辭書編纂過程中,并根據(jù)日常應用或研究辭書的經(jīng)驗知識隨時更新詞條?;ヂ?lián)網(wǎng)平臺的優(yōu)勢在于,能夠保存過程性的條目編輯記錄,并為眾多參與者提供一個公共討論空間。例如,截至2023年10月27日,“維基百科”中的“茶”詞條共經(jīng)歷過1074次修訂,每個歷史版本標注有“修正筆誤”“內(nèi)容擴充”“修飾語句”“增加或調(diào)整參考來源”等具體修訂操作,可以比較修訂版本、統(tǒng)計或交互式瀏覽修訂歷史;另外,條目下設置有討論區(qū),用于交流觀點、展示條目質(zhì)量評價情 況等。
如今,越來越多的數(shù)字辭書采取這種眾源編纂模式。除了“百度百科”“搜狗百科”“MBA智庫百科”“知乎百科”等百科網(wǎng)站之外,《在線大牛津》《中國英語詞典》等網(wǎng)絡詞典也正在逐步開放收集、編輯、修訂、擴充等編纂權限。不過,這種模式下用戶主要承擔辭書編纂的“義務資料員”和“學術顧問”兩類角色(秦曉惠 2014;秦曉惠,邸乙娟 2020),生活化程度有限。而且,為了保證條目編輯質(zhì)量,辭書眾源編纂的前期、中期和后期分別需要設置明晰嚴格的工作流程、編輯規(guī)則和審查制度。
(二) 開源管理:學習詞典的個性化定制
“開源”指公開計算機軟件的源代碼,允許用戶獲取、修改和分享。廣義的“開源”不僅限于軟件,而是泛指一種開放共享的協(xié)作模式。如果說眾源編纂是對辭書編纂活動的開放式探索,數(shù)字辭書的開源管理則是對傳統(tǒng)辭書出版模式的創(chuàng)新,將辭書產(chǎn)品的設計權限更多地移交給用戶。
目前市場上許多學習詞典都支持用戶對數(shù)字辭書資源進行開源管理,例如“歐路詞典”“墨墨背單詞”“DesktopVoc”等軟件。用戶可以選擇已有詞典、導入詞典庫或創(chuàng)建詞庫,也可以添加或修改詞條,根據(jù)自己的學習需求來定制實際使用的詞典,或者接受系統(tǒng)算法基于查檢習慣提供的個性化推薦。
值得一提的是真正實現(xiàn)狹義開源的辭書工具“GoldenDict”。它公開提供不同歷史版本的軟件安裝包和源代碼,不僅支持導入多種開源格式的詞典資源、添加在線詞典或百科網(wǎng)站、結合正則表達式進行語料檢索,還允許用戶自定義字體、背景、顯示風格等界面設計,并且主要依靠用戶網(wǎng)絡社區(qū)進行維護與升級。這類開源辭書工具的使用門檻相對較高,需要具備一定的計算機知識。但用戶探索、討論、推薦辭書管理方案的主觀意愿也比較強,經(jīng)常在網(wǎng)絡社區(qū)內(nèi)交流使用經(jīng)驗、功能擴展、詞典資源、語言學習等問題。
數(shù)字辭書的開源管理模式對構建開放式辭書生活具有較大的啟發(fā)意義。隨著人的全面發(fā)展,對美好生活的多元需求得以釋放,數(shù)字化與融媒體技術也讓人們更關注個性化定制方案。在辭書編纂與出版等活動中提升人們參與辭書生活的主動權,可以引導人們自發(fā)探索和維護辭書資源,促進更好的用戶體驗。
(三) 移動社區(qū):“生僻字征集”微信小程序
“生僻字征集”微信小程序是由工業(yè)和信息化部電子工業(yè)標準化研究院指導的生僻字提交入口,廣泛征集生僻字的圖片、讀音、來源、釋義等信息,通過審核考證的生僻字將被賦碼并錄入國標字庫,從而實現(xiàn)在信息化系統(tǒng)中的無障礙輸入與輸出。除了提交生僻字之外,用戶還可以在該小程序中使用以下幾項功能:(1) 進入“生僻字廣場”,查看所有用戶最新提交的生僻字信息,進行評價(“有啟發(fā)”或“很費解”)和分享;(2) 互動答題,根據(jù)圖片猜測漢字的意思,回答后可以查看詳細釋義;(3) 瀏覽關于“漢字守護計劃”的科普文章。此外,為了提高用戶的積極性和創(chuàng)造力,該小程序采用的激勵機制是提供“漢字守護者”的守護記錄和證書,以證明用戶為共建漢字文明做出的貢獻。
我們把以“生僻字征集”小程序為代表的辭書生活模式概括為移動社區(qū)模式,其特點是覆蓋了從源頭征集到應用落地的全鏈路,通過多種互動場景構建移動端的虛擬辭書社區(qū)。相較于辭書的眾源編纂和開源管理,這種移動社區(qū)模式在保留開放式征集任務的基礎上,鼓勵用戶培育猜一猜漢字、逛一逛“廣場”、看一看所參與計劃的動態(tài)等辭書生活習慣,隨時獲取辭書知識,豐富語言文化生活。用戶從“義務資料員”角色成長為中華語言文化的建設者和見證者,對于辭書生活的黏性和活躍度更高,有利于建立以辭書為紐
帶的趣緣群體(interest-related group)和文化認同。
(四) 智能交互:對話式AI作為釋義工具
智能化是數(shù)字化發(fā)展的下一階段,可以預見的是,數(shù)字時代的開放式辭書生活將不斷與語言智能深度融合。作為語言智能的典型代表,對話式AI有兩個顯著優(yōu)勢,一是能快速從海量數(shù)據(jù)中提取相關信息并生成簡要回答,二是對話式的人機交互方式對用戶更友好。在此,我們嘗試跳出辭書生活的固有場景,探索對話式AI工具在釋義過程中的輔助性介入作用,想象智能交互模式在未來辭書生活中的應用前景。
1. 大語言模型輔助解釋新詞新義
對于隨著社會發(fā)展出現(xiàn)的新詞或新義,我們進行釋義時,可以先對大語言模型下指令,初步了解詞語的意義和用法。例如,“逆行者”是《咬文嚼字》發(fā)布的2020年度十大流行語之一,對于指令“請對中文詞語‘逆行者’進行釋義”,GPT-3.5、文心一言和訊飛星火這三類對話式AI的回答分別如下:
(1) GPT-3.5:“逆行者”通常指的是那些不按照社會傳統(tǒng)或規(guī)范來行事的人,他們可能持有與主流觀點相反的看法,或者在特定領域或問題上采取與大多數(shù)人不同的立場和行動。這個詞語可以用來形容那些敢于挑戰(zhàn)權威、常規(guī)或傳統(tǒng)的人,他們通常追求獨立思考和創(chuàng)新,有時會遭受批評或反對,但也可能因此取得顯著的成就或引領變革。逆行者常常代表一種對社會變革和進步的力量。
(2) 文心一言:“逆行者”這個詞語通常用來形容那些在困境中表現(xiàn)出頑強和毅力的行動者。它帶有一種贊美和敬仰的情感色彩。具體來說,“逆行者”是指那些在面對困難、挑戰(zhàn)或者是不利環(huán)境時,不屈不撓地前行,甚至能夠改變自己以適應環(huán)境的人。這些人通常具有非常強的意志力和決心,他們不畏艱難險阻,勇往直前,不放棄任何機會去實現(xiàn)自己的目標。例如,在疫情期間,那些冒著風險堅守在一線的醫(yī)護人員就可以被稱為“逆行者”,因為他們在這個困難時刻選擇了前行,而不是后退。
(3) 訊飛星火:“逆行者”是一個中文詞語,通常用來形容在特定情況下,與大多數(shù)人或主流趨勢相反行動的人。這個詞語常常用來表示這些人具有勇敢、堅定的品質(zhì),他們敢于挑戰(zhàn)權威、傳統(tǒng)觀念或者社會規(guī)范,為了追求真理、正義或者個人信仰而選擇與眾不同的道路。例如,在疫情期間,醫(yī)護人員冒著生命危險救治病患,他們被稱為“抗疫逆行者”。在這個語境下,“逆行者”表示這些醫(yī)護人員不顧自身安危,勇敢地投身于抗擊疫情的戰(zhàn)斗中,與病毒傳播的大趨勢背道而馳。
從上述回答來看,“逆行者”有兩個義項,并且釋義關鍵詞是“逆”和“勇敢”。但是,AI給出的釋義太過冗長,不符合簡明易讀的釋義原則。人工釋義如下:
逆行者 名 ①勇于跟通常的行為或認識反向行動的人。②特指敢于奔赴受災地區(qū)或危險境地進行救援工作的人。
而且,AI解釋的都只有比喻義,忽略了“逆行者”的本義,即“反向運動的人”,如:
(4) 車輛行人都要靠右行駛。如果不這樣就是逆行,出了交通事故,一般要由逆行者負責。(師言《社會保險行政爭議處理辦法實施手冊》)
不過,“逆行者”的本義不常用;且中文里帶“者”的詞語很多,例如“旅行者、唱歌跑調(diào)者、饑餓者、貧困者……”?!澳嫘姓摺苯瓿稍~,與抗疫先進個人和集體產(chǎn)生的重大社會影響有關,創(chuàng)建詞條時可以只收常用的、超出字面的比喻義。
2. AI文獻閱讀工具輔助術語釋義
當代世界科技創(chuàng)新呈指數(shù)增長,新概念、新術語不斷涌現(xiàn),而權威的學術文獻通常是術語釋義的重要參考來源。合理運用AI文獻閱讀工具,可以快速得到關于術語的綜合理解和觀點對比,有效減輕編纂??妻o書的考證壓力。
以對話式AI工具“SciSpace”為例,它可以在理解論文的基礎上,為用戶的問題提供一些有價值的見解(insight)。比如,我們希望了解學界關于“元宇宙”概念的解釋,于是提問“‘元宇宙’是否有定義”(Does“ Metaverse” have a de?nition?),得到的AI見解如下:
(5) “元宇宙”一詞確實有定義,盡管其描述方式存在一些差異。元宇宙通常被理解為結合虛擬現(xiàn)實和物理現(xiàn)實的虛擬宇宙或共享空間,包括虛擬世界、增強現(xiàn)實和互聯(lián)網(wǎng)。它是一個由相互連接的虛擬空間組成的網(wǎng)絡,用戶在其中可以通過虛擬現(xiàn)實(VR)和增強現(xiàn)實(AR)等沉浸式技術與彼此和環(huán)境進行交互。元宇宙被視為一個為品牌提供與消費者互動并創(chuàng)造沉浸式體驗機會的平臺。它也被描述為一個自給自足的系統(tǒng),擁有自己的虛擬物品經(jīng)濟和貿(mào)易,并且需要一個相互依存的架構來促進交互。無數(shù)用戶可以同步持續(xù)體驗元宇宙,它為各行各業(yè)的數(shù)字創(chuàng)新提供了巨大機遇。
除了綜合性回答之外,AI還會詳細地整理每個觀點的論文出處,并且接受用戶的評價和反饋。如表1所示,表格中列出了談及“元宇宙”定義的論文標題、作者、來源期刊、發(fā)表時間和相關觀點,以便術語編纂者進一步地查閱和考證。
以上兩個案例說明,對話式AI能夠很好地發(fā)揮數(shù)據(jù)驅(qū)動優(yōu)勢,提供開放的釋義線索和參考材料,在一定程度上有可能取代眾源編纂中“義務資料員”的角色。智能交互模式是一種值得繼續(xù)探索的辭書生活模式,但AI有明顯的局限性,在辭書生活中更宜充當釋義“助手”。
五、 結語
本文將辭書生活定義為與編纂辭書、出版辭書、應用辭書、研究辭書相關的社會生活,并從辭書的數(shù)據(jù)、媒介、類型、服務等方面討論了數(shù)字化轉(zhuǎn)型對當代辭書生活的顯著影響。數(shù)字時代的辭書編纂邏輯和應用場景已發(fā)生深刻變化,技術上支持辭書資源的公開獲取、使用、傳播、編輯與評價,有必要及時探索開放式辭書生活的理論概念和實踐模式。
“開放”是數(shù)字時代的重要議題,建設開放式辭書生活,應重視人們的個性化、多元化需求,鼓勵社會公眾協(xié)同參與辭書編纂、出版、研究等活動,共同促進辭書知識內(nèi)容的動態(tài)更新、辭書資源的共建共享、辭書產(chǎn)品及服務的普惠應用;同時,也要注意應對知識產(chǎn)權、數(shù)據(jù)安全、數(shù)據(jù)隱私、語言倫理、語言規(guī)范等方面的挑戰(zhàn)。本文集中歸納了開放式辭書生活的四種模式:眾源編纂,開源管理,移動社區(qū)和智能交互。隨著語言智能的發(fā)展,辭書編纂“義務資料員”的角色將來可能被AI取代,人們應更積極地嘗試辭書生活中的多元角色。為了引導安全、規(guī)范、高質(zhì)量的開放式辭書生活,專業(yè)的辭書編纂者或可向辭書生活治理者轉(zhuǎn)型。
開放式辭書生活有助于形成以辭書為紐帶的趣緣群體和文化認同,從現(xiàn)實維度實現(xiàn)中華優(yōu)秀語言文化的集體構建,在提升我國辭書編纂水平、知識管理與服務水平、文化傳播能力和世界辭書影響力等方面做出重要貢獻。未來,更多現(xiàn)代化辭書生活模式值得進一步探索。
參考文獻
1. 陳雪. 數(shù)字時代,辭書有何新變化. 光明日報,2022-11-29.
2. 戴宗杰. 中國辭書學會融媒體辭書專題研討會暨常務理事會擴大會議在魯東大學舉行. http://www.cishu.ldu.edu.cn/info/1041/2703.htm,2019.
3. 杜翔.試論中國辭書精神.語言戰(zhàn)略研究,2023(3).
4. 國務院辦公廳. 關于全面加強新時代語言文字工作的意見:國辦發(fā)〔2020〕30號. http://www.gov.cn/zhengce/content/2021-11/30/content_5654985.htm,2020.
5. 金丹.“眾包方式”在詞典編纂中的應用.開封教育學院學報,2019(9).
6. 李仕春.基于日常生活經(jīng)驗的語文辭書釋義研究.魯東大學學報,2021(5).
7. 李宇明. 我看“融媒辭書”——小論“聚典數(shù)據(jù)開放平臺”. 中華讀書報,2020a-09-16(6).
8. 李宇明.語言治理的現(xiàn)實路向(代主持人語).云南師范大學學報,2020b(3).
9. 李宇明.語言規(guī)劃學說略.辭書研究,2022(1).
10. 李宇明,王東海.中國辭書歷史發(fā)展的若干走勢.魯東大學學報,2020(1).
11. 聯(lián)合國教科文組織. 開放科學建議書. 巴黎:聯(lián)合國教育、科學及文化組織,2022.
12. 呂海春.中國辭書數(shù)字化發(fā)展三十年.語言戰(zhàn)略研究,2023(5).
13. 毛文濤.從《辭?!返健熬鄣鋽?shù)據(jù)開放平臺”.出版與印刷,2023(4).
14. 秦曉惠.基于“眾源方式”的詞典編纂模式探析——以《在線牛津英語詞典》為例.語言教學與研究,2014(4).
15. 秦曉惠,邸乙娟. 基于眾源方式的《中國英語詞典》編纂與使用研究. 北京:對外經(jīng)濟貿(mào)易大學出版社,2020.
16. 汪維輝.時代呼喚在線《漢語大詞典》.寧波大學學報,2013(4).
17. 汪維輝.探索辭書“動態(tài)修訂”新模式.辭書研究,2019(4).
18. 張書巖.權威辭書對語言文字規(guī)范的貫徹與引領——以《新華字典》為例.魯東大學學報,2023(1).
19. 章宜華.融媒體視角下多模態(tài)詞典文本的設計構想.辭書研究,2021(2).
20. 中華人民共和國國民經(jīng)濟和社會發(fā)展第十四個五年規(guī)劃和2035年遠景目標綱要. https://www.gov.cn/xinwen/2021-03/13/content_5592681.htm,2021.
21. Atkins B T S,Rundell M. The Oxford Guide to Practical Lexicography. New York:Oxford University Press,2008.
22. Hartmann R R K. Lexicography:Critical Concepts. London:Routledge,2003.
23. Zgusta L. Manual of Lexicography. Prague:Academia,Publishing House of the Czechoslovak Academy of Sciences,1971.
(儲澤祥 中國社會科學院大學文學院/中國社會科學院文學研究所 北京 100732;徐夢真 北京郵電大學人文學院 北京 102206)
(責任編輯 劉 博)