趙生輝,胡 瑩(.西藏民族大學(xué)管理學(xué)院;.云南大學(xué)歷史與檔案學(xué)院)
互聯(lián)網(wǎng)的飛速發(fā)展使人們接觸到非母語信息的機(jī)會大幅增加,檢索、訪問、閱讀和利用非母語信息資源的需求日益增長。為了滿足用戶對多語種信息資源的利用需求,數(shù)字圖書館必須在信息資源的生成、采集、組織、檢索、呈現(xiàn)、服務(wù)等環(huán)節(jié)提供多語言支持。多語言環(huán)境下的數(shù)字圖書館除了具備單一語言數(shù)字圖書館的基本屬性之外,其信息生態(tài)鏈也會因語言文字的多樣性體現(xiàn)出特有的結(jié)構(gòu)和規(guī)律。研究和探索多語言數(shù)字圖書館信息生態(tài)鏈的運(yùn)行機(jī)理對于應(yīng)對全球范圍內(nèi)信息管理和利用的多語種化趨勢、提高多語言數(shù)字圖書館建設(shè)和管理的科學(xué)化程度具有重要作用,對于多民族國家面向不同語言公民社群開展多語種信息服務(wù)具有一定的參考價(jià)值。
數(shù)字圖書館(Digital Library)通常是指致力于實(shí)現(xiàn)數(shù)字文獻(xiàn)信息資源跨媒體、跨地域整合與共享的分布式信息服務(wù)系統(tǒng)。[1]作為“多語言信息存取”[2]與“數(shù)字圖書館”的交叉領(lǐng)域,多語言數(shù)字圖書館(Multilingual Digital Library,MDL)是指涉及兩種以上自然語言信息資源的存取或者可以為用戶提供兩種以上自然語言信息服務(wù)的數(shù)字圖書館。[3]此處的“語言”是指人類社會生成和使用的自然語言,并非面向計(jì)算機(jī)處理的人工編程語言,計(jì)算機(jī)軟件視角下的可以集成多種編程語言的“多語言數(shù)字圖書館”雖然采用了同樣的術(shù)語表達(dá),卻不屬于本文的研究范疇。多語言數(shù)字圖書館當(dāng)中的“多語言”通常包括多語言信息資源和多語言信息服務(wù)兩個方面的特征,前者重點(diǎn)關(guān)注多語種信息資源的集成共享,后者重點(diǎn)關(guān)注信息資源的多語言傳播。
多語言數(shù)字圖書館具備數(shù)字圖書館系統(tǒng)的基本屬性,同時(shí)由于信息資源和信息服務(wù)的多語言特征,面臨一些需要特別應(yīng)對的挑戰(zhàn)和問題。例如,對不同語種信息資源進(jìn)行語義關(guān)聯(lián)實(shí)現(xiàn)多語種信息資源的跨語言檢索,為用戶提供必要的母語信息提示、輔助用戶完成跨語言瀏覽或閱讀等。多語言數(shù)字圖書館旨在協(xié)調(diào)語言文字多樣性和溝通交流一體化之間的矛盾,它可以在保持信息資源多語言特征的同時(shí),通過技術(shù)和管理手段實(shí)現(xiàn)多語言信息資源與多語言用戶群體的最佳匹配,將語言文字差異性造成的溝通交流障礙降到最低,使用戶獲得更加良好的信息服務(wù)體驗(yàn)。
目前,較大規(guī)模的多語言數(shù)字圖書館主要有世界數(shù)字圖書館(World Digital Library,WDL)、國際兒童數(shù)字圖書館 (International Children’s Digital Library,ICDL)、加勒比海數(shù)字圖書館(The Digital Library of Caribbean,dLOC)、雪域數(shù)字圖書館(The Tibetan&Himalayan Library,THL)等。國內(nèi)學(xué)者或機(jī)構(gòu)近年來提出的有關(guān)多語言數(shù)字圖書館建設(shè)的倡議主要有亞洲數(shù)字圖書館(Asia Digital Library,ADL)、絲路數(shù)字圖書館(Belt&RoadDigitalLibrary)、中國民族數(shù)字圖書館等。[3-5]總體而言,學(xué)界當(dāng)前對多語言數(shù)字圖書館這一特殊研究對象的認(rèn)識還處于較為粗淺的階段,這種狀況對“一帶一路”背景下圖書館事業(yè)的國際合作以及提升我國民族地區(qū)多語言環(huán)境下的信息服務(wù)水平造成了一定程度的制約。
信息生態(tài)學(xué)是從生態(tài)學(xué)視角探討人類社會信息活動規(guī)律的交叉學(xué)科,其基本觀點(diǎn)主要包括:信息在人類社會的流轉(zhuǎn)與生物在自然界的繁衍生息具有相似的規(guī)律性;一定時(shí)空中的信息生態(tài)系統(tǒng)是由信息、信息人、信息技術(shù)和信息環(huán)境等要素相互聯(lián)系、相互影響和相互作用而形成的有機(jī)整體;信息在不同主體之間的流轉(zhuǎn)形成相互關(guān)聯(lián)、相互依存的鏈條式結(jié)構(gòu),即“信息生態(tài)鏈”。[6]因此,多語言數(shù)字圖書館信息生態(tài)鏈?zhǔn)侵付嗾Z言信息資源在信息傳播者、信息收集者、信息聚合者、語言服務(wù)提供者、信息技術(shù)提供者和多語言用戶群體之間流轉(zhuǎn)而形成的相互關(guān)聯(lián)、相互依存的復(fù)雜性鏈條式結(jié)構(gòu)。
美國數(shù)學(xué)家申農(nóng)(C.E.Shannon)將信息通訊過程簡化為由信源、編碼、信道、信號、噪聲、譯碼、信宿等要素組成的信息系統(tǒng)。[7]從信息通訊系統(tǒng)視角審視多語言數(shù)字圖書館信息生態(tài)鏈,可將其看作信息服務(wù)人員將多語言數(shù)字信息資源通過互聯(lián)網(wǎng)傳遞給多語言用戶的過程。如果數(shù)字信息使用的語言文字與用戶能理解和識別的語言文字不屬于同一類型,意味著信源端和信宿端出現(xiàn)了編碼方案錯位,信息資源即使可以傳遞給用戶也不能對其產(chǎn)生實(shí)質(zhì)性影響,溝通交流被語言障礙所阻斷。為減少語言文字差異性對信息交流造成的影響,信息服務(wù)者通常需要依托人工或機(jī)器翻譯手段對信息資源進(jìn)行轉(zhuǎn)換,以實(shí)現(xiàn)信息資源與用戶需求之間的匹配。因此,多語言數(shù)字圖書館信息生態(tài)鏈本質(zhì)上就是信源端和信宿端編碼方案動態(tài)匹配的過程,其形態(tài)通常不會是簡單的線性結(jié)構(gòu),而是因多種語言相互轉(zhuǎn)換而形成的復(fù)雜結(jié)構(gòu)。
婁策群等認(rèn)為,信息生態(tài)鏈?zhǔn)侵冈谛畔⑸鷳B(tài)系統(tǒng)中,信息流轉(zhuǎn)于不同信息人之間而形成的鏈?zhǔn)揭来骊P(guān)系。[6]信息生態(tài)鏈的基本形態(tài)可以描述為由信息生產(chǎn)者、信息傳遞者和信息消費(fèi)者之間的正向信息流和反饋信息交流構(gòu)成的鏈?zhǔn)浇Y(jié)構(gòu)。根據(jù)上述觀點(diǎn),構(gòu)建數(shù)字圖書館的信息生態(tài)鏈(見圖1)。[8]
圖1 數(shù)字圖書館的信息生態(tài)鏈的結(jié)構(gòu)
數(shù)字圖書館的信息生態(tài)鏈主要由信息生產(chǎn)者、信息傳播者、信息收集者、信息聚合者、信息技術(shù)支持者、信息政策制定者和信息消費(fèi)者等信息主體構(gòu)成?!靶畔⑸a(chǎn)者”是產(chǎn)生信息的人,主要指撰寫圖書、論文等各類信息資源的作者群體?!靶畔鞑フ摺笔菑氖滦畔⒊霭姘l(fā)行和公開傳播服務(wù)的各類專業(yè)工作者群體,如出版社、期刊社、報(bào)社等新聞出版機(jī)構(gòu)及博客、論壇等網(wǎng)絡(luò)信息服務(wù)機(jī)構(gòu)的工作人員?!靶畔⑹占摺狈譃閮煞N類型,“信息收集者I”主要是指從事文獻(xiàn)數(shù)據(jù)庫建設(shè)的信息服務(wù)提供商,“信息收集者II”指圖書館中從事特定主題數(shù)字信息資源建設(shè)的工作人員?!靶畔⒕酆险摺敝竿ㄟ^技術(shù)手段和統(tǒng)一界面為信息消費(fèi)者提供自建、購買或共享的數(shù)字信息資源的工作人員?!靶畔⒓夹g(shù)提供者”是為數(shù)字圖書館的功能實(shí)現(xiàn)和正常運(yùn)行提供技術(shù)支持的各類技術(shù)人員?!靶畔⒄咧贫ㄕ摺敝竿ㄟ^制定數(shù)字圖書館運(yùn)行管理相關(guān)的法律、規(guī)范和標(biāo)準(zhǔn),維持?jǐn)?shù)字圖書館信息生態(tài)系統(tǒng)運(yùn)行秩序的各類公共機(jī)構(gòu)工作人員?!靶畔⑾M(fèi)者”分為兩種類型,“信息消費(fèi)者I”是指分散形態(tài)信息資源面向的用戶群體,大多數(shù)情況下屬于信息傳播的受眾群體,“信息消費(fèi)者II”是指聚合形態(tài)信息資源面向的用戶群體,本質(zhì)上屬于信息資源的二次集成利用而產(chǎn)生的新的用戶群體?!靶畔⑾M(fèi)者II”與“信息聚合者”之間為雙箭頭,表示兩者之間為互動關(guān)系,“信息消費(fèi)者II”可以通過信息反饋影響信息服務(wù)的模式和信息資源收集的范圍。綜上,數(shù)字圖書館(D-Library)是在特定的信息政策環(huán)境中,由各類相關(guān)信息主體在信息技術(shù)支持下,通過信息收集、信息聚合、信息技術(shù)支持等功能所形成的整合型信息空間,各類因素相互聯(lián)系、相互協(xié)作、相互依賴,形成具有整體性功能特征的信息生態(tài)系統(tǒng),最終目標(biāo)是集成各類社會信息資源,最大限度滿足用戶的信息需求。
多語言數(shù)字圖書館信息生態(tài)鏈?zhǔn)窃趪艺Z言文字政策框架內(nèi),由信息資源的多語言特征或信息消費(fèi)者的多語言需求驅(qū)動的多語言化信息收集、聚合與服務(wù)的過程(見圖2)。
圖2 多語言數(shù)字圖書館信息生態(tài)鏈的結(jié)構(gòu)
多語言數(shù)字圖書館具備數(shù)字圖書館信息生態(tài)鏈的基本特征,同時(shí)由于語言文字的多樣性,其信息生態(tài)鏈需要增加部分個性化模塊。相對于單一語言數(shù)字圖書館,多語言數(shù)字圖書館信息生態(tài)鏈有以下4個特點(diǎn)。① 信息資源的語種多樣。造成信息資源語種多樣性的主要原因是信息生產(chǎn)者處于不同的語言文字生態(tài)圈,當(dāng)收集信息的范圍跨越不同區(qū)域時(shí),就會對數(shù)字圖書館的體系結(jié)構(gòu)和服務(wù)模式提出更高要求。② 信息服務(wù)的語種多樣。信息服務(wù)需求呈現(xiàn)多語言特征的主要原因在于信息消費(fèi)者群體來自不同的語言文字圈,不能識別和理解以其他語言文字為信息記錄符號的信息資源。③ 數(shù)字圖書館需要進(jìn)行不同語種語言文字信息資源之間的相互轉(zhuǎn)換。通常情況下,至少需要使用一種語言文字著錄或者翻譯另一種語言的信息,以保證信息消費(fèi)者可以用自己熟悉的語言文字閱讀或者了解其他語種信息資源的內(nèi)容。因此,圖2中的“語言服務(wù)提供者”可分為“語言服務(wù)提供者I”和“語言服務(wù)提供者II”,前者指數(shù)字圖書館建設(shè)機(jī)構(gòu)內(nèi)部從事語言文字翻譯或轉(zhuǎn)換服務(wù)的工作人員,后者指從事語言文字翻譯服務(wù)的社會專業(yè)機(jī)構(gòu)或人員。在數(shù)字圖書館建設(shè)機(jī)構(gòu)缺乏足夠的多語言專業(yè)工作人員時(shí),通??梢酝ㄟ^服務(wù)外包的方式購買社會專業(yè)機(jī)構(gòu)提供的語言服務(wù)。④ 數(shù)字圖書館的多語言信息資源管理需要遵守國家語言文字管理的法規(guī)政策,符合國家語言文字工作的總體戰(zhàn)略,這是單一語言數(shù)字圖書館建設(shè)很少需要考慮的問題。因此,圖2中的“語言文字政策制定者”主要是指國家語言文字工作機(jī)構(gòu)、標(biāo)準(zhǔn)規(guī)范制定機(jī)構(gòu)的工作人員。
可見,多語言數(shù)字圖書館信息生態(tài)鏈以使用多種語言文字的用戶群體為基礎(chǔ),在信息政策制定者、語言政策制定者共同構(gòu)建的制度框架內(nèi),通過信息傳播者、信息收集者、信息聚合者、語言服務(wù)提供者、信息技術(shù)提供者的相互協(xié)作實(shí)現(xiàn)多語言信息資源的優(yōu)化配置,最終滿足用戶對多語言信息資源的需求。
多語言數(shù)字圖書館信息生態(tài)鏈結(jié)構(gòu)模型是對多語言環(huán)境下數(shù)字信息資源傳播過程的全面反映,是一種考慮到各類應(yīng)用需求的復(fù)雜網(wǎng)狀結(jié)構(gòu)。然而,具體到任何一個實(shí)際的應(yīng)用場景,數(shù)字資源語種和數(shù)量、機(jī)構(gòu)所擁有或者可以從外部共享的語言資源的數(shù)量、服務(wù)對象的語言能力的差異性等因素都會使多語言數(shù)字圖書館的功能構(gòu)建側(cè)重于其中的某些方面,因而信息生態(tài)鏈的運(yùn)行機(jī)理會呈現(xiàn)出多樣化特征。根據(jù)申農(nóng)的信息通訊系統(tǒng)模型,[7]信源端采集和保存的信息資源語言數(shù)量和信宿端用戶所能識讀和理解的語言數(shù)量呈現(xiàn)出從一種到多種的可能性,兩者之間的組合關(guān)系與數(shù)字圖書館信息生態(tài)鏈之間的關(guān)系見圖3。
圖3 多語言數(shù)字圖書館信息生態(tài)鏈的類型
圖3 將數(shù)字圖書館數(shù)字資源語言種類劃分為1(單語言)和n(n≧2,多語言)兩種情形,將用戶群體可以理解的語言種類表達(dá)為1(單語言)和m(m≧2,多語言)兩種情形。根據(jù)信源端和信宿端涉及語言文字?jǐn)?shù)量之間的組合對應(yīng)關(guān)系,可以將多語言數(shù)字圖書館的信息生態(tài)鏈劃分為四種類型:① 一對一(1/1),并行結(jié)構(gòu)多語言數(shù)字圖書館信息生態(tài)鏈;②多對一(n/1),集成結(jié)構(gòu)多語言數(shù)字圖書館信息生態(tài)鏈;③ 一對多(1/m),擴(kuò)散結(jié)構(gòu)多語言數(shù)字圖書館信息生態(tài)鏈;④ 多對多(n/m),網(wǎng)絡(luò)結(jié)構(gòu)多語言數(shù)字圖書館信息生態(tài)鏈。上述每種結(jié)構(gòu)的多語言數(shù)字圖書館信息生態(tài)鏈都有其典型特征,與不同的應(yīng)用場景相對應(yīng),呈現(xiàn)出不同的運(yùn)行機(jī)理。
并行結(jié)構(gòu)多語言數(shù)字圖書館信息生態(tài)鏈的特征為信源端的數(shù)字資源只涉及一種語言,用戶群體只能識讀一種語言文字的信息資源,信源端傳遞的信息資源和信宿端用戶可以識讀和理解的信息資源屬于同一語種,這正是單一語言數(shù)字圖書館的典型特征。這就意味著在并行結(jié)構(gòu)多語言數(shù)字圖書館中,單一語言數(shù)字圖書館的特征依然存在,即多語言數(shù)字圖書館當(dāng)中同時(shí)并行著若干條獨(dú)立存在的單一語言信息傳遞通道。并行結(jié)構(gòu)多語言數(shù)字圖書館是按照多個語種獨(dú)立提供信息服務(wù)的思路進(jìn)行建設(shè)的,其建設(shè)機(jī)構(gòu)并沒有或較少考慮跨語言信息映射問題,而是根據(jù)信息資源的現(xiàn)有語種進(jìn)行元數(shù)據(jù)描述和檢索界面設(shè)計(jì),供熟悉該語種的用戶使用。并行式結(jié)構(gòu)多語言數(shù)字圖書館的信息資源按照語種進(jìn)行嚴(yán)格分割,每個語種只要遵循單一語種數(shù)字圖書館建設(shè)和開發(fā)的規(guī)律進(jìn)行即可,不需要增加專門的語言文字映射系統(tǒng),因而整體結(jié)構(gòu)相對簡單,建設(shè)難度相對較小,可以作為多語言數(shù)字圖書館建設(shè)初期采用的架構(gòu)。并行結(jié)構(gòu)多語言數(shù)字圖書館的不足在于信息資源的管理和利用局限于單一語言內(nèi)部,信息資源傳播的范圍較小,用戶能夠檢索和閱讀的信息資源相對單一。尤其是當(dāng)用戶對某種語言的文字符號完全不能識讀時(shí),即使該信息資源對于用戶非常重要也無法被用戶檢索和利用,甚至完全排除在可利用信息資源范圍之外。
并行結(jié)構(gòu)多語言數(shù)字圖書館的應(yīng)用情境通常有以下類型。① 用戶群體中的絕大多數(shù)人能夠熟練閱讀和理解兩種以上語言文字信息資源。如果圖書館所在地區(qū)屬于典型的雙語或多語地區(qū),絕大多數(shù)的服務(wù)對象已經(jīng)掌握了兩種或兩種以上語言文字,則數(shù)字圖書館可以按照并行式架構(gòu)提供服務(wù),由用戶逐一檢索不同的服務(wù)界面獲取多個語種的信息資源。例如,我國大多數(shù)高校數(shù)字圖書館都購買了部分外文版學(xué)術(shù)數(shù)據(jù)庫的使用權(quán),用戶進(jìn)入外文版檢索頁面進(jìn)行檢索,根據(jù)需要下載和閱讀相應(yīng)語種的外文信息資源。在上述過程中,圖書館并沒有提供任何外文信息資源的翻譯服務(wù),主要是基于對高校數(shù)字圖書館用戶群體的定位,設(shè)定有外文學(xué)術(shù)數(shù)據(jù)庫使用需求的用戶通常情況下是可以熟練閱讀英語甚至其他語種外文文獻(xiàn)的。②采用松散結(jié)構(gòu)的聯(lián)邦式數(shù)字圖書館。在圖書館國際合作過程中,相關(guān)國家或者地區(qū)的文化機(jī)構(gòu)將各自的單一語種數(shù)字圖書館鏈接到協(xié)作組織的主頁中,供用戶群體進(jìn)行選擇和使用。除參與協(xié)作各方所建成的數(shù)字圖書館通常都以本國官方語言文字為主,通過協(xié)作形成的數(shù)字圖書館聯(lián)盟就成為一種并行結(jié)構(gòu)的多語言數(shù)字圖書館。
集成式結(jié)構(gòu)多語言數(shù)字圖書館的特征是信源端的信息資源涉及多個語種,但是作為服務(wù)對象的用戶群體只能識讀和理解一種語言文字,即出現(xiàn)了“多對一”結(jié)構(gòu)。由于用戶群體無法閱讀母語之外的信息資源,數(shù)字圖書館的建設(shè)機(jī)構(gòu)就要通過某種形式的映射機(jī)制為用戶提供除母語之外的其他語種信息資源的元數(shù)據(jù)、摘要甚至全文翻譯文本,信息資源的跨語言映射工作通常由專業(yè)翻譯人員或者機(jī)器翻譯系統(tǒng)相互配合完成。上述過程實(shí)現(xiàn)了多個語種數(shù)字信息資源向某一語種信息資源的映射,可以認(rèn)為是一種具有集成功能的數(shù)字圖書館。集成式結(jié)構(gòu)多語言數(shù)字圖書館是其建設(shè)機(jī)構(gòu)為了擴(kuò)大用戶的閱讀面,將部分非當(dāng)?shù)赝ㄓ谜Z種的文獻(xiàn)資源納入采集范圍而形成的一種信息生態(tài)鏈。集成式結(jié)構(gòu)多語言數(shù)字圖書館主要應(yīng)用于公共圖書館,大多數(shù)用戶群體只能閱讀和理解其母語信息資源,要檢索和利用非母語數(shù)字信息資源就必須借助公共圖書館提供的支持系統(tǒng)。例如,我國公共圖書館主要提供國家通用的漢語信息服務(wù),如果要引入英語、日語、德語、法語等外語信息資源服務(wù),則需要圖書館提供上述信息資源的漢語版本的元數(shù)據(jù)、摘要、縮寫版或者全部譯文。
與集成式結(jié)構(gòu)多語言數(shù)字圖書館的“多對一”結(jié)構(gòu)相反,擴(kuò)散式結(jié)構(gòu)多語言數(shù)字圖書館體現(xiàn)為“一對多”結(jié)構(gòu),即數(shù)字圖書館的信源端只涉及一種語言的數(shù)字信息資源,但是信宿端用戶群體的語言文字能力具有多樣化特征,需要數(shù)字圖書館建設(shè)機(jī)構(gòu)為其提供必要的支持。與集成式結(jié)構(gòu)相同的是,擴(kuò)散式架構(gòu)也需要建設(shè)機(jī)構(gòu)根據(jù)用戶需求對信息資源進(jìn)行跨語言映射,只是映射的方向不是由多語言轉(zhuǎn)向單一語言,而是由單一語言轉(zhuǎn)向多語言。假設(shè)擴(kuò)散式結(jié)構(gòu)多語言數(shù)字圖書館有使用A、B、C三種不同語言的用戶群體,對應(yīng)的信宿A、信宿B和信宿C只能識讀和理解各自信息傳遞通道上傳輸?shù)男畔①Y源,公共文化機(jī)構(gòu)所采集和保存的信息資源的語言為A、B、C當(dāng)中的一種或者是A、B、C之外的某一種語言;如果要擴(kuò)大上述信息資源的傳播范圍,則需要在語言交換體系的支持下將信源端的信息資源映射成為A語言、B語言或C語言的元數(shù)據(jù)、摘要或譯文。此外,考慮到用戶語言的多樣性,需要專門設(shè)計(jì)每一語種的檢索和利用界面,或者在同一界面中同時(shí)包含多種語言文字,以便用戶根據(jù)提示信息完成相關(guān)操作。
擴(kuò)散式結(jié)構(gòu)多語言數(shù)字圖書館的應(yīng)用情境通常有以下兩種情形。① 承擔(dān)著國家文化對外傳播功能的多語言數(shù)字圖書館。在國際合作與交流中,如果某個國家希望自己的文化能夠被其他國家的用戶所了解,則可以從傳播的視角專門設(shè)計(jì)相應(yīng)主題的數(shù)字圖書館,將本國有代表性的文化資源翻譯成多種語言文字版本,并通過多語言版本的用戶界面向目標(biāo)用戶群體提供服務(wù)。② 承擔(dān)著國家內(nèi)部跨語言社群溝通交流功能的數(shù)字圖書館。如果國家內(nèi)部存在多個不同的語言社群,尤其是部分人口還不能使用通用語言文字進(jìn)行交流時(shí),就需將與公共利益相關(guān)的各類政府文獻(xiàn)以各少數(shù)社群的語言文字進(jìn)行傳播。[9]無論是對美國、加拿大、澳大利亞這類移民國家,還是中國這類典型的世居多民族國家,擴(kuò)散式結(jié)構(gòu)多語言數(shù)字圖書館都適用。如,我國政府在召開重要的政治會議時(shí),會在提供國家通用語言文字版本會議文獻(xiàn)的同時(shí)為少數(shù)民族代表提供少數(shù)民族語言版本的文獻(xiàn)。[10]
網(wǎng)絡(luò)式結(jié)構(gòu)多語言數(shù)字圖書館是一種“多對多”的結(jié)構(gòu),信源端的數(shù)字信息資源涉及多種語言文字,信宿端是使用不同語言文字的用戶群體,數(shù)字圖書館在語言映射系統(tǒng)的輔助下,在不同語言文字信息資源之間建立關(guān)聯(lián),使得任何一種語言文字信息資源都可以映射為其他語種的元數(shù)據(jù)、摘要或者譯文,任何用戶都可以用自己熟悉的語言文字了解或閱讀數(shù)字圖書館中的任何信息資源,形成一種類似網(wǎng)絡(luò)的結(jié)構(gòu)。網(wǎng)絡(luò)式架構(gòu)是多語言數(shù)字圖書館的一種理想化模式,如果多語言數(shù)字圖書館信息生態(tài)鏈各模塊功能都可以實(shí)現(xiàn),則數(shù)字圖書館呈現(xiàn)的整體功能就是網(wǎng)絡(luò)式架構(gòu)。
網(wǎng)絡(luò)結(jié)構(gòu)多語言數(shù)字圖書館可以實(shí)現(xiàn)并行式結(jié)構(gòu)、集成式結(jié)構(gòu)、擴(kuò)散式結(jié)構(gòu)的所有功能,是多語言數(shù)字圖書館信息生態(tài)鏈四種類型中功能最為完備的一種,也是涉及因素最多、結(jié)構(gòu)最復(fù)雜的方案。 網(wǎng)絡(luò)結(jié)構(gòu)多語言數(shù)字圖書館可以在語言交換體系的支持下實(shí)現(xiàn)某一語言信息資源向其他語種信息資源的自由映射,任何一種語言的信息資源都可以在其他語言信息通道建立相同內(nèi)容、不同語言的“鏡像”。在多語言數(shù)字圖書館涉及的語言數(shù)量較多時(shí),要實(shí)現(xiàn)任何兩種語言文字信息資源之間的雙向映射成本過高,可以將其中一種語言作為中間語言,系統(tǒng)只考慮中間語言與其他語言之間的映射問題,其他語言之間的雙向映射可以中間語言為中介完成。
在網(wǎng)絡(luò)式架構(gòu)多語言數(shù)字圖書館信息生態(tài)鏈中,各類語言的地位都是平等的,因而適用于基于平等合作、互惠互利原則建立起來的國際或區(qū)域性數(shù)字圖書館聯(lián)盟。除此以外,網(wǎng)絡(luò)式架構(gòu)多語言數(shù)字圖書館可以結(jié)合不同的場合進(jìn)行變通,從而在實(shí)踐中發(fā)展出具有不同特征的應(yīng)用場景。例如,網(wǎng)絡(luò)式架構(gòu)數(shù)字圖書館中各種語言的信息資源總量和用戶數(shù)量并不相等,在機(jī)構(gòu)語言轉(zhuǎn)換能力有限的情況下,可以在跨語言映射過程中有所側(cè)重。如果某語種信息資源數(shù)量較少但用戶數(shù)量較多,將其映射到其他語種時(shí)可以選擇較小粒度、較高精度,甚至人工參與的方式完成全文對等翻譯;反之,如果某語種信息資源數(shù)量較多但用戶數(shù)量較少,則可以選擇粗粒度、低精度的映射方式,只對文獻(xiàn)的元數(shù)據(jù)甚至標(biāo)題進(jìn)行翻譯。由于語言映射系統(tǒng)能力的限制以及跨語言映射粒度、精度的變化,經(jīng)過映射處理的信息資源通常會有不同程度的“損耗”。例如,在粗粒度、低精度映射的情況下,源語言信息資源整個篇章的文本投射到另外一個語言傳遞通道后可能僅為一條數(shù)據(jù)記錄。此外,網(wǎng)絡(luò)式架構(gòu)對數(shù)字圖書館跨語言交換能力的依賴度較高,整體功能的實(shí)現(xiàn)程度受到機(jī)器翻譯等自然語言處理技術(shù)發(fā)展水平的制約,短期內(nèi)還無法實(shí)現(xiàn)在不同語言信息傳遞通道之間自由切換的狀態(tài)。因而,在自然語言處理技術(shù)還沒有取得根本性突破的情況下,網(wǎng)絡(luò)結(jié)構(gòu)多語言數(shù)字圖書館應(yīng)該視為一種遠(yuǎn)期發(fā)展目標(biāo),而不是短期內(nèi)可以實(shí)現(xiàn)的成熟模式。
多語言數(shù)字圖書館建設(shè)事關(guān)國際文化交流和民族地區(qū)文化發(fā)展,應(yīng)當(dāng)引起國家相關(guān)部門的關(guān)注和重視。根據(jù)多語言數(shù)字圖書館信息生態(tài)鏈的結(jié)構(gòu)模型,我國的多語言數(shù)字圖書館建設(shè)涉及信息政策制定者、語言政策制定者、信息傳播者、信息收集者、信息聚合者、語言服務(wù)提供者、信息技術(shù)提供者等信息主體,因此建議國家公共文化行政機(jī)構(gòu)、語言文字工作機(jī)構(gòu)和外事管理部門多方協(xié)調(diào),從國家層面上制定多語言數(shù)字圖書館發(fā)展的總體政策框架,確立多語言數(shù)字圖書館建設(shè)的基本原則,為我國多語言數(shù)字圖書館建設(shè)提供戰(zhàn)略參照體系,為多語言數(shù)字圖書館建設(shè)創(chuàng)造良好的信息環(huán)境。
(1)多語言文化數(shù)字圖書館,主要滿足我國參與國際文化交流、傳播優(yōu)秀傳統(tǒng)文化的戰(zhàn)略需要,如“亞洲數(shù)字圖書館”“絲路數(shù)字圖書館”等建設(shè)倡議就屬于這種類型。[11]多語言文化數(shù)字圖書館建設(shè)初期可以采用“擴(kuò)散式信息生態(tài)鏈”,將我國優(yōu)秀文化信息資源翻譯為多國語言文字版本,通過數(shù)字圖書館平臺進(jìn)行對外傳播。隨著建設(shè)推進(jìn),可以在相關(guān)國家文化機(jī)構(gòu)、語言文字工作機(jī)構(gòu)的共同參與下,按照“網(wǎng)絡(luò)式信息生態(tài)鏈”的目標(biāo)模式進(jìn)行建設(shè),最終建成多國語言文字文化資源交匯和交流的中樞平臺。
(2)多語言學(xué)術(shù)數(shù)字圖書館,主要滿足多語言學(xué)術(shù)著作、期刊等文獻(xiàn)信息資源的共享需求,主要承擔(dān)者有高校圖書館、文獻(xiàn)數(shù)據(jù)庫服務(wù)商等。[12]高等學(xué)校圖書館可以對其信息資源按照語種進(jìn)行細(xì)分,對于以英語作為記錄語言的數(shù)字信息資源適當(dāng)采用“并行式結(jié)構(gòu)信息生態(tài)鏈”,由用戶自行檢索和閱讀;對于英語之外的非通用語種數(shù)字信息資源提供跨語言檢索服務(wù),并盡可能提供漢語元數(shù)據(jù)或者摘要服務(wù),以便用戶判斷資源主題的相關(guān)性。
(3)多民族語言數(shù)字圖書館,主要滿足我國民族地區(qū)多語言環(huán)境下的文化交流需求,增進(jìn)各民族之間的溝通和理解。多民族語言數(shù)字圖書館建設(shè)的核心問題是處理好國家通用語言文字與少數(shù)民族語言文字之間的關(guān)系,多民族語言數(shù)字圖書館信息生態(tài)鏈在總體上可以采用“集成式結(jié)構(gòu)”,對少數(shù)民族語言信息資源進(jìn)行雙語著錄、雙語摘要甚至雙語翻譯,以國家通用語言文字為中介,將各少數(shù)民族語言信息資源聯(lián)結(jié)為統(tǒng)一的整體。[10]
多語言數(shù)字圖書館作為學(xué)術(shù)概念是統(tǒng)一的,是對眾多具有共同特征數(shù)字圖書館的統(tǒng)稱。然而,任何一個多語言數(shù)字圖書館的建設(shè)都面臨非常具體的應(yīng)用情境,需要結(jié)合實(shí)際分析其信息生態(tài)鏈的結(jié)構(gòu)類型,有針對性地選擇發(fā)展路徑。為此,需要對擬建設(shè)的多語言數(shù)字圖書館進(jìn)行全面系統(tǒng)的需求分析,根據(jù)所涉及語言文字的種類、語言文字服務(wù)人員的數(shù)量、跨語言信息支持技術(shù)的發(fā)展水平、多語言用戶的數(shù)量及需求結(jié)構(gòu)等信息綜合分析判斷,確定多語言數(shù)字圖書館的建設(shè)思路。例如,雙語著錄是我國少數(shù)民族語言信息管理的基本原則,對少數(shù)民族語言信息資源進(jìn)行雙語著錄時(shí),多語言數(shù)字圖書館信息生態(tài)鏈整體上呈現(xiàn)出“集成式結(jié)構(gòu)”特征。但是,這種情況并不是絕對的,如果某一民族地區(qū)雙語教育發(fā)展水平較高,當(dāng)?shù)亟^大多數(shù)居民可以同時(shí)使用兩種語言文字進(jìn)行溝通交流,則數(shù)字圖書館信息生態(tài)鏈可以采用“并行式結(jié)構(gòu)”,由用戶群體在兩種語言文字當(dāng)中選擇任何一種進(jìn)行信息檢索和閱讀。