摘 要:數(shù)字圖書館知識(shí)組織策略是傳統(tǒng)圖書館數(shù)字化轉(zhuǎn)型從而提供知識(shí)服務(wù)的重要舉措。明確數(shù)字圖書館與傳統(tǒng)圖書館知識(shí)組織的異同,有助于更好地進(jìn)行數(shù)字圖書館的知識(shí)組織。闡述數(shù)字圖書館知識(shí)組織所應(yīng)采取的策略。
關(guān)鍵詞:數(shù)字圖書館;知識(shí)組織策略;元數(shù)據(jù)
中圖分類號(hào):G250 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1673-291X(2013)21-0233-02
一、采用分類主題一體化的知識(shí)組織模式
隨著信息技術(shù)特別是檢索技術(shù)的發(fā)展,我們應(yīng)該利用分類主題一體化方式來(lái)進(jìn)行數(shù)字圖書館的知識(shí)組織。這是因?yàn)榉诸愔黝}一體化實(shí)現(xiàn)了分類語(yǔ)言與主題語(yǔ)言的結(jié)構(gòu)整合和性能互補(bǔ),其優(yōu)點(diǎn)是:(1)標(biāo)引人員可以用它同時(shí)完成分類標(biāo)引與主題標(biāo)引,兩種數(shù)據(jù)可以互相轉(zhuǎn)換,節(jié)省了人力、物力和時(shí)間;(2)用戶可以在一個(gè)檢索系統(tǒng)中進(jìn)行主題字順檢索和分類檢索,既方便了用戶,又提高了檢索效率;(3)在先編分面分類表,再編字順敘詞表的情況下,可以保證編表選詞的全面性和均衡性,有助詞間關(guān)系顯示的完整性和準(zhǔn)確性;(4)依據(jù)人工擬定的分類表或分類表數(shù)據(jù),可以由計(jì)算機(jī)自動(dòng)生成字順敘詞表,提高編表的速度與質(zhì)量;(5)有助于建立一個(gè)統(tǒng)一機(jī)構(gòu)來(lái)負(fù)責(zé)一體化語(yǔ)言的編制與管理;而且因?yàn)槟壳耙延幸恍C(jī)構(gòu)(包括數(shù)字圖書館)開(kāi)始利用基于分類主題一體化知識(shí)組織模式的雛形——搜索引擎來(lái)組織網(wǎng)絡(luò)信息。
目前數(shù)字圖書館實(shí)際可行的知識(shí)組織模式是用分類主題一體化的方式對(duì)知識(shí)進(jìn)行組織。它應(yīng)該包括三個(gè)部分:(1)一個(gè)結(jié)構(gòu)簡(jiǎn)明的知識(shí)分類體系,通過(guò)該知識(shí)分類系統(tǒng),實(shí)現(xiàn)對(duì)信息知識(shí)領(lǐng)域的宏觀控制;(2)一個(gè)智能化的控制詞表,實(shí)現(xiàn)對(duì)作者語(yǔ)言與用戶語(yǔ)言的控制和轉(zhuǎn)換;(3)建立分類體系與控制詞表的系統(tǒng)聯(lián)系,即可將標(biāo)引語(yǔ)言進(jìn)而也將作者語(yǔ)言和用戶語(yǔ)言納入分類體系,來(lái)實(shí)現(xiàn)自然語(yǔ)言檢索。
二、利用元數(shù)據(jù)來(lái)組織數(shù)字圖書館知識(shí)
(一)知識(shí)發(fā)現(xiàn)
互聯(lián)網(wǎng)搜索計(jì)劃(TheIntemetScoutProject)中的艾薩克項(xiàng)目(Projectlsaac)主要負(fù)責(zé)分布式元數(shù)據(jù)館藏的建立、維護(hù)、索引與檢索,已經(jīng)取得了一些進(jìn)展。它利用國(guó)際標(biāo)準(zhǔn)化協(xié)議,如輕權(quán)目錄訪問(wèn)協(xié)議(LDAP)和公共索引協(xié)議(CIP)來(lái)把地區(qū)性分布式元數(shù)據(jù)館藏連接成一個(gè)虛擬的元數(shù)據(jù)館藏。通過(guò)這個(gè)虛擬的元數(shù)據(jù)館藏,用戶可以查詢?cè)诓煌攸c(diǎn)的多個(gè)館藏信息,并得到單一的“選中列表”或結(jié)果集。這時(shí)用戶就可仔細(xì)觀察元數(shù)據(jù)記錄,或者訪問(wèn)實(shí)際網(wǎng)絡(luò)資源。
主題服務(wù)中的資源組織與發(fā)現(xiàn)項(xiàng)目(ROADS)作為英國(guó)電子圖書館計(jì)劃的基礎(chǔ)項(xiàng)目,能夠?yàn)槟承╊I(lǐng)域(如醫(yī)學(xué)、化學(xué))專家提供一種人工獲得高質(zhì)量信息數(shù)據(jù)庫(kù)的知識(shí)發(fā)現(xiàn)機(jī)制。每個(gè)ROADS數(shù)據(jù)庫(kù)由一系列元數(shù)據(jù)模塊組成,每個(gè)模塊代表不同的信息資源。國(guó)際互聯(lián)網(wǎng)匿名文件傳輸協(xié)議存檔模塊(1AFATemplate)被用來(lái)作為所有ROADS數(shù)據(jù)庫(kù)的元數(shù)據(jù)標(biāo)準(zhǔn),所有ROADS數(shù)據(jù)庫(kù)通過(guò)它實(shí)現(xiàn)相互兼容。ROADS還可由最高網(wǎng)關(guān)無(wú)縫訪問(wèn)所有子網(wǎng)關(guān),從而提供全面、準(zhǔn)確、高質(zhì)量的信息與知識(shí)。
(二)知識(shí)保存
如今我們面臨著數(shù)字信息與知識(shí)的長(zhǎng)期保存問(wèn)題,而數(shù)字信息與知識(shí)的長(zhǎng)期保存都與元數(shù)據(jù)的創(chuàng)建和維護(hù)有關(guān)。數(shù)字檔案館中的大學(xué)研究圖書館合作模型研究項(xiàng)目為開(kāi)放式存檔信息系統(tǒng)(OAIS)建立了一個(gè)參考模型,并被視為國(guó)際標(biāo)準(zhǔn)草案。OAIS參考模型運(yùn)用信息對(duì)象類目分類法標(biāo)識(shí)和區(qū)分了用來(lái)支持?jǐn)?shù)字信息與知識(shí)保存的不同種元數(shù)據(jù),并把每種信息與知識(shí)和它的元數(shù)據(jù)作為一個(gè)“信息包”(1nformationPackage)捆在一起。一個(gè)信息包由“內(nèi)容信息”(Contentlnformation)和“保存描述信息”(PreservationDescriptionlnformation)兩部分組成。內(nèi)容信息聚集了各種保存數(shù)字資源或數(shù)據(jù)對(duì)象,保存描述信息則聚集了各種描述元數(shù)據(jù)。
為利用元數(shù)據(jù)來(lái)長(zhǎng)期保存數(shù)字信息與知識(shí),網(wǎng)絡(luò)化歐洲存貯圖書館(NEDLIB)定義了一種電子出版物存貯系統(tǒng)(DSEP)。它由攝人、存檔、保存、數(shù)據(jù)管理、訪問(wèn)和系統(tǒng)管理六大模塊組成,各模塊分別利用不同種元數(shù)據(jù)來(lái)共同完成對(duì)數(shù)字信息與知識(shí)的長(zhǎng)期保存。攝人模塊接收提交信息包(SubmissionlnformationPackage,SIP),SIP用來(lái)收集圖書館或其他部門遞交的出版物信息。通過(guò)核實(shí)出版物和建立元數(shù)據(jù)后,SIP就轉(zhuǎn)變成存檔信息包(Archi-vallnformationPackage,AIP)進(jìn)入存檔模塊,而元數(shù)據(jù)被送到數(shù)據(jù)管理模塊;存檔模塊存貯AIP和比特流,并按要求把AIP傳送到訪問(wèn)模塊;保存模塊負(fù)責(zé)保存策略——遷移和仿真的執(zhí)行,并把產(chǎn)生的保存型元數(shù)據(jù)反饋給數(shù)據(jù)管理模塊;數(shù)據(jù)管理模塊為系統(tǒng)管理模塊存貯了監(jiān)控存貯系統(tǒng)的元數(shù)據(jù);訪問(wèn)模塊通過(guò)傳播信息包實(shí)現(xiàn)對(duì)電子出版物及其相關(guān)元數(shù)據(jù)的利用;系統(tǒng)管理模塊監(jiān)控DSEP系統(tǒng)的存檔程序。
三、采用專家系統(tǒng)來(lái)組織數(shù)字圖書館知識(shí)
專家系統(tǒng)是一種智能計(jì)算機(jī)程序,它用一定的知識(shí)和推理進(jìn)程去解釋通常需要人的知識(shí)和經(jīng)驗(yàn)才能解決的復(fù)雜問(wèn)題。專家系統(tǒng)由知識(shí)庫(kù)、推理機(jī)制、知識(shí)獲取和用戶界面組成。
(一)知識(shí)表示
知識(shí)表示就是關(guān)于如何描述事物所作的一組約定,是知識(shí)的符號(hào)化過(guò)程。從專家系統(tǒng)用戶的角度來(lái)看,只有具有可理解性、可訪問(wèn)性和解釋性的知識(shí)表示才是合理的。一般說(shuō)來(lái),知識(shí)表示方法可分為兩類:說(shuō)明式方法和過(guò)程型方法。
1.邏輯表示,即使用常數(shù)、變量、函數(shù)、謂詞、邏輯聯(lián)結(jié)詞和量詞等概念,把事實(shí)表示成某種邏輯中的邏輯公式,知識(shí)庫(kù)看成是邏輯公司的集合。
2.語(yǔ)義網(wǎng)絡(luò),即是一個(gè)由表示實(shí)體、概念、情況等的結(jié)點(diǎn)和表示結(jié)點(diǎn)間關(guān)系的弧或鏈組成。用語(yǔ)義網(wǎng)絡(luò)表示知識(shí),可對(duì)領(lǐng)域問(wèn)題進(jìn)行明顯的、結(jié)構(gòu)的語(yǔ)義學(xué)描述,尤其是表示分類層次結(jié)構(gòu)。
3.框架,是關(guān)于一個(gè)事物的詳細(xì)的知識(shí)和經(jīng)驗(yàn)的匯總,它由一組槽組成,每個(gè)槽描述事物的一個(gè)方面。
4.產(chǎn)生式規(guī)則,是一種前因后果式表達(dá)模型,由兩個(gè)部分構(gòu)成,前一部分稱之為條件,如狀態(tài)、前提、原因等;后一部分稱為結(jié)果,如活動(dòng)、結(jié)論、后果等。
(二)知識(shí)獲取
知識(shí)獲取是把用于解答專門領(lǐng)域的問(wèn)題的知識(shí)從擁有這種知識(shí)的知識(shí)源取出并轉(zhuǎn)換為一特定計(jì)算機(jī)表示,或從經(jīng)驗(yàn)中抽取知識(shí)并將其轉(zhuǎn)換為一特定的計(jì)算機(jī)表示。在數(shù)字圖書館知識(shí)組織中,知識(shí)獲取的主要步驟依次是:
1.問(wèn)題識(shí)別。這一階段的主要任務(wù)是明確專家系統(tǒng)在數(shù)字圖書館知識(shí)組織中的作用,概括地了解完成相應(yīng)任務(wù)所需要的各種知識(shí),可以通過(guò)對(duì)話方式、口述備忘錄、觀察專家工作過(guò)程及其他合適的輔助工具系統(tǒng)。在這里有三方面的工作:其一是要把數(shù)字圖書館知識(shí)組織問(wèn)題通過(guò)輸入輸出進(jìn)行確定化;其二是確定人工智能的必要性;其三是對(duì)所用的知識(shí)源進(jìn)行判別,以選擇最為合適的知識(shí)。
2.概念化。這一階段要盡可能仔細(xì)地分析專家系統(tǒng)所要解決知識(shí)組織問(wèn)題的性質(zhì),以建立一個(gè)適宜的問(wèn)題求解過(guò)程模型。即把數(shù)字圖書館知識(shí)組織專家解決問(wèn)題的過(guò)程和推理過(guò)程明確起來(lái),把概念與重要概念的關(guān)系明確起來(lái),并為有關(guān)專家模型、用戶模型提供有關(guān)概念,加速抽取目標(biāo)知識(shí)的過(guò)程。
3.形式化。這個(gè)階段是把由概念化階段中所明確的概念、重要概念、部分問(wèn)題等用專家系統(tǒng)構(gòu)筑工具的框架形式表示出來(lái),根據(jù)模型的情況選擇合適的人工智能方式,對(duì)框架內(nèi)的知識(shí)進(jìn)行結(jié)構(gòu)化。形式化過(guò)程需要考慮假設(shè)空間、過(guò)程模型、數(shù)據(jù)的特征等三個(gè)問(wèn)題。為明確假設(shè)空間,必須將概念形式化,再將這些概念連接起來(lái)。
4.實(shí)現(xiàn)。這階段是將形式化的知識(shí)映射到為此問(wèn)題選定的工具表示框架中,即把形式化的知識(shí)通過(guò)知識(shí)表示框架變換為計(jì)算機(jī)上推理實(shí)現(xiàn)的某種形式。
5.測(cè)試。在已構(gòu)成了原型知識(shí)庫(kù)的基礎(chǔ)上,必須對(duì)知識(shí)庫(kù)進(jìn)行修改、再構(gòu)造,其中包括重新設(shè)計(jì)形式化概念、表示方法或?qū)崿F(xiàn)系統(tǒng)的精練。它有兩種方式,一種是靜態(tài)測(cè)試,主要檢驗(yàn)知識(shí)庫(kù)構(gòu)造的整體性;一種是動(dòng)態(tài)測(cè)試,主要檢驗(yàn)知識(shí)庫(kù)的一致性。
參考文獻(xiàn):
[1] 吳彤.高校圖書館學(xué)科知識(shí)服務(wù)的策略[J].圖書館學(xué)刊,2011,(2) .
[2] 南曉倩.基于知識(shí)管理的圖書館知識(shí)服務(wù)策略[J].科技信息,2011,(16).
[3] 胥偉嵐,龍朝陽(yáng).基于知識(shí)供應(yīng)鏈的圖書館知識(shí)服務(wù)策略研究[J].情報(bào)資料工作,2011,(5).
[4] 馬瑞敏,倪超群.作者耦合分析:一種新學(xué)科知識(shí)結(jié)構(gòu)發(fā)現(xiàn)方法的探索性研究[J].中國(guó)圖書館學(xué)報(bào),2012,(2).
[5] 王振興.基于知識(shí)管理的圖書館知識(shí)服務(wù)策略[J].科技創(chuàng)新導(dǎo)報(bào),2012,(13).
[6] 曹劍波.知識(shí)是標(biāo)識(shí)的、對(duì)比的,還是語(yǔ)境的?——知識(shí)結(jié)構(gòu)的理論與懷疑主義難題的解答[J].哲學(xué)動(dòng)態(tài),2009,(3).
[7] 郝群,成俊穎.論信息共享空間的資源組織策略[J].中國(guó)圖書館學(xué)報(bào),2009,(4).