賈鳳旭
(鞍山師范學院圖書館,遼寧 鞍山 114005)
網(wǎng)絡技術的發(fā)展推動了文獻資源的數(shù)字化建設,由此,作為數(shù)字圖書館服務門戶的數(shù)字資源共享平臺系統(tǒng)的建設也成為必然。XML作為描述數(shù)據(jù)語言及其所具備的數(shù)據(jù)互操作等眾多優(yōu)點,以其作為基礎技術構建的數(shù)字圖書館資源共享平臺,成為數(shù)字資源和用戶密切聯(lián)系的紐帶,既方便讀者利用數(shù)字資源,又提高了數(shù)字圖書館的知識服務能力。
XML(eXtensibleMarkupLanguage)是 W3C工作組制定的可擴展置標語言。XML是定義語義標記的規(guī)則,通過標記將文檔分成多個部件并加以標識。XML和HTML雖然同是SGML應用子集,但XML可依據(jù)不同應用而自定義標簽,以開放的自我描述方法來定義數(shù)據(jù)結構,進而描述數(shù)據(jù)內(nèi)容和數(shù)據(jù)之間的關系。具體講,XML有以下幾方面特點。
XML采用嵌套文本標簽的方式來表示數(shù)據(jù),標簽的文本和結構均可以自由擴展,使用者可以按需創(chuàng)建并使用新的標記,其區(qū)別于一些二進制文件對字段結構長度的諸多限制,極容易擴展,因此,其技術在廣泛的開發(fā)平臺都有支持,幾乎所有的常用編程語言都支持XML,從而讓其成為理想的信息交換工具。
HTML雖是Web顯示數(shù)據(jù)的專用語言,但其顯示的網(wǎng)頁樣式信息與內(nèi)容信息混雜在一起。而XML采用文檔數(shù)據(jù)和顯示指令分離的機制,有利于對大量XML文檔的維護,有利于應用程序處理XML文檔,直接分析、處理數(shù)據(jù)內(nèi)容。而且多個XML文檔可共用一個樣式文件,便于管理。
XML文檔中的標簽在不違反其語法的前提下可以根據(jù)需要自由設定,但要注意考慮所用詞匯的合理性,以及標簽相互的嵌套層次邏輯性。
為了有利于XML傳播和共享信息,需協(xié)定共同遵守行業(yè)標準,使用規(guī)范的語匯。
XML的跨平臺特征,決定了它可以實現(xiàn)不同數(shù)據(jù)源之間的數(shù)據(jù)交換,提供一個公共交換平臺。XML格式數(shù)據(jù)不需任何轉換和其本身的簡明性,為數(shù)據(jù)交換的發(fā)展提供廣闊的前景。
XML文件結構可以分為實體結構和邏輯結構。實體結構是構成XML文件的實際資料;邏輯結構是XML元素排列圖,即元素的排列順序。XML文件的邏輯結構包括3部分:文件首,用來指定該文件的指令;主體部分,由一個或多個元素組成,形式為可以包含字符數(shù)據(jù)的層次結構樹;文件尾,包括注釋、處理命令及主體后面的空白。
XML文件的實體結構用下面實例作進一步說明:
XML文檔
----- ①
----- ②
< 圖書 A=”1”B=”2”C=”3”/> ----- ④
<選擇 =”A”/>
----- ⑤
其構成部分及解釋如下:
①XML聲明:XML版本號和文本編碼方式。
②處理指令:給XML應用程序閱讀的特殊標記。
③元素:;分別是兩對元素。
④屬性:與元素相關聯(lián)的部分,如“圖書”元素有3個“A”、“B”、“C”屬性,其屬性值分別為“1”、“2”、“3”。
⑤文本:兩個標簽之間的字符,如“這個選擇是正確的!”是“結論”這個元素的文本。
⑥空白:文本中出現(xiàn)的換行,半角空格或制表符。
XML是記述Web相關數(shù)據(jù)的最基本語言;XML既采用供閱讀的文件形式,又采用供程序使用的數(shù)據(jù)形態(tài),具有記述文件和數(shù)據(jù)的兩面性,使非表格形式的數(shù)據(jù)結構非常清晰地顯示出來,在關聯(lián)數(shù)據(jù)方面發(fā)揮出它獨特的優(yōu)勢。
第一,分布在不同地域的數(shù)據(jù),XML的遠程功能,借助HTTP協(xié)議,解決了這類數(shù)據(jù)的共享問題。
第二,結構和語言不同的數(shù)據(jù),XML的DOM和XQL工具,XML對半結構化數(shù)據(jù)的通用表示以及XML查詢語言,實現(xiàn)了對該類數(shù)據(jù)的互操作。
第三,不同系統(tǒng)間屬性表示和語義差異的數(shù)據(jù),XML通過源和目標大綱屬性來匹配描述性的元數(shù)據(jù),把這類數(shù)據(jù)轉換成同一性而實現(xiàn)互操作。
第四,不同規(guī)范的數(shù)據(jù),XML通過把這些數(shù)據(jù)根據(jù)需要重新組織成不同結構的數(shù)據(jù)表來實現(xiàn)操作。
第五,簽定數(shù)據(jù),XML清晰明確地描述屬性表示和語義方面的優(yōu)勢,可以避免數(shù)據(jù)使用端程序的識別錯誤。
基于XML在數(shù)據(jù)方面的優(yōu)勢,采用其建立接口數(shù)據(jù)標準,有利于數(shù)字資源平臺的開發(fā),實現(xiàn)不同平臺間的數(shù)據(jù)交換和協(xié)同工作,通過XML模式發(fā)布,可以自動實現(xiàn)對數(shù)據(jù)的驗證和約束,使數(shù)字資源數(shù)據(jù)由抽象的標準變成具體的操作。
數(shù)字圖書館的資源目標是構建一個邏輯上統(tǒng)一、物理上分散的資源共享體系,以資源元數(shù)據(jù)為核心基礎,統(tǒng)一管理分散的資源數(shù)據(jù),具體構想如圖1。
圖1
數(shù)字資源共享平臺主要從用戶需求出發(fā)來考慮構建,包括“數(shù)據(jù)信息檢索、發(fā)現(xiàn)和數(shù)據(jù)訪問”,用戶通過資源共享服務平臺網(wǎng)站檢索數(shù)據(jù)信息、發(fā)現(xiàn)并訪問使用,主要是通過各節(jié)點系統(tǒng)的元數(shù)據(jù)搜索引擎來實現(xiàn)檢索功能。具體實現(xiàn)步驟是:資源共享平臺傳遞的檢索請求信息通過數(shù)據(jù)描述層節(jié)點,
經(jīng)數(shù)據(jù)控制層的調(diào)用處理,通過XML查詢命令從各資源庫中生成檢索結果并回復給服務器,最后回應到客戶端瀏覽器。用戶確認后可根據(jù)共享資源元數(shù)據(jù)定位信息(URL)下載資源,實現(xiàn)對數(shù)據(jù)的訪問。管理員通過元數(shù)據(jù)管理系統(tǒng),實現(xiàn)對數(shù)字資源元數(shù)據(jù)的更新、添加、編輯、修改,并對資源數(shù)據(jù)庫進行維護。
表1
數(shù)字資源共享平臺系統(tǒng)是異構數(shù)字資源數(shù)據(jù)庫整合推介平臺,能便捷、系統(tǒng)地為用戶提供知識服務。主要設計了兩大功能模塊:①服務模塊:資源信息推介、信息檢索、信息下載。②管理維護模塊:數(shù)據(jù)資源整理和加工、數(shù)據(jù)存儲、數(shù)據(jù)資源安全、用戶管理及事務管理。數(shù)字資源共享平臺按層次理論分析如表1所示。
目前XML應用于互聯(lián)網(wǎng)上數(shù)據(jù)交互操作主要形式為“Web服務”,是指客戶端和服務器通過網(wǎng)絡利用XML信息進行溝通,是數(shù)據(jù)信息的“請求→處理→應答”過程。
圖2
Web服務的客戶端以XML形式并基于HTTP協(xié)議,用GET或POST方法在HTTP報文中發(fā)送請求到Web服務器,Web服務器解析XML請求報文并執(zhí)行相關操作,從數(shù)據(jù)庫查詢處理并返回XML應答報文給Web服務器,Web服務器將應答報文解析為相應的信息,并把結果顯示到客戶端電腦頁面,以便客戶端等待做下一步指令處理工作。
這樣基于XML技術的數(shù)據(jù)處理流程,后臺加載XML文檔避免了類似HTML網(wǎng)頁向服務器提交表單,用戶需等待表單處理完畢才能進行下一步操作的情況,提高了數(shù)據(jù)服務的效率。
隨著XML的普及應用和相關工具軟件的層出不窮,XML在各行各業(yè)的應用也愈加廣泛。在數(shù)字圖書館資源建設方面,用XML記述數(shù)字資源的內(nèi)容和元數(shù)據(jù),已成為現(xiàn)今的主流。數(shù)字圖書館的資源主要包括做為元數(shù)據(jù)的目錄和信息資源的全文數(shù)據(jù),用XML記述的全文數(shù)據(jù),可以通過程序對它們進行各種操作。XML對內(nèi)容記述與顯示分離的特性,方便將XML源數(shù)據(jù)進行不同形式的轉換,實現(xiàn)多角度的檢索,從而滿足不同讀者需求,因此,XML技術成為數(shù)字圖書館建設和服務的基礎。
集成XML眾多優(yōu)越性構建的數(shù)字圖書館資源共享平臺,以其方便、快捷、人性化的服務,把數(shù)字圖書館資源展現(xiàn)在用戶面前,以知識服務為基礎指針的資源管理、組織和服務體系,不斷推動數(shù)字圖書館作為信息、知識的社會核心地位的發(fā)展。
[1]石塚英弘,李穎.未來網(wǎng)絡的基磐技術——XML的理論與應用[M].北京:華藝出版社,2002.
[2] 李廣?。當?shù)字時代的圖書館網(wǎng)絡信息系統(tǒng)[M].北京:北京圖書館出版社,2006.
[3] 左偉明.即用即查XML數(shù)據(jù)標記語言參考手冊[M].北京:人民郵電出版社,2007.
[4] 雷燕.高校圖書館Web站點信息服務比較研究[J].大學圖書館學報,1999(2):28-30.