• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      圖書館館藏特色文獻(xiàn)資源的數(shù)字化深加工模式探析

      2012-12-31 00:00:00韓春磊
      科技資訊 2012年25期


        摘 要:圖書館作為文獻(xiàn)資源收藏和服務(wù)機(jī)構(gòu),承擔(dān)著為社會(huì)提供各類文獻(xiàn)的主要職責(zé),而其館藏特色文獻(xiàn)是衡量一個(gè)圖書館的資源地位并為讀者提供特色服務(wù)能力的重要指標(biāo),是圖書館為文化建設(shè)服務(wù)的知識(shí)特色寶庫(kù)。在當(dāng)前互聯(lián)網(wǎng)和數(shù)字技術(shù)高速發(fā)展的大環(huán)境下,圖書館原有的“藏”為主將轉(zhuǎn)變?yōu)椤胺?wù)”的功能,因此有責(zé)任充分利用數(shù)字和網(wǎng)絡(luò)技術(shù),將傳統(tǒng)的特色館藏文獻(xiàn)紙質(zhì)資源通過(guò)數(shù)字化深加工的形式進(jìn)行充分展示。主要介紹了上海圖書館館藏特色文獻(xiàn)資源的定義和類型;探討了資源數(shù)字化深加工可以從深度標(biāo)引、檢索功能的多功能化以及知識(shí)單元鏈接的具體模式,為圖書館特色館藏文獻(xiàn)資源開(kāi)發(fā)提供了方法。
        關(guān)鍵詞:圖書館 特色文獻(xiàn)資源 數(shù)字化 深加工 模式
        中圖分類號(hào):G259文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1672-3791(2012)09(a)-0255-02
        圖書館作為文獻(xiàn)資源收藏和服務(wù)機(jī)構(gòu),承擔(dān)著為社會(huì)提供各類文獻(xiàn)的主要職責(zé),而其館藏特色文獻(xiàn)是衡量一個(gè)圖書館的資源地位并為讀者提供特色服務(wù)能力的重要指標(biāo),是圖書館為文化建設(shè)服務(wù)的知識(shí)特色寶庫(kù)。在當(dāng)前互聯(lián)網(wǎng)和數(shù)字技術(shù)高速發(fā)展的大環(huán)境下,圖書館原有的“藏”為主將轉(zhuǎn)變?yōu)椤胺?wù)”的功能,因此有責(zé)任充分利用數(shù)字和網(wǎng)絡(luò)技術(shù)的發(fā)展,將傳統(tǒng)的特色館藏文獻(xiàn)紙質(zhì)資源進(jìn)行數(shù)字化深加工。進(jìn)行數(shù)字化深加工不只是進(jìn)行文獻(xiàn)的掃描和保存,而是將文獻(xiàn)的本元以數(shù)字化深加工的形式進(jìn)行充分展示,從而為讀者進(jìn)行全方位的應(yīng)用和服務(wù),這是現(xiàn)代化圖書館的一個(gè)重要使命。
        圖書館重要文獻(xiàn)資源進(jìn)行數(shù)字化,可以使文獻(xiàn)得到更有效利用和保存;進(jìn)一步深加工,則可為讀者深入服務(wù)提供平臺(tái)和工具。本文就上海圖書館從事近代期刊、古籍等特色館藏資源數(shù)字化深加工過(guò)程認(rèn)為,目前特色文獻(xiàn)資源的數(shù)字化深加工有多種模式和類型,圖書館工作者要根據(jù)文獻(xiàn)的特性進(jìn)行分類,可以通過(guò)OCR識(shí)別、知識(shí)標(biāo)引、檢索系統(tǒng)的多功能化等手段來(lái)實(shí)現(xiàn)特色館藏資源的數(shù)字化深加工。
        1 館藏特色資源的定義
        圖書館館藏特色資源類型可定義為:具有一定的地域和歷史人文特色,或與地方的政治、經(jīng)濟(jì)和文化發(fā)展密切相關(guān)的資源。這些資源往往具有特定及一定規(guī)模的研究群體,文獻(xiàn)研究?jī)r(jià)值大,市場(chǎng)需求度較高。通常按文獻(xiàn)類型可分為:圖書、期刊、報(bào)紙等;按文獻(xiàn)種類可分為:書籍、論文、字畫、照片、講座、手稿、地圖、檔案、傳單、廣告、標(biāo)本、實(shí)驗(yàn)、觀測(cè)數(shù)據(jù)等。
        2 數(shù)字資源深加工模式類型
        數(shù)字資源深加工模式類型可根據(jù)不同文獻(xiàn)需求進(jìn)行不同類型的深加工。
        2.1 全文識(shí)別數(shù)字化(OCR)
        在圖書館館藏特色文獻(xiàn)中,報(bào)刊資源是一類相對(duì)比較有研究?jī)r(jià)值的文獻(xiàn)。(1)民國(guó)時(shí)期期刊由于該類文獻(xiàn)開(kāi)本不盡相同,紙張材質(zhì)和出版樣式不同,繁體字樣式繁多,因此在OCR過(guò)程中,要選擇一個(gè)支持繁體大字庫(kù)的識(shí)別軟件,在圖像掃描時(shí)為深度標(biāo)引作好各類標(biāo)識(shí)。在圖像的展示上要實(shí)現(xiàn)放大、縮小功能,同時(shí)亦可輸入百分比,控制放大縮小功能。同時(shí)要實(shí)現(xiàn)期刊全屏展示,全屏內(nèi)容為頁(yè)面內(nèi)容;(2)報(bào)紙應(yīng)根據(jù)出版期間不同版式、不同內(nèi)容的報(bào)紙進(jìn)行樣本抽取和研究。由于報(bào)紙量大,特色欄目較多,需要對(duì)新聞、廣告、等特色內(nèi)容進(jìn)行較深入研究,以確定是否在OCR過(guò)程中專門制定特色欄目?jī)?nèi)容的標(biāo)識(shí)。
        2.2 深度標(biāo)引
        特色館藏資源通常具有顯著的地域特色或者文獻(xiàn)價(jià)值,在標(biāo)引時(shí)要注意這些文獻(xiàn)的特性。目前圖書館在進(jìn)行深加工時(shí)往往只考慮到統(tǒng)一和跨庫(kù)檢索,而忽略了揭示文獻(xiàn)的本質(zhì),因此在數(shù)據(jù)庫(kù)的檢索服務(wù)系統(tǒng)的檢索字段設(shè)置較為簡(jiǎn)單6ea4e6f608d62d781dd3a89119c68457,檢索功能有待強(qiáng)化,要加強(qiáng)標(biāo)引深度。
        深度標(biāo)引可按學(xué)科或?qū)I(yè)進(jìn)行分類,從增加檢索字段來(lái)實(shí)現(xiàn)多種途徑檢索,以提高文獻(xiàn)的利用率。除了書名、作者、書號(hào)、類別、寫作年代、地點(diǎn)等外,還可以根f0cf136190cffc51894396c6fabbb19c據(jù)不同文獻(xiàn)的特點(diǎn)進(jìn)行深度標(biāo)引。例如:對(duì)文物價(jià)值較高的古籍文獻(xiàn)中的詩(shī)進(jìn)行深度標(biāo)引時(shí),可以根據(jù)它的特點(diǎn)設(shè)置詩(shī)體、韻、平仄、主題等;對(duì)詞進(jìn)行深度標(biāo)引時(shí),可以根據(jù)它的特點(diǎn)設(shè)置詞牌名、詞調(diào)結(jié)構(gòu)、長(zhǎng)短詞等;對(duì)期刊進(jìn)行深度標(biāo)引時(shí),可以根據(jù)期刊的研究領(lǐng)域設(shè)置學(xué)科、專業(yè)等;對(duì)報(bào)紙數(shù)據(jù)庫(kù),不但要展示報(bào)紙每篇文章的篇名、作者,還應(yīng)根據(jù)報(bào)紙的特點(diǎn)設(shè)置專欄、廣告、公告、新聞等。
        2.3 檢索系統(tǒng)多功能化
        2.3.1 檢索導(dǎo)航
        建立強(qiáng)大的以全文檢索為基礎(chǔ)構(gòu)造的智能化檢索系統(tǒng),將大大節(jié)省研究者在文獻(xiàn)檢索、輯佚方面的時(shí)間和精力,還將極大地啟發(fā)和擴(kuò)展其研究的廣度與深度。在加工過(guò)程中目前可以借助現(xiàn)有的檢索技術(shù),實(shí)現(xiàn)條件檢索、邏輯檢索、模糊檢索、組配檢索、屬性檢索等多種類型的檢索[1]。其中屬性檢索對(duì)于特色文獻(xiàn)使用者具有突出的價(jià)值和意義,可滿足其特定的需要,例如以寫作年代、地點(diǎn)、題材、體裁、事件等作為屬性,即可匯集撰寫于同一時(shí)間、地點(diǎn)的文獻(xiàn),采用同一題材、體裁及記載同一事件的文獻(xiàn)。此外,根據(jù)不同類型文獻(xiàn)的自身特點(diǎn),還可針對(duì)性地開(kāi)辟各種特殊的檢索項(xiàng)目。
        2.3.2 輔助檢索工具
        在數(shù)據(jù)庫(kù)中載入輔助性工具(字詞典、歷史年表、電子地圖等)已在部分古籍?dāng)?shù)據(jù)庫(kù)中得到實(shí)現(xiàn),例如在《四庫(kù)全書》電子版中,設(shè)有單字字義查詢、古今紀(jì)年換算、干支/公元年換算、八卦·六十四卦表等輔助工具,這樣的設(shè)計(jì)使得研究者不需要為了弄清某些知識(shí)點(diǎn)再查閱其他資料,就可以依靠該工具迅速進(jìn)行確認(rèn)。但是現(xiàn)有的輔助性工具還很有限,因此在今后的數(shù)字資源深加工過(guò)程中可以根據(jù)各類文獻(xiàn)的特殊情況,開(kāi)發(fā)更具專業(yè)性、系統(tǒng)性和針對(duì)性的工具,在附帶字詞典、歷史年表、電子地圖的基礎(chǔ)上,建立相應(yīng)的知識(shí)支撐系統(tǒng)或?qū)iT的輔助數(shù)據(jù)庫(kù)[2],例如有關(guān)歷代官制、兵制(或謂軍制)、科舉制及歷代政區(qū)等的知識(shí)系統(tǒng)。在設(shè)置期刊數(shù)據(jù)庫(kù)的輔助檢索工具時(shí),可以設(shè)置近義詞或同義詞查詢、刊名輔助導(dǎo)航、期刊聚類檢索等功能。
        通過(guò)這些知識(shí)系統(tǒng),正確反映各個(gè)時(shí)代的政治、軍事、文化、地理等方面的信息,為研究者提供具體的時(shí)空坐標(biāo)和背景資料,及時(shí)解決他們?cè)谖墨I(xiàn)閱讀過(guò)程中的問(wèn)題,甚至有可能幫助發(fā)掘出原本隱藏在文獻(xiàn)背后的關(guān)聯(lián)信息。
        2.4 知識(shí)單元鏈接
        數(shù)字化資源不只是紙張版本的簡(jiǎn)單翻版,而應(yīng)采取多種方式和技術(shù)手段,以原文本為中心進(jìn)行發(fā)散和延伸,為使用者提供基于超文本的立體閱讀環(huán)境。因此可采用知識(shí)單元鏈接的方法,該方法可分為同種文獻(xiàn)和跨文獻(xiàn)類型的知識(shí)鏈接。
        2.4.1 原文與相關(guān)知識(shí)點(diǎn)之間的鏈接
        在古籍文獻(xiàn)資源中的世傳經(jīng)典著述通常有古代著名學(xué)者、訓(xùn)詁專家為其注疏,注疏包括傳注、章句、義疏、集解、音義等各種不同類型[3],其中包含著豐富的內(nèi)容,不僅有對(duì)字詞句及篇章文義的注解,也有對(duì)名物制度、成語(yǔ)典故的詮釋,是后人閱讀和理解原文的重要紐帶,也是繼續(xù)研究的前提基礎(chǔ)。在原文與注疏之間進(jìn)行鏈接應(yīng)是拓展古籍閱讀內(nèi)容的有效和必要方式。
        除此之外,鏈接的內(nèi)容還可包括文獻(xiàn)本身相關(guān)內(nèi)容之間、相關(guān)文獻(xiàn)之間以及文獻(xiàn)與相關(guān)網(wǎng)站之間的鏈接等。例如:在期刊數(shù)據(jù)庫(kù)中,可以鏈接至期刊雜志社的網(wǎng)站、上海圖書館IPAC目錄中的館藏信息以及其他館的館藏信息等。而國(guó)家圖書館在所建特色資源庫(kù)—— 敦煌遺珍中嘗試鏈接了有關(guān)敦煌和絲綢之路、相關(guān)文獻(xiàn)收藏機(jī)構(gòu)以及文物保護(hù)的網(wǎng)站,以豐富讀者對(duì)數(shù)字化敦煌文獻(xiàn)的認(rèn)知,推進(jìn)敦煌學(xué)研究[4]。
        2.4.2 文獻(xiàn)不同版本之間的鏈接
        這種鏈接包括數(shù)字圖像版與文本版、不同文本版之間的對(duì)照和切換。數(shù)字圖像版可以展示版本類型、版刻特征、字體、墨色等信息,滿足版本研究、書史研究、文物鑒定等多種需要;不同文本版的切換則便于異文的對(duì)照和批校內(nèi)容的互補(bǔ)互證。
        2.5 檢索統(tǒng)計(jì)研究功能
        對(duì)文獻(xiàn)有關(guān)內(nèi)容及各類檢索結(jié)果進(jìn)行計(jì)量統(tǒng)計(jì),提供科學(xué)、準(zhǔn)確的統(tǒng)計(jì)數(shù)據(jù)和信息,是對(duì)數(shù)字化資源的內(nèi)容補(bǔ)充與增值。統(tǒng)計(jì)結(jié)果作為許多后續(xù)研究的基礎(chǔ)數(shù)據(jù),不僅可以改善研究者的研究條件,而且還會(huì)帶來(lái)研究思路、研究方法的變革。20世紀(jì)90年代中期,北京大學(xué)開(kāi)發(fā)的古詩(shī)研究系統(tǒng)即專門設(shè)置了統(tǒng)計(jì)功能,并以圖、表等直觀形式顯示。其中包括:詩(shī)作統(tǒng)計(jì)(按年代、地點(diǎn)、詩(shī)體、主題等分門別類地進(jìn)行統(tǒng)計(jì))[5]、漢字統(tǒng)計(jì)(各種字詞信息如字?jǐn)?shù)、字頻、詞頻的統(tǒng)計(jì))、總體統(tǒng)計(jì)(對(duì)于全宋詩(shī)整體的詩(shī)作和漢字統(tǒng)計(jì))。各類統(tǒng)計(jì)數(shù)據(jù)和信息如果具有一定規(guī)模,可進(jìn)一步為它們單獨(dú)建立統(tǒng)計(jì)知識(shí)庫(kù),為研究者展示了多個(gè)角度以供其分析問(wèn)題,例如從多種詞匯使用現(xiàn)象的統(tǒng)計(jì)中考察作者的創(chuàng)作風(fēng)格,從作品中人名、地名的統(tǒng)計(jì)中分析作者的交游與游歷情況,從某一時(shí)段詞匯的引用頻度變化中探討詞匯的時(shí)代分布和變遷[6]。
        應(yīng)在各個(gè)統(tǒng)計(jì)知識(shí)庫(kù)之間建立更密切的關(guān)聯(lián),以便于研究者將各種統(tǒng)計(jì)結(jié)果相互結(jié)合、參照、對(duì)比,獲得更大的思考和研究空間。例如,把作者一生的游歷地點(diǎn)與各時(shí)期撰著數(shù)量的統(tǒng)計(jì)相結(jié)合,與作品用詞用語(yǔ)變化的統(tǒng)計(jì)相結(jié)合,與整個(gè)時(shí)代同類文獻(xiàn)數(shù)量的統(tǒng)計(jì)、語(yǔ)言變化的統(tǒng)計(jì)相結(jié)合,就能對(duì)某一作者在整個(gè)時(shí)代中所處的位置、所受的影響、撰著的背景等有一立體的認(rèn)知。
        3 結(jié)語(yǔ)
        特色資源的數(shù)字化深加工建設(shè)是圖書館的重要工作之一,作為一個(gè)公益性服務(wù)機(jī)構(gòu),圖書館應(yīng)立足于廣大讀者,根據(jù)特色文獻(xiàn)的類型,選擇不同的深加工模式,同時(shí)要深入分析這些文獻(xiàn)的特性,設(shè)置最能反映文獻(xiàn)本質(zhì)的數(shù)字化檢索字段,才能順應(yīng)社會(huì)和時(shí)代發(fā)展的需要。
        參考文獻(xiàn)
        [1]魏艷玲.網(wǎng)絡(luò)環(huán)境與圖書館信息資源建設(shè)[J].延邊黨校學(xué)報(bào),2006(1).
        [2]李惠霞.論圖書館特色資源數(shù)字化建設(shè)[J].法律文獻(xiàn)信息與研究,2003(1).
        [3]關(guān)燕云.論圖書館在“共享共建”中的數(shù)字化建設(shè)[J].中共貴州省委黨校學(xué)報(bào), 2006(5).
        [4]邢秋霞.淺談高校圖書館特色數(shù)據(jù)庫(kù)的建設(shè)[J].科技情報(bào)開(kāi)發(fā)與經(jīng)濟(jì),2010(4).
        [5]詹曙萌.試論圖書館地方文獻(xiàn)資源的數(shù)字化建設(shè)[J].現(xiàn)代情報(bào),2007(2).
        [6]張紅揚(yáng).特色文獻(xiàn)數(shù)字化過(guò)程中資源的綜合利用與合作共享—— 以北大港大兩館聯(lián)合建設(shè)“北京歷史地理數(shù)據(jù)庫(kù)”項(xiàng)目為例[J].情報(bào)資料工作,2007(3

      林周县| 辛集市| 荔浦县| 手游| 朝阳县| 高州市| 岚皋县| 高平市| 亳州市| 闸北区| 蓬溪县| 靖边县| 静海县| 通渭县| 大邑县| 曲松县| 会泽县| 安远县| 泗水县| 江陵县| 肇庆市| 西丰县| 太谷县| 巨鹿县| 曲松县| 长宁区| 隆化县| 陇川县| 常德市| 泰州市| 龙南县| 项城市| 北票市| 通城县| 绥中县| 仙桃市| 鲁甸县| 东平县| 佛山市| 北宁市| 施秉县|