沈丘縣圖書館 王建軍
本文闡述了電子計算機在圖書館應(yīng)用發(fā)展的歷史,圖書館計算機文獻采購系統(tǒng),計算機文獻標引系統(tǒng),計算機文獻編目系統(tǒng),圖書館數(shù)據(jù)庫。
1946年,美國生產(chǎn)了首臺電子計算機,從而開始了人類科學技術(shù)的一個新階段。在這些研究中,最先實現(xiàn)了把文獻按照固定的詞庫編制索引的是美國的盧恩。在20世紀五六十年代,出現(xiàn)了定題批示處理和回溯檢索系統(tǒng)。這一時期,工業(yè)較發(fā)達國家的圖書館自動化系統(tǒng)紛紛出現(xiàn)。比較著名的有1964年美國國立醫(yī)學圖書館建立的醫(yī)學文獻分析與檢索系統(tǒng)MEDLARS。進入20世紀70年代,隨著第四代計算機的問世,情報檢索已由批式處理向聯(lián)機檢索發(fā)展,其最大特點是讀者直接同計算機會話,遇到錯誤立即修改,并可以反復(fù)進行提問檢索。這時如美國的NASA、DIALOC、ORBIT、歐洲航天局的BECON系統(tǒng)等,都在原有的基礎(chǔ)上形成了跨國跨洲的國際網(wǎng)絡(luò)。美國國會圖書館于1981年關(guān)閉了傳統(tǒng)目錄卡片的使用,機讀目錄占主導地位。在圖書館自動化發(fā)展的歷程中,它是一個重要的里程碑。
網(wǎng)絡(luò)化可以平衡和協(xié)調(diào)網(wǎng)內(nèi)的情報資源,以滿足在不同地理環(huán)境中的讀者對圖書情報的需求。網(wǎng)絡(luò)化是圖書情報自動化發(fā)展的趨勢。
圖書館計算機文獻采購系統(tǒng)運行的目的,是能在短時間內(nèi)給圖書館工作者采訪圖書提供各種必要的數(shù)據(jù),打印各種統(tǒng)計報表、處理訂單、經(jīng)費管理以及代替執(zhí)行某些手工作業(yè),從而提高文獻采購的效率。
根據(jù)對文獻采購流程的分析,計算機文獻采購系統(tǒng)必須具備以下幾個功能:
處理訂單。計算機對每一份訂單進行存貯和檢索,并根據(jù)格式打印。
組織訂購目錄。計算機編制出訂購圖書的書名目錄,著錄目錄或其它形式的目錄,提高給出版發(fā)行部門或供訂購過程中的中間結(jié)果使用。
更新訂購主文檔。一本書處理完后,可刪除該書在訂購主文檔中的預(yù)定記錄。新的記錄不斷增加,處理后所剩的記錄不斷減少。這就是訂購主文檔的更新過程。
處理資金賬目。
進行訂購過程中各種數(shù)據(jù)的統(tǒng)計分析。國別統(tǒng)計、文種統(tǒng)計、各類書的統(tǒng)計、財經(jīng)統(tǒng)計、預(yù)定統(tǒng)計、到書統(tǒng)計及差價計算日統(tǒng)計、日統(tǒng)計、年統(tǒng)計等。計算機不僅要統(tǒng)計,還要編制報表。
檢索。從書名、作者、出版機構(gòu)、ISBN號等項目對預(yù)定主文檔實行檢索。
打印新書通報。
計算機文獻采購系統(tǒng)主要由以下幾個部分組成:
(1)采購文獻的建庫程序。這部分的主要目的是將訂購記錄存入計算機,一般應(yīng)為一個獨立的文檔,數(shù)據(jù)供任何一道程序調(diào)用。
(2)倒排檔建立程序。這道程序供查重用,倒排檔的個數(shù)視需要而定,一般有書名倒排檔、作者倒排檔、ISBN倒排檔等。
(3)統(tǒng)計分析文檔建立程序。這道程序的功能是把采購系統(tǒng)中需要統(tǒng)計的數(shù)據(jù)從各個記錄中抽出來組織文檔,目的是為打印統(tǒng)計報表作準備。
(4)打印程序。統(tǒng)計、發(fā)票、財經(jīng)以及其它需要計算的數(shù)據(jù)、在確定處理方案時,一定要按現(xiàn)行的圖書館的會計制度和技術(shù)要求進行,否則不可能實用。所以采購系統(tǒng)的設(shè)計必須建立在對館藏、經(jīng)費、任務(wù)、財經(jīng)制度、出版動態(tài)、以及其它系統(tǒng)功能充分調(diào)查的基礎(chǔ)上,盡量使數(shù)據(jù)和程序共享。
大多數(shù)計算機文獻自動標引方案都是以詞頻來作為判別某個詞是否能作為標引詞的標準。因此,其實現(xiàn)方案按如下步驟進行:
對于一個大小為n的文獻集合,計算出每篇文獻中每個不同的出現(xiàn)次數(shù),即文獻之中詞K的出現(xiàn)頻率Fiko。
根據(jù)詞的頻率進行降序排列,找出一個適當?shù)母哳l閥值并除掉所有高于此值的詞。
找出一個適當?shù)牡皖l閥值并除掉所有低于此值的詞。
剩下的詞將作為代表文獻的標引詞。
實現(xiàn)自動標引有兩個基本要素:自動抽詞和詞加權(quán)。而詞權(quán)值計算方法的優(yōu)劣是決定自動標引質(zhì)量的重要因素。因此,在自動標引研究中,其研究的焦點是如何有效地計算詞的權(quán)值。這里面以C.Salton的矢量空間自動標引模型以及M.E.Maron的概率自動標引模型最為突出,下面分別簡述之。
(1)矢量空間自動標引模型
該模型以矢量代數(shù)為其理論基礎(chǔ),以數(shù)量積公式。
旅游小鎮(zhèn)建設(shè)開發(fā)要適度,生態(tài)環(huán)境保護是第一要務(wù),在保障生態(tài)環(huán)境的前提下漸進發(fā)展,如何平衡開發(fā)與保護,和諧發(fā)展,是武陵山鄉(xiāng)旅游小鎮(zhèn)建設(shè)的重要挑戰(zhàn)。
(2)概率自動標引模型
該模型主要通過相關(guān)數(shù)來計算權(quán)值。然后,根據(jù)古典概率計算相關(guān)數(shù),即計算條件概率。
該模型作為權(quán)值,它表示用戶所需的信息包含在文獻標引詞來形成提問式概率。
用計算機編制文獻目錄的工作,叫做計算機編目。保證并使計算機順利編目的設(shè)備、技術(shù)和流程,叫做計算機編目系統(tǒng)。計算機編目是對書目數(shù)據(jù)或字段集合處理的過程,也就是將文獻著錄項目記錄在計算機的可讀載體的過程。
計算機編目過程為:(1)收集書目數(shù)據(jù)。(2)編輯。即將表示各種著錄事項的編輯符號、字段指示符、子字段指示符和分隔符插入書目數(shù)據(jù)相應(yīng)的位置上。并補充某些必要內(nèi)容。(3)鍵盤輸入或穿孔卡片、磁盤輸入。(4)計算機處理。將磁帶、盤或紙帶上的代碼信息讀入計算機,通過機讀目錄程序處理,整理成機讀目錄的格式結(jié)構(gòu)。(5)存貯。由計算機輸出經(jīng)整理后的數(shù)據(jù)作為校樣,與原始輸入書目數(shù)據(jù)校對,如發(fā)現(xiàn)有錯,則將更正的數(shù)據(jù)再輸入,反復(fù)輸出校對,直至無誤,最后將正確記錄輸入機讀目錄數(shù)據(jù)庫中,以形成可再使用的機讀目錄。(6)用計算機打印出目錄卡片或其它形式的目錄。
機讀目錄也叫機器能讀的目錄或機器可讀的目錄,是目錄載體發(fā)展中出現(xiàn)的一種新型目錄。機讀目錄就是以代碼形式和特定結(jié)構(gòu)記錄在計算機存貯載體上的,能夠被計算機識別和編輯輸出書目信息的目錄形式。機讀目錄是計算機編目后的輸出產(chǎn)品。
機讀目錄產(chǎn)生于美國國會圖書館,進入20世紀70年代后,MARC格式北接受為國際標準。
MARC系統(tǒng)是創(chuàng)制機讀目錄的一系列技術(shù)和操作方法的整體,包括硬件和軟件兩個方面。MARC系統(tǒng)大致分為四個子系統(tǒng):MARC存貯子系統(tǒng),MARC檢索子系統(tǒng),MARC輸入子系統(tǒng),MARC輸出子系統(tǒng)。
機讀目錄在圖書館工作中的作用有以下幾個方面:(1)行政管理。主要指對圖書館預(yù)算規(guī)劃工作進行幫助并提供所需要的各種數(shù)據(jù)。(2)采訪應(yīng)用。機讀目錄是采訪工作的書目情報源。將機讀目錄并入自動采訪系統(tǒng)時,它的目錄數(shù)據(jù)可用來進行采訪檢索、制備各種訂單、制備印刷的或穿孔的收據(jù)卡和處理控制卡、編印采訪目錄、編制財產(chǎn)帳以及編制各種采訪統(tǒng)計報表。(3)編目應(yīng)用。機讀目錄可以用來生產(chǎn)幾乎所有由編目形成的印刷品:目錄卡片、圖書目錄、工作單、檢索單、書標、書袋和書卡。(4)流通應(yīng)用。用于制備流通卡,用主記錄檔編制流通文獻目錄和制備各種催書單。(5)參考工作和書目工作應(yīng)用。機讀目錄實際上是一個完整的近期出版物數(shù)據(jù)庫,它可以進行各種綜合性和專題性處理。
數(shù)據(jù)庫是實現(xiàn)有組織地、動態(tài)地存儲大量關(guān)聯(lián)數(shù)據(jù),方便讀者訪問的計算機軟、硬資源組成的系統(tǒng),其主要特點是數(shù)據(jù)充分共享、交叉訪問、與應(yīng)用高度獨立。
對圖書館而言,數(shù)據(jù)庫是一種經(jīng)過編輯組織以機讀形式出現(xiàn)的書目記錄集合,其信息存儲在一定載體上,以供計算機檢索處理的工具。數(shù)據(jù)庫的建立和使用,是圖書館自動化的關(guān)健。
隨著數(shù)據(jù)庫的發(fā)展,產(chǎn)生了數(shù)據(jù)庫技術(shù),稱為“數(shù)據(jù)庫管理系統(tǒng)”,它是操作和控制數(shù)據(jù)庫的一種工具,并能提供多個應(yīng)用程序,或用一種軟件統(tǒng)一管理數(shù)據(jù),進行數(shù)據(jù)維護、更新和檢索等。
數(shù)據(jù)庫目前大致分為文獻、事實、數(shù)值數(shù)據(jù)庫三種類型。
文獻數(shù)據(jù)庫是為了滿足讀者關(guān)于某一主題、某一課題、某一著者、某一機構(gòu)的有關(guān)文獻以及查出某一論文的出處或收藏處所的需求,以順便完成他們的研究工作。
事實數(shù)據(jù)庫則用于滿足有關(guān)某一事實及其發(fā)生的時間、地點和過程的查詢。
數(shù)值數(shù)據(jù)庫用于滿足查詢某種數(shù)據(jù)、參數(shù)、公式、圖表或化學分子式等。這個數(shù)據(jù)庫裝的是直接使用的情報。這些數(shù)據(jù)事先由圖書館員從原始文獻中經(jīng)過仔細選擇、整理、分析、運算后得出,然后進行科學地存貯,形成“數(shù)據(jù)庫”。