孫 遜
摘要:文章首先對(duì)檔案專題數(shù)據(jù)庫(kù)的內(nèi)涵作一界定,然后分析檔案數(shù)據(jù)庫(kù)的特點(diǎn),重點(diǎn)提出有關(guān)檔案專題數(shù)據(jù)庫(kù)建設(shè)的宏觀政策、開(kāi)發(fā)程序及安全問(wèn)題等方面的幾點(diǎn)思考,以期能夠更好地服務(wù)于檔案專題數(shù)據(jù)庫(kù)建設(shè)的良好前景。
關(guān)鍵詞:檔案專題數(shù)據(jù)庫(kù)信息化政策問(wèn)題開(kāi)發(fā)程序需求分析
欄案專題數(shù)據(jù)庫(kù)建設(shè)是信息化時(shí)代下檔案信息資源開(kāi)發(fā)與利用的一項(xiàng)創(chuàng)新手段與重要途徑,也是檔案數(shù)字化建設(shè)的目標(biāo)和任務(wù)之一。研究信息化時(shí)代下的檔案專題數(shù)據(jù)庫(kù)建設(shè),對(duì)其內(nèi)涵與特點(diǎn)加以歸納,有針對(duì)性地對(duì)其建設(shè)現(xiàn)狀及問(wèn)題作以思考,有利于實(shí)現(xiàn)檔案信息資源社會(huì)共享的目標(biāo)。
1檔案專題數(shù)據(jù)庫(kù)的內(nèi)涵界定
關(guān)于檔案數(shù)據(jù)庫(kù)的概念,早在1987年孫淑揚(yáng)就指出:“檔案數(shù)據(jù)庫(kù)屬于文獻(xiàn)數(shù)據(jù)庫(kù),是檔案自動(dòng)化的重要內(nèi)容,它是經(jīng)過(guò)整理組織以機(jī)讀形式出現(xiàn)的檔案信息集合?!倍鴻n案專題數(shù)據(jù)庫(kù)作為檔案數(shù)據(jù)庫(kù)的一個(gè)重要形式,它是以各類檔案基礎(chǔ)數(shù)據(jù)庫(kù)為主要數(shù)據(jù)來(lái)源,通過(guò)檔案信息管理系統(tǒng),按照某一專門題材內(nèi)容編制而成的各類檔案數(shù)據(jù)集合。檔案專題數(shù)據(jù)庫(kù)是跨全宗、多類別的檔案數(shù)據(jù)鏈接組合,是系統(tǒng)性的檔案數(shù)字化綜合開(kāi)發(fā)成果,在提供利用方面具有較強(qiáng)的針對(duì)性、實(shí)用性。作為互聯(lián)互通、共建共享的檔案資源網(wǎng)絡(luò)與服務(wù)平臺(tái),建立檔案專題數(shù)據(jù)庫(kù)可以確保檔案的完整收集、長(zhǎng)期保存與充分開(kāi)發(fā)。
檔案專題數(shù)據(jù)庫(kù)的分類方法有多種。從開(kāi)發(fā)層次上,檔案專題數(shù)據(jù)庫(kù)包括專題目錄數(shù)據(jù)庫(kù)和全文數(shù)據(jù)庫(kù)兩種類型:就目前的技術(shù)手段而言,檔案專題數(shù)據(jù)庫(kù)可以分為四種類型:一是文獻(xiàn)數(shù)據(jù)庫(kù),二是多媒體數(shù)據(jù)庫(kù),三是數(shù)值型數(shù)據(jù)庫(kù),四是事實(shí)型數(shù)據(jù)庫(kù)。這四種類型的數(shù)據(jù)庫(kù)都是基于檔案內(nèi)容信息,通過(guò)對(duì)檔案信息內(nèi)容的分析、過(guò)濾、加工、編排而產(chǎn)生的。
2檔案專題數(shù)據(jù)庫(kù)的特點(diǎn)分析
與傳統(tǒng)館藏?cái)?shù)據(jù)庫(kù)相比,檔案專題數(shù)據(jù)庫(kù)主要涉及的是檔案信息資源開(kāi)發(fā)方面,具有多元性、系統(tǒng)性、針對(duì)性等特點(diǎn)。兩者在數(shù)據(jù)信息、產(chǎn)生過(guò)程、目的作用及使用范圍等方面均存在著差異。
①多元性。檔案專題數(shù)據(jù)庫(kù)是跨全宗、多類別的檔案數(shù)據(jù)鏈接組合。它包括目錄數(shù)據(jù)、圖像數(shù)據(jù)、視音頻數(shù)據(jù)等不同數(shù)據(jù)形式,有著豐富多彩的數(shù)字復(fù)合視聽(tīng)效果。檔案專題數(shù)據(jù)庫(kù)能夠更為全面、直觀地向利用者揭示編纂主題相關(guān)的內(nèi)容,打破了傳統(tǒng)紙質(zhì)編纂成果只有文字和圖片的限制。同時(shí),在來(lái)源上,檔案專題數(shù)據(jù)庫(kù)不僅局限于館(室)藏檔案,還可以補(bǔ)充采集、鏈接相關(guān)的數(shù)字化材料。
②系統(tǒng)性。傳統(tǒng)檔案管理中,根據(jù)檔案的專題屬性,按照用戶的需求來(lái)編制檔案目錄或報(bào)道性檢索工具,其目的在于系統(tǒng)地揭示館(室)藏的某一專門題材檔案的內(nèi)容。但檔案專題數(shù)據(jù)庫(kù)不僅是數(shù)據(jù)庫(kù)形式的檢索工具,而且是檔案目錄和內(nèi)容數(shù)據(jù)——對(duì)應(yīng)鏈接、反映某一專題內(nèi)容的檔案數(shù)據(jù)集合。無(wú)論是形式上還是內(nèi)容上,檔案專題數(shù)據(jù)庫(kù)都具有相對(duì)系統(tǒng)性,能夠比較完整地揭示和反映某一專題檔案的內(nèi)容。
③針對(duì)性。與檔案館藏?cái)?shù)據(jù)庫(kù)相比,檔案專題數(shù)據(jù)庫(kù)注重將館藏中與專題相關(guān)的檔案信息提取并揭示出來(lái),為了說(shuō)明問(wèn)題,通常需要對(duì)檔案館藏?cái)?shù)據(jù)庫(kù)中的相關(guān)數(shù)據(jù)信息進(jìn)行整合,更為強(qiáng)調(diào)的是“精”和“準(zhǔn)”。這樣有針對(duì)性的開(kāi)發(fā)不但有利于揭示紛繁復(fù)雜的館(室)藏內(nèi)容,也有利于利用者系統(tǒng)、完整地了解和利用某方面的檔案信息,對(duì)于有效地開(kāi)發(fā)利用檔案信息資源也具有重要的意義。
3關(guān)于檔案專題數(shù)據(jù)庫(kù)建設(shè)的幾點(diǎn)思考
3.1加強(qiáng)建立檔案專題數(shù)據(jù)庫(kù)的宏觀政策。檔案專題數(shù)據(jù)庫(kù)建設(shè)是新時(shí)期檔案事業(yè)實(shí)現(xiàn)跨越式創(chuàng)新發(fā)展的關(guān)鍵所在。國(guó)家檔案局站在戰(zhàn)略的高度,認(rèn)真規(guī)劃?rùn)n案專題數(shù)據(jù)庫(kù)建設(shè)是很有必要的舉措。通過(guò)統(tǒng)一規(guī)劃、統(tǒng)一組織,統(tǒng)一領(lǐng)導(dǎo)全國(guó)檔案專題數(shù)據(jù)庫(kù)建設(shè),將其納入檔案數(shù)據(jù)庫(kù)建設(shè)范疇,制訂出更多完善的檔案專題數(shù)據(jù)庫(kù)建設(shè)綱要及細(xì)則,以指導(dǎo)全國(guó)檔案專題數(shù)據(jù)庫(kù)的開(kāi)發(fā)與建設(shè)。
目前,檔案專題數(shù)據(jù)庫(kù)主要集中在沿海發(fā)達(dá)地區(qū)且發(fā)展較快,如福建、浙江等地,內(nèi)地多數(shù)尚未建成檔案專題數(shù)據(jù)資源庫(kù)。可以說(shuō),檔案專題數(shù)據(jù)庫(kù)建設(shè)存在著區(qū)域發(fā)展不平衡的現(xiàn)象。國(guó)家及地方應(yīng)積極推進(jìn)檔案專題數(shù)據(jù)庫(kù)建設(shè),將其納入到檔案信息化建設(shè)規(guī)劃當(dāng)中,全面統(tǒng)籌,規(guī)范標(biāo)準(zhǔn)建設(shè),在已取得試點(diǎn)突破的基礎(chǔ)上,總結(jié)可行性及發(fā)展規(guī)律,為早日建成國(guó)家檔案信息資源專題數(shù)據(jù)庫(kù)創(chuàng)造良好的條件與堅(jiān)厚的基礎(chǔ)。
檔案專題數(shù)據(jù)庫(kù)建設(shè)是信息化時(shí)代檔案信息資源開(kāi)發(fā)利用的新途徑,通過(guò)對(duì)檔案專題數(shù)據(jù)庫(kù)進(jìn)行開(kāi)發(fā),從人們最關(guān)心、最直接的問(wèn)題出發(fā),有效整合相關(guān)的檔案數(shù)據(jù)庫(kù)資源,特別是在民生檔案建設(shè)的熱潮時(shí)期,加強(qiáng)對(duì)民生方面的檔案專題的關(guān)注,將會(huì)很大程度上有利于以后檔案事業(yè)的長(zhǎng)效可持續(xù)發(fā)展。如福建省檔案局建設(shè)的知青檔案專題數(shù)據(jù)庫(kù),其規(guī)模及效應(yīng)在全國(guó)范圍內(nèi)仍不多見(jiàn)。
3.2注重開(kāi)發(fā)檔案專題數(shù)據(jù)庫(kù)的科學(xué)程序。檔案專題數(shù)據(jù)庫(kù)開(kāi)發(fā)程序的科學(xué)與否,直接關(guān)系到檔案信息資源開(kāi)發(fā)利用成果質(zhì)量的高低,建立良好的檔案專題數(shù)據(jù)庫(kù)開(kāi)發(fā)程序,將有助于檔案信息資源的獲取,最終實(shí)現(xiàn)檔案信息資源的社會(huì)共享。
一般而言,檔案專題數(shù)據(jù)庫(kù)開(kāi)發(fā)需要經(jīng)過(guò)分析主題、研究專題、收集數(shù)據(jù)和整合編排等環(huán)節(jié)。所謂分析主題,即通過(guò)了解各級(jí)黨政機(jī)關(guān)和人民大眾所關(guān)心的熱點(diǎn)問(wèn)題,圍繞服務(wù)大局,結(jié)合館(室)藏檔案內(nèi)容,遴選出有現(xiàn)實(shí)利用價(jià)值和潛在利用價(jià)值的檔案主題。在遴選出的檔案主題中,結(jié)合時(shí)事宣傳和檔案利用的工作需要,確定專題內(nèi)容,即所謂的研究專題環(huán)節(jié)。然后,在圍繞某一專題的基礎(chǔ)上,首先設(shè)立項(xiàng)目,通過(guò)查找本館的檔案資料,也包括館外的其他文獻(xiàn)資料,集中相關(guān)檔案信息數(shù)據(jù),再經(jīng)過(guò)加工編排而產(chǎn)生檔案專題信息資源。這里有必要提出的是,關(guān)于采集數(shù)據(jù)的過(guò)程,不妨通過(guò)關(guān)鍵詞檢索、全文內(nèi)容檢索等手段,在海量的檔案基礎(chǔ)數(shù)據(jù)庫(kù)中查找所需的專題數(shù)據(jù)材料。有時(shí)也可通過(guò)補(bǔ)充采集一些數(shù)據(jù)資料,進(jìn)一步充實(shí)和完善檔案專題數(shù)據(jù)庫(kù)的內(nèi)容。在選題時(shí):需要注意的是要求盡量使得體系完備、分類合理,力求使整個(gè)目錄收集的內(nèi)容涵蓋整個(gè)專題的范圍。
對(duì)數(shù)據(jù)的加工整合也是檔案專題數(shù)據(jù)庫(kù)科學(xué)程序必不可少的環(huán)節(jié),要針對(duì)不同的專題數(shù)據(jù)形式制定統(tǒng)一的數(shù)據(jù)庫(kù)字段和數(shù)據(jù)格式,確保整個(gè)專題數(shù)據(jù)庫(kù)的規(guī)范性、標(biāo)準(zhǔn)性和可共享性,有必要時(shí)統(tǒng)一開(kāi)發(fā)相應(yīng)的建庫(kù)軟件。最后,要對(duì)采集到的專題數(shù)據(jù)進(jìn)行編排處理,特別是有不同數(shù)據(jù)形式的,要?dú)w類排序,形成一個(gè)內(nèi)容介紹,用以概述該專題數(shù)據(jù)庫(kù)的簡(jiǎn)要內(nèi)容。
盡管以上幾個(gè)環(huán)節(jié)均必不可
少,但我們必須分清輕重緩急,適當(dāng)?shù)胤峙涔ぷ鞯闹攸c(diǎn),要始終以利用者需求為導(dǎo)向,實(shí)現(xiàn)科學(xué)的檔案專題數(shù)據(jù)庫(kù)開(kāi)發(fā)程序的目標(biāo)。適時(shí)地進(jìn)行利用者需求的調(diào)研,將其作為檔案專題數(shù)據(jù)庫(kù)建設(shè)的環(huán)節(jié)也不是不可以考慮的,這對(duì)于檔案專題數(shù)據(jù)庫(kù)開(kāi)發(fā)的效果將起到十分關(guān)鍵的作用。
3.3重視研究檔案專題數(shù)據(jù)庫(kù)的安全問(wèn)題。在諸多關(guān)于檔案數(shù)據(jù)庫(kù)的文章中,有不少談及到檔案數(shù)據(jù)庫(kù)的安全問(wèn)題。對(duì)于檔案專題數(shù)據(jù)庫(kù)也不例外,同樣需要重視其安全問(wèn)題,這樣才能保證檔案專題數(shù)據(jù)庫(kù)更加穩(wěn)健地發(fā)展。
檔案專題數(shù)據(jù)庫(kù)的安全問(wèn)題主要涉及介質(zhì)安全與數(shù)據(jù)安全兩方面。介質(zhì)安全是指檔案專題數(shù)據(jù)庫(kù)的存儲(chǔ)介質(zhì),因?yàn)檫@些介質(zhì)可能隨著時(shí)間流逝,出現(xiàn)老化、失效等問(wèn)題,繼而導(dǎo)致數(shù)據(jù)庫(kù)的數(shù)據(jù)缺失,這對(duì)檔案專題數(shù)據(jù)庫(kù)來(lái)說(shuō)是一個(gè)致命的問(wèn)題。另外,檔案專題數(shù)據(jù)庫(kù)經(jīng)常通過(guò)網(wǎng)絡(luò)發(fā)布,很容易受到網(wǎng)絡(luò)黑客的攻擊,這就面臨數(shù)據(jù)被篡改,甚至數(shù)據(jù)異常等問(wèn)題。在這樣的情況下,研究檔案專題數(shù)據(jù)庫(kù)的安全問(wèn)題顯得十分必要。
因此,首先要改良檔案專題數(shù)據(jù)庫(kù)的存儲(chǔ)介質(zhì),發(fā)展更優(yōu)良的存儲(chǔ)形式,從硬件上保護(hù)檔案專題數(shù)據(jù)庫(kù)的安全。在系統(tǒng)設(shè)計(jì)階段,應(yīng)加強(qiáng)權(quán)限設(shè)置,一方面要對(duì)系統(tǒng)中各個(gè)功能模塊的操作權(quán)限進(jìn)行定義,另一方面是對(duì)系統(tǒng)數(shù)據(jù)的分層管理和操作權(quán)限的定義。比如,數(shù)據(jù)庫(kù)的管理人員可以看到后臺(tái)的數(shù)據(jù),可以對(duì)數(shù)據(jù)庫(kù)進(jìn)行編輯和管理,高級(jí)用戶可以看到編纂完成之后的所有檔案信息,普通用戶則只能看到一部分信息等。就目前檔案專題數(shù)據(jù)庫(kù)網(wǎng)絡(luò)化的趨勢(shì)而言,還要加強(qiáng)數(shù)據(jù)庫(kù)的反黑客能力。檔案專題數(shù)據(jù)庫(kù)的安全問(wèn)題能否順利解決與否,關(guān)系到檔案專題數(shù)據(jù)庫(kù)運(yùn)行與發(fā)展的水平與趨勢(shì),我們必須對(duì)其高度重視,在實(shí)現(xiàn)其物理安全的同時(shí),更加注重研究其網(wǎng)絡(luò)環(huán)境下的安全隱患,如對(duì)于著作權(quán)的研究也應(yīng)該是檔案專題數(shù)據(jù)庫(kù)建設(shè)中值得深思的問(wèn)題。
在信息化時(shí)代下,要以滿足人民群眾日益增長(zhǎng)的檔案信息需求為導(dǎo)向,對(duì)檔案專題數(shù)據(jù)庫(kù)的開(kāi)發(fā)與應(yīng)用是檔案信息資源開(kāi)發(fā)利用的重要形式與創(chuàng)新手段,因此,立足于地方特色、館藏特色及本館特色的基礎(chǔ)上,對(duì)利用者的需求分析成了檔案專題數(shù)據(jù)庫(kù)建設(shè)的新任務(wù)。這就需要對(duì)利用者的需求進(jìn)行分析,提煉出人們所關(guān)心的檔案資源,經(jīng)過(guò)對(duì)其進(jìn)行分類,開(kāi)發(fā)出各類利用價(jià)值高、有針對(duì)性的檔案專題數(shù)據(jù)庫(kù),以滿足不同利用者對(duì)檔案信息資源的需求。