尹承龍
檔案管理工作具有社會(huì)性。高校是人才聚集地,其在發(fā)展中會(huì)產(chǎn)生大量的檔案信息。信息化時(shí)代的到來(lái)使高校檔案信息具有大數(shù)據(jù)特征,因此高校檔案資源極為關(guān)鍵。順利開展檔案資源建設(shè)工作還有利于提升其他工作的效率?,F(xiàn)主要研究如何在大數(shù)據(jù)時(shí)代背景下高效開展高校數(shù)字檔案資源建設(shè)工作,提出高校數(shù)字檔案資源建設(shè)的新思路,為后續(xù)相關(guān)工作的開展提供借鑒。
大數(shù)據(jù)時(shí)代的本質(zhì)就是借助先進(jìn)技術(shù)充分挖掘各類數(shù)據(jù),并實(shí)現(xiàn)對(duì)數(shù)據(jù)的合理利用,高校檔案資源就是眾多數(shù)據(jù)中的一部分。高校是人才聚集地,若是在發(fā)展中未及時(shí)有效地進(jìn)行檔案資源建設(shè),將會(huì)影響相關(guān)工作的順利推進(jìn)。因此,高校和政府機(jī)構(gòu)需要著重研究大數(shù)據(jù)時(shí)代高校數(shù)字檔案資源建設(shè)工作的開展路徑,以提升高校各項(xiàng)工作的效率。
高校數(shù)字檔案資源建設(shè)的優(yōu)勢(shì)
高校數(shù)字檔案資源建設(shè)立足于現(xiàn)代信息技術(shù),因此為了順利完成高校數(shù)字檔案資源建設(shè)工作,高校應(yīng)積極引進(jìn)信息技術(shù)專業(yè)人才,使其承擔(dān)主要的建設(shè)工作。高校在完成數(shù)字檔案資源建設(shè)工作后,會(huì)明確劃分各部門的職責(zé)。由于各部門的數(shù)據(jù)庫(kù)具有緊密聯(lián)系,可以共享數(shù)字檔案資源,從而避免出現(xiàn)“信息孤島”,這為各部門工作的開展提供了數(shù)據(jù)支持,顯著提升了高校各項(xiàng)工作的效率。此外,高校各部門會(huì)將豐富的數(shù)字檔案資源匯總到檔案館,為高校師生提供一站式服務(wù)。由此可見(jiàn),高校數(shù)字檔案資源建設(shè)工作的重要性,同時(shí)其也是高校在大數(shù)據(jù)時(shí)代創(chuàng)新發(fā)展的必然選擇。
大數(shù)據(jù)時(shí)代高校數(shù)字檔案資源建設(shè)面臨的難題
資源方面存在的問(wèn)題
1.高校數(shù)字檔案資源體量大、類型多
高校數(shù)字檔案館建設(shè)的核心是數(shù)字檔案資源。但其來(lái)源廣泛,形式和種類復(fù)雜多樣。大數(shù)據(jù)時(shí)代,高校的數(shù)據(jù)呈現(xiàn)出海量式增長(zhǎng)的趨勢(shì),如日常信息服務(wù)、機(jī)房設(shè)備,學(xué)生選課、考試、借書等都會(huì)產(chǎn)生大量數(shù)據(jù)。這些數(shù)據(jù)包括文本、視頻音頻、圖片圖像、動(dòng)態(tài)和靜態(tài)網(wǎng)頁(yè)等多種形式。其中,傳統(tǒng)載體檔案的數(shù)字化轉(zhuǎn)換以及電子文件歸檔是數(shù)字檔案資源最主要的兩大來(lái)源。如今,高校數(shù)字檔案資源除了電子文件和數(shù)字化檔案外,還包括與高校有關(guān)的各類網(wǎng)絡(luò)資源。
2.高校數(shù)字檔案資源分散,質(zhì)量參差不齊
高校數(shù)字檔案資源來(lái)自高校不同部門的數(shù)據(jù)庫(kù),各個(gè)數(shù)據(jù)庫(kù)自成體系,且建設(shè)標(biāo)準(zhǔn)不統(tǒng)一,這導(dǎo)致各部門之間溝通不暢,存在數(shù)據(jù)異構(gòu)的問(wèn)題。此外,巨大的數(shù)據(jù)量考驗(yàn)著服務(wù)器的響應(yīng)速度和吞吐能力,非結(jié)構(gòu)化、半結(jié)構(gòu)化數(shù)據(jù)格式又考驗(yàn)著數(shù)據(jù)庫(kù)的性能。在海量的檔案資源中有許多重復(fù)、交叉的內(nèi)容,這對(duì)檔案工作人員的技術(shù)能力和個(gè)人素養(yǎng)提出了新的要求。
3.檔案信息的挖掘不深入
信息化時(shí)代下,人們每日的工作和生活都離不開網(wǎng)絡(luò),會(huì)不斷產(chǎn)生各類信息,相關(guān)工作人員應(yīng)深入挖掘各類信息的潛在價(jià)值。高校數(shù)字檔案資源建設(shè)工作也是如此,如果只是淺層次地利用數(shù)字檔案資源開展工作,沒(méi)有深入挖掘數(shù)字檔案資源的內(nèi)在價(jià)值,就無(wú)法充分發(fā)揮出檔案資源的作用。
技術(shù)方面存在的問(wèn)題
數(shù)字檔案資源工作人員可以從采集、處理與集成、分析、解釋四個(gè)階段入手處理數(shù)據(jù)。其中數(shù)據(jù)分析是最核心的部分,也是深入挖掘數(shù)字檔案資源價(jià)值的關(guān)鍵環(huán)節(jié)。由于高校數(shù)字檔案資源的大數(shù)據(jù)特征顯著,所以,工作人員可以使用大數(shù)據(jù)技術(shù)深入挖掘數(shù)字檔案資源的價(jià)值。過(guò)去,工作人員大多采用隨機(jī)采樣分析法挖掘檔案資源的價(jià)值,但是采樣分析的隨機(jī)性會(huì)直接影響檔案資源分析的準(zhǔn)確性。在數(shù)據(jù)處理和集成環(huán)節(jié),工作人員需要提取、重構(gòu)、集成異構(gòu)數(shù)據(jù),并按照相關(guān)標(biāo)準(zhǔn)分門別類地儲(chǔ)存,形成可供分析的原始數(shù)據(jù),不僅可以保證數(shù)據(jù)的質(zhì)量與可靠性,也促使數(shù)字檔案得到精細(xì)化管理。但是,當(dāng)前高校各部門沒(méi)有建立統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn),內(nèi)部檔案信息管理系統(tǒng)在與外部信息系統(tǒng)進(jìn)行對(duì)接的過(guò)程中會(huì)產(chǎn)生許多錯(cuò)誤數(shù)據(jù),造成數(shù)據(jù)冗余,這對(duì)數(shù)據(jù)清洗環(huán)節(jié)提出了嚴(yán)峻的考驗(yàn)。此外,因?yàn)殡x線冷數(shù)據(jù)和在線熱數(shù)據(jù)的數(shù)量眾多,所以可以運(yùn)用分布式計(jì)算法對(duì)檔案資源的價(jià)值進(jìn)行深入挖掘,而這對(duì)數(shù)字檔案資源整理和篩選工作提出了迫切要求。
思維方面存在的問(wèn)題
以往,高校在開展檔案資源管理工作的過(guò)程中,大多是將業(yè)務(wù)作為關(guān)注重點(diǎn),所以會(huì)出現(xiàn)無(wú)法將檔案資源的利用需求和服務(wù)要求聯(lián)系起來(lái)的情況。服務(wù)理念的落后導(dǎo)致資源建設(shè)和用戶建設(shè)脫節(jié)的情況加劇,高校檔案館很少對(duì)用戶分類進(jìn)行深入研究。大數(shù)據(jù)時(shí)代,高校數(shù)字檔案資源建設(shè)的意義并不在于存儲(chǔ),而是應(yīng)該以用戶為中心,借助現(xiàn)代化技術(shù),深入挖掘數(shù)字檔案資源的隱藏價(jià)值,為用戶提供個(gè)性化服務(wù),真正有效地將數(shù)字檔案信息轉(zhuǎn)變?yōu)闄n案知識(shí),實(shí)現(xiàn)高校數(shù)字檔案服務(wù)的轉(zhuǎn)型與升級(jí)。
高校數(shù)字檔案資源建設(shè)內(nèi)容
實(shí)體檔案數(shù)字化處理
高校檔案資源建設(shè)中實(shí)體檔案的作用顯著,且地位極高。從載體和內(nèi)容的角度來(lái)看,實(shí)體檔案除了紙質(zhì)檔案外,還有錄像帶、磁盤和照片等形式。工作人員對(duì)高校實(shí)體檔案進(jìn)行數(shù)字化處理,將紙質(zhì)檔案轉(zhuǎn)變?yōu)閿?shù)字檔案,如此在進(jìn)行基本的檔案資源檢索時(shí)可以直接檢索文件的標(biāo)題,大大提高了工作效率。工作人員還可以采取數(shù)字化方式處理聲像檔案,借助掃描儀并結(jié)合相關(guān)標(biāo)準(zhǔn)處理照片檔案等。各個(gè)高校都有大量的檔案資料,而且存儲(chǔ)的實(shí)體檔案資料內(nèi)容復(fù)雜,因此對(duì)全部實(shí)體檔案進(jìn)行數(shù)字化處理,可以有效提高各項(xiàng)工作的效率,為后續(xù)高校數(shù)字檔案資源建設(shè)工作的開展奠定基礎(chǔ)。
檔案資源數(shù)據(jù)庫(kù)的建設(shè)
高校數(shù)字檔案資源建設(shè)工作中數(shù)據(jù)庫(kù)具有顯著作用。在不斷推進(jìn)檔案數(shù)字化發(fā)展的過(guò)程中,以網(wǎng)絡(luò)數(shù)據(jù)庫(kù)為基礎(chǔ),有利于順利開展高校數(shù)字檔案資源建設(shè)工作,全面反映高校的數(shù)字檔案資源建設(shè)現(xiàn)狀。
首先,在高校數(shù)字檔案資源建設(shè)的過(guò)程中,應(yīng)該將設(shè)置檢索功能作為工作的切入點(diǎn),構(gòu)建數(shù)字檔案資源數(shù)據(jù)庫(kù),方便師生快速檢索數(shù)據(jù)。其次,需要建設(shè)特色專題數(shù)據(jù)庫(kù)。學(xué)校在開展管理工作的過(guò)程中,可能會(huì)多次使用某些專題的檔案資源,相關(guān)工作人員應(yīng)根據(jù)學(xué)校的要求建立特色專題數(shù)據(jù)庫(kù),精準(zhǔn)對(duì)接用戶的知識(shí)需求,這是高校數(shù)字檔案資源建設(shè)工作的突破口,可以充分發(fā)揮出高校數(shù)字檔案資源的真正價(jià)值,加快數(shù)字檔案資源建設(shè)的進(jìn)程,方便高校各部門實(shí)時(shí)共享專題檔案資料。不僅如此,建設(shè)特色專題數(shù)據(jù)庫(kù),還可以充分展示高校的辦學(xué)特色。因此,學(xué)校各部門之間應(yīng)緊密聯(lián)系起來(lái),積極建設(shè)特色專題數(shù)據(jù)庫(kù),有效解決教學(xué)和科研工作中存在的檔案資源利用不便的問(wèn)題。
檔案信息網(wǎng)站建設(shè)
高校通過(guò)建設(shè)數(shù)字檔案資源網(wǎng)絡(luò)平臺(tái),并在其中設(shè)置導(dǎo)航服務(wù),有利于用戶快速查找所需要的檔案信息,學(xué)校也不需要花費(fèi)更多的資金建設(shè)新的檔案館,在降低成本的同時(shí)提高了信息檢索效率,使用戶的多樣化需求得以滿足,為高校數(shù)字檔案資源建設(shè)工作的開展做好了準(zhǔn)備工作。因此,許多高校都開始積極建設(shè)數(shù)字檔案館,借助互聯(lián)網(wǎng)和信息技術(shù),構(gòu)建檔案信息平臺(tái)。但是,在平臺(tái)的建設(shè)過(guò)程中還存在如下問(wèn)題。部分高校檔案信息平臺(tái)的信息不全面,很多檔案資料都被封存,只有一小部分檔案資料是因?yàn)槌鋈甑拇鎯?chǔ)時(shí)間才公布在網(wǎng)絡(luò)平臺(tái)上,而且只能通過(guò)內(nèi)部局域網(wǎng)才能進(jìn)行查閱。部分高校的檔案網(wǎng)絡(luò)平臺(tái)信息只是對(duì)匯編活動(dòng)內(nèi)容的整合,尚未深度挖掘檔案資料內(nèi)容的價(jià)值,且更新不及時(shí),降低了數(shù)字檔案資源的實(shí)效性,難以突顯學(xué)校特色。因此,在實(shí)際搭建網(wǎng)絡(luò)平臺(tái)的過(guò)程中,高校工作人員應(yīng)著重考慮檔案資源的運(yùn)用方式,深度挖掘數(shù)字檔案資源的潛在價(jià)值,及時(shí)更新檔案內(nèi)容,以滿足用戶的知識(shí)需求。
大數(shù)據(jù)時(shí)代高校數(shù)字檔案資源建設(shè)的路徑
整合高校數(shù)字檔案資源,建立統(tǒng)一的數(shù)字管理標(biāo)準(zhǔn)
數(shù)據(jù)在社會(huì)中具有重要作用,尤其是在大數(shù)據(jù)背景下。在高校傳統(tǒng)檔案資源轉(zhuǎn)化為數(shù)字資源的過(guò)程中,最主要的是數(shù)據(jù)資源。相關(guān)工作人員應(yīng)提高對(duì)大數(shù)據(jù)的重視程度,推動(dòng)高校數(shù)字檔案資源建設(shè)工作的順利開展。因此,高校需要及時(shí)轉(zhuǎn)變數(shù)字資源建設(shè)思路,結(jié)合大數(shù)據(jù)時(shí)代的特征樹立新型數(shù)字檔案資源建設(shè)理念,在數(shù)字檔案資源建設(shè)中融入館藏?cái)?shù)字資源和高校網(wǎng)絡(luò)資源。另外,工作人員還可以借助云計(jì)算技術(shù)將資源虛擬化,并集中整合在云平臺(tái)上,形成資源存儲(chǔ)池。一方面,可以有效避免“信息孤島”的出現(xiàn);另一方面,方便工作人員對(duì)數(shù)字資源的統(tǒng)一管理和利用,方便用戶快速獲取信息。因此,工作人員要充分利用云計(jì)算技術(shù)開展高校數(shù)字檔案資源建設(shè)工作,構(gòu)建云平臺(tái),將不同業(yè)務(wù)系統(tǒng)和網(wǎng)站中分散的數(shù)字檔案資源整合起來(lái),并按照標(biāo)準(zhǔn)檔案格式和類型進(jìn)行分類儲(chǔ)存,實(shí)現(xiàn)高校數(shù)字檔案資源的優(yōu)化配置。
基于云計(jì)算技術(shù)構(gòu)建大數(shù)據(jù)挖掘體系架構(gòu)
在大數(shù)據(jù)環(huán)境下,云計(jì)算技術(shù)的應(yīng)用價(jià)值極高,其所具備的并行處理能力和存儲(chǔ)能力是構(gòu)建數(shù)據(jù)挖掘體系架構(gòu)的重要前提,可以最大程度地發(fā)揮出高校數(shù)字檔案資源的真正價(jià)值。高校數(shù)字檔案資源體系架構(gòu)主要分為三層。第一層,云計(jì)算平臺(tái)層。要想充分挖掘數(shù)據(jù)資源的價(jià)值,云計(jì)算平臺(tái)層是重要的技術(shù)支撐,主要作用是存儲(chǔ)和整合各類檔案數(shù)據(jù)。第二層,數(shù)據(jù)挖掘處理層。其主要作用是預(yù)處理海量的檔案數(shù)據(jù),并采取信息化技術(shù)對(duì)檔案數(shù)據(jù)進(jìn)行智能化分析,通過(guò)讀取數(shù)字檔案資源對(duì)數(shù)字檔案資源進(jìn)行格式的轉(zhuǎn)化和統(tǒng)一。而后經(jīng)過(guò)數(shù)據(jù)清洗,利用算法數(shù)字檔案資源進(jìn)行識(shí)別和統(tǒng)計(jì),分析其內(nèi)在規(guī)律。第三層,展示服務(wù)層。其是平臺(tái)與用戶互動(dòng)的接口,可以通過(guò)可視化界面向用戶展示數(shù)據(jù)處理結(jié)果。高校檔案工作人員在借助云計(jì)算技術(shù)構(gòu)建大數(shù)據(jù)挖掘體系架構(gòu)的過(guò)程中,還需要采取措施保護(hù)檔案數(shù)據(jù)的安全,如樹立數(shù)據(jù)保護(hù)意識(shí),對(duì)檔案數(shù)據(jù)進(jìn)行定期檢查,及時(shí)更新補(bǔ)丁,設(shè)置防火墻等。
以用戶為中心,高效利用數(shù)字檔案資源
在大數(shù)據(jù)時(shí)代,高校數(shù)字檔案資源建設(shè)應(yīng)該以用戶為中心,通過(guò)搭建集利用服務(wù)與知識(shí)共享為一體的網(wǎng)絡(luò)化服務(wù)平臺(tái),為其提供個(gè)性化知識(shí)服務(wù)。首先,高校檔案工作者必須及時(shí)更新工作理念,重視數(shù)字檔案資源知識(shí)服務(wù)在高校發(fā)展中的重要作用,應(yīng)從數(shù)字資源的管理者轉(zhuǎn)變?yōu)橹R(shí)的提供者。同時(shí),數(shù)字檔案資源工作者還應(yīng)該重視檔案資源的開放和共享,主動(dòng)且深入地挖掘用戶的知識(shí)需求,以確保知識(shí)服務(wù)工作的開展具有針對(duì)性和科學(xué)性。其次,工作人員應(yīng)重視優(yōu)化和完善知識(shí)服務(wù)技術(shù),學(xué)會(huì)運(yùn)用數(shù)據(jù)挖掘技術(shù),深層次挖掘和分析數(shù)字檔案資源的潛在價(jià)值,使數(shù)字檔案資源中蘊(yùn)含的隱性知識(shí)顯性化。最后,工作人員還需要采集用戶的靜態(tài)數(shù)據(jù)和動(dòng)態(tài)數(shù)據(jù),通過(guò)數(shù)據(jù)清洗,將與用戶特征無(wú)關(guān)的數(shù)據(jù)刪除,然后利用數(shù)據(jù)挖掘技術(shù)對(duì)用戶數(shù)據(jù)進(jìn)行計(jì)算,分析不同用戶的利用需求特征,并在此基礎(chǔ)上構(gòu)建用戶分類數(shù)據(jù)庫(kù),最后再借助可視化方法描述用戶的需求。通過(guò)對(duì)用戶行為的動(dòng)機(jī)與特點(diǎn)進(jìn)行分析,可以明確高校檔案數(shù)字資源建設(shè)的重點(diǎn),有針對(duì)性地優(yōu)化高校數(shù)字檔案資源的配置,進(jìn)而向用戶提供精準(zhǔn)個(gè)性化服務(wù)。
本文主要分析了大數(shù)據(jù)時(shí)代背景下,高校數(shù)字檔案資源建設(shè)工作的現(xiàn)狀,對(duì)涉及的相關(guān)內(nèi)容與在工作過(guò)程中遇到的難題進(jìn)行了詳細(xì)討論,明確了數(shù)字檔案資源建設(shè)工作開展的新思路。要想提高檔案管理工作的效率,高校數(shù)字檔案工作人員應(yīng)以全新的方式建設(shè)高校數(shù)字檔案資源,充分挖掘數(shù)字化檔案資源的潛在價(jià)值,滿足高校師生的多元化需求,推動(dòng)高校數(shù)字檔案資源管理和建設(shè)工作的創(chuàng)新開展。
河南省軟科學(xué)計(jì)劃研究項(xiàng)目“濮陽(yáng)市扶貧資金績(jī)效管理問(wèn)題研究”(編號(hào):202400410413)。
(作者單位:濮陽(yáng)職業(yè)技術(shù)學(xué)院)