陸芳艷
[摘要]隨著檔案工作數(shù)據(jù)的電子化辦公和數(shù)字信息的歸檔率都在不斷上升,歸檔的數(shù)字信息正在變得更加復(fù)雜。隨著而來的是對(duì)數(shù)字歸檔的信息管理,處理,存儲(chǔ),安全,和處置變得越來越困難。我們必須在大數(shù)據(jù)的形勢(shì)下,通過新方法,搜索、發(fā)現(xiàn)和分析來幫助檔案管理人員更好的從事檔案管理工作。
[關(guān)鍵詞]大數(shù)據(jù);檔案管理;信息化;智能化;預(yù)測(cè)
首先,何為大數(shù)據(jù)?“大數(shù)據(jù)”是一個(gè)體量特別大,數(shù)據(jù)類別特別大的數(shù)據(jù)集,并且這樣的數(shù)據(jù)集無法用傳統(tǒng)數(shù)據(jù)庫(kù)工具對(duì)其內(nèi)容進(jìn)行抓取、管理和處理。大數(shù)據(jù),首先是指數(shù)據(jù)體量(volumes)大,指代大型數(shù)據(jù)集,一般在10TB規(guī)模左右,但在實(shí)際應(yīng)用中,很多企業(yè)用戶把多個(gè)數(shù)據(jù)集放在一起,已經(jīng)形成了PB級(jí)的數(shù)據(jù)量;其次是指數(shù)據(jù)類別(variety)大,數(shù)據(jù)來自多種數(shù)據(jù)源,數(shù)據(jù)種類和格式日漸豐富,已沖破了以前所限定的結(jié)構(gòu)化數(shù)據(jù)范疇,囊括了半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)。接著是數(shù)據(jù)處理速度(Velocity)快,在數(shù)據(jù)量非常龐大的情況下,也能夠做到數(shù)據(jù)的實(shí)時(shí)處理。最后一個(gè)特點(diǎn)是指數(shù)據(jù)真實(shí)性(Veracity)高,隨著檔案數(shù)據(jù)、檔案記錄內(nèi)容、交易與應(yīng)用數(shù)據(jù)等新數(shù)據(jù)源的興趣,傳統(tǒng)數(shù)據(jù)源的局限被打破。
國(guó)家對(duì)大數(shù)據(jù)的愿景:對(duì)信息資源的開發(fā)利用能力已經(jīng)成為國(guó)際競(jìng)爭(zhēng)以及國(guó)家整體實(shí)力的重要方面,當(dāng)全球范圍內(nèi)數(shù)據(jù)成為國(guó)家資產(chǎn)、創(chuàng)新前沿,要成為“數(shù)據(jù)時(shí)代先驅(qū)者”,我們需要學(xué)習(xí),借鑒、消化和創(chuàng)新,例如美國(guó)、歐洲數(shù)據(jù)開放戰(zhàn)略,韓國(guó)、新加坡的基礎(chǔ)設(shè)施建設(shè),日本智慧城市、醫(yī)療和農(nóng)業(yè)等方面的創(chuàng)新等。在國(guó)家層面建立大數(shù)據(jù)國(guó)家戰(zhàn)略,強(qiáng)化對(duì)于基礎(chǔ)設(shè)施的投入,推動(dòng)政府?dāng)?shù)據(jù)公開,建立數(shù)據(jù)流通平臺(tái),加強(qiáng)法律環(huán)境建設(shè),通過產(chǎn)業(yè)推進(jìn)和詳細(xì)規(guī)劃,引導(dǎo)和推動(dòng)各部委、各行業(yè)對(duì)大數(shù)據(jù)的研究與利用,推動(dòng)各領(lǐng)域大數(shù)據(jù)落地,營(yíng)造良好的大數(shù)據(jù)產(chǎn)業(yè)生態(tài)環(huán)境,養(yǎng)成大數(shù)據(jù)時(shí)代的管理創(chuàng)新思維。
大數(shù)據(jù)對(duì)婚姻檔案管理的影響,未來將運(yùn)用大數(shù)據(jù)等信息化的技術(shù)手段,進(jìn)一步完善婚姻數(shù)據(jù)庫(kù)檔案,將其與教育信息平臺(tái)、公安部平臺(tái)等實(shí)現(xiàn)信息共享,加大對(duì)婚姻教育的信息化和打擊拐賣婦女等不平等的婚姻做出數(shù)據(jù)依據(jù)。
目前婚姻檔案數(shù)據(jù)庫(kù)建設(shè)正在逐步實(shí)現(xiàn)部門共享,向公檢法等職能部門公開。作為推動(dòng)政府職能轉(zhuǎn)變,加強(qiáng)事中事后監(jiān)管的重要措施,有利于培育更加和諧完美的中國(guó)婚姻,打造中國(guó)夢(mèng)。
民政檔案,全國(guó)各地由大大小小的省,市,縣等部門組成。大數(shù)據(jù)的目標(biāo)就是要形成涵蓋省市縣四級(jí)。如婚姻數(shù)據(jù)業(yè)務(wù)的信用信息采集鏈條,在全國(guó)范圍內(nèi)實(shí)現(xiàn)互聯(lián)互通。婚姻信用檔案建檔對(duì)象為家庭,采集的婚姻信息包括以家庭為單位的基本信息,強(qiáng)制性婚姻狀況記錄等許可的信息,以及政府獎(jiǎng)勵(lì)等良好行為記錄,同時(shí)也有因?yàn)楣召u婦女等不合格以及執(zhí)法中發(fā)現(xiàn)的違法違規(guī)的不良婚姻行為記錄。
電子化檔案是一種能被傳輸、傳達(dá)的信息,它是以文件、圖像等載體體現(xiàn)出來的信息。在現(xiàn)代社會(huì),我國(guó)的網(wǎng)絡(luò)技術(shù)水平也在不斷提高,檔案管理的數(shù)字化要依靠科學(xué)技術(shù)的發(fā)展來實(shí)現(xiàn),這已經(jīng)成為我國(guó)檔案管理現(xiàn)階段的必然趨勢(shì)。在這種趨勢(shì)下,很多檔案信息都可以從檔案的實(shí)體中分離出來,實(shí)現(xiàn)資料的及時(shí)共享,為人們獲取信息帶了方便。
檔案管理理論的挑戰(zhàn)。正如信息化時(shí)代挑戰(zhàn)了紙質(zhì)時(shí)代的來源原則、文件生命周期理論、檔案價(jià)值鑒定理論,催生了基礎(chǔ)理論的新變革,產(chǎn)生新來源觀、文件連續(xù)體理論、宏觀鑒定理論等等革新的理論。在大數(shù)據(jù)時(shí)代,新來源觀、文件連續(xù)體理論、宏觀鑒定理論都將受到不同程度的挑戰(zhàn),檔案學(xué)基礎(chǔ)理論將進(jìn)一步發(fā)展。
挑戰(zhàn)與機(jī)遇并存。大數(shù)據(jù)時(shí)代給檔案管理工作帶來挑戰(zhàn)的同時(shí)也帶來了新的機(jī)遇:大數(shù)據(jù)的理念給海量檔案信息資源管理帶來了機(jī)遇。傳統(tǒng)紙質(zhì)檔案以“卷”“件”“份”為單位,在大數(shù)據(jù)時(shí)代,檔案更多以“字段”“數(shù)據(jù)庫(kù)”為管理對(duì)象。在檔案統(tǒng)計(jì)方面,從原來的以“頁(yè)”“米”為統(tǒng)計(jì)單位改為以“GB”(千兆字節(jié))為統(tǒng)計(jì)單位。大數(shù)據(jù)的應(yīng)用給檔案數(shù)據(jù)挖掘帶來了機(jī)遇。傳統(tǒng)的檔案管理以文檔管理為主,檔案基本處于被動(dòng)利用,沉淀的檔案沒有人去分析利用,也沒有技術(shù)工具去支撐挖掘、分析。在大數(shù)據(jù)時(shí)代,檔案系統(tǒng)中除了大量的文檔之外,還有海量結(jié)構(gòu)化數(shù)據(jù),并且數(shù)據(jù)利用的效果要大于文檔利用效果。檔案部門在收集大數(shù)據(jù)之后,通過主動(dòng)調(diào)查利用者的需求,建立各種數(shù)據(jù)模型,對(duì)海量數(shù)據(jù)進(jìn)行聚類、分類、相關(guān)性分析,找到數(shù)據(jù)之間的關(guān)系,提高檔案價(jià)值,將原來的“死檔案”變成“活信息”,為高層決策提供參考。
大數(shù)據(jù)時(shí)代化檔案管理相較于以前的檔案管理?yè)碛幸韵碌膬?yōu)勢(shì):
1.信息互聯(lián)管理數(shù)字化。在大數(shù)據(jù)時(shí)代,數(shù)據(jù)是大而全的。檔案管理人員在管理時(shí)可以采用現(xiàn)在高科技的網(wǎng)絡(luò)技術(shù),和大數(shù)據(jù)互聯(lián)技術(shù),完成數(shù)字化的管理。通過分布式,一體化的操作來提高檔案管理的安全性、一致性、時(shí)效性等優(yōu)點(diǎn),互聯(lián)網(wǎng)的可視性、專業(yè)性可以為管理人員提供及時(shí)的查詢和瀏覽功能,從而解決資源的匱乏。
2.資源管理虛擬一致化。通過大數(shù)據(jù)一致化,互聯(lián)網(wǎng)和檔案館相互對(duì)檔案進(jìn)行及時(shí)的管理,可以達(dá)到檔案管理的穩(wěn)定性和時(shí)效性,避免在檔案借閱中的不及時(shí)和漏記等現(xiàn)象,從而達(dá)到對(duì)檔案信息資源的便捷性,準(zhǔn)確性的管理。
3.管理信息檔案數(shù)字化管理具有智能性。檔案管理人員可以利用大數(shù)據(jù)先進(jìn)的軟件和系統(tǒng)對(duì)信息的智能化搜索分析。搜索的速度要比普通的查閱快好幾倍,這樣不僅可以提高搜索的效率,還可以擴(kuò)展搜索的范圍,查閱到有有用的信息和資料,還可以對(duì)資料進(jìn)行加密安全的管理,保證檔案的安全性。這種數(shù)字化不僅提高了檔案的保存年限,更對(duì)比較珍貴的資料進(jìn)行了智能化的管理,方便使用者查閱,而且可以智能的用大數(shù)據(jù)分析出當(dāng)下國(guó)民喜歡看的書籍和年齡段分層的數(shù)據(jù),使得檔案數(shù)據(jù)更加合理的提供給使用人員。
4.用戶使用方便化。用戶可以在不同的時(shí)間、不同的地點(diǎn)使用互聯(lián)網(wǎng)進(jìn)行信息的查閱,不受地域和時(shí)間的限制,這樣可以幫助用戶取得更及時(shí)、準(zhǔn)確的信息,節(jié)省了用戶的時(shí)間和精力,提高工作效率。檢索速度快只需要幾秒鐘,而且還提高了信息的保存年限,而且還有智能的檢索排行榜,對(duì)用戶決策提供幫助。信息的真實(shí)性也有了一定的保證,在一定的時(shí)間內(nèi)不會(huì)受到人為或者自然的損害,導(dǎo)致信息的失真。所以實(shí)現(xiàn)檔案管理的數(shù)字化可以令使用者在世界的有網(wǎng)絡(luò)信號(hào)的位置可以查詢到想知道的準(zhǔn)確信息。
5.具有統(tǒng)計(jì)性和預(yù)測(cè)性。通過大數(shù)據(jù)系統(tǒng)技術(shù)的統(tǒng)計(jì)特性,可以得出規(guī)律統(tǒng)計(jì),比如統(tǒng)計(jì)婚姻檔案,得出不同地方的婚姻檔案記錄和預(yù)測(cè)未來的一個(gè)婚姻趨勢(shì)。這就是大數(shù)據(jù)的檔案管理魅力。
參考文獻(xiàn)
[1]趙國(guó)棟,易歡歡,糜萬軍,鄂維南 著.大數(shù)據(jù)時(shí)代的歷史機(jī)遇.清華大學(xué)出版社,2013