吳建軍
[摘 要] 21世紀隨著互聯(lián)網(wǎng)以及智能領(lǐng)域的發(fā)展,個人使用手機、個人電腦、平板電腦以及智能設(shè)備的頻率不斷上升,隨之而來的是個人電子數(shù)據(jù)的急劇增長,從檔案學視角來研究對于這些個人數(shù)據(jù)如何歸檔管理和利用成為新的研究領(lǐng)域。本文第一部分就個人數(shù)字檔案的基礎(chǔ)來源進行了闡述。第二部分在互聯(lián)網(wǎng)環(huán)境下確定了歸檔數(shù)據(jù)的基礎(chǔ)上提出了個人數(shù)字檔案歸檔收集和管理的設(shè)想,包括收集標準和范圍、收集方式、個人數(shù)字檔案具體的管理方法。第三部分主要闡釋了個人數(shù)字檔案的利用以及歸檔的意義。最后就個人數(shù)字歸檔存在的問題提出了相應的解決辦法。
[關(guān)鍵詞] 互聯(lián)網(wǎng);個人數(shù)字檔案;歸檔利用
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2018. 13. 079
[中圖分類號] G270.7;G273 [文獻標識碼] A [文章編號] 1673 - 0194(2018)13- 0175- 03
1 概 況
個人數(shù)字檔案顧名思義是個人或者一個家庭在互聯(lián)網(wǎng)環(huán)境活動中所產(chǎn)生的文字或者音視頻等的數(shù)字記載,伴隨著各種電子載體尤其是手機的普及,人們在日常的生活和工作當中自動創(chuàng)造了大量的電子數(shù)據(jù)。這些數(shù)據(jù)對于不同的主題有不同的價值,對于個人而言,參考這些數(shù)據(jù)有助于以后的規(guī)劃和回憶美好人生,對于政府來說,這些數(shù)據(jù)是管理社會的一項基礎(chǔ)參考,對于企業(yè)來講,將這些數(shù)據(jù)整合在一起形成大數(shù)據(jù)并加以分析利用,給企業(yè)帶來利潤,而對于檔案館和圖書館,收集這些數(shù)據(jù)成為必由之路。而隨著網(wǎng)絡大數(shù)據(jù)的出現(xiàn),個人數(shù)字檔案的收集以及保管利用成為新的研究熱點。
2 網(wǎng)絡環(huán)境下個人檔案的歸檔
2.1 網(wǎng)絡環(huán)境下個人數(shù)字內(nèi)容的產(chǎn)生和形成
據(jù)中國互聯(lián)網(wǎng)絡信息中心(CNNIC)2017年8月份發(fā)布的第40次《中國互聯(lián)網(wǎng)絡發(fā)展狀況統(tǒng)計報告》統(tǒng)計表明[http://cnnic.cn/gywm/xwzx/rdxw/201708/t20170804_69449.htm]:
隨著網(wǎng)絡的覆蓋率范圍不斷擴大,網(wǎng)民的數(shù)量也隨之上升,截至 2017 年 6 月,中國網(wǎng)民規(guī)模達 7.51 億。互聯(lián)網(wǎng)普及率為 54.3%,截至 2017 年 6 月,中國手機網(wǎng)民規(guī)模達 7.24 億,較 2016 年底增加 2 830 萬人。網(wǎng)民中使用手機上網(wǎng)人群占比由 2016 年底的 95.1% 提升至 96.3%。如表1所示,每天有龐大的網(wǎng)民規(guī)模在使用著各種各樣的互聯(lián)網(wǎng)應用,產(chǎn)生著海量的應用數(shù)據(jù),而這些數(shù)據(jù)都來自于網(wǎng)民的創(chuàng)造和行為活動的痕跡,那么,對于這些個人數(shù)字內(nèi)容的歸檔就顯得尤為重要。
2.2 收集和管理
2.2.1 收集標準
個人數(shù)字內(nèi)容的形式可以分為圖片、文字、音視頻三大類來歸檔,根據(jù)中國網(wǎng)民各類互聯(lián)網(wǎng)應用的使用率統(tǒng)計可以看出每個人在日常的互聯(lián)網(wǎng)生活中無時無刻不在創(chuàng)造著這些內(nèi)容,其中這三大類數(shù)據(jù)主要呈現(xiàn)形式來自互聯(lián)網(wǎng)中的社交媒體:即時通信、自媒體、筆記等各種互聯(lián)網(wǎng)模式?;ヂ?lián)網(wǎng)當中的網(wǎng)民在創(chuàng)造內(nèi)容的同時將這些內(nèi)容分散存儲在外部設(shè)備和載體以及提供服務的互聯(lián)網(wǎng)公司的服務器上面,其中外部設(shè)備包括了手機內(nèi)存、硬盤、可存儲穿戴設(shè)備、U盤、存儲卡等,各類網(wǎng)盤、云存儲、服務器本身存儲等商家提供可存儲的服務。
在海量的數(shù)據(jù)當中如何才能更好地搜集和保存有價值的信息資源,確定其收集范圍是首要的任務,可以從以下兩方面來確定,首先從個人時間方面來確定,比如個人從出生到死亡的時間軸來確定收集的范圍,在這個范圍內(nèi)按照鑒定標準收集個人一生中創(chuàng)造的互聯(lián)網(wǎng)數(shù)字檔案資源信息。其次根據(jù)個人所處的組織機構(gòu)來確定收集的內(nèi)容范圍,個人在某個機構(gòu)或者公司中所產(chǎn)生的互聯(lián)網(wǎng)數(shù)據(jù)和信息資源根據(jù)個人的存儲需求來存檔,一個人的一生所參加和工作的組織機構(gòu)比較有限,所以根據(jù)組織機構(gòu)存檔會顯得更加清晰可尋。最后在確定收集范圍時,也可以根據(jù)需求采用時間和組織機構(gòu)相結(jié)合來確定存檔范圍,兩者結(jié)合可以更好地根據(jù)收集目的來確定信息資源的時間和空間,使得收集更加地精確和有效。
在實際的歸檔中,首先要鑒定所歸個人數(shù)字文件的價值。鑒定的總原則要從國家、家庭、個人的整體利益出發(fā)。相對于遵循歸檔鑒定原則的機構(gòu)和復雜多樣的個人互聯(lián)網(wǎng)內(nèi)容,在互聯(lián)網(wǎng)環(huán)境下制定個人數(shù)字歸檔原則是不太現(xiàn)實的,但是可以從網(wǎng)民個人和社群整體的角度需求來探索互聯(lián)網(wǎng)環(huán)境下的個人數(shù)字內(nèi)容鑒定歸檔原則即用發(fā)展的全面的創(chuàng)新的觀點來判別個人數(shù)字檔案的價值。相對于個人來說,個人數(shù)據(jù)具有天然的隱私性,保存的個人數(shù)字資源不想成為個人的負擔且在以后的生活中可以被利用和回憶美好的生活,因此歸檔時應從個人對于檔案的記錄、科研等價值的需求來判斷,歸檔鑒定彈性比較大。相對于國家及家庭的整體利益來說,個人互聯(lián)網(wǎng)環(huán)境下的數(shù)據(jù)反映了社會活動的軌跡,是社會文化的一部分,更是家庭檔案乃至社會記憶的重要組成部分,鑒定時應從保留社會文化以及為國家管理活動提供參考和對子孫后代的價值來確定。
其次是具體的收集方式,個人、企業(yè)、檔案館、圖書館之間應該緊跟互聯(lián)網(wǎng)的發(fā)展,將個人有價值的信息資源歸檔。個人的數(shù)據(jù)一般存儲在外部存儲設(shè)備或者互聯(lián)網(wǎng)服務器中,那么個人應該樹立普識的歸檔意識,用戶自己平時及時收集并將這些數(shù)據(jù)適時地按一定規(guī)則保存起來以備后用,企業(yè)現(xiàn)在提供的云存儲等服務也在一定程度上解決了個人存儲的問題,但是在企業(yè)提供這些服務的同時沒有提供個性化的歸檔服務,存儲得到了解決,但是規(guī)范的歸檔存儲沒有得到解決,基于以上問題,企業(yè)可以在云存儲劃歸出一部分存儲空間,而這個空間是專門為網(wǎng)民提供個人數(shù)字資源的歸檔服務。圖書館、檔案館這些機構(gòu)應該利用互聯(lián)網(wǎng)多宣傳,讓網(wǎng)民了解并樂于歸檔,以便利用和回憶美好時光,這些傳統(tǒng)的歸檔機構(gòu)也可以建立自己的服務器來為個人數(shù)字歸檔服務,讓網(wǎng)民放心和方便地存儲自己的個人數(shù)字資源。企業(yè)和檔案館、圖書館可以開展合作,企業(yè)提供支持擴大效益,同時檔案館、圖書館很好地收集個人數(shù)字資源,在新時代互聯(lián)網(wǎng)環(huán)境下完成自己的職能。
2.2.2 管理個人數(shù)字檔案的方法
管理個人數(shù)字檔案首先要將這些原始數(shù)據(jù)分類標引,而元數(shù)據(jù)分類標引的最終目的是方便地查找和利用,因此為元數(shù)據(jù)分類標引是個人數(shù)字檔案歸檔管理和利用的基礎(chǔ)性前提。在建立個人或者家庭數(shù)字檔案目錄中,每個人或者每個家庭的目錄下有按統(tǒng)一命名規(guī)則的文件夾,這種命名規(guī)則如:姓名+時間軸或組織機構(gòu)+分類的標簽文件。對于收集到的個人數(shù)字檔案,分類整理是利用的第一步,為元數(shù)據(jù)添加元素標簽是管理的第二步,這種管理辦法可以制定出一個普遍適從的管理規(guī)則,比如文字元數(shù)據(jù)可以添加“GRWZ”-“個人文字”的標簽,然后在細分類管理,依次類推“GRTP”“GRYS”個人圖片、個人音視頻的元數(shù)據(jù)標簽,個人在歸檔的時候根據(jù)標簽進行分類,上傳到云或者檔案數(shù)據(jù)庫時設(shè)置好元數(shù)據(jù)規(guī)范上傳格式,通過大數(shù)據(jù)技術(shù)自動分析辨別數(shù)據(jù)并上傳。做好這些準備之后就是個人檔案數(shù)據(jù)的實時更新,實時更新和同步個人檔案數(shù)據(jù)庫為今后的查找利用做好數(shù)據(jù)全面性的準備。
分類是整理的核心,好的分類方法可使整理工作事半功倍。對個人數(shù)字檔案進行整理的第一步就是要對個人數(shù)字檔案進行科學的分類,接著對分類好的個人數(shù)字檔案添加元數(shù)據(jù)和標簽,建立個人獨有的方便記錄和記憶的個人數(shù)字檔案目錄,最后一步就是更新和同步。個人數(shù)字檔案經(jīng)過這樣的整理,便于個人的查找檢索,為今后的開發(fā)利用做好準備工作。
3 網(wǎng)絡環(huán)境下個人檔案的利用
隨著時代的進步,每個人都在創(chuàng)造著數(shù)據(jù)資源,如果不加以歸檔或者保存的話這些數(shù)據(jù)將會消失,當今世界數(shù)據(jù)就是資源,是發(fā)展創(chuàng)新的源泉之一。那么對于個人來說歸檔保存這些數(shù)據(jù)會對以后的生活和工作發(fā)揮借鑒作用,或者對其他人有潛在的學習和利用價值也可以說是一份經(jīng)驗借鑒,起到了一定的教育和指導作用。對于保存自己的美好時光來“記錄生活軌跡”讓自身檔案意識逐步提升,留住記憶的同時被家人或者子孫后代記起起到了非常好的作用。相對于個人來說還有一項重要的作用就是原始數(shù)據(jù)的記錄性,個人數(shù)字檔案顧名思義是一種檔案,那么它就會有檔案所具有的真實性、原始性等屬性,如果個人在生活中遇到糾紛或者確定直接負責人時,這些檔案數(shù)據(jù)可以作為直接證據(jù)用它來維護自己的合法權(quán)益及確定責任人!
對于一些學者來說,這些數(shù)據(jù)有著潛在的科研價值。個人總是生活在某個家族當中,那么這些家族成員的個人檔案的匯集就組成了家庭數(shù)字檔案,對于研究家族史的學者來說,這些數(shù)據(jù)就是研究的樣本和目標且這些數(shù)據(jù)是極其豐富和真實的存在,對于科研成果的支撐起到了真實而具有說服性的基礎(chǔ)作用。不僅于此,對于各專業(yè)的學者來說這些個人檔案數(shù)據(jù)都是可以作為研究對象的,比如社會學,可以研究這些數(shù)據(jù)背后所折射出來的社會現(xiàn)象等。因此個人數(shù)字檔案不僅僅是一堆個人數(shù)據(jù),其所包含的科研價值值得學者去研究和發(fā)掘。
對于社會來說,這些數(shù)據(jù)為社會的管理和文化的留存起到了很好的作用。每個人都是社會的組成部分,人離不開社會,社會也離不開人,社會的運行離不開人的管理,那么這些個人檔案數(shù)據(jù)可以為社會管理提供數(shù)據(jù)支撐。國家參考這些個人檔案數(shù)據(jù)可以具有針對性,在制定某項政策,有效實施社會保障和管理,讓這個國家運行更有效率。每個人是文化的承載者也是文化的創(chuàng)造者,個人數(shù)字檔案很好地保存了體現(xiàn)在每個人身上的文化內(nèi)涵。通過形式豐富多樣的元數(shù)據(jù)記錄每個人的軌跡,保存體現(xiàn)在每個人身上的我國各地豐富的個人生活和群體生活以及天南海北悠久而又豐富燦爛的歷史文化,這些檔案記錄將成為文化中國和文化強國的有力支撐,更是個人承擔中國記憶的歷史體現(xiàn)。
4 個人數(shù)字檔案歸檔利用中存在的問題及可行性
4.1 防止互聯(lián)網(wǎng)歸檔信息的泄露
雖然個人數(shù)字信息的歸檔保存了屬于個人或是家族的信息,但是發(fā)生個人信息泄露的事件無時無刻不在我們的身邊發(fā)生著,個人的隱私在互聯(lián)網(wǎng)上也發(fā)生著泄露。個人數(shù)字檔案經(jīng)過若干年后會對社會公眾開放,但是在開放前,個人的數(shù)據(jù)歸檔在檔案館、圖書館的服務器上或是跟這些機構(gòu)合作的企業(yè)的服務器上面,為了保證個人數(shù)據(jù)不被泄露或者被盜取,就要采取相應的措施比如服務器訪問權(quán)限和規(guī)則身份認證的加密,將歸檔的數(shù)據(jù)采取加密水印技術(shù),加強數(shù)據(jù)的雙重保護,防止病毒感染和被盜。在歸檔時讓用戶選擇秘密級別,一些文字或有趣的照片視頻是能讓其他人查閱和分享的,而一些信息是不想讓別人看見的,那么在利用和保存這些信息時應重點做相應的調(diào)整,讓不公開的這些信息訪問權(quán)限級別升級,這樣既可以有效地保護個人的隱私,又很好地將歸檔數(shù)據(jù)加以利用。個人數(shù)字檔案也屬于檔案,受到《檔案法》的保護,為了更加有效地保護數(shù)據(jù),對泄露個人數(shù)字檔案形成威懾,國家和相關(guān)行業(yè)機構(gòu)應著力對用戶個人數(shù)字檔案信息泄露出臺相關(guān)的補充規(guī)定來保護用戶的合法權(quán)益。
4.2 數(shù)據(jù)存續(xù)的長期性和可視性
作為個人數(shù)字檔案,需要以一種有效而又長期保存的環(huán)境保存下來,隨著科技的進步,或許今天先進的存儲技術(shù)在若干年后被淘汰,而這種落后的存儲狀態(tài)下的數(shù)據(jù)沒有有效的設(shè)備方便地利用和讀取這些信息,那么就失去了個人數(shù)字檔案存檔的意義了。要想解決這個問題,首先要對歸檔保存的數(shù)據(jù)分類保存,例如一些檔案需要永久保存的,那么隨著保存技術(shù)的發(fā)展,要適時對這些數(shù)據(jù)進行遷移,以保證數(shù)據(jù)的有效性。其次有些數(shù)據(jù)需要長期的和短期的保存,對于這些數(shù)據(jù)應該采用相應的處理方法,如短期保存的個人數(shù)字檔案,其數(shù)據(jù)本身在上傳時設(shè)置到期自動銷毀功能。隨著長期保存技術(shù)的發(fā)展,信息的加密保存、永久保存和完整安全性讀取方面會越來越成熟,這些問題將會得到很好的解決。
4.3 技術(shù)問題及歸檔意識的培養(yǎng)
個人數(shù)字檔案歸檔過程中首先是要對數(shù)據(jù)進行分類標引,而分類標引不管對于個人還是檔案館、圖書館來說無疑都是工作量巨大的工作。這也導致了用戶個人不愿花大量時間手動去標引自己的數(shù)據(jù),但是不標引的數(shù)據(jù)在今后的查找利用中會帶來諸多不便,這個問題也影響了個人數(shù)字歸檔的積極性。要想解決這個問題,從技術(shù)方面著手解決更加有效率,個人在歸檔時如果將數(shù)據(jù)直接上傳,由智能化的數(shù)據(jù)檢驗和標引系統(tǒng)去完成分類和標引工作然后直接上傳到指定的歸檔位置,既節(jié)省了人力,物力也給歸檔個人帶來智能化的全新體驗。
時代的進步使得人人成為網(wǎng)絡的建設(shè)者和貢獻者,那么產(chǎn)生的這些個人數(shù)據(jù)需要及時地保存和歸檔,歸檔的前提是個人歸檔意識的提升,沒有意識就不能很好地歸檔。檔案館、圖書館以及從事檔案事業(yè)的從業(yè)者應該從自身電子數(shù)據(jù)歸檔意識培養(yǎng)開始,不斷地進行宣傳,如檔案館門戶網(wǎng)站的宣傳,各館的線下宣講,開展各種關(guān)于個人電子檔案歸檔的競賽等來提高個人的歸檔意識。
5 結(jié) 語
個人數(shù)字歸檔是一項長期的工作,而且是勢在必行的工作。本文就個人數(shù)據(jù)的產(chǎn)生以及在這個基礎(chǔ)上的收集、管理、利用提出了可行的設(shè)想,在開展工作的過程中會產(chǎn)生許多問題,本文就個人數(shù)字歸檔產(chǎn)生的問題進行了闡述并提出了有針對性的解決方法。相對于傳統(tǒng)檔案來說,個人數(shù)字檔案是新的檔案領(lǐng)域,隨著信息化和智能化的發(fā)展,這種信息量會不斷增加,我們需要利用新的手段和方法去歸檔和挖掘這些數(shù)字資源,讓個人數(shù)字檔案發(fā)揮其應有的價值來推動整個社會的發(fā)展進步。
主要參考文獻
[1]施明儀.個人數(shù)字檔案存檔研究[J].現(xiàn)代商貿(mào)工業(yè),2018,39(2):80-82.
[2]夏蓮春. 個人檔案保存策略及其實現(xiàn)機制研究[D].合肥:安徽大學,2017.