陳漫翔
(廣東海洋大學(xué),廣東 湛江 524088)
所謂個人數(shù)字檔案即以數(shù)字形式記載的個人信息,與傳統(tǒng)的檔案資料不同,其形成主體、管理主體、保管主體、開發(fā)主體及使用主體更具復(fù)雜性[1]。傳統(tǒng)的檔案資料形成主體包括組織機(jī)構(gòu)、企業(yè)單位等,而個人數(shù)字檔案的形成主體必然是個人,檔案的所有權(quán)也屬于個人。社會個體在社會實踐活動中其活動內(nèi)容、過程及結(jié)論必然會形成一系列的原始記錄,且這一原始記錄是已經(jīng)形成的,因此個人數(shù)字檔案體現(xiàn)出社會性、歷史性、確定性及原始性的屬性[2]。個人數(shù)字檔案的管理主體與開發(fā)主體既可以是個人,也可以是經(jīng)過個人授權(quán)的其他機(jī)構(gòu),應(yīng)用主體可以是個人,也可以是國家政府、社會組織、企事業(yè)單位等。此外,個人數(shù)字檔案的保管主體是個人,即使后續(xù)個人數(shù)字檔案保管權(quán)會移交,保管主體發(fā)生了改變,但是開始時仍然保管于個體手中,因此個人數(shù)字檔案的安全性、所有權(quán)都是完整的。
個人數(shù)字檔案的類型包括圖片類文件、文檔資料、視頻文件、音頻文件等,這些文件格式多樣、來源多樣,且都是非結(jié)構(gòu)化數(shù)據(jù)構(gòu)成,因此無法用簡單的分類標(biāo)準(zhǔn)對其進(jìn)行分析[3]。鑒于此,我們可以總結(jié)出數(shù)字檔案的特點如下:首先,對存儲條件要求更高。隨著信息技術(shù)及互聯(lián)網(wǎng)的普及,人們獲得數(shù)據(jù)、產(chǎn)生數(shù)據(jù)的速率越來越高,后續(xù)產(chǎn)生的數(shù)據(jù)會很快淹沒前面的數(shù)據(jù),因此這些數(shù)據(jù)要及時管理、及時保存,且電子數(shù)據(jù)對存儲容量的要求越來越大,視頻、音頻、圖片等文件需要更高的保真度,因此個人數(shù)字檔案的存儲條件要求更高。其次,需要高效的管理工具。傳統(tǒng)紙質(zhì)檔案可以通過合理的手段來控制數(shù)據(jù)量,比如鑒定檔案的應(yīng)用價值大小、設(shè)置特定的保管期限、定期銷毀等,且檔案的分類原則也更容易制定,因此紙質(zhì)檔案的管理相對更加容易[4]。但是個人數(shù)字檔案很難進(jìn)行簡單分類,且檔案管理人員也不可能針對海量的信息進(jìn)行鑒定、分類,因此個人數(shù)字檔案的管理需要高效的管理工具。最后,數(shù)據(jù)量龐大。互聯(lián)網(wǎng)及信息技術(shù)的普及促使個人數(shù)字信息呈爆炸式增長,人們廣泛使用各種數(shù)字設(shè)備、智能終端、存儲載體等生成海量的數(shù)據(jù),包括各種移動終端、電腦設(shè)備、智能穿戴設(shè)備等,個人使用的網(wǎng)絡(luò)也分布十分廣泛,因此個人數(shù)字檔案具有來源廣、種類多。
具體而言,個人數(shù)字檔案的管理要點包括以下幾個方面:
個人數(shù)字檔案的收集包括收集對象、收集來源、收集方式、內(nèi)容價值鑒定等多個環(huán)節(jié)。個人數(shù)字檔案的收集對象包括數(shù)字文件、元數(shù)據(jù)及相關(guān)支持軟件,數(shù)字檔案的收集需要注意文件破損、文件無法識別、文件格式不支持等問題;個人數(shù)字檔案的來源包括個人設(shè)備的檔案數(shù)據(jù)、網(wǎng)絡(luò)環(huán)境中的檔案數(shù)據(jù)、云存儲服務(wù)器中的檔案數(shù)據(jù)等,其中個人設(shè)備包括移動硬盤、智能終端,網(wǎng)絡(luò)環(huán)境中的檔案數(shù)據(jù)包括各種即時通信工具;云存儲服務(wù)器則包括百度云、騰訊云等各種云計算服務(wù)器等,針對不同的數(shù)據(jù)來源要根據(jù)其不同的特點進(jìn)行分類,避免出現(xiàn)使用不當(dāng)導(dǎo)致數(shù)字檔案缺失問題[5]。個人數(shù)字檔案的收集包括手動收集與自動收集,自動收集主要針對網(wǎng)絡(luò)環(huán)境的檔案數(shù)據(jù),剔除沒有應(yīng)用價值的數(shù)據(jù),收藏有價值的信息;手動收集則要提前規(guī)劃好時間及內(nèi)容范圍。個人數(shù)字檔案價值鑒定主要鑒別、判斷檔案的價值,妥善保存具有價值的檔案數(shù)據(jù)。不過鑒別個人數(shù)字檔案的價值以人們的保存目的為主要依據(jù),可以剔除個人主觀認(rèn)為無需保存的數(shù)據(jù),個性化特征比較突出。
個人數(shù)字檔案的管理包括分類、整理、存儲及安全防護(hù)等四個環(huán)節(jié)。
首先個人數(shù)字檔案的分類,可以根據(jù)數(shù)字檔案的收集時間進(jìn)行分類,或者根據(jù)收集方式進(jìn)行分類,再進(jìn)一步根據(jù)檔案的來源、時間、內(nèi)容、形式等再進(jìn)行有層次的區(qū)分。根據(jù)個人數(shù)字檔案特點按照主題進(jìn)行分類,并建立對應(yīng)的文件夾,比如工作檔案、健康檔案等,按照主題分類靈活性更強(qiáng),沒有結(jié)構(gòu)限制,且數(shù)據(jù)查詢及歸納也更方便。注意應(yīng)用過程中注意避免主題詞誤差、用詞不規(guī)范、多主題檔案等問題,以免檔案分類模糊或同一檔案多次分類等問題[6]。具體分類時,按內(nèi)容分類包括工作類、學(xué)習(xí)類、娛樂類、生活類等,工作類包括工作計劃、方案、公文等,學(xué)習(xí)類包括課程資料、論文材料、考試資料等,娛樂類包括游戲、旅游材料、聚會材料等,生活類包括各類生活記錄、個人日志等。根據(jù)個人數(shù)字檔案的時效性與歷史性特征對其按時間分類,比如按年度分類、按時期分類等。按格式分類可以采用兩種分類方法結(jié)合的方式來提高后續(xù)查詢應(yīng)用的便利性,比如按照時間與類型進(jìn)行分類,或者按照時間與內(nèi)容進(jìn)行分類等,甚至可以應(yīng)用三種分類方法相結(jié)合的存儲分類方式,以提高數(shù)據(jù)使用時的搜索效率。
個人數(shù)字檔案整理是檔案管理的難點問題,因為個人數(shù)字檔案的數(shù)據(jù)來源、收集方式、存儲介質(zhì)等各不相同,在整理過程中無法以統(tǒng)一的格式進(jìn)行歸類、整理,再輔助對應(yīng)的原則,比如可以將紙質(zhì)資源轉(zhuǎn)化為數(shù)字圖、數(shù)字文本,建立統(tǒng)一的操作規(guī)范,進(jìn)行檔案的掃描、處理、備份及驗收,避免出現(xiàn)數(shù)據(jù)遺漏或損壞[7]。具體而言,個人數(shù)字檔案的整理可以遵循以下規(guī)則:首先,明確分類方案,個人數(shù)字檔案分類可以根據(jù)數(shù)據(jù)來源、數(shù)據(jù)時間、保管期限、數(shù)據(jù)類型進(jìn)行分級;其次,合理確定件(卷),檔案整理要保持文件材料之間的有機(jī)聯(lián)系,根據(jù)文件數(shù)據(jù)的類型區(qū)分價值,以便于保管與利用,可以根據(jù)內(nèi)容確定個人數(shù)字檔案的件或卷;再次,合理選擇格式,個人數(shù)字檔案整理通常選擇通用格式,可以保證數(shù)據(jù)適用于大多數(shù)計算機(jī)環(huán)境,降低個人數(shù)字檔案的遷移轉(zhuǎn)換成本,便于個人數(shù)字檔案的長期保存;從次,確定元數(shù)據(jù)方案,不同類型的個人數(shù)字檔案對應(yīng)有不同的元數(shù)據(jù)描述方案,包括文件實體、機(jī)構(gòu)人員、業(yè)務(wù)實體、實體關(guān)系等四大類,共88個元數(shù)據(jù)項,實施過程中可以抽取文件實體中部分元素進(jìn)行描述,或者描述核心內(nèi)容,既保證個人數(shù)字檔案的真實性與完整性,又保證數(shù)據(jù)的簡化性;最后,合理確定檔案編號,個人數(shù)字檔案編號要能夠體現(xiàn)出檔案的分類方法,固化整理順序,比如按照來源—年度—保管期限—類型—順序號等進(jìn)行編號,以便于長期管理。
個人數(shù)字檔案存儲方式包括網(wǎng)絡(luò)云存儲、本地存儲、離線存儲、系統(tǒng)存儲等幾種方式,云存儲主要是指網(wǎng)絡(luò)云服務(wù)器,其優(yōu)勢在于操作簡單、存儲空間大,但是云服務(wù)器供應(yīng)商之間可能存在不兼容的問題,且存在個人隱私及安全性問題;本地存儲主要是將數(shù)字檔案數(shù)據(jù)存儲于本地空間,這要求用戶具備一定的計算機(jī)操作技術(shù)及安全意識;離線存儲主要載體有光盤、磁帶,不僅便于擴(kuò)容,而且可以防疫病毒,離線存儲通常用于數(shù)據(jù)備份及恢復(fù),離線存儲出錯率高,且存儲條件高;系統(tǒng)存儲目前我國還屬空白,根據(jù)后續(xù)需進(jìn)一步開發(fā)、利用。
個人數(shù)字檔案安全問題主要來自計算機(jī)設(shè)備的硬件及軟件故障,用戶自身缺乏安全意識且管理制度缺失,因此個人數(shù)字檔案安全管理要做好硬件設(shè)備的維護(hù),提高軟件性能的穩(wěn)定性,做好個人隱私保護(hù);用戶要增強(qiáng)安全意識;國家、政府、信息管理部門要不斷完善個人數(shù)字檔案相關(guān)的法律法規(guī),以更好地維護(hù)個人權(quán)益。
目前個人數(shù)字檔案的主體還是個人本身,因此個人數(shù)字檔案的利用還無法普及,但是目前可知的個人數(shù)字檔案的利用包括以下幾個方面:首先,個人數(shù)字檔案信息資源具有一定的證據(jù)效用。目前我國《民事訴訟法》與《刑事訴訟法》中都有明確規(guī)定,視聽資料、電子數(shù)據(jù)都可以作為證據(jù),比如具有合法性、真實性與關(guān)聯(lián)性的聊天記錄。其次,個人數(shù)字檔案信息資源整合查詢,主要是將大量集散的個人數(shù)字檔案信息集中在一起,消除個人數(shù)字檔案信息孤島,實現(xiàn)數(shù)據(jù)共享最大化。最后,個人數(shù)字檔案信息資源的研究利用,比如可以將社交媒體中的個人數(shù)字檔案作為一種信息資源的補(bǔ)充,或者目前的網(wǎng)絡(luò)文化、熱點事件、流行動態(tài)等,都可以作為學(xué)者研究課題的信息資源。
總之,在信息技術(shù)飛速發(fā)展的今天,以數(shù)字形式記載個人信息的個人數(shù)字檔案是信息社會中的重要內(nèi)容,個人數(shù)字檔案的管理也至關(guān)重要。實際管理過程中,要做好個人數(shù)字檔案的收集、管理與利用工作,尤其是個人數(shù)字檔案的管理,要做好分類、整理、存儲及安全防護(hù)等各個環(huán)節(jié)的管理工作,明確分類方案,根據(jù)數(shù)字檔案的收集時間進(jìn)行分類,或者根據(jù)收集方式進(jìn)行分類,再進(jìn)一步根據(jù)檔案的來源、時間、內(nèi)容、形式等再進(jìn)行有層次的區(qū)分,合理確定件(卷),選擇格式并確定元數(shù)據(jù)方案,確定檔案編號,做好個人數(shù)字檔案管理系統(tǒng)硬件設(shè)備的維護(hù),提高軟件性能的穩(wěn)定性,做好個人隱私保護(hù),以保證個人數(shù)字檔案管理的實效性及安全性。