王 華 王 瑾/浙江省能源集團(tuán)有限公司
馮萍萍/浙江浙能電力股份有限公司蕭山發(fā)電廠
企業(yè)重要業(yè)務(wù)平臺(tái)電子文件歸檔與電子檔案集成利用項(xiàng)目,是浙江省檔案局推薦、國(guó)家檔案局與國(guó)家國(guó)國(guó)家發(fā)展和改革委員會(huì)聯(lián)合發(fā)文批準(zhǔn)的項(xiàng)目,也是浙江省唯一一家列入國(guó)家“企業(yè)電子文件歸檔和電子檔案管理”的第一批試點(diǎn)項(xiàng)目。該項(xiàng)目對(duì)浙能集團(tuán)和全省檔案工作的意義十分重大,得到到國(guó)家檔案局、省政府、省檔案局、浙能集團(tuán)等各方的政策支持與相關(guān)保障。
該項(xiàng)目主要解決浙能集團(tuán)重要業(yè)務(wù)系統(tǒng)中辦公OA系統(tǒng)、合同系統(tǒng)、CAD系統(tǒng)通過(guò)接口與SEAS檔案管理系統(tǒng)的歸檔集成問(wèn)題,著重解決業(yè)務(wù)系統(tǒng)電子文件歸檔與電子檔案管理問(wèn)題,并通過(guò)四性檢測(cè)、CA認(rèn)證等解決電子文件與電子檔案安全性保障問(wèn)題,同步開(kāi)展基于大數(shù)據(jù)技術(shù)的電子檔案開(kāi)發(fā)利用與研究,最終形成可推廣的規(guī)范性文件,以期為集團(tuán)型企業(yè)電子文件歸檔和電子檔案管理的研究與推廣起到示范作用。
合同系統(tǒng)、OA系統(tǒng)、CAD系統(tǒng)與檔案系統(tǒng)的歸檔集成通過(guò)接口方式實(shí)現(xiàn)。在檔案管理系統(tǒng)數(shù)據(jù)歸檔集成中,平臺(tái)針對(duì)結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)的特點(diǎn),分別采用Web Services接口和sFTP接口,其中元數(shù)據(jù)、指令消息、路程數(shù)據(jù)等結(jié)構(gòu)化數(shù)據(jù)使用Web Services接口進(jìn)行交互,電子文件、影像、圖紙等非結(jié)構(gòu)化數(shù)據(jù)使用更為高效和安全的sFTP協(xié)議進(jìn)行傳輸。通過(guò)調(diào)用檔案管理系統(tǒng)提供的Web Services和sFTP接口,數(shù)據(jù)被收集、保存到檔案管理系統(tǒng)中。數(shù)據(jù)交換通過(guò)標(biāo)準(zhǔn)的XML文件格式進(jìn)行交互,實(shí)現(xiàn)業(yè)務(wù)系統(tǒng)電子文件在線(xiàn)歸檔。下面筆者以合同系統(tǒng)為例,描述業(yè)務(wù)系統(tǒng)與檔案系統(tǒng)的歸檔集成。
用戶(hù)在合同管理系統(tǒng)中辦理流程,流程結(jié)束后會(huì)形成一些結(jié)果性文件,用戶(hù)選取需要?dú)w檔的電子文件及元數(shù)據(jù)(XML格式),通過(guò)接口歸檔到檔案管理系統(tǒng)預(yù)歸檔庫(kù),進(jìn)而歸檔到檔案管理系統(tǒng)檔案庫(kù),由檔案管理系統(tǒng)對(duì)電子檔案進(jìn)行管理與利用。
接口技術(shù)開(kāi)發(fā)原則與技術(shù)要求主要包括以下幾點(diǎn):第一,需支持多語(yǔ)言和基于規(guī)范的平臺(tái),不受限于特定的操作系統(tǒng)或硬件平臺(tái);第二,通信方式(訪(fǎng)問(wèn)協(xié)議)需使用國(guó)際標(biāo)準(zhǔn);第三,編碼采用UTF-8編碼傳輸數(shù)據(jù);第四,能支撐高并發(fā)且運(yùn)行穩(wěn)定;第五,需網(wǎng)絡(luò)化,無(wú)需任何插件等。
Web Service使用標(biāo)準(zhǔn)技術(shù),應(yīng)用程序資源在各網(wǎng)絡(luò)上均可用。這是因?yàn)閃eb Service基于HTTP 、XML和SOAP等標(biāo)準(zhǔn)協(xié)議,所以即使用不同語(yǔ)言編寫(xiě)并且在不同操作系統(tǒng)上運(yùn)行,也可以進(jìn)行通信。因此,Web Service適用于網(wǎng)絡(luò)上不同系統(tǒng)之間的通信。
在綜合檔案管理系統(tǒng)中建立具有三層結(jié)構(gòu)的“合同預(yù)歸檔庫(kù)”與“合同檔案庫(kù)”,分別為合同項(xiàng)目級(jí)(相當(dāng)于案卷級(jí))、合同文件級(jí)(項(xiàng)目所包含的文件條目)、合同電子文件級(jí),檔案系統(tǒng)默認(rèn)將合同系統(tǒng)的選定字段信息全部接收,以保證合同檔案信息的完整性。合同系統(tǒng)與檔案系統(tǒng)案卷級(jí)字段對(duì)應(yīng)關(guān)系如下:公司代碼—全宗、合同編號(hào)—檔號(hào)、合同名稱(chēng)—案卷題名、公司名稱(chēng)—立卷單位、公司名稱(chēng)—主要責(zé)任者、相對(duì)方全稱(chēng)—次要責(zé)任者、履行期限—履行期限、簽訂日期—日期等。
電子檔案的四性即真實(shí)性、完整性、可用性和安全性,檔案系統(tǒng)必須具備四性保障的功能。根據(jù)國(guó)家檔案局要求,該項(xiàng)目對(duì)檔案系統(tǒng)進(jìn)行了進(jìn)一步開(kāi)發(fā),著重對(duì)電子文件歸檔的四性保障進(jìn)行有效檢測(cè)。制訂了OA系統(tǒng)、合同系統(tǒng)、CAD系統(tǒng)接口歸檔電子文件元數(shù)據(jù)標(biāo)準(zhǔn),根據(jù)元數(shù)據(jù)項(xiàng)制訂詳細(xì)的四性檢測(cè)項(xiàng)目。
一是真實(shí)性保障。主要通過(guò)IT技術(shù)和管理相結(jié)合的方式,保證電子文件在收集、移交、檢測(cè)、整理和電子檔案保管、利用、遷移、移交進(jìn)館等過(guò)程中操作的不可抵賴(lài)性、數(shù)據(jù)存儲(chǔ)的完整性、用戶(hù)身份的真實(shí)性,保證電子文件和電子檔案信息不被非法更改,并保證電子文件和電子檔案的內(nèi)容、結(jié)構(gòu)和背景信息經(jīng)過(guò)傳輸、遷移等處理后與形成時(shí)的原始狀況相一致。檢測(cè)方式是檢查電子文件的背景信息以及打開(kāi)文件并查看其內(nèi)容,技術(shù)上通過(guò)“數(shù)字簽名”使系統(tǒng)自動(dòng)監(jiān)控和發(fā)現(xiàn)文件是否被修改,并結(jié)合人工方式判斷內(nèi)容是否完整、是否真實(shí)。
二是完整性保障。主要是確保電子文件的內(nèi)容信息、背景信息、結(jié)構(gòu)信息等沒(méi)有缺損。檔案系統(tǒng)檢測(cè)可根據(jù)電子文件歸檔和電子檔案管理要求進(jìn)行設(shè)置和調(diào)整,可自行定義檔案名稱(chēng)、類(lèi)別、編號(hào)、適用范圍等文檔庫(kù)的屬性信息,還可自定義哪些字段可以為空、哪些字段不可為空。管理員根據(jù)不同的檔案門(mén)類(lèi)設(shè)置好相應(yīng)的必輸項(xiàng),系統(tǒng)在接收時(shí)會(huì)進(jìn)行自動(dòng)檢測(cè),并提醒管理員元數(shù)據(jù)是否完整。
三是可用性保障。主要是保障電子文件和電子檔案的長(zhǎng)期保存。一是采用PDF/A的格式作為電子文件存儲(chǔ)格式,通過(guò)格式轉(zhuǎn)換后進(jìn)行數(shù)據(jù)封裝;二是對(duì)各種類(lèi)型電子文件的瀏覽編輯軟件環(huán)境進(jìn)行備份。其檢查主要是檢查電子文件是否具有可理解性和可利用性,包括軟件的完好性、信息的可識(shí)別性、存儲(chǔ)系統(tǒng)的可靠性、軟件的兼容性等,可采用檔案管理員人工檢查結(jié)合軟件系統(tǒng)自動(dòng)檢查的方式進(jìn)行。還要進(jìn)行有效性檢查,即在技術(shù)上判定文件是否可讀并加以提示。
四是安全性保障。主要是對(duì)電子文件的安全性采取保障措施。對(duì)于安全性的檢查主要體現(xiàn)為檢查文件是否感染了病毒,因此在公司網(wǎng)絡(luò)內(nèi)部署查殺病毒軟件是一個(gè)較好的方式。此外,建議由企業(yè)科信部定期給出查殺病毒報(bào)告。
當(dāng)前,企業(yè)已不再局限于對(duì)信息進(jìn)行保存和檢索,而是重視依托新時(shí)代的信息技術(shù)實(shí)現(xiàn)對(duì)信息的分析和加工重組,由此衍生出大數(shù)據(jù)概念。檔案是信息資源的重要組成部分,檔案工作更需要適應(yīng)新時(shí)代社會(huì)的要求,從傳統(tǒng)的“重保管、輕利用”的模式向“重保管更重利用”的模式轉(zhuǎn)變。檔案的“重保管更重利用”模式,是在遵循檔案管理規(guī)范和保管要求的同時(shí),對(duì)檔案進(jìn)行分門(mén)別類(lèi)的開(kāi)發(fā)利用,并作為全新的檔案管理模式,為企業(yè)進(jìn)行大數(shù)據(jù)分析提供必要的決策支持。
盡管目前集團(tuán)檔案數(shù)據(jù)還達(dá)不到大數(shù)據(jù)的規(guī)模,但集團(tuán)所擁有的數(shù)據(jù)來(lái)源廣泛、格式眾多,并且隨著集團(tuán)下屬單位檔案系統(tǒng)的部署,檔案數(shù)據(jù)量快速增長(zhǎng)。在此情形下,集團(tuán)迫切要求對(duì)海量海量檔案數(shù)據(jù)進(jìn)行分析,挖掘其中的信息價(jià)值。該項(xiàng)目除了應(yīng)用大數(shù)據(jù)技術(shù)對(duì)電子檔案信息開(kāi)發(fā)利用進(jìn)行研究、針對(duì)檔案數(shù)據(jù)與不同屬性字段進(jìn)行分組統(tǒng)計(jì)外,還對(duì)檔案數(shù)據(jù)進(jìn)行大數(shù)據(jù)研究和分析,以O(shè)A系統(tǒng)、合同系統(tǒng)文件審批流程中流轉(zhuǎn)速度的快慢、審批所需時(shí)間的多少為研究對(duì)象,通過(guò)對(duì)單個(gè)樣本進(jìn)行分析,以及與整體樣本的平均速度進(jìn)行比較,分析出單個(gè)樣本的工作效率,進(jìn)而分析集團(tuán)的管理效率,從而提高管理效率。
根據(jù)國(guó)家檔案局電子檔案試點(diǎn)項(xiàng)目的要求,對(duì)納入檔案數(shù)據(jù)庫(kù)的歸檔文件實(shí)現(xiàn)數(shù)字簽名與電子簽章數(shù)字認(rèn)證,同時(shí)考慮后期將數(shù)字認(rèn)證在全集團(tuán)進(jìn)行推廣。數(shù)字認(rèn)證能夠滿(mǎn)足對(duì)數(shù)據(jù)的完整性要求,防止數(shù)據(jù)被篡改或抵賴(lài),確保數(shù)據(jù)私密性并實(shí)現(xiàn)身份認(rèn)證,從而保證網(wǎng)上交易數(shù)據(jù)的完整性和可信性。該項(xiàng)目雖然可采用MD5的方法進(jìn)行數(shù)據(jù)真實(shí)性校驗(yàn),但為保證數(shù)據(jù)的真實(shí)性,應(yīng)采用數(shù)字簽名技術(shù)進(jìn)行驗(yàn)證。
該項(xiàng)目鑒于三個(gè)接口系統(tǒng)具有復(fù)雜性,選擇OA辦公系統(tǒng)歸檔到檔案系統(tǒng)的電子文件進(jìn)行跨系統(tǒng)傳輸?shù)臄?shù)字認(rèn)證,主要包括CA認(rèn)證與電子驗(yàn)簽、CA認(rèn)證對(duì)電子簽名與電子簽章的有效性問(wèn)題、電子驗(yàn)簽對(duì)電子文件各種格式的有效性問(wèn)題。CA認(rèn)證應(yīng)用跨系統(tǒng)傳輸,檔案系統(tǒng)接到文件后不再做可視化(改變?cè)次募┨幚?,以避免歸檔后的文件對(duì)CA仍有依賴(lài)。
[1]李向前.論檔案工作中電子文件的“四性”保 障[EB/OL]. http://www.docin.com/p-699637273.html.