黃若非
大數(shù)據(jù)的“大”不單指多的意思,還有威力大的意思,所謂威力大是指過(guò)去的數(shù)據(jù)雖然是靜態(tài)的一張張、一段段,但是組合起來(lái)也是一段完整的歷史,而現(xiàn)在在智能化時(shí)代,可能還有不同的視頻音頻、甚至是多角度的多媒體,現(xiàn)在的大數(shù)據(jù)不僅可以動(dòng)如影視,還可以立體透視,不僅有延時(shí)信息、還有瞬時(shí)信息、甚至是在線即時(shí)信息,一個(gè)城市,先是重要的建檔立案,再是較為全面建檔立案,現(xiàn)在是大數(shù)據(jù)建檔立案,進(jìn)而逐步讓一座城市完整起來(lái)、動(dòng)起來(lái)、活起來(lái)。
縱觀城市檔案演變的過(guò)程,先是手工記錄和收集城市重點(diǎn)檔案,再是信息化城市檔案,并且不斷擴(kuò)大相應(yīng)的范圍和深度,直到現(xiàn)在較為全面的大數(shù)據(jù)化、智能化、市場(chǎng)化和法治化。一步步都反應(yīng)了其與時(shí)俱進(jìn)的特點(diǎn),其作用越來(lái)越普及、越來(lái)越成為一個(gè)城市管理的靈魂和手足。
檔案能夠讓人類很好地了解過(guò)去、把握現(xiàn)在和預(yù)見(jiàn)未來(lái),并借助過(guò)去這個(gè)杠桿、以及當(dāng)下這個(gè)支點(diǎn)、撬動(dòng)對(duì)未來(lái)的價(jià)值,檔案先后經(jīng)歷手工階段、信息化階段、智能化階段,可以說(shuō)這個(gè)杠桿作用先是局部的、重點(diǎn)的,再是信息化的、較為全面的,現(xiàn)在到了大數(shù)據(jù)時(shí)代,匯集了互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、智聯(lián)網(wǎng)核心內(nèi)容,已經(jīng)可以智能化起來(lái)。
現(xiàn)在大數(shù)據(jù)在采集、儲(chǔ)存、分類、明晰、提取、應(yīng)用上越來(lái)越智能化,越來(lái)越互動(dòng)起來(lái)、越來(lái)越效率效益起來(lái)。因而越來(lái)越具有相應(yīng)的社會(huì)價(jià)值和經(jīng)濟(jì)價(jià)值。當(dāng)然還越來(lái)越具有戰(zhàn)略競(jìng)爭(zhēng)價(jià)值。隨著大數(shù)據(jù)儲(chǔ)存一體或數(shù)算分離,兩種趨勢(shì)都大量出現(xiàn)了,大數(shù)據(jù)把檔案管理賦予了歷史意義和現(xiàn)實(shí)鮮活生命,隨著大數(shù)據(jù)的價(jià)值日新月異,反過(guò)來(lái)推動(dòng)了檔案管理的信息化、全息化、動(dòng)態(tài)化、分布式存儲(chǔ)、智能化,讓延遲檔案和實(shí)時(shí)檔案都能夠發(fā)揮相應(yīng)的價(jià)值和作用,顯然二者的高度互動(dòng),還對(duì)輔助決策甚至自動(dòng)決策具有重要意義。
檔案大數(shù)據(jù)的戰(zhàn)略意義在于對(duì)這些有較高價(jià)值的飽含歷史意義的數(shù)據(jù)進(jìn)行專業(yè)化處理。方法和手段可能不完全一樣,產(chǎn)出的價(jià)值、形態(tài)或許各個(gè)不同,但是檔案大數(shù)據(jù)的普遍意義越來(lái)越突出,檔案大數(shù)據(jù)具有數(shù)據(jù)量巨大、數(shù)據(jù)類型繁多的特征,在手工階段甚至信息化階段其價(jià)值密度低,因?yàn)樘幚硭俣炔粔蚩?,但是在現(xiàn)代網(wǎng)絡(luò)時(shí)代,實(shí)時(shí)、互動(dòng)、網(wǎng)絡(luò)化特征,決定了檔案被賦予了新的生命,新的經(jīng)濟(jì)和戰(zhàn)略價(jià)值,這一方面表現(xiàn)在檔案為政府和企業(yè)提供各種運(yùn)行的依據(jù),從而更好地支持核心生產(chǎn)力與應(yīng)用,另一方面檔案仍對(duì)合規(guī)、電子取證、安全檢驗(yàn)等具有不可替代作用。
過(guò)去,檔案檢索主要依靠手工著錄、卡片檢索,檔案數(shù)據(jù)主要來(lái)源于兩個(gè)方面:各業(yè)務(wù)部門(mén)通過(guò)業(yè)務(wù)系統(tǒng)產(chǎn)生的業(yè)務(wù)數(shù)據(jù)轉(zhuǎn)為檔案數(shù)據(jù);檔案部門(mén)通過(guò)人工填寫(xiě)、錄入、搜集歸類后轉(zhuǎn)為檔案數(shù)據(jù)。信息化下業(yè)務(wù)系統(tǒng)產(chǎn)生的檔案數(shù)據(jù)具有多媒體效果,并且還具有及時(shí)、廣泛、數(shù)據(jù)量大、內(nèi)容繁雜的特點(diǎn)。當(dāng)前信息化、自動(dòng)化的業(yè)務(wù)系統(tǒng)能夠隨時(shí)將業(yè)務(wù)數(shù)據(jù)輸送至檔案部門(mén)存檔,包括OA辦公系統(tǒng)、財(cái)務(wù)管理系統(tǒng)、監(jiān)控監(jiān)視錄像音頻系統(tǒng)等,當(dāng)文件辦畢時(shí),數(shù)據(jù)(文件)可立刻甚至自動(dòng)轉(zhuǎn)為檔案數(shù)據(jù)。在分布式存儲(chǔ)下,智能化檔案開(kāi)發(fā)與利用日益突出,日益具有靈活多樣特點(diǎn)。
不同職能的業(yè)務(wù)部門(mén)產(chǎn)生的檔案更具有深刻性,如種畜檔案、基因檔案、法院卷宗、醫(yī)院病歷、人事檔案、駕駛檔案、城市建筑設(shè)施檔案等,不同的立檔部門(mén)產(chǎn)生不同的業(yè)務(wù)檔案,如城市建設(shè)檔案、房產(chǎn)產(chǎn)證檔案、消防設(shè)備檔案等。日常工作業(yè)務(wù)系統(tǒng)時(shí)刻運(yùn)行時(shí),意味著每時(shí)每刻都會(huì)產(chǎn)生檔案數(shù)據(jù),因此檔案數(shù)據(jù)量會(huì)大得驚人。即便是同一個(gè)業(yè)務(wù)部門(mén)產(chǎn)生檔案數(shù)據(jù),也會(huì)由于檔案門(mén)類、信息歸屬不同,形成的檔案數(shù)據(jù)流不同。檔案管理部門(mén)除了采用業(yè)務(wù)系統(tǒng)收集檔案數(shù)據(jù)以外,還采用人工方式生成檔案數(shù)據(jù)。最常見(jiàn)的是將館藏的實(shí)體檔案通過(guò)數(shù)字化技術(shù)轉(zhuǎn)為檔案數(shù)據(jù),如掃描、拍照、錄像視頻等。
城建檔案中的圖紙(特別是藍(lán)圖)大部分是復(fù)印件,有關(guān)大樓結(jié)構(gòu)、消防通道等都是檔案管理主要內(nèi)容,在工程存在期間,以及后來(lái)的維修、擴(kuò)建期間,這些都需要建檔立案,以便用時(shí)查詢。一般大樓設(shè)計(jì)使用單位、相應(yīng)審批機(jī)構(gòu)、城建檔案館都要分別保存。過(guò)去城建檔案館用大量的人力、物力對(duì)大部分工程圖紙,運(yùn)用原始方法進(jìn)行裝訂、整理、排架、編目,并且進(jìn)行相應(yīng)的分別存檔。后來(lái)經(jīng)過(guò)信息化,以及當(dāng)下的大數(shù)據(jù)化,以便進(jìn)一步充分開(kāi)發(fā)利用,其中有的是線下開(kāi)發(fā)利用,有的是線上開(kāi)發(fā)利用,都越來(lái)越專業(yè)化、市場(chǎng)化、法治化、效率化、效益化。
自從電腦誕生以來(lái),檔案管理的構(gòu)架在電腦文檔中被借鑒,而電腦文檔管理又推動(dòng)檔案管理標(biāo)準(zhǔn)化,二者相互適應(yīng)、共同信息化,從信息化以來(lái)檔案大數(shù)據(jù)給傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)架構(gòu)帶來(lái)了一系列的沖擊和挑戰(zhàn),僅從存儲(chǔ)層面來(lái)審視,倉(cāng)儲(chǔ)的構(gòu)建者不得不面對(duì)來(lái)自兩方面的焦慮:一是數(shù)據(jù)規(guī)模急速增長(zhǎng),現(xiàn)有的共享磁盤(pán)架構(gòu)能否適應(yīng)海量數(shù)據(jù)的存儲(chǔ);二是數(shù)據(jù)結(jié)構(gòu)復(fù)雜多樣,現(xiàn)有的基于結(jié)構(gòu)化數(shù)據(jù)為主體的存儲(chǔ)方案能否兼容無(wú)模式的非結(jié)構(gòu)化數(shù)據(jù)。從現(xiàn)有數(shù)據(jù)庫(kù)存儲(chǔ)架構(gòu)和實(shí)踐研究來(lái)看,一個(gè)大而全的存儲(chǔ)架構(gòu)不能完美地解決大數(shù)據(jù)的存儲(chǔ)。大部分企業(yè)更應(yīng)該偏向于讓不同種類的數(shù)據(jù)存儲(chǔ)在最適合他們的存儲(chǔ)系統(tǒng)里,再將不同類型的數(shù)據(jù)進(jìn)行融合,最后在融合的數(shù)據(jù)基礎(chǔ)上做分析。
2022年國(guó)家最新頒布了東數(shù)西算戰(zhàn)略,其中包括東部較多的行政管理數(shù)據(jù)、城市檔案管理數(shù)據(jù)輸送到西部中部電力資源較為豐富的地區(qū),以便儲(chǔ)存、線下計(jì)算節(jié)約成本、支援西部開(kāi)發(fā),而東部由于電價(jià)較貴、樓宇面積租金較多,適合更多實(shí)時(shí)大數(shù)據(jù)以及實(shí)時(shí)計(jì)算,比如自動(dòng)駕駛、物聯(lián)網(wǎng)下的3D打印、VR和AR等,但是統(tǒng)分、集散都需要把過(guò)往檔案信息以及現(xiàn)實(shí)即時(shí)信息相結(jié)合,根據(jù)需要配套相應(yīng)的速度和數(shù)據(jù),以便各自發(fā)揮最大效率。
現(xiàn)代存儲(chǔ)技術(shù)日新月異,先有芯片的摩爾定律,以及各種新的儲(chǔ)存材料層出不窮,現(xiàn)在各種新的計(jì)算機(jī),比如量子計(jì)算機(jī),由于其采用的是2的X次方的并行計(jì)算,現(xiàn)有計(jì)算機(jī)要上萬(wàn)年才能運(yùn)行完的數(shù)據(jù),一臺(tái)量子計(jì)算機(jī)可能只需幾秒鐘,未來(lái)城市檔案廣覆蓋、深挖潛,那時(shí)量子計(jì)算機(jī)與之配套,整個(gè)城市就真正的動(dòng)起來(lái)、活起來(lái)了,儼然具有了自己的生命。
現(xiàn)在檔案數(shù)字化工作在各個(gè)地方廣泛開(kāi)展,原生電子檔案不斷接收進(jìn)館,未來(lái)幾年檔案信息化甚至實(shí)時(shí)化將得到快速發(fā)展,數(shù)字檔案信息將呈幾何級(jí)增長(zhǎng),形成真正意義上的檔案大數(shù)據(jù)。這就需要從檔案大數(shù)據(jù)的源頭迅速采用新技術(shù)、新手段采集新檔案,把握檔案數(shù)據(jù)“快、廣、大、散、死”的特點(diǎn),變?yōu)閷?shí)時(shí)互動(dòng)、精準(zhǔn)有用,讓城市檔案活起來(lái)、更有價(jià)值起來(lái)甚至具有生命意義起來(lái),得益于城市檔案智能化發(fā)展,未來(lái)城市就真正是一個(gè)智能化城市。