張 倩(南京藝術(shù)學(xué)院綜合檔案室,江蘇南京,210013)
?
高校檔案物聯(lián)網(wǎng)大數(shù)據(jù)處理平臺(tái)的構(gòu)建方案研究*
張倩
(南京藝術(shù)學(xué)院綜合檔案室,江蘇南京,210013)
[摘要]文章借鑒大數(shù)據(jù)技術(shù)發(fā)展理念和物聯(lián)網(wǎng)環(huán)境建設(shè)的基本原理,通過考察高校檔案物聯(lián)網(wǎng)環(huán)境中的大數(shù)據(jù)源特征和處理流程,試圖探尋物聯(lián)網(wǎng)與大數(shù)據(jù)等處理技術(shù)的“跨界”融合途徑,提出高校檔案物聯(lián)網(wǎng)大數(shù)據(jù)處理平臺(tái)的設(shè)計(jì)重點(diǎn)與主要功能模塊的構(gòu)建方案。
[關(guān)鍵詞]大數(shù)據(jù)高校檔案物聯(lián)網(wǎng)信息系統(tǒng)
[分類號(hào)]G271
隨著信息產(chǎn)業(yè)的飛速發(fā)展,高校檔案業(yè)界即將迎來“檔案Web3.0”時(shí)代。步入Web3.0時(shí)代,在高校檔案物聯(lián)網(wǎng)環(huán)境下,檔案數(shù)據(jù)采集將呈爆炸式增長,特別是檔案大數(shù)據(jù)源的處理和運(yùn)用,將成為創(chuàng)建高校智慧檔案館(室)不可或缺的服務(wù)手段??紤]到現(xiàn)階段大數(shù)據(jù)技術(shù)在高校檔案物聯(lián)網(wǎng)領(lǐng)域應(yīng)用的緊迫性和相對(duì)滯后,本文借鑒大數(shù)據(jù)技術(shù)發(fā)展理念和物聯(lián)網(wǎng)環(huán)境建設(shè)的基本原理,通過考察高校檔案物聯(lián)網(wǎng)環(huán)境中的大數(shù)據(jù)源特征和處理流程,試圖探尋物聯(lián)網(wǎng)與大數(shù)據(jù)等處理技術(shù)的“跨界”融合途徑,提出高校檔案物聯(lián)網(wǎng)大數(shù)據(jù)處理平臺(tái)的設(shè)計(jì)重點(diǎn)與主要功能模塊的構(gòu)建方案。
1.1物聯(lián)網(wǎng)是大數(shù)據(jù)的孕育之母。通過考察可以發(fā)現(xiàn),物聯(lián)網(wǎng)生成的子系統(tǒng)不斷增加,數(shù)據(jù)源規(guī)模日益膨脹,大數(shù)據(jù)由此應(yīng)運(yùn)而生。實(shí)踐還告訴我們,物聯(lián)網(wǎng)世界的本質(zhì)就是數(shù)據(jù)。物聯(lián)網(wǎng)既是數(shù)據(jù)源的“產(chǎn)房”,也是大數(shù)據(jù)的孕育之母。借助物聯(lián)網(wǎng)技術(shù),不僅可使高校檔案物理環(huán)境中的信息實(shí)現(xiàn)數(shù)據(jù)化,而且這些數(shù)據(jù)均具有大數(shù)據(jù)的特征,即:數(shù)據(jù)體量大(Volume)、數(shù)據(jù)處理速度快(Velocity)、數(shù)據(jù)類型繁多(Variety)、數(shù)據(jù)蘊(yùn)藏價(jià)值高(Value),是供高校檔案管理機(jī)構(gòu)開發(fā)增值服務(wù)的豐富“寶藏”[2]。
1.2大數(shù)據(jù)是物聯(lián)網(wǎng)的助力之神。大數(shù)據(jù)技術(shù)提供對(duì)終端設(shè)備的智能化控制和智能化交互,將引領(lǐng)高校檔案物聯(lián)網(wǎng)向智能物聯(lián)網(wǎng)方向發(fā)展,使高校檔案物聯(lián)網(wǎng)擁有更加廣闊的發(fā)展空間。實(shí)踐探索表明,創(chuàng)建具有云計(jì)算功能的大數(shù)據(jù)處理平臺(tái),運(yùn)用大數(shù)據(jù)技術(shù)對(duì)檔案物聯(lián)網(wǎng)生成的數(shù)據(jù)源作采集、存儲(chǔ)、過濾、篩選和可視化處理,既是高校檔案物聯(lián)網(wǎng)建設(shè)的核心任務(wù),也是高校智慧檔案館(室)創(chuàng)新數(shù)據(jù)化運(yùn)作機(jī)制、增強(qiáng)智能化關(guān)聯(lián)與預(yù)測(cè)功能、提升個(gè)性化服務(wù)水平的重要手段。
1.3物聯(lián)網(wǎng)與大數(shù)據(jù)是“聯(lián)姻”之體。物聯(lián)網(wǎng)與云計(jì)算、大數(shù)據(jù)無論在技術(shù)概念上,還是在技術(shù)內(nèi)涵上,都存在著極強(qiáng)的關(guān)聯(lián)性與共生性。若將檔案物聯(lián)網(wǎng)看作是處于前端的傳感器與網(wǎng)絡(luò)設(shè)備,具有云計(jì)算功能的檔案大數(shù)據(jù)處理平臺(tái)則是發(fā)揮核心作用的應(yīng)用系統(tǒng),促進(jìn)三者技術(shù)優(yōu)勢(shì)的融合,是提升高校檔案信息智能化服務(wù)水平的關(guān)鍵所在[3]。因此,高校檔案管理機(jī)構(gòu)在推進(jìn)檔案物聯(lián)網(wǎng)建設(shè)的過程中,不僅要積極引入物聯(lián)網(wǎng)技術(shù),而且要注重與云計(jì)算、大數(shù)據(jù)等處理技術(shù)進(jìn)行“聯(lián)姻”。
2.1檔案物聯(lián)網(wǎng)環(huán)境中大數(shù)據(jù)源的主要特征
(1)數(shù)據(jù)規(guī)模的海量性。海量性(Volume)是大數(shù)據(jù)源的4V特征之一,物聯(lián)網(wǎng)則是最能體現(xiàn)這一特點(diǎn)的應(yīng)用領(lǐng)域。例如,在檔案物聯(lián)網(wǎng)環(huán)境中,每件檔案及其相關(guān)設(shè)備都被附加了可跟蹤其位置的標(biāo)簽或芯片,這些裝置實(shí)時(shí)生成的日數(shù)據(jù)量不僅能以指數(shù)級(jí)增長,而且能創(chuàng)造出眾多的“數(shù)據(jù)?!?。因此,構(gòu)建檔案物聯(lián)網(wǎng)并依托大數(shù)據(jù)技術(shù)對(duì)檔案大數(shù)據(jù)源進(jìn)行收集、存儲(chǔ)、分析處理和應(yīng)用,這既是對(duì)高校檔案管理機(jī)構(gòu)改造傳統(tǒng)管理模式的艱巨挑戰(zhàn),也是跟上Web3.0發(fā)展步伐的重大機(jī)遇。
(2)數(shù)據(jù)處理的高速性。數(shù)據(jù)處理速度(Velocity)是決定物聯(lián)網(wǎng)成敗的重要支撐條件之一,大數(shù)據(jù)分析技術(shù)的最大優(yōu)勢(shì)就在于其能夠快速“提純”出有價(jià)值的信息。例如,在檔案物聯(lián)網(wǎng)環(huán)境中,檔案大數(shù)據(jù)處理平臺(tái)的傳感器、控制器等智能處理設(shè)備每天都會(huì)高速、動(dòng)態(tài)生成大量的數(shù)據(jù),不僅TB級(jí)以上的日數(shù)據(jù)增長量將呈常態(tài)化,而且以流(Stream)的形式產(chǎn)生的實(shí)時(shí)監(jiān)控?cái)?shù)據(jù)規(guī)模量將更為驚人。因此,高校檔案管理機(jī)構(gòu)應(yīng)當(dāng)高度關(guān)注檔案物聯(lián)網(wǎng)建設(shè)的重要性和緊迫性,著力加快云計(jì)算和大數(shù)據(jù)技術(shù)落地進(jìn)程,以利促進(jìn)檔案物聯(lián)網(wǎng)大數(shù)據(jù)源的開發(fā)與利用。
(3)數(shù)據(jù)類型的異構(gòu)性、多態(tài)性和顆粒性?!按髷?shù)據(jù)源”是海量數(shù)據(jù)+復(fù)雜類型的數(shù)據(jù),其數(shù)據(jù)生成方式的多樣化是造成物聯(lián)網(wǎng)大數(shù)據(jù)源極具復(fù)雜性的重要原因之一。例如,在檔案物聯(lián)網(wǎng)環(huán)境中,種類繁多、結(jié)構(gòu)不同、功能各異的傳感器、非接觸式射頻識(shí)別標(biāo)簽等感知設(shè)備生成的文本數(shù)據(jù)和圖像、音頻、視頻等多媒體數(shù)據(jù),既有異構(gòu)的、非結(jié)構(gòu)化和有噪聲的數(shù)據(jù),又有靜態(tài)數(shù)據(jù)和動(dòng)態(tài)數(shù)據(jù)。這些不同類型數(shù)據(jù)構(gòu)成的檔案物聯(lián)網(wǎng)“大數(shù)據(jù)源”,具有明顯的異構(gòu)性、多態(tài)性和顆粒性(數(shù)據(jù)通常帶有位置、時(shí)間、行為和環(huán)境等信息)特征,其對(duì)檔案大數(shù)據(jù)源的處理與開發(fā)利用造成了極大的難度。因此,高校檔案管理機(jī)構(gòu)必須重視檔案物聯(lián)網(wǎng)大數(shù)據(jù)源的處理平臺(tái)建設(shè),尤其要采取將錯(cuò)誤數(shù)據(jù)檢測(cè)與冗余信息處理等方法相結(jié)合的措施,讓非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換成結(jié)構(gòu)化數(shù)據(jù),以優(yōu)化高校檔案物聯(lián)網(wǎng)的大數(shù)據(jù)智能處理機(jī)制。
2.2檔案物聯(lián)網(wǎng)環(huán)境中大數(shù)據(jù)源的處理流程
遵循檔案信息大數(shù)據(jù)“生成、傳輸、處理和應(yīng)用”的四項(xiàng)基本原則,我們可以把高校檔案物聯(lián)網(wǎng)大數(shù)據(jù)處理平臺(tái)的技術(shù)構(gòu)架分為“感知識(shí)別、網(wǎng)絡(luò)樞紐、管理服務(wù)和綜合應(yīng)用”四大層階[4]。這種技術(shù)模型構(gòu)造的高校檔案物聯(lián)網(wǎng),以大數(shù)據(jù)源的集成與應(yīng)用為核心對(duì)象,其處理流程可歸結(jié)為:數(shù)據(jù)采集、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)分析和數(shù)據(jù)應(yīng)用等四大運(yùn)作環(huán)節(jié)。其中,數(shù)據(jù)的采集和存儲(chǔ)是基本功能,數(shù)據(jù)智能化分析和處理是大數(shù)據(jù)技術(shù)的精髓所在。
(1)感知識(shí)別層大數(shù)據(jù)的采集與遴選。
感知識(shí)別層位于物聯(lián)網(wǎng)四階次模型的最底層,是所有上層結(jié)構(gòu)的重要基礎(chǔ)。在這一層階中,其采集的數(shù)據(jù)是檔案物聯(lián)網(wǎng)集成大數(shù)據(jù)源的主要“原料”,后續(xù)各種應(yīng)用都將通過提取存儲(chǔ)在“原料庫”(數(shù)據(jù)庫)中的各類數(shù)據(jù)才能實(shí)現(xiàn)。檔案物聯(lián)網(wǎng)感知識(shí)別層如同人體的皮膚和五官,其作用主要是通過裝置在檔案庫區(qū)環(huán)境中各類物體上的射頻識(shí)別、全球定位系統(tǒng)、傳感器、二維碼等信息傳感設(shè)備(“觸手”),對(duì)檔案數(shù)據(jù)進(jìn)行采集、識(shí)別、篩選和存儲(chǔ),并由檔案物理環(huán)境“全息式感知系統(tǒng)”來構(gòu)建大數(shù)據(jù)源集成庫(智能數(shù)據(jù)庫)。
在檔案物聯(lián)網(wǎng)環(huán)境中,采集到的數(shù)據(jù)因其具有異構(gòu)性、多態(tài)性與顆粒性等特征,其中很可能存在較多受過干擾的錯(cuò)誤數(shù)據(jù),必須依靠大數(shù)據(jù)技術(shù)對(duì)原始數(shù)據(jù)進(jìn)行“去偽存真”和“去粗取精”。感知識(shí)別層的遴選流程與措施:一是對(duì)采集的異源、異構(gòu)數(shù)據(jù)進(jìn)行識(shí)別分類;二是對(duì)噪聲數(shù)據(jù)進(jìn)行去噪處理;三是對(duì)數(shù)據(jù)設(shè)置時(shí)空標(biāo)志;四是與歷史數(shù)據(jù)進(jìn)行比對(duì);五是建立大數(shù)據(jù)資源存儲(chǔ)庫。
(2)網(wǎng)絡(luò)樞紐層大數(shù)據(jù)的傳輸與交互。
網(wǎng)絡(luò)樞紐層在檔案物聯(lián)網(wǎng)四層模型中的主要功能是:“鏈接”感知識(shí)別層和管理服務(wù)層。這一層階如同人體的神經(jīng)中樞和大腦,其作用主要是:通過數(shù)據(jù)接入技術(shù)(包括個(gè)人網(wǎng)、局域網(wǎng)、廣域網(wǎng)等傳遞網(wǎng)絡(luò)的融合),將下層(感知識(shí)別)經(jīng)過加工處理的數(shù)據(jù)高效、穩(wěn)定、安全地調(diào)度輸送到上層(管理服務(wù)),并由數(shù)據(jù)交互功能模塊構(gòu)建“智能交互”的檔案大數(shù)據(jù)源共享系統(tǒng)。需要指出的是:大寬帶是處理極端高速關(guān)鍵數(shù)據(jù)的基本要求,也是實(shí)現(xiàn)高效消化和處理大型數(shù)據(jù)集的基礎(chǔ)[4]。因此,對(duì)于構(gòu)建“智能交互”的檔案大數(shù)據(jù)源共享系統(tǒng)而言,首先要確保帶寬能夠滿足數(shù)據(jù)高速流動(dòng)的要求。此外,高校檔案物聯(lián)網(wǎng)感知識(shí)別層的節(jié)點(diǎn)眾多,如果直接將實(shí)時(shí)采集的海量感知數(shù)據(jù)傳輸至綜合應(yīng)用層,不僅會(huì)占用數(shù)據(jù)資源庫,而且會(huì)導(dǎo)致網(wǎng)絡(luò)擁塞甚至癱瘓。因而,采用基于云計(jì)算的分布式系統(tǒng)作為檔案物聯(lián)網(wǎng)大數(shù)據(jù)源的基礎(chǔ)架構(gòu),可為網(wǎng)絡(luò)樞紐層提供足夠的數(shù)據(jù)傳輸與存儲(chǔ)能力,進(jìn)而實(shí)現(xiàn)高校檔案數(shù)據(jù)“物物相連”的智能交互之目的。
(3)管理服務(wù)層大數(shù)據(jù)的組織與整合。
管理服務(wù)層位于感知識(shí)別層和網(wǎng)絡(luò)樞紐層之上、綜合應(yīng)用層之下,是檔案物聯(lián)網(wǎng)大數(shù)據(jù)處理平臺(tái)進(jìn)行智慧管理的“數(shù)據(jù)資源供應(yīng)站”。檔案物聯(lián)網(wǎng)感知識(shí)別層生成的海量數(shù)據(jù),經(jīng)過網(wǎng)絡(luò)樞紐層傳輸匯聚起來后,需在管理服務(wù)層進(jìn)行組織與整合方可利用。因而,管理服務(wù)層承擔(dān)的主要功能是:應(yīng)用數(shù)據(jù)檢索、數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)等大數(shù)據(jù)處理技術(shù),對(duì)下層生成并傳輸過來的海量數(shù)據(jù)進(jìn)行組織與整合(有針對(duì)性地進(jìn)行數(shù)據(jù)挖掘、實(shí)時(shí)分析、模型預(yù)測(cè)等),并通過提供智能檢索手段來便利數(shù)據(jù)的有效挖掘與利用。需要強(qiáng)調(diào)的是,將大規(guī)模動(dòng)態(tài)且可能是模棱兩可的數(shù)據(jù)高效、可靠地組織與整合起來,并能導(dǎo)出可理解的內(nèi)容,這是建立高校檔案物聯(lián)網(wǎng)的要?jiǎng)?wù)之一。
(4)綜合應(yīng)用層大數(shù)據(jù)的可視化與智能化。
無論采用任何技術(shù),應(yīng)用是決定其成敗的關(guān)鍵。只有有應(yīng)用需求的數(shù)據(jù)才是有價(jià)值的數(shù)據(jù),只有生成服務(wù)模式各異的多樣性數(shù)據(jù)應(yīng)用才是高校檔案物聯(lián)網(wǎng)大數(shù)據(jù)源的最終價(jià)值體現(xiàn)。綜合應(yīng)用層處于檔案物聯(lián)網(wǎng)四階次模型中的最上層,是提供檔案大數(shù)據(jù)服務(wù)的“數(shù)據(jù)應(yīng)用指揮部”。這一層的核心功能有二:一是將管理服務(wù)層提煉出來的數(shù)據(jù)結(jié)果,進(jìn)行可視化處理;二是建立多樣性應(yīng)用模式,提供智能化應(yīng)用。即運(yùn)用可視化技術(shù)以圖文并茂的方式輸出分析與預(yù)測(cè)的數(shù)據(jù)結(jié)果,并由大數(shù)據(jù)的匹配機(jī)制提供智能化應(yīng)用。值得指出的是,構(gòu)建高校檔案物聯(lián)網(wǎng),實(shí)現(xiàn)檔案大數(shù)據(jù)源應(yīng)用的可視化與智能化,這既是推進(jìn)高校檔案管理手段轉(zhuǎn)型升級(jí)的內(nèi)在要求,也是創(chuàng)建高校智慧檔案館(室)的明智選擇。
3.1設(shè)計(jì)重點(diǎn)一:創(chuàng)建檔案文件智能追溯模塊。
在傳統(tǒng)的文書處理模式下,檔案文件從生成到存檔或銷毀的各個(gè)環(huán)節(jié)都需要人工參與記錄,檔案管理部門因缺乏獲得文件流轉(zhuǎn)過程的實(shí)時(shí)信息,故而無法做到對(duì)每份文件的實(shí)時(shí)監(jiān)控與管理,即使收到了記錄資料,在時(shí)間上往往也存在延遲,且對(duì)出現(xiàn)的誤差更是無法及時(shí)追溯,嚴(yán)重影響到歸檔文件的真實(shí)性、完整性和有效性。解決這一難題的出路何在?
筆者通過深入考察和研究,提出的建議方案是:在高校檔案物聯(lián)網(wǎng)大數(shù)據(jù)處理平臺(tái)中建立“檔案文件智能追溯模塊”。即應(yīng)用非接觸式射頻識(shí)別、近場通信、二維碼等物聯(lián)網(wǎng)技術(shù),將每一份(件)實(shí)體檔案都“植入”電子標(biāo)簽或芯片,檔案文件智能追溯系統(tǒng)就可實(shí)現(xiàn)“一檔一碼”的精細(xì)化檔案質(zhì)量控制和檔案大數(shù)據(jù)源的開發(fā)與利用。
在高校檔案物聯(lián)網(wǎng)大數(shù)據(jù)處理平臺(tái)中建立“檔案文件智能追溯模塊”后,傳統(tǒng)的檔案文件從生成到存檔或銷毀的各個(gè)環(huán)節(jié)的信息生成及其生命周期管理(ILM)模式將被徹底顛覆,不僅數(shù)據(jù)化檔案文件在每個(gè)環(huán)節(jié)上產(chǎn)生的實(shí)時(shí)信息都可自動(dòng)寫入標(biāo)簽或芯片之中,而且檔案文件智能追溯系統(tǒng)可隨時(shí)監(jiān)測(cè)、定位、追蹤數(shù)據(jù)化檔案文件在各個(gè)節(jié)點(diǎn)的流轉(zhuǎn)情況,并可全程跟蹤每份數(shù)據(jù)化檔案文件的去向。值得一提的是,檔案文件智能追溯系統(tǒng)除了具有接收檔案文件實(shí)時(shí)與精準(zhǔn)的優(yōu)點(diǎn),還可提前控制檔案的數(shù)量與形態(tài),有利于降低或規(guī)避意外風(fēng)險(xiǎn)。
3.2設(shè)計(jì)重點(diǎn)二:創(chuàng)建檔案倉儲(chǔ)智能管理模塊
面對(duì)與日俱增的實(shí)體檔案,特別是在海量數(shù)據(jù)化檔案的壓力之下,高校檔案管理機(jī)構(gòu)如何找到實(shí)體檔案與海量數(shù)據(jù)化檔案實(shí)時(shí)、高效、安全的對(duì)接捷徑?
筆者通過深入考察和研究,提出的建議方案是:借鑒倉儲(chǔ)管理(Warehouse Management)的理念與方法,在高校檔案物聯(lián)網(wǎng)大數(shù)據(jù)處理平臺(tái)中建立“檔案倉儲(chǔ)智能管理模塊”。
鑒于現(xiàn)代高校檔案倉儲(chǔ)管理的目的不僅是保管,更多是利用,對(duì)倉儲(chǔ)管理的重點(diǎn)也不再僅僅著眼于檔案保管的安全性,更多關(guān)注的是如何提高倉儲(chǔ)運(yùn)作的效率與效益,因此,高校檔案管理機(jī)構(gòu)應(yīng)根據(jù)檔案倉儲(chǔ)業(yè)務(wù)的核心內(nèi)容,為檔案物聯(lián)網(wǎng)大數(shù)據(jù)處理平臺(tái)的“檔案倉儲(chǔ)智能管理模塊”設(shè)置如下技術(shù)支持功能:
一是檔案出入庫的智能作業(yè)。在高校檔案物聯(lián)網(wǎng)大數(shù)據(jù)處理平臺(tái)中,應(yīng)借助RFID、NFC、二維碼等物聯(lián)網(wǎng)技術(shù)來創(chuàng)建“檔案倉儲(chǔ)智能管理模塊”,讓檔案物聯(lián)網(wǎng)大數(shù)據(jù)處理平臺(tái)在無需人工物理接觸實(shí)體檔案的情況下,就可做到“感知”全庫檔案的種類、數(shù)量以及儲(chǔ)位等詳細(xì)的屬性信息,以達(dá)到實(shí)體檔案出入庫智能作業(yè)之目的。
二是檔案統(tǒng)計(jì)與盤點(diǎn)的智能作業(yè)。在高校檔案物聯(lián)網(wǎng)大數(shù)據(jù)處理平臺(tái)中建立“檔案倉儲(chǔ)智能管理模塊”后,可將RFID標(biāo)簽等感知設(shè)備安裝在庫房智能密集架上,檔案管理人員只需手持“讀寫器”走過智能密集架,檔案物聯(lián)網(wǎng)大數(shù)據(jù)處理平臺(tái)就可通過倉儲(chǔ)智能管理系統(tǒng)在幾十米的范圍內(nèi)精準(zhǔn)測(cè)定實(shí)體檔案的位置、類別、保管期限等屬性信息,且可將采集的實(shí)體檔案數(shù)據(jù)通過“讀寫器”與管控平臺(tái)對(duì)接,自動(dòng)記錄和告知檔案管理人員有關(guān)實(shí)體檔案丟失或放錯(cuò)位置等方面的詳細(xì)信息,并迅速完成庫房實(shí)體檔案的統(tǒng)計(jì)與盤點(diǎn)作業(yè)。
三是檔案在線利用的智能作業(yè)。在高校檔案物聯(lián)網(wǎng)大數(shù)據(jù)處理平臺(tái)中建立“檔案倉儲(chǔ)智能管理模塊”后,附有電子標(biāo)簽或芯片的實(shí)體檔案被放置在智能集成管理架上,其所放物理位置的感知編碼與檔案物聯(lián)網(wǎng)大數(shù)據(jù)處理平臺(tái)中的庫位編碼信息相一致,因此,運(yùn)用庫位感知編碼技術(shù),檔案物聯(lián)網(wǎng)大數(shù)據(jù)處理平臺(tái)不僅可通過倉儲(chǔ)智能管理系統(tǒng)快速鎖定實(shí)體檔案,而且能實(shí)現(xiàn)在線辦理自助借出與歸還的智能作業(yè),特別是檔案被查詢和利用過程中的所有移動(dòng)路徑,都會(huì)被自動(dòng)詳細(xì)記錄在標(biāo)簽或芯片之中。此外,檔案物聯(lián)網(wǎng)大數(shù)據(jù)處理平臺(tái)還可通過對(duì)倉儲(chǔ)智能管理系統(tǒng)中相關(guān)歷史數(shù)據(jù)的分析,提出優(yōu)化庫房布局和實(shí)體檔案科學(xué)排列的建議方案,并可預(yù)測(cè)用戶借閱行為,以有針對(duì)性地研發(fā)可增值的檔案產(chǎn)品和服務(wù)。
3.3設(shè)計(jì)重點(diǎn)三:創(chuàng)建檔案環(huán)保智能監(jiān)控模塊
筆者研究發(fā)現(xiàn),將物聯(lián)網(wǎng)技術(shù)應(yīng)用于環(huán)境監(jiān)測(cè)領(lǐng)域,不僅是最早提出、最為普及的先進(jìn)模式,而且這項(xiàng)技術(shù)的智能化水平已達(dá)到較高程度。因此,應(yīng)用以傳感網(wǎng)為代表的環(huán)保監(jiān)控技術(shù),在高校檔案物聯(lián)網(wǎng)大數(shù)據(jù)處理平臺(tái)中建立“檔案環(huán)保智能監(jiān)控模塊”,既可使高校檔案庫區(qū)環(huán)境監(jiān)測(cè)盡早獲得成熟技術(shù)的支持與保障,又可依據(jù)管控平臺(tái)全天候、大規(guī)模、連續(xù)性的實(shí)時(shí)監(jiān)測(cè)結(jié)果來不斷完善處置檔案環(huán)境變化所需的應(yīng)對(duì)預(yù)案。
例如,對(duì)溫濕度控制,檔案物聯(lián)網(wǎng)大數(shù)據(jù)處理平臺(tái)可通過環(huán)保智能監(jiān)控系統(tǒng)和感知節(jié)點(diǎn)部署的“智能恒溫器”,不間斷地測(cè)量檔案庫房和展廳內(nèi)各個(gè)區(qū)域的溫濕度,自動(dòng)制定溫濕度設(shè)定的最佳預(yù)案,并指導(dǎo)“智能恒溫器”根據(jù)需要自動(dòng)調(diào)整溫濕度;檔案管理人員則只需用智能手機(jī)的相關(guān)APP就能監(jiān)控全局。應(yīng)用這一技術(shù),既可徹底擺脫人工每日查看溫濕度計(jì)進(jìn)行記錄的繁瑣勞作,又可有效地避免人為因素造成的誤差或判斷失誤。此外,檔案物聯(lián)網(wǎng)大數(shù)據(jù)處理平臺(tái)對(duì)環(huán)保智能監(jiān)控系統(tǒng)實(shí)時(shí)采集的全方位(7×24小時(shí))監(jiān)測(cè)數(shù)據(jù),可以進(jìn)行大數(shù)據(jù)智能分析,分析環(huán)境質(zhì)量發(fā)展趨勢(shì)及其變化規(guī)律,生成各類可視化統(tǒng)計(jì)圖表,按需發(fā)布監(jiān)測(cè)結(jié)果。
3.4設(shè)計(jì)重點(diǎn)四:創(chuàng)建檔案設(shè)備智能監(jiān)控模塊
確保檔案管理機(jī)構(gòu)設(shè)備的安全運(yùn)作,也是一項(xiàng)不可輕視的重要工作。近幾年,高校檔案管理機(jī)構(gòu)購置的現(xiàn)代化設(shè)備迅速增多,依靠人工方式記錄并統(tǒng)計(jì)這些設(shè)備的運(yùn)轉(zhuǎn)及維修養(yǎng)護(hù)信息,不僅需要耗費(fèi)大量的精力,而且不可能做到實(shí)時(shí)、精確。
筆者通過研究提出的建議方案是:引入物聯(lián)網(wǎng)技術(shù),在高校檔案物聯(lián)網(wǎng)大數(shù)據(jù)處理平臺(tái)中建立“檔案設(shè)備智能監(jiān)控模塊”。目前,這一技術(shù)的運(yùn)用,已在許多領(lǐng)域廣為普及且簡便易行。即:只需檔案管理人員在每臺(tái)(件)設(shè)備上都裝上感知標(biāo)簽或芯片,檔案設(shè)備智能監(jiān)控系統(tǒng)就可立即鎖定設(shè)備的安放位置、工作性能、使用狀態(tài)等,并可隨時(shí)提供監(jiān)控的運(yùn)行參數(shù)。
檔案設(shè)備智能監(jiān)控模塊的核心作用在于:通過實(shí)時(shí)監(jiān)測(cè)特別是對(duì)運(yùn)行參數(shù)的統(tǒng)計(jì)分析,可進(jìn)一步理解并掌握設(shè)備的運(yùn)行規(guī)律,進(jìn)而提供以下技術(shù)支持功能:一是可以依據(jù)設(shè)備運(yùn)行產(chǎn)生的大數(shù)據(jù),將其工作性能調(diào)整到最佳運(yùn)行狀態(tài);二是可以提出設(shè)備合理調(diào)配的使用方案,最大化地提高資產(chǎn)利用效率;三是可以及時(shí)獲知設(shè)備部件的故障點(diǎn),迅速準(zhǔn)確地通知管理人員進(jìn)行維修;四是可以科學(xué)安排設(shè)備的養(yǎng)護(hù),及時(shí)更換老化的設(shè)備。
3.5設(shè)計(jì)重點(diǎn)之五:創(chuàng)建檔案數(shù)據(jù)信息流智能預(yù)警模塊
與傳統(tǒng)的人工安全防范措施相比,檔案物聯(lián)網(wǎng)大數(shù)據(jù)處理平臺(tái)依托感知、識(shí)別、通信、定位等先進(jìn)技術(shù),對(duì)高校檔案數(shù)據(jù)信息流的安全管控將更加及時(shí)有效,特別是綜合防范能力將大為提高。只要為實(shí)體檔案及其存放設(shè)施(設(shè)備)安置的“傳感器”設(shè)定標(biāo)準(zhǔn)參數(shù)并啟動(dòng)實(shí)時(shí)監(jiān)控,一旦有某項(xiàng)數(shù)值超標(biāo),檔案數(shù)據(jù)信息流智能預(yù)警系統(tǒng)就可立即發(fā)出警告信號(hào),還可自動(dòng)實(shí)施應(yīng)急預(yù)案設(shè)定的安全措施。
筆者認(rèn)為,在高校檔案物聯(lián)網(wǎng)大數(shù)據(jù)處理平臺(tái)中建立檔案數(shù)據(jù)信息流智能預(yù)警模塊,依托其“大數(shù)據(jù)高速處理引擎”進(jìn)行安防監(jiān)控預(yù)警分析,不僅僅對(duì)檔案信息具有可靠的安防預(yù)警作用,還可對(duì)高校檔案物聯(lián)網(wǎng)環(huán)境中大數(shù)據(jù)源進(jìn)行深層次開發(fā)與應(yīng)用。即運(yùn)用采集的數(shù)據(jù)資源,創(chuàng)建“高校檔案物聯(lián)網(wǎng)大數(shù)據(jù)預(yù)警信息庫”,并依托歷史數(shù)據(jù)與實(shí)時(shí)數(shù)據(jù)的全方位分析比較機(jī)制,構(gòu)建自動(dòng)刪除重復(fù)數(shù)據(jù)、重點(diǎn)保存和分析突發(fā)性異常數(shù)據(jù)等智能化的功能,有利于挖掘其更重要的預(yù)測(cè)預(yù)警作用。例如,通過對(duì)高校檔案物聯(lián)網(wǎng)大數(shù)據(jù)預(yù)警信息庫的開發(fā)與應(yīng)用,可以深入剖析大規(guī)模的網(wǎng)絡(luò)數(shù)據(jù)外流流量,并對(duì)出現(xiàn)反常態(tài)的數(shù)據(jù)外流流量(指向此前未知的目標(biāo),可能就是數(shù)據(jù)外泄的信號(hào))進(jìn)行預(yù)測(cè)預(yù)警。
關(guān)注IT技術(shù)發(fā)展,積極學(xué)習(xí)和應(yīng)用計(jì)算機(jī)、互聯(lián)網(wǎng)等IT領(lǐng)域的科技成果,盡快承接物聯(lián)網(wǎng)、云計(jì)算和大數(shù)據(jù)等新技術(shù)在高校檔案領(lǐng)域落地,既是創(chuàng)建高校智慧檔案館(室)的內(nèi)在要求和重大機(jī)遇,也是推動(dòng)高校檔案服務(wù)業(yè)態(tài)轉(zhuǎn)型升級(jí)的發(fā)展方向和有效之舉。毋庸諱言,我國的高校智慧檔案館(室)建設(shè)尚面臨著知識(shí)儲(chǔ)備、物質(zhì)條件等方面的挑戰(zhàn)與制約。但是,筆者深信在不久的未來,傳統(tǒng)型高校檔案館(室)將被塑造成為集建筑物自動(dòng)化(BA)、通信自動(dòng)化(CA)、辦公自動(dòng)化(OA)、安全保衛(wèi)自動(dòng)化(SAS)、消防自動(dòng)化(FAS)等多功能于一體的“智慧殿堂”,極具人性化的舒適環(huán)境和智能服務(wù)的功能,成為人們流連忘返的上佳去處。
*本文為2015年度江蘇省檔案局科技項(xiàng)目“高校檔案大數(shù)據(jù)智能處理平臺(tái)的構(gòu)建方案研究”(項(xiàng)目編號(hào):2015-18)研究成果之一。
參考文獻(xiàn)
[1]朗為民.大話物聯(lián)網(wǎng)[M].北京:人民郵電出版社,2011:40.
[2]鮑亮,李倩.實(shí)戰(zhàn)大數(shù)據(jù)[M].清華大學(xué)出版社,2014:100.
[3]張禮立.大數(shù)據(jù)時(shí)代的云計(jì)算敏捷紅利[M].北京:清華大學(xué)出版社,2013:17.
[4]郎為民.漫話大數(shù)據(jù)[M].北京:人民郵電出版社,2014:23.
張倩,女,南京大學(xué)檔案學(xué)碩士,南京藝術(shù)學(xué)院綜合檔案室主任,副研究館員。主要研究方向?yàn)闄n案信息化建設(shè)。
Research on the Construction Scheme of IOT Big Data Archival Processing Platform in Colleges and Universities
Zhang Qian
(Comprehensive Archives Office of Nanjing University of the Arts,Jiangsu,Nanjing,210013)
Abstract:Referring to the principle of IOT environment construction and the idea of the development of big data technology,this paper investigates big data source characteristics and treatment process of University Archives in the environment of Internet of things,and attempts to explore the approach of IOT and big data processing techniques of "crossover" fusion and put forward the design of key and the main function module of processing platform for big data of Environment of Internet of things.
Keywords:Big data;University Archives;Internet of things;Information System
[作者簡介]