吳衛(wèi) 倫鳳梅 宋曉淳 路紅華
摘 要:在大數(shù)據(jù)時(shí)代的來(lái)臨之下,所帶來(lái)的數(shù)據(jù)量極為龐大,生成速度較快,同時(shí)擁有較高的價(jià)值,如今大數(shù)據(jù)的系統(tǒng)已邁向更多的應(yīng)用范圍,進(jìn)行重復(fù)的使用,往較高的方向發(fā)展,并且通過(guò)互聯(lián)網(wǎng)技術(shù)和信息技術(shù)的加強(qiáng),與其進(jìn)行合作,獲取信息的重要性尤為重要,其重要性也較為突出,同時(shí)對(duì)高效檔案的信息的價(jià)值也有明顯提升,本文從大數(shù)據(jù)的特點(diǎn)開(kāi)始,總結(jié)大數(shù)據(jù)環(huán)境下高校檔案信息資源的集成與服務(wù)的主要特點(diǎn)和內(nèi)容。
關(guān)鍵詞:大數(shù)據(jù)時(shí)代;高校檔案信息資源;互聯(lián)網(wǎng)技術(shù);集成與服務(wù)
基金項(xiàng)目:2018年黑龍江省高等院校檔案研究項(xiàng)目“大數(shù)據(jù)環(huán)境下高校檔案信息資源的集成與服務(wù)研究”(項(xiàng)目編號(hào):HGDK2018-14)。
移動(dòng)互聯(lián)網(wǎng)的不斷發(fā)展,對(duì)人們的日常生活帶來(lái)了巨大的便利,大數(shù)據(jù)時(shí)代也便隨之而來(lái)。半個(gè)世紀(jì)以來(lái),整個(gè)全球數(shù)據(jù)總量以每年55%的速度持續(xù)增長(zhǎng),如今80%的數(shù)據(jù)總量則來(lái)源于近幾年。數(shù)據(jù)量增加愈來(lái)愈勇,數(shù)據(jù)規(guī)模已經(jīng)鋪天蓋地,無(wú)法使用常規(guī)的處理方式進(jìn)行處理。在大數(shù)據(jù)時(shí)代的來(lái)臨之下,各個(gè)行業(yè)都激起了大數(shù)據(jù)的巨浪,高校檔案部門(mén)也同樣跟隨著大數(shù)據(jù)時(shí)代的腳步。檔案大數(shù)據(jù)化、大數(shù)據(jù)檔案信息化等一系列聯(lián)想概念也較為廣泛。傳統(tǒng)的信息資源太過(guò)局限性、分散性和社會(huì)對(duì)信息資源的需求便利性、綜合性的沖突逐漸增長(zhǎng),促使信息資源的進(jìn)行合并的理念,逐步被社會(huì)需要。目前檔案信息具有歷史價(jià)值的信息資源,其推動(dòng)了社會(huì)經(jīng)濟(jì)的發(fā)展,成為了社會(huì)發(fā)展的主要?jiǎng)恿?lái)源。當(dāng)前的高校檔案信息管理化建設(shè)主要內(nèi)容就是將檔案信息與大數(shù)據(jù)進(jìn)行結(jié)合,從而為其創(chuàng)建更優(yōu)秀的資源共享平臺(tái)。
1 檔案大數(shù)據(jù)的含義
1.1 何為大數(shù)據(jù)
大數(shù)據(jù)是無(wú)法用現(xiàn)有的軟件工具對(duì)其進(jìn)行提取、存儲(chǔ)、共享、分析和處理的海量的、較為復(fù)雜的數(shù)據(jù)合集。檔案大數(shù)據(jù)是通過(guò)設(shè)計(jì)檔案方面的數(shù)據(jù)和信息規(guī)模大到無(wú)法使用現(xiàn)有軟件工具提取和管理的海量數(shù)據(jù)集合。其特點(diǎn)為數(shù)據(jù)量大,速度快、多變化等,并且需要可擴(kuò)展的存儲(chǔ)介質(zhì)和數(shù)據(jù)分析,以及數(shù)據(jù)處理。同時(shí)大數(shù)據(jù)還具有復(fù)雜性和不確定性,所以在大數(shù)據(jù)的背景下,因此對(duì)數(shù)據(jù)資料進(jìn)行處理和管理有一定的挑戰(zhàn)性。近年來(lái),移動(dòng)互聯(lián)網(wǎng)的不斷發(fā)展,各行業(yè)為了發(fā)展和創(chuàng)新,均將移動(dòng)互聯(lián)網(wǎng)與本身的行業(yè)的實(shí)際情況相互組合,在組合的過(guò)程中,需要長(zhǎng)期使用計(jì)算機(jī)對(duì)大量數(shù)據(jù)菌進(jìn)行存儲(chǔ)、記錄和處理,其涉及到較多的行業(yè),如軍工、教育、房產(chǎn)、建筑、金融等。
1.2 大數(shù)據(jù)存儲(chǔ)方式和存儲(chǔ)意義
在進(jìn)行數(shù)據(jù)存儲(chǔ)的時(shí)候,會(huì)采用較為保險(xiǎn)的方式進(jìn)行操作,將信息轉(zhuǎn)換為簡(jiǎn)單的數(shù)字檔案方便存儲(chǔ)。該方式具有較高的專(zhuān)業(yè)性,需要專(zhuān)業(yè)的人員來(lái)進(jìn)行操作。傳統(tǒng)的檔案存儲(chǔ)方式主要是紙質(zhì)方式存儲(chǔ),信息技術(shù)的進(jìn)步,改變了現(xiàn)在存儲(chǔ)檔案的介質(zhì),如紙質(zhì)、影像、音頻、圖片等。電子檔案的存儲(chǔ)方式通過(guò)采取計(jì)算機(jī)輔助檔案管理從而變得更加便捷和效率高。數(shù)據(jù)的處理可以通過(guò)計(jì)算機(jī)進(jìn)行,檔案的存儲(chǔ)是為了將來(lái)需要時(shí),可進(jìn)行查看和應(yīng)用。計(jì)算機(jī)可以處理較為繁雜的數(shù)據(jù),獲得的數(shù)據(jù)量越多,其應(yīng)用的價(jià)值就越大。數(shù)據(jù)的本身是無(wú)價(jià)的,借助大數(shù)據(jù)對(duì)公司業(yè)務(wù)產(chǎn)生幫助才是主要目的。保存檔案可以提供給相關(guān)人員查看和應(yīng)用。如今大數(shù)據(jù)涌入各種行業(yè),大量的檔案其中涵蓋的是不可估量的價(jià)值,其意義在于擁有較高價(jià)值的數(shù)據(jù)施行專(zhuān)業(yè)化進(jìn)行儲(chǔ)存處理。從大量數(shù)據(jù)中分析用戶(hù)行為則是檔案大數(shù)據(jù)的主要意義,根據(jù)用戶(hù)行為特點(diǎn)對(duì)客戶(hù)的需求進(jìn)行結(jié)合,對(duì)用戶(hù)系統(tǒng)施行針對(duì)性的改善,能夠符合用戶(hù)習(xí)慣,用戶(hù)可方便的查閱到自己想看到的信息。
2 大數(shù)據(jù)環(huán)境下檔案信息的整理和保存
結(jié)構(gòu)化的數(shù)據(jù)可以通過(guò)計(jì)算機(jī)進(jìn)行處理,而檔案存儲(chǔ)的內(nèi)容是由大量不夠統(tǒng)一的結(jié)構(gòu)化數(shù)據(jù),這些數(shù)據(jù)以文檔、錄像、聲音、圖片、圖像和各種交叉錯(cuò)亂的數(shù)據(jù)予以體現(xiàn)。怎樣能夠及時(shí)有效的在大數(shù)據(jù)的環(huán)境下保存這些數(shù)據(jù),則是一項(xiàng)較為艱難的工程。把存量大的數(shù)據(jù)盡量簡(jiǎn)化,把內(nèi)容雜亂的檔案數(shù)據(jù)重新整理歸檔。 對(duì)于檔案大數(shù)據(jù)的存儲(chǔ),要先考慮其數(shù)據(jù)在未來(lái)是否會(huì)出現(xiàn)大規(guī)模的增長(zhǎng),若有此現(xiàn)象發(fā)生的可能,則使用大容量的存儲(chǔ)硬盤(pán)給予存儲(chǔ),以確保有較多的數(shù)據(jù)可以存儲(chǔ),根據(jù)大數(shù)據(jù)的性質(zhì)以及特點(diǎn)設(shè)計(jì)出對(duì)應(yīng)的解決方案,使結(jié)構(gòu)化數(shù)據(jù)為基本的存儲(chǔ)方式能夠?qū)Ψ墙Y(jié)構(gòu)化的數(shù)據(jù)進(jìn)行兼容,可有效對(duì)數(shù)據(jù)進(jìn)行管理。
3 大數(shù)據(jù)環(huán)境下檔案信息的服務(wù)和應(yīng)用
大數(shù)據(jù)環(huán)境下檔案信息資源方式和傳統(tǒng)利用方式有不同之處,不會(huì)以分類(lèi)存儲(chǔ)和簡(jiǎn)單的統(tǒng)計(jì)查詢(xún)形式出現(xiàn),可以通過(guò)專(zhuān)業(yè)的技術(shù)手段,從存儲(chǔ)的數(shù)據(jù)中快速提取重要的信息,并且根據(jù)所提取出的有效信息,對(duì)相應(yīng)的需求進(jìn)行深挖。挖掘出的信息可以滿(mǎn)足不同用戶(hù)的需求,才能體現(xiàn)出檔案大數(shù)據(jù)的精髓。在大數(shù)據(jù)環(huán)境下檔案信息資源的應(yīng)用和服務(wù)為挖掘、智能搜索等方面。
3.1 信息發(fā)現(xiàn)
通過(guò)文本數(shù)據(jù)挖掘,可以對(duì)數(shù)據(jù)縮小查找范圍從而提高查找效率。其發(fā)現(xiàn)方式是要以大量的數(shù)據(jù)中進(jìn)行文本數(shù)據(jù)挖掘。涵蓋人工智能、數(shù)據(jù)統(tǒng)計(jì)、自然語(yǔ)言處理為主要方式,信息抽取后進(jìn)行分類(lèi)、舉例、數(shù)據(jù)壓縮、數(shù)據(jù)處理,以信息訪問(wèn)和知識(shí)發(fā)現(xiàn)為應(yīng)用范圍。文本數(shù)據(jù)發(fā)現(xiàn)的主要目的是,將文本在處理過(guò)程中所產(chǎn)生的高質(zhì)量信息進(jìn)行分類(lèi)、融合、壓縮,最后在文本抽取中的過(guò)程中發(fā)現(xiàn)需要的知識(shí)和信息。
3.2 智能搜索
智能搜索可以分為語(yǔ)言搜索、音頻、視頻內(nèi)容搜索、檔案以人工智能輔助借助于語(yǔ)言搜索,采用語(yǔ)音識(shí)別,在進(jìn)行發(fā)出命令聲音后, 人工智能通過(guò)對(duì)人類(lèi)的聲音和命令中的文字進(jìn)行系統(tǒng)性分析,最后分析得出其含義,并且予以相應(yīng)的反饋;進(jìn)行音頻、視頻內(nèi)容的搜索,可以直接對(duì)計(jì)算機(jī)輸入視頻或音頻,計(jì)算機(jī)進(jìn)行計(jì)算分析后可直接對(duì)音頻或視頻進(jìn)行區(qū)分,并且在數(shù)據(jù)庫(kù)中搜索出相應(yīng)的數(shù)據(jù)。采用智能化輔助分類(lèi)應(yīng)用于高校檔案管理,用戶(hù)所進(jìn)行的搜索歷史信息,則會(huì)記錄下來(lái)并進(jìn)行分類(lèi),通過(guò)重復(fù)的訓(xùn)練,可以有效提升智能輔助分類(lèi)的準(zhǔn)確度,同時(shí)也可以對(duì)用戶(hù)的分類(lèi)表示進(jìn)行有效的幫助。
4 總結(jié)
高校檔案信息管理施行大數(shù)據(jù)管理是必然的趨勢(shì),通過(guò)對(duì)其管理方式的改變可有效提高檔案管理的效率。所有的教育單位機(jī)構(gòu)都將要面對(duì)大數(shù)據(jù)時(shí)代所帶來(lái)的大量多元化數(shù)據(jù)資料,高校檔案管理部門(mén)這種信息量巨大并且較為集中的數(shù)據(jù)管理機(jī)構(gòu),必須要對(duì)數(shù)據(jù)的收集、利用等工作進(jìn)行加強(qiáng)。檔案管理部門(mén),要根據(jù)大數(shù)據(jù)時(shí)代檔案管理模式的發(fā)展需要,從而積極與信息化統(tǒng)計(jì)部門(mén)進(jìn)行密切合作,制定多種有效的數(shù)據(jù)的管理體系,將各行業(yè)產(chǎn)生的數(shù)據(jù)進(jìn)行規(guī)范整理,根據(jù)數(shù)據(jù)的類(lèi)型進(jìn)行分類(lèi),建立數(shù)據(jù)搜索機(jī)制,將高校檔案管理在大數(shù)據(jù)時(shí)代環(huán)境下打好基礎(chǔ)。
參考文獻(xiàn)
[1]吳娜.大數(shù)據(jù)背景下檔案信息資源整合策略探析[J].開(kāi)封教育學(xué)院學(xué)報(bào),2018,38(12):241-242.
[2]楊來(lái)青.大數(shù)據(jù)背景下檔案信息資源挖掘策略與方法研究[J].中國(guó)檔案,2018,538(08):55-56.
[3]顏英利.大數(shù)據(jù)背景下高校教學(xué)資源整合研究[J].中國(guó)成人教育,2018,457(24):39-41.
[4]劉丹.大數(shù)據(jù)時(shí)代高校數(shù)字教學(xué)資源整合對(duì)策研究[J].數(shù)字通信世界,2019,171(03):256.
[5]司國(guó)斌,叢金梅.大數(shù)據(jù)時(shí)代高校教學(xué)模式的改革研究[J].成才之路,2017,(16):18-18.
作者簡(jiǎn)介
吳衛(wèi)(1971-),女,漢族,黑龍江省克東縣,黑龍江省黑河學(xué)院,本科,研究館員,研究方向:檔案管理。