摘 要:隨著社會的發(fā)展及科學(xué)技術(shù)水平的不斷提高,現(xiàn)代化信息技術(shù)得以在各行各業(yè)充分應(yīng)用,高校的檔案管理工作也是如此。利用大數(shù)據(jù)、人工智能等技術(shù)提高檔案管理水平,可直接影響到學(xué)校的建設(shè)質(zhì)量與發(fā)展進(jìn)程,也成為提高辦學(xué)水平與優(yōu)化公共服務(wù)質(zhì)量的重要手段。本文以“基于數(shù)據(jù)挖掘與智能分析的高校檔案管理體系構(gòu)建分析”為題,在發(fā)展意識、平臺建設(shè)、技術(shù)應(yīng)用和安全防護(hù)等方面指出當(dāng)下存在的各種問題及未來發(fā)展的方向,深入探討信息化管理體系的實(shí)踐路徑,以供高校同行參考。
關(guān)鍵詞:信息技術(shù);數(shù)據(jù)挖掘;智能分析;管理體系
隨著新時代科技水平的提高,高校進(jìn)入“互聯(lián)網(wǎng)+智慧校園”的新發(fā)展模式。在檔案管理工作中,通過建設(shè)信息化管理利用平臺,融合多種技術(shù),實(shí)現(xiàn)海量檔案資源信息在線整合、高速流轉(zhuǎn)與高效共享。高校檔案管理部門在工作實(shí)踐中,需要牢固樹立責(zé)任意識,積極創(chuàng)新優(yōu)化管理模式,通過多樣化舉措將檔案信息化管理體系建設(shè)落地落實(shí),為高校檔案事業(yè)的可持續(xù)發(fā)展提供助力。
1 高校檔案管理體系構(gòu)建關(guān)鍵要素分析
1.1 數(shù)據(jù)挖掘技術(shù)內(nèi)涵及功能
數(shù)據(jù)挖掘是基于機(jī)器學(xué)習(xí)與數(shù)據(jù)庫管理的交叉技術(shù)。其主要功能是在數(shù)據(jù)庫技術(shù)的基礎(chǔ)上提取大量數(shù)據(jù)信息,通過機(jī)器學(xué)習(xí)對不完全、大量、模糊的數(shù)據(jù)進(jìn)行深入分析研判,總結(jié)形成具有潛在利用價值的信息集合,達(dá)到高效率、低成本的目的。其應(yīng)用涉及需求導(dǎo)向原則(以系統(tǒng)平臺用戶的需求為主)、數(shù)據(jù)前提原則(有較大數(shù)據(jù)量,解決異構(gòu)數(shù)據(jù)問題)、成本效益原則(量力而行適當(dāng)投入資金成本)和檔案保護(hù)原則(避免使用原始數(shù)據(jù))。
1.2 智能分析技術(shù)內(nèi)涵及功能
人工智能即是所謂的“機(jī)器邏輯”,是一種模仿人的智力,讓計(jì)算機(jī)擁有與人類一樣的思維方式與思考邏輯,從而執(zhí)行相應(yīng)任務(wù)的技術(shù)。其自主學(xué)習(xí)功能來自知識庫,將數(shù)據(jù)信息通過互聯(lián)網(wǎng)進(jìn)行“神經(jīng)傳遞”,實(shí)現(xiàn)自動管理。其應(yīng)用原則有以下幾個方面:一是以數(shù)據(jù)為中心。在檔案管理中將數(shù)據(jù)視為核心資產(chǎn)并進(jìn)行整合共享應(yīng)用,構(gòu)建完整的檔案數(shù)據(jù)生態(tài)系統(tǒng)。二是科學(xué)性原則。檔案的收管存用要遵循客觀規(guī)律,充分考慮檔案信息的本質(zhì)特征,確保信息真實(shí)可靠,具備時效性、準(zhǔn)確性、機(jī)密性、一致性和可檢索性。通過利用人工智能技術(shù)實(shí)現(xiàn)高校檔案的管理流程自動化、智能分類與優(yōu)化及深度價值挖掘,可進(jìn)一步創(chuàng)新檔案管理服務(wù)模式,為高校師生提供更加主動的利用服務(wù),從而提升檔案數(shù)據(jù)豐富性和可用性,彰顯檔案潛在利用價值。
1.3 高校檔案信息化管理體系建設(shè)的必要性及意義
一是緊跟政策導(dǎo)向?!丁笆奈濉比珖鴻n案事業(yè)發(fā)展規(guī)劃》提出,要“深化信息化戰(zhàn)略轉(zhuǎn)型,強(qiáng)化科技和人才支撐”“加快推進(jìn)檔案信息化建設(shè),引領(lǐng)檔案管理現(xiàn)代化”。這標(biāo)志著我國檔案信息化建設(shè)已成為時代潮流,檔案工作領(lǐng)域辦公系統(tǒng)、業(yè)務(wù)系統(tǒng)逐漸向平臺化、移動化、無紙化和電子化邁進(jìn),做到電子文件“應(yīng)歸盡歸”“應(yīng)收盡收”“應(yīng)用盡用”已成為檔案行業(yè)的必答題。二是優(yōu)化檔案體系。一方面保證其完整性與安全性。高校檔案是建校以來教學(xué)、科研、后勤和行政等多種活動的真實(shí)記錄,是學(xué)校歷史與發(fā)展階段的見證。通過將大量的紙質(zhì)類檔案數(shù)字化,可最大程度地確保檔案原件不會在利用過程中被損壞、丟失與非法篡改。另一方面可提升其高效性與價值性。檔案的信息化、平臺化與共享化不僅能夠提升檔案文件檢索速率,使管理者能夠快速精準(zhǔn)定位所需信息,還可通過數(shù)據(jù)分析,為教學(xué)、科研人員的工作決策提供歷史數(shù)據(jù)和經(jīng)驗(yàn)借鑒,提升決策的科學(xué)性和合理性[1]。
2 基于數(shù)據(jù)挖掘與智能分析的高校檔案管理體系構(gòu)建現(xiàn)存的問題
2.1 變革意識有待提升,創(chuàng)新水平較為低下
對于高校而言,檔案詳細(xì)記錄了學(xué)校發(fā)展歷程及各項(xiàng)工作的活動流程、取得的成果。高校檔案不僅是學(xué)校未來發(fā)展的決策依據(jù),還是教職工開展工作的重要參考。在實(shí)際工作中,由于學(xué)校缺乏對全體教職工進(jìn)行檔案重要性的宣傳和教育,一些人員存在重視程度有限,發(fā)展思維存在滯后性與局限性。認(rèn)為檔案管理只是將散落在各部門的紙質(zhì)檔案存放到庫房即可,無需投入較多人力、物力和財(cái)力使其與信息化模式接軌,認(rèn)為檔案的信息化體系建設(shè)與學(xué)校運(yùn)行管理和長效發(fā)展沒有直接聯(lián)系,創(chuàng)新性思維較弱,使得整體工作效率較為緩慢,無形中增加了風(fēng)險(xiǎn)隱患。同時,受思維定式的影響,較多學(xué)校缺乏明確的職責(zé)劃分與清晰的工作流程,組織架構(gòu)存在缺失,導(dǎo)致各部門之間信息傳遞不通暢,檔案資源共享不及時,導(dǎo)致檔案管理工作落實(shí)不到位。
2.2 平臺建設(shè)有待完善,技術(shù)水平較為低下
在大數(shù)據(jù)信息化技術(shù)的應(yīng)用趨勢下,部分高校的檔案管理系統(tǒng)平臺仍存在功能設(shè)計(jì)不規(guī)范、技術(shù)應(yīng)用不熟練、數(shù)據(jù)傳輸較緩慢、文件共享有困難等問題。有的系統(tǒng)平臺僅可提供基本的電子檔案存儲與檢索功能,缺少對海量檔案數(shù)據(jù)的深度信息挖掘與智能語義分析,個性化、智能化管理較為薄弱,頁面設(shè)計(jì)不友好、操作煩瑣、流程審批時間長等問題也使得用戶的實(shí)際體驗(yàn)感大大降低。與此同時,相當(dāng)多高校的檔案管理系統(tǒng)“各自為政”的問題較為嚴(yán)重,沒有與財(cái)務(wù)系統(tǒng)、后勤系統(tǒng)和人力資源系統(tǒng)等平臺實(shí)現(xiàn)對接,使得整體系統(tǒng)集成性較差,平臺兼容性較差,數(shù)據(jù)傳輸性較低,無法將可開放的電子檔案實(shí)現(xiàn)共建共享,影響了檔案自身價值的發(fā)揮。
2.3 應(yīng)用存在技術(shù)瓶頸,用戶體驗(yàn)感有待提升
首先,在高校檔案管理領(lǐng)域雖然數(shù)據(jù)挖掘和人工智能技術(shù)已經(jīng)得到了廣泛應(yīng)用,但實(shí)際效果仍然存在技術(shù)瓶頸,算法仍需繼續(xù)優(yōu)化。有的檔案內(nèi)容識別率不高、處理速度慢等,需要通過自然語言處理辦法、深度學(xué)習(xí)等與數(shù)據(jù)挖掘相關(guān)的先進(jìn)技術(shù)提高OCR識別技術(shù)的準(zhǔn)確性與效率,使用戶更好地理解檔案內(nèi)容。數(shù)據(jù)挖掘技術(shù)語義數(shù)據(jù)存在缺失問題,使得文本數(shù)據(jù)識別率低,文獻(xiàn)加工難以深入內(nèi)部的單元層,在后期檔案利用過程中對后期語義知識組織和語義加工造成影響,無法發(fā)揮數(shù)據(jù)挖掘的真正意義。其次,在人工智能技術(shù)的應(yīng)用過程中,由于在實(shí)踐過程中沒有做到與時俱進(jìn),定期的軟件更新和硬件優(yōu)化力度不夠,技術(shù)應(yīng)用可靠性較差。誤差容忍性存在問題,在高校檔案服務(wù)中存在數(shù)據(jù)質(zhì)量、算法設(shè)計(jì)和模型訓(xùn)練等方面的挑戰(zhàn),用戶可能因?yàn)樨?fù)責(zé)操作界面或復(fù)雜應(yīng)用邏輯而放棄應(yīng)用系統(tǒng)平臺,無法進(jìn)一步提升用戶體驗(yàn)和服務(wù)質(zhì)量。
3 基于數(shù)據(jù)挖掘與智能分析的高校檔案管理體系構(gòu)建優(yōu)化路徑
3.1 多角度提升管理團(tuán)隊(duì)數(shù)字化管理的意識
《中華人民共和國國民經(jīng)濟(jì)和社會發(fā)展第十四個五年規(guī)劃和2035年遠(yuǎn)景目標(biāo)綱要》指出,要以數(shù)字化轉(zhuǎn)型整體驅(qū)動生產(chǎn)方式、生活方式和治理方式變革,對于高校檔案的管理體系建設(shè)而言,轉(zhuǎn)變發(fā)展思想,緊跟時代潮流,實(shí)現(xiàn)檔案資源的數(shù)字化轉(zhuǎn)型、信息化管理及智慧化利用是重中之重。
3.1.1加強(qiáng)宣傳教育。高校要定期召開檔案專題培訓(xùn)研討會,向全體師生和管理人員宣傳檔案管理的政策環(huán)境、發(fā)展方向、重要性及意義,充分認(rèn)識到檔案管理不僅是一項(xiàng)后勤保障工作,還是學(xué)校發(fā)展、提高科研水平并與個人利益息息相關(guān)的基石。也可定期邀請當(dāng)?shù)貦n案行政主管部門的專家舉辦講座,分享檔案管理經(jīng)驗(yàn)與成功案例,提高其重視程度和參與意識,營造適合檔案事業(yè)發(fā)展的環(huán)境。
3.1.2完善組織架構(gòu)。針對檔案管理工作,學(xué)校領(lǐng)導(dǎo)要發(fā)揮主導(dǎo)及統(tǒng)籌作用,將檔案管理納入學(xué)校發(fā)展的戰(zhàn)略規(guī)劃,精細(xì)化地梳理檔案信息化體系構(gòu)建步驟及建設(shè)內(nèi)容。成立領(lǐng)導(dǎo)小組,明確職責(zé)權(quán)限與工作目標(biāo),將學(xué)校相關(guān)部門的力量整合起來,形成齊抓共管的良好局面。
3.2 多舉措優(yōu)化系統(tǒng)平臺信息化管理功能
3.2.1強(qiáng)化學(xué)習(xí)建設(shè)。在高校檔案信息化體系建設(shè)實(shí)踐過程中,學(xué)校領(lǐng)導(dǎo)及管理人員要深入開展行業(yè)調(diào)研和學(xué)習(xí),結(jié)合國家檔案局出臺的《電子文件歸檔與電子檔案管理規(guī)范(GB/T18894-2016)》、《電子檔案單套管理一般要求》《電子檔案移交接收操作規(guī)程》等行業(yè)標(biāo)準(zhǔn),針對高校檔案數(shù)量龐大、內(nèi)容復(fù)雜、分類較多、更新較快和利用較廣等特點(diǎn)及性質(zhì),梳理需求與發(fā)展目標(biāo),通過引入技術(shù)、優(yōu)化流程、規(guī)范業(yè)務(wù)、重構(gòu)體系等手段,不斷提高檔案管理信息化水平。
3.2.2完善智慧系統(tǒng)架構(gòu)。檔案事業(yè)要緊密聯(lián)系智慧校園建設(shè),促進(jìn)檔案管理工作與智慧校園相結(jié)合、相融合,期間要重點(diǎn)建設(shè)完善智慧系統(tǒng)架構(gòu)。一方面,相關(guān)工作人員要積極與系統(tǒng)平臺開發(fā)商溝通,結(jié)合自身工作需求與實(shí)際工作漏洞,在系統(tǒng)架構(gòu)基礎(chǔ)上拓展全新的功能體系,打造符合高校特色的檔案管理工作系統(tǒng),為師生提供個性化服務(wù)。例如,檔案信息管理功能。系統(tǒng)要支持學(xué)生檔案自助查詢,為全校師生提供便捷的錄入界面和數(shù)據(jù)字段,并采取安全機(jī)制保障敏感信息的安全性和保密性。精細(xì)化檢索查詢功能。充分利用數(shù)據(jù)挖掘技術(shù)與智能分析技術(shù),通過關(guān)聯(lián)規(guī)則、回歸分析、時間序列分析、文本挖掘、機(jī)器學(xué)習(xí)、自然語言處理、追蹤檢測和語義分析等技術(shù)手段,挖掘在電子檔案上傳系統(tǒng)的過程中提取關(guān)鍵詞,實(shí)現(xiàn)自動分類,能夠?qū)⒉樵兘Y(jié)果以多種形式呈現(xiàn)給用戶[2]。
3.3 多元化提高數(shù)據(jù)挖掘科學(xué)化應(yīng)用水平
3.3.1全面認(rèn)識數(shù)據(jù)挖掘技術(shù)。常見檔案數(shù)據(jù)挖掘技術(shù)包括分類技術(shù)、聚類技術(shù)和關(guān)聯(lián)技術(shù),一般與檔案數(shù)據(jù)決策、檔案數(shù)據(jù)屬性歸類、檔案數(shù)據(jù)關(guān)聯(lián)等工作密切相關(guān),在實(shí)際檔案數(shù)據(jù)挖掘中應(yīng)用于檔案數(shù)據(jù)的自動化采集、多源數(shù)據(jù)整合、數(shù)據(jù)質(zhì)量控制機(jī)制制定等方面。通過此技術(shù)可實(shí)現(xiàn)對高校檔案全域數(shù)據(jù)庫進(jìn)行深度挖掘分析,發(fā)現(xiàn)潛在信息關(guān)聯(lián)及利用規(guī)律,在為學(xué)校相關(guān)決策提供科學(xué)依據(jù)的同時,也可對海量的數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,更好地促進(jìn)學(xué)校綜合發(fā)展。
3.3.2多元化應(yīng)用數(shù)據(jù)挖掘技術(shù)。對于高校檔案日常管理的技術(shù)應(yīng)用有以下幾個方面。一是基于開源平臺研發(fā)。高校檔案的信息化管理工作的開展可基于Hadoop的開源計(jì)算機(jī)平臺,以MapReduce開源代碼為基礎(chǔ),進(jìn)行檔案大數(shù)據(jù)應(yīng)用程序的開發(fā),數(shù)據(jù)資源處理的規(guī)??蛇_(dá)到1TB以上,可完成高校海量數(shù)據(jù)的挖掘、提取與計(jì)算任務(wù)的切割,從而提高檔案數(shù)據(jù)資源管理效率。二是快速處理復(fù)雜數(shù)據(jù)。高校檔案的信息包括大量半結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù),需要在構(gòu)建成熟的非關(guān)系型數(shù)據(jù)庫的基礎(chǔ)上,運(yùn)用數(shù)據(jù)挖掘技術(shù),提升復(fù)雜信息分析處理效能,可利用NoSQL非關(guān)系型數(shù)據(jù)庫,完成CouchDB、Cassandra等不同類型數(shù)據(jù)信息的儲存,實(shí)現(xiàn)各種數(shù)據(jù)的快速處理,解決了檔案異化結(jié)構(gòu)數(shù)據(jù)的處理問題,為數(shù)據(jù)統(tǒng)籌、數(shù)據(jù)挖掘和數(shù)據(jù)管理提供了解決方案,對今后的共建共享工作提供了一定的優(yōu)勢[3]。
3.4 多渠道促進(jìn)海量數(shù)據(jù)智能化分析與利用
高校檔案種類復(fù)雜、數(shù)量較多、價值豐富,利用人工智能技術(shù)保管、利用好檔案已成為高校未來需要面對的重要難題,需要做到創(chuàng)新日常工作管理模式,加強(qiáng)數(shù)據(jù)隱私安全保護(hù)、提升用戶應(yīng)用服務(wù)的體驗(yàn),采用自然語言處理、人工智能等技術(shù),可以實(shí)現(xiàn)對高校檔案文本的智能化解析,同時輔以人性化用戶頁面設(shè)計(jì),使得管理員及全校師生能夠更加便捷地進(jìn)行查詢與檢索操作。
3.4.1創(chuàng)新“收管存用”四個環(huán)節(jié)。利用人工智能技術(shù)實(shí)現(xiàn)智能采集,一方面,借助終端設(shè)備在線爬取互聯(lián)網(wǎng)資源,實(shí)現(xiàn)原始檔案積累,另一方面對現(xiàn)有檔案文本資料及音視頻檔案轉(zhuǎn)錄文件進(jìn)行統(tǒng)一整合為數(shù)據(jù)庫。實(shí)現(xiàn)智能化管理,通過自然語言處理技術(shù)和監(jiān)督學(xué)習(xí)技術(shù)研發(fā)文本分類器模型,以對師生服務(wù)為目的,對高校檔案進(jìn)行語義級檔案分類,提升檢索定位精準(zhǔn)度。實(shí)現(xiàn)智能化保存,將人工智能模型與高校檔案管理系統(tǒng)平臺進(jìn)行功能融合,對全校師生產(chǎn)生的會計(jì)檔案、科技檔案、教育檔案等進(jìn)行實(shí)時性自動化保存。實(shí)現(xiàn)智能化應(yīng)用,根據(jù)自然語言處理、專家系統(tǒng)、機(jī)器學(xué)習(xí)等技術(shù)實(shí)現(xiàn)部分檔案的個性化與智慧化檢索,并在特定場景下滿足用戶的應(yīng)用需求[4]。
3.4.2完善檔案保護(hù)機(jī)制。高校檔案利用較為頻繁,且人員數(shù)量龐大、身份來源廣泛,在對外服務(wù)環(huán)節(jié)極易出現(xiàn)安全問題。利用人工智能的生物特征識別技術(shù)。例如,人臉識別、指紋識別、虹膜識別,配合漏洞檢測與智能入侵檢測功能,使檔案資源在利用過程中最大限度地進(jìn)行風(fēng)險(xiǎn)預(yù)警、實(shí)時監(jiān)測、權(quán)限限制和防范攻擊,以確保檔案長期安全保存[5]。
結(jié)語
隨著信息化技術(shù)不斷進(jìn)步,各行各業(yè)轉(zhuǎn)型不斷深入,智慧校園建設(shè)已成為教育信息化的最主要路徑,高校檔案管理數(shù)字化轉(zhuǎn)型的重要性也在日益凸顯,對于檔案而言,其信息化體系建設(shè)是一項(xiàng)長期而艱巨的任務(wù),為此,各級高校領(lǐng)導(dǎo)者及管理人員要緊跟時代潮流,認(rèn)清發(fā)展形勢,牢固樹立信息化意識,積極應(yīng)對新任務(wù)和新挑戰(zhàn),充分利用現(xiàn)代化科學(xué)技術(shù)強(qiáng)化自身的檔案管理能力,在思想意識轉(zhuǎn)變、人才引進(jìn)培養(yǎng)、系統(tǒng)平臺設(shè)計(jì)、現(xiàn)代技術(shù)應(yīng)用等方面多重發(fā)力,加強(qiáng)協(xié)同合作、探索發(fā)展新模式,從而推動檔案事業(yè)實(shí)現(xiàn)高質(zhì)量發(fā)展。
參考文獻(xiàn)
[1]余琦.高校檔案信息化安全體系建設(shè)的價值及路徑[J].通訊世界,2024,31(10):40-42.
[2]王忠泰.高校檔案數(shù)字化建設(shè)與信息資源整合研究[J].辦公室業(yè)務(wù),2024(17):28-30.
[3]趙海晶.基于數(shù)據(jù)挖掘技術(shù)的檔案管理系統(tǒng)分析[J].電子技術(shù),2024,53(01):320-322.
[4]張帆.基于人工智能的檔案分類與檢索系統(tǒng)優(yōu)化研究[J].蘭臺世界,2024(11):69-71.
[5]劉洪,王文雯.人工智能在檔案管理中的應(yīng)用研究[J].蘭臺世界,2024(12):35-38.DOI:10.16565/j.cnki.1006-7744.2024.12.10.
作者簡介:黃偉紅(1981—),檔案學(xué)專業(yè)研究生學(xué)歷,任廣西建設(shè)職業(yè)技術(shù)學(xué)院檔案科科長、館員,主要從事廣西高職院校檔案信息化建設(shè)(高校檔案管理系統(tǒng)平臺建設(shè)探索)研究等。