• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      高校檔案知識圖譜構(gòu)建及系統(tǒng)實(shí)現(xiàn)探析

      2023-09-10 18:23:27張雯君
      蘭臺內(nèi)外 2023年22期
      關(guān)鍵詞:高校檔案知識圖譜

      張雯君

      摘 要:隨著數(shù)字化進(jìn)程的深入,智慧校園的廣泛建設(shè),產(chǎn)生大量形式異構(gòu)、內(nèi)容繁雜的高校數(shù)字資源。高校數(shù)字資源在收集、檢索查詢上的功能缺失,導(dǎo)致檔案關(guān)聯(lián)度差,無法深度開發(fā)資源和信息共享。構(gòu)建一種基于知識圖譜的檔案管理系統(tǒng),解決高校檔案管理過程中知識關(guān)聯(lián)弱,檔案價值挖掘程度低等問題,為高校檔案智能管理提供新的思路。

      關(guān)鍵詞:高校檔案;知識圖譜;檔案系統(tǒng)

      知識圖譜這一概念起源于Google公司提出的“Google Knowledge Graph”,目的是優(yōu)化搜索引擎,用來提供更復(fù)雜的關(guān)聯(lián)信息查找,從語義層面解析用戶的意愿,從而給出更加具有針對性的搜索結(jié)果。高校檔案記錄了學(xué)校在教學(xué)、科研過程中發(fā)生的多種活動,對于學(xué)校的管理和建設(shè)起著重要的作用。將知識圖譜技術(shù)與高校檔案相結(jié)合,有效開發(fā)和利用多種形式的高校檔案資源,從高校檔案數(shù)據(jù)中構(gòu)建高校檔案本體關(guān)聯(lián)知識圖譜,以可視化的形式展示高校檔案,并基于知識圖譜展開有效的知識推理和語義檢索,實(shí)現(xiàn)高校檔案價值增值。

      一、檔案知識圖譜研究應(yīng)用

      隨著人工智能的快速發(fā)展,知識圖譜在檔案學(xué)探索中的運(yùn)用逐漸增多并不斷發(fā)展。參考現(xiàn)有的知識圖譜在檔案學(xué)中的應(yīng)用,可以得到啟發(fā)。例如,利用知識圖譜做關(guān)鍵詞共現(xiàn)分析,得到所有檔案中共同出現(xiàn)的關(guān)鍵詞詞頻,以此研究檔案的熱點(diǎn)內(nèi)容、共同特征等;繪制檔案關(guān)鍵詞共現(xiàn)的時間序列圖譜,展示不同時間段的檔案的熱點(diǎn)或共同特點(diǎn);利用突現(xiàn)詞探測法了解檔案中出現(xiàn)的新內(nèi)容,還可以結(jié)合時區(qū)圖得到一段時間內(nèi)的檔案熱點(diǎn)內(nèi)容,知識圖譜除了應(yīng)用于語義搜索,還被應(yīng)用于推薦系統(tǒng)、輔助決策等方面。

      二、高校檔案知識圖譜構(gòu)建的可行性

      知識圖譜作為大數(shù)據(jù)時代一種可以揭示實(shí)體之間關(guān)系的技術(shù),在知識的推理和語義檢索等方面展示了巨大的能量。能夠?qū)n案信息重新整合,將關(guān)系抽取出來,并利用可視化圖譜展現(xiàn)其系統(tǒng)化、有序化的知識組織。將知識圖譜運(yùn)用在高校檔案管理系統(tǒng)中具有以下優(yōu)勢:

      1.知識圖譜可以實(shí)現(xiàn)信息共享,揭示數(shù)據(jù)之間的關(guān)聯(lián)性

      高校檔案具有數(shù)據(jù)量大、內(nèi)容豐富的特點(diǎn),為了快速挖掘檔案資源信息,知識圖譜可以將相關(guān)聯(lián)的數(shù)據(jù)重新組織成一個網(wǎng)絡(luò)數(shù)據(jù)群,以可視化圖譜的方式展示其知識脈絡(luò)。這樣不僅可以實(shí)現(xiàn)不同資源之間的快速連接,還能夠讓需求者快速獲得檔案信息,使得資源共享服務(wù)得到最大化。

      2.知識圖譜可以提升檔案利用效率

      知識圖譜通過挖掘碎片化的信息、重新組合以及描述發(fā)展進(jìn)程,了解實(shí)物之間的完整關(guān)系。因此,相比于傳統(tǒng)的檔案管理系統(tǒng),知識圖譜可以提高檔案之間的利用率,實(shí)現(xiàn)查詢、檢索自動化,全面展示該領(lǐng)域中各要素的關(guān)聯(lián)情況、發(fā)展情況等。

      3.知識圖譜可以展示檔案數(shù)據(jù)的動態(tài)特征

      高校檔案隨著不同階段的加工往往會表現(xiàn)出動態(tài)的變化特征,知識圖譜的加入可以實(shí)現(xiàn)檔案數(shù)據(jù)的實(shí)時更新,對其開展動態(tài)調(diào)整從而保障檔案的完整性與準(zhǔn)確性。

      相較于其他內(nèi)容的大數(shù)據(jù),高校檔案數(shù)據(jù)記錄真實(shí)的教學(xué)活動和管理建設(shè)工作,經(jīng)過嚴(yán)格的分類,其內(nèi)容的表達(dá)也有嚴(yán)格的規(guī)范,有著較為完整的檔案元數(shù)據(jù)標(biāo)準(zhǔn),為基于知識圖譜的檔案管理系統(tǒng)打下良好的數(shù)據(jù)基礎(chǔ)。目前,從高校檔案管理現(xiàn)狀以及系統(tǒng)需求分析,結(jié)合知識圖譜構(gòu)建過程,以山東建筑大學(xué)檔案為數(shù)據(jù)源,開發(fā)具有智能采集與歸檔、碎片化加工、增強(qiáng)高校檔案資源間關(guān)聯(lián)關(guān)系性能等系統(tǒng),提升高校檔案管理水平,并解決其管理過程中知識關(guān)聯(lián)弱,檔案價值挖掘程度低等問題。

      三、高校知識圖譜構(gòu)建方式和流程

      1.高校知識圖譜構(gòu)建方式

      知識圖譜普遍存在兩種構(gòu)建方式:一是自頂向下的構(gòu)建方式,首要建立圖譜模型,構(gòu)建知識圖譜本體,隨后將實(shí)體及屬性匹配設(shè)計到模式層本體中。自頂向下的方式,是垂直領(lǐng)域知識圖譜常用方式,因難度技術(shù)較低,需要依靠分類體系確定性高的結(jié)構(gòu)化知識庫;二是自底向上的構(gòu)建方式,利用公開的數(shù)據(jù),運(yùn)用知識提取出知識,選擇高質(zhì)量的知識導(dǎo)入知識庫中,并加以組織。自底向上的方式,體系更加完備,具有較高的智能化,適用于非結(jié)構(gòu)化的知識庫。高校檔案知識庫存在大量異構(gòu)數(shù)據(jù),較適用于自底向上的構(gòu)建方式。

      2.高校檔案知識圖譜構(gòu)建流程

      運(yùn)用信息技術(shù)抽取非結(jié)構(gòu)化、半結(jié)構(gòu)化以及結(jié)構(gòu)化數(shù)據(jù)的有效信息形成知識網(wǎng)絡(luò)是高校知識圖譜構(gòu)建的基礎(chǔ)。高校知識圖譜的構(gòu)建過程有三個階段,即知識抽取、知識融合與知識計算。知識抽取,即從高校原始數(shù)據(jù)中提煉出實(shí)體、屬性以及實(shí)體之間的關(guān)系;知識融合是指在完成知識抽取后,對新知識中相同的實(shí)體進(jìn)行整合,或消除具有矛盾和歧義的知識;知識計算的過程就是對新獲取的知識展開篩選評估的過程,經(jīng)過評估合格后的知識補(bǔ)充到知識庫中。

      (1)知識抽取。 知識抽取是高校檔案知識圖譜構(gòu)建的第一步,通過自動化或半自動化的知識抽取技術(shù),從高校檔案原始數(shù)據(jù)中獲得實(shí)體、關(guān)系及屬性等可用知識單元,為高校檔案知識圖譜的構(gòu)建提供知識基礎(chǔ)。

      (2)知識融合。由結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)等多源異構(gòu)數(shù)據(jù)源抽取的知識存在冗余、語義沖突和知識重疊等問題。為了能夠更有效地構(gòu)建知識圖譜,要應(yīng)用知識合并技術(shù)從數(shù)據(jù)模式層融合和數(shù)據(jù)層融合兩方面實(shí)行融合,對知識實(shí)行實(shí)體消歧、沖突檢測、共指消解和實(shí)體整合處理。實(shí)體鏈接為知識融合的關(guān)鍵技術(shù),主要包含實(shí)體消歧和共指消解。分別用于解決一詞多義以及指向同一實(shí)體有不同表述的問題。目前,實(shí)體消歧主要采用聚類法,而共指消解可以使用分類的方法和聚類的方法求解。

      (3)知識計算。經(jīng)過知識抽技術(shù)得到的知識,經(jīng)過知識融合后,生成初步表達(dá)。然而,為了得到結(jié)構(gòu)化、網(wǎng)絡(luò)化的知識網(wǎng)絡(luò),產(chǎn)生更精準(zhǔn)的模型,還需要展開知識計算。首先,知識計算需要構(gòu)建本體,也就是通過人工編輯的方法或由數(shù)據(jù)驅(qū)動機(jī)器的方法構(gòu)建特定領(lǐng)域的本體。其次,開展知識推理,運(yùn)用推理技術(shù)從現(xiàn)有數(shù)據(jù)中獲取新關(guān)聯(lián),完成新知識的補(bǔ)充。知識推理的知識開展質(zhì)量評估,實(shí)現(xiàn)知識可信度的量化,保障知識庫的質(zhì)量。

      四、基于高校檔案知識圖譜的檔案管理系統(tǒng)設(shè)計路徑

      1.國內(nèi)高校檔案管理現(xiàn)狀分析

      通過國內(nèi)外高校檔案管理研究綜述,并調(diào)研山東大學(xué)、濟(jì)南大學(xué)以及山東交通學(xué)院等山東省內(nèi)高校檔案管理現(xiàn)狀,在充分了解高校檔案資源專業(yè)性、綜合性等特點(diǎn)的基礎(chǔ)上,在研究中發(fā)現(xiàn)高校檔案管理經(jīng)過近幾年的發(fā)展,信息化水平有所提升。但在高校檔案管理模式、檔案收集、加工以及存儲與利用、信息共享等方面還存在諸多問題。

      (1)高校檔案管理模式。目前,國內(nèi)高校仍以紙質(zhì)檔案管理為主,相關(guān)檔案管理制度主要適用于傳統(tǒng)檔案管理。檔案信息化制度建設(shè)和技術(shù)建設(shè)方面成果較少。部分高校因信息化管理意識欠缺、經(jīng)費(fèi)不足以及技術(shù)能力薄弱、專業(yè)人員缺乏等問題,尚未開展紙質(zhì)檔案數(shù)字化工作。對于已開展數(shù)字化工作的高校,仍有一半以上數(shù)據(jù)檢索需要靠人工完成,學(xué)生通過自行前往檔案館查閱,信息化還處于較低水平。

      (2)檔案內(nèi)容的完整性。高校檔案管理的第一步是檔案收集,檔案收集的完整性、可靠性和準(zhǔn)確性決定了檔案利用價值。目前,高校檔案收集工作普遍存在檔案收集不當(dāng)、內(nèi)容缺失的問題。主要涉及三個原因,一是檔案收集制度不完善,缺乏有效的監(jiān)督機(jī)制使得檔案未能及時歸檔;二是檔案的來源比較廣泛,分散于各個部門,加大了檔案收集的難度;三是檔案收集流程不規(guī)范,未做到應(yīng)收盡收,存在缺少附件、日期不明確和內(nèi)容缺失等問題。

      (3)檔案的存儲與共享利用。一般來說,高校檔案分散存儲在不同部門,且各部門之間無法相互訪問,各部門之間缺少溝通與聯(lián)系,高校檔案管理存在著分散和多重管理的問題。解決這一問題,需要各類單位、機(jī)構(gòu)、部門建立共享機(jī)制,實(shí)現(xiàn)資源共享。此外,由于檔案存儲不當(dāng),存儲流程細(xì)節(jié)不夠具體,極易造成檔案丟失。電子檔案的存儲會因?yàn)榫哂幸欢ǖ拈_放性而遭到泄露和入侵。目前,各高校的檔案系統(tǒng)還未實(shí)現(xiàn)專業(yè)化與數(shù)字化,檔案之間的調(diào)用與查閱過于煩瑣,無法直接利用。因此,構(gòu)建一個科學(xué)、系統(tǒng)的高校檔案管理系統(tǒng)是必不可少的。

      2.系統(tǒng)技術(shù)支持及框架設(shè)計

      面對海量的異構(gòu)數(shù)據(jù),高校管理者需要從管理軟件中解決檔案的智慧化收集和歸檔等問題。運(yùn)用知識圖譜技術(shù),匯集高校行政、人事、科研、資產(chǎn)和學(xué)生等各類的檔案,從而使之產(chǎn)生關(guān)聯(lián),為高校高質(zhì)量發(fā)展提供檔案數(shù)據(jù)支撐。

      基于知識圖譜構(gòu)建方式的利弊,選擇自下而上的構(gòu)建方式,構(gòu)建高校檔案管理系統(tǒng)。總體架構(gòu)自下而上劃分為數(shù)據(jù)解析層、智能識別層、語義關(guān)聯(lián)層和智能管理層。

      (1)數(shù)據(jù)分析層。數(shù)據(jù)分析層為高校檔案管理系統(tǒng)提供數(shù)據(jù)與收集規(guī)則。由于高校檔案資源分散于各個部門管理,且類型各異,有儲存在數(shù)據(jù)庫的結(jié)構(gòu)化數(shù)據(jù),也有以圖片、文本形式存在的非結(jié)構(gòu)化數(shù)據(jù)。這些檔案沒有經(jīng)過系統(tǒng)處理,加大后期檔案的識別與加工難度,因此,需要在數(shù)據(jù)解析層設(shè)計檔案收集規(guī)則。針對不同格式的數(shù)據(jù)源分別開發(fā)對應(yīng)的解析工具,使用ETL引擎對來源數(shù)據(jù)實(shí)行解析、抽取和結(jié)構(gòu)化處理,保證從各數(shù)據(jù)源采集的數(shù)據(jù)可以統(tǒng)一清洗、規(guī)范、管理和使用,并嚴(yán)格按照統(tǒng)一數(shù)據(jù)標(biāo)準(zhǔn)實(shí)行存儲。

      (2)知識抽取層。在智能識別層主要提取檔案中不同類型的實(shí)體、關(guān)系與屬性值,并用三元組的表示方式揭示各檔案數(shù)據(jù)之間的關(guān)聯(lián)。例如,從結(jié)構(gòu)化數(shù)據(jù)中生成檔案、人員、時間和具體發(fā)生的事情等實(shí)體,并獲取對應(yīng)的屬性值。由于高校檔案數(shù)據(jù)量過大,可利用機(jī)器學(xué)習(xí)方法完成檔案資源關(guān)系的抽取,按照知識圖譜中知識抽取的步驟將這些內(nèi)容存儲在數(shù)據(jù)庫中,并轉(zhuǎn)化為RDF三元組的形式,方便后續(xù)的管理與應(yīng)用。

      (3)知識關(guān)聯(lián)層。語義關(guān)聯(lián)層對抽取出來的信息實(shí)行知識融合和語義豐富化。從多個來源獲取檔案數(shù)據(jù)后,由于某些實(shí)體可能存在多種表達(dá)方式,因此,需要消除矛盾和歧義,并補(bǔ)充其屬性信息。在知識圖譜中,可視化直接提供了高校檔案的直接分析。根據(jù)建立的知識圖譜系統(tǒng)原型,使用相關(guān)的推理引擎對高校檔案中的關(guān)聯(lián)關(guān)系作出合理推理,以便后續(xù)的更新與管理。此外,可以利用文本相似度等方法對檔案中的內(nèi)容作出相似度分析,豐富圖譜中檔案的關(guān)聯(lián)程度和數(shù)據(jù)信息。

      (4)智能管理層。根據(jù)已經(jīng)構(gòu)建好的基于知識圖譜的高校檔案管理系統(tǒng),在智能管理層融合數(shù)據(jù)解析模塊、語義識別模塊和語義推理模塊等。利用檔案數(shù)據(jù)的特性,對知識圖譜中的數(shù)據(jù)開展知識挖掘,形成高校檔案和其他數(shù)據(jù)庫的新關(guān)聯(lián)。此外,在可視化功能上,使用者利用檢索功能對想要查詢的檔案資源進(jìn)行調(diào)動,通過系統(tǒng)內(nèi)部的解析形成個人的檔案知識圖譜。

      3.系統(tǒng)核心功能

      (1)智能化采集與歸檔。目前,高校檔案資源主要包含紙質(zhì)資源與電子資源兩種。其中,紙質(zhì)檔案要利用掃描設(shè)備實(shí)現(xiàn)數(shù)字化。對于不同來源的信息數(shù)據(jù)利用智能化技術(shù)對檔案資源所包含的內(nèi)容展開智能識別、采集,排除無效信息,滿足用戶的查詢需求。

      (2)自動抽取與關(guān)聯(lián)。高校檔案種類多且繁雜,需要運(yùn)用知識圖譜技術(shù)開展知識抽取。通過構(gòu)建實(shí)體、關(guān)系、屬性的RDF三元組,利用實(shí)體抽取辨別實(shí)例數(shù)據(jù)是否被定義,利用關(guān)系抽取分析實(shí)體關(guān)聯(lián)程度,利用屬性抽取采集特定實(shí)體信息。

      (3)語義增強(qiáng)。在傳統(tǒng)的檔案系統(tǒng)中,檔案之間的利用率極低,限制了檔案中真正有價值的信息流動。而基于知識圖譜的高校檔案管理系統(tǒng)可以利用語義技術(shù)促進(jìn)檔案數(shù)據(jù)的關(guān)聯(lián)與利用,將檔案實(shí)行多元化語義關(guān)聯(lián),方便系統(tǒng)管理員智能化組織檔案資源,以增強(qiáng)檔案資源語義性,形成高質(zhì)量的高校檔案知識圖譜,提升檔案管理效率。

      五、高校檔案知識圖譜構(gòu)建思考

      通過開展高校檔案知識圖譜應(yīng)用研究,旨在推動高校檔案管理模式向語義關(guān)聯(lián)化與智能化發(fā)展。構(gòu)建高校檔案知識圖譜及開發(fā)高校檔案系統(tǒng)時,還需要考慮幾個問題:(1)由于現(xiàn)有的知識圖譜繪制軟件較多,選擇合適的繪圖軟件變得很有必要。已有學(xué)者對使用率較高的幾個知識圖譜軟件的功能、優(yōu)勢和缺陷進(jìn)行了對比分析,使用者在選擇時仍要充分了解不同軟件的特性,充分理解其應(yīng)用的主題,并做出最合適的選擇。(2)知識圖譜繪制軟件多數(shù)對中文數(shù)據(jù)的兼容性不強(qiáng),通常需要對中文數(shù)據(jù)展開格式轉(zhuǎn)化。

      參考文獻(xiàn):

      [1]董 偉,朱小梅,徐少同.基于知識圖譜的近10年國際電子政務(wù)研究進(jìn)展分析[J]. 圖書情報工作,2012(13):19-25.

      [2]張 璇,蘇 楠,楊紅崗,等.2000-2011年國際電子政務(wù)的知識圖譜研究——基于Citespace和VOSviewer的計量分析[J].情報雜志,2012,31(12):51-57

      [3]趙范心.基于知識圖譜的檔案知識服務(wù)模式思考[J].辦公室業(yè)務(wù),2022,(13):64-66.

      (作者單位:山東建筑大學(xué))

      猜你喜歡
      高校檔案知識圖譜
      探討高校檔案管理工作的創(chuàng)新策略
      商情(2016年42期)2016-12-23 15:07:57
      淺談信息化背景下的高校檔案服務(wù)
      國內(nèi)圖書館嵌入式服務(wù)研究主題分析
      國內(nèi)外政府信息公開研究的脈絡(luò)、流派與趨勢
      高校檔案信息化建設(shè)存在的問題及有效策略
      以用戶需求為導(dǎo)向的高校檔案利用研究
      青年時代(2016年20期)2016-12-08 17:50:05
      近十五年我國小學(xué)英語教學(xué)研究的熱點(diǎn)、問題及對策
      基于知識圖譜的產(chǎn)業(yè)集群創(chuàng)新績效可視化分析
      智富時代(2016年12期)2016-12-01 16:28:41
      新形勢下高校檔案管理人員素質(zhì)要求
      基于知識圖譜的智慧教育研究熱點(diǎn)與趨勢分析
      绥德县| 崇信县| 密云县| 西峡县| 辽阳县| 垣曲县| 开鲁县| 瑞安市| 瑞金市| 乌拉特后旗| 柞水县| 铁岭县| 闽清县| 长沙市| 石嘴山市| 万州区| 新竹县| 泸溪县| 柘荣县| 定结县| 青海省| 台前县| 凤翔县| 乌拉特前旗| 包头市| 盐亭县| 南阳市| 共和县| 深水埗区| 墨竹工卡县| 武隆县| 乐陵市| 公主岭市| 平远县| 沧源| 廉江市| 射洪县| 金昌市| 陕西省| 会同县| 棋牌|