郭肖肖,李雪山,李俊奇,李子林,劉慶猛
(中國鐵道科學(xué)研究院集團(tuán)有限公司 科學(xué)技術(shù)信息研究所,北京 100081)
機(jī)構(gòu)知識庫是機(jī)構(gòu)實(shí)現(xiàn)知識管理的平臺,主要針對機(jī)構(gòu)內(nèi)部產(chǎn)生的或外部獲取的專門知識進(jìn)行系統(tǒng)化收集和長期保存,避免知識資產(chǎn)流失,促進(jìn)其持續(xù)共享和傳播利用。機(jī)構(gòu)知識庫自產(chǎn)生起就引發(fā)了研究與建設(shè)熱潮,目前已形成多種建設(shè)類型,包括機(jī)構(gòu)單獨(dú)成立的機(jī)構(gòu)知識庫,如中國科學(xué)院機(jī)構(gòu)知識網(wǎng)格、西安交通大學(xué)機(jī)構(gòu)知識門戶等;多個(gè)機(jī)構(gòu)共同建設(shè)的機(jī)構(gòu)知識庫,如中國高校機(jī)構(gòu)知識庫聯(lián)盟[1];國家級的機(jī)構(gòu)知識庫,如荷蘭的DARE 項(xiàng)目[2]、澳大利亞的ARROW 項(xiàng)目[3]、日本機(jī)構(gòu)知識庫[4-5]等。多種類型的機(jī)構(gòu)知識庫促進(jìn)了從單個(gè)機(jī)構(gòu)到國家層面知識存儲(chǔ)共享的發(fā)展[6]。
機(jī)構(gòu)知識庫的快速發(fā)展豐富了相關(guān)領(lǐng)域的研究和實(shí)踐,也為更多機(jī)構(gòu)建設(shè)機(jī)構(gòu)知識庫提供了經(jīng)驗(yàn)[7]。國內(nèi)高校(如北京大學(xué)、西安交通大學(xué))、科研院所(如中國科學(xué)院、中國農(nóng)業(yè)科學(xué)院)等率先建立了機(jī)構(gòu)知識庫系統(tǒng),用于知識成果存儲(chǔ)及交流共享。隨著數(shù)字化轉(zhuǎn)型及數(shù)智化時(shí)代的發(fā)展,機(jī)構(gòu)知識庫逐漸向科學(xué)數(shù)據(jù)管理和知識增值服務(wù)拓展[8]。由于學(xué)科建設(shè)、人員配備、管理機(jī)制等因素,綜合性大學(xué)、學(xué)術(shù)水平領(lǐng)先的科研院所機(jī)構(gòu)知識庫建設(shè)工作進(jìn)展較快,而鐵路類高校和科研院所機(jī)構(gòu)知識庫建設(shè)工作相對滯后。鐵路行業(yè)涵蓋“車、機(jī)、工、電、輛”多個(gè)專業(yè),涉及基礎(chǔ)科學(xué)、工程科技、信息科技、經(jīng)濟(jì)管理等多個(gè)學(xué)科領(lǐng)域,一項(xiàng)工作的開展往往需要多個(gè)專業(yè)、部門共同協(xié)作完成。然而,目前機(jī)構(gòu)知識大多分散在各部門、項(xiàng)目組、成員手中,尚未有統(tǒng)一的知識平臺將各類知識統(tǒng)一存儲(chǔ)與交流共享,在遇到部門職能變化、撤銷、合并或部門員工離職、退休等情況時(shí),可能導(dǎo)致知識流失,影響工作開展。建立鐵路行業(yè)機(jī)構(gòu)知識保存與共享交流系統(tǒng),及時(shí)將形成的知識進(jìn)行存儲(chǔ)管理和共享利用,對于保存機(jī)構(gòu)知識資產(chǎn)、促進(jìn)機(jī)構(gòu)內(nèi)溝通和科研協(xié)作交流、提高科研效率、營造人才發(fā)展的氛圍和機(jī)制、提升機(jī)構(gòu)知識管理能力及擴(kuò)大機(jī)構(gòu)在領(lǐng)域內(nèi)的影響力具有重要價(jià)值。鑒于此,本文結(jié)合鐵路行業(yè)機(jī)構(gòu)知識特點(diǎn)和需求,設(shè)計(jì)了鐵路行業(yè)機(jī)構(gòu)知識保存與共享交流系統(tǒng),為后續(xù)開展機(jī)構(gòu)知識存儲(chǔ)與利用提供支持平臺。
DSpace 是一個(gè)較成熟的模塊化開源軟件,采用高度耦合的模塊化功能設(shè)計(jì)方法,可根據(jù)需要定制界面和功能[9]。鐵路行業(yè)機(jī)構(gòu)知識保存與共享交流系統(tǒng)基于Dspace 進(jìn)行二次開發(fā),采用Spring 技術(shù)框架、VUE 前端框架及Java、Typescript 語言進(jìn)行開發(fā)。
在安全方面,本系統(tǒng)建立了有效的安全管理機(jī)制,從物理安全、網(wǎng)絡(luò)安全、系統(tǒng)安全、應(yīng)用安全等方面進(jìn)行約束。采用Nginx 作為中間件,用于HTTPS 解密、負(fù)載均衡及安全防護(hù),提高本系統(tǒng)的穩(wěn)定性與安全性,依托權(quán)限管理和備份機(jī)制實(shí)現(xiàn)數(shù)據(jù)安全。在應(yīng)用集成方面,本系統(tǒng)可對外提供Rest API 訪問接口,實(shí)現(xiàn)與OA 系統(tǒng)、科研管理系統(tǒng)及其他內(nèi)容管理系統(tǒng)的數(shù)據(jù)交互。系統(tǒng)架構(gòu)如圖1 所示。
圖1 鐵路行業(yè)機(jī)構(gòu)知識保存與共享交流系統(tǒng)架構(gòu)
1.1.1 物理層
包括網(wǎng)絡(luò)設(shè)備和客戶終端,實(shí)現(xiàn)本系統(tǒng)的網(wǎng)絡(luò)部署和終端訪問。
1.1.2 數(shù)據(jù)層
采用開源關(guān)系型數(shù)據(jù)庫PostgreSQL 存儲(chǔ)數(shù)據(jù),通過ORM、JDBC、MyBatis 等與業(yè)務(wù)邏輯層交互數(shù)據(jù)請求。數(shù)據(jù)類型包括結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),如論文、報(bào)告、專利、標(biāo)準(zhǔn)、獎(jiǎng)勵(lì)成果、圖片、音視頻等,用于滿足機(jī)構(gòu)成員各類知識成果的存儲(chǔ)需求。
采用Solr 提供內(nèi)容檢索服務(wù),減少高頻數(shù)據(jù)對數(shù)據(jù)庫的直接訪問,提升本系統(tǒng)性能。
1.1.3 業(yè)務(wù)邏輯層
核心服務(wù)層,向上層提供服務(wù),以實(shí)現(xiàn)各類應(yīng)用功能。主要包括用戶注冊及登錄、成果提交、在線瀏覽及下載、信息檢索與導(dǎo)航、權(quán)限管理、用戶及用戶組管理、模板定制、批量導(dǎo)入導(dǎo)出、系統(tǒng)管理、成果統(tǒng)計(jì)、評論交流、審核管理等模塊。
1.1.4 應(yīng)用層
面向用戶層次,采用Servlet/JSP 容器(如Tomcat web 應(yīng)用服務(wù)器)與下層通信,前端基于Vue3、Element Plus 和Node 等技術(shù)進(jìn)行開發(fā),實(shí)現(xiàn)用戶交互及模板渲染等功能。根據(jù)部署方式的不同,用戶可通過互聯(lián)網(wǎng)、機(jī)構(gòu)局域網(wǎng)進(jìn)行訪問。用戶可分為匿名訪客、注冊用戶及管理用戶,主要模塊包括用戶中心、導(dǎo)航/瀏覽/檢索、數(shù)據(jù)管理、成果統(tǒng)計(jì)及后臺管理,根據(jù)用戶權(quán)限的不同,展示的模塊有所區(qū)別。
鐵路行業(yè)機(jī)構(gòu)知識保存與共享交流系統(tǒng)提供用戶及權(quán)限管理、數(shù)據(jù)管理、檢索/瀏覽/導(dǎo)航、統(tǒng)計(jì)分析、內(nèi)容組織管理、系統(tǒng)管理等功能[10],功能架構(gòu)如圖2 所示。
圖2 鐵路行業(yè)機(jī)構(gòu)知識保存與共享交流系統(tǒng)功能架構(gòu)
1.2.1 用戶及權(quán)限管理
(1)用戶管理:提供用戶注冊、登錄、個(gè)人空間管理、用戶增刪改、批量導(dǎo)入導(dǎo)出等功能。
(2)用戶組管理:通過將用戶加入某一用戶組,對某組用戶進(jìn)行統(tǒng)一管理。用戶組可按照部門或研究課題組來進(jìn)行設(shè)置,通過設(shè)置用戶組可將資源權(quán)限劃分得更為詳細(xì),保障知識傳播的安全性。
(3)操作權(quán)限管理:提供5 類操作權(quán)限,包括管理、提交、審核并編輯元數(shù)據(jù)、審核元數(shù)據(jù)、編輯元數(shù)據(jù),可按專題、用戶、用戶組賦予相應(yīng)權(quán)限。上述5 類權(quán)限由高到低排列,當(dāng)賦予用戶管理權(quán)限后,用戶便成為子管理員,具有對該專題下內(nèi)容、用戶的管理權(quán)限,并可進(jìn)行二次授權(quán)。
(4)訪問權(quán)限管理:提供4 類訪問權(quán)限,包括全文下載、在線瀏覽、元數(shù)據(jù)訪問、專題訪問,可按專題、用戶、用戶組賦予相應(yīng)權(quán)限。上述4 類權(quán)限由高到低排列,具有高級訪問權(quán)限的用戶自動(dòng)具有低級別權(quán)限。
1.2.2 數(shù)據(jù)管理
(1)數(shù)據(jù)提交:授權(quán)用戶可在選擇相應(yīng)的專題和資源類型模板后進(jìn)行數(shù)據(jù)的提交發(fā)布工作。
(2)批量導(dǎo)入導(dǎo)出:管理員和子管理員可將已有的數(shù)據(jù)批量導(dǎo)入本系統(tǒng)中,支持CSV、Excel 等通用格式,支持全文數(shù)據(jù)自動(dòng)導(dǎo)入。
(3)數(shù)據(jù)增刪改:用戶可對自身提交的數(shù)據(jù)進(jìn)行刪除、修改,管理用戶可對權(quán)限范圍內(nèi)的數(shù)據(jù)進(jìn)行刪改。
1.2.3 檢索/瀏覽/導(dǎo)航
提供簡單檢索、高級檢索,支持多個(gè)字段的組合查詢,對檢索結(jié)果提供按相關(guān)性、時(shí)間等排序的功能;支持按學(xué)科、文獻(xiàn)類型等的分類導(dǎo)航、在線預(yù)覽、下載等功能。
1.2.4 統(tǒng)計(jì)分析
(1)基本統(tǒng)計(jì):包括提交統(tǒng)計(jì)、檢索統(tǒng)計(jì)、訪問下載統(tǒng)計(jì),可對各專題、各類型數(shù)據(jù)設(shè)定不同統(tǒng)計(jì)條件,進(jìn)行多角度、多維度的統(tǒng)計(jì),采用ECharts技術(shù)進(jìn)行可視化展示[11]。
(2)個(gè)人學(xué)術(shù)計(jì)量:統(tǒng)計(jì)個(gè)人發(fā)布的各類型論文、成果、作品及其所涉及的專業(yè)、研究領(lǐng)域及關(guān)鍵詞,全面展示個(gè)人的學(xué)術(shù)能力和業(yè)績。
1.2.5 內(nèi)容組織管理
(1)元數(shù)據(jù)定義:以都柏林核心(Dublin Core)元數(shù)據(jù)為基礎(chǔ),支持靈活定義各種元數(shù)據(jù)字段,用于描述資源對象信息,如題名(title)、作者(author)、關(guān)鍵詞(subject)、摘要(abstract)、年(year)、卷(volume)、期(issue)、頁(page)、來源(source)、日期(date)等,各字段可根據(jù)需要修改其顯示名稱,如標(biāo)識符(identifier)字段,在標(biāo)準(zhǔn)規(guī)范中可顯示為標(biāo)準(zhǔn)號,在項(xiàng)目合同中顯示為合同編號,在管理辦法中顯示為文號,在專利發(fā)明中顯示為專利號。
(2)模板定制:支持靈活定義各種資源類型,通過將元數(shù)據(jù)與模板關(guān)聯(lián),可為各資源類型設(shè)定元數(shù)據(jù)(字段),如針對期刊論文,可在元數(shù)據(jù)中選擇題名、作者、關(guān)鍵詞、摘要、年、卷、期、頁、來源等作為描述字段;針對標(biāo)準(zhǔn)規(guī)范,可在元數(shù)據(jù)中選擇標(biāo)準(zhǔn)號、題名、作者、發(fā)布日期、實(shí)施日期、關(guān)鍵詞、摘要、狀態(tài)等作為描述字段,實(shí)現(xiàn)對不同類型知識對象的擴(kuò)展管理。
(3)知識組織:支持按照學(xué)科分類、組織架構(gòu)、學(xué)科分類+組織架構(gòu)等多種方式進(jìn)行知識成果組織,可根據(jù)需要靈活設(shè)置知識組織展示方式[12]。
1.2.6 系統(tǒng)管理
(1)參數(shù)配置:支持如網(wǎng)站名稱、域名、郵件服務(wù)器、水印、版權(quán)內(nèi)容等網(wǎng)站參數(shù)的靈活配置。
(2)主題設(shè)置:可預(yù)先設(shè)置界面主題樣式和logo 標(biāo)識,管理員可通過后臺對其進(jìn)行靈活切換。
(3)備份及恢復(fù):包括系統(tǒng)備份、數(shù)據(jù)庫備份、文件備份,可進(jìn)行增量備份和全量備份,可根據(jù)需要設(shè)置備份策略。
鐵路領(lǐng)域數(shù)據(jù)來源廣泛、知識類型多樣,包括期刊/會(huì)議/學(xué)位論文、研究報(bào)告、專利、演示文稿、圖片、音視頻、專著/譯著、軟件、軟件著作權(quán)、各類申報(bào)書、部門內(nèi)部管理文件等,元數(shù)據(jù)字段類型眾多。
針對資源類型及其元數(shù)據(jù)多樣的特點(diǎn),本文采用元數(shù)據(jù)非編程性動(dòng)態(tài)定制擴(kuò)展技術(shù),在遵循都柏林核心元素集的基礎(chǔ)上定義了108 個(gè)元數(shù)據(jù),自定義形成14 種資源類型,包括期刊論文、簡報(bào)內(nèi)參、標(biāo)準(zhǔn)規(guī)范、獎(jiǎng)勵(lì)成果等,每種資源類型可由管理員從已建立的元數(shù)據(jù)集中選擇相應(yīng)字段進(jìn)行描述,最終形成該資源類型模板,用于數(shù)據(jù)提交和資源展示。該技術(shù)的應(yīng)用為機(jī)構(gòu)數(shù)據(jù)的統(tǒng)一歸集和檢索利用奠定基礎(chǔ),也可為后續(xù)與OA 系統(tǒng)、科研管理系統(tǒng)等系統(tǒng)間數(shù)據(jù)的交互提供便利。
機(jī)構(gòu)對知識的組織和展示方式有不同需求,機(jī)構(gòu)知識可按照學(xué)科分類、機(jī)構(gòu)組織架構(gòu)、學(xué)科分類+組織架構(gòu)相結(jié)合的方式進(jìn)行組織。
針對上述需求,本文將知識組織方式抽象化為樹形結(jié)構(gòu)展示,基于面向?qū)ο蟮乃枷?,采用組合模式實(shí)現(xiàn)靈活的樹形結(jié)構(gòu)構(gòu)建,管理員、子管理員可根據(jù)知識組織及展示需要,自定義創(chuàng)建子節(jié)點(diǎn)(部門)、葉子節(jié)點(diǎn)(專題),將容器對象與葉子節(jié)點(diǎn)對象進(jìn)行遞歸組合,以層次化形式展示知識成果。同時(shí),這種知識組織方式也是權(quán)限管理的基礎(chǔ),管理員、子管理員可對用戶組、用戶賦予樹形結(jié)構(gòu)中各個(gè)部門、專題的操作和訪問權(quán)限。
機(jī)構(gòu)知識安全是鐵路行業(yè)機(jī)構(gòu)知識保存與共享交流系統(tǒng)穩(wěn)定運(yùn)行的前提,不同資源開放傳播的范圍不同,不同用戶對資源的操作、訪問權(quán)限也不同。
針對數(shù)據(jù)開放范圍對用戶權(quán)限要求的不同,采用細(xì)粒度的權(quán)限設(shè)置、靈活的權(quán)限組合,支持目錄級權(quán)限及單文件權(quán)限設(shè)置,支持對用戶組、單個(gè)用戶進(jìn)行權(quán)限設(shè)置。本系統(tǒng)分為5 類操作權(quán)限和4 類訪問權(quán)限,管理員、子管理員可根據(jù)數(shù)據(jù)開放范圍及管理需要為所屬用戶組、用戶賦予對各個(gè)部門、專題的操作、訪問權(quán)限。此外,本系統(tǒng)支持文件級權(quán)限管理,可對單個(gè)文件設(shè)置訪問權(quán)限,實(shí)現(xiàn)在促進(jìn)機(jī)構(gòu)知識共享的同時(shí)防止文檔外泄,有效保護(hù)機(jī)構(gòu)知識資產(chǎn)。
知識已成為一種重要的無形資產(chǎn),及時(shí)積累、保存機(jī)構(gòu)所產(chǎn)生的知識,將機(jī)構(gòu)內(nèi)各部門、各項(xiàng)目組、各成員散存的各類知識統(tǒng)一存儲(chǔ)、再組織、展現(xiàn),可以避免因機(jī)構(gòu)職能變化、撤銷、合并及員工的離職、退休等導(dǎo)致的知識流失。鐵路行業(yè)機(jī)構(gòu)知識保存與共享交流系統(tǒng)作為一種管理機(jī)構(gòu)知識的工具,能夠?qū)C(jī)構(gòu)內(nèi)各下屬機(jī)構(gòu)、項(xiàng)目組、成員散存的各類知識成果記錄、集成、再組織、展現(xiàn),實(shí)現(xiàn)機(jī)構(gòu)知識的長期積累、保存和傳承。
鐵路是一個(gè)多學(xué)科交叉的專業(yè),機(jī)構(gòu)成員在研究方向上存在相近和交叉,鐵路行業(yè)機(jī)構(gòu)知識保存與共享交流系統(tǒng)的建設(shè)能夠?yàn)闄C(jī)構(gòu)成員提供一個(gè)互相認(rèn)識、了解彼此研究領(lǐng)域、交流協(xié)作的平臺,為不同部門和團(tuán)隊(duì)協(xié)作共享提供契機(jī),不同部門和團(tuán)隊(duì)可基于某一研究主題,共同在該領(lǐng)域推進(jìn)研究,進(jìn)而發(fā)揮機(jī)構(gòu)成員的專業(yè)綜合優(yōu)勢。此外,通過對部門乃至整個(gè)機(jī)構(gòu)的知識成果或知識碎片進(jìn)行統(tǒng)一收集,為機(jī)構(gòu)內(nèi)知識的共享、相互借鑒提供了基礎(chǔ),便于后人對前人研究成果的再利用、再研究,有助于提升機(jī)構(gòu)創(chuàng)新能力,并在一定程度上可避免重復(fù)研究、減少資源浪費(fèi)、提升科研效率。
鐵路行業(yè)機(jī)構(gòu)知識保存與共享交流系統(tǒng)為機(jī)構(gòu)成員提供了展示自身、發(fā)展自身的機(jī)會(huì),機(jī)構(gòu)成員通過上傳自身的工作成果,匯總自身相關(guān)知識成果的同時(shí)展示了自己的研究領(lǐng)域、方向、學(xué)術(shù)能力和業(yè)績,為機(jī)構(gòu)發(fā)現(xiàn)人才、培養(yǎng)人才提供了途徑,也為機(jī)構(gòu)遴選領(lǐng)域?qū)<?、查找相近領(lǐng)域研究人員提供了線索,對營造積極向上的人才發(fā)展、成才氛圍具有重要意義。
本文基于鐵路行業(yè)知識存儲(chǔ)管理、共享利用的需求,設(shè)計(jì)并實(shí)現(xiàn)了鐵路行業(yè)機(jī)構(gòu)知識保存與共享交流系統(tǒng),為機(jī)構(gòu)成員提供了一個(gè)展示自身研究成果和相互溝通的橋梁,為機(jī)構(gòu)內(nèi)協(xié)作交流提供了契機(jī)和平臺,對提升機(jī)構(gòu)創(chuàng)新能力、提升研發(fā)效率具有重要價(jià)值。
機(jī)構(gòu)知識保存與共享交流系統(tǒng)的運(yùn)行需要用戶的積極參與,后續(xù)還將進(jìn)一步結(jié)合各機(jī)構(gòu)知識管理的需求,研究機(jī)構(gòu)知識存繳激勵(lì)機(jī)制和管理機(jī)制[13],探索面向科學(xué)數(shù)據(jù)管理的機(jī)構(gòu)知識庫系統(tǒng)建設(shè)[8],提升用戶知識存繳和共享交流積極性,促進(jìn)本系統(tǒng)的可持續(xù)發(fā)展,對提升機(jī)構(gòu)創(chuàng)新能力提供有效支撐。