李濟(jì)偉 艾永琦 夏磊
(國(guó)家電網(wǎng)有限公司信息通信分公司,北京 100000)
隨著國(guó)家電網(wǎng)公司數(shù)字化轉(zhuǎn)型工作的深入開(kāi)展,公司內(nèi)各級(jí)單位的線(xiàn)上辦公滲透率逐年增加。在線(xiàn)上辦公的過(guò)程中,產(chǎn)生了大量的非結(jié)構(gòu)化文檔數(shù)據(jù),造成辦公文檔數(shù)據(jù)在跨部門(mén)協(xié)作、檢索等過(guò)程中效率偏低[1-2]。同時(shí),非結(jié)構(gòu)化文檔數(shù)據(jù)采用網(wǎng)絡(luò)附屬存儲(chǔ)(Network Attached Storage, NAS)文件傳輸協(xié)議(File Transfer Protocol,FTP)等方式為主[3-4],存在企業(yè)辦公文檔權(quán)限控制難度大,應(yīng)用場(chǎng)景不能貼近生產(chǎn)等問(wèn)題,因此,為了進(jìn)一步保障辦公文檔的有序應(yīng)用、安全可靠運(yùn)行,亟需結(jié)合電網(wǎng)企業(yè)的辦公場(chǎng)景,開(kāi)展企業(yè)辦公文檔管理體系的建設(shè)研究。
國(guó)內(nèi)外許多學(xué)者對(duì)企業(yè)辦公管理做了大量的研究。文獻(xiàn)[5]中,提出了一種一體化的企業(yè)辦公管理方法,該方法通過(guò)企業(yè)辦公文檔的數(shù)據(jù)流向業(yè)務(wù)流轉(zhuǎn)換,從而實(shí)現(xiàn)企業(yè)辦公文檔的統(tǒng)一管理。文獻(xiàn)[6]中,提出了一種基于Python的企業(yè)辦公文檔管理方法,通過(guò)Rational模型建立了企業(yè)文檔的系統(tǒng)架構(gòu)和邏輯架構(gòu),采用文檔數(shù)據(jù)庫(kù)解決了大并發(fā)壓力和企業(yè)辦公文檔流轉(zhuǎn)監(jiān)管問(wèn)題。文獻(xiàn)[7]中,提出了一種基于ISO15189質(zhì)量標(biāo)準(zhǔn)的企業(yè)文檔管理方法,通過(guò)文檔標(biāo)識(shí)碼,實(shí)現(xiàn)了企業(yè)文檔的全過(guò)程管理,對(duì)文件的唯一、規(guī)范和可追溯性進(jìn)行了有效的管理。文獻(xiàn)[8]中,提出了一種基于Spring和MyBatis (Spring+SpringMVC+MyBatis, SSM)框架的企業(yè)文檔管理方法,通過(guò)對(duì)企業(yè)文檔的收集、分類(lèi)、存儲(chǔ)、整理等屬性的操作,實(shí)現(xiàn)了企業(yè)文檔的有序管理。文獻(xiàn)[9]中,提出了一種基于開(kāi)放檔案信息系統(tǒng)(Open Archival Information System,OAIS)的企業(yè)文檔管理方法,實(shí)現(xiàn)了企業(yè)文檔的長(zhǎng)期可靠保存和有效應(yīng)用。由此可見(jiàn),企業(yè)文檔管理方法多樣。但上述方法缺少對(duì)文檔的跨部門(mén)知識(shí)挖掘、多層級(jí)權(quán)限控制方面的應(yīng)用。
為解決線(xiàn)上辦公中存在的跨部門(mén)檢索難的問(wèn)題,提出了一種基于知識(shí)圖譜的企業(yè)辦公文檔管理方法。該方法通過(guò)知識(shí)圖譜技術(shù)挖掘了電網(wǎng)企業(yè)各部門(mén)和單位之間文檔的關(guān)聯(lián)規(guī)律,并通過(guò)業(yè)務(wù)場(chǎng)景與權(quán)限控制,實(shí)現(xiàn)了企業(yè)多層級(jí)、多部門(mén)的辦公文檔統(tǒng)一管理。
文中所述的基于知識(shí)圖譜的企業(yè)辦公文檔管理方法框架主要包括:建立企業(yè)文檔目錄架構(gòu)、建立企業(yè)文檔應(yīng)用場(chǎng)景和建立企業(yè)文檔權(quán)限架構(gòu)三部分內(nèi)容,如圖1所示:
由圖1可見(jiàn),在建立企業(yè)文檔目錄架構(gòu)環(huán)節(jié),首先,采用知識(shí)圖譜技術(shù)挖掘電網(wǎng)企業(yè)各部門(mén)之間的關(guān)聯(lián)關(guān)系,獲得電網(wǎng)企業(yè)各部門(mén)之間文檔的核心結(jié)構(gòu);其次,對(duì)電網(wǎng)集團(tuán)單位的上下級(jí)、平級(jí)單位之間的文檔關(guān)系進(jìn)行關(guān)聯(lián)關(guān)系挖掘,展現(xiàn)其核心的文檔結(jié)構(gòu);最后,利用可視化技術(shù)建立多層級(jí)的電網(wǎng)企業(yè)辦公文檔目錄管理架構(gòu)。在建立企業(yè)文檔應(yīng)用場(chǎng)景環(huán)節(jié),首先,結(jié)合電網(wǎng)企業(yè)單位的業(yè)務(wù)管理流程,建立單位內(nèi)部跨部門(mén)的文檔應(yīng)用場(chǎng)景。其次,結(jié)合電網(wǎng)企業(yè)上下級(jí)與平級(jí)單位間的業(yè)務(wù)流程,建立跨單位的文檔應(yīng)用場(chǎng)景。在建立電網(wǎng)企業(yè)文檔權(quán)限架構(gòu)環(huán)節(jié),結(jié)合電網(wǎng)企業(yè)的組織架構(gòu)和企業(yè)文檔業(yè)務(wù)場(chǎng)景,進(jìn)行訪(fǎng)問(wèn)權(quán)限管理;其次,對(duì)最終用戶(hù)進(jìn)行企業(yè)文檔應(yīng)用授權(quán)。
知識(shí)圖譜技術(shù)是通過(guò)將企業(yè)內(nèi)部不同的企業(yè)文檔數(shù)據(jù)有機(jī)連接在一起形成的一個(gè)知識(shí)分享網(wǎng)絡(luò)。知識(shí)圖譜技術(shù)應(yīng)用了信息的可視化技術(shù)、圖像技術(shù)、信息科學(xué)的理論,采用了計(jì)量分析、共性挖掘分析等綜合方法,并利用信息可視化技術(shù)展示企業(yè)文檔數(shù)據(jù)關(guān)系。因此,文中采用知識(shí)圖譜技術(shù)建立電網(wǎng)企業(yè)的文檔目錄架構(gòu)。
2.1.1 部門(mén)關(guān)聯(lián)關(guān)系數(shù)據(jù)挖掘
部門(mén)關(guān)聯(lián)關(guān)系數(shù)據(jù)挖掘是一個(gè)企業(yè)內(nèi)部各部門(mén)間的信息挖掘。電網(wǎng)企業(yè)中,包括了營(yíng)銷(xiāo)、生產(chǎn)、人資、工會(huì)、黨建等各類(lèi)文檔數(shù)據(jù)。在部門(mén)關(guān)聯(lián)關(guān)系數(shù)據(jù)挖掘中,包含了進(jìn)行企業(yè)文檔知識(shí)建模、企業(yè)文檔知識(shí)獲取、企業(yè)文檔知識(shí)融合、企業(yè)文檔數(shù)據(jù)存儲(chǔ)和企業(yè)文檔關(guān)聯(lián)關(guān)系展現(xiàn)五部分。
(1) 企業(yè)文檔知識(shí)建模。將電網(wǎng)企業(yè)營(yíng)銷(xiāo)、財(cái)務(wù)、人資、生產(chǎn)等各部門(mén)間的非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行抽象描述并組織轉(zhuǎn)換為可識(shí)別的電網(wǎng)企業(yè)數(shù)據(jù)類(lèi)型。轉(zhuǎn)換的數(shù)據(jù)Sa為:
(1)式中:na為單個(gè)電網(wǎng)企業(yè)中業(yè)務(wù)部門(mén)的數(shù)量;si為不同的電網(wǎng)企業(yè)業(yè)務(wù)部門(mén)的非結(jié)構(gòu)化文檔。
(2)企業(yè)文檔知識(shí)獲取。企業(yè)文檔知識(shí)獲取的目的是將電網(wǎng)企業(yè)營(yíng)銷(xiāo)、財(cái)務(wù)、人資、生產(chǎn)等各部門(mén)間的非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換為知識(shí)圖譜數(shù)據(jù),轉(zhuǎn)換后,將生成解析的電網(wǎng)企業(yè)文檔的半結(jié)構(gòu)化數(shù)據(jù),并具有文檔的標(biāo)引和推理。
(3)企業(yè)文檔知識(shí)融合。為確保電網(wǎng)企業(yè)部門(mén)關(guān)聯(lián)關(guān)系數(shù)據(jù)的有用性,將電網(wǎng)企業(yè)營(yíng)銷(xiāo)、財(cái)務(wù)、人資、生產(chǎn)等各部門(mén)間的充分?jǐn)?shù)據(jù)進(jìn)行融合,消除冗余的數(shù)據(jù)集,減少模型算法的運(yùn)算時(shí)間。
(4)企業(yè)文檔知識(shí)存儲(chǔ)。根據(jù)電網(wǎng)企業(yè)營(yíng)銷(xiāo)、財(cái)務(wù)、人資、生產(chǎn)等部門(mén)的非結(jié)構(gòu)化數(shù)據(jù)集,提供便捷的數(shù)據(jù)存儲(chǔ)空間,實(shí)現(xiàn)多樣化的靈活非結(jié)構(gòu)化電網(wǎng)企業(yè)數(shù)據(jù)的存儲(chǔ)。
(5)企業(yè)文檔關(guān)聯(lián)關(guān)系展現(xiàn)。通過(guò)知識(shí)圖譜的可視化技術(shù),對(duì)電網(wǎng)企業(yè)各部門(mén)之間的非結(jié)構(gòu)化數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系進(jìn)行展示。
2.1.2 各級(jí)單位文檔關(guān)系挖掘
在電網(wǎng)企業(yè)中,包含“國(guó)家級(jí)、?。ㄊ校┘?jí)、地市級(jí)、縣級(jí)和鄉(xiāng)鎮(zhèn)供電所”5個(gè)層級(jí)。在各級(jí)單位中,有上級(jí)單位向下級(jí)單位下發(fā)的通知、技術(shù)標(biāo)準(zhǔn)、制度文件等文檔;有下級(jí)單位向上級(jí)單位的匯報(bào)文件等;有平級(jí)單位的交流文件等。文中所述方法中,采用知識(shí)圖譜技術(shù)對(duì)各級(jí)單位之間的文檔關(guān)系進(jìn)行挖掘。
各級(jí)單位文檔建模轉(zhuǎn)換的數(shù)據(jù)Ka為:
(2)式中:nb為電網(wǎng)企業(yè)中各級(jí)單位的數(shù)量;ki為不同級(jí)別的電網(wǎng)企業(yè)的非結(jié)構(gòu)化文檔。
然后,對(duì)各級(jí)單位的非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行跨單位知識(shí)獲取、跨單位知識(shí)融合、跨單位知識(shí)存儲(chǔ)和跨單位文檔關(guān)聯(lián)關(guān)系展現(xiàn),形成各級(jí)單位間的非結(jié)構(gòu)化數(shù)據(jù)架構(gòu)。
2.1.3 多層級(jí)目錄架構(gòu)搭建
電網(wǎng)企業(yè)多層級(jí)目錄架構(gòu)搭建包括了橫向企業(yè)辦公文檔目錄搭建與縱向企業(yè)辦公文檔目錄搭建。其中,橫向企業(yè)辦公文檔目錄搭建為單個(gè)電網(wǎng)企業(yè)的各部門(mén)的非結(jié)構(gòu)化文檔目錄層級(jí)架構(gòu),縱向企業(yè)辦公文檔目錄是國(guó)家級(jí)、省(市)級(jí)、地市級(jí)、縣級(jí)和鄉(xiāng)鎮(zhèn)供電所5個(gè)層級(jí)的目錄體系。同時(shí),在多層級(jí)目錄架構(gòu)搭建的過(guò)程中考慮了電網(wǎng)企業(yè)大規(guī)模用戶(hù)的并發(fā)使用需求以及彈性擴(kuò)展需求。
電網(wǎng)企業(yè)的辦公文檔應(yīng)用場(chǎng)景包括跨部門(mén)的辦公文檔應(yīng)用場(chǎng)景和跨單位的辦公文檔應(yīng)用場(chǎng)景。在已構(gòu)建知識(shí)圖譜的電網(wǎng)企業(yè)多層級(jí)目錄架構(gòu)中,應(yīng)用場(chǎng)景類(lèi)型為在線(xiàn)共享協(xié)作、全局內(nèi)容檢索和文檔安全管控3部分。
2.2.1 在線(xiàn)共享協(xié)作
在線(xiàn)共享協(xié)作是一種多層級(jí)人員在線(xiàn)共同維護(hù)一個(gè)文檔的方式。在電網(wǎng)企業(yè)中,各部門(mén)之間通常采用人員信息收集、黨員活動(dòng)資料維護(hù)、疫情防控信息收集等信息采用在線(xiàn)共享寫(xiě)作方式進(jìn)行。在各級(jí)單位之間,通常是某專(zhuān)業(yè)部門(mén),以省(市)公司設(shè)備部、地市公司運(yùn)檢部、縣公司運(yùn)檢部、供電所為例,省(市)公司下發(fā)電力設(shè)備數(shù)據(jù)填報(bào)信息單,地市公司運(yùn)檢部、縣公司運(yùn)檢部、供電所分別按層級(jí)將信息填報(bào)在在線(xiàn)共享協(xié)作文檔中。
通過(guò)在線(xiàn)共享協(xié)作可以實(shí)現(xiàn)橫向跨部門(mén)、縱向跨單位的在線(xiàn)文檔協(xié)作編輯,提高工作效率。
2.2.2 全局內(nèi)容檢索
全局內(nèi)容檢索是電網(wǎng)企業(yè)非結(jié)構(gòu)化文檔檢索的核心部分內(nèi)容。通過(guò)檢索工具實(shí)現(xiàn)電網(wǎng)企業(yè)不同部門(mén)、不同層級(jí)單位之間的非結(jié)構(gòu)化數(shù)據(jù)的查詢(xún)。文中所提方法采用知識(shí)圖譜技術(shù),在電網(wǎng)企業(yè)范圍內(nèi)進(jìn)行不受限制的非結(jié)構(gòu)化數(shù)據(jù)收集。為提高檢索速度,在知識(shí)圖譜技術(shù)上內(nèi)置文檔快速標(biāo)識(shí),實(shí)現(xiàn)電網(wǎng)企業(yè)的全局內(nèi)容高效檢索。
2.2.3 文檔安全管理
文檔安全管理是針對(duì)電網(wǎng)企業(yè)橫向各部門(mén)、縱向各層級(jí)單位之間的差異化企業(yè)非結(jié)構(gòu)化文檔安全的管理需求,通過(guò)加密機(jī)制實(shí)現(xiàn)文檔的建立、修改、發(fā)布等電網(wǎng)企業(yè)文檔全壽命周期的安全,實(shí)現(xiàn)電網(wǎng)企業(yè)中各部門(mén)、各層級(jí)單位之間的重要核心信息的流轉(zhuǎn)安全,防止電網(wǎng)企業(yè)的核心信息泄密。
在電網(wǎng)企業(yè)傳統(tǒng)的非結(jié)構(gòu)化辦公文檔流轉(zhuǎn)的過(guò)程中,數(shù)據(jù)不涉及到權(quán)限管控,即便采用文檔加水印的方法,但各部門(mén)、各級(jí)單位使用非結(jié)構(gòu)化辦公文檔可以隨意地復(fù)制、粘貼和修改,非結(jié)構(gòu)化數(shù)據(jù)泄密的風(fēng)險(xiǎn)大。因此,需對(duì)電網(wǎng)企業(yè)非結(jié)構(gòu)化文檔實(shí)現(xiàn)權(quán)限管理。
超文本標(biāo)記語(yǔ)言(Hyper Text Markup Language5,H5)是構(gòu)建網(wǎng)頁(yè)內(nèi)容的計(jì)算機(jī)語(yǔ)言描述方式,是互聯(lián)網(wǎng)的最新技術(shù)標(biāo)準(zhǔn),被廣泛地應(yīng)用在電網(wǎng)企業(yè)的各類(lèi)信息化系統(tǒng)中,因此,文中采用H5搭建電網(wǎng)企業(yè)權(quán)限管理體系。
文中方法采用知識(shí)圖譜建立目錄結(jié)構(gòu)后,采用虛擬技術(shù)、電網(wǎng)企業(yè)員工身份認(rèn)證技術(shù)和權(quán)限授權(quán)技術(shù)等,建立了電網(wǎng)企業(yè)辦公文檔的管理標(biāo)準(zhǔn),實(shí)現(xiàn)對(duì)電網(wǎng)企業(yè)各類(lèi)型的受控文檔的精準(zhǔn)權(quán)限控制,從根源防止電網(wǎng)企業(yè)員工在使用文檔期間造成的核心數(shù)據(jù)泄密問(wèn)題。
為驗(yàn)證文中所提基于知識(shí)圖譜的企業(yè)辦公文檔管理方法的有效性,在某單位進(jìn)行仿真應(yīng)用。文檔管理方法部署在信通公司的信息機(jī)房。方法采用以容器的形式部署在信通公司的國(guó)網(wǎng)云平臺(tái)中,實(shí)現(xiàn)微服務(wù)化管理。目前共分配96個(gè)CPU核心、192GB內(nèi)存的計(jì)算資源,以及100TB的云存儲(chǔ)資源。文中涉及的單位層級(jí)為四級(jí),分別為省電力公司、地市供電公司、縣供電公司和供電所。文中的部門(mén)數(shù)量,省電力公司的部門(mén)為28個(gè),地市公司的部門(mén)為19個(gè),縣公司的部門(mén)為11個(gè),供電所無(wú)單獨(dú)設(shè)置部門(mén),上下級(jí)單位的部門(mén)呈多對(duì)一形式。
文中用于與基于知識(shí)圖譜的企業(yè)辦公文檔管理方法是開(kāi)放檔案企業(yè)辦公文檔管理方法,該方法在電網(wǎng)企業(yè)中廣泛使用,具有電網(wǎng)辦公文檔行業(yè)的通用性。
3.2.1 電網(wǎng)企業(yè)辦公文檔全局檢索耗時(shí)
電網(wǎng)企業(yè)辦公文檔全局檢索耗時(shí)是文中所提基于知識(shí)圖譜的企業(yè)辦公文檔管理方法的核心指標(biāo)。其計(jì)算方法為全局檢索的開(kāi)始時(shí)間與生成檢索結(jié)果的時(shí)間之差。該時(shí)間越短,則說(shuō)明全局檢索的能力越強(qiáng)。為節(jié)約人工處理時(shí)間,文中方法采用表單代填機(jī)器人進(jìn)行文件檢索處理。
分別選擇電力營(yíng)銷(xiāo)服務(wù)指標(biāo)仿真數(shù)量為20000、25000、35000、45000、55000、65000、90000、100000個(gè),采用文中所提基于知識(shí)圖譜的企業(yè)辦公文檔管理方法與開(kāi)放檔案方法比較電網(wǎng)企業(yè)辦公文檔全局檢索耗時(shí),電網(wǎng)企業(yè)辦公文檔全局檢索平均耗時(shí)比較結(jié)果如表1所示。
表1 電網(wǎng)企業(yè)辦公文檔全局檢索平均耗時(shí)
由上表可見(jiàn),文中所提基于知識(shí)圖譜的企業(yè)辦公文檔管理方法平均電網(wǎng)企業(yè)辦公文檔全局檢索耗時(shí)為0.14s,小于開(kāi)放檔案方法。由此可見(jiàn),基于知識(shí)圖譜的企業(yè)辦公文檔管理方法電網(wǎng)企業(yè)辦公文檔全局檢索耗時(shí)更短。
3.2.2 電網(wǎng)企業(yè)辦公文檔協(xié)作率
電網(wǎng)企業(yè)辦公文檔協(xié)作率是衡量電網(wǎng)企業(yè)辦公協(xié)作有效性的核心指標(biāo)。該電網(wǎng)企業(yè)辦公文檔協(xié)作率的計(jì)算方法為,在線(xiàn)上統(tǒng)計(jì)的文檔數(shù)和總體的文檔數(shù)之比。該指標(biāo)的取值范圍為0~100%,值越大,則說(shuō)明電網(wǎng)企業(yè)辦公文檔協(xié)作率越高。
選擇2022年2月至8月期間,某省其中6個(gè)地市供電公司的企業(yè)辦公文檔應(yīng)用數(shù)據(jù)進(jìn)行分析,分別采用文中所提基于知識(shí)圖譜的企業(yè)辦公文檔管理方法與開(kāi)放檔案方法比較電網(wǎng)企業(yè)辦公文檔協(xié)作率,其電網(wǎng)企業(yè)辦公文檔協(xié)作率如圖2所示。
由圖2可見(jiàn),文中所提基于知識(shí)圖譜的企業(yè)辦公文檔管理方法平均文檔協(xié)作率為98.9%,比開(kāi)放檔案方法高57.3%。由此可見(jiàn),文中所提基于知識(shí)圖譜的企業(yè)辦公文檔管理方法文檔協(xié)作率更高。
為解決線(xiàn)上辦公中存在的跨部門(mén)檢索難的問(wèn)題,提出了一種基于知識(shí)圖譜的企業(yè)辦公文檔管理方法。通過(guò)了知識(shí)圖譜技術(shù)挖掘電網(wǎng)企業(yè)橫向各部門(mén)、縱向各層級(jí)單位之間的關(guān)聯(lián)規(guī)律,形成了多層級(jí)的業(yè)務(wù)場(chǎng)景辦公文檔管理系統(tǒng),并通過(guò)權(quán)限控制,避免了非結(jié)構(gòu)化文件的泄密。