文/雷 榮 尹 君
本文立足于基層企業(yè)管理環(huán)境,利用Python的中文分詞工具,分析文檔信息形成的特征和文檔信息利用的特點(diǎn),探尋文檔信息形成場(chǎng)景和利用場(chǎng)景之間的規(guī)律,構(gòu)建用戶(hù)畫(huà)像和文件之間的關(guān)聯(lián),實(shí)現(xiàn)文檔信息的智能服務(wù)
檔案管理部門(mén)管理對(duì)象多樣化,包括紙質(zhì)檔案、電子檔案和業(yè)務(wù)系統(tǒng)中在線(xiàn)歸檔的檔案數(shù)據(jù)?!皫缀蹩梢钥隙ǖ氖?未來(lái)文檔管理一定是處于多態(tài)并存的局面,因而對(duì)管理對(duì)象的態(tài)勢(shì)感知顯得尤為重要,不同態(tài)別的對(duì)象需要與之配套協(xié)同的管理手段和方法。”[1]面對(duì)多態(tài)的管理對(duì)象,檔案管理需要采用精細(xì)化的管理方法和手段,探尋智能化的利用服務(wù)方式。雖然檔案利用逐步實(shí)現(xiàn)了電子化和網(wǎng)絡(luò)化,但是仍局限于以文件為單位的利用服務(wù),檔案數(shù)據(jù)的深層次開(kāi)發(fā)缺乏需求導(dǎo)向。檔案工作者需要掌握一套快速、準(zhǔn)確的響應(yīng)用戶(hù)的需求,提供檔案信息智能服務(wù)方法和能力。
在企業(yè)運(yùn)行較為成熟的辦公自動(dòng)化系統(tǒng)中,提取該系統(tǒng)中核心業(yè)務(wù)數(shù)據(jù)進(jìn)行詞頻分析。在實(shí)際的公文處理活動(dòng)中,公文的數(shù)據(jù)可以分為發(fā)文形成的數(shù)據(jù)和收文形成的數(shù)據(jù)。選擇公文標(biāo)題和責(zé)任部門(mén)(形成部門(mén)和承辦部門(mén))兩個(gè)維度,分析公文數(shù)據(jù)的形成和處理情況。
在規(guī)范的公文標(biāo)題中包含發(fā)文機(jī)關(guān)名稱(chēng)、事由和文種這三個(gè)要素,其中“事由”信息揭示了公文的主要內(nèi)容。通過(guò)數(shù)據(jù)清洗剔除公文標(biāo)題數(shù)據(jù)中的“發(fā)文機(jī)關(guān)名稱(chēng)”和“文種”信息,對(duì)“事由”信息進(jìn)行分詞和統(tǒng)計(jì)。
利用Python的結(jié)巴中文分詞,對(duì)公文標(biāo)題中的“事由”數(shù)據(jù)進(jìn)行分詞處理并統(tǒng)計(jì)出高頻詞匯。按照承辦部門(mén)分類(lèi)統(tǒng)計(jì)收文的詞頻結(jié)果,按照形成部門(mén)分類(lèi)統(tǒng)計(jì)發(fā)文的分詞結(jié)果,選取人事部門(mén)和財(cái)務(wù)部門(mén)在一定時(shí)期內(nèi)形成和處理的公文數(shù)據(jù),經(jīng)過(guò)分詞、統(tǒng)計(jì)詞頻及數(shù)據(jù)的可視化后結(jié)果見(jiàn)下圖:
財(cái)務(wù)部門(mén)和人事部門(mén)的公文數(shù)據(jù)中“事由”涵蓋了部門(mén)基本職能,其中高頻詞反映部門(mén)的核心關(guān)鍵業(yè)務(wù)。通過(guò)文件標(biāo)題“事由”部分的詞頻分析可以看出:在職能活動(dòng)中形成了與崗位、職責(zé)高度匹配的文件信息。在企業(yè)組織環(huán)境中,組織中的崗位和職責(zé)賦予了文檔形成和使用者(簡(jiǎn)稱(chēng)文檔用戶(hù))鮮明的特性,正是這些因素構(gòu)成了文檔用戶(hù)特有的工作場(chǎng)景。他們?cè)诼毮芑顒?dòng)中處理各種各樣的文件,同時(shí)在職能活動(dòng)中生成各種各樣的文件。
正如上圖財(cái)務(wù)部門(mén)和人事部門(mén)在各自的職能活動(dòng)中,既需要處理大批與其職責(zé)相關(guān)的文件,也產(chǎn)生了文檔信息的利用需求。部門(mén)業(yè)務(wù)活動(dòng)中形成的公文數(shù)據(jù),能夠展示出這個(gè)業(yè)務(wù)活動(dòng)的前因后果,也反映出部門(mén)履職過(guò)程和業(yè)務(wù)完成情況。例如:
關(guān)于開(kāi)展某某活動(dòng)的通知——起因
關(guān)于印發(fā)《某某活動(dòng)方案》的通知——經(jīng)過(guò)
關(guān)于上報(bào)《某某活動(dòng)總結(jié)》的報(bào)告——結(jié)果
在職能活動(dòng)中,用戶(hù)對(duì)文檔信息的需求來(lái)源于當(dāng)前工作場(chǎng)景;同時(shí)需要再現(xiàn)和還原過(guò)去相關(guān)社會(huì)活動(dòng)的時(shí)間、人物、行為、背景、情景關(guān)系等一系列場(chǎng)景信息。
場(chǎng)景思維就是利用場(chǎng)景來(lái)對(duì)問(wèn)題進(jìn)行思考,從需求行為產(chǎn)生的時(shí)間和背景等角度,對(duì)用戶(hù)需求從不同角度和不同維度進(jìn)行分析和理解,探尋本質(zhì)性的需求,并據(jù)此提供符合需求的產(chǎn)品或者服務(wù)。文檔利用工作者一方面積極挖掘企業(yè)文檔中包含的場(chǎng)景信息;另一方面從企業(yè)生產(chǎn)經(jīng)營(yíng)活動(dòng)場(chǎng)景出發(fā)分析文檔信息需求,挖掘用戶(hù)在特定業(yè)務(wù)場(chǎng)景中文檔信息需求;最后將文檔信息場(chǎng)景和業(yè)務(wù)活動(dòng)場(chǎng)景相匹配,提供符合場(chǎng)景需求的文檔信息,推送相應(yīng)的文檔信息,提高信息需求和信息產(chǎn)品連接的效率和質(zhì)量,實(shí)現(xiàn)文檔信息利用的智能化。
在復(fù)雜的人類(lèi)社會(huì)實(shí)踐活動(dòng)中形成了檔案,檔案是社會(huì)活動(dòng)的原始記錄,檔案記錄各種各樣的社會(huì)職能活動(dòng)。檔案記錄了社會(huì)活動(dòng)時(shí)間、空間、目的、用途等一系列場(chǎng)景信息。業(yè)務(wù)活動(dòng)中形成了其特定職責(zé)、業(yè)務(wù)范圍內(nèi)的檔案信息。
黨和政府機(jī)關(guān)在辦理公務(wù)活動(dòng)中形成了具有特定效力和規(guī)范格式的文件和檔案。這些文檔數(shù)據(jù)一般由“時(shí)間、部門(mén)、人員、事件、主題”等要素組成,反映了公務(wù)活動(dòng)起因、經(jīng)過(guò)、結(jié)果。可見(jiàn),檔案形成于社會(huì)實(shí)踐的各個(gè)場(chǎng)景中,記錄和保存了當(dāng)時(shí)的場(chǎng)景信息。
檔案信息的收集、整理、保管、鑒定、統(tǒng)計(jì)和提供利用管理工作,都是為了確保檔案信息的完整、準(zhǔn)確、系統(tǒng)和安全,維護(hù)檔案的原始性。文書(shū)類(lèi)電子文件元數(shù)據(jù)方案明確了文書(shū)類(lèi)電子文件形成、交換、歸檔、移交、保管、利用等全過(guò)程中元數(shù)據(jù)的設(shè)計(jì)、捕獲和著錄要求[2];元數(shù)據(jù)描述記錄了文件的背景、內(nèi)容、結(jié)構(gòu),包括文件生成和管理的全過(guò)程的數(shù)據(jù),包括文件、機(jī)構(gòu)和人員、業(yè)務(wù)以及其關(guān)系等數(shù)據(jù)[2]。這些元數(shù)據(jù)記錄了文件形成場(chǎng)景信息,包括文件形成時(shí)的組織機(jī)構(gòu)、時(shí)間、人員、業(yè)務(wù)、行為及其相互關(guān)系等。文書(shū)類(lèi)電子文件元數(shù)據(jù)的管理過(guò)程,既確保元數(shù)據(jù)的規(guī)范和完整,也維護(hù)了文書(shū)類(lèi)文件場(chǎng)景信息的準(zhǔn)確和完整??梢?jiàn),檔案工作也是對(duì)檔案形成場(chǎng)景信息規(guī)范管理的過(guò)程。
檔案利用的過(guò)程是通過(guò)查找、使用或檢索檔案信息、獲取檔案信息的過(guò)程。實(shí)際也就是指檔案工作者通過(guò)一定的方式、方法,將檔案信息提供給利用者的過(guò)程。檔案利用活動(dòng)包括檔案管理者、檔案和檔案利用者這三個(gè)主體。檔案管理者通過(guò)一系列的管理工作保持檔案信息的原始性,通過(guò)利用工作來(lái)滿(mǎn)足利用者對(duì)檔案信息的需求,實(shí)現(xiàn)了檔案的價(jià)值。檔案利用者需要通過(guò)各類(lèi)檔案信息還原歷史活動(dòng)的真實(shí)情景,指導(dǎo)當(dāng)下的社會(huì)實(shí)踐活動(dòng)。
但是在傳統(tǒng)以“關(guān)鍵詞”查詢(xún)?yōu)橹鞯睦没顒?dòng)中,檔案部門(mén)守著浩瀚的文件資料卻不能滿(mǎn)足用戶(hù)的需求。這是因?yàn)閭鹘y(tǒng)的檔案工作是以“文件”為單元,以檢索為目標(biāo),通過(guò)收集、著錄、分類(lèi)、編目、提供利用活動(dòng)開(kāi)展工作。這種利用方式不能滿(mǎn)足用戶(hù)對(duì)文檔內(nèi)容信息多維度的智能化需求。特里·庫(kù)克認(rèn)為傳統(tǒng)的檔案工作重點(diǎn)是檔案實(shí)體的保管,在后保管時(shí)代檔案工作關(guān)注重點(diǎn)將轉(zhuǎn)為:檔案的來(lái)源、檔案信息的形成過(guò)程、檔案的形成目的、檔案之間的關(guān)聯(lián)關(guān)系和來(lái)源部門(mén)(單位)之間的職能業(yè)務(wù)關(guān)系,檔案形成部門(mén)(單位)、形成者的職責(zé)范圍等[3]。
當(dāng)用戶(hù)以一定的角色首次登錄業(yè)務(wù)系統(tǒng)時(shí),系統(tǒng)根據(jù)用戶(hù)基本信息(如崗位、職責(zé))結(jié)合業(yè)務(wù)系統(tǒng)中已有的相似角色或歷史角色信息,分析構(gòu)建這個(gè)用戶(hù)“畫(huà)像”。系統(tǒng)定期分析該用戶(hù)在系統(tǒng)中形成的信息和處理的信息,不斷地修正用戶(hù)“畫(huà)像”。系統(tǒng)將具有相關(guān)職責(zé)的用戶(hù)活動(dòng)信息進(jìn)行分析,形成一定主題或一段時(shí)期內(nèi)相似的用戶(hù)群的“畫(huà)像”。這樣在相對(duì)穩(wěn)定的組織場(chǎng)景中,通過(guò)分析特定職責(zé)用戶(hù)信息記錄,積累形成用戶(hù)的信息需求特征。
改變傳統(tǒng)的以檢索為目標(biāo)的信息收集和采集方式,注重背景信息的收集。利用信息技術(shù),挖掘用戶(hù)在業(yè)務(wù)活動(dòng)中形成和處理文檔信息的規(guī)律,利用信息技術(shù),分析數(shù)據(jù)特有的場(chǎng)景信息,以此構(gòu)建以特定要素為基礎(chǔ)的文件群,通過(guò)特定的算法為每一個(gè)用戶(hù)推薦其高度關(guān)注的文檔信息。
在用戶(hù)日常的業(yè)務(wù)活動(dòng)中,通過(guò)活動(dòng)場(chǎng)景觸發(fā)特定的用戶(hù)畫(huà)像,完成需求與信息產(chǎn)品的匹配,形成關(guān)聯(lián)性高度匹配的文檔信息集合推送給用戶(hù),實(shí)現(xiàn)檔案信息服務(wù)的智能化。
在業(yè)務(wù)活動(dòng)場(chǎng)景中由職能要素關(guān)聯(lián)用戶(hù)文檔需求。建立職責(zé)要素的用戶(hù)畫(huà)像,用戶(hù)在職責(zé)要素下形成的文檔群,用戶(hù)在職責(zé)要素下處理的文檔群;用戶(hù)在職責(zé)活動(dòng)中觸發(fā)潛在的文檔需求,系統(tǒng)將“形成文檔群”和“處理文檔群”中相匹配的文檔推送給特定的用戶(hù)。
當(dāng)然在實(shí)際的業(yè)務(wù)系統(tǒng)中,這里的匹配要素可能不僅僅表現(xiàn)為“職責(zé)”,也可以是“專(zhuān)業(yè)”“學(xué)科”“工作節(jié)點(diǎn)”等。根據(jù)不同的業(yè)務(wù)場(chǎng)景具體分析,我們才能夠滿(mǎn)足用戶(hù)需求的多樣性,滿(mǎn)足用戶(hù)潛在需求。
總之,文檔管理部門(mén)應(yīng)轉(zhuǎn)變思維,立足于企業(yè)信息化建設(shè)中積累的數(shù)據(jù)信息,立足于多樣化的業(yè)務(wù)場(chǎng)景,運(yùn)用成熟的信息技術(shù)分析用戶(hù)需求規(guī)律,摸索出適合本企業(yè)文檔信息的開(kāi)發(fā)模式和智能服務(wù)方式,實(shí)現(xiàn)文檔信息價(jià)值,改進(jìn)文檔信息服務(wù)質(zhì)量和效果,提升企業(yè)檔案管理的精細(xì)化水平。