金 鳳
(泰州市黨史方志檔案辦公室,江蘇泰州,225300)
在檔案管理過程中,為了確保館藏檔案的有效管理,經(jīng)常需要生成各種各樣的統(tǒng)計(jì)表。然而,館藏?cái)?shù)據(jù)的不斷增加以及客觀上統(tǒng)計(jì)格式要求的多變,造成純手工統(tǒng)計(jì)方式以及簡單數(shù)據(jù)庫統(tǒng)計(jì)方式效率嚴(yán)重低下。特別是要分全宗統(tǒng)計(jì)的臺(tái)賬資料,如案卷目錄標(biāo)簽、案卷目錄統(tǒng)計(jì)表、館藏檔案數(shù)量統(tǒng)計(jì)表以及館藏所有全宗卷內(nèi)相關(guān)表格的統(tǒng)計(jì)制作等。這類統(tǒng)計(jì)表共同的特點(diǎn)是一個(gè)全宗需要制作一張表。由于綜合檔案館全宗數(shù)量多,這項(xiàng)工作需要很大的工作量,極其消耗時(shí)間和精力。在數(shù)據(jù)統(tǒng)計(jì)過程中,一旦某個(gè)環(huán)節(jié)數(shù)據(jù)出錯(cuò),則需要花費(fèi)很長的時(shí)間來修改前后累計(jì)數(shù),給工作增加了很多麻煩。
能否利用已有的數(shù)據(jù)庫資源,達(dá)到一次性生成所有報(bào)表的目的,從而減少工作量?優(yōu)化設(shè)想如圖1,將需要統(tǒng)計(jì)的數(shù)據(jù)抽象為數(shù)據(jù)集,將統(tǒng)計(jì)的過程抽象為報(bào)表模板,將統(tǒng)計(jì)的結(jié)果抽象為目標(biāo)報(bào)表,那么我們每做一次報(bào)表的過程就是做好報(bào)表模板,需要統(tǒng)計(jì)不同的臺(tái)賬資料時(shí),只需修改數(shù)據(jù)集,就能一下生成不同的報(bào)表。
在此過程中,我們需要借助于一個(gè)報(bào)表設(shè)計(jì)模板,即報(bào)表軟件。報(bào)表軟件在統(tǒng)計(jì)分析領(lǐng)域廣泛運(yùn)用,但在檔案界似乎用得不多。目前已有的報(bào)表軟件的種類很多,有FineReport 模板設(shè)計(jì)器、華表模板設(shè)計(jì)器、MyExcel和cognos 等,在這里不再贅述。這類軟件共同的特點(diǎn)是采用分層思想,數(shù)據(jù)源與模板設(shè)計(jì)分開。
下面我們以FineReport模板設(shè)計(jì)器為例,詳細(xì)介紹一種基于報(bào)表軟件生成《館藏檔案數(shù)量統(tǒng)計(jì)表》的方法。該方法可以基于數(shù)據(jù)庫一次性生成所需報(bào)表,大大提高工作效率。
圖1 優(yōu)化設(shè)計(jì)思路
表1 館藏檔案數(shù)量統(tǒng)計(jì)表格式
從表1可以看出,《館藏檔案數(shù)量統(tǒng)計(jì)表》是一個(gè)分全宗統(tǒng)計(jì)的報(bào)表,也就是說,一個(gè)全宗需要一張表。同一全宗內(nèi)需要按年代和保管期限分別統(tǒng)計(jì)案卷數(shù)量。通常制作這類表格的做法是先設(shè)計(jì)好表的格式,然后再利用數(shù)據(jù)查詢語句,一個(gè)全宗一個(gè)全宗地填寫相關(guān)數(shù)據(jù)。以泰州市檔案館為例,共有館藏檔案309 個(gè)全宗,這也就是說即使復(fù)制粘貼,也要操作309次,再加上數(shù)據(jù)的統(tǒng)計(jì)和填寫,查詢語句的修改等等,這項(xiàng)工作一般都要花費(fèi)一個(gè)月甚至幾個(gè)月才能完成。
其實(shí),通過觀察不難發(fā)現(xiàn),整個(gè)報(bào)表是基于兩個(gè)數(shù)據(jù)源。一個(gè)是館藏案卷級(jí)目錄,另一個(gè)是全宗名冊。表中的全宗號(hào)、年代以及本年的卷冊數(shù)可從館藏案卷級(jí)目錄中獲取,而全宗名稱則來源于全宗名冊。
所有的數(shù)據(jù)源都找到后,我們可以借助于FineReport 模板設(shè)計(jì)器,將整個(gè)設(shè)計(jì)過程分為四步操作,見圖2。
1.導(dǎo)入數(shù)據(jù)
源數(shù)據(jù),指需要分析統(tǒng)計(jì)的基礎(chǔ)數(shù)據(jù)源,格式可以是文本、數(shù)據(jù)庫、XML、EXCEL 等各種格式的數(shù)據(jù)文件。源數(shù)據(jù)往往不是可以直接使用的數(shù)據(jù),有時(shí)需要經(jīng)過抽取、傳輸、轉(zhuǎn)換和加載。數(shù)據(jù)導(dǎo)入體系結(jié)構(gòu)提供對(duì)數(shù)據(jù)的流動(dòng)和控制的程序及服務(wù),從而將數(shù)據(jù)裝載進(jìn)統(tǒng)計(jì)數(shù)據(jù)庫。
本例中所用到的源數(shù)據(jù)為館藏案卷級(jí)目錄和全宗名冊,格式分別是DBF 和EXCEL 格式。采用工具抽取到Access 數(shù)據(jù)庫中,將數(shù)據(jù)歸集到數(shù)據(jù)集市,方便以后的統(tǒng)計(jì)和分析,一次操作,以后就不需要重復(fù)處理數(shù)據(jù),分析和查看就可不關(guān)心底層數(shù)據(jù)情況;生成不同的數(shù)據(jù)報(bào)表時(shí),就可以不關(guān)心后面的操作,直接修改數(shù)據(jù)集。
圖2 報(bào)表設(shè)計(jì)過程
圖3 定義數(shù)據(jù)集
2.設(shè)計(jì)數(shù)據(jù)集
各種各樣的數(shù)據(jù)集中到數(shù)據(jù)庫中,如果只是用簡單的數(shù)據(jù)庫查詢語句來生成報(bào)表,只能生成一些簡單的報(bào)表,且不能重復(fù)使用,每次重新查詢,都要重新寫語句,格式變化也要進(jìn)行較大的修改。現(xiàn)在我們的目標(biāo)是一次設(shè)計(jì),以后不再設(shè)計(jì)查詢語句,這需要建立報(bào)表軟件與數(shù)據(jù)庫的鏈接。首先定義數(shù)據(jù)庫的鏈接,數(shù)據(jù)庫選擇Access,驅(qū)動(dòng)器選擇,sun.jdbc.odbc.JdbcOdbcDriverURL,URL 指向數(shù)據(jù)源的MDB 文件。定義數(shù)據(jù)集的操作如圖3。
生成的《館藏檔案數(shù)量統(tǒng)計(jì)表》需要使用兩個(gè)數(shù)據(jù)集:館藏案卷級(jí)目錄數(shù)據(jù)集和全宗名冊數(shù)據(jù)集。分別設(shè)計(jì)SQL語句如下:
館藏案卷級(jí)目錄數(shù)據(jù)集:
SELECT A.全宗號(hào),A.保管期限,A.歸檔年代
count(A.案卷號(hào))as 案卷數(shù)
FROM[館藏案卷級(jí)目錄]A
group by A.全宗號(hào),A.終止日期,A.保管期限
order by A.全宗號(hào),A.終止日期
全宗名冊數(shù)據(jù)集:
SELECT*FROM[全宗名冊]
3.設(shè)計(jì)報(bào)表模板
根據(jù)模板數(shù)據(jù)集,結(jié)合館藏檔案數(shù)量統(tǒng)計(jì)表格式,設(shè)計(jì)報(bào)表模板。
其中全宗號(hào),縱向擴(kuò)展,來自于館藏案卷級(jí)目錄數(shù)據(jù)集的全宗號(hào);全宗名稱來自于全宗名冊數(shù)據(jù)集的字段3,依賴于全宗號(hào),并設(shè)置過濾館藏案卷級(jí)目錄的全宗號(hào)等于全宗名冊的字段2;同一全宗號(hào)中的檔案按年代匯總,年代縱向擴(kuò)展,來自于館藏案卷級(jí)目錄數(shù)據(jù)集的歸檔年代;永久本年卷冊設(shè)置為依賴于歸檔年,分組匯總求和館藏案卷級(jí)目錄數(shù)據(jù)集的案卷數(shù),過濾篩選數(shù)據(jù)集保管期限=“永久”,累計(jì)設(shè)置公式:=G6[A6:-1]+ F6,即擴(kuò)展的上一行的永久累計(jì)加本行的永久本年;下面長期和短期的做法類似于永久。合計(jì)即永久+長期+短期,合計(jì)本年的公式為:=F6+J6+N6,累計(jì)的公式為:=G6+K6+O6。
4.生成目標(biāo)報(bào)表
模板數(shù)據(jù)集和報(bào)表模板設(shè)計(jì)好以后,就可以使用設(shè)計(jì)器預(yù)覽,修改格式,最終導(dǎo)出成需要的格式,可以是EXCEL、WORD 和PDF格式,還可以設(shè)置成需要打印的格式。每個(gè)全宗擴(kuò)展,同一全宗中,按年代分永、長、短三類分組匯總卷冊數(shù),并累計(jì),如表2展示。
表2 館藏檔案數(shù)量統(tǒng)計(jì)表
該方法最大的優(yōu)點(diǎn)是簡單高效,最顯著的特點(diǎn)是能一次性生成多張報(bào)表,最重要的工具是報(bào)表軟件。使用該方法制作的報(bào)表數(shù)據(jù)準(zhǔn)確,格式統(tǒng)一,一次操作以后直接使用,大大提高了館藏檔案數(shù)據(jù)統(tǒng)計(jì)的效率。該方法能避繁就簡,將檔案管理人員從繁雜的數(shù)據(jù)中解脫出來,在制作檔案管理各種臺(tái)賬的過程中可以得到廣泛運(yùn)用。