劉麗梅
摘 要:第二次全國地名普查檔案是近三十年來全國地名工作的嶄新成果,具有資料新、數(shù)量大、現(xiàn)實性強的等特點,在我國的新一輪數(shù)字化經(jīng)濟建設(shè)中有著不可替代的作用。建設(shè)能夠適合互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、云計算意義的應(yīng)用型數(shù)據(jù)庫,則是實現(xiàn)地名檔案全社會應(yīng)用的全新引擎。為了全面推進地名檔案數(shù)據(jù)庫建設(shè),筆者從數(shù)據(jù)庫設(shè)計的基本要素出發(fā),對“二普”地名檔案數(shù)據(jù)庫建設(shè)中的界面設(shè)計和數(shù)據(jù)庫模塊設(shè)計進行了粗淺的分析,意在為全國地名檔案工作提供借鑒。
關(guān)鍵詞:普查工作;地名檔案;數(shù)據(jù)庫
第二次全國地名普查工作于2018年底結(jié)束,形成了大量的地名檔案資料。根據(jù)《全國第二次地名普查檔案管理辦法》和《全國第二次地名普查成果轉(zhuǎn)化規(guī)劃(2015--2020)》關(guān)于“建設(shè)地名信息社會服務(wù)平臺,創(chuàng)新應(yīng)用電子地圖、遙感影像、三維仿真等技術(shù)手段,拓展利用云平臺、大數(shù)據(jù)、物聯(lián)網(wǎng)等技術(shù)方式,向社會提供權(quán)威、及時、準(zhǔn)確的地名信息服務(wù)”的系統(tǒng)要求,地名檔案數(shù)據(jù)庫建設(shè)則成為當(dāng)前工作的重點。但是,時間已經(jīng)進入2020年,各地的地名檔案數(shù)據(jù)庫建設(shè)工作仍比較遲緩。為了加快“二普”地名檔案數(shù)據(jù)庫建設(shè),筆者從數(shù)據(jù)庫建設(shè)的基本原理出發(fā),對地名檔案數(shù)據(jù)庫建設(shè)的框架結(jié)構(gòu)進行了粗淺的研究,提出了地名檔案數(shù)據(jù)庫界面和模塊設(shè)計的基本思路。
1 主要界面的設(shè)計
根據(jù)數(shù)據(jù)庫的界面工作原理,數(shù)據(jù)庫的界面設(shè)計主要分為應(yīng)用層、數(shù)據(jù)層和管理層。地名檔案數(shù)據(jù)庫的界面設(shè)計意在通過人、機交互,實現(xiàn)感知信號和實際地名信息的交互,通過指令——輸出命令——結(jié)果反饋——輸出結(jié)果等一系列的計算機運算實現(xiàn)信息的提取與共享,進而達到地名檔案數(shù)字化服務(wù)社會的目標(biāo)。地名檔案數(shù)據(jù)庫的界面則屬于軟件界面設(shè)計。軟件界面是系統(tǒng)功能的延伸,是指軟件中面向操作者而設(shè)計的用于操作使用及反饋信息的指令部分,包括系統(tǒng)啟動界面、系統(tǒng)整體架構(gòu)、菜單、圖標(biāo)、按鈕、滾動條等。在地名檔案數(shù)據(jù)庫的設(shè)計中,應(yīng)本著“簡約、通用、易行、大眾”的設(shè)計理念,積極開展設(shè)計工作。功能界面應(yīng)包括著錄、掃描、借閱、質(zhì)檢、統(tǒng)計、編輯著錄等。
1)著錄界面。著錄界面是整個系統(tǒng)的信息形成的核心界面之一,其功能是通過該界面的命令導(dǎo)引進入工作界面,進而開展著錄工作。該界面以Excel的形式展開,第一行為著錄項目,下方為表格填充項。其中著錄項目包括地名檔案的所有項目,而且在有新的需求時還可以拓展,進而為地名檔案的著錄打開了廣闊空間。
2)掃描界面。掃描是全國第一次地名普查檔案數(shù)字化的重要內(nèi)容之一,是檔案真實性、原始性的集中反應(yīng),沒有掃描件作為參照,著錄的數(shù)據(jù)的真實性將遭到質(zhì)疑。為了確保掃描工作的完整性、檔案的原始性、數(shù)據(jù)比對的真實性,在軟件的設(shè)計中,我們采用點陣數(shù)據(jù)庫的形式,將掃描件存入圖形數(shù)據(jù)庫。在界面展示上則呈現(xiàn)出橫縱向排列的圖形界面,只顯示檔案的紙張形態(tài),和按照規(guī)則進行排列的整體圖案。
3)查閱界面。檔案查詢借閱是對外服務(wù)功能的核心,檢索功能的強弱,調(diào)閱速度的快慢,檢全率的高低,直接考驗軟件使用功能的成敗。查閱界面的圖標(biāo)以書頁的圖案表示,當(dāng)你點擊這個圖標(biāo)后,將顯示一個對話框,讀者可以根據(jù)自己的需求,按照專名、通名、區(qū)劃類別、地名類別進行查閱。
4)質(zhì)檢界面。質(zhì)量檢查是核驗著錄準(zhǔn)確率的重要環(huán)節(jié),是保證著錄內(nèi)容與掃描件完全一致的重要手段。沒有全面、系統(tǒng)、準(zhǔn)確的質(zhì)檢,檔案的真實性將大打折扣,也意味著檔案數(shù)字化工作的失敗。為了提高著錄工作的準(zhǔn)確率,在質(zhì)檢界面的設(shè)計中,著重體現(xiàn)了國家檔案局關(guān)于質(zhì)量標(biāo)準(zhǔn)的要求和規(guī)范,在界面表示上,數(shù)據(jù)庫內(nèi)的數(shù)據(jù)以電子表格的形式呈現(xiàn),以區(qū)縣為單位建立數(shù)據(jù)庫,實施分列,按排列順序和檔號加以區(qū)分。當(dāng)點擊要質(zhì)檢的條目時,可同時打開檔案原件的掃描件,進行對照。查驗后,發(fā)現(xiàn)錯誤,可在機上立刻修改,完成質(zhì)檢。
5)統(tǒng)計界面。檔案統(tǒng)計是檔案工作的重要內(nèi)容,是制定檔案工作發(fā)展規(guī)劃、實施目標(biāo)任務(wù),指導(dǎo)檔案工作健康發(fā)展的重要環(huán)節(jié)。因此,在統(tǒng)計界面的設(shè)計上,要體現(xiàn)獨特的功能。為實現(xiàn)上述目標(biāo),在統(tǒng)計界面的設(shè)計上,應(yīng)本著“科學(xué)使用,項目齊全、功能完備”的原則,設(shè)計多功能的統(tǒng)計界面。通過總按鈕打開后,可以按照下拉式菜單的方式,分別鍵入通名、類別、專名、曾用名、行政區(qū)劃、全稱、簡稱等進行統(tǒng)計。
6)編輯界面。這里提及的編輯功能并不是對掃描件、原著錄內(nèi)容的修改,并不是修改數(shù)據(jù)庫中的原件,而是可以將其中著錄原文下載,然后編輯利用。為了實現(xiàn)這一功能,在地名檔案數(shù)據(jù)庫軟件的設(shè)計中,應(yīng)突出下載功能,為用戶提供更加廣闊的利用空間,也可為檔案管理者修史編志提供極大便利。
2 數(shù)據(jù)庫的設(shè)計
“二普”地名檔案數(shù)據(jù)庫是以多個分支數(shù)據(jù)庫為支撐的系統(tǒng)數(shù)據(jù)源,其核心是通過融合多個數(shù)據(jù)庫的感知信號和實際地名信息的交互,完成輸出、輸入指令的信息系統(tǒng)。為了實現(xiàn)功能的互聯(lián)互通,在第二次全國地名普查檔案數(shù)據(jù)庫的設(shè)計中,至少應(yīng)建立以下基礎(chǔ)數(shù)據(jù)庫。
1)目錄數(shù)據(jù)庫。目錄數(shù)據(jù)庫就是對檔案目錄進行存儲、處理和維護的軟件系統(tǒng)。對現(xiàn)存目錄的電子化,是其中的核心要素。地名檔案目錄的電子化主要包括以下內(nèi)容:一是對檢索目錄項的設(shè)置,要體現(xiàn)長遠性、統(tǒng)一性和實用性;二是要保證電子目錄字段的多樣性和全面性。為了確保關(guān)鍵字查詢的有效性,其字段應(yīng)包括以下內(nèi)容:全宗號、檔案號、保管期限、責(zé)任者、文號、題名、日期、頁數(shù)、備注9個字段。三是設(shè)置電子目錄中檢索項題名項中任意關(guān)鍵詞進行自動標(biāo)引和檢索,形成友好、方便、使用的檢索界面。
2)圖形掃描數(shù)據(jù)庫。圖形數(shù)據(jù)庫,是地名檔案數(shù)據(jù)庫的重要數(shù)據(jù)庫之一,它的意義在于實現(xiàn)著錄檔案內(nèi)容與實體檔案內(nèi)容的比對,是確保檔案真實性的重要環(huán)節(jié)。從內(nèi)容來看,主要包括圖形文件和文書文件兩部分,它們在總數(shù)據(jù)庫下又分為多個分支區(qū)塊。二者的數(shù)據(jù)庫建設(shè)的標(biāo)引和著錄體系均體現(xiàn)了地名的核心要素,其中包括名稱、漢語拼音、曾用名、地名由來、地理概況、區(qū)劃屬性、隸屬關(guān)系、類別等。
3)全文著錄數(shù)據(jù)庫。全文著錄數(shù)據(jù)庫,是二普地名檔案數(shù)據(jù)庫的根數(shù)據(jù),是數(shù)據(jù)庫建設(shè)的核心,其巨大的容量、海量的數(shù)據(jù)構(gòu)成了數(shù)據(jù)庫的有力支撐。在全文著錄的系統(tǒng)設(shè)計過程中,應(yīng)著重考慮全國第二次地名普查檔案進館后的容量空間和詞條新的變化情況,一是留足了空間,二是為新增的地名標(biāo)志、地名成果圖、名稱審定、地名標(biāo)準(zhǔn)化處理、少數(shù)民族地名譯寫、行政區(qū)域界線標(biāo)繪做好了先期設(shè)計等。
4)照片數(shù)據(jù)庫。在這次地名普查中形成了大量的照片檔案,是地名檔案中的寶貴資料。為了實現(xiàn)二普照片檔案數(shù)據(jù)庫開發(fā)的專屬性,既要完善其數(shù)量體系,又要實現(xiàn)檢索和存儲路徑的互通。在檢索系統(tǒng)設(shè)計上,要依據(jù)二普檔案——圖片——屬地——名稱——內(nèi)容說明,等標(biāo)引項,展開設(shè)計。在路徑設(shè)計上,盡量與圖形掃描數(shù)據(jù)庫區(qū)別開來,防止二者混淆。數(shù)據(jù)庫中的每一張圖片均與其相應(yīng)的地名檔案相對應(yīng),并與地名著錄數(shù)據(jù)庫相關(guān)聯(lián)。當(dāng)用戶查閱某一條地名時,該照片也同步實現(xiàn)相應(yīng)的組合展示,使地名檔案的圖形實感效應(yīng)立現(xiàn)。
5)圖書資料數(shù)據(jù)庫。圖書資料是地名檔案的重要內(nèi)容之一,是地名普查工作的真實記錄,是地名普查成果轉(zhuǎn)化的具體表現(xiàn),其主要包括地名志、地名錄、地名詞典、地名圖和地名工作的其他資料。為了提高利用率,在軟件開發(fā)中應(yīng)開辟專門的地名圖書資料數(shù)據(jù)庫。數(shù)據(jù)庫的主要按圖書的類型設(shè)立文件夾,夾內(nèi)再進行細(xì)分到每本圖書,并建立單獨目錄和檢索工具,便于檢索利用。