湯 萌 張 潔
(上海交通大學(xué)圖書館,上海 200030)
?
【文史論苑】
來源視角下的地方歷史文獻整理流程研究
——以上海交通大學(xué)圖書館為例
湯 萌 張 潔
(上海交通大學(xué)圖書館,上海 200030)
上海交通大學(xué)圖書館針對地方歷史文獻館藏制定了由入藏、編號、修復(fù)、編目、歸庫構(gòu)成的標(biāo)準(zhǔn)整理流程。在整理過程中,依據(jù)來源信息編號、來源狀態(tài)歸庫保存,并且在編目中設(shè)計體現(xiàn)來源信息的元數(shù)據(jù)項目,即檔案號、日期、事主、歸戶、地域等。從來源視角整理地方歷史文獻,并應(yīng)用于后續(xù)的數(shù)字化、數(shù)據(jù)庫開發(fā)過程,將有助于研究者在多脈絡(luò)的環(huán)境下觀察文獻,推動地方歷史文獻的文獻學(xué)方法、數(shù)據(jù)化分析及其他新的研究議題。
地方歷史文獻;來源原則;數(shù)字化;歸戶;元數(shù)據(jù)
2006年,上海交通大學(xué)歷史系在浙江省松陽縣石倉地區(qū)發(fā)現(xiàn)一批保存完整、連續(xù)性好的契約文書,并將這批資料整理出版,形成一系列針對清代鄉(xiāng)村社會的研究。[1]此后,2009-2013年間,上海交通大學(xué)歷史系又通過文書市場搜集近35萬件各類民間文書,并轉(zhuǎn)入上海交通大學(xué)圖書館(以下簡稱“上交大圖書館”)保藏、整理。地方歷史文獻通常與圖書館入藏的書籍性質(zhì)不同,因此,近年來研究者已先后討論如何建立資源分類法,如何對資料進行數(shù)字化建設(shè)和數(shù)據(jù)庫開發(fā)[2-4],并已有成功利用這些資料的案例。[5,6]
2012至今,筆者參與了這批資料到館后的整理加工工作,本文將總結(jié)上交大圖書館已經(jīng)形成的整理流程,提出并論證“來源視角”作為地方歷史文獻整理原則的合理性與推廣建議。目前,以館藏資料進行研究,主要是針對已經(jīng)整理完成后的狀態(tài),即數(shù)字化與文獻研究。但是,地方歷史文獻這類資料應(yīng)如何整理,以適用于數(shù)字化建設(shè)與文獻研究,在此前的研究中尚未提及。在徽州文書與清水江文書的整理中,尊重民間文書的來源為學(xué)者們所重視。[7,8]不過,目前這些整理原則、方法主要是以紙質(zhì)出版為導(dǎo)向,上交大圖書館的整理流程則自始即以數(shù)字化為導(dǎo)向,因而對實體保藏、掃描、編目都進行了面向數(shù)字化的規(guī)范設(shè)計。
整理實務(wù)中,圖書館館員們歸納了文獻整理的標(biāo)準(zhǔn)流程,即初次編號、殺蟲除塵、二次編號、修復(fù)、掃描、歸庫。上交大圖書館入藏的地方歷史文獻來自文物市場,在入藏前經(jīng)過了一定的流轉(zhuǎn)過程。流轉(zhuǎn)過程中,書商通常只是用報紙等對文獻進行簡單包裝,并且流轉(zhuǎn)過程中的受潮、蟲蝕等問題都在所難免,文書間的位置關(guān)系也比較復(fù)雜。上述整理流程正是針對這樣的現(xiàn)狀提出的。2009-2012年間,入藏的資料暫存于上海交通大學(xué)歷史系山極晃文庫,使用密集書架放置。2012年之后轉(zhuǎn)入圖書館以開放式書架保存。
(一)初次編號
文書搜集過程中以“包”和“袋”為單位?!鞍笔菚淘谑占^程中形成的文獻群單位,“袋”則是收集者在不同時間收集到文獻的聚合單位。文獻入藏后,登記“包”和“袋”的收集時間,以及文獻所保留的地點、人物等來源信息,并制作文獻的編號卡片。這在整理流程中稱為初次編號。
(二)殺蟲除塵
文書整理初期使用冰箱除蟲,此后改用沖氮殺蟲法。所有文書在清點及二次編號前以原始狀態(tài)進行殺蟲、除塵。
(三)二次編號
文獻轉(zhuǎn)入整理流程后,拆去原始包裝,逐漸清點文書,噴水后用鬃刷刷平整,之后進行二次編號。每件文書的編號為14位號段。編號由“來源人物碼(2)—收集日期編號(6)—包排列序號(2)—件排列序號(4)”組成。來源人物碼的含義是文書市場中的搜集來源人,收集日期編號即入藏日期,也即“袋”的編號,包排列序號指書商收集過程中的順序編號,件排列序號則是在打開每一包時,順序清點賦予的流水號。編號用宣紙裁成的紙條貼于文書背面。由以上步驟形成的14位編號是每一件文書的唯一身份識別號碼。操作中,單件文書每一頁計為1件,簿冊文書每一冊計為1件。
每完成一包編號,需及時登記,登記內(nèi)容包括操作時間、包號、單張件數(shù)、成冊件數(shù)、需修復(fù)件張數(shù)等,據(jù)此撰寫《上海交通大學(xué)地方文獻編號工作日志》。流程管理員登記每天編號工作進度,統(tǒng)計工作總量和速度,根據(jù)《編號工作日志》填寫《上海交通大學(xué)地方文獻需修復(fù)文獻跟蹤表》。
(四)依據(jù)不同破損程度確定流程
本流程規(guī)范在制定初始即劃分“需修復(fù)文獻”和“不需修復(fù)文獻”?!靶栊迯?fù)文獻”修復(fù)完成后,需轉(zhuǎn)入掃描包裝流程,而“不需修復(fù)文獻”可能在掃描時受到損傷,需轉(zhuǎn)入修復(fù)流程。所以,兩項工作的交叉無可避免,如何在修復(fù)掃描完成后有序地匯總整理成為整個流程暢通有效的重要問題。依據(jù)破損程度設(shè)計流程的核心原則是完成整批次修復(fù)后才能進入下一批次修復(fù)。
(五)修復(fù)
在清點與編號過程中,工作人員發(fā)現(xiàn)大量文書存在破損情況,因此也制定了修復(fù)流程。修復(fù)管理的難點是要保持多流程平行協(xié)作。整理流程中,文書清點、編號后將直接掃描,但破損文書則需要修復(fù)后再掃描。因此,修復(fù)流程管理中,需要同時在掃描文書流程中登記修復(fù)中的待掃描文書,并在修復(fù)文書流程中登記修復(fù)文書所屬的待掃描序列,也即管理兩個平行工作的流程。
(六)掃描
上交大圖書館新藏地方歷史文獻以電子化利用作為文獻整理與資源建設(shè)的主要方向,因此,文獻清點后全部進行掃描。掃描的難點是出圖的規(guī)格與質(zhì)量。正式掃描前,需要平整文書,這樣平板掃描時,圖片上不會有褶皺的痕跡。掃描質(zhì)量應(yīng)根據(jù)后期用途決定。尤其值得注意的是,單件文書如果紙張背面也有字跡,也應(yīng)當(dāng)掃描,正面與背面的掃描圖合并為一個圖檔,方便使用者閱讀。
(七)歸庫
文書完成編號、修復(fù)、掃描后,將歸入庫藏保存。文書使用宣紙、塑料儲存箱及開放式書架(樟木柜)保存。文書以“包”為單位保存,每一個來源的“包”在保藏時歸并在一起,單件文書每10件用1張宣紙包裹,簿冊每冊用1張宣紙包裹,全部文書依編號順序放入儲存箱。再將儲存箱按照初次編號順序排列在開放式書架上。倉庫中配有溫度、濕度檢測,保證恒溫恒濕環(huán)境。
地方歷史文獻為何要按照以上方法進行整理?筆者提出的文獻整理方法論是來源原則。來源原則是檔案學(xué)中的概念。檔案學(xué)的全宗原則(respect des fonds)指同一機構(gòu)或個人創(chuàng)建、積累、維護、使用的資料必須按照原始順序(如果有的話)放在一起(視為屬于同一集合體)。[9]也就是說,應(yīng)以文獻產(chǎn)生時的來源單位作為文獻保管的基本單位,從而避免打破文獻之間既有的有機聯(lián)系。經(jīng)典的檔案學(xué)理論認(rèn)為,“向文件中心或檔案館移交文件之前,在事務(wù)活動過程中形成、保管和/或利用文件的組織或個人”,即構(gòu)成來源。[10]此外,檔案學(xué)理論認(rèn)為,文件具有生命周期,包括文件從產(chǎn)生直至因喪失作用而被銷毀或者因具有長遠歷史價值而被檔案館永久保存的整體運動過程。[11]
地方歷史文獻具有與檔案相似的性質(zhì)。本文所說的地方歷史文獻主要指兩類材料:一類是民間日常生活中形成的文書,亦可稱之為民間文書;一類是基層政府行政中形成的檔案。前者往往具有功能性,是為了應(yīng)對民間生活中的具體事務(wù)書寫形成,如土地買賣、借貸、婚喪、宗教儀式等。具體事務(wù)結(jié)束后,文書也就完成其使命,永久或半永久地放置不用,這正如檔案學(xué)所說的文件生命周期。也正因此,事實上,人們今天所面對的民間文書僅僅是漫長歷史過程中保留下來的一小部分,絕大多數(shù)民間文書已經(jīng)在使用結(jié)束后自然消亡了。至于后者,則本身即為檔案,完全可以使用檔案學(xué)的整理方法。
來源對于地方歷史文獻具有特殊的意義,它區(qū)別于物理形態(tài)、內(nèi)容信息,屬于文獻身份識別的本質(zhì)屬性之一,它獨立于文獻實體和內(nèi)容信息,存在于歷史流傳過程中。簡言之,來源包括文獻產(chǎn)生、流轉(zhuǎn),以及保存的時間、地點、人物、事由和狀態(tài)。整理實務(wù)中,我們在歸戶欄中登記文獻來源的人或社會組織及其所屬的行政區(qū)劃、家族信息,由此反映文獻與文獻之間的關(guān)系,有助于整理者回溯文獻形成的過程。
地方歷史文獻可以應(yīng)用來源原則進行整理,整理實務(wù)中,以收購方式或田野調(diào)查方式獲得的文獻應(yīng)使用不同的來源登記方法。對文獻內(nèi)容進行編目及元數(shù)據(jù)處理時,人名、地域等能反映來源的信息也應(yīng)采用標(biāo)準(zhǔn)化的提取與描述,以便于后續(xù)的數(shù)據(jù)庫開發(fā)與研究利用。
目前,地方歷史文獻類的館藏,主要有通過收購渠道獲得,通過田野調(diào)查獲得實物或電子檔復(fù)制品等途徑。通過收購渠道獲得的文獻,以上海交大館藏為例,多數(shù)在入藏時仍然保留著來源信息。實際上,采購者在收購時就傾向于購買來源信息完整的文獻。在某些地域甚至已經(jīng)形成了固定的來源信息標(biāo)準(zhǔn)化格式,如交大館藏的部分福建文獻,其來源信息包括歸戶、收藏時間、包數(shù)、每包件數(shù),每一次收購來的文獻都記載以上詳細信息,其歸戶格式為“省—縣—鄉(xiāng)—村—姓氏”。
通過田野調(diào)查獲得的文獻,其保存類型分為入藏文獻實物與入藏文獻復(fù)制品兩種。為了保留文獻原有的保存脈絡(luò),最大程度地還原來源,上海交大將大多數(shù)田野采訪所得文獻留在當(dāng)?shù)兀瑢⒃呙?、修?fù)后返還原有主人。
前文未詳細介紹的有數(shù)字化的核心環(huán)節(jié),即元數(shù)據(jù)組織,也是通常所說的編目,它是數(shù)字化與數(shù)據(jù)化的中間環(huán)節(jié)。地方歷史文獻數(shù)字化工作不僅僅是對文獻掃描,更是一個集合了整理、分類、修復(fù)、掃描、編目和數(shù)據(jù)庫建設(shè)的完整流程。因此,除掃描和修復(fù)等技術(shù)外,描述性元數(shù)據(jù)的設(shè)置與組織也是整理中的難點。圖書館學(xué)中,描述性元數(shù)據(jù)是組織揭示文獻資源的技術(shù)工具,通過描述文獻資源的內(nèi)容、范圍、權(quán)限等信息,在文獻資源與用戶之間構(gòu)建起使用的橋梁。描述性元數(shù)據(jù)可以定義為“描述和識別信息資源的特征以及分析信息資源知識內(nèi)容的數(shù)據(jù)”,一般包括用于識別某信息資源的數(shù)據(jù)(如題名、作者、制作或出版日期、支撐數(shù)字對象的原始對象信息)、知識組織數(shù)據(jù)(如責(zé)任者控制、姓名、主題等與相關(guān)主題的搭配,多個實體之間關(guān)系的識別),以及知識訪問數(shù)據(jù)等。[12]通常,元數(shù)據(jù)可提供發(fā)現(xiàn)、識別、選擇、獲取文獻資源的信息,并提供資源互操作的途徑。
從數(shù)字化的終端成果看,建立專業(yè)的分析型數(shù)據(jù)庫是目前被廣泛接受的形式,而編目與數(shù)據(jù)庫的功能設(shè)計緊密相連。數(shù)據(jù)庫蘊含的分析功能能否實現(xiàn),取決于數(shù)據(jù)庫功能的設(shè)計與編目質(zhì)量,編目字段的設(shè)計與數(shù)據(jù)庫功能框架相關(guān)。
上海交大圖書館在整理地方歷史文獻的過程中遵循了來源原則,由此進行了一系列整理及加工利用,每一個環(huán)節(jié)的操作都是為了保護文獻和它的來源脈絡(luò)。來源形成于文獻的形成過程,但需要整理者建立針對性的整理方法以及設(shè)計標(biāo)準(zhǔn)化的元數(shù)據(jù)描述才能得以體現(xiàn),并使研究者可以觀察、檢索、應(yīng)用文獻的來源信息。
對來源信息的考辨也將有助于發(fā)展地方歷史文獻針對性的文獻學(xué)方法。地方歷史文獻與傳統(tǒng)古籍具有不同的文獻學(xué)性質(zhì)。在傳統(tǒng)文獻學(xué)中,重視考據(jù)古籍的年代、序跋、牌記、紙張、墨色和避諱等信息,從而形成古籍的版本脈絡(luò)。而在地方歷史文獻研究中,從來源切入,考據(jù)文獻的形成過程,也是發(fā)展與豐富針對性的文獻學(xué)方法的有效途徑。
來源信息還將有效推進文獻的數(shù)據(jù)化分析。標(biāo)準(zhǔn)化描述的來源信息有助于挖掘文獻之間的關(guān)系,包括同一歸戶下或不同歸戶之間,通過對檔案號實施分段截取,可以獲得同一來源的文獻,即同一收集日期以及同一歸戶(地方文獻產(chǎn)生來源的人或社會組織及其所屬的行政區(qū)劃、家族信息)的文獻,以此類推,保留了契約文書的原始獲取信息及順序關(guān)系。這些信息將在后續(xù)的數(shù)據(jù)庫開發(fā)中發(fā)揮重要作用。
[1]曹樹基.石倉契約的發(fā)現(xiàn)、搜集與整理[J].客家學(xué)刊,2009,(6):146-172.
[2]李芳,陳進,王昕.上海交通大學(xué)圖書館新藏地方歷史文獻的數(shù)字化建設(shè)規(guī)劃與實踐[J].大學(xué)圖書館學(xué)報,2015,32(2):77-83.
[3]趙思淵.上海交通大學(xué)新藏地方歷史文獻的分類法及其依據(jù)[J].上海交通大學(xué)學(xué)報(哲學(xué)社會科學(xué)版),2015,22(3):76-87.
[4]趙思淵.地方歷史文獻的數(shù)字化、數(shù)據(jù)化與文本挖掘——以《中國地方歷史文獻數(shù)據(jù)庫》為例[J].清史研究,2016,(4):28-38.
[5]趙思淵.19世紀(jì)徽州鄉(xiāng)村的土地市場、信用機制與關(guān)系網(wǎng)絡(luò)[J].近代史研究,2015,(4):82-97.
[6]賈曉陽,章毅.清代初期的徽州田價:《乾隆休寧黃氏置產(chǎn)簿》研究[J].農(nóng)業(yè)考古,2016,(3):62-68.
[7]劉伯山.民間文書檔案整理的“三尊重”原則[J].安徽史學(xué),2015,(6):16-19.
[8]張應(yīng)強.清水江文書的收集、整理與研究芻議[J].原生態(tài)民族文化學(xué)刊,2013,5(3):33-38.
[9]馮惠玲.論檔案整理理論的演變與發(fā)展[A].吳寶康,丁永奎.當(dāng)代中國檔案學(xué)論[M].北京:中國檔案出版社,1988.115-167.
[10][11]馮惠玲,張輯哲.檔案學(xué)概論(第二版)[M].北京:中國人民大學(xué)出版社,2001.198.201.
[12]王松林.信息組織工具論[J].山東圖書館季刊,2008,(4):5-9.
【責(zé)任編輯:周 丹】
G254.1
A
1673-7725(2016)12-0219-04
2016-10-20
湯萌(1986-),女,山東煙臺人,助理館員,主要從事圖書館學(xué)研究。