——以“版本源流考訂”為例*"/>
李明杰,盧 彤,高曉文
版本源流有兩重含義:一是廣義的版本源流,指的是文獻制作方式的演變源流,如寫本源流、拓本源流、刻本源流、石印本源流;二是狹義的版本源流,指的是單種文獻(含叢書)在傳抄、翻刻等傳播過程中形成的錯綜復雜的版本傳承關(guān)系。本文探討的即為狹義的版本源流。對單種文獻版本演變源流的考訂,其意義不僅在于梳析歷代同書異本之間的傳承脈絡(luò),更在于從現(xiàn)有的存本中發(fā)現(xiàn)和推薦善本。我國文獻整理向來有考訂版本源流的傳統(tǒng),積累了大量相關(guān)的研究成果。這些成果有的以分散形式呈現(xiàn),如文獻中附載的大量序、跋、敘錄、校勘記;有的以集中形式出現(xiàn),如版本目錄、版本學專著,以及今人發(fā)表的版本學論文。這些既有的版本源流考訂成果,如果能在古籍數(shù)字化系統(tǒng)中以一種恰當形式呈現(xiàn),既可以避免后來的研究者進行重復性勞動,也可為讀者指明可供利用的善本。為此,本文結(jié)合實例,探討“版本源流考訂”這一文獻整理傳統(tǒng)對于古籍數(shù)字化的參照價值。
文獻在產(chǎn)生之初,就因在記錄、傳播等各個環(huán)節(jié)出現(xiàn)的主觀或客觀因素,產(chǎn)生同書異本現(xiàn)象。所謂版本是指同一種文獻在講誦、鑄刻、抄寫、傳拓、印刷、攝錄等不同形式的傳播過程中,因書名卷數(shù)、篇章次序、文字內(nèi)容、裝訂形式等方面的差異而形成的不同物質(zhì)形態(tài)[1]。同一種文獻因版本的不同,其學術(shù)價值、文物價值和審美價值也大不相同。從研究和利用文獻的目的出發(fā),人們都希望讀到內(nèi)容與文獻初始面貌較為接近的版本。但在沒有祖本的情況下,什么樣的版本與文獻的初始面貌最為接近,哪些類型的版本從文本的整體性來看最為可靠,這就需要對文獻的各種版本進行鑒別和比較,對其源流進行梳理和考訂。
早期對文獻版本源流的考訂與佛經(jīng)的整理有極大關(guān)系。佛經(jīng)自東漢明帝時傳入中國以來,主要依賴口譯筆受的方式傳播,但因譯出多門,傳承派別有異,再加經(jīng)文前后學說改易,各種譯本極為混亂,因此有學者萌發(fā)了追討“正本”的想法。中國歷史上第一位漢族僧人朱士行,“常于洛陽講《道行經(jīng)》,覺文章隱質(zhì),諸未盡善,每嘆曰:‘此經(jīng)大乘之要,而譯理不盡,誓志捐身,遠求大本?!煊谖焊事段迥?260年),發(fā)跡雍州,西渡流沙。既至于闐,果得梵書正本?!盵2]晉代時佛經(jīng)的版本問題更為復雜,支敏度在整理《合維摩詰經(jīng)》時,發(fā)現(xiàn)有支恭明、竺法護、竺叔蘭三家譯本,“余是以合兩令相附,以明所出為本,以蘭所出為子,分章斷句,使事類相從。令尋之者瞻上視下,讀彼案此,足以釋乖迂之勞,易則易知矣。若能參考校異,極數(shù)通變,則萬流同歸,百慮一致?!盵3]支敏度提出的“萬流同歸,百慮一致”是中國古代版本源流考訂思想的最早表達。
唐初雕版印刷技術(shù)發(fā)明以后,經(jīng)五代初步發(fā)展,至兩宋大規(guī)模應用,文獻傳播效率和傳播范圍得到極大提升,但也加劇了同書異本現(xiàn)象的產(chǎn)生,導致學者更加重視版本源流的考訂。入宋以后,以序、跋或書目解題的形式對文獻版本源流進行考訂已成為學術(shù)常態(tài)。蘇頌《補注神農(nóng)本草總序》考訂了《神農(nóng)本草》自兩漢以來的版本流變過程:先由兩漢的三卷本至南梁的七卷本、唐二十卷本,再由唐本分為宋本和后蜀本,而宋本又有詳定和重定之別;沈晦《柳先生集序》不僅敘述了柳宗元文集的版本源流情況,還對各版本的異同、優(yōu)劣、選取底本的依據(jù)等都作了說明;吳若《杜工部集序》不僅指明《杜工部集》的建康府本是李端明本、鮑欽止本互校的結(jié)果,還對二本中“稱樊者”“稱晉者”“稱荊者”“稱宋者”等的版本來源進行了說明;吳正子《箋注評點李長吉歌詩外集》不僅指明了李賀詩集的秘閣本與姚氏本、賀鑄本與宣城本的源流關(guān)系,并且通過篇卷的考察,論證了鮑本與宣本源自同一版本[4]。宋代還出現(xiàn)了版本目錄和版本學專著,關(guān)于版本源流的考訂以更加集中的形式表現(xiàn)出來。晁公武《郡齋讀書志》和陳振孫《直齋書錄解題》均有大量考訂一種文獻版本源流的內(nèi)容。南宋淳祐年間出現(xiàn)第一部考訂版本源流的專著——曹士冕的《法帖譜系》,其在考訂版本源流基礎(chǔ)上,第一次用譜系圖的形式形象地揭示《淳化閣法帖》眾多版本的傳承關(guān)系。
及至明清,受雕版印刷技術(shù)成熟、商品經(jīng)濟萌芽、宋元舊槧收藏價值提高等因素影響,士人講求版本的風氣達至鼎盛。對藏書家而言,對版本源流的考訂有助于揭示文獻的收藏價值。特別是乾嘉時期考據(jù)學興盛,促使藏書家更加重視版本,在購求藏書時必須具備鑒別真?zhèn)闻c版本考訂的能力。孫從添在《藏書記要·鑒別》中云:“夫藏書而不知鑒別,猶瞽之辨色,聾之聽音。雖其心未嘗不好,而才不足以濟之,徒為識者所笑,甚無謂也。”[5]學者更多地把考訂版本源流作為文獻整理的輔助手段,透過比較版本間的差異來解釋特定版本的學術(shù)價值,達到指明善本的目的。余嘉錫云:“一事也,數(shù)書同見,此書誤,參之他書,而得其不誤者焉。一語也,各家并用,此篇誤,參之他篇而得其不誤者焉。文字音韻訓詁,則求知于經(jīng)。典章官制地理,則考之于史。于是近刻本之誤,宋元刊本之誤,以及從來傳寫本之誤,罔不軒豁呈露,瞭然于心目,躍然于紙上。”[6]這一時期(特別是清代)版本源流考訂成果的形式更加豐富,除序言、題跋、書目解題(以《四庫全書總目提要》為代表)、版本學專著(以《書林清話》為代表)外,還出現(xiàn)了大量的讀書記、善本書志等,如錢曾的《讀書敏求記》、丁丙《善本書室藏書志》、王國維的《傳書堂藏善本書志》。
版本源流考訂的學術(shù)傳統(tǒng)至今有其現(xiàn)實意義,尤其是對古籍數(shù)字化而言,因為從本質(zhì)上講,古籍數(shù)字化仍屬于古籍整理的范疇,必然要遵循古籍整理原有的學術(shù)范式。但從古籍數(shù)字化實踐看,很長一段時期內(nèi)以技術(shù)為先導,缺乏對古代文獻整理學術(shù)傳統(tǒng)的借鑒。之前筆者曾撰文論及古籍數(shù)字化過程中種種學術(shù)失范的現(xiàn)象[7],此不贅述。僅從版本源流考訂的學術(shù)傳統(tǒng)來看,其價值缺失在古籍數(shù)字化中主要表現(xiàn)為以下幾個方面。
第一,底本選擇未能參照版本源流考訂的成果。底本選擇是古籍數(shù)字化的一個關(guān)鍵環(huán)節(jié)。因為底本選擇的不慎,一旦劣本化身千萬,不僅使善本因錯失入選數(shù)據(jù)庫的機會而被湮沒,還會將劣本的錯訛放大和擴散,貽誤讀者,嚴重的還將攔腰截斷前代學人對單種文獻的整理成績。遺憾的是,在古籍數(shù)字化實踐中,由于缺少版本學專業(yè)的指導,人們對底本的選擇往往遵循易獲得性原則,如不少古籍數(shù)據(jù)庫選用《四庫全書》本作為底本就是例證。實際上對于很多古籍而言,四庫本的內(nèi)容經(jīng)過四庫館臣的篡改和抽換,并不是最善的版本。因此,古籍數(shù)字化之前底本的選擇,應遵從版本學研究的規(guī)律,借鑒前人版本源流考訂的成果,從現(xiàn)有存本中擇出最優(yōu)良的版本。
第二,版本源流信息在古籍數(shù)字化過程中被遺失。從現(xiàn)有的古籍數(shù)字化成果來看,人們往往把注意力集中在古籍正文的數(shù)字化轉(zhuǎn)換上,而對正文之外的其他副文本缺乏足夠的重視,有時甚至直接刪略,如序言、題跋、??庇?、注釋、批語等等。而這些寫于不同時期的副文本,反映了該書在不同歷史階段成書、翻刻、整理、傳閱的經(jīng)過,保存了不少關(guān)于該書原始的版本源流信息,加上傳統(tǒng)的書目解題,都是后人考訂該書版本源流的重要參考資料。因此筆者建議,在古籍數(shù)字化整理過程中,不僅要保留文獻中的各種副文本信息,甚至還應將歷代書目關(guān)于該書的版本著錄信息及書目解題,與正文一并作為數(shù)字化的內(nèi)容。
第三,對前人版本源流考訂成果未能有效開發(fā)利用。對一書版本源流考訂的結(jié)果,是歷代版本學家經(jīng)科學考訂后給出的客觀描述或主觀判斷,既有對微觀的文獻載體形態(tài)特征的著錄,也有宏觀的版本源流梳理;既包含了與文獻整理和傳刻相關(guān)的歷史人物、地理、時間等信息,也包含了比較不同版本之間內(nèi)容與形式差異的描述,具有豐富的語義內(nèi)涵。但如果只是對序言、題跋、??庇洝刻嵋冗M行數(shù)字文本的轉(zhuǎn)換,讀者很難從中獲取直接的版本源流考訂成果。如果借助現(xiàn)代信息技術(shù)手段,對這些零散的版本源流信息進行數(shù)據(jù)加工,使之以直觀的形式呈現(xiàn)出來,則能極大地方便讀者參考與利用。
文獻學家對版本源流進行考訂,其最終目的是為讀者或研究者提供可靠的版本。從讀者與研究者利用文獻的角度而言,“可靠”的版本至少有兩層含義:一是在文字上最接近“原本”;二是在內(nèi)容和語義上最接近“原本”。文字上最接近“原本”的版本,一指抄寫或翻刻次數(shù)較少,在出版時間上與祖本較為接近的本子;二指那些經(jīng)過精心??保M量把文獻在各種不同形式的傳播環(huán)節(jié)中有意或無意產(chǎn)生的錯誤降至最低。內(nèi)容和語義上最接近“原本”的版本,是指那些經(jīng)過名家標點和注釋的版本?,F(xiàn)存文獻因為與成書之初的年代相隔久遠,對于后世的讀者來說,可能因為文字本身的發(fā)展演變以及地理名稱、行政區(qū)劃、職官制度的更替變遷而產(chǎn)生隔閡。因此,把歷代名家注疏與批校等內(nèi)容以副文本的形式加入原有的文獻之中,可以滿足后世讀者準確把握和理解文獻內(nèi)容與語義的需求。
版本學家考訂一書的版本源流,梳理一書歷代版本之間的傳承關(guān)系,可以讓后來者參照其研究成果,考察某一特定版本與祖本的親疏遠近,根據(jù)版本信息提供的線索定位該版本在整個版本譜系中的位置,以便從中選擇最可靠的版本。盡管這類研究成果很多,但從目前古籍數(shù)字化產(chǎn)品看,版本源流考訂的成果尚未得到充分的數(shù)字化利用。若能對其中的版本源流譜系進行合理的組織與加工,使譜系圖從二維的平面圖像轉(zhuǎn)為計算機可識別的元數(shù)據(jù)資源,把經(jīng)過加工的版本源流信息嵌入已有的古籍數(shù)據(jù)庫檢索平臺,提供檢索結(jié)果的可視化輸出,或以RDF等信息描述框架建立類似人名規(guī)范庫的開放資源,則可極大地方便研究者自由獲取古籍版本信息。
目前國內(nèi)關(guān)于中文古籍版本領(lǐng)域本體較具影響力的研究成果,有武漢大學信息管理學院鄧仲華等依據(jù)版本學領(lǐng)域知識構(gòu)建的“學習型古籍版本知識庫”和上海圖書館夏翠娟等從循證學角度構(gòu)建的“中文古籍聯(lián)合目錄及循證平臺”。鄧仲華等的“學習型古籍版本知識庫”研究成果是針對本體語言與本體構(gòu)建技術(shù)運用于古籍版本知識數(shù)據(jù)的結(jié)構(gòu)化組織與系統(tǒng)化存儲上的探索性研究,以此作為構(gòu)建古籍版本數(shù)據(jù)庫的基礎(chǔ),鑒于非專業(yè)與專業(yè)研究者的不同需求,該數(shù)據(jù)庫面向非專業(yè)用戶設(shè)計,目的是方便用戶了解、使用和查詢古籍版本學基礎(chǔ)知識,由古籍版本術(shù)語庫、古籍版本學史庫、單書版本源流庫、廣義版本源流庫等4部分組成,將版本學領(lǐng)域的知識以語義網(wǎng)的表現(xiàn)形式予以組織與揭示[8]。夏翠娟等的“中文古籍聯(lián)合目錄及循證平臺”使用的“古籍循證”概念是基于“循證實踐”與“循證社會學思想”而生發(fā)出的一種版本學領(lǐng)域的數(shù)字人文學理念。與傳統(tǒng)版本學依靠經(jīng)驗為主的版本鑒定方法不同,該理念以古籍目錄的記載和古籍文獻中的內(nèi)容事實(包括物理證據(jù)、內(nèi)容證據(jù)、歷史證據(jù)與關(guān)聯(lián)證據(jù))為依據(jù),將科學的研究方法與研究人員的經(jīng)驗結(jié)合起來,以解決特定研究問題。該平臺根據(jù)不同學科領(lǐng)域的研究需求,將所收錄的機構(gòu)古籍館藏目錄、現(xiàn)代古籍聯(lián)合目錄,與我國歷代不同來源、不同格式的古籍目錄,按照FRBR的“作品-內(nèi)容表達-載體表現(xiàn)-單件(WEMI)”四層模型與BIBFRAME 的“作品-版本-單件(WII)”三層模型的基本結(jié)構(gòu),提出了中文古籍書目框架的“作品-版本-單件”+“注釋”+“分類”的“3+2”古籍書目框架模型,實現(xiàn)了聯(lián)合目錄檢索、循證研究等研究輔助功能[9]。
圖1 《宛陵集》版本源流譜系圖
相較于上述兩種研究成果,本文研究實踐與其異同點在于:第一,不以版本學的領(lǐng)域知識為對象構(gòu)建學習型古籍版本知識庫,而是以具體的版本源流研究成果為描述對象構(gòu)建研究輔助型的古籍版本知識庫;第二,不以歷代官修目錄、史志目錄與古籍聯(lián)合目錄等書目信息為著錄對象進行基于“群體”的大規(guī)模循證研究,而是以近代具體的版本源流考據(jù)成果(主要指版本源流考訂的學術(shù)文章與專著)為研究對象,以本體方法揭示一種文獻各版本與責任者之間的語義關(guān)系;第三,不論版本存佚,同樣以“作品-版本-單件”的古籍書目框架為基礎(chǔ),來揭示一種文獻完整的版本源流譜系以及其中的責任者關(guān)系?;谏鲜霎愅?,本文嘗試以本體構(gòu)建法,將“版本源流考訂”學術(shù)傳統(tǒng)嵌入古籍數(shù)字化實踐中,為開發(fā)符合專業(yè)研究習慣的古籍數(shù)字化產(chǎn)品提供參考方案,構(gòu)建面向?qū)I(yè)用戶的研究型版本源流知識庫。通過本體類、本體屬性與本體實例設(shè)計,以RDF 資源描述框架將古籍版本源流信息表現(xiàn)為細粒度的語意結(jié)構(gòu),以充分揭示同書異本之間的源流關(guān)系,在新的數(shù)字環(huán)境下踐行版本源流考訂的學術(shù)傳統(tǒng)。
本文選擇筆者關(guān)于梅堯臣《宛陵集》版本源流的考訂成果作為本次實驗的數(shù)據(jù)來源和揭示對象。根據(jù)傳世序跋、書目提要及各家文集的記載,筆者對宋代詩人梅堯臣《宛陵集》紹興本之前的各家稿本系統(tǒng)、各刻本的祖本、紹興本之原貌、紹興本之后的歷代刻本源流進行考辨和梳理,以版本源流譜系形式揭示《宛陵集》稿本的形成經(jīng)過以及眾多刻本之間的源流關(guān)系,參見圖1。
在進行版本源流知識庫的結(jié)構(gòu)設(shè)計之前,需先提取出其中所欲揭示的信息,并以關(guān)系型數(shù)據(jù)數(shù)據(jù)庫結(jié)構(gòu)予以表示。在版本源流譜系中,人物、作品、版本、評價及其之間的關(guān)系是重要的信息單元,應分別為其設(shè)計數(shù)據(jù)表與數(shù)據(jù)類型,并定義表間關(guān)系。本次實踐的表間ER圖與各表數(shù)據(jù)類型如圖2所示。
(1)人物(Person)。人物是古籍版本流傳過程中的責任者,人物數(shù)據(jù)表存儲與作品、版本及研究成果產(chǎn)生關(guān)聯(lián)的人物信息,包括人名、其他名稱、朝代與職業(yè)等,表間關(guān)系以責任方式(Act)連接。不同的責任方式與連接的實體所對應的是不同的人物類型,與作品相關(guān)聯(lián)的人物是指作者或曾參與該作品內(nèi)容創(chuàng)作的責任者,如注疏者、編纂者;與版本相關(guān)聯(lián)的人物是指參與改變作品載體形態(tài)的責任者,如出版者、作序者與刻工;與評價結(jié)果相關(guān)聯(lián)的人物是指曾對該作品的特定版本做出鑒定的版本研究者。
圖2 表間關(guān)系與數(shù)據(jù)類型
(2)作品及其內(nèi)容表達(Work)。在FRBR的定義中,作品(Work)是一個抽象的實體,由作品的實現(xiàn)方式或內(nèi)容表達(Express)來識別,作品本身只存在于不同內(nèi)容表達的共性內(nèi)容之中,而內(nèi)容表達能反映同一作品在不同實現(xiàn)方式之間存在的知識或藝術(shù)內(nèi)容的區(qū)別[10]。為方便操作,本文簡化了作品與內(nèi)容表達之間的層級關(guān)系,以作品為實體建立數(shù)據(jù)表,并創(chuàng)建“其他名稱”數(shù)據(jù)項來存儲抽象作品下的具體內(nèi)容表達,以達到根據(jù)作品層面聚集載體表現(xiàn)的目的。
(3)版 本(Manifesta‐tion)。版本對應的FRBR實體為載體表現(xiàn)(Mani‐festation),是一部作品內(nèi)容表達的物理體現(xiàn),即“同書異本”。實踐中建立版本數(shù)據(jù)表以存儲版本的各種外在特征,包括版本名稱、其他名稱、版本類型、行款、序跋、版次、存佚情況、卷數(shù)、出版地、出版年、附錄等信息;同時建立版本與作品間的表間關(guān)系,表示兩者的從屬關(guān)系。
(4)版本評價(Work Comment)。版本評價是歷代版本研究者對某一文獻特定版本所給出的評價結(jié)果,因評價者與其所處時代的善本觀而異。實踐中建立版本評價數(shù)據(jù)表,包含評價出處(各類版本研究成果)、評價理由(內(nèi)容精粗、版式優(yōu)劣等)與評價結(jié)果(善本、劣本等)。此外,構(gòu)建該表與人物表及版本表的表間關(guān)系,表示該評價的責任者與評價對象的關(guān)聯(lián)。
本次實驗根據(jù)W3C發(fā)布的OWL本體描述語言,采用自頂向下的方式進行研究型版本源流知識庫的類、屬性與實例的結(jié)構(gòu)設(shè)計。
3.2.1 本體類設(shè)計
本體的推理是藉由描述個體所屬的類,并由類成員關(guān)系所繼承的屬性來達成,雖然個體的屬性可透過個別聲明賦予,但本體的個體推理功能仍大多是基于對類的推理。本文定義了版本、人物、作品、評價等類別。版本源流知識本體類結(jié)構(gòu)如圖3所示。
圖3 版本源流知識本體類結(jié)構(gòu)
(1)版本類(Edition)。根據(jù)文獻的具體制作工藝將版本類分為如下子類:寫本(Transcript Edition)、刻本(Block Printed Edition)、套印 本(Chromatograph Edition)、影印本(Photocopy Edition)、拓 本(Copy of Rubbings)、活 字 本(Movable Type Edition)、石印本(Lithographed Edition)及鈐印本(Sealing Style Edition)。
(2)人物類(Person)。包括某一種古文獻的各類責任者,根據(jù)責任方式將其分為如下子類:作者(Author)、 出 版 者(Publisher)、 整 理 者(Reviser)、作序者(Prefacer)、版本研究者(Scholar)、刻工(Worker)等。作者指作品的原作者,整理者指歷代參與加工作品的內(nèi)容表達者,如注疏者、校勘者、編纂者。
(3)作品類(Work)。與前文中對作品及內(nèi)容表達的簡化操作相同,便于達到根據(jù)作品實現(xiàn)版本聚類的目的。本文在作品類下創(chuàng)建內(nèi)容表達(Expression)、稿本(Manuscript)、祖本(Original Edition)與傳本(Inherit Edition)4 個子類。為區(qū)分稿本與刻本,以祖本表示現(xiàn)存刻本源流中各系統(tǒng)的最古刻本,祖本有其所依據(jù)的稿本,傳本則代表各祖本系統(tǒng)下的子本。
(4)評價類(Work Comment)。有書目題跋類(Bibliography)與考據(jù)型成果類(Research Result)兩個子類。
(5)其他。包括地點類(Location)與數(shù)值分段類(Value Partition)。地點類包括籍貫、出版單位、出版地、收藏地等與版本有關(guān)的地理信息;數(shù)值分段類是一種用于完善各類描述的特殊類,它不屬于OWL或其他本體語言,而是一種設(shè)計模式,是對建模過程中反復出現(xiàn)的問題的解決方案[11]。本文創(chuàng)建了朝代、評價結(jié)果(善本、劣本、常本)與流傳情況(佚失、稀有、通行)等數(shù)值分段子類。
3.2.2 本體屬性設(shè)計
圖4 類和對象屬性的實體關(guān)系圖
屬性是指關(guān)于類成員的一般事實和關(guān)于實例的具體事實,分為對象屬性(Object Properties)和數(shù)據(jù)類型屬性(Datatype Properties)兩類,前者表示兩個類的實例間關(guān)系,后者表示類的具體特點和事實,用于將實例關(guān)聯(lián)到數(shù)據(jù)類型[12]。本文關(guān)于類和對象屬性的ER見圖4。
(1)對象屬性。本文定義了多個對象屬性,同時根據(jù)情況創(chuàng)建逆屬性,包括:
第一,責任方式(Act)。指不同責任者對不同作品所做的行為,由于責任者因其責任方式而異,因此藉由屬性定義域、值域的設(shè)定與本體的推理,可以透過屬性推知實例所屬的類。本文中,責任方式的定義域為人物(Person);值域為作品(Work)或評價(Work Comment);子屬性包括:撰(Write)、注疏(Annotate)、編訂(Revise)、作序(Preface)、考據(jù)(Research)、收藏(Own)與出版(Publish)。
第二,所據(jù)底本(Ancestor)。指版本源流譜系中各版本所參校的版本,其逆屬性為子本(Offspring)。所據(jù)底本的定義域為作品類中的稿本(Manuscript)、祖本(Original Edition)與傳本(Inherit Edition),其中稿本與祖本的值域為稿本,傳本的值域為祖本或傳本。在《宛陵集》版本源流中,刻本的祖本“紹興本”所據(jù)底本為稿本“十五卷本梅圣俞詩集”,而傳本“嘉定本”所據(jù)底本為“紹興本”。
第三,作品聚類(Con‐tain)。指一個作品包含多個版本,定義域為內(nèi)容表達(Expression),值域為稿本、祖本與傳本;逆屬性為組成(Constitute),定義域為稿本、祖本與傳本,值域為內(nèi)容表達。如《宛陵集》由稿本“十卷本梅圣俞詩集”、祖本“紹興本”與眾多傳本(如“正統(tǒng)本”“萬歷本”“順治本”)所組成。
第四, 版本類型(Edition)。表示不同版本的載體形式,定義域為稿本、祖本與傳本,值域為版本類。如稿本十卷本《梅圣俞詩集》的載體形式為寫本,傳本“正統(tǒng)本”為刻本。
第五,評價對象(Object)。指書目提要與版本研究成果所研究的特定版本,子屬性有著錄(Record)與評價(Apprise),定義域為評價類,值域為作品。如《郘亭知見傳本書目》著錄了元代翠巖精舍本。
第六,數(shù)值分段屬性(Partition Value)。用來表示一些常用的特性劃分,如評價結(jié)果、流傳情況、時期等,定義域為稿本、祖本與傳本,值域為數(shù)值分段類。如《梅堯臣集編年校注》的評價結(jié)果為善本,流傳情況為通行本,時期為現(xiàn)代;“刪削本”的流傳情況為佚失,時期為元代。
(2)數(shù)據(jù)類型屬性。是通過數(shù)據(jù)值來描述實例的事實信息,如鄧仲華等人在《論中文古籍版本本體庫的構(gòu)建》一文中定義了多種描述版本相關(guān)信息的數(shù)據(jù)類型屬性,包括與人物相關(guān)的姓名、字、號、成就、思想、流派、籍貫、朝代、及代表作品;與版本源流相關(guān)的源流簡介、祖本名稱、祖本簡介、傳本名稱及傳本簡介;與版本相關(guān)的版本名稱、版本全文出版者、出版時間、館藏、和版本簡介等信息[8],以上屬性基本涵蓋本次實踐描述一書版本源流之所需。
3.2.3 本體實例設(shè)計
實例是類的具體成員,類則代表實例的集合,是一組人類思維概念組成的對象,因此類被用來對一些具有共性的實例進行分組,以便統(tǒng)一調(diào)用[13]。本文根據(jù)《宛陵集》的版本源流關(guān)系,將各類實例設(shè)計如下:
(1)人物類實例。作者實例為《宛陵集》作者梅堯臣;出版者實例為姜奇方、徐惇復、李士琪、李文江、柯炘、梁中孚、梅枝鳳、汪伯彥、袁旭及遲日豫等人,為各傳本的出版者;整理者實例為歐陽修、謝景初。其中,歐陽修為《梅圣俞詩稿》、十五卷本《梅圣俞詩集》的整理者,謝景初為十卷本《梅圣俞詩集》整理者;版本研究者實例為傅增湘、朱東潤、汪遠孫、莫友芝、錢泰吉等人,是曾對《宛陵集》進行著錄及研究的學者。
(2)作品類實例。內(nèi)容表達實例為《宛陵集》,又稱《宛陵先生文集》;稿本實例為《梅圣俞詩稿》、十卷本《梅圣俞詩集》、十五卷本《梅圣俞詩集》等;刻本祖本實例為紹興本,又稱紹興十年宣州軍學本;傳刻本實例包括嘉定十六年寧國府本、翠巖精舍本、過渡本、正統(tǒng)四年本、萬歷四年本、順治十六年本、康熙八年本、康熙二十六年會慶堂本、康熙四十一年白華書屋本、道光十年本、梅堯臣集編年校注等。
(3)評價類實例。評價類實例包括《宋元舊本書經(jīng)眼錄》《振綺堂書錄》《藏園訂補郘亭知見傳本書目》《甘泉鄉(xiāng)人稿》《甘泉余稿》《郘亭知見傳本書目》,以及本次實驗依據(jù)的筆者關(guān)于梅堯臣《宛陵集》版本源流考訂的成果。
(4)地點類實例。籍貫實例為宣城,是梅堯臣的出生地;出版單位實例有會慶堂、宣州軍學、白華書屋、宣城(官刻)、翠巖精舍等。
基于上文的結(jié)構(gòu)設(shè)計,本文以Protégé(5.5.0)為工具進行研究型古籍版本源流的領(lǐng)域本體的構(gòu)建。具體實驗效果如圖5所示。
(1)區(qū)間顯示版本源流相關(guān)知識的各父類及子類,包括人物類、作品類、版本類、數(shù)值分段類及評價類。
(2)區(qū)間展示根據(jù)《宛陵集》版本源流信息設(shè)計的各類的具體實例。
(3)區(qū)間顯示選定實例所屬的類,如會慶堂本屬傳刻本類,且屬數(shù)值分段類中的清代類。
(4)區(qū)間顯示與選定實例相關(guān)的對象屬性及數(shù)據(jù)類型屬性,如會慶堂本的對象屬性“所據(jù)底本”(hasAncestor)為萬歷四年本,而數(shù)據(jù)屬性則描述其版本載體特征。
Protégé中的OntoGraf插件可將所構(gòu)建的本體進行可視化,展示本體中類、屬性與實例之間的結(jié)構(gòu)關(guān)系。如圖6所示,在OntoGraf界面中以“宛陵集”為檢索詞進行檢索,其結(jié)果顯示與《宛陵集》相關(guān)的類與實例,右鍵點擊類或?qū)嵗蛇x擇所欲呈現(xiàn)的關(guān)系屬性。右鍵點擊各個實例的“所據(jù)底本”(hasAncestor)屬性,即可呈現(xiàn)出版本之間的源流關(guān)系。
圖5 研究型版本源流知識庫實現(xiàn)
圖6 以O(shè)ntoGraf呈現(xiàn)的《宛陵集》的聚類關(guān)系
版本源流考訂是我國文獻整理悠久的學術(shù)傳統(tǒng),它對梳析同書異本之間的傳承關(guān)系,發(fā)現(xiàn)和推薦善本具有重要的意義。對古籍數(shù)字化而言,版本源流考訂一方面可幫助我們選擇精良的底本;另一方面,前代學者考訂版本源流的成果也可以數(shù)字化的形式呈現(xiàn)在古籍數(shù)據(jù)庫中,以幫助讀者在從事人文歷史研究時選擇善本。版本源流考訂成果的數(shù)字化,既包括對古籍的序言、題跋、??庇洝刻嵋?、版本學論著等紙質(zhì)文本的數(shù)字化,也包括對這些成果的數(shù)據(jù)加工和可視化呈現(xiàn)。
為了在數(shù)字環(huán)境下踐行版本源流考訂的學術(shù)傳統(tǒng),本文完成了針對版本源流譜系的關(guān)系型數(shù)據(jù)庫結(jié)構(gòu)設(shè)計,并基于本體開發(fā)工具Protégé完成了以RDF資源描述框架為基礎(chǔ)的本體建模。由于關(guān)系型領(lǐng)域知識的數(shù)據(jù)庫建設(shè)需要大量的人力物力,因此目前并沒有基于古籍版本研究成果構(gòu)建的開放資源可供利用。未來與古籍版本源流考訂成果相關(guān)的本體研究,是在構(gòu)建完備的關(guān)系型數(shù)據(jù)庫前提之下,利用W3C 的RDB2RDF 工作小組所制定的R2RML、D2RQ,將關(guān)系型數(shù)據(jù)庫映射為RDF 格式的數(shù)據(jù),如此便能以SPARQL訪問非RDF數(shù)據(jù)庫,或通過Web將數(shù)據(jù)庫內(nèi)容作為關(guān)聯(lián)數(shù)據(jù)訪問,或?qū)?shù)據(jù)庫的內(nèi)容轉(zhuǎn)換為RDF 格式并予以保存,或使用Apache Jena API訪問非RDF數(shù)據(jù)庫[14]。
在版本源流譜系的可視化呈現(xiàn)上,目前有許多開源工具可供利用。例如,基于開放源代碼框架Adobe Flex 編寫的RelFinder[15],可提取并可視化RDF數(shù)據(jù)中所選對象之間的關(guān)系,交互探索對象之間的關(guān)系,具有突出顯示和過濾功能,以支持全局和詳細級別的可視化分析,并可與提供標準化SPARQL 訪問的任何RDF 數(shù)據(jù)集一起使用[16],嵌入RelFinder即可以SPARQL查詢語言實現(xiàn)對RDF數(shù)據(jù)的查詢和可視化呈現(xiàn)。