王愛(ài)民 葛彥強(qiáng) 劉國(guó)英 葛文英 周宏宇 王丁磊
1 安陽(yáng)師范學(xué)院計(jì)算機(jī)與信息工程學(xué)院 455002
2 數(shù)字甲骨學(xué)研究所 455002
甲骨文計(jì)算機(jī)輔助綴合技術(shù)研究
王愛(ài)民1、2葛彥強(qiáng)1劉國(guó)英1、2葛文英1周宏宇1王丁磊1
1 安陽(yáng)師范學(xué)院計(jì)算機(jī)與信息工程學(xué)院 455002
2 數(shù)字甲骨學(xué)研究所 455002
計(jì)算機(jī)輔助甲骨文碎片綴合,是整理甲骨的一種先進(jìn)技術(shù)。研究甲骨片圖像的輪廓信息的提取與輪廓跟蹤算法,建立甲骨片數(shù)據(jù)庫(kù),研制了基于邊界匹配的甲骨文綴合輔助系統(tǒng),選定待綴合的甲骨碎片后,該系統(tǒng)可以自動(dòng)生成疑是目標(biāo)甲骨碎片的動(dòng)態(tài)數(shù)據(jù)庫(kù),甲骨文專(zhuān)家只需要基于“備選甲骨碎片數(shù)據(jù)庫(kù)” 通過(guò)人機(jī)交互來(lái)實(shí)現(xiàn)甲骨文綴合。
甲骨文;綴合;計(jì)算機(jī);邊界匹配;算法
文獻(xiàn)標(biāo)示碼:A
inscriptions on bones or tortoise shells;rejoining;computer;contour matching
甲骨文是我國(guó)古代占卜用的龜甲和獸骨上的文字,是我國(guó)迄今發(fā)現(xiàn)的最早的一種成熟文字系統(tǒng),在我國(guó)文字發(fā)展史上占有重要地位。特別是,甲骨文里記錄了不少關(guān)于商(殷)朝政治、經(jīng)濟(jì)、文化、習(xí)俗等許多方面的內(nèi)容,是研究上古歷史,尤其是商代歷史不可替代的第一手材料,它們的出現(xiàn),解決了不少歷史之謎。據(jù)最近的統(tǒng)計(jì),甲骨出土的數(shù)量已多達(dá)十五萬(wàn)片,今后的新發(fā)現(xiàn)還不可預(yù)料。
由于甲骨質(zhì)脆,又經(jīng)歷了近三千年的歲月,所以在出土?xí)r多已裂成碎片。只有盡可能地將這些碎片綴合在一起,才能更好地了解卜辭的文例、位置和語(yǔ)法規(guī)律,更全面地研究卜辭的內(nèi)容。在甲骨文的研究工作中,綴合破碎的甲骨片是一項(xiàng)重要的準(zhǔn)備步驟。然而,傳統(tǒng)的甲骨片綴合過(guò)程工作量很大,如果全靠人力來(lái)整理將是十分困難的。能否設(shè)計(jì)出一種新的方法,使甲骨學(xué)家從這一繁重的工作中解放出來(lái)?這是學(xué)術(shù)界共同關(guān)注的問(wèn)題。隨著計(jì)算機(jī)技術(shù)的發(fā)展,利用計(jì)算機(jī)技術(shù)輔助甲骨文綴合已經(jīng)成為甲骨文研究、考釋和應(yīng)用的一個(gè)新的課題。1973年,美國(guó)加州大學(xué)周鴻翔教授利用電腦技術(shù)對(duì)甲骨片綴合進(jìn)行了嘗試,可以作到完整的或大致完整的骨版的綴合;1974年,國(guó)內(nèi)也有人從事這方面的研究,可以將一骨版的1/4以上的碎片進(jìn)行綴合。當(dāng)然,這些研究在理論上、技術(shù)上、方法上都有待進(jìn)一步改進(jìn),與甲骨文研究的需要相比都還存在很大差距,有待于通過(guò)大量的研究實(shí)踐來(lái)發(fā)展和完善。目前,擬定的綴合條件包括時(shí)代、字跡、骨版、碎片、卜辭、邊緣六項(xiàng),除了“時(shí)代”一項(xiàng)以外,都是用圖形顯示的,因此只要在電子計(jì)算機(jī)上利用一臺(tái)光讀器的設(shè)備,就可以直接輸入圖像,隨著我國(guó)電子技術(shù)的迅速發(fā)展和普及,不斷提高卜甲綴合的自動(dòng)化水平,將是完全可能的事。
2001年8月起,我們成立了甲骨文計(jì)算機(jī)輔助綴合課題組,開(kāi)始了基于“碎片、邊緣、骨版、卜辭、字跡”的甲骨文計(jì)算機(jī)輔助綴合研究,在理論和技術(shù)上都取得了重要的階段性成果。
理論上講,對(duì)于給定待綴合甲骨碎片,只要存在目標(biāo)碎片,我們總是可以找到的,也就是說(shuō)甲骨文的綴合問(wèn)題一定有解。但是,目前發(fā)掘甲骨的總數(shù)量約在十五萬(wàn)片左右,要想從十五萬(wàn)個(gè)甲骨片中找到待綴合的甲骨碎片,靠人工綴合的工作難度是可想而知的。特別是,基于“骨版、碎片、邊緣”的人工綴合通常需要實(shí)物作支撐。找到滿(mǎn)足“骨版、碎片、邊緣”綴合條件后的甲骨文碎片(稱(chēng)為疑是目標(biāo)碎片),再通過(guò)“時(shí)代、字跡、卜辭”三個(gè)要素進(jìn)行終級(jí)綴合。
據(jù)統(tǒng)計(jì),十五萬(wàn)個(gè)甲骨片收藏分布情況是這樣的:十多萬(wàn)片廣布于大陸四十個(gè)城市的九十多個(gè)單位,主要集中在中國(guó)科學(xué)院、國(guó)家博物館、南京博物館等地。臺(tái)灣有二萬(wàn)五千多片。國(guó)外的二萬(wàn)六千多片,其分布情況大致如下:日本有12443片,主要藏于東京大學(xué)考古教研室,東京大學(xué)教養(yǎng)學(xué)部博物館,京都大學(xué)人文科學(xué)研究所,東京國(guó)立上野博物館,東洋文庫(kù),書(shū)道博物館等。加拿大有7802片,主要藏于皇家安大略博物館。英國(guó)有3355片,主要藏于倫敦大英博物館,蘇格蘭博物院,劍橋大學(xué)圖書(shū)館,牛津大學(xué)東方藝術(shù)博物館等。美國(guó)有1882片,主要藏于普林斯頓大學(xué),哥倫比亞大學(xué),哈佛大學(xué),都市藝術(shù)博物館,歷史與技術(shù)博物館,自然歷史博物館,國(guó)會(huì)圖書(shū)館等。德國(guó)有715片,主要藏于柏林民俗博物館。蘇聯(lián)有199片,主要藏于彼得格勒博物館,愛(ài)爾米塔什博物館。瑞典有100片,主要藏于斯德哥爾摩遠(yuǎn)東博物館。瑞士有99片,主要藏于巴費(fèi)爾人種博物館。法國(guó)有64片,主要藏于巴黎大學(xué),柴魯斯基博物館,奎木爾博物館。比利時(shí)有7片,藏于皇家藝術(shù)博物館。韓國(guó)有6片,藏于漢城大學(xué)。
就甲骨片的收藏分布情況來(lái)看,直接利用甲骨片實(shí)物輔助綴合目前是不現(xiàn)實(shí)的。據(jù)報(bào)道,也有人通過(guò)查閱大量的甲骨文拓片和有關(guān)的解釋資料,綜合考慮“時(shí)代、字跡、骨版、碎片、卜辭、邊緣”六項(xiàng)條件實(shí)現(xiàn)了部分甲骨文碎片的綴合。顯然這種綴合成功的概率很小。計(jì)算機(jī)技術(shù)的發(fā)展,為甲骨文綴合、甲骨文研究、考釋和應(yīng)用開(kāi)辟了的一個(gè)全新的研究領(lǐng)域。遺憾的是,甲骨文計(jì)算機(jī)輔助綴合的進(jìn)展還不能滿(mǎn)足人們的需要。只是淺層次的直接輔助,缺少系統(tǒng)研究,特別是用人工錄制標(biāo)本信息工作量大,而且不甚準(zhǔn)確。我們從甲骨文拓片入手,在基于“邊界匹配”的甲骨文綴合方向,進(jìn)行了長(zhǎng)期的研究與實(shí)踐工作,在理論和技術(shù)兩個(gè)方面都取得了重要的研究成果,受到了有關(guān)甲骨文專(zhuān)家好評(píng)。
從目前出土的甲骨來(lái)看,除了龜甲和牛骨外,也發(fā)現(xiàn)用其他動(dòng)物骨頭來(lái)刻辭的,如牛的肋骨,或鹿、羊、豬的肩胛骨,甚至人的頭蓋骨,但數(shù)量極少。我們知道,對(duì)于給定的待綴合甲骨片來(lái)說(shuō),很容易判斷出它是龜甲與否,下面的問(wèn)題應(yīng)該是,選擇在龜甲拓片中找目標(biāo)碎片還是在牛骨(含其他)拓片中找目標(biāo)碎片,這樣可以少做無(wú)用勞動(dòng),提高綴合速度。基于以上分析,我們的研究是從以下幾個(gè)方面開(kāi)展的。
1、建設(shè)通用甲骨片數(shù)據(jù)庫(kù)。在《甲骨文合集》、《小屯南地甲骨》等(均為海內(nèi)外具有國(guó)家級(jí)受譽(yù)的出版物)7 種甲骨文著作中需要綴合的碎片的基礎(chǔ)上,建設(shè)甲骨片數(shù)據(jù)庫(kù)(數(shù)據(jù)庫(kù)Ⅰ、數(shù)據(jù)庫(kù)Ⅱ)。其中數(shù)據(jù)庫(kù)Ⅰ中記錄卜甲(龜甲)碎片的全部信息,數(shù)據(jù)庫(kù)Ⅱ中記錄卜骨(牛骨和其他骨片)碎片的全部信息。該數(shù)據(jù)庫(kù)的設(shè)計(jì)目標(biāo)是,既支持甲骨文計(jì)算機(jī)輔助綴合也支持甲骨文人工綴合、甲骨文研究、考釋和其他應(yīng)用。
2、對(duì)甲骨片圖像預(yù)處理,獲取甲骨片圖像的輪廓信息。這項(xiàng)工作主要包括去噪、分割、分割結(jié)果后再處理和輪廓跟蹤等幾個(gè)主要工作程序。去噪主要用于去除甲骨片圖像成像過(guò)程中的成像噪聲,為后續(xù)的圖像分割奠定基礎(chǔ);圖像分割是檢測(cè)出甲骨片圖像區(qū)域,綴合成功與否的基礎(chǔ);形態(tài)學(xué)處理的主要目的是為了形成甲骨片的閉合圖像區(qū)域,用以完整地表示甲骨片的輪廓信息;輪廓跟蹤的目的是獲取甲骨片的輪廓信息。為了后續(xù)輪廓匹配的需要,待綴合甲骨片的輪廓跟蹤和建立甲骨片數(shù)據(jù)庫(kù)時(shí)采用的跟蹤方向相反。
3、研究甲骨片邊界片段的提取策略。甲骨文計(jì)算機(jī)輔助綴合過(guò)程中,采用的是從數(shù)據(jù)庫(kù)中逐段搜索能夠匹配的輪廓片段的方式。因此,如何從待綴合輪廓中選擇合適邊界片段、以及如何從數(shù)據(jù)庫(kù)候選輪廓中選擇候選邊界片段就成為整個(gè)系統(tǒng)能否運(yùn)行的關(guān)鍵。最簡(jiǎn)單的方式是設(shè)定一個(gè)固定的輪廓片段長(zhǎng)度Comp_len,從待綴合的輪廓和數(shù)據(jù)庫(kù)中某一候選輪廓中直接截取Comp_len長(zhǎng)的輪廓片段進(jìn)行匹配。然而,這種截取方式會(huì)帶來(lái)較大的問(wèn)題:(1)Comp_len太小,難以表達(dá)輪廓片段的特征,在匹配過(guò)程中會(huì)從數(shù)據(jù)庫(kù)中找出非常多的可匹配甲骨片;(2)Comp_len太大,選取的輪廓片段有可能會(huì)跨越多個(gè)可匹配甲骨片輪廓區(qū)域。因此,如何選擇合適的甲骨片輪廓片段的提取策略對(duì)整個(gè)系統(tǒng)的運(yùn)行效果有著非常重要的作用。一種改進(jìn)的策略便是從較小的Comp_len開(kāi)始進(jìn)行匹配,并設(shè)定一定的步長(zhǎng),隨著匹配的成功再逐漸地增加提取輪廓的長(zhǎng)度。
甲骨片數(shù)據(jù)庫(kù)Ⅰ和甲骨片數(shù)據(jù)庫(kù)Ⅱ的結(jié)構(gòu)是相同的,設(shè)計(jì)的幾個(gè)主要數(shù)表結(jié)構(gòu)如圖1、2、3、4所示。
圖1 甲骨片圖像表結(jié)構(gòu)
圖2 甲骨片輪廓表結(jié)構(gòu)
圖3 甲骨片鏈碼表結(jié)構(gòu)
圖4 甲骨片信息表結(jié)構(gòu)
目前已經(jīng)將《甲骨文合集》、《小屯南地甲骨》等7套書(shū)中的待綴合的甲骨片進(jìn)行了處理(所有甲骨碎片的選取,都經(jīng)過(guò)甲骨文研究人員重新臨摹并加???、釋文),甲骨片數(shù)據(jù)庫(kù)Ⅰ(卜甲)已經(jīng)收錄5829個(gè)待綴合的碎片、甲骨片數(shù)據(jù)庫(kù)Ⅱ(卜骨)收錄2622個(gè)待綴合的碎片。
該數(shù)據(jù)庫(kù),已經(jīng)在有關(guān)甲骨文專(zhuān)家的“文字考釋”、“甲骨文編輯、編碼”等研究中得到應(yīng)用,很受好評(píng)。
基于邊界信息的甲骨片計(jì)算機(jī)輔助綴合系統(tǒng)的整體框架圖如圖5所示。待綴合甲骨片經(jīng)過(guò)圖像的預(yù)處理之后可以獲取甲骨片的輪廓,整個(gè)系統(tǒng)通過(guò)逐段輪廓比較的方式從甲骨片數(shù)據(jù)庫(kù)中尋找能夠匹配成功的候選甲骨片。在甲骨片數(shù)據(jù)庫(kù)中存儲(chǔ)了能夠搜集到的所有甲骨片的圖像編碼以及甲骨片的輪廓信息。
為了提高計(jì)算速度,在綴合工程中,我們建立了與甲骨片數(shù)據(jù)庫(kù)結(jié)構(gòu)相同的動(dòng)態(tài)備選甲骨碎片數(shù)據(jù)庫(kù)??紤]文章篇幅,有關(guān)的甲骨片圖像的輪廓信息提取技術(shù)、邊界片段特征信息的提取計(jì)算法、邊界信息匹配算法等內(nèi)容我們將在另文介紹。
圖5 基于邊界的甲骨片綴合系統(tǒng)框架
實(shí)驗(yàn)證明,當(dāng)甲骨片數(shù)據(jù)庫(kù)中存在目標(biāo)甲骨碎片時(shí),基于邊界的甲骨文計(jì)算機(jī)輔助綴合系統(tǒng)可以自動(dòng)將其找到。事實(shí)上,來(lái)自不同甲骨上的碎片僅就其邊界而言,可能是相同的。也就是說(shuō),對(duì)于給定的待綴合甲骨碎片,一般情況下,在基礎(chǔ)數(shù)據(jù)庫(kù)中會(huì)存在多個(gè)疑是目標(biāo)甲骨碎片,系統(tǒng)會(huì)自動(dòng)生成動(dòng)態(tài)備選甲骨碎片數(shù)據(jù)庫(kù)。對(duì)于疑是目標(biāo)甲骨碎片的判斷,需要根據(jù)“時(shí)代、字跡、骨版、卜辭”通過(guò)人機(jī)交互來(lái)實(shí)現(xiàn)。
顯示人機(jī)交互過(guò)程的關(guān)鍵算法如下:
人機(jī)交互中數(shù)據(jù)處理的有關(guān)算法將在另文介紹,交互綴合的工作界面如圖6所示。由于完成人機(jī)交互綴合,需要甲骨文“時(shí)代、字跡、骨版、卜辭”的知識(shí)作支撐,通常情況下,這項(xiàng)工作應(yīng)該由甲骨文專(zhuān)家完成。
本文建設(shè)甲骨片數(shù)據(jù)庫(kù),既支持甲骨文計(jì)算機(jī)輔助綴合也支持甲骨文人工綴合、甲骨文研究、考釋和其他應(yīng)用。已經(jīng)被有關(guān)甲骨文專(zhuān)家所用,并且很受歡迎。
對(duì)待綴合的甲骨文碎片,基于甲骨片數(shù)據(jù)庫(kù),應(yīng)用《甲骨文計(jì)算機(jī)輔助綴合系統(tǒng)》,可以自動(dòng)生成動(dòng)態(tài)備選甲骨碎片數(shù)據(jù)庫(kù)(能為甲骨文綴合人員節(jié)省大量的時(shí)間),調(diào)用甲骨文人機(jī)交互綴合系統(tǒng),以甲骨文“時(shí)代、字跡、骨版、卜辭”的知識(shí)作支撐,可以實(shí)現(xiàn)甲骨文的綴合。
目前,甲骨片數(shù)據(jù)庫(kù)的信息量還不到需求量的1/15,還有很多工作要做,特別是信息處理速度太慢,有關(guān)算法需要進(jìn)一步完善。今后我們計(jì)劃把人工智能技術(shù)應(yīng)用到人機(jī)交互綴合系統(tǒng),不斷提高自動(dòng)化程度。
圖6 甲骨文交互綴合系統(tǒng)界面
[1] Freeman H. On the encoding of arbitary geometric configurations. IRE Trans, 1961, 10:260-268.
[2] Freeman H. Shape description via the use of critical potions. Pattern Recognition, 1978, 10:159-166.
[3] Freeman H. Computer processing of line drawing images. ACM Computing Surveys, 6:57-97.
[4] Zhan C T, Roskies R Z, Fourier descriptors for plane closed curves. IEEE Trans.Computer, 1972, 21(3): 269-281.
[5] Persoon E, Fu K S. Shape descrimination using Fourier descriptors. IEEE Trans. System,Man, Cybernetics, 1977, 7(3): 170-179.
[6] Teague M R. Image analysis via the general theory of moments. J. Opt Soc Amer., 1980,70:920-930.
[7] 岡薩雷斯(著), 阮秋琦(譯).數(shù)字圖像處理(Matlab版).北京:電子工業(yè)出版社.2006.4.
[8] 劉宏申, 秦鋒. 確定輪廓形狀匹配中形狀描述函數(shù)的方法. 華中科技大學(xué)學(xué)報(bào)(自然科學(xué)版).2005.4, 33(4): 13-16.
[9] C Papaodysseus, etal. Contour - Shape Based Reconstruction of Fragment, 1600 B. C.Wall Paintings [ J ]. IEEE Transactions On Signal Processing, June 2002, 50 (6) : 1277 –1288.
[10] 賈海燕, 朱良家等. 一種碎紙自動(dòng)拼接中的形狀匹配方法.計(jì)算機(jī)仿真.2006.月, 23(11): 180-183.
[11] 商朝甲骨. http://www.xtmm.cn/2009/0924/yMMDAwMDAxMzkyMg_4.html
The System Designation for the Computer Aided Rejoining of the Bones/Tortoise Shells with Inscriptions Based on Contour Matching
Wang Aiming Ge Yanqiang Liu Guoying Ge Wenying Zhou Hongyu Wang Dinglei
1 School of Computer & Information Engineering, Anyang Normal University, Anyang, Henan, 455002
2 Institute of Digital Inscriptions on Bones/Tortoise Shells, Anyang, 455002
The computer aided rejoining is an advanced technology for the arrangement of the bones or tortoise shells with inscriptions. In this paper, we have studied the algorithms for contour extracting and tracking from these shell images and algorithms for extracting the feature vectors of the contour segments. We established a database for the oracle shell images, and developed a computer aided system based on the contour matching technology. After a being rejoined shell is selected, this system can automatically find a dynamic database for the possible target shells.Based on which, the experts can carry out the shell rejoining only by hand-computer interaction.
TP311. 1
王愛(ài)民(1957-)男,教授,博士,研究方向:數(shù)據(jù)挖掘與智能技術(shù)、甲骨文信息處理。