丁晨
明年是官方發(fā)行的第一張紙幣——交子誕生10 0 0年。無獨有偶,在距離交子誕生地——成都近20 0 0公里的上海,一項有關“紙幣數(shù)字化”的課題也于近日完成初步階段。這便是由國家文物鑒定委員會委員、上海博物館青銅研究部研究館員周祥主持的中宣部“文化名家暨四個一批人才”自選課題“民國紙幣研究信息化建設”。
周祥國家文物鑒定委員會委員 上海博物館青銅研究部研究館員
此項課題歷時5 年時間,對上海博物館收藏的民國紙幣進行數(shù)據(jù)采集、信息識別、以圖識圖,從而建立了一個上海博物館館藏民國紙幣數(shù)據(jù)庫。這是全國文物博物館領域首次將人工智能技術運用于學術研究的一種嘗試和探索。日前,《中國收藏》雜志記者在上海與周祥面對面,就這一課題做了一次深入訪談。周祥表示,他是從上海博物館舉辦的多次數(shù)字藝術大展中獲得的靈感。比如上海博物館曾于2 018年舉辦“丹青寶筏——董其昌書畫藝術大展”,其中所展示的“董其昌數(shù)字人文展示系統(tǒng)”依托博物館自身的藏品、研究轉化為以“董其昌”為中心的知識圖譜,收獲了不錯的社會反響。周祥從中看到了博物館藏品數(shù)字化、信息化所帶來的機遇,“ 既然館藏書畫作品可以數(shù)字化展現(xiàn),為什么館藏紙幣不可以呢?”敢于突破、勇于創(chuàng)新的周祥認為——紙幣數(shù)字化,勢在必行!但是在具體實施過程中,周祥卻面臨著一個又一個的難題。
據(jù)不完全統(tǒng)計,上海博物館收藏民國紙幣有1萬余張,包括由國民政府、國家銀行、商業(yè)銀行、地方銀行等發(fā)行的各類紙幣。豐富的館藏對于課題的開展是一個便利條件,周祥也想借這個機會近距離接觸實物藏品。一張張平面的紙幣要用三維展示,怎么實現(xiàn)?圖像抓取、信息識別、數(shù)據(jù)庫建立……對于深植于傳統(tǒng)學術研究領域的周祥來說,數(shù)字化是一個完全陌生的領域。
《中國收藏》:為什么會選擇“民國紙幣研究信息化建設”這個方向作為課題?
通過智能標注功能,系統(tǒng)可以提取民國紙幣主景圖組合的深層特征。
周祥:自從進入上海博物館工作之后,我一直從事傳統(tǒng)的學術研究,習慣性根據(jù)經驗對文物進行判斷。但是人的記憶不是恒定的,會在不同的時期產生偏差,即人的經驗和記憶會存在差錯率。因此,我想借課題機會,利用科技和信息化的手段,將紙幣上所包含的信息進行拆解,將它們變成一組組真實可靠的數(shù)據(jù)。
得益于人工智能和A I技術的迅速發(fā)展,如果這個課題放到今天,可操作性和完成度會更高。但是,“ 民國紙幣研究信息化建設”課題啟動時是在5 年前。當時,人工智能與A I 技術剛剛在國內興起,所以,這些科技手段能成為紙幣數(shù)字化研究的手段嗎?關于這個問題,我當時在心里畫了個問號。
《中國收藏》:開展課題的第一步是什么?
周祥:搭建數(shù)據(jù)庫。在這個過程中,圖像是最基礎也是最關鍵的一步。在博物館工作有一個很大的優(yōu)勢,那就是可以接觸到大量的珍貴文物,這些文物可以成為理論研究的重要實物支撐。這也是區(qū)別于以文獻作為主要參考對象的院校研究的最大不同。
因此,在課題開展過程中,我也參與到藏品拍攝、成像等過程中。專業(yè)的攝制團隊對圖片進行拍攝,在保管員的監(jiān)督下,由我將藏品取出,當藏品四個角度的拍攝均完成后,再由我遞交給保管員入庫。盡管有部分藏品已經進行過圖像留存,但我還是選擇統(tǒng)一重新拍攝,為的就是用新的標準補全所有藏品的信息。在近距離接觸了這些館藏紙幣后,我對它們的了解也更加深入。
按照步驟來說,數(shù)據(jù)庫搭建完成之后,接下來應該拆解藏品信息,并借助專業(yè)的軟件與技術提取相關信息。然而,究竟要提取哪些信息?不同的信息該如何分類?這就需要課題主持人對于這一領域有著深入的研究,且能夠在實際過程中結合所發(fā)生的各種變量,運用個人知識儲備不斷修訂方案,而這也正是周祥的優(yōu)勢所在。
《中國收藏》:在拆解信息的過程中,您曾遇到過哪些難題?
周祥:一張紙幣上往往包含著許多信息,比如發(fā)行機構名稱、印刷機構名稱、底紋、顏色、邊框、簽名等。在拆解這一步驟時,我初步確定了需要拆解的信息類目,有7 8 項,然后請上海博物館多媒體信息中心的同事幫忙。他們依據(jù)我提供的參考標準,運用專業(yè)的軟件與先進的技術提取相關信息。但是在這個過程中,我們卻再次遇到了難題。
這主要是因為不同的紙幣在印刷時并未采用固定的標準,因此不同紙幣所承載的信息存在特殊性,而當時確定好的細分項無法完全覆蓋每一張紙幣。比如,僅“底紋”一項,不同的紙幣就可能給出不同的答案,因此只能用“有無底紋”進行區(qū)分。但有時發(fā)現(xiàn),僅以“ 有”“無”進行判斷,還是會略顯寬泛,因此我們進一步調整了規(guī)范,將標準劃定為“有無底紋,底紋為數(shù)字、文字或圖案”。
大洋票、小洋票、銀元票、銅元票……眾所周知,中國紙幣發(fā)行的過程中產生了多種命名形式,不同的紙幣也各有其特征。但是在搭建系統(tǒng)進行信息化采集與處理時,需要盡可能簡化流程,而將不同的命名全部納入系統(tǒng)之中是不現(xiàn)實的,因此,如何將紙幣上的信息進行標準化統(tǒng)一,也是一大難題。
《中國收藏》:通過搭建這一系統(tǒng),可以實現(xiàn)怎樣的效果?
周祥:有些紙幣自稱兌換券,我們就不能將其命名為銀元券。關于這些問題,都需要結合專業(yè)知識進行規(guī)范化分類,將其劃分到不同的類目中,這樣等到數(shù)據(jù)庫建立完成之后,大家在檢索時才能一目了然。而且,我想要做的這個數(shù)據(jù)庫不僅需要提供文字檢索功能,還需要達到以圖搜圖、以圖識圖的效果。因此,當明確與統(tǒng)一了不同紙幣之間的語義問題之后,系統(tǒng)搭建的最后一步是——運用AI技術進行識圖處理。
“民國紙幣研究信息化建設”是全國文物博物館領域首次將人工智能技術運用于學術研究的一種嘗試和探索。
如今在這個系統(tǒng)中,如果我提交與“交通銀行”四個字有關的圖片,系統(tǒng)將會從宣統(tǒng)元年至2 0世紀4 0年代之間有關交通銀行發(fā)行的紙幣顯示出來。由于貨幣制度改革是中央銀行集中發(fā)行制定的,因此在這30余年的時間里,“交通銀行”四個字的書體也發(fā)生過改變。而這個識圖系統(tǒng)也運用A I技術與精密的算法,對不同的書體進行了標注,以圖片的形式呈現(xiàn)出來。在識別到圖片之后,系統(tǒng)會根據(jù)這張圖片與所查詢圖片中相關書體的相似度,按照相似度大小進行升降序排列,并顯示在圖片的信息介紹欄中。由此,查詢者可以通過這個系統(tǒng),掌握歷史上有關交通銀行行名的多種寫法,并且查詢到相關書籍以及使用數(shù)據(jù),形成知識累積。
不僅如此,通過這個系統(tǒng),還可以把目前學界已公開發(fā)表的理論著述和研究信息都導入其中,然后將相應的資料和數(shù)據(jù)對應到某張具體的紙幣上。在信息查閱的過程中,如果有人對當前學界針對某張藏品的研究有誤或持有不同觀點,系統(tǒng)也提供留言功能,查詢者可以將個人觀點發(fā)布在留言處。
每一關都是難題,每一關都是挑戰(zhàn)。在周祥的堅持與努力下,目前,上海博物館收藏民國紙幣的數(shù)字化模型已初步搭建完畢,這預示著周祥“紙幣數(shù)字化”的課題也告一段落。作為紙幣數(shù)字化探索方面的先行者,提及課題開展的過程,周祥感慨良多,他坦言道:“這對于我來說是個不小的挑戰(zhàn),剛開始的時候確實有點摸不著頭腦,但真正開始著手項目之后,又十分想把它做好。受制于資金限制,目前這一項目只進行到初步階段,要想進一步深入研究,還需要以一張張紙幣為藍本,細細鉆研與提取其中的信息,也需要對系統(tǒng)進行進一步的維護與完善,這是一個長期的過程,需要更大的資金支持以及投入更多的精力?!?/p>
據(jù)悉,該系統(tǒng)目前僅限上海博物館內部人員使用,周祥認為:“運用現(xiàn)代科技手段可以搭建起一個數(shù)字化的研究平臺,進而在傳統(tǒng)研究的基礎上開辟出另一種新的研究路徑、研究手段與研究方法,為館內研究員從事研究提供便利。我也很希望能有人將這個課題繼續(xù)做下去,并且期待未來這個系統(tǒng)能夠作為公開使用的平臺,惠及更多致力于錢幣領域研究的學者朋友?!保ㄗⅲ罕疚呐鋱D由周祥提供)
“民國紙幣研究信息化建設”系統(tǒng)目前僅限上海博物館內部人員使用。周祥期待未來該系統(tǒng)能夠作為公開使用的平臺,惠及更多錢幣研究者和愛好者。