邢明旭
中文在線將與CBDB項目組共同打造中國古籍?dāng)?shù)據(jù)的數(shù)字人文資源平臺,重構(gòu)古文獻(xiàn)研究服務(wù)新脈絡(luò)。
不少重要時刻的誕生都緣自不經(jīng)意的邂逅。正如2017年的深秋,大洋彼岸的美國哈佛大學(xué)校園內(nèi),一位中國訪學(xué)者與美國教授的一次偶然相遇,不僅讓兩人成為志同道合的好友,更讓CBDB(中國歷代人物傳記資料庫)走進(jìn)了中文在線董事長兼總裁童之磊的視野,并幫助這一由海外學(xué)者牽頭、歷時30余年打造的中國歷史人文寶庫得以漂洋過海,普惠更廣泛的用戶。
剛剛過去的3月,這一愿景在初春的上海迎來了它抽枝發(fā)芽的一刻。中文在線數(shù)字出版集團(tuán)股份有限公司董事長兼總裁童之磊、哈佛大學(xué)費(fèi)正清中國研究中心包弼德教授、北京大學(xué)中國古代史研究中心史睿博士齊聚滬上,共同簽署了CBDB(中國歷代人物傳記資料庫)項目合作協(xié)議。在不久的將來,中文在線將與CBDB項目組共同打造中國古籍?dāng)?shù)據(jù)的數(shù)字人文資源平臺,重構(gòu)古文獻(xiàn)研究服務(wù)新脈絡(luò),并運(yùn)用人工智能技術(shù),提高處理歷史資料的效率和準(zhǔn)確度,聚合更多主題并不斷優(yōu)化用戶體驗。
“CBDB是現(xiàn)今數(shù)字人文(Digital Humanities)技術(shù)發(fā)展過程中的前沿成果,這與從誕生之初便以數(shù)字傳承文明為使命的中文在線的愿景不謀而合。過去,中文在線主要在大眾出版、教育出版兩個領(lǐng)域謀篇布局。與CBDB的合作,則象征著中文在線在專業(yè)出版邁出的第一步?!蓖谥赋觯爸形脑诰€有使命去推動CBDB的發(fā)展和傳播,與更多有志于傳承中華文明的同伴共建數(shù)字人文的新未來?!?/p>
緣起哈佛
在童之磊看來,人類文明和文化產(chǎn)品的發(fā)展經(jīng)歷過三個階段。在經(jīng)歷了上世紀(jì)90年代從傳統(tǒng)紙媒向數(shù)字化內(nèi)容的轉(zhuǎn)換后,如今人類文明的存續(xù)已經(jīng)進(jìn)入了全新的階段——數(shù)字人文時代。
相較于單純的紙本數(shù)字化,數(shù)字人文時代有何獨(dú)特之處?“數(shù)字人文是用數(shù)字化的方式將人文資料進(jìn)行重構(gòu),利用大數(shù)據(jù)、神經(jīng)網(wǎng)絡(luò)分析等數(shù)字技術(shù),構(gòu)建新的人文體系,這是未來非常重要的趨勢?!蓖诟嬖V《出版人》?!捌浯危瑪?shù)字人文時代充分發(fā)揮信息技術(shù)的優(yōu)點(diǎn),跨越時空,對過去的人文資料進(jìn)行高效的處理。這樣的重構(gòu)還創(chuàng)造了很多新的可能性,比如過去鮮有人考慮到的人文資料和地理信息的結(jié)合。所有這些,都讓我們得以看到全新的人文浪潮席卷而來?!?/p>
從2000年創(chuàng)辦以來,中文在線在過去的18年間成為了大量中國經(jīng)典作品的傳播平臺,這其中包括巴金、莫言等文學(xué)巨匠的作品,也包括季羨林、啟功等人文社科領(lǐng)域的大家之作。而在童之磊看來,未來中文在線很重要的一步便是在數(shù)字人文方面持續(xù)推進(jìn)。
“在這個過程中,我特別榮幸地在過去一年的哈佛大學(xué)訪學(xué)期間認(rèn)識了包弼德教授,并深深地為他和CBDB項目組多年來的努力所折服?!蓖诟嬖V《出版人》。
在包弼德教授的介紹下,童之磊對于CBDB有了深入的了解。據(jù)悉,CBDB是由哈佛大學(xué)費(fèi)正清中國研究中心、北京大學(xué)中國古代史研究中心、中研院歷史語言研究所共同主持的學(xué)術(shù)數(shù)據(jù)庫,該項目旨在將計算機(jī)技術(shù)與人文社會科學(xué)相結(jié)合,系統(tǒng)性地對中國歷史上所有重要的傳記資料進(jìn)行數(shù)字化處理,以便采用社會科學(xué)方法研究中國歷史。研究人員可以通過檢索人物ID或人名(漢字或拼音),返回豐富的結(jié)構(gòu)化人物傳記資料(生卒、別名、地理信息,任官、親屬關(guān)系、社會關(guān)系等),即在以傳統(tǒng)感性為主的人文學(xué)科研究基礎(chǔ)上引入理性技術(shù)手段,將定量分析與定性分析融為一體,輸出可視化的成果。截至目前,該數(shù)據(jù)庫共收錄超過41萬人的傳記資料。
“CBDB體量之龐大、內(nèi)容之深入讓我印象深刻,客觀來講,之前在國內(nèi)鮮有類似的以人物傳記構(gòu)建的中國歷史文化數(shù)據(jù)庫?!蓖诟嬖V《出版人》,而更加令他感到震撼的則是包弼德接手CBDB背后的原因?!鞍龅陆淌诟嬖V我,在他學(xué)習(xí)世界歷史時,中國是19世紀(jì)才出現(xiàn)的,該過程似乎就像人們發(fā)現(xiàn)了一個世界文明的旁支。這令包弼德教授非常震動,中國這樣一個幾千年沒有中斷的文明,卻在西方的世界史研究架構(gòu)當(dāng)中出現(xiàn)如此之晚,且份量如此之輕。正是基于此,包弼德教授決定接受并延續(xù)CBDB的生命,讓更多的人了解中國的歷史和文化?!?/p>
“中文在線誕生以來的愿景,就是數(shù)字傳承文明。很快我便認(rèn)定,中文在線有使命來推動CBDB這項對中華文明意義重大的工程的發(fā)展和傳播?!?/p>
助推CBDB普惠大眾
牽手后,中文在線將為CBDB注入怎樣全新的活力?在采訪中,童之磊和中文在線研發(fā)中心常務(wù)副總經(jīng)理朱厚權(quán)向記者做了詳細(xì)的介紹。
“首先很重要的一點(diǎn),便是CBDB的大眾化。”童之磊說?!爱?dāng)前CBDB項目成果的使用對象主要是非常專業(yè)的科研人員,在易用性、合理化、友好性等方面還存在相當(dāng)大的升級空間,這也是中文在線承接這個項目后首先要改進(jìn)和升級的地方?!?/p>
“很重要的一個工作,便是增加簡體版和拼音版?!敝旌駲?quán)補(bǔ)充道?!傲硗?,去年清華附小四年級學(xué)生利用大數(shù)據(jù)研究蘇軾并寫出一系列論文的事件受到社會的關(guān)注,中文在線也和該校老師進(jìn)行了交流,設(shè)想如果在當(dāng)時有CBDB這樣的數(shù)據(jù)庫可以提供給學(xué)生,類似的研究便會非常方便?!敝旌駲?quán)說?!傲硪环矫?,數(shù)字人文研究人員需要大量基于B/S的定量和定性分析工具,以解決網(wǎng)絡(luò)資源和本地資源的組合利用困境,因此為研究人員提供豐富、多樣、易操作的分析工具、接口和方法也是重點(diǎn)。”
其次,便是多方關(guān)注的商業(yè)化?!癈BDB過去更多地以非商業(yè)化的方式發(fā)展。這有其優(yōu)點(diǎn),卻也使其面臨如何持續(xù)、穩(wěn)定發(fā)展的挑戰(zhàn)?!蓖谥赋觯裉烊祟愇拿鞯陌l(fā)展很大程度上是和商業(yè)文明的發(fā)展并行的,沒有商業(yè)文明的發(fā)展,不可能出現(xiàn)像蘋果手機(jī)這樣集合高科技和人性化于一體的優(yōu)秀產(chǎn)品,正是因為商業(yè)的推動,很多科學(xué)技術(shù)才得以廣泛地被使用,并產(chǎn)生巨大和持久的生命力?!爸形脑诰€要做的,就是把CBDB進(jìn)行增值開發(fā),為用戶帶來更大的價值,相信用戶也愿意因此付費(fèi)。”包弼德教授也對此次CBDB牽手中文在線提出了自己的想法?!皩W(xué)者沒有能力進(jìn)行商業(yè)運(yùn)作,但‘中文在線可以。他們把學(xué)者打造的數(shù)據(jù)庫,變成所有人都可以利用的工具,這點(diǎn)非常重要。這樣學(xué)者就可以專注于學(xué)術(shù),讓商業(yè)和學(xué)術(shù)各自去完成擅長的部分。”
最后的落腳點(diǎn)則是創(chuàng)新。童之磊指出,中文在線希望在CBDB數(shù)據(jù)庫中,重構(gòu)古文獻(xiàn)研究服務(wù)新脈絡(luò),創(chuàng)造研究歷史人文的全新坐標(biāo)體系?!巴ㄟ^時間、地點(diǎn)、人物三個維度,打造史學(xué)的三維研究空間,當(dāng)我們確定三個坐標(biāo),便可以聚焦到每個事件,這是非常有意義的新型研究模式。”
而在具體落地方面,“我們一方面將努力擴(kuò)大CBDB在國內(nèi)的應(yīng)用范圍,并引入更多圖書館領(lǐng)域的合作方,充實(shí)CBDB數(shù)據(jù)庫內(nèi)容資源;二是提供一定的科研支持,吸引更多高端學(xué)術(shù)人才加入CBDB項目組;三是將CBDB的成果分用戶層級地展示給不同的用戶,如可以單獨(dú)制作中小學(xué)傳統(tǒng)文化教育中涉及的重要?dú)v史人物庫,以方便中小學(xué)生用好、學(xué)好相關(guān)知識。”朱厚權(quán)告訴《出版人》。
對于CBDB的商業(yè)化引入,同時身為共建方和使用者的北京大學(xué)相關(guān)負(fù)責(zé)人也在接受《出版人》采訪時談及了自身的理解。“在傳統(tǒng)的史學(xué)研究領(lǐng)域中,‘?dāng)?shù)字人文還沒有得到廣泛應(yīng)用;而與中文在線合作后,除了希望把以前的工作做得更深入之外,也期待CBDB加入更標(biāo)準(zhǔn)化、更通用的工具,建成完善的‘網(wǎng)絡(luò)基礎(chǔ)設(shè)施,使數(shù)據(jù)庫除了在學(xué)術(shù)上應(yīng)用以外,也能推向公眾,讓普通人也更方便地了解中國歷史人物的事跡、著作、生平等?!北本┐髮W(xué)中國古代史研究中心副所長史睿如是說。
北大圖書館副館長聶華表示,CBDB數(shù)據(jù)庫在圖書館界久負(fù)盛名,是中國歷史資料數(shù)據(jù)庫的鼻祖,從各個方面來講本次引入都很有意義,國內(nèi)高校圖書館及公共圖書館對其的需求也毋庸置疑。而作為用戶代表,面對數(shù)據(jù)庫的商業(yè)化,聶華認(rèn)為“從理智的角度看,商業(yè)化是正確的選擇。多年來,各方專家學(xué)者團(tuán)隊,包括中文在線接手以來,都在該項目上投入了大量的人力和財力資源。商業(yè)化能夠更好地維持CBDB繼續(xù)健康地發(fā)展下去”。但聶華同時也指出,就最終的目的而言,希望能夠讓CBDB開發(fā)者、企業(yè)、使用者三方共贏,“只有共贏才是真正可持續(xù)的模式?!?/p>
在童之磊未來的愿景中,未來重新構(gòu)建后的CBDB不僅面向國人,更要面向世界?!白屓驘o數(shù)有尋根訴求的華人以及對中華歷史文明感興趣的人們受惠,一起擁抱數(shù)字人文的新未來。”童之磊說。