○ 馬英珺
《中國音樂大典》編纂工程是“中國樂派高精尖創(chuàng)新中心”①“中國樂派高精尖創(chuàng)新中心”成立于2016年10月9日,是依托中國音樂學(xué)院建設(shè)的音樂人才特區(qū),其建設(shè)目標(biāo)是以中國音樂資源為依托、中國藝術(shù)風(fēng)格為基調(diào)、中國音樂家為載體、中國音樂作品為體現(xiàn),為最終實(shí)現(xiàn)中國樂派的確立與發(fā)展構(gòu)筑強(qiáng)有力的支撐。的建設(shè)方向之一,是“中國樂派”研究與建設(shè)的重要理論支撐,其要旨是通過梳理中國音樂的歷史文化發(fā)展脈絡(luò),研究中國音樂傳世之精品,全方位展示中國音樂的思想理論、音樂作品、音樂人物、音樂表演、音樂器物、音樂組織等各方面的發(fā)展成就,努力打造成為中國音樂歷史上的“四庫全書”②王黎光:《院長致辭》,《中國音樂》,2017年,第1期,第5-7、11頁。。
中國音樂大典數(shù)據(jù)庫是一套專門為《中國音樂大典》編纂工程而建設(shè)的典籍資源平臺(tái),內(nèi)容與《中國音樂大典》收錄的資源相匹配。平臺(tái)的根本任務(wù)是通過對(duì)《中國音樂大典》文論編、樂譜編、音像編、圖像編等不同類型的音樂資源進(jìn)行采集、存儲(chǔ)、分析、管理,實(shí)現(xiàn)海量資源的動(dòng)態(tài)展示和各編之間的信息關(guān)聯(lián),為用戶提供瀏覽、檢索、資源推送等個(gè)性化服務(wù),為中國音樂理論、創(chuàng)作、表演研究提供便捷有效的知識(shí)獲取渠道。
數(shù)據(jù)庫首先需要將《中國音樂大典》先期收錄的圖、文、譜、音、像等數(shù)據(jù)資料進(jìn)行整理、分類、編目、修復(fù)和存檔等,在保證原文件無損的前提下進(jìn)行數(shù)字化處理、轉(zhuǎn)換、加工、入庫,然后根據(jù)不同類型資源的元數(shù)據(jù)規(guī)范建立索引和關(guān)聯(lián),通過資源發(fā)布平臺(tái)對(duì)外發(fā)布,用戶便可以通過終端進(jìn)行檢索、瀏覽、下載、視聽,隨時(shí)隨地獲取中國音樂信息資源。
系統(tǒng)采用經(jīng)典B/S架構(gòu),基于MVC設(shè)計(jì)模式,以Mysql數(shù)據(jù)庫、Solr搜索引擎、SpringCloud服務(wù)端框架等先進(jìn)的開源技術(shù)作為支持。技術(shù)架構(gòu)支持分布式集群,采用模塊化設(shè)計(jì),每個(gè)模塊之間互不影響,分合自如,是有機(jī)聯(lián)系的一體,確保在高并發(fā)下的訪問速度和穩(wěn)定性,同時(shí)保證系統(tǒng)后期升級(jí)迭代開發(fā)的延續(xù)性。
系統(tǒng)通過梳理實(shí)際業(yè)務(wù)流、數(shù)據(jù)流和工作流,細(xì)化軟件開發(fā)方案,設(shè)計(jì)了數(shù)據(jù)庫管理、數(shù)據(jù)庫采集轉(zhuǎn)換與加工處理、數(shù)據(jù)庫發(fā)布檢索、用戶權(quán)限認(rèn)證、系統(tǒng)管理等模塊,并且支持門戶布局、框架的自定制,功能模塊、服務(wù)的擴(kuò)充和調(diào)整等個(gè)性化定制,實(shí)現(xiàn)資源的導(dǎo)航瀏覽、發(fā)布檢索、資源推送以及數(shù)據(jù)庫管理和統(tǒng)計(jì)分析等功能。
在遵守國家相關(guān)標(biāo)準(zhǔn)的前提下,系統(tǒng)圍繞統(tǒng)一數(shù)據(jù)管理、統(tǒng)一身份認(rèn)證、統(tǒng)一數(shù)據(jù)共享的設(shè)計(jì)原則,規(guī)范地進(jìn)行業(yè)務(wù)數(shù)據(jù)的采集、存儲(chǔ)和應(yīng)用,確保技術(shù)的先進(jìn)性和穩(wěn)定性、平臺(tái)的開放性和可擴(kuò)展性、數(shù)據(jù)的規(guī)范性和安全性以及服務(wù)的可靠性、操作的易用性,并充分尊重知識(shí)產(chǎn)權(quán)問題。
中國音樂大典數(shù)據(jù)庫的內(nèi)容與紙本大典文獻(xiàn)資源內(nèi)容一致,分為文論編、樂譜編、音像編和圖像編。四編的收錄內(nèi)容大致如下:文論編主要收錄古代與近現(xiàn)當(dāng)代有關(guān)中國音樂的經(jīng)典著作、論文、文集等,其作品收錄標(biāo)準(zhǔn)定位為經(jīng)典、典范、典型,以便于研究和了解中國音樂研究的現(xiàn)狀;樂譜編收錄中國古代與近現(xiàn)當(dāng)代已出版的、民間收藏的,以及流傳于海外的各類型樂譜及譜本提要,其中古代樂譜包括存見于古籍中的古代樂譜和傳世于今的琴譜、工尺譜等,現(xiàn)當(dāng)代樂譜包括中國傳統(tǒng)音樂曲譜及經(jīng)典中國音樂作品曲譜;音像編主要收集整理中國傳統(tǒng)音樂各類藝術(shù)形式的音樂作品,著重于收錄現(xiàn)當(dāng)代有學(xué)者采錄的、來自田野的音像資料和傳統(tǒng)音樂作品;圖像編主要收錄中國古今一切記錄、描繪社會(huì)樂音生活各個(gè)領(lǐng)域的音樂器物、場景、人物,以及音樂實(shí)踐的、以平面視覺形象為表現(xiàn)形式的、具有經(jīng)典意義的圖像資料。四編收錄的各類資源共同為“中國樂派”的建設(shè)提供理論體系的支撐。
中國音樂大典數(shù)據(jù)庫確立了基于音樂研究領(lǐng)域的科學(xué)的、合理的分類。文論編、樂譜編、音像編和圖像編是四個(gè)并列的子庫,也是數(shù)據(jù)庫的四個(gè)一級(jí)分類。二級(jí)分類建立在時(shí)間維度之上,文論編分古代文論、近現(xiàn)代文論;圖像編亦分古代卷和近現(xiàn)當(dāng)代卷;樂譜編和音像編分傳統(tǒng)藝術(shù)形式與現(xiàn)代藝術(shù)形式等。從三級(jí)分類開始,各編內(nèi)容各有側(cè)重:如近現(xiàn)代文論按照資源的出版形式和來源分為圖書、期刊和學(xué)位論文;傳統(tǒng)藝術(shù)形式的樂譜和音像資源則是根據(jù)音樂藝術(shù)形式的門類劃分為民歌、戲曲、曲藝、器樂等。第四級(jí)、五級(jí)、六級(jí)分類是數(shù)據(jù)庫最為核心的內(nèi)容,分別體現(xiàn)了各類資源所屬的學(xué)科、專業(yè)、樂種等,七級(jí)則是具體的曲目名稱。以漢族民間器樂曲譜的分類層級(jí)為例。(見表1)
表1 漢族民間器樂曲分類結(jié)構(gòu)示例
數(shù)據(jù)庫在上述分類基礎(chǔ)上確立了層次性與多元性結(jié)合的樹形分類體系,并搭建了數(shù)據(jù)庫分類導(dǎo)航架構(gòu),使得各編的分類一目了然,用戶可以根據(jù)檢索需求任意點(diǎn)擊分類樹前面的“+”“-”符號(hào),擴(kuò)展或縮小層級(jí)。(見圖1)
圖1 樂譜編和文論編樹形分類架構(gòu)
對(duì)于以資源為主的學(xué)術(shù)類數(shù)據(jù)庫來說,檢索功能之重要性不言而喻,檢索結(jié)果的精確度和敏感度直接影響到數(shù)據(jù)庫使用效果。中國音樂大典數(shù)據(jù)庫采用實(shí)時(shí)分布式搜索和分析引擎,實(shí)現(xiàn)了一站式檢索、分類檢索、高級(jí)檢索、關(guān)聯(lián)檢索等功能,并且對(duì)不同信息載體之間既各自獨(dú)立,又相互關(guān)聯(lián)的中國音樂資源進(jìn)行優(yōu)化和整合。
在中國音樂大典數(shù)據(jù)庫主頁面上,即設(shè)計(jì)了一站式檢索框,可以同時(shí)在四個(gè)子數(shù)據(jù)庫中進(jìn)行檢索式表達(dá),并支持主題檢索和全文檢索。
主題檢索即選擇相應(yīng)主題字段進(jìn)行檢索。數(shù)據(jù)庫在檢索框左側(cè)設(shè)置了主題字段的下拉框,用戶可以根據(jù)需求選取下拉框中的標(biāo)題、關(guān)鍵詞、摘要、責(zé)任者等字段,然后在檢索框中輸入對(duì)應(yīng)的關(guān)鍵詞進(jìn)行檢索。在這些主題字段中(除責(zé)任者之外),系統(tǒng)采用了搜索引擎的分詞檢索功能,即把檢索詞拆分成多個(gè)詞語,如“中國音樂學(xué)院”進(jìn)行分詞后就會(huì)生成“中國”“音樂”“學(xué)院”“音樂學(xué)院”“中國音樂”等,使得檢索結(jié)果更加豐富。
全文檢索則是根據(jù)關(guān)鍵詞在全文中進(jìn)行匹配③蘇石、翟中會(huì)、劉華:《一站式檢索工具在系統(tǒng)評(píng)價(jià)中的應(yīng)用及效果評(píng)價(jià)》,《中國循證醫(yī)學(xué)雜志》,2018年,第5期,第506-510頁。,在中國音樂大典數(shù)據(jù)庫中,如果沒有選擇下拉框中的指定主題字段,則默認(rèn)為全文檢索。全文檢索支持空格操作符,多個(gè)關(guān)鍵詞使用空格連接可實(shí)現(xiàn)“與”檢索。以查詢“程硯秋”演唱的《鎖麟囊》為例,直接在檢索框中輸入“程硯秋 鎖麟囊”(使用空格連接關(guān)鍵詞,實(shí)現(xiàn)“與”檢索),即可在四個(gè)子庫中進(jìn)行全文檢索,如果檢索結(jié)果數(shù)量較多,可以直接點(diǎn)擊左上角資源類型,有目的地瀏覽某一編的數(shù)據(jù)內(nèi)容。
中國音樂大典數(shù)據(jù)庫首頁下方設(shè)計(jì)了文論編、樂譜編、圖像編、音像編的分類導(dǎo)航功能。鼠標(biāo)移動(dòng)到某一編目標(biāo)區(qū)域的時(shí)候,會(huì)自動(dòng)展開其二級(jí)分類和三級(jí)分類,用戶可以根據(jù)需求點(diǎn)擊某個(gè)分類,即可進(jìn)入到相應(yīng)的檢索結(jié)果頁面??焖俜诸悪z索功能能夠幫助用戶快速了解數(shù)據(jù)庫各編的資源內(nèi)容。
高級(jí)檢索是利用布爾邏輯運(yùn)算符實(shí)現(xiàn)多個(gè)字段的檢索組合,是一種靈活、精確的檢索方式。中國音樂大典數(shù)據(jù)庫在高級(jí)檢索頁面設(shè)計(jì)了可視化的表單式檢索界面,用戶可以通過資源類型、檢索字段、時(shí)間范圍、查找方式、檢索式等多個(gè)條件,任意新增或刪除檢索字段,并在多個(gè)字段間進(jìn)行“與”或“非”等邏輯關(guān)系的組配,滿足多元的檢索需求,有效縮減檢索范圍,直接定位目標(biāo)數(shù)據(jù)。在高級(jí)檢索中,數(shù)據(jù)庫還提供了精確查找、模糊查找以及“檢索字段+時(shí)間范圍”的檢索方式。其中,精確查找不進(jìn)行字段分詞檢索,檢索結(jié)果比較精確;模糊查找對(duì)檢索字段進(jìn)行分詞檢索,可以得到更全面的檢索數(shù)據(jù);“檢索字段+時(shí)間范圍”的檢索方式,方便用戶根據(jù)關(guān)鍵詞來定位某一個(gè)時(shí)間范圍內(nèi)的文獻(xiàn),提高數(shù)據(jù)訪問的效率。
關(guān)聯(lián)檢索是在檢索結(jié)果頁面中根據(jù)數(shù)據(jù)庫提供的檢索字段進(jìn)行二次檢索,以縮小數(shù)據(jù)范圍。由于中國音樂大典各編內(nèi)容的側(cè)重點(diǎn)不同,因此每一編設(shè)計(jì)了不同的二次檢索字段:文論編可以通過標(biāo)題、關(guān)鍵詞、責(zé)任者、摘要、文獻(xiàn)來源進(jìn)行二次檢索;樂譜編可通過標(biāo)題、責(zé)任者、民族、類別、流傳地區(qū)進(jìn)行二次檢索;圖像編通過標(biāo)題、民族、類別、時(shí)間等字段進(jìn)行二次檢索;音像編可以通過標(biāo)題等字段進(jìn)行二次檢索。關(guān)聯(lián)檢索可以找到更多目標(biāo)之外而又非常重要的數(shù)據(jù)。
中國音樂大典數(shù)據(jù)庫的檢索結(jié)果以列表形式呈現(xiàn),檢索結(jié)果可以按相關(guān)度或者時(shí)間進(jìn)行排序。為了醒目表現(xiàn),每一條數(shù)據(jù)都將其中的檢索詞(包括分詞之后的詞語)做了高亮展示。頁面左側(cè)提供檢索分類樹和聚類檢索功能,右側(cè)上方還可以選擇標(biāo)題、責(zé)任者等主題字段繼續(xù)“在結(jié)果中檢索”,或者重新進(jìn)行全局檢索。在檢索結(jié)果數(shù)據(jù)中,每一條數(shù)據(jù)都可能對(duì)應(yīng)不同的附件類型,點(diǎn)擊標(biāo)題后的附件標(biāo)志(不同的附件類型有不同的標(biāo)志),即可瀏覽PDF、音視頻等附件內(nèi)容。每次使用的檢索策略都會(huì)存放在檢索記錄模塊中,用戶可對(duì)自己的檢索歷史進(jìn)行修改、保存和刪除,如果直接復(fù)用這些檢索條件可以再次進(jìn)行檢索。④陸敏、劉穎、洪正國:《CALIS專題特色數(shù)據(jù)庫中心門戶系統(tǒng)建設(shè)分析》,《圖書情報(bào)工作》,2007年,第5期,第126-129頁。
中國音樂大典數(shù)據(jù)庫以資源的目錄體系為紐帶,整合不同類型資源,實(shí)現(xiàn)海量數(shù)據(jù)的存儲(chǔ)、維護(hù)、管理、發(fā)布、全文檢索以及統(tǒng)計(jì)、分析、應(yīng)用等功能;數(shù)據(jù)庫的每個(gè)子系統(tǒng)既可單獨(dú)運(yùn)行,又是有機(jī)聯(lián)系的一體,分合自如,有效地梳理解決數(shù)據(jù)資源整合及數(shù)據(jù)共享的復(fù)雜應(yīng)用需求。
中國音樂大典數(shù)據(jù)庫目前已擁有20余萬條數(shù)據(jù),所包含的中國音樂信息全面豐富,體量巨大。數(shù)據(jù)庫內(nèi)容與大典收錄的文獻(xiàn)資源內(nèi)容一致,涵蓋了現(xiàn)有分布式網(wǎng)絡(luò)中所有數(shù)字媒體類型。目前,樂譜編收錄了中國古代與近現(xiàn)當(dāng)代已出版的、民間收藏的各類型樂譜數(shù)據(jù)近4萬條;音像編收錄了中國傳統(tǒng)音樂門類的音視頻資源3萬余條;圖像編收錄中國古今音樂器物、音樂場景、音樂人物等圖像資料13萬條;文論編收錄有關(guān)中國音樂理論、創(chuàng)作等相關(guān)書籍、學(xué)位論文、期刊文獻(xiàn)等5萬余條。這些海量數(shù)據(jù)為音樂學(xué)者進(jìn)行中國音樂研究提供了重要線索,為音樂藝術(shù)院校及音樂研究機(jī)構(gòu)提供全面而翔實(shí)的音樂史料。
針對(duì)不同文獻(xiàn)類型和資源內(nèi)容而設(shè)計(jì)的元數(shù)據(jù)著錄體例和規(guī)范,對(duì)于在不同元數(shù)據(jù)元素之間建立準(zhǔn)確可用的映射起到非常重要的作用。為滿足不同類型的文獻(xiàn)對(duì)于元數(shù)據(jù)的不同需求,中國音樂大典數(shù)據(jù)庫在遵循國際標(biāo)準(zhǔn)、國家標(biāo)準(zhǔn)和行業(yè)標(biāo)準(zhǔn)的前提下,以都柏林核心元數(shù)據(jù)為基礎(chǔ),制定出十幾套元數(shù)據(jù)描述類型和對(duì)應(yīng)的著錄體例,如著作類元數(shù)據(jù)、學(xué)位論文元數(shù)據(jù)、期刊文獻(xiàn)元數(shù)據(jù)、古代樂譜元數(shù)據(jù)、近現(xiàn)代樂譜元數(shù)據(jù)、民間樂譜元數(shù)據(jù)、音像編元數(shù)據(jù)、圖像編元數(shù)據(jù)等,涉及曲名、作詞、作曲、演唱、傳譜、演奏、伴奏、劇目、角色、聲腔、民族、打譜、譜本名稱、版本信息、年代、編者、提要等上百條元素,從而可以對(duì)各種不同格式、不同來源、不同類型的文獻(xiàn)進(jìn)行有效組織,合理類聚,形成互聯(lián)互通的中國音樂知識(shí)網(wǎng)絡(luò)。
中國音樂大典數(shù)據(jù)庫在四個(gè)子庫的基礎(chǔ)上,設(shè)計(jì)了科學(xué)、合理、專業(yè)的分類導(dǎo)航瀏覽體系,并根據(jù)資源類型、年代、藝術(shù)門類、民族、樂種、作品等,將相同字段、相近主題特征的數(shù)據(jù)聚合在一起,提供基于文獻(xiàn)內(nèi)容和外部特征的知識(shí)鏈接,有助于厘清四編內(nèi)容之間的內(nèi)在聯(lián)系,有效解決各編資源松散孤立的問題。與此同時(shí),數(shù)據(jù)庫利用語義化共詞分析方法實(shí)現(xiàn)基于主題的多維度聚合⑤劉偉:《基于內(nèi)容特征元數(shù)據(jù)的多源異構(gòu)科技資源關(guān)聯(lián)聚合研究》,《中國科技資源導(dǎo)刊》,2020年,第5期,第28-34頁。,形成類目體系之外的聚類層次:比如文論編提供時(shí)間、期刊、院系機(jī)構(gòu)、出版社等聚類;樂譜編提供譜式、譜本、體裁聚類;音像編提供時(shí)間、采錄地點(diǎn)聚類等;圖像編提供表演照、事件照、人物照、樂器照聚類。如此這般,不同的資源類型聯(lián)動(dòng)不同的聚類,使得數(shù)據(jù)庫的層級(jí)更鮮明,為用戶提供更多的關(guān)聯(lián)內(nèi)容,數(shù)據(jù)檢索結(jié)果也更加理想,便于知識(shí)的分享與推薦。
中國音樂大典數(shù)據(jù)庫秉持“一切面向服務(wù)”和“簡化用戶體驗(yàn)”的設(shè)計(jì)原則,系統(tǒng)頁面清晰簡潔,配色輕松淡雅,欄目主次分明,結(jié)構(gòu)合理清晰,數(shù)據(jù)顯示集中,操作簡便靈活。登錄用戶可以對(duì)檢索結(jié)果進(jìn)行收藏、分享、推薦、下載、保存、打印等豐富的個(gè)性化服務(wù)。數(shù)據(jù)庫將PDF文件都添加了目錄,并可進(jìn)行放大、縮小、旋轉(zhuǎn)、全屏閱覽、快速跳轉(zhuǎn)等功能。另外,數(shù)據(jù)庫支持門戶布局、框架的自定義以及功能模塊的擴(kuò)充和調(diào)整等個(gè)性化定制。
數(shù)據(jù)庫后臺(tái)管理系統(tǒng)采用 VUE+Elementui的集成方案,內(nèi)置了i18國際化解決方案,提煉了典型的業(yè)務(wù)模型,設(shè)計(jì)了圖表化數(shù)據(jù)分析和統(tǒng)計(jì)功能。業(yè)務(wù)人員可按照四編聚類特點(diǎn)進(jìn)行學(xué)科、專業(yè)、體裁、民族、樂種、譜式等方面的數(shù)據(jù)統(tǒng)計(jì)和數(shù)據(jù)分析功能,分析結(jié)果以柱狀圖、餅狀圖、地圖等形式展現(xiàn)出來,滿足各編信息資源的統(tǒng)計(jì)和數(shù)據(jù)共享過程中的應(yīng)用和管理需求,為《中國音樂大典》的進(jìn)一步研究提供便利的條件。
中國音樂大典數(shù)據(jù)庫是《中國音樂大典》編纂項(xiàng)目不可或缺的一部分,同時(shí)也是學(xué)院信息化建設(shè)頂層設(shè)計(jì)的項(xiàng)目之一。數(shù)據(jù)庫整合了《中國音樂大典》的海量數(shù)據(jù)資源,實(shí)現(xiàn)了對(duì)文論、音視頻、樂譜、圖片等多種數(shù)據(jù)資源的發(fā)布、存儲(chǔ)及管理,為保存、傳承和利用中國音樂資源、弘揚(yáng)中國音樂文化發(fā)揮了應(yīng)有的作用。