◎史 蕾
(西安音樂學院圖書館 陜西 西安 710061)
2019年12月31日,西安音樂學院圖書館建設完成的“魯日融教授數(shù)據庫”順利通過學校有關部門和專家驗收,并在校園網正式供全校師生訪問使用。由于本研究是實戰(zhàn)性的命題,因此在數(shù)據收集(手稿、樂譜)、人文成果銜接、服務器系統(tǒng)配置等方面都有這樣那樣的缺失,并且項目的實施過程是一個系統(tǒng)工程必須在同一時間、同一空間完成。這次的項目是西安音樂學院建館以來第一次大的網絡改造升級工程,試運行后基本達到了預期的效果。
圖書館是一個不斷生長的有機體,整理和保存研究資料是圖書館的使命,“創(chuàng)新”是一個始終不變的話題,站在巨人的肩膀上“創(chuàng)新”則是最為智慧的途徑之一。由于音樂院圖書館館藏資源的特殊性,在過去的數(shù)十年中各個音樂院校圖書館都在努力構建自己的特色數(shù)據庫。一是為了讓資源更好地服務于教學,二是擴大影響力,但同時也形成了資源割據現(xiàn)象,嚴重影響了全國音樂院校館藏資源的能量發(fā)揮?!皵?shù)字人文”的出現(xiàn)為圖書館提供了重塑自身價值的機會,它為館藏資源的深度開發(fā)提供了創(chuàng)造性的理論和實踐性的方法,使得館藏資源語義分析、字頻統(tǒng)計、信息挖掘、智能標點以及文獻數(shù)字化地圖建設等成為可能。
筆者從CNKI知識平臺以“美國數(shù)字人文成果”為主題檢索詞,共檢出36篇研究論文。蘇敏分析和總結了美國高校圖書館開展數(shù)字人文服務的路徑,提出了我國高校圖書館應轉變發(fā)展理念,積極向數(shù)字人文發(fā)展方向靠攏[1]。左娜從建設內容和基礎環(huán)境等四個維度的對比分析了中美數(shù)字人文項目建設的異同點,僅Center Net收錄達百項項目成果,很有借鑒意義[2]。汪莉認為在新的知識創(chuàng)造模式和新的學術環(huán)境中重新定位圖書館,最終與數(shù)字人文之間形成真正的平等關系,促進數(shù)字人文在圖書館的可持續(xù)發(fā)展[3]。徐志瑋以美國國家基金會的跨大西洋合作基金挖掘數(shù)字挑戰(zhàn)資助的50個項目為例,提出了本土化轉化的可能性[4]。
數(shù)字人文的研究及應用源于圖書館,無論在中國、英國還是美國,數(shù)字人文項目的數(shù)據源不外乎日記、文稿、信札、電報、賬冊、電文、合同、章程等,這些碎片化的信息再賦予新方法、新工具、新平臺和新內容就形成了一個具有前沿性的項目呈現(xiàn)在人們面前,我國高校圖書館數(shù)字人文的研究應用起步較晚,基礎共性的特點使得本土化有了很大的可能性。
“魯日融教授數(shù)據庫”2018年6月獲得省級立項。為了提升圖書館服務質量,校方在硬件配置上給予了支持,2018年8月“西安音樂學院圖書館業(yè)務平臺建設與機房改造”項目獲批,為新建數(shù)據庫的平臺搭建奠定了物質基礎。因此,本次建庫較之前的數(shù)據庫在標準、理念等方面有一個大的提升。通過以上分析可得出只有擷取數(shù)字人文成果中的精華,并進行本土化轉化,植入數(shù)據庫的某些字段中,才能提高知識發(fā)現(xiàn)水平。
設立了主任一名,學歷背景:西安音樂學院音樂專業(yè),在讀博士。其主要職責為館內及校內各單位文獻資源信息的釋放、回饋、修正;部內日常工作及分配;經費預算、項目申報、項目實施,項目結題;尋找校內外合作伙伴,研究解決建設中出現(xiàn)的重大問題。數(shù)字人文館員一名,學歷背景:西安音樂學院作曲專業(yè),碩士。其主要職能是為校內師生等用戶使用圖書館數(shù)字人文終端提供指導,協(xié)調、咨詢召開以征求服務對象意見為目的的座談會,以推廣服務內容為目的的發(fā)布會、線上線下互動的討論會、舉辦研討會和學術交流活動等。數(shù)字學術協(xié)調員一名,學歷背景:上海音樂學院音教專業(yè),碩士。其主要職責為編輯內部交流刊《文化信息報》的編撰、微信平臺的稿件撰寫及推送、項目的實施等。電腦工程師一名,學歷背景:西北工業(yè)大學計算機專業(yè)碩士,其主要職責是圖書館網絡平臺的建設和內部局域網的維護,負責網絡及網絡設備的維護,保證各個終端的正常使用。
專家介紹:魯日融教授是蜚聲海內外的音樂家,秦派二胡、民間音樂的創(chuàng)始人,他的二胡曲《迷胡調》《秦腔主題隨想曲》《歡樂的秦川》《搖籃曲》《曲江吟》等許多悅耳動聽的曲目廣為流傳。20世紀80年代以來他先后應邀出訪日本、德國、法國、比利時、荷蘭、瑞士、西班牙、馬來西亞、新加坡等國家進行文化交流與講學活動。宣揚華夏民族音樂文化,講授“秦派二胡”,介紹“長安樂派”深受業(yè)界推崇。1992年國務院授予“國家有突出貢獻專家”稱號。
圖書館(館藏資源檢索)→網絡(內網、遠程)→本人(線索、收藏)→單位(工作日志、排課表、課時安排、授課內容、講稿、講義、總結、榮譽)→同事(回憶、評價)→觀眾(認知度、擴展)。
在可視化對格式、維度、分辨率和精確度高標準、嚴要求的基礎上,通過掃描、文本檢索和數(shù)據庫查詢等方法把所需數(shù)據提出來,并將這些數(shù)據融入同一時間維度的社會環(huán)境、人物關系和文化背景中,這些數(shù)字人文環(huán)境下具有緊密聯(lián)系的語義信息就構成了可視化建設的數(shù)據來源。例如對魯日融文本信息的提取采用了目前最先進的掃描儀,保證了可視化對分辨率的要求,同時采集年代、作者、篇名、刊名、卷、期、頁碼、標題、摘要、類型、引文等數(shù)據,為研究文獻隱藏的知識奠定基礎。
以美國密歇根大學數(shù)字人文與社會科學中心的“奴隸傳記”項目以及賓法尼亞大學圖書館數(shù)字語言聯(lián)盟的“管理計劃”(Data Management Plan,DMP)人文成果為例,擷取相匹配的數(shù)據段落,對搜集到的文獻數(shù)據要進行數(shù)據清洗和集成,需要將重復的非相關文獻去除,合并同義關鍵詞。通過抽取文本的年代、期刊、機構、作者或關鍵詞等顯性特征進行統(tǒng)計分析。對年代、期刊、機構和作者通過Excel實現(xiàn)數(shù)據的統(tǒng)計分析。通過年代分析,可以看出作者的貢獻峰值;通過文獻分布可得出作者作品的創(chuàng)作背景及地域性的依據。通過機構分析,可看出無論文本、音頻、視頻數(shù)據都與社會或人文因素有關聯(lián)。