錢文琪,李子晉
(1.中國音樂學(xué)院,北京 100101;2.中央音樂學(xué)院,北京 100091)
近幾年來,計(jì)算機(jī)技術(shù)介入作曲領(lǐng)域的研究呈現(xiàn)出不斷加速、擴(kuò)大的趨勢,眾所周知,音樂領(lǐng)域是極富有創(chuàng)造性的領(lǐng)域,音樂創(chuàng)作與計(jì)算機(jī)的結(jié)合迅速受到社會(huì)各領(lǐng)域廣泛關(guān)注?!八惴ā焙汀白髑敝钥梢越Y(jié)合形成一個(gè)新興的研究領(lǐng)域,兩者之間一定有邏輯關(guān)系將其聯(lián)結(jié)。追溯到很久之前,作曲本身其實(shí)就是一種嚴(yán)格的規(guī)則邏輯,從很早的簡單節(jié)奏及音高對應(yīng)關(guān)系到巴洛克時(shí)期復(fù)調(diào)音樂中嚴(yán)格的邏輯對應(yīng),再到后來的十二音序列音樂,音樂中各種要素的隨機(jī)對應(yīng)關(guān)系,算法始終貫穿在作曲過程之中。因此,可以將算法作曲認(rèn)為是兩種不同領(lǐng)域的邏輯在當(dāng)代的交叉碰撞。
現(xiàn)階段,在計(jì)算機(jī)領(lǐng)域,英文文獻(xiàn)中大部分學(xué)者更加偏向于“自動(dòng)作曲”這個(gè)解釋,普遍認(rèn)為算法作曲是使用算法創(chuàng)作音樂的技術(shù),認(rèn)為算法作曲這個(gè)術(shù)語通常用來表示無需人工干預(yù)進(jìn)行的音樂創(chuàng)作過程。中文文獻(xiàn)中大部分學(xué)者更加偏向?qū)⑺惴ㄗ髑忉尀椤坝?jì)算機(jī)作曲”,在作曲的過程中,人盡可能少地干預(yù)音樂的生成,以實(shí)現(xiàn)計(jì)算機(jī)算法作曲的主導(dǎo)作用最大化。在音樂領(lǐng)域,中英文獻(xiàn)在算法作曲的釋義理解上則出現(xiàn)較大分歧。英文文獻(xiàn)中部分國外音樂家是希望形成完全自動(dòng)化的作曲,但中文文獻(xiàn)中音樂家更加注重人在其中的干預(yù)作用,強(qiáng)調(diào)了人干預(yù)是必不可少的,甚至是有利于結(jié)果的最優(yōu)化。
“算法作曲”就是“在算法輔助下的作曲”,算法作曲在計(jì)算機(jī)算法的支撐下,已經(jīng)成為當(dāng)代創(chuàng)作音樂的新趨勢,隨著各種算法的不斷更新完善,人們越來越依賴計(jì)算機(jī)的算法來進(jìn)行音樂的創(chuàng)作,賦予計(jì)算機(jī)更多的權(quán)限,人們將更多的關(guān)注點(diǎn)逐漸移向算法。在計(jì)算機(jī)算法作曲系統(tǒng)中,人們擔(dān)任的角色只是規(guī)則制定者與反饋調(diào)試者。這種趨向“自動(dòng)化創(chuàng)作”的方式雖然新穎,但是當(dāng)作曲家將自己的靈感和情感輸入到計(jì)算機(jī)中,計(jì)算機(jī)是否能夠給予他們與之匹配的音樂才是至關(guān)緊要的。這種認(rèn)知的差異性其實(shí)主要取決于人們對它的定位。直到現(xiàn)在,對“算法作曲”的理解還沒有一個(gè)統(tǒng)一的概念。
各領(lǐng)域?qū)λ惴ㄗ髑J(rèn)知的偏差,在很大程度上影響了算法作曲的研究內(nèi)容和趨勢發(fā)展,但是僅基于個(gè)人的主觀判斷是不能夠得出結(jié)論的,而是需要通過客觀準(zhǔn)確的數(shù)據(jù)來說話。文獻(xiàn)計(jì)量的方法應(yīng)用領(lǐng)域十分廣泛,在近幾年呈現(xiàn)出與其他領(lǐng)域?qū)W科相結(jié)合的趨勢,通過這種方法可以提取到文章內(nèi)容的核心要素。文獻(xiàn)計(jì)量法可以將文獻(xiàn)量、作者數(shù)、詞匯數(shù)作為研究對象對大量文獻(xiàn)進(jìn)行量化分析,而后實(shí)現(xiàn)對相關(guān)研究領(lǐng)域的研究熱點(diǎn)的預(yù)測和評估。本文對國內(nèi)外算法作曲發(fā)展趨勢、研究熱點(diǎn)進(jìn)行定量考察,借助可視化文獻(xiàn)計(jì)量分析工具Citespace,通過發(fā)文量及詞頻分析中關(guān)鍵詞聚類、突現(xiàn)詞分析的方法確定算法作曲研究內(nèi)容在不同發(fā)展階段的核心關(guān)鍵詞變動(dòng),以獲取其研究領(lǐng)域演變趨勢及熱點(diǎn)變化。
嚴(yán)格地說,與其它專著、研究報(bào)告等文獻(xiàn)相比,期刊論文更直接、客觀、嚴(yán)謹(jǐn)?shù)胤从沉讼嚓P(guān)研究領(lǐng)域的研究課題和研究前沿。本文研究以中文學(xué)術(shù)期刊庫中國知網(wǎng)(CNKI)和美國科學(xué)信息研究所Web of science(WoS)核心合集數(shù)據(jù)庫為主要數(shù)據(jù)來源。其中,以“算法作曲”作為主題詞和關(guān)鍵詞為中國知網(wǎng)(CNKI)數(shù)據(jù)庫檢索式,檢索時(shí)間跨度為1955-2020年,時(shí)間切片為1,檢索文獻(xiàn)時(shí)間為2020年2月29日,統(tǒng)計(jì)結(jié)果時(shí)間為2020年3月1日,經(jīng)過人工篩選,把顯然不屬于該領(lǐng)域的文獻(xiàn)剔除,并刪除重復(fù)文章。結(jié)果共檢索出相關(guān)文獻(xiàn)共63篇,將檢索出的論文題目、關(guān)鍵詞、作者、摘要等數(shù)據(jù)以Refworks的純文本格式導(dǎo)出,以備數(shù)據(jù)分析所用。
本文又以Web of science(WoS)為檢索平臺,選擇“Web of Science Core Collection”數(shù)據(jù)庫為樣本框,檢索策略設(shè)定為 TS=(Antibiotic*AND Soil),文獻(xiàn)類型設(shè)定為“Article”,檢索主題為“Algorithm composition”和“music”;OR 主題為“Computer Composition”和”music”;檢索時(shí)間跨度是1985-2019年,檢索時(shí)間為2020年2月29日,統(tǒng)計(jì)時(shí)間為2020年3月1日,經(jīng)過人工篩選,對檢索結(jié)果逐條篩選,剔除不相關(guān)的非學(xué)術(shù)文章,并且刪除重復(fù)文獻(xiàn),最終共得到相關(guān)有效文獻(xiàn)共295篇,將篩選過后的文獻(xiàn)保存為純文本格式導(dǎo)出,以備數(shù)據(jù)分析所用。
本文采用文獻(xiàn)計(jì)量法中的關(guān)鍵詞共現(xiàn)分析方法,關(guān)鍵詞共現(xiàn)可以分為幾個(gè)分析維度,分別為關(guān)鍵詞頻次(關(guān)鍵詞提取檢索所得論文中的高頻關(guān)鍵詞,以揭示算法作曲在不同發(fā)展階段的研究主題)、關(guān)鍵詞中心性(Betweenness Centrality)、關(guān)鍵詞聚類圖譜(可以反映聚類結(jié)構(gòu)特征,表征識別聚類的性質(zhì),從特定聚類的標(biāo)題、關(guān)鍵詞、摘要中抽取名詞短語,作為聚類標(biāo)簽,更能清晰得出該研究領(lǐng)域的核心)、Time line圖譜(揭示聚類時(shí)間跨度、發(fā)展脈絡(luò)及研究進(jìn)程)、Time zone圖譜(在時(shí)間層面展示關(guān)鍵詞關(guān)聯(lián)及研究領(lǐng)域知識演進(jìn))。
通過對中英文算法作曲相關(guān)文獻(xiàn)的發(fā)文量進(jìn)行對比分析(如圖1)。首先看到的是明顯的發(fā)文量數(shù)量的差距,英文相關(guān)文獻(xiàn)發(fā)文總量大致為國內(nèi)發(fā)文總量的2倍。中文相關(guān)文獻(xiàn)發(fā)表時(shí)間明顯晚于國外,之間相差近20年。首先,通過觀察發(fā)表論文的數(shù)量趨勢,兩者趨勢基本一致。英文相關(guān)文獻(xiàn)的數(shù)量分別在1995年、2005年、2015年出現(xiàn)高峰值,在1993年、2009年出現(xiàn)低峰值;而對比中文文獻(xiàn),在2006年、2010年及2013年出現(xiàn)高峰值,在2008年、2012出現(xiàn)低峰值??梢缘弥?,英文文獻(xiàn)幾乎每隔10年就會(huì)出現(xiàn)一個(gè)高峰值,而中文文獻(xiàn)幾乎每四年出現(xiàn)一個(gè)高峰值。由此可見,這種數(shù)量的發(fā)展趨勢是相同的。
圖1 國內(nèi)外中英文算法作曲發(fā)文量散點(diǎn)對比圖
在科學(xué)研究中,關(guān)鍵詞通??梢员磉_(dá)一篇論文的研究核心內(nèi)容,繼而可以表征出該領(lǐng)域的研究主題和發(fā)展動(dòng)向[1]。因此,如果某一主題詞或關(guān)鍵詞在其領(lǐng)域文獻(xiàn)中出現(xiàn)次數(shù)較多,則可認(rèn)為該關(guān)鍵詞或主題詞所表征的研究主題即為該領(lǐng)域的研究熱點(diǎn)。
聚類分析是機(jī)器學(xué)習(xí)的一個(gè)很重要的分支。聚類(Clustering),就是將相似度較高的團(tuán)或簇聚成一組。聚類也是一種可視化樣式,它可以展示網(wǎng)絡(luò)的聚類分布概況。Citespace自動(dòng)聚類的實(shí)現(xiàn)是依據(jù)譜聚類算法(Spectral Clustering,SC),聚類樣式中的聚類以不同顏色的節(jié)點(diǎn)來表示。譜聚類是從圖論中演化出來的算法,目前在聚類研究中得到了廣泛的應(yīng)用,是一種新型聚類算法。其原理是基于聚類矩陣的相似性,然后利用圖分割形成聚類。
本文將所得中國知網(wǎng)(CNKI)文獻(xiàn)數(shù)據(jù)導(dǎo)入Citespace軟件進(jìn)行關(guān)鍵詞共現(xiàn)分析,軟件時(shí)區(qū)選擇為1990年-2019年,時(shí)間切片(Slice length)為1,節(jié)點(diǎn)類型選擇“keyword”,TopN為50。經(jīng)過參數(shù)篩選,關(guān)鍵詞共現(xiàn)圖譜中共出現(xiàn)關(guān)鍵詞141個(gè),形成200條連線,密度為0.0203。此次研究中,CNKI數(shù)據(jù)的輪廓值S為0.5696,模塊值Q為0.8262,一般而言,Q的值在區(qū)間[0,1)內(nèi),Q≥0.3說明劃分出來的關(guān)鍵詞聚類是明確的[2];當(dāng)S值在0.7時(shí),聚類是高效率令人信服的,若在0.5以上,一般認(rèn)為聚類是合理的,表明形成聚類的結(jié)構(gòu)層次比較清晰,該方法的置信度較高且具有意義[3]。另外,筆者采用潛在語義索引算法(LSI)從施引文獻(xiàn)的關(guān)鍵詞(Keyword list)中提取名詞性術(shù)語對聚類進(jìn)行命名。
同樣,本文將Web of science(WoS)核心合集數(shù)據(jù)庫中文獻(xiàn)數(shù)據(jù)導(dǎo)入Citespace軟件進(jìn)行關(guān)鍵詞共詞分析,軟件時(shí)區(qū)選擇為1970年-2019年,時(shí)間跨度(Slice length)為1,節(jié)點(diǎn)類型選擇“keyword”,TopN為50。經(jīng)過參數(shù)篩選,圖譜中共出現(xiàn)關(guān)鍵詞386個(gè),形成836條連線,密度為0.0113。WOS數(shù)據(jù)的輪廓值S為0.7022,模塊值Q為0.6268,表明形成聚類的結(jié)構(gòu)層次比較清晰。另外,筆者同樣采用相同語義索引算法(LSI)從施引文獻(xiàn)的關(guān)鍵詞(Keyword list)中提取名詞性術(shù)語對聚類進(jìn)行命名。
圖2 中文文獻(xiàn)中“算法作曲”關(guān)鍵詞聚類知識圖譜
圖3 英文文獻(xiàn)中“算法作曲”關(guān)鍵詞聚類知識圖譜
從關(guān)鍵詞聚類視圖可以發(fā)現(xiàn),中文文獻(xiàn)中該領(lǐng)域聚類分布較分散,每個(gè)聚類相關(guān)性較??;而外文文獻(xiàn)中該領(lǐng)域聚類分布密集,相關(guān)性較大。
本文將中英文算法作曲相關(guān)論文關(guān)鍵詞聚類進(jìn)行對比得出表1(如下表)。中文文獻(xiàn)關(guān)鍵詞主要聚類分析結(jié)果有4個(gè),分別是“人工智能”(聚類0)、“計(jì)算機(jī)音樂”(聚類1)、“適應(yīng)度函數(shù)”(聚類2)、“計(jì)算機(jī)作曲”(聚類3);英文文獻(xiàn)關(guān)鍵詞主要聚類分析結(jié)果有5個(gè)。分別是“深度學(xué)習(xí)”(聚類0)、“教育”(聚類1)、“機(jī)器學(xué)習(xí)”(聚類2)、“算法作曲”聚類3)、“算法”(聚類4)??梢姡形奈墨I(xiàn)中算法作曲研究主要以算法為主要研究內(nèi)容;而英文文獻(xiàn)中算法作曲研究內(nèi)容涉及很多方面。
表1 中英文獻(xiàn)算法作曲關(guān)鍵詞聚類視圖對比表
此外,本文將文獻(xiàn)中算法作曲高頻中介中心性關(guān)鍵詞進(jìn)行整理對照(如表2),可以看出,中文文獻(xiàn)中關(guān)于算法作曲的主要研究重點(diǎn)在于算法的研究,如“遺傳算法”、“神經(jīng)網(wǎng)絡(luò)”、“機(jī)器學(xué)習(xí)”、“交互式遺傳算法”、“循環(huán)神經(jīng)網(wǎng)絡(luò)”、“馬爾科夫鏈”等;而英文文獻(xiàn)以“evolutionary algorithm”(進(jìn)化算法)為算法研究方向的主要內(nèi)容,與此同時(shí),還進(jìn)行作曲本身要素的研究,如“結(jié)構(gòu)”、“模型”、“作曲技法”等,另外還加入了主觀情感的影響因素研究。
表2 中英文獻(xiàn)算法作曲中介中心性關(guān)鍵詞匯總
關(guān)鍵詞時(shí)區(qū)視圖可以清晰地呈現(xiàn)算法作曲研究主要研究內(nèi)容的變化以及研究前沿。在中文文獻(xiàn)中,前期的研究中幾乎都是算法相關(guān)的研究,如“隱馬爾科夫模型”、“遺傳算法”、“適應(yīng)度函數(shù)”這些關(guān)鍵詞。在中期的研究階段,關(guān)鍵詞為“節(jié)奏”、“音樂創(chuàng)作”、“神經(jīng)網(wǎng)絡(luò)”等,這表明研究重點(diǎn)雖沒有離開算法,但是加入了一些音樂創(chuàng)作相關(guān)的內(nèi)容。目前,中文文獻(xiàn)中算法作曲的研究以“局部自動(dòng)化”為研究前沿。
英文文獻(xiàn)中算法作曲關(guān)鍵詞時(shí)區(qū)視圖中可知前期出現(xiàn)“algorithm”、“music”、“composition”、“computer music”這些關(guān)鍵詞,這表明前期大部分的研究雖然是以算法為研究出發(fā)點(diǎn),但主要研究內(nèi)容是在音樂創(chuàng)作本體上。在研究中期,出現(xiàn)“machine learning”、“genetic algorithm”等關(guān)鍵詞,表明這個(gè)階段是以算法的研究為主。目前,英文文獻(xiàn)中算法作曲的研究以“emotion”、“education”、“evolutionary algorithm”為研究前沿。
通過對比中英文文獻(xiàn)中算法作曲關(guān)鍵詞突現(xiàn)視圖可以得出下表(表3),表中可以看出中文文獻(xiàn)中算法作曲在2005年之前的研究成果幾乎為空白,而英文文獻(xiàn)中在該領(lǐng)域已經(jīng)開始有針對算法的研究,主要體現(xiàn)在交互遺傳算法和人工智能相關(guān)的算法研究;2005年-2010年這個(gè)階段中文文獻(xiàn)中算法作曲的研究內(nèi)容開始集中在算法,而在此階段,英文文獻(xiàn)中相關(guān)研究已經(jīng)開始強(qiáng)調(diào)計(jì)算機(jī)的輔助作用,甚至出現(xiàn)了計(jì)算機(jī)算法作曲應(yīng)用于教育的研究;在2010年-2015年,這個(gè)階段,中文文獻(xiàn)中該領(lǐng)域從單一算法研究變?yōu)榻换ナ骄幊陶Z言的應(yīng)用研究,與此同時(shí),英文文獻(xiàn)中該領(lǐng)域已經(jīng)開始了細(xì)胞自動(dòng)機(jī)(CA)、生物反饋的相關(guān)算法研究來進(jìn)行作曲;2015年-2019年這個(gè)階段,中文文獻(xiàn)中的研究沒有明顯的進(jìn)展,研究內(nèi)容上也沒有明顯的變化。這個(gè)階段的英文文獻(xiàn)中已經(jīng)在算法作曲研究中加入了情感、主觀感知等影響因素的探索研究。
表3 中英文獻(xiàn)中算法作曲突現(xiàn)詞階段對比
本文通過運(yùn)用文獻(xiàn)計(jì)量法,對比中英文算法作曲相關(guān)文獻(xiàn),根據(jù)國內(nèi)外算法作曲發(fā)展趨勢和研究熱點(diǎn),演測其研究前沿并總結(jié)出以下結(jié)論:
(1)國內(nèi)外研究進(jìn)度趨勢大體相同。從發(fā)文量看,國內(nèi)和國外發(fā)文量都是經(jīng)過短暫的緩慢增長后出現(xiàn)三個(gè)明顯的峰值,且各峰值之間的年份間隔分布均勻,發(fā)展趨勢線條走勢大體相同,其原因可能在于國內(nèi)外研究時(shí)代背景相同,兩者的發(fā)展始終存在密切的聯(lián)系。
(2)國內(nèi)外研究熱點(diǎn)存差異。在算法的研究方面還處于尋找“最優(yōu)解”的過程中,國內(nèi)大多數(shù)研究偏重早期遺傳算法和神經(jīng)網(wǎng)絡(luò)。且以遺傳算法為主流方向。目前,國外的多數(shù)研究側(cè)重深入研究進(jìn)化算法輔助作曲,并且在找到“最優(yōu)解”的情況下,加入了主觀情感因素的干擾性,這也是由于領(lǐng)域?qū)W科之間的教育方式的差異性,導(dǎo)致國內(nèi)外在學(xué)科領(lǐng)域的融合度不同。在研究過程中,也會(huì)由于語言翻譯的問題,對于算法作曲的本身具有的邏輯性認(rèn)知存在差異。
(3)國內(nèi)外研究前沿趨于一致。通過時(shí)區(qū)圖譜的對比,也可以發(fā)現(xiàn)國內(nèi)的研究前沿是局部自動(dòng)化,而國外是自動(dòng)作曲。局部自動(dòng)化是需要人工干預(yù)的,而自動(dòng)化的概念已經(jīng)擴(kuò)展為計(jì)算機(jī)技術(shù)代替人體力或者腦力的過程。目前,國內(nèi)對于算法的探索研究不僅局限于遺傳算法,還進(jìn)行了神經(jīng)網(wǎng)絡(luò)等復(fù)雜算法的突破性實(shí)踐以及音樂風(fēng)格情感方面的研究探索。
目前,算法作曲的相關(guān)算法經(jīng)過多年的蛻變、演算、進(jìn)化,已基本滿足該領(lǐng)域研究要求。與此同時(shí),研究視角開始切換到作曲理論,即關(guān)注于作曲理論規(guī)則制定的科學(xué)性,如何讓一個(gè)音樂作品更具有可聽性。但是可以說,自動(dòng)化是算法作曲發(fā)展的必然趨勢。