蔣盛益,陽 垚,廖靜欣
1.廣東外語外貿(mào)大學(xué) 信息學(xué)院,廣州 510006
2.淘寶(中國)軟件有限公司,杭州 310099
中文音樂情感詞典構(gòu)建及情感分類方法研究
蔣盛益1,陽 垚2,廖靜欣1
1.廣東外語外貿(mào)大學(xué) 信息學(xué)院,廣州 510006
2.淘寶(中國)軟件有限公司,杭州 310099
作為2012年中國互聯(lián)網(wǎng)網(wǎng)民使用率僅次于即時通信和搜索引擎的第三大應(yīng)用,網(wǎng)絡(luò)音樂的用戶規(guī)模達(dá)到43 586萬,與2011年同比增長率為13.0%[1],網(wǎng)絡(luò)音樂及其應(yīng)用技術(shù)已經(jīng)成為互聯(lián)網(wǎng)的一個研究熱點。音樂是情感的載體,情感是音樂的本質(zhì)特征和內(nèi)涵,同時也是音樂最重要的語義信息。正因如此,音樂的情感分析廣泛應(yīng)用于音樂檢索和推薦系統(tǒng)、不同場景的音樂配放(如動漫制作)、個人音樂欣賞(如音樂下載服務(wù))等領(lǐng)域,是人機(jī)情感交互技術(shù)研究中重要的組成部分[2],受到業(yè)界學(xué)者的高度重視。
傳統(tǒng)的音樂情感分析大都是基于音頻的,且此方面的研究已有近20年的歷史,然而至今難以獲得準(zhǔn)確反映情感的音頻特征,情感分析未能達(dá)到滿意的水平[3]。因此研究者開始向音樂情感的另一本體——歌詞展開研究,基于歌詞的情感分析逐漸成為熱門的研究方向。歌詞,本質(zhì)上屬于文本的范疇。因此,從歌詞分析的角度來看,音樂的情感由歌詞中所有詞語的情感序列組合而成,最小的語義構(gòu)成單位是詞語,詞語的情感判別是歌詞情感分析的基礎(chǔ)。構(gòu)建一部合理的情感詞典,實現(xiàn)詞匯的情感分析是高效、精確的歌詞情感分析的前提和基礎(chǔ)。
借助于HowNet[4]、《同義詞詞林》[5]等系統(tǒng),目前國內(nèi)構(gòu)建中文情感詞典的研究工作已獲得了一定的成果。Subasic和Huettner手工建立了一個基于情感類別相關(guān)的詞典,詞典中標(biāo)明了詞的強(qiáng)度(表達(dá)情感的力度)和向心度(與類別的相關(guān)程度)[6]。Liu等人提出了使用Open Mind Commonsense數(shù)據(jù)庫為選擇的語言特征賦予情感值,并將其歸納為六個基本類別(高興、悲傷、憤怒、恐懼、厭惡和驚奇)[7]。徐琳宏等標(biāo)注了近4萬句,100萬字的情感語料庫,給出了其情感分布和情感遷移規(guī)律等統(tǒng)計數(shù)據(jù)[8]。佘莉等參照《同義詞詞林》的結(jié)構(gòu)利用聚類技術(shù)進(jìn)行了詞匯擴(kuò)展,構(gòu)建了一個包含近6 000個詞匯的情感詞庫[9]。國內(nèi)情感詞典構(gòu)建起步較晚,目前國內(nèi)仍沒有一部完善的大規(guī)模的中文情感詞典被廣泛認(rèn)可,而面向音樂情感分類的情感詞典幾乎處于空白狀態(tài)。
通過相關(guān)學(xué)者近幾年的努力,目前國內(nèi)對歌詞的數(shù)據(jù)挖掘也取得了一些成果。陳若涵等采用基于詞匯的向量空間模型和層次分類方法研究歌詞的情感[10]。鄭亞斌等通過實驗表明歌詞語料庫的分布基本符合齊夫定律,利用向量空間模型找到了比較相似的歌詞集合,提出了用LRC歌詞中的時間標(biāo)注信息提取歌曲的重復(fù)片段、節(jié)奏劃分等[11]。丁效等通過領(lǐng)域事件詞聚類的方法自動發(fā)現(xiàn)音樂領(lǐng)域具有代表性的事件,采用基于關(guān)鍵詞與觸發(fā)詞相結(jié)合的過濾方法簡化了事件類型的識別過程,并用最大熵模型解決了事件元素識別問題[12]。
本文以改進(jìn)后的Hevner情感環(huán)模型為情感分類基準(zhǔn),從歌詞文本語料庫方面著手,利用HowNet中語義相似度計算的思想,構(gòu)建音樂領(lǐng)域的中文情感詞典,然后在此中文情感詞典的基礎(chǔ)上,借助KNN分類算法的思想,并利用LRC歌詞攜帶的語速信息,提出了一種基于情感向量空間模型的歌詞情感分類方法。
本文實驗的整體過程如圖1所示。
圖1 基于歌詞文本的音樂情感分類流程
2.1 選擇音樂情感模型
不同類型的音樂必定與不同的情感類別相聯(lián)系,如“快樂”、“悲傷”等。本文選擇歌詞文本為情感分類的載體,因此,必須設(shè)置一個針對文本分析的文本關(guān)鍵字模型作為情感分類的依據(jù)。作為文本關(guān)鍵字模型的代表——Hevner情感環(huán)模型,具有非常好的研究基礎(chǔ)。然而,Hevner并不完全適用于中文情感的分析。因此,本文所選取的情感模型是由劉濤等根據(jù)漢語文化背景對原始Hevner情感環(huán)模型進(jìn)行優(yōu)化的情感模型[13],如表1所列。列1為情感類別,即本文用于情感分類的標(biāo)簽,共8類;而列2~列7為對應(yīng)每一個類別的情感詞匯,即理解為如情感類別“快樂”包括了“欣喜”、“明亮”兩種情感。
2.2 構(gòu)建音樂情感詞典
由2.1節(jié)可知,改進(jìn)后的Hevner模型分為兩層,本文分別將其稱呼為一級情感詞匯和二級情感詞匯。一級情感詞匯為表1中的列1,共8個詞,二級情感詞匯為表1所有列(二級情感詞匯包含一級情感詞匯),共47個詞。由于以上47個詞語都是經(jīng)過提煉而成的情感類別標(biāo)簽,并不一定適用于歌詞文本的分析。正因如此,利用HowNet相似度計算及歌詞語料庫,本文對原始的47個情感詞匯進(jìn)行了擴(kuò)展,構(gòu)造了第三級情感詞匯,使其適用于歌詞文本分析。實現(xiàn)過程如圖2所示。最終,情感詞典將情感詞匯分為三個級別,情感詞匯由詞語和情感傾向權(quán)值兩個特征組成,情感傾向權(quán)值為對應(yīng)的第三級情感詞與所屬第二級情感詞的相似度值。如表2所列的存儲結(jié)構(gòu)將情感詞匯存儲在txt文檔中。
表1 改進(jìn)后的Hevner情感模型
圖2 情感詞典構(gòu)建流程
表2 情感詞典的存儲結(jié)構(gòu)
圖3 標(biāo)準(zhǔn)的LRC歌詞文檔
其中,歌詞語料庫采用了從搜狗音樂網(wǎng)站中爬取的59 403篇LRC歌詞(LRC歌詞格式如圖3所示),經(jīng)過如圖2所示的歌詞處理及詞匯提取后得到歌詞詞匯語料庫,用作擴(kuò)展三級情感詞匯的基礎(chǔ)數(shù)據(jù)。之后利用HowNet相似度計算方法計算歌詞詞匯語料庫中每個詞語與47個二級情感詞匯的相似度值,相似度值范圍為[0,1],即每個詞語得到一個47維的向量。設(shè)置初始相似度閾值threshold,從0.1開始,提取出向量中相似度值大于threshold的對應(yīng)的詞語,用作“實驗用三級情感詞匯”,在多個小規(guī)模樣本集中進(jìn)行分類實驗(分類實驗方法將在2.3節(jié)闡述),分析實驗結(jié)果并調(diào)整threshold,每次增加0.05,至threshold為1。最后,經(jīng)過以上的多次實驗,可以從結(jié)果分析得到本實驗中最佳的threshold為0.3。至此面向音樂領(lǐng)域的中文情感詞典構(gòu)建完成,該詞典共包含情感詞匯2 417個,其中8大情感類別的詞匯量的分布情況如表3所列。
表3 情感詞典中8大情感子類的詞匯量分布情況
2.3 構(gòu)建基于歌詞文本的情感向量
本文采用改進(jìn)后的Hevner情感環(huán)模型的8維情感類別“神圣”、“悲傷”、“向往”、“抒情”、“輕盈”、“快樂”、“熱情”和“生機(jī)”以及歌詞的語速信息作為音樂的情感特征向量,共9個維度。該情感特征向量表現(xiàn)為音樂與每類情感的語義(前8維)和節(jié)奏強(qiáng)度(第9維)的相似關(guān)系。
根據(jù)公式(1)計算每一篇歌詞的情感特征向量:
其中,Ek表示情感特征向量中第k維的值;Wi表示一篇歌詞經(jīng)過分詞處理后的第i個詞語;BWk,j表示情感詞典中第k維情感子類中的第 j個詞匯;bool(Wi,BWk,j)為判斷Wi與BWk,j是否同一詞匯的函數(shù),是則取值為1,否則取值為0;Qk,j表示BWk,j所對應(yīng)的情感傾向權(quán)重值,即2.2節(jié)中構(gòu)建的情感詞典中的情感傾向權(quán)值;M表示情感詞典中第k維情感子類的詞匯數(shù)目;S表示該篇歌詞經(jīng)過分詞后得到的詞語總數(shù);StartTimei表示LRC歌詞文檔中的第i句歌詞的時間標(biāo)簽;WordNumi表示第i句歌詞所包含的字?jǐn)?shù);N表示該篇LRC歌詞文檔在經(jīng)過時間標(biāo)簽排序后的句子總數(shù)。
通過考慮情感詞典的結(jié)構(gòu)信息,給出了公式(1)用于計算歌詞的情感特征向量。該方法不是純粹使用模糊數(shù)學(xué)上的and,or,not將多個詞連接,而是將歌詞中所有屬于情感詞典中每個情感子類中所有三級情感詞匯的權(quán)重值進(jìn)行累加,除以詞匯的總數(shù)得到的均值即為特征向量前8維的取值,再通過計算LRC歌詞文檔的語速信息值,并賦值于特征向量的第9維。這樣綜合考慮了歌詞情感表達(dá)的語義信息和節(jié)奏強(qiáng)度信息,增加了隸屬該情感類別的可靠性,使得利用情感向量空間模型能夠取得更好的分類性能。
2.4 歌詞情感分類
本文采用KNN分類算法用于歌詞情感分類,每篇歌詞的情感特征表示成一個9維的情感特征向量。首先對歌詞的情感特征向量進(jìn)行歸一化處理,然后利用KNN分類的思想,對每個測試樣例,計算它與所有訓(xùn)練樣例之間的情感特征向量的歐幾里德距離,以確定其最近鄰列表。最后使用多數(shù)表決的方法,分別對測試樣例進(jìn)行單標(biāo)記分類和多標(biāo)記分類。單標(biāo)記分類將最近鄰中出現(xiàn)次數(shù)最多一個類別作為測試樣例的類別,多標(biāo)記分類將最近鄰中出現(xiàn)次數(shù)最多的前三個類別作為測試樣例的三個類別。針對不同規(guī)模的樣本集進(jìn)行多次實驗。注意,本文進(jìn)行了兩次實驗,在2.2節(jié)中提到需要進(jìn)行多次小規(guī)模實驗,目的是得到最佳的閾值threshold。而最終的歌詞情感分類是在情感詞典已經(jīng)構(gòu)建的條件下進(jìn)行,即2.2節(jié)中在threshold為0.3的條件下構(gòu)建的情感詞典。
在多次不同規(guī)模的實驗中,以下是實驗結(jié)果最優(yōu)的實驗。
(1)數(shù)據(jù)集為從歌詞文本語料庫中抽取了情感類別鮮明的LRC歌詞文檔共169篇,每個情感類別約20篇。
(2)將數(shù)據(jù)集按1∶1的比例分為訓(xùn)練集和測試集,按照上述歌詞的情感分類方法進(jìn)行單標(biāo)記分類和多標(biāo)記分類實驗。在以下實驗中,當(dāng)k取值為9時分類效果最佳。實驗結(jié)果如表4,表5所列。
表4 歌詞情感分類——單標(biāo)記分類測試結(jié)果
表5 歌詞情感分類——多標(biāo)記分類測試結(jié)果
從測試結(jié)果中的分類效果度量值可以看出,本文提出的歌詞情感單標(biāo)記分類器的平均準(zhǔn)確率為0.705,查全率為0.705,F(xiàn)1值為0.697;多標(biāo)記分類器的平均準(zhǔn)確率為0.817,查全率為0.825,F(xiàn)1值為0.812。其中多標(biāo)記分類比單標(biāo)記的評估參數(shù)值提高了11%左右,且抒情、快樂和熱情等類別的分類效果較好,在一定程度上實現(xiàn)了以文字為基礎(chǔ)的情感分類要求,進(jìn)一步驗證了本文中所構(gòu)建的音樂領(lǐng)域的中文情感詞典在歌詞的情感分類上具有較好的性能,能夠比較準(zhǔn)確地反映音樂領(lǐng)域內(nèi)各情感子類的情感特征。
同時亦容易發(fā)現(xiàn),神圣、悲傷、輕盈等類別的歌詞的情感分類效果不佳,經(jīng)認(rèn)真分析整個過程,認(rèn)為問題在于以下方面:
(1)情感模型。本文構(gòu)建情感詞典所采用的情感模型是改進(jìn)后的Hevner模型,是將原Hevner模型中的英文詞匯翻譯成中文的基礎(chǔ)上,再針對中國民族音樂進(jìn)行改進(jìn)的,而本文的研究內(nèi)容主要是華語流行音樂,故在歌詞的用詞特點方面可能存在差異。
(2)情感詞典。經(jīng)過查看情感詞典中各類情感詞的數(shù)量分布,即表3所列,發(fā)現(xiàn)詞匯的分布出現(xiàn)異常,如“生機(jī)”,情感詞匯為868,顯然高于其他各類的情感詞匯數(shù)量,直接影響了基于歌詞文本的情感向量的構(gòu)建結(jié)果。
(3)基于歌詞文本的情感向量。構(gòu)造過程中暫未考慮詞頻的影響。
(4)分類方法。本文采用KNN算法作為分類方法,單一的分類器對分類效果存在影響。
本文針對歌詞領(lǐng)域,提出了一種中文音樂情感詞典構(gòu)建方法及情感分類方法,其中借助了情感模型、歌詞語料庫、HowNet相似度計算方法,初步實驗取得了較好的結(jié)果,在一定程度上證明了該構(gòu)建方法及分類方法的可行性與實用性。該方法可為音樂情感分析研究者提供一種思路,幫助其進(jìn)行相關(guān)的情感分析工作。在以后的研究中將從以下幾個方面進(jìn)行改進(jìn)。
(1)針對情感模型進(jìn)行進(jìn)一步的改進(jìn)或修改,嘗試使用社會標(biāo)簽作為情感分類類別,即普遍認(rèn)可及廣泛使用的一些音樂情感,而非“神圣”、“生機(jī)”等過于書面化的詞語表達(dá)。
(2)針對情感詞典的構(gòu)建,采用人工檢查方式去除情感詞典中的異常詞匯及無意義詞匯,研究各個分類的詞語特點,優(yōu)化情感詞典。
(3)針對基于歌詞文本的情感向量的構(gòu)建,嘗試增加詞頻及實詞詞性的影響作用及優(yōu)化整體構(gòu)建方法,如針對部分區(qū)分度不高的情感詞匯,可以理解為該詞在多個類別所屬的情感詞匯中都存在,增加參數(shù)用于降低這部分詞語的權(quán)重,同時提高高區(qū)分度詞語的權(quán)重。
(4)針對分類方法,嘗試使用除KNN算法外的其他分類算法,對比不同分類方法的效果。
(5)結(jié)合基于音頻的情感分析方法,以提高情感分類的準(zhǔn)確率。
[1]第31次中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計報告[R].中國互聯(lián)網(wǎng)網(wǎng)絡(luò)信息中心,2013.
[2]蔣盛益,李霞,王連喜.音樂情感分析綜述[J].計算機(jī)工程與設(shè)計,2010,31(18):4112-4115.
[3]夏云慶,楊瑩,張鵬洲.基于情感向量空間模型的歌詞情感分析[J].中文信息學(xué)報,2010,24(1):99-104.
[4]董振東,董強(qiáng).知網(wǎng)和漢語研究[J].當(dāng)代語言學(xué),2001,3(1):33-44.
[5]梅家駒,竺一鳴,高蘊(yùn)琦,等.同義詞詞林[M].上海:上海辭書出版社,1983.
[6]Subasic P,Huettner A.Affect analysis of text using fuzzy semantic typing[J].IEEE Trans on Fuzzy Systems,2001,9(4):483-496.
[7]Liu H,Lieberman H,Selker T.A model of textual affect sensing using real-world knowledge[C]//Proc of the 11th Int Conf on Intelligent User Interface,2003:125-132.
[8]徐琳宏,林鴻飛,趙晶.情感語料庫的構(gòu)建和分析[J].中文信息學(xué)報,2008,22(1):116-122.
[9]佘莉,夏虎,傅彥.音樂評論的情感挖掘研究[J].計算機(jī)科學(xué),2009,36(5):172-176.
[10]陳若涵,許肇凌,張智星,等.以音樂內(nèi)容為基礎(chǔ)的情緒分析與辨識[C]//第二屆電腦音樂與音訊技術(shù)研討會,中國,臺灣,臺北,2006.
[11]鄭亞斌,劉知遠(yuǎn),孫茂松.中文歌詞的統(tǒng)計特征及其檢索應(yīng)用[J].中文信息學(xué)報,2007,21(5):61-67.
[12]丁效,宋凡,秦兵,等.音樂領(lǐng)域典型事件抽取方法研究[J].中文信息學(xué)報,2011,25(2):15-20.
[13]劉濤.音樂情感認(rèn)知模型與交互技術(shù)研究[D].杭州:浙江大學(xué)計算機(jī)科學(xué)與技術(shù)學(xué)院,2006.
JIANG Shengyi1,YANG Yao2,LIAO Jingxin1
1.School of Informatics,Guangdong University of Foreign Studies,Guangzhou 510006,China
2.Taobao(China)Software Co.Ltd,Hangzhou 310099,China
Among all the applications for China Internet users,instant message has first-largest users,search engine has the second-largest users and the web music has the third-largest users.Web music and its application technology have been popular with academics.Music plays an important role as a communication media in human communication which carries abundant information of emotion.As a result,musical emotion analysis has been paid more attention.During the process of musical emotion analysis which is based on lyric texts,a reasonable musical semantic lexicon will provide a more accurate result.This paper is about how to build a Chinese musical emotional lexicon which is based on the improved model of Hevner emotional ring model and the semantic knowledge resources provided by HowNet and a text corpus of lyrics. Also it realizes a method of lyric emotional classification with the help of emotional VSM,emotional lexicon and lyrics speed.The experiments show that the Chinese emotional lexicon built here is more suitable in the area of music than the lexicon built by manual.
Chinese emotional lexicon;musical emotion analysis;Hevner emotional ring model;HowNet
作為僅次于及時通信和搜索引擎的中國互聯(lián)網(wǎng)網(wǎng)民第三大應(yīng)用,網(wǎng)絡(luò)音樂及其應(yīng)用技術(shù)受到業(yè)界學(xué)者的青睞。音樂作為人類最重要的交流媒介,攜帶著豐富的情感信息,計算機(jī)音樂情感分析更是得到人機(jī)情感交互技術(shù)領(lǐng)域的高度重視。在基于歌詞文本的音樂情感分析過程中,一部合理的音樂領(lǐng)域情感詞典,將提供更加細(xì)致、更加準(zhǔn)確的分析結(jié)果。以改進(jìn)后的Hevner情感環(huán)模型為基礎(chǔ),借助HowNet所提供的語義資源和從網(wǎng)絡(luò)爬取的歌詞文本語料庫,構(gòu)建了一部樹形層次結(jié)構(gòu)的音樂領(lǐng)域中文情感詞典,并利用LRC歌詞攜帶的時間標(biāo)簽獲取歌曲的語速信息,實現(xiàn)了基于情感向量空間模型和情感詞典的歌詞情感分類。實驗表明與人工構(gòu)建的情感詞典相比,所構(gòu)建的情感詞典更適用于音樂領(lǐng)域。
中文情感詞典;音樂情感分析;Hevner情感環(huán)模型;知網(wǎng)
A
TP311
10.3778/j.issn.1002-8331.1305-0147
JIANG Shengyi,YANG Yao,LIAO Jingxin.Research of building Chinese musical emotional lexicon and emotional classification.Computer Engineering and Applications,2014,50(24):118-121.
國家自然科學(xué)基金(No.61070061);教育部人文社會科學(xué)青年基金項目(No.12YJCZH281);廣州市越秀區(qū)科技計劃項目(No.2012-TP-005)。
蔣盛益(1963—),男,博士,教授,主要研究方向:數(shù)據(jù)挖掘、自然語言處理;陽垚(1991—),女,本科,主要研究方向:數(shù)據(jù)挖掘;廖靜欣(1990—),女,碩士研究生,主要研究方向:數(shù)據(jù)挖掘。E-mail:jiangshengyi@163.com
2013-05-14
2013-06-29
1002-8331(2014)24-0118-04
CNKI網(wǎng)絡(luò)優(yōu)先出版:2013-09-04,http∶//www.cnki.net/kcms/detail/11.2127.TP.20130904.1344.015.html