徐琳宏,林鴻飛,祁瑞華,楊 亮
(1. 大連外國語大學(xué) 軟件學(xué)院,遼寧 大連 116044; 2. 大連理工大學(xué) 信息檢索實驗室,遼寧 大連 116024)
隨著商品經(jīng)濟的發(fā)展,商品的種類和品牌數(shù)量不斷增加,廣告成為商家競爭和銷售的重要手段。廣告?zhèn)鞑サ姆绞讲粌H包括傳統(tǒng)的電視和報紙,網(wǎng)絡(luò)作為一種新的形式,占有的比重也越來越大,尤其是手機、平板電腦和電視等電子媒介的出現(xiàn),為廣告的傳播提供了更快、更廣的傳播途徑,逐漸受到更多商家的青睞。廣告的定義為: “通過媒體向公眾介紹商品、勞務(wù)和企業(yè)信息的一種宣傳方式。一般指商業(yè)廣告。從廣義來說,凡是向公眾傳播社會人事動態(tài)、文化娛樂、宣傳觀念的都屬于廣告范疇。[1]”廣告的形式多樣,有語音、圖片以及視頻形式。無論哪種形式,廣告語言都是其中不可或缺的部分。“廣告語言是指廣告中的語言,包括各種廣告中所有的語言文字信息,即廣告中的語音、詞語、句子、文字、標點符號和文字圖形。[2]”
廣告語言和廣告語是從屬關(guān)系,“廣告語言包括廣告語,廣告語是廣告語言中的純語言形式,是廣告語言中最能體現(xiàn)企業(yè)品牌價值的部分。[3]”一則成功的廣告語不僅要語言簡短、朗朗上口,而且要有美感,能凝練商品或品牌的核心價值,是一種高級的語言創(chuàng)作過程。廣告語的創(chuàng)作過程中需要更多的智慧、靈感和豐富的知識,也是一個艱苦的過程。
古詩詞是傳統(tǒng)文化中廣泛流傳的文學(xué)形式,朗朗上口、對仗工整,有較強的傳播優(yōu)勢。巧妙地用古詩詞改編廣告語,可以增強廣告作品的文化品位,增強廣告的感染力。古詩詞一般文字精煉、意境深遠,符合廣告語簡短而內(nèi)涵豐富的特點。借助詩詞的廣告語能夠獲得人們的廣泛認知,有較高的知名度。通過計算機自動生成古詩詞型的廣告語有兩種生成方式: 一種是為商品生成新的符合韻律的詩詞廣告語;另一種是在原詩的基礎(chǔ)上經(jīng)過嵌入和替換的方法生成廣告語。兩種方式各有特色,生成新詩詞的方法可以更好地貼近商品特征,但新詩詞在傳播能力方面不如嵌入式的詩詞廣告語,因為后者是大家耳熟能詳?shù)脑娋?,能迅速引起人們興趣,便于記憶和再次傳播,本文采用后一種形式。
在古代詩詞的基礎(chǔ)上,我們通過諧音替換和多特征融合的方式生成廣告語,并從語音、形狀、語義和情境多方面評估廣告語,為該類語言的創(chuàng)作提供更多更好的資源。接下來的內(nèi)容安排如下: 第1節(jié)介紹了國內(nèi)外廣告語生成和詩詞生成的相關(guān)工作;第2節(jié)提出諧音廣告語的生成模型;第3節(jié)解釋生成廣告語的評估方法;第4節(jié)報告了實驗的設(shè)計和結(jié)果;第5節(jié)給出了研究的結(jié)論和未來改進的方向。
本文研究目標是以古詩詞為原型,自動生成諧音廣告語,所以下面分別從諧音廣告語生成和古詩詞生成兩個方面介紹相關(guān)的研究工作。
諧音廣告語中包含諧音詞匯,而大部分包含諧音詞匯的語句都具有雙關(guān)的含義。在諧音雙關(guān)語和廣告語的生成方面,國外很早就有相關(guān)的研究工作。早在1982年,Michel等人就研究過雙關(guān)廣告語中的模糊性[4]。2002年,Pricken也提出將熟悉的表達方式做替換或者變換,這是產(chǎn)生廣告語的重要手段[5]。2003年,Lundmark等人以概念混合理論為基礎(chǔ),研究雙關(guān)廣告語中隱喻與幽默的關(guān)系[6]。2008年,Valitutti等人生成具有情感的廣告標題,生成廣告語時根據(jù)句中詞匯來合成情感,而情感是在大規(guī)模語料庫上通過無監(jiān)督的方法獲得,系統(tǒng)選擇一些固定情感的詞匯,如有強烈諷刺效果的詞匯等,生成新的廣告語[7]。2011年,Valitutti等又提出一種計算幽默程度的方法,評估生成的諧音雙關(guān)語。首先利用音素距離、音節(jié)距離、單詞距離和熟悉用語等多個特征生成諧音雙關(guān)語,最后采用人工評估的方法檢驗生成系統(tǒng)的效果[8]。2012年,Pawel Dybala等人生成日文的雙關(guān)語,通過高頻詞匯統(tǒng)計的方式過濾候選詞匯,降低雙關(guān)語生成系統(tǒng)的時間代價。Yike Zhang等人分別在2011和2012年利用敘述生成系統(tǒng)中的概念字典和廣告修辭技術(shù)提高廣告生成系統(tǒng)的能力[9-10]。2013年,Ping Xiao等人為圖片廣告語生成恰當?shù)碾[喻概念。他首先尋找與商品價值相同的高想象力的概念,然后從情感、突出特點、次要屬性和張量相似度四個方面評估候選答案,最后采用三個真實的廣告案例,驗證生成方案的有效性[11]。Valitutti等人也在2013年通過對普通文本的替換產(chǎn)生諧音幽默的句子,替換過程中主要考慮單詞的聲音相似性、拼寫和可替換性三個特征,使幽默生成變?yōu)樵~語選擇問題,最后通過人工打分的方式評估諧音文本的幽默性[12]。
古詩詞是中華傳統(tǒng)文化的璀璨明珠,關(guān)于古代詩詞分析及自動生成方面有許多研究工作,古詩詞的生成除了考慮對仗和韻律,更重要是的考慮生成詩詞的情境和意境。
徐有富將詩的意境分為時代特色、地域特色和個人特色三部分[13]。陳少松指出唐詩也分古體詩和近體詩,有的遵守平仄要求,有的不遵守,并詳細討論了詩與音節(jié)和調(diào)之間的關(guān)系[14]。徐志嘯用“套語”理論研究《詩經(jīng)》,認為相同韻律的詩表達同樣的思想[15]。莫礪鋒在《怎樣讀杜甫詩》一文中記述杜甫生處動蕩時代,詩的風(fēng)格沉郁[16]。以上是語言學(xué)方面對詩詞韻律和意境的部分研究。下面介紹自然語言處理中關(guān)于詩詞生成方面的研究工作。
2010年,周昌樂等人根據(jù)宋詞的特點設(shè)計平仄編碼,構(gòu)建了一種基于遺傳算法的宋詞自動生成模型。并針對主題相關(guān)度、風(fēng)格情感一致性和總體質(zhì)量三個方面人工打分,評測生成詩句的效果[17]。2010年,何晶等人根據(jù)用戶輸入的關(guān)鍵詞,生成詩詞首句,然后將格律詩的上下句映射為統(tǒng)計翻譯模型中的源語言與目標語言。其中設(shè)置的詩詞評價指標有較好的借鑒價值,全詩評價包括語言、韻律、是否符合題意、結(jié)構(gòu)和意境五個方面,每部分權(quán)重不同,采用人工打分的方式評估[18]。2015年,蔣銳瀅利用主題模型進行詩詞的意境擴展,使用BLEU值自動評測詩詞質(zhì)量[19]。
以上是國外雙關(guān)廣告語生成和國內(nèi)詩詞生成方面的研究進展,國內(nèi)關(guān)于廣告語生成方面的研究較少,基于固定文本來生成廣告語的研究更是處于起步階段。本文在大家耳熟能詳?shù)某S迷娫~基礎(chǔ)上,生成諧音廣告語,主要的貢獻如下: ①根據(jù)一定的韻律模板生成初級廣告語群,并提取廣告語的九大特征; ②對生成的初級廣告語群,采用基于主成分分析和自定義權(quán)重的雙序評估方法,得到每個品牌的高分廣告語群; ③考慮語音、形狀、語義和情境四個維度,采用人工評分的方式,評估生成廣告語的質(zhì)量。
廣告語生成模型是在人們熟知的古詩詞文集中挑選詩句,利用一定語音模板生成候選廣告語群,然后再分別從語音、形狀、語義和情境四個方面計算生成廣告語的特征向量,從而得到某品牌的廣告語群的特征矩陣。最后在評估階段根據(jù)生成的特征矩陣,自動獲取最佳廣告語。某品牌的廣告語生成系統(tǒng)的整體流程如圖1所示。
圖1 廣告語的生成模型
該模型的輸入是某品牌的信息,首先利用語音模板在古詩詞文集中查找相應(yīng)的候選廣告語。然后對該品牌的候選廣告語群中的每條廣告語計算形狀、語義、情境和語音四個維度的九個特征,生成該品牌廣告語群的特征矩陣,作為后續(xù)評估算法的輸入,從而篩選出質(zhì)量較好的多條廣告語。特征矩陣是選擇廣告語的重要數(shù)據(jù),下面本文將詳細介紹四個維度的九個特征。
語音模板是在古詩詞文集中檢索每條詩句,查找與品牌信息相同或者相似發(fā)音的詞匯,并替換成相應(yīng)的品牌信息,生成候選廣告語群。在計算兩個詞匯發(fā)音相似程度時,本文采用浮動積分制。
其中五支韻,i 與聲母 zh、ch、sh、z、c、s 搭配,而七齊韻,i與聲母 b、p、m、f、d、t、n、l、j、q、x、y搭配。
模板一是向上加分制,如果兩個詞匯的韻母完全相同分值設(shè)定為3,詞匯中如果有一個字的發(fā)音完全相同,即聲母、韻母和音調(diào)一致,則分值加1。例如,“江鈴”和“江陵”,在韻母相同的基礎(chǔ)上,兩個字聲母都相同,則語音距離得分為5。模板二是向下減分制,如果兩個詞匯的韻母不相同,則檢查兩個詞匯的發(fā)音是否符合十三轍十八韻,符合則語音距離得分為1。古代詩詞講究合轍押韻,押韻的詩句讀起來朗朗上口,也便于記憶。本文使用《詩韻新編》[20]中選取的十八韻制作模板,其中十八韻分類情況見表1。
表1 十八韻
形狀特征是指廣告的外在表現(xiàn)形式,包括詞性、長度和字形三部分。
(1) 詞性特征: 該特征計算品牌詞匯Bi與詩句中被替換掉的原詞匯Pi的詞性是否相同。如果詞性相同得分為1,否則得分為0。本特征在一定程度上體現(xiàn)了生成廣告語的語法正確性。
(2) 長度特征: 太短的廣告語信息含量低,太長的廣告語又容易使人失去閱讀興趣。單純使用長度數(shù)值不能體現(xiàn)上述對廣告語的要求,所以,本文將廣告語的字數(shù)通過高斯變換,得到長度特征,增加中間長度的廣告語特征值,降低長度過長或過短的廣告語特征值,具體公式如式(1)所示。
(1)
其中x表示廣告語的字數(shù),f(x)為變換后的長度特征值。期望為μ,標準差為σ2,由公式(1)可見,選擇一個合理的期望值μ,對結(jié)果的影響較大。為了得到合理的期望值,需要統(tǒng)計大規(guī)模的廣告語,計算平均長度。2013年,劉佳等人創(chuàng)建了廣告語言文本語料庫[21]。該語料庫包含2 676條廣告語,共計28 653個漢字,廣告語的平均長度為10.7,所以本文選擇μ為10.7,σ=1的正態(tài)分布。
(3) 字形特征: 有時包含相同漢字的詞匯在詞義上也會比較相近,所以字形特征計算品牌詞匯Bi與詩句中原詞匯Pi有多少個字完全相同。特征初值為0,如果找到字形相同的字,則累加1。
語義特征主要是體現(xiàn)品牌信息嵌入到詩句中,語義上是否合理、通暢。包括內(nèi)聚程度、替換距離和熟悉程度。假設(shè)廣告種類的詞匯為Ti,詩句中被替換掉的詞匯為Pi。
(1) 內(nèi)聚程度: 計算Ti與廣告語中其他詞匯的Bigram值,相加后除以詞匯總數(shù),如式(2)所示。
,Vj)/lengh(Ai)
(2)
其中Coh(Ai)表示廣告語Ai的內(nèi)聚程度,Bigram(Ti,Vj)計算品種詞匯Ti與詩句中第j個詞匯的Bigram值。所以內(nèi)聚程度是指Ti與廣告語中其他詞匯Bigram加和除以廣告語的詞匯總數(shù)。值越大說明詩詞內(nèi)容與該種類的商品越相關(guān)。本文集成KenLM Toolkit[22]工具包,訓(xùn)練Ngram語言模型。
(2) 替換距離: 計算品牌詞匯Bi與詩詞中被替換掉的詞匯Pi之間的Bigram值,如式(3)所示。
Dis(Ai)=Bigram(Bi,Pi)
(3)
Dis(Ai)值越大說明廣告信息嵌入的越合理,值太小,則說明該品牌信息與原詩語義差別較大。
(3) 熟悉程度: 每首詩被人們熟知的程度不一樣,有些詩被廣為傳頌,而有些詩只有詩詞鑒賞專家才了解。朗朗上口,被更多受眾熟知的詩生成的廣告語容易記憶和傳播。
為了保證廣告語的生成效果,本文選擇的詩詞是人們耳熟能詳?shù)奶圃娝卧~,將每首詩的熟悉程度定為四個等級。以人教版和蘇教版的語文教材為劃分標準,小學(xué)語文教材中出現(xiàn)的詩熟悉程度的特征值為5,中學(xué)教材中的值為4,高中教材中的值為3,不在語文教材中的詩詞值為1。可見,值越大熟悉程度越高,生成的廣告語傳播效果越好。
唐朝的王昌齡在《詩格》中提到“詩有三境: 一曰物境;二曰情境;三曰意境”,其中情境的定義為“情境二。娛樂愁怨,皆張于意而處于身,然后馳思,深得其情?!焙唵蝸碚f,詩的情境就是指詩中表達的情感。
廣告語主要是通過贊揚等手段,以積極的情感表達商品的優(yōu)點。所以通常來說,包含正向情感的古詩比較適合作為廣告語,而包含哀怨、批評等負向情感的古詩作為廣告語接受度會比較低。為了更好地刻畫詩句的情感特征,本文將情境特征劃分為詩句情感和整詩情感兩部分,因為一首詩中多有轉(zhuǎn)折和遞進,每一個分句的情感不一定和整首詩的情感基調(diào)一致,所以我們采用詩句情感和整詩情感,分別從微觀和宏觀兩個方面來描述詩句的情感。
(1) 詩句情感: 該特征主要描述詩詞生成的廣告語的情感傾向性,分為-1、0和1三個等級。分別表示貶義、中性和褒義三種情感。計算如式(4)所示。
(4)
其中Orien(Ai)表示廣告語Ai的情感傾向性,Orien(Cj)表示廣告語中第j個漢字的情感傾向性。因為古詩中的用詞和現(xiàn)代漢語的用詞有較大差別,一方面分詞的準確率比較低,另一方面即使切分正確,古詩中的用語在現(xiàn)代情感詞典中也很多沒有收錄,因而,本文選擇在漢字級別上計算古詩的情感。一條廣告語的情感傾向性是通過其中字的情感傾向性累加得到的。漢字Cj的情感Orien(Cj)是通過大連理工大學(xué)信息檢索實驗室的情感詞匯本體[23],根據(jù)漢字出現(xiàn)在正向和負向情感詞匯中的頻率確定漢字的情感。即,
其中MaxClass(Cj)表明字Cj在情感詞典出現(xiàn)次數(shù)最多的類別,分為褒義、貶義和中性三種類別。
(2) 整詩情感: 古詩相對于現(xiàn)代文來說,比較晦澀難懂,還有的詩文比較長,不容易找到代表整篇古詩情感基調(diào)的語句。所以,本文不是通過分析古詩文本身獲得整篇詩文的情感,而是利用百度百科,爬取與詩篇對應(yīng)的現(xiàn)代文解說。例如《靜夜思》在百度百科中的解說為“此詩描寫了秋日夜晚,詩人于屋內(nèi)抬頭望月的所感。詩中運用比喻、襯托等手法,表達客居思鄉(xiāng)之情,語言清新樸素而韻味含蓄無窮,歷來廣為傳誦” 。由此可見,現(xiàn)代解說比白話文形式的古詩文更易理解。
詩詞解說可以看作是一個小的語篇,獲取篇章情感傾向性的方法是: 首先,使用Word2Vec在1G的維基百科中文語料上訓(xùn)練詞向量。然后將詩文解說中每個詞匯的詞向量拼接得到一篇解說文的二維矩陣Mij,i為解說文的最大詞匯長度,j為一個詞向量的長度。最后將矩陣Mij作為卷積神經(jīng)網(wǎng)絡(luò)(CNN)的輸入,通過深度學(xué)習(xí)的方法計算語篇的情感傾向性。詩文解說作為測試集,訓(xùn)練集和開發(fā)集選取 COAE2014 任務(wù) 4 提供的5 000條微博語句,其中4 000條訓(xùn)練集,1 000條作為開發(fā)集。卷積神經(jīng)網(wǎng)絡(luò)在開發(fā)集上的準確率為86.25%。
第2節(jié)中的廣告語生成模型,為每條廣告語計算出一個特征向量。因此,輸入一個品牌的商品,生成候選的廣告語群,即得到包含多條廣告語的特征矩陣。有時一個品牌商品廣告語的數(shù)量可以達到幾十個或者幾百個,如何從中挑選最優(yōu)的廣告語,需要一個合理的評估算法。
評估算法的輸入是廣告語群的特征矩陣,因為此階段生成的廣告語并沒有評價質(zhì)量好壞的標簽,需要采用無監(jiān)督的方法,將多特征融合,得到廣告語的排序。本文采用的是多級融合的雙序評估算法,算法的整體流程如圖2所示。
圖2 多級融合的雙序評估算法
廣告語群的特征矩陣分別經(jīng)過主成分分析(Principal Component Analysis,PCA)和自定義權(quán)重(Custom Weight,CW)兩種評估算法計算得分并排序,最后融合兩種評估算法的分值,得到最終的廣告語分值。多級融合中第一級是指兩種評估算法中分別融合特征矩陣的多個特征,第二級融合是指組合兩個評估算法的得分,獲取廣告語的最終分值。下面分別介紹兩種評估方法。
基于主成分分析的評估算法是在一定有效成分比例的控制下,通過矩陣變換,選擇多特征值中比較有代表性的特征進行積累,計算得分。
3.1.1 PCA的基本原理
主成分分析(Principal Component Analysis,PCA),是一種常用的無監(jiān)督降維方法。通過正交變換將一組相關(guān)特征轉(zhuǎn)換為一組最優(yōu)不相關(guān)的特征。其主要原理如下:
假設(shè)樣本個數(shù)為m,X={x1,x2…,xm}表示樣本數(shù)據(jù)。第一步,首先對樣本數(shù)據(jù)X進行歸一化,計算樣本的協(xié)方差矩陣S=XXT。第二步,求得S的m個特征根λ={λ1,λ2…,λm},使|S-λI|=0,其中I為單位矩陣。第三步,求特征根對應(yīng)的單位特征矩陣A,則主成分F=AX。
(5)
一般有效成分比例取值在80%以上,使降維后的特征能更好地體現(xiàn)原始樣本數(shù)據(jù)的關(guān)系。
3.1.2 基于PCA的廣告語評估
每條廣告語都對應(yīng)一個向量,每個分量分別對應(yīng)第2節(jié)中給出的九個特征。這些特征之間有一定的相關(guān)性,例如詩句情感和整詩情感可能相關(guān),整個詩文的情感一定是通過部分詩句來表現(xiàn)的。還有替換距離和內(nèi)聚程度也都有一定的相關(guān)性。如果直接將各特征的分值歸一化后相加,會把某些相關(guān)性較大的特征多次疊加。為了去除特征之間的冗余性,本文首先利用主成分分析法,消除部分特征的相關(guān)性,保留獨立不相關(guān)的p個主要特征,然后將p個獨立的特征值相加,作為廣告語的最終得分。
(6)
自定義權(quán)重的評估算法首先為各特征分配自定義的權(quán)重,然后將權(quán)重向量與特征向量相乘,并加和作為廣告語分值。具體步驟如下:
第一步,將九個特征分為形狀、語義、語音和情境四個維度,每個維度的權(quán)重初始化為0.25,包含多個特征的維度,每個特征平分本維度的權(quán)重,得到一個初始化的權(quán)重向量W={w1,w2,…,wn}。其中,n值為9。第二步,通過式(7)計算廣告語Ai的得分:
*Xij
(7)
本文選擇網(wǎng)上流傳較廣的四個標準廣告語作為測試集,每個都是由詩詞改編。用這些廣告語測試兩種評估算法的有效性。利用第2節(jié)中給出的模型為四個品牌生成廣告語群。分別通過PCA和自定義權(quán)重兩種方法,計算標準廣告語的得分,分值的范圍是0~9。兩種評估方法在標準廣告語上的平均得分均高于5.3分,且標準廣告語在生成的廣告語群中排名基本都在前三名。說明兩種評估方法都能夠有效地從生成的廣告語中挑選出大眾認可度較高的廣告語。
雖然兩種評估方法都能夠識別接受度較高的廣告語,但兩者打分的結(jié)果也有一定差別。基于PCA的評估方法打分普遍比基于權(quán)重的方法分值低,且廣告語之間分值差距較小。而基于權(quán)重的評估方法廣告語群中分值差距較大。如果單純使用PCA的評估方法,不能有效區(qū)分廣告語的級別,僅使用基于權(quán)重的方法,可能會丟失某些質(zhì)量較高的廣告語,召回率較低。單純使用PCA的方法又不能更好地體現(xiàn)廣告語的區(qū)分度。為了更全面和完善地評估生成的廣告語,本文融合了兩種評估算法,具體算法如下:
forAiin AdvermentList:
if score_pca(Ai)>=tand
score_weight(Ai)>=t:
score(Ai)=average(Ai)
else if score_pca(Ai)>=t:
score(Ai)=score_pca(Ai)
else if score_weight(Ai)>=t:
score(Ai)=score_weight(Ai)
else
score(Ai)=0
其中t為廣告語分值的閾值,本文設(shè)置為6。循環(huán)廣告語群中每條生成的廣告語,如果兩種評估方法的分值都大于等于t,則最終分值取兩者平均。如果兩種評估方法的分值都小于t,則舍棄該廣告語。從算法中可以看出,兩種評估方法,只要有一組分值大于t,則輸出廣告語,這在一定程度上增加了高分廣告語的召回率。如果兩個評估方法分值都大于t,則取平均值,也保證了廣告語之間的區(qū)分度。
第3節(jié)中通過融合兩種評估算法,得到高分廣告語群,這些評分較高的廣告語是否能夠獲得受眾的認可,還需要通過人工打分的方式評估。本節(jié)主要介紹使用的語料、實驗方案及人工評估標準和結(jié)果。
實驗數(shù)據(jù)包括品牌信息和古詩詞文集。品牌信息本文選擇了茶葉、白酒、酒店和襯衫四個品種,共28個品牌的信息。每個品牌信息包括品種、品牌、諧音詞匯和描述四部分信息。其中,諧音詞匯是最終出現(xiàn)在廣告語中的詞匯。
考慮到生成的廣告語不但要朗朗上口,還要便于記憶和傳播,本文的古詩詞文集沒有采用全唐詩和全宋詞,而是選用人們比較熟悉的唐詩和宋詞591首,按句切分后作為候選的古詩詞文集,其中每句包括詩名、作者、詩句、熟悉程度和詩詞描述。熟悉程度是指人們對詩句的熟悉程度。小學(xué)、中學(xué)和高中課本中的詩句分別定位5、4、3等級,其余的熟悉等級定義為1。詩句描述是在百度百科抓取的詩文解釋,完整描述整個詩文的內(nèi)容和意境。
4.2 實驗方案及結(jié)果4.2.1 實驗方案及評估標準
首先,根據(jù)輸入的品牌信息,利用第2節(jié)中的廣告語生成模型,生成候選廣告語群,并計算對應(yīng)的特征矩陣。然后采用第3節(jié)中介紹的多級融合的雙序評估算法,以特征矩陣為輸入,得到候選廣告語的評分和排名,并從中分離出高分廣告語群。最后,制定合適的評估標準,通過人工評估的方式,驗證生成廣告語的質(zhì)量。
考慮到目前機器對詩詞意境和語義關(guān)系的理解的不足,我們采用人工評估的方式綜合考察廣告語的效果。曹志耘在《廣告語言藝術(shù)》中認為廣告語要“簡明、醒目、生動”[2]。于根元在《廣告語言概論》中提到“廣告語言要短,要上口”,“廣告語言的任務(wù)是介紹商品和服務(wù)”[24]。根據(jù)上述廣告語的特性,本文從語感和主題貼合度兩個方面考察生成的廣告語,具體的評估標準如表2。
表2 廣告語評估標準
4.2.2 實驗結(jié)果及分析
我們請五名評測員按表2中的標準對高分廣告語群打分。經(jīng)雙序評估算法過濾后的廣告語共55條,每條都由五個評測人員分別在語感和主題貼合度兩個方面打分,結(jié)果如表3所示。
其中機器得分是第3節(jié)雙序評估算法計算后的分值。P1到P5列分別給出五個評測人員在語感和主題貼合度兩個方面對55條廣告語的評分結(jié)果。
表3 人工評估結(jié)果
從結(jié)果可以看出人工評估結(jié)果略低于機器評分,兩者基本相近,說明雙序評估算法對高分廣告語群的評估與人們的感受基本接近。語感得分普遍比主題貼合度部分比例高,說明語音模板效果較好,能夠過濾出朗朗上口的廣告語。但廣告主題和詩詞意境的貼合還有待加強。
圖3分析了茶葉、白酒、酒店和襯衫四個品種廣告在人工評分和機器評分上的差異。白酒的機器評分與人工評分最相近,這是因為很多古詩的題材與酒有關(guān),詩詞的意境與品種主題比較貼合。襯衫的人工評分最低,只有4.7分。很大一部分原因是由于襯衫屬于現(xiàn)代商品,古詩所處的時代沒有此類商品,很多襯衫和古詩的主題不相融。所以在生成廣告語中可考慮商品種類和文集之間的相融程度。例如白酒適合使用古詩生成廣告,而洗漱用品可能使用歌詞作為原始文集更好。
圖3 不同品種的評測結(jié)果
為了對比三種評估方法的效果,下面通過55個人工評估的廣告語檢驗PCA評估方法、自定義權(quán)重的評估方法以及融合評估方法的有效性。其中,一致性是計算自動評估方法與人工評分差值的平均,如表4所示。
表4 三種評估方法效果對比
實驗結(jié)果表明,PCA評估方法比權(quán)重評估方法的一致性更高,更接近人工評分的結(jié)果,但權(quán)重評估方法的F1值最高,能夠找到更多的高分廣告語。融合方法吸取兩種評估方法的優(yōu)點,F(xiàn)1值更高,與人工評分最接近。
為了進一步細化各個維度特征對自動評分結(jié)果的影響,本文以效果較好的自定義權(quán)重方法為例,依次添加語義、情境、形狀和語音四個維度的特征,取機器評分與人工評分之差的絕對值衡量各個特征的作用,結(jié)果如表5所示。
表5 各維特征對自動評估算法的影響
可見,依次加入語義、情境、形狀和語音四大類特征,機器評分的結(jié)果逐漸接近人工評分的結(jié)果。其中加入語音特征,結(jié)果提高最為明顯,這是因為諧音廣告語評估中,語音上是否朗朗上口是評估大眾接受程度的一個重要特性。
因為人工的參與,不同人對詩詞的理解有一定的隨機性,打分機制存在依賴打分人個人偏好的問題。為了衡量評估人工打分質(zhì)量,本文嘗試增加了機器評估生成廣告語的部分,使機器評估方法輔助人工評估,更加全面和多角度地評估生成的詩詞廣告語。
廣告語一般簡明、醒目,所以機器評估部分主要從語義透明度和語句簡潔性兩個方面考核。語義透明度是指整個句子的語義可以根據(jù)合成語句的多個詞匯含義來推知的程度。本文通過計算廣告語中所有字的使用頻率來衡量。語句簡潔性是指句子清晰、簡單,本文利用語句中漢字的筆劃數(shù)量來計算。最后將機器評估的排序結(jié)果與人工評估的排序結(jié)果對照,利用兩者的相關(guān)性判別不同評估人的打分質(zhì)量。
表6中“前N個”代表人工評估的前N個廣告語在機器評估的前N個中出現(xiàn)的個數(shù),即兩者的一致度。由于機器對詩詞意境和語義的把握還有欠缺,所以機器評估不能完全代替人工評估。但機器評估涵蓋了廣告語要“簡明、醒目”的特點,它與人工評估的相關(guān)性可以從一個側(cè)面反應(yīng)人工評估的可靠性。由表6中數(shù)據(jù)可以看出人工評估與機器評估的相關(guān)系數(shù)均在1/3左右,每個人的相關(guān)系數(shù)基本相近,可見人工評估雖然有一定的主觀性,但標準基本相近,比較可靠。
表6 人工評估一致性檢測
表7給出了生成廣告語的部分樣例,從結(jié)果可以看出生成的部分廣告語質(zhì)量可以接受,也有一些廣告語讀起來朗朗上口,并與品牌主題貼合度較大,有一定的傳播價值和藝術(shù)性。
表7 部分高分廣告語
本文在融合多種語音和語義特征的基礎(chǔ)上,生成諧音廣告語,利用雙序評估算法自動計算廣告語的分值,從而得到主題相關(guān)且便于傳播和記憶的廣告語。根據(jù)嚴格的人工評測結(jié)果,該模型生成的大部分廣告語是可以接受的,具有較好的實用性。
但我們的研究工作也存在一些問題,如部分三個字以上的品牌信息不能生成合適的廣告語。這一方面是因為被人們熟知的古詩詞數(shù)量有限,另一方面是生成模型缺少單字分別嵌入的能力。未來,我們將嘗試在古詩詞的基礎(chǔ)上增加歌詞等文本集,并進一步提高模型的生成能力。