周舒君 何冬梅 江漢大學(xué)人文學(xué)院
從手機(jī)語(yǔ)音助手到語(yǔ)音地圖,人工智能的語(yǔ)音功能已經(jīng)深入到我們當(dāng)代生活的很多方面,以人工智能配音的首部紀(jì)錄片《創(chuàng)新中國(guó)》也已經(jīng)面世。
紀(jì)錄片《創(chuàng)新中國(guó)》的重磅問(wèn)世不僅為科技狂人們獻(xiàn)上一場(chǎng)“視覺(jué)盛宴”,還被稱之為人工智能向藝術(shù)致敬的代表。該紀(jì)錄片的最大亮點(diǎn)在于通過(guò)科大訊飛利用智能語(yǔ)音和人工智能技術(shù),讓已逝的著名配音藝術(shù)家李易老師的聲音重現(xiàn)熒幕,這也是全球第一部全篇采用人工智能配音的紀(jì)錄片。
“人工智能配音技術(shù)稱為‘TTS’(文本到語(yǔ)音)。簡(jiǎn)單地說(shuō),這種合成技術(shù)將用戶輸入的文本轉(zhuǎn)換為流暢自然的語(yǔ)音輸出,并支持語(yǔ)速、音調(diào)、音量和音頻設(shè)置。其打破了傳統(tǒng)的人機(jī)交互方式,使人們更加自然地溝通。在此技術(shù)基礎(chǔ)上,結(jié)合頂級(jí)聲學(xué)模型和語(yǔ)言模型,結(jié)合韻律處理,情感語(yǔ)音合成等技術(shù),最終呈現(xiàn)出自然而富有張力的配音?!盵1]由此可知,人工智能配音技術(shù)幾乎全程使用計(jì)算機(jī)來(lái)完成一系列合成輸出工作。新興科技的出現(xiàn)必然要先從自身的條件作為基礎(chǔ),再進(jìn)行下面的每一個(gè)步驟。傳統(tǒng)的紀(jì)錄片配音,往往受到設(shè)備、配音演員、后期制作、場(chǎng)地等因素的制約而不能如期進(jìn)行或完成。但人工智能配音的出現(xiàn)就減輕了很多煩瑣的環(huán)節(jié)。相比真人真聲為紀(jì)錄片逐字逐句配音要節(jié)省更多的時(shí)間,在短時(shí)間內(nèi)提高效率,這樣可以加速紀(jì)錄片完成進(jìn)度。我們可以花費(fèi)大量時(shí)間在創(chuàng)新研究上,使人工智能為紀(jì)錄片配音時(shí)更具特色,使其賦予更多細(xì)膩的功能,逐漸變成一個(gè)能體會(huì)情感變化的紀(jì)錄片配音助手。
從《周恩來(lái)外交風(fēng)云》到《改革開(kāi)放二十年》再到《再說(shuō)長(zhǎng)江》《大明宮》李易老師的聲音陪伴一代又一代人的成長(zhǎng),似乎也成了紀(jì)錄片配音的代名詞。應(yīng)該說(shuō),李易老師的聲音本身就具有標(biāo)識(shí)性。紀(jì)錄片《創(chuàng)新中國(guó)》通過(guò)人工智能技術(shù)再次讓李易老師的聲音重現(xiàn)熒屏,“其音色的端莊儒雅且厚重自然、發(fā)音的強(qiáng)氣息和弱控制、語(yǔ)流的起伏平淡又極富張力,共同構(gòu)成其紀(jì)錄片解說(shuō)的獨(dú)特風(fēng)格。”[2]
(1)吐字發(fā)音
“毋庸置疑,配音藝術(shù)最基本的要求就是規(guī)范到位的吐字歸音和嫻熟自如的發(fā)聲技巧?!盵3]在吐字發(fā)音方面,人工智能充分復(fù)制并重組了李易老師的語(yǔ)音,成功實(shí)現(xiàn)了李易老師吐字清晰、準(zhǔn)確,發(fā)音純正、規(guī)范的特點(diǎn)。例如在《創(chuàng)新中國(guó)》第一集《信息世界》有一句“對(duì)于每天忙碌在派送一線的陶文斌來(lái)說(shuō),這次選拔競(jìng)爭(zhēng)激烈。”其中“陶文斌”“激烈”這樣的重音詞,不僅在調(diào)值上能夠做到陰陽(yáng)上去分明到位,并且在這基礎(chǔ)上能夠很自然的突出重點(diǎn),使整個(gè)句子主次分明邏輯清晰。讓受眾感受到該紀(jì)錄片態(tài)度的端正性與嚴(yán)謹(jǐn)性。而模仿一位大師吐字發(fā)音的準(zhǔn)確性只是人工智能為紀(jì)錄片配音邁出的第一步。
(2)音色調(diào)整
“美好的聲音總是能夠讓人難以忘懷,這也說(shuō)明每個(gè)人都有自己獨(dú)特的聲音特色和聲音魅力?!盵3]音色的特點(diǎn)表現(xiàn)為共鳴腔體的位置、氣息的處理方式、歸音的特點(diǎn)以及音高音強(qiáng)的處理等。李易老師的聲音厚重自然、端莊儒雅,其配音作品氣息平穩(wěn)、虛實(shí)相宜,共鳴腔體的位置以胸腹共鳴為主,歸音平穩(wěn)利落。這種音色端莊大氣適于給大題材、大事件配音。在《創(chuàng)新中國(guó)》第一集《信息世界》中有這樣一句話“一旦通過(guò)面試,他們的職業(yè)生涯將被徹底改變,更重要的是他們將親身經(jīng)歷物流領(lǐng)域正在上演的一次創(chuàng)新革命。”在這段配音當(dāng)中元音的開(kāi)口度到位,后鼻韻歸音采用胸腹共鳴使音色略顯滄桑,句尾音節(jié)收束有力,音節(jié)彈性較強(qiáng),使整個(gè)文本顯得很有力量,并具有時(shí)代厚重感。
(3)語(yǔ)流音變
“評(píng)判解說(shuō)人語(yǔ)言質(zhì)量不僅要聽(tīng)聲音的靜態(tài)品質(zhì),而且要看語(yǔ)言的動(dòng)態(tài)表達(dá)效果?!盵2]李易老師在處理語(yǔ)流音變時(shí)多采用強(qiáng)氣息弱控制的方法使語(yǔ)言平緩有力、銜接自然流暢,同時(shí)又不失重音起伏的變化,可謂是一氣呵成。但在《創(chuàng)新中國(guó)》配音當(dāng)中,人工智能的語(yǔ)流音變略顯僵硬,在第一集介紹無(wú)人機(jī)技術(shù)時(shí)多次出現(xiàn)字與字之間銜接不夠圓潤(rùn)的情況,如“走出深圳實(shí)驗(yàn)室,走向?qū)嶋H應(yīng)用場(chǎng)景?!逼渲锌梢悦黠@感受到“走出”“深圳”“實(shí)驗(yàn)室”三個(gè)詞之間有停頓沒(méi)能形成很連貫的一個(gè)短句子。再如“帶來(lái)了兩款獨(dú)特機(jī)型”同樣可以聽(tīng)出“帶來(lái)了”與“兩款”之間仍間隔較長(zhǎng),這就使短句子更碎片化,在聽(tīng)覺(jué)上沒(méi)能呈現(xiàn)很好地表達(dá)效果。但從整體上看《創(chuàng)新中國(guó)》長(zhǎng)句子的處理,語(yǔ)流音變還是很入耳的。
(1)記憶呼喚
“配音員聲音特質(zhì)與紀(jì)錄片的完美契合,能夠形成傳播過(guò)程中受眾的聲音審美期待。”[4]當(dāng)李易老師的聲音出現(xiàn)在紀(jì)錄片《創(chuàng)新中國(guó)》當(dāng)中時(shí),不由得讓人回憶起當(dāng)年李易老師的那些經(jīng)典之作,那是一代人的記憶呼喚,同時(shí)也為當(dāng)下的人們所贊嘆,雄渾親和的聲音,擲地有聲,不免讓人懷念當(dāng)年的崢嶸歲月,回憶起的不僅是一部部經(jīng)典紀(jì)錄片,而是屬于那個(gè)年代的點(diǎn)點(diǎn)滴滴。同時(shí)也讓受眾感慨歲月流逝,如今的科技水平,已經(jīng)可以在一定程度上滿足人們的記憶呼喚,再次重溫李易老師的經(jīng)典之聲,就已經(jīng)讓受眾身臨其境在《創(chuàng)新中國(guó)》的科技魅力里,感受我國(guó)的發(fā)展進(jìn)步。這不得不讓人們感受到《創(chuàng)新中國(guó)》制作團(tuán)隊(duì)的良苦用心。
(2)豐富想象
人工智能通過(guò)對(duì)李易老師聲音的模仿激發(fā)了受眾的想象力,“紀(jì)錄片有其鮮明的時(shí)代特征,紀(jì)錄片配音也必然有其獨(dú)特的時(shí)代個(gè)性?!盵5]人工智能配音紀(jì)錄片《創(chuàng)新中國(guó)》首先在聲音上豐富了對(duì)李易老師早期作品的想象與回憶。其次,李易老師的聲音作為紀(jì)錄片當(dāng)中最為熟悉的聲音之一,會(huì)給受眾更強(qiáng)的代入感,因此對(duì)紀(jì)錄片《創(chuàng)新中國(guó)》當(dāng)中所講述的事情也會(huì)有所想象。最后,受眾感慨于當(dāng)今科技發(fā)展的突飛猛進(jìn),自然而然地會(huì)想象出未來(lái)科技的高速變化。如在《創(chuàng)新中國(guó)》第四集《生命科學(xué)》中講到的一段“由于人多地少等現(xiàn)實(shí)問(wèn)題的困擾,如何制造充足的食物來(lái)滿足未來(lái)中國(guó)人的需求,科學(xué)家們不斷利用生物技術(shù),創(chuàng)造著奇跡?!碑?dāng)人們聽(tīng)到這段講述時(shí),不免會(huì)想起李易老師的經(jīng)典之作《再說(shuō)長(zhǎng)江》。同時(shí),在雄渾的聲音中,一幅幅生動(dòng)的畫(huà)面又把觀眾的想象拉回到現(xiàn)實(shí),那滄桑的聲音傳遞出的悲憫情懷和面對(duì)未來(lái)的信心也讓我們深受感染。這會(huì)使觀眾在多重想象中獲得極大的審美滿足。
(3)人文情懷
“唯有融合東方審美取向和當(dāng)下時(shí)代審美訴求,紀(jì)錄片配音才能在精神引領(lǐng)和審美塑造方面發(fā)揮作用。”[6]人工智能選用李易老師的聲音為紀(jì)錄片《創(chuàng)新中國(guó)》配音,首先包含了對(duì)已逝去的李易老師的緬懷之情,李易老師作為我國(guó)早期紀(jì)錄片配音的標(biāo)桿本就屬于一個(gè)時(shí)代的印記,其中濃縮了早年我國(guó)社會(huì)人文的心路歷程。再者,李易老師的聲音能夠再現(xiàn)熒屏,證明他的聲音在某些方面仍具有當(dāng)代學(xué)習(xí)的價(jià)值,這是與時(shí)代無(wú)關(guān)的,而是他能成為一代典范與他的后天努力與堅(jiān)持的精神是密不可分的。在看似簡(jiǎn)單的配音背后是一代一代人創(chuàng)新堅(jiān)守的成果才有了今天人工智能配音紀(jì)錄片的出現(xiàn)。“舊聲新現(xiàn)”的樣態(tài)同樣記錄著我們這一時(shí)代的歷史巨變,呈現(xiàn)出帶有歸屬性的人文情懷。
(1)創(chuàng)作空間狹窄
“AI智能配音還是有一定的缺陷,首先它沒(méi)有情感也沒(méi)有思想,在現(xiàn)階段僅僅只是能夠做到更接近人聲,但缺乏配音員對(duì)于聲音形象和具體情節(jié)的塑造,所以適用場(chǎng)景有限?!盵1]如在《創(chuàng)新中國(guó)》第二集《創(chuàng)造能源》中“當(dāng)下的我們,前所未有地支配著種類繁多的能源,但沒(méi)有哪一種能源是完美的?!睆倪@句當(dāng)中并沒(méi)有很好地表達(dá)出我們對(duì)能源匱乏的擔(dān)憂,以及對(duì)開(kāi)發(fā)新能源篤定的信念。情感平淡并且有些刻意機(jī)械。又如同樣在第二集中出現(xiàn)的“蛋變成雞需要在孵化器里經(jīng)歷21天的時(shí)間?!逼渲斜硎龅闹匾舨皇呛苊鞔_也就顯得這句話的邏輯感不強(qiáng)。因此,除了人工智能首先涉及的手機(jī)語(yǔ)音助手與語(yǔ)音導(dǎo)航外,人工智能選中為紀(jì)錄片配音就是因?yàn)榧o(jì)錄片在文字表達(dá)中極少使用議論、抒情等表達(dá)方式,并且在為紀(jì)錄片《創(chuàng)新中國(guó)》配音時(shí)也盡量避開(kāi)或刪減了有關(guān)情感跨度較大的詞語(yǔ),避免造成情感表達(dá)不當(dāng)?shù)葐?wèn)題的出現(xiàn),以免影響整部紀(jì)錄片的傳播效果。若不能改變?nèi)斯ぶ悄芘湟羟楦斜磉_(dá)及態(tài)度呈現(xiàn)方面的問(wèn)題,那么人工智能配音的空間將仍面臨一個(gè)狹窄的局面。
(2)個(gè)性化缺失
個(gè)性化是藝術(shù)創(chuàng)作追求的目標(biāo)之一。由于人工智能配音的《創(chuàng)新中國(guó)》是我國(guó)首部運(yùn)用該技術(shù)合成的紀(jì)錄片,因此可借鑒的素材極少,選用李易老師的聲音作為人工智能模仿的對(duì)象也是一次大膽的挑戰(zhàn),畢竟李易老師的聲音是極具個(gè)性化的。但是就是這種個(gè)性化的聲音,并不能適用于所有的紀(jì)錄片配音。因?yàn)椋總€(gè)紀(jì)錄片作品都是獨(dú)一無(wú)二的個(gè)體,更何況李易老師的配音風(fēng)格已經(jīng)與我國(guó)近幾年的紀(jì)錄片配音風(fēng)格有所區(qū)別,因此人工智能配音的紀(jì)錄片還缺少一定的個(gè)性,沒(méi)有很明確的自身定位。例如在第二集中提到的“這些剛孵化出來(lái)的小雞,將被送往40公里外武夷山脈的深處?!崩钜桌蠋煹穆曇粜蹨営辛?,在處理這句話的時(shí)候明顯感受到對(duì)于小雞的闡述過(guò)于沉重,缺失了一份靈動(dòng)自然?!凹o(jì)錄片配音藝術(shù),雖是輔宰卻同其他藝術(shù)構(gòu)成元素一樣,承載了紀(jì)錄片創(chuàng)作的整體和諧之美。”[7]李易老師的聲音雖具有個(gè)性,但相對(duì)于全部配音作品來(lái)講卻并不是全體匹配的。另外,隨著時(shí)代的改變,受眾人群也在相繼發(fā)生變化,李易老師的聲音是否還適用于當(dāng)今受眾的審美需求,有待考證。
人工智能配音首先選中紀(jì)錄片的一個(gè)重要原因就是在紀(jì)錄片的表述中少有語(yǔ)言的情感變化。這樣就大大降低了人工智能給紀(jì)錄片配音的難度,這也是為什么《創(chuàng)新中國(guó)》能夠取得成功的原因之一。在第三集“智造”生活當(dāng)中像是“中國(guó)曾以驚人速度成長(zhǎng)為制造業(yè)巨頭”這樣的理性概述語(yǔ)言占全片配音篇幅較多,這也就降低了紀(jì)錄片的情節(jié)性,而更像一部純粹的科普片。從以往李易老師的作品來(lái)看,他的聲音更適合大氣的紀(jì)錄片作品。
我們熟知的電視劇、電影、動(dòng)漫等都需要配音演員極深的臺(tái)詞功底,再加上我國(guó)語(yǔ)言文化博大精深,若人工智能配音想探索這些領(lǐng)域,就有極大的困難。因此,人工智能配音在今后的發(fā)展中除了要量化自身,其次就是要確定配音范圍,尋找適合自己的文本進(jìn)行加工創(chuàng)作。除了紀(jì)錄片以外,還可以嘗試新聞?lì)惞?jié)目這樣的少有情感變化的語(yǔ)言類節(jié)目進(jìn)行再度加工。
“不難發(fā)現(xiàn),許多優(yōu)秀的紀(jì)錄片解說(shuō)配音都選擇了更具張力的聲音。音域更寬更深,嗓音更具共鳴和彈性,以及成熟穩(wěn)健的敘事風(fēng)格,是表達(dá)紀(jì)錄片內(nèi)涵的完美條件?!盵8]紀(jì)錄片《創(chuàng)新中國(guó)》能夠一炮打響,還有一個(gè)不可或缺的因素就是它選用了受眾們最為熟知的李易老師的聲音。李易老師的聲音是一個(gè)時(shí)代的標(biāo)簽,極具代表性。但隨著我們的社會(huì)發(fā)展,人文風(fēng)貌也在發(fā)生著相應(yīng)的改變,李易老師的聲音固然有他的時(shí)代意義,但未必適用于未來(lái)的紀(jì)錄片配音風(fēng)格。因此,人工智能在未來(lái)的聲音選取上也要多挖掘有個(gè)性的聲音,具有我們這個(gè)時(shí)代特色的聲音,能高度符合當(dāng)代社會(huì)文化的主旋律,為不同風(fēng)格元素的紀(jì)錄片選取最適中的聲音去塑造它,為紀(jì)錄片增添更多新鮮活力的血液,從而打造屬于我們這個(gè)時(shí)代的紀(jì)錄片聲音印記。
李易老師的聲音之所以能成為一個(gè)時(shí)代的經(jīng)典,就證明他的配音順應(yīng)當(dāng)時(shí)的社會(huì)歷史背景,而人工智能在今后為紀(jì)錄片配音時(shí)也需要選取多元化的聲音來(lái)凸顯不同紀(jì)錄片的特色以及所要表達(dá)的主旨要義,既要在聲線上與紀(jì)錄片題材相吻合,語(yǔ)言氣質(zhì)上更要有審美性,突破原本的紀(jì)錄片配音印象,擺脫刻板、冷漠的聲音形象,盡可能使紀(jì)錄片的聲音畫(huà)面和諧自然。多元化的聲音也可以反作用于人們的常規(guī)思想,激發(fā)更多更好的紀(jì)錄片文本創(chuàng)作,增添更加豐富的畫(huà)面素材靈感,為受眾們呈現(xiàn)更多印有中國(guó)元素的紀(jì)錄片。
人工智能為紀(jì)錄片配音的出現(xiàn)無(wú)疑是一次科技與人文相融合的大膽嘗試。而人工智能配音是否對(duì)真人真聲配音產(chǎn)生沖擊一直是很多配音演員及廣大受眾所擔(dān)心的問(wèn)題。其實(shí)只要定位得當(dāng)找準(zhǔn)自己的最佳生態(tài)位,二者完全可以相輔相成不會(huì)出現(xiàn)此消彼長(zhǎng)的局面。人工智能給紀(jì)錄片配音的技術(shù)還不夠穩(wěn)定成熟,聲音形式和樣本還較為單一,情感表達(dá)不當(dāng)或不到位是人工智能配音紀(jì)錄片目前無(wú)法攻克的難關(guān)。