【摘要】在當今數字化浪潮的推動下,人工智能技術以其卓越的數據處理能力和學習機制,正逐步滲透至傳媒行業(yè)的各個角落,播音主持領域亦然。人工智能(Artificial Intelligence,AI)技術通過仿真的語音合成、情感分析以及深度內容理解承擔起新聞播報、節(jié)目主持等任務,并能根據觀眾反饋實時調整內容以提升傳播效果。本文旨在分析AI技術在播音主持領域的應用優(yōu)勢與表現(xiàn)的機遇,及人工智能技術在播音主持領域的具體應用,以期為播音主持行業(yè)的可持續(xù)發(fā)展提供理論支撐與實踐指導。
【關鍵詞】播音主持;人工智能技術;語音合成;虛擬主播
中圖分類號:J9 文獻標識碼:A DOI:10.12246/j.issn.1673-0348.2024.15.033
在當今科技飛速發(fā)展的時代背景下,人工智能技術(AI)已經滲透到社會生活的方方面面,而播音主持領域作為信息傳播的重要窗口也正在經歷著由AI引領的深刻變革。從智能語音合成到情感識別,再到虛擬主播的誕生,AI技術的應用正重塑大眾對播音主持藝術的認知。本文將探討AI技術在播音主持領域的具體應用,并分析其對行業(yè)產生的深遠影響。
1. 人工智能如何影響播音主持行業(yè)
在近幾年來,互聯(lián)網技術的飛速進步重塑了全球媒體領域,而人工智能技術的融入則催生了前所未有的內容創(chuàng)作與傳播模式,這些創(chuàng)新正在深刻影響著播音與主持行業(yè)的敘述手法和思維邏輯。播音主持行業(yè)正在經歷一場變革,移動化、可視化、智能化和互動化成為其主要發(fā)展趨勢[1]。當前,移動化趨勢愈發(fā)明顯,5G時代的到來使得人們更傾向于通過移動設備獲取信息,智能手機和平板電腦早已深深融入我們的日常生活,這凸顯了移動設備在現(xiàn)代社會中的普及程度,也預示著移動化將成為未來發(fā)展的重要趨勢。且短視頻崛起已成為人們獲取新聞信息的新寵,新媒體與傳統(tǒng)媒體競相涉足短視頻市場以迎合觀眾日益增長的觀看偏好。據某美國知名設備公司預測,在未來五年里,全球移動視頻數量將迎來爆炸性增長,飆升近九倍,這反映了人們對高質量、便捷視頻內容的不斷追求,也預示著移動設備和網絡技術的快速發(fā)展將繼續(xù)推動視頻行業(yè)的繁榮。
2. 人工智能技術的播音主持應用優(yōu)勢
2.1 信息播報規(guī)范
播音主持作為傳播學視角下的媒介傳播形式,致力于實現(xiàn)信息的有效傳遞與接收。播音員或主持人在接收到當天的稿件后,首要任務是確保以精確無誤且自然流暢的語調進行朗讀。然而在這一過程中或許會遭遇諸多挑戰(zhàn)與突發(fā)狀況,如信息傳遞的誤差或發(fā)音上的瑕疵等問題。在當今融媒體時代,可借助尖端的人工智能技術對海量信息進行深度加工,經過精心處理后,以清晰流暢的語音形式完美呈現(xiàn),確保播音文稿的每個細節(jié)都得以精準傳達。人工智能技術能夠精準調控聲音的響度、速率及音質,這些關鍵參數均通過計算機程序預設,并以語音技術原型為基礎,通過樣本數據實現(xiàn)語音的合成[2]。人工智能合成語音以其精確無誤的詞匯運用、嚴謹的語法結構、清晰的發(fā)音以及流暢的表達能力,在播音主持領域展現(xiàn)出顯著的應用優(yōu)勢,成為播報信息的標準化工具。
2.2 表現(xiàn)形式創(chuàng)新
人工智能技術所催生的虛擬人物現(xiàn)已在播音主持領域大放異彩,這些虛擬角色擁有與真人主持人相媲美的各項主持技能,能通過高度逼真的面部表情、目光交流和肢體語言,為觀眾帶來身臨其境的觀看體驗。人工智能技術在播音主持領域展現(xiàn)出驚人的靈活性,能輕松切換男女聲音并根據需求塑造出各式各樣的形象——從逼真的人類形象到可愛的卡通角色,應有盡有。這種創(chuàng)新的應用方式為播音主持工作注入了前所未有的活力,并不斷激發(fā)觀眾的好奇心,因此人工智能在播音主持領域的運用憑借其獨特且富有創(chuàng)意的表達形式脫穎而出,成為行業(yè)的一大亮點。
2.3 具備高效學習技巧
人工智能展現(xiàn)出卓越的學習天賦,其核心在于構建深層的智能學習網絡,并通過不斷地對巨量數據進行深度挖掘和學習,提煉出最具價值的特征信息,從而實現(xiàn)高效的特征學習。借助人工智能技術的獨特優(yōu)勢,可實現(xiàn)播音主持在情感對話和知識解答方面的高效執(zhí)行[3]。如人工智能機器人“微軟小冰”在收到用戶提問后,能迅速檢索其龐大的應答語料庫,并據此給出精確答案。該人工智能機器人通過持續(xù)的數據采集和深度學習技術可逐漸提升其解答觀眾問題的精準度和速度。
3. 人工智能技術提升播音主持表現(xiàn)的機遇
3.1 自動剪輯技術對播音主持表現(xiàn)的影響
自動剪輯技術可利用先進的計算機視覺和圖像處理技術自動識別視頻中的關鍵幀、人物動作、情感表達等元素,并根據預設的規(guī)則或算法進行快速剪輯,以提高剪輯效率,降低人工成本。在視頻圖像處理過程中,自動剪輯能夠實時地對畫面質量進行增強,包括去噪、穩(wěn)定化和色彩校正等,使得主持人的表現(xiàn)即使在光線不足或動態(tài)變化的環(huán)境中仍能保持最佳效果[4];或通過綠幕技術和AR在虛擬的環(huán)境中進行播報,為觀眾提供新穎的觀看體驗。如在新聞報道中自動剪輯系統(tǒng)可以自動識別出主持人的口型和表情變化,從而選擇最合適的鏡頭進行切換,使得播報更加自然流暢。在剪輯中,深度學習算法可分析視頻內容,自動選擇最佳的鏡頭來展示主持人的表現(xiàn),減少人工選擇的時間和主觀因素;或通過分析主持人的語音和面部表情識別出主持人的情緒狀態(tài),并據此調整剪輯點使節(jié)目的情感表達更加自然和連貫。
3.2 基于用戶數據挖掘的個性化主持服務
隨著互聯(lián)網的普及和大數據技術的發(fā)展,用戶需求的多樣性和個性化特征日益凸顯。而為滿足用戶的個性化需求,播音主持人需不斷地調整自己的主持風格和內容,其中基于用戶數據挖掘的個性化主持服務正是實現(xiàn)這一目標的有效途徑。用戶興趣模型是個性化主持服務的基礎,其通過收集用戶的觀看歷史、點贊記錄、評論內容等信息構建出用戶的興趣模型,并根據模型的變化動態(tài)地調整主持內容和風格,且為保持用戶興趣模型的時效性和準確性,還需要定期對模型進行更新和優(yōu)化。目前,常用的推薦算法包括協(xié)同過濾、內容推薦、混合推薦等,其中協(xié)同過濾通過分析用戶的歷史行為數據找出用戶之間的相似性,從而預測用戶可能感興趣的內容;而矩陣分解則試圖找到用戶和商品之間的潛在關系,通過這種關系來預測用戶的評分或偏好[5]。
在實際應用中,可根據具體需求選擇合適的推薦算法進行實現(xiàn):①上下文感知推薦。結合用戶的當前上下文信息(如時間、地點、設備類型)來調整推薦結果,以提高推薦的相關性和及時性;②多模態(tài)推薦系統(tǒng)。利用文本、圖像和視頻等多種模態(tài)的數據,通過深度學習模型來理解用戶的復雜偏好,實現(xiàn)更加精細的個性化推薦;③強化學習。在推薦系統(tǒng)中應用強化學習讓系統(tǒng)通過試錯來學習如何優(yōu)化推薦策略,以最大化用戶滿意度和長期參與度。
4. 人工智能技術在播音主持領域的應用
4.1 語音合成技術的應用
語音合成技術,又稱為文本到語音技術(Text-to-Speech,TTS)能夠將文本信息轉化為自然流暢語音的技術。近年來,基于深度學習的語音合成模型如循環(huán)神經網絡(RNN)、長短期記憶網絡(LSTM)和生成對抗網絡(GAN)等取得了顯著的突破,尤其是Transformer模型的提出為語音合成技術的進一步發(fā)展奠定了基礎,其通過大量的訓練數據學習語音的深層特征使得生成的語音更加自然、流暢[6]?;谏疃葘W習的語音合成模型主要包括文本分析模塊和語音生成模塊,前者負責將輸入的文本信息轉化為語音合成所需的特征表示,如音素、音調、節(jié)奏等;而后者則根據這些特征表示,利用深度學習模型生成對應的語音信號。比如,谷歌的Tacotron系列模型和百度的Deep Voice系列模型都是基于深度學習的語音合成技術的“代表”,其能生成高質量的語音并根據不同的語言、口音和情感等要求進行定制化的語音合成。
其中,科大訊飛作為國內領先的人工智能企業(yè),其語音合成技術在播音主持領域的應用尤為突出。央視紀錄片《創(chuàng)新中國》全片采用科大訊飛的人工智能配音技術,成功復刻已故配音大師李易老師的聲音,這是對李易老師的致敬,同時也標志著個性化人工智能語音合成技術在影視領域的嶄新里程碑[7]。此外,科大訊飛的語音合成技術還被廣泛應用于新聞播報、有聲讀物、虛擬助手等多種場景,如在一些新聞節(jié)目中由于時間緊迫或播音員臨時缺席等原因,制作人員會選擇使用語音合成技術來生成新聞稿的旁白部分,以確保節(jié)目的正常播出并能在一定程度上節(jié)省人力和時間成本。自2024年1月1日起,新疆阿克蘇地區(qū)的AI主播“小芮”成為該地區(qū)首個常態(tài)化播報地方新聞的AI主播,以解決傳統(tǒng)播音員數量不足的問題,提高新聞播報的準確性和時效性。且“小芮”利用先進的語音合成技術將新聞稿件轉化為流暢自然的語音輸出,其聲音甜美、清晰且深受觀眾喜愛。
4.2 語音識別技術的應用
傳統(tǒng)的語音識別方法主要基于特征工程和統(tǒng)計模型,如隱馬爾可夫模型(HMM)和高斯混合模型(GMM),其方法需要手工設計復雜的特征提取器并對聲學模型和語言模型的參數調整非常敏感,這限制了其性能。而深度學習的興起為語音識別帶來了革命性的變化,特別是RNN和LSTM的提出為處理序列數據提供了強大的工具。隨后,Transformer模型的出現(xiàn)以其自注意力機制(self-attention)徹底改變了語音識別的面貌,其可捕捉長距離依賴關系以提高語音識別的準確率[8]。目前,基于Transformer的語音識別系統(tǒng),如WaveNet、Baidu's Deep Speech 2和Google的Speech-Trans演示了前所未有的性能,其在公開的語音識別基準測試中取得了驚人的成績,接近甚至超越了人類的識別水平。
在電視新聞、體育比賽和在線會議等場合,實時字幕可以幫助聽力障礙人士或非母語觀眾更好地理解內容,如CNN和BBC等新聞頻道在實時報道中提供自動生成的字幕,其基于先進的語音識別技術在嘈雜的環(huán)境中可保持較高的準確率,且蘋果的Siri和亞馬遜的Alexa亦是基于TTS技術的智能助手的典范。同時,語音識別技術還被用于自動生成播客和音頻書籍,將文本文件轉換為音頻文件為用戶提供隨時隨地的聽書體驗,如Audible和Google Play Books等音頻書平臺允許用戶下載由真人朗讀或TTS系統(tǒng)生成的書籍。2018年新華社聯(lián)合搜狗推出了首個AI合成主播“新小浩”采用先進的語音識別技術和深度學習算法實時將用戶的語音轉換為標準的播音腔,并通過合成技術生成逼真的人臉圖像和口唇動作實現(xiàn)虛擬主播的功能,以降低新聞播報的成本和難度為觀眾帶來全新的視覺體驗,且“新小浩”還具備智能對話和互動功能,可根據觀眾的提問和反饋進行實時回應和互動,增強觀眾的參與感和沉浸感。
4.3 自然語言處理技術的應用
自然語言處理(Natural Language Processing, NLP)技術可以使計算機理解、解釋、生成和操作人類語言以簡化內容創(chuàng)作過程,在主持稿件的生成中NLP的應用體現(xiàn)在:①自動化寫作。利用NLP中的模板生成和NLG技術自動生成新聞稿件、體育比賽報告和財經資訊等,這通常需要大量的數據訓練以便學會如何構造符合語法和語義規(guī)則的句子;②個性化內容。NLP可通過分析聽眾的歷史數據和偏好幫助生成個性化的新聞簡報和推薦內容,如流媒體服務平臺使用NLP技術來分析用戶的觀看習慣,從而推薦用戶可能感興趣的新節(jié)目;③實時更新。NLP可針對體育賽事和新聞報道等需要快速更新信息的場景,實現(xiàn)對最新數據的自動整合和語言表達以確保信息的及時傳遞;④多語言支持。NLP技術使得自動生成的內容可支持多種語言,這對于國際新聞和多語言市場尤為重要。比如,湖南衛(wèi)視的數字主播“小漾”基于智能對話系統(tǒng)而構建,其擁有充滿朝氣的形象且具備高度智能化的交互能力,能實時感知觀眾的情感和需求并根據不同的情境做出相應的回應。“小漾”可以提供定制化的播報服務,與觀眾進行趣味橫生的對話以豐富節(jié)目的內容形式,從而贏得年輕觀眾的喜愛與追捧。2024年1月10日,正值長沙市兩會隆重舉行之際,長沙廣電推出《兩會AI回答》互動平臺,其中名為“常小星”的AI虛擬主播驚艷亮相,與廣大網友展開了熱烈的交流和互動,而長沙廣電通過這一新穎的形式成功地將兩會的精神和內容以更加生動、形象的方式傳遞給了廣大市民,引發(fā)了社會各界的廣泛關注和熱議。
5. 結束語
人工智能技術的應用正在深刻地改變播音主持領域的現(xiàn)狀,從語音合成到自然語言處理,再到增強學習和推薦系統(tǒng)的應用,AI技術的發(fā)展可以提高播音主持的工作效率,為觀眾帶來更為沉浸及個性化的聽覺體驗。且隨著AI在播音主持中的應用越來越廣泛,有理由相信未來的播音主持行業(yè)將會變得更加智能化、個性化和多元化。因此需不斷關注AI技術的發(fā)展動態(tài),積極探索其在播音主持領域的應用前景和發(fā)展方向。
參考文獻:
[1]王欣.基于人工智能背景下播音主持的發(fā)展趨勢研究[J].數字通信世界,2020(10):168-169.
[2]鄭爽悅.人工智能對播音主持工作的影響及應對舉措研究[J].傳媒論壇,2023,6(20):64-66.
[3]魏寧.人工智能技術環(huán)境下播音主持現(xiàn)狀分析[J].中國報業(yè),2020(06):90-91.
[4]邢煜婷.融媒體時代人工智能技術在播音主持工作的應用[J].黃河.黃土.黃種人,2022(11):38-40.
[5]莊皓瀛.人工智能技術與播音主持協(xié)同創(chuàng)新研究[J].新聞文化建設,2022(03):77-79.
[6]賈斐然.人工智能技術沖擊背景下播音主持的價值堅守與發(fā)展路徑研究[J].西部廣播電視,2023,44(13):207-209.
[7]王立元,王小宇.人工智能技術在播音主持領域的應用概述[J].傳媒論壇,2020,3(19):40.
[8]王一民.融媒體語境下以人工智能技術推動播音主持工作[J].華東科技,2022(09):119-121.
作者簡介:王曉燕(1985—),女,河南安陽人,編輯,研究方向:主持人與編輯。