文/王 丹
2018年11月,新華社在第五屆世界互聯(lián)網(wǎng)大會上發(fā)布“AI合成主播”,這是人工智能技術與廣電媒體融合的創(chuàng)新實踐成果?!癆I合成主播”的出現(xiàn),對于傳統(tǒng)新聞業(yè)態(tài)產(chǎn)生了強烈沖擊——打造與人工智能技術發(fā)展相匹配的新聞業(yè)務范式,成為廣電媒體新時代核心競爭力提升的關鍵。筆者以此為核心切入點,從新聞業(yè)務范式中的新聞播報出發(fā),分析“AI合成主播”的發(fā)展優(yōu)勢與價值,探索廣電媒體新聞播報的雙效推進策略。
廣電媒體的創(chuàng)新發(fā)展需求。人工智能技術與廣電媒體的融合發(fā)展,推進了傳統(tǒng)媒體的智能化升級,“AI合成主播”作為主要的融合成果之一,符合廣電媒體的創(chuàng)新發(fā)展需求和受眾群體對于新聞播報的個性化現(xiàn)實需求。首先,廣電媒體想要尋求轉型與發(fā)展,媒介融合是必經(jīng)之路。從廣電媒體的傳播平臺和新聞播報方式看,主要構成要素包含了新聞稿件、主持人和受眾群體,借助傳統(tǒng)媒體平臺傳遞新聞信息是大眾媒體時代的主流傳播模式。隨著人工智能技術的快速發(fā)展,廣電媒體面臨的媒介融合環(huán)境可謂機遇與挑戰(zhàn)并存,而人工智能技術的逐漸成熟成為重要的突破口。新華社與搜狗公司的合作,通過提取真人主播新聞播報中的聲音、唇形、表情動作等特征,借助技術聯(lián)合建模訓練手段,生成全球首個“AI合成主播”。
受眾群體的個性現(xiàn)實需求。人工智能技術應用于虛擬主播的實踐探索,符合新時代新聞受眾群體對新聞播報的個性化需求。廣電媒體的發(fā)展,最終服務的主體是廣大用戶,旨在向用戶傳遞有效的新聞信息;但廣電媒體以主持人播報為主的傳統(tǒng)新聞播報形態(tài),由于播報過程的不可控性容易出現(xiàn)播報失誤問題,在一定程度上可能影響新聞播報的真實性、可靠性。同時,移動互聯(lián)網(wǎng)時代,信息流通速率加快,用戶獲取信息的方式也以平板電腦、手機等移動終端為主,廣電媒體傳統(tǒng)新聞播報的關注度不高,新聞播報的影響力和覆蓋面有限。“AI合成主播”的出現(xiàn),打破了傳統(tǒng)的新聞播報模式,帶給用戶群體全新的感官體驗。通過分析“人工智能技術+虛擬主播”的現(xiàn)實需求,有助于推動“AI合成主播”的健康“成長”。
強強聯(lián)手的創(chuàng)新技術合作?!叭斯ぶ悄芗夹g+虛擬主播”的產(chǎn)生,需要強大的技術支撐。由新華社和搜狗公司聯(lián)合打造的全球首個“AI合成主播”,相比于2016年提出的AI同傳技術,彰顯技術進步與時代性的“AI合成主播”更勝一籌——作為AI合成領域的技術突破與創(chuàng)新,這與搜狗近年來深耕AI技術創(chuàng)新不無關系,近年來搜狗公司在人工智能技術上取得了突出成就,具體有以下五個方面:一是語音識別。借助搜狗輸入法等產(chǎn)品的成熟度,搜狗語音識別準確率突破98%,行業(yè)領先;二是TTS。在語音合成領域的國際頂級大賽Blizzard Challenge 2018中,搜狗獲得“可懂度”和“語音停頓”兩項子任務的全球第一;三是機器翻譯。搜狗的機器翻譯技術分別獲得WMT 2017和IWSLT2018兩項大賽的全球第一;四是人機對話。搜狗語義理解技術獲得NLPCC 2018比賽第一名、NTCIR 2017評測比賽的短文本對話任務第一;五是機器視覺。在MegaFace 2 0 1 8 的人臉識別任務中,搜狗以99.939%的準確率獲全球第一。
搜狗公司在人工智能技術方面取得的成就,為“AI合成主播”提供了技術層面的支持,“AI合成主播”的本質是以語音合成引擎和圖像生成引擎為核心。語音合成引擎是通過搜狗的個性化語音合成技術,快速對主持人新聞播報過程中的多維度特征進行采集,建立文本與輸出音頻信息之間的關聯(lián)關系;圖像生成方面,借助搜狗人臉識別、三維人臉重建、表情建模等技術,對人臉表情動作進行采集,通過建立文本、輸出音頻和視覺信息的關聯(lián)映射生成輸出分身視頻,最終將“AI合成主播”的新聞播報內(nèi)容呈現(xiàn)在觀眾的面前。
在人工智能技術的加持下,“AI合成主播”在新聞播報方面有著獨特優(yōu)勢,相比于傳統(tǒng)廣電媒體主持人的新聞播報,“AI合成主播”的新聞播報優(yōu)勢與應用效果主要體現(xiàn)在播報方式、肢體語言和播報精準度等方面。
播報方式多元。新聞的播報方式,決定著新聞的傳播力與影響力。傳統(tǒng)的新聞播報過程,信息要素以文字、語音為主,由主持人進行信息播報,方式較為單一?!癆I合成主播”的新聞播報形式更多元,借助技術的優(yōu)勢在進行新聞播報的過程中,能夠通過人工智能和大數(shù)據(jù)的支持,完成對某一新聞事件的深度解析,利用圖片、視頻以及精準的對比數(shù)據(jù)資料,打破了傳統(tǒng)的播報方式。值得關注的是,“AI合成主播”的新聞播報方式可預先設定,更多元、更直觀、更立體。
肢體語言豐富。“AI合成主播”在肢體語言表現(xiàn)上更為豐富,已經(jīng)初步實現(xiàn)了“站立式播報”,能夠向受眾群體傳遞立體化的新聞內(nèi)容?!癆I合成主播”可以根據(jù)新聞播報的內(nèi)容和不同的情境,生動、準確地使用肢體語言,以此增強新聞的表現(xiàn)力,傳遞更有價值的新聞內(nèi)容。肢體語言是新聞播報的輔助信息要素,強化了受眾群體對新聞的理解,傳遞了主持人的情緒。例如,“AI合成主播新小浩”會在新聞播報過程中配合手勢、姿態(tài)等肢體語言,將新聞信息聲情并茂地呈現(xiàn)出來。
播報準確度更高。主持人需要具備極強的專業(yè)素養(yǎng)才能保持播報的準確性,但在新聞播報中還是會出現(xiàn)“NG”等失誤,繼而影響新聞播報的連續(xù)性?!癆I合成主播”的應用,能夠借助人工智能技術帶來的優(yōu)勢,實現(xiàn)零失誤的新聞播報,有效提高新聞的播報準確度。
我國“人工智能技術+虛擬主播”的實踐應用效果顯著,先有全球首個AI合成女主播“新小萌”,后有新華社與搜狗公司完成技術攻關后出現(xiàn)的站立式AI合成男主播“新小浩”。相比于“新小萌”,“新小浩”不僅能站立式播報新聞,還可以借助手勢、姿態(tài)等多種肢體語言將新聞生動呈現(xiàn),更智能也更接近于真人播報的效果。
應用效果廣受好評。在人工智能合成技術的不斷完善下,“AI合成主播”的播報實踐效果良好,定制周期也大為縮短,新聞播報效果和穩(wěn)定性全面提升?!癆I合成主播”上崗至今,已經(jīng)交出了一份滿意的答卷——截至目前,AI合成主播已發(fā)稿3400余條,累計播報時長達到10000多分鐘,參與了第五屆世界互聯(lián)網(wǎng)大會、首屆進博會、2019年春運、農(nóng)歷豬年春節(jié)、全國兩會等重要報道;相比于傳統(tǒng)的播報形式,由“AI合成主播”所播報的新聞資源更豐富,包括文字、圖片、視頻、音頻以及動漫等多要素的整合,打造出了具有極強感染力的融媒體新聞產(chǎn)品,使得傳統(tǒng)新聞播報呈現(xiàn)出新形態(tài)。
“AI合成主播”的新聞播報內(nèi)容已經(jīng)在新華社中英文客戶端、新華社微信公眾號、中國新華新聞電視網(wǎng)等平臺發(fā)布,借助移動短視頻平臺的播放量,“AI合成主播”引發(fā)了廣泛關注,海內(nèi)外的主流媒體相繼進行報道?!叭斯ぶ悄芗夹g+虛擬主播”能夠取得廣受好評的實踐應用效果,既為我國廣電媒體的發(fā)展指明了創(chuàng)新方向,也讓世界認可了我國人工智能技術的創(chuàng)新成果。
以人為主的人機協(xié)同。人工智能技術的進步與發(fā)展,與人的主觀能動性之間有著直接的關聯(lián),以人為主導的人機協(xié)同生產(chǎn)是廣電媒體“AI合成主播”新聞播報雙效推進的基礎。未來,新聞的生產(chǎn)者將更多元,而用戶對新聞信息的篩選意識也將增強,由此帶來的是新聞質量的全面提升。廣電媒體的新聞播報是用戶獲取專業(yè)新聞、權威信息的主要渠道,具有社會輿論的引導功能;作為最具實力的新聞生產(chǎn)者,廣電媒體自身對新聞播報“雙效”的重視程度,將關系到新聞產(chǎn)品的數(shù)量和質量。建立以人為主的人機協(xié)同模式如“傳感器新聞”的開發(fā),能夠帶來更多優(yōu)質的新聞產(chǎn)品,并為新聞播報提供優(yōu)質素材。
新聞播報與用戶偏好的協(xié)同。廣電媒體“AI合成主播”新聞播報的雙效推進過程要堅持“經(jīng)濟利益必須服從社會效益”的新聞價值取向,在新聞分發(fā)上以用戶偏好為核心,實現(xiàn)對人工智能新聞分發(fā)算法的改進。廣電媒體的新聞工作者,應積極與人工智能的算法工程師開展合作,將新聞本身的社會價值融入算法設計并科學地開展算法評價,以算法化和模型化的處理實現(xiàn)有價值新聞的傳遞,通過二者的協(xié)同為“AI合成主播”提供優(yōu)質的新聞播報內(nèi)容。
軟件硬件上的協(xié)同。人工智能時代,可謂萬物皆媒體,所有端口都可以成為新聞的入口。由此,廣電媒體要與人工智能技術尋求軟硬件上的合作,從而在協(xié)同的基礎上開發(fā)視聽端,為群眾帶來全新的視聽體驗,使得新聞信息的雙效價值得以展現(xiàn)——在廣播媒體端,人工智能音箱入口是開發(fā)核心;而在電視媒體端,人工智能電視則是開發(fā)核心。廣電媒體與人工智能軟硬件商的協(xié)同合作,帶來的將是廣闊的發(fā)展空間,能夠實現(xiàn)新聞播報的多元化和傳播渠道的多樣化。新型終端入口的把控,對于廣電媒體“AI合成主播”的新聞播報雙效推進作用明顯。
數(shù)據(jù)與內(nèi)容資源的協(xié)同?!癆I合成主播”在人工智能時代為廣電媒體深度融合打開了新局面,而作為廣電媒體的全新嘗試與探索,“AI合成主播”的新聞播報需要數(shù)據(jù)和內(nèi)容資源的協(xié)同與支撐。為此,新華社專門成立全球首個智能化編輯部,全面推進人工智能技術的應用,從新聞的策劃、采集、編輯、供稿和傳播實現(xiàn)一體化指揮,在多環(huán)節(jié)協(xié)同尤其是數(shù)據(jù)與內(nèi)容資源協(xié)同的基礎上,使“AI合成主播”的新聞播報內(nèi)容更具雙效價值,增強了廣電媒體自身的影響力。
規(guī)章約束與公眾監(jiān)督的協(xié)同?!癆I合成主播”的出現(xiàn),在未來會對廣電媒體的發(fā)展持續(xù)產(chǎn)生影響,但相比于傳統(tǒng)的新聞播報方式,“AI合成主播”的播報方式同樣可能出現(xiàn)新聞失范的問題。對此,“AI合成主播”的發(fā)展想要達成雙效推進的目標,還需要廣電媒體盡早出臺針對人工智能新聞和新聞播報的規(guī)章制度,并對媒體自身內(nèi)部的組織框架進行調整,建立問責機制。除此之外,新聞播報本身就是面對廣大群眾,公眾監(jiān)督必不可少,建立多元化的反饋渠道如社區(qū)、微博、微信公眾號平臺等,接受公眾監(jiān)督將推動“AI合成主播”的新聞播報走向規(guī)范化。
“人工智能技術+虛擬主播”的新聞播報方式在未來的發(fā)展前景廣闊,可從主持人、記者以及用戶等主客體角度對其發(fā)展趨勢與應用方向進行展望。
主持人角色轉型升級。廣電媒體在未來的發(fā)展中,運用“AI合成主播”進行新聞播報將漸成趨勢。目前“AI合成主播”在新聞播報的準確性方面雖然有優(yōu)勢和保障,但情感表達仍處于劣勢。主持人的角色轉型,則能幫助“AI合成主播”實現(xiàn)情感上的傳遞與延伸,如果傳統(tǒng)主持人能從“主角”轉為“配角”,將借助職業(yè)升級更好地服務于新聞業(yè)。正如“AI合成主播新小浩”的肢體語言表達已經(jīng)可以實現(xiàn)情感的傳遞,主持人能夠為新聞行業(yè)的智能化發(fā)展持續(xù)提供支持,相信未來隨著人工智能技術的發(fā)展成熟,“AI合成主播”的情感傳遞也將更具體、更高效。
記者從幕后走到臺前。“AI合成主播”新聞播報過程的升級,將不斷促使傳統(tǒng)的新聞策劃、采集、編輯和供稿等環(huán)節(jié)持續(xù)變化,記者的職能也將逐漸被重新定位,從幕后走向臺前著手對采編環(huán)節(jié)的深入把關,同時規(guī)范“AI合成主播”的播報內(nèi)容。通過“AI合成主播”的技術更新和記者職能日漸轉變的人力資源輔助,未來“AI合成主播”的新聞播報必將朝著專業(yè)化、規(guī)范化的方向發(fā)展。
用戶體驗將全面強化。新聞播報受眾群體的用戶體驗,直接決定著新聞本身的感染力和播報過程對內(nèi)容的詮釋效果?!癆I合成主播”的播報,在目前已經(jīng)初步實現(xiàn)了內(nèi)容播報的精準化,但情感傳遞的效果卻并不理想。雖然最新的主播已經(jīng)能夠在肢體動作上輔助情感表達,但情感上的內(nèi)在關聯(lián)很難形式化的形成,用戶也難以從如此的新聞播報中獲取有效的情感信息。人工智能技術的升級將讓“AI合成主播”更具個性化,在新聞播報過程中更準確地表達和傳遞新聞信息要素,全面強化用戶體驗與感知,讓用戶能夠在“AI合成主播”的新聞播報中了解新聞的本質與內(nèi)涵。綜上所述,“人工智能技術+虛擬主播”的新聞播報未來探索的發(fā)展方向,旨在打開廣電媒體的全新發(fā)展局面,邁步進入智媒時代。