劉藝琳
(西北大學,陜西 西安 710127)
AI 全稱是 Artificial Intelligence,中文釋義為人工智能。它是計算機科學的一個分支,它的目的是了解智能的實質(zhì),并生產(chǎn)出一種能無限接近人類智慧的機器。通俗地說,AI 是通過信息數(shù)據(jù)的采集,對人的思維及行為的一種模擬。AI 主播的出現(xiàn)就是利用人工智能技術(shù)對新聞播音員的播報狀態(tài)所做出的模擬。全球首個“AI 合成主播”是于2018 年11 月7 日在第五屆世界互聯(lián)網(wǎng)大會上正式亮相,由搜狗與新華社共同研發(fā)的“小浩”?!靶滦『啤敝两褚言谛氯A社客戶端上持續(xù)為觀眾服務(wù)700多天,截至至2020 年五月底,“新小浩”先后產(chǎn)出13000 多條新聞報道,累計時長超過35000 分鐘。
2020 年3月3日,新華社客戶端發(fā)布了《首個AI 合成女主播今日上崗》的推送,由此迎來了全球首位AI 合成女主播“新小萌”。該推送在新華社客戶端瀏覽量超27萬,在新華社微信瀏覽量近100 萬。隨后《新小萌上兩會全國政協(xié)十三屆二次會議在京開幕》報道即由“新小萌”進行報道。當天的瀏覽量迅速突破百萬。
2020 年5 月21 日,在全國矚目的兩會召開之際,搜狗又聯(lián)合新華社推出全球首個3D AI 合成主播“新小微”。較之前的2D 主播,3D“新小微”更是有了諸多提升,不僅立體靈活可控,可實現(xiàn)功能持續(xù)自我更迭,進行變裝、改變發(fā)型等,還同時支持多機位多景深,可以全方位全角度呈現(xiàn)內(nèi)容,在空間應(yīng)用上帶來了更多的可能性,也為新聞節(jié)目的多樣化制作呈現(xiàn)提供了更堅實的基礎(chǔ)。
近年來,隨著網(wǎng)絡(luò)技術(shù)和人工智能的發(fā)展媒介形態(tài)、輿論生態(tài)、傳播方式發(fā)生重大變化,其在新聞行業(yè)的運用變得越來越多、越來越廣,甚至在逐漸改變著新聞行業(yè)整體的發(fā)展趨向,新聞生產(chǎn)傳播模式正在重塑。新一代媒體人不僅承載探究真相、表達觀點、傳遞信息和價值的使命,也要使用機器、理解機器、駕馭機器,還要進一步順應(yīng)數(shù)字時代、智媒時代媒體發(fā)展大勢,提高采編發(fā)、傳播平臺的智能化水平是大勢所趨、行業(yè)所需。
今年1 月25 日,中央政治局就全媒體時代和媒體融合發(fā)展舉行集體學習,總書記發(fā)表重要講話,強調(diào)要運用信息革命成果,推動媒體融合向縱深發(fā)展,做大做強主流輿論。要探索將人工智能運用在新聞采集、生產(chǎn)、分發(fā)、接收、反饋中,全面提高輿論引導能力。新華社蔡名照社長也強調(diào),要順應(yīng)互聯(lián)網(wǎng)發(fā)展大勢,樹立互聯(lián)網(wǎng)思維,加快建設(shè)網(wǎng)上通訊社提高新聞時效和生產(chǎn)效率。
本文基于SWOT分析法,從優(yōu)勢(Strength)、劣勢(Weakness)、機遇(Opportunities)和威脅(Threatens)對AI 合成主播在新聞報道中的應(yīng)用進行深入研究和分析,總結(jié)出相應(yīng)的結(jié)論。
1.AI 合成主播自身優(yōu)勢。工作質(zhì)量高,作為人工智能合成產(chǎn)物,AI 主播在新聞播報中吐字發(fā)音具有規(guī)范性、準確性,可以真正做到播報0失誤,還可模擬音色、韻律、聲調(diào)起伏等,更加貼合真人播報觀感,大大加強傳播效果。
工作效率高,播送迅速高效,AI 合成主播可以將文字稿件直接迅速地合成為語音及視頻,同時可以24 小時全天無休進行工作,提高效率、降低工作成本。如遇突發(fā)事件,AI 主播的高效快捷可以大大加快信息傳播速度,滿足受眾需求,促進社會和諧發(fā)展。
AI 主播只要安裝相關(guān)語言軟件就可隨意切換英語、日語、法語等多種語言,適應(yīng)新聞播報的國際化需要,降低了主播跨語種播報地門檻。
2.AI 合成主播技術(shù)優(yōu)勢。人工智能下的內(nèi)容生產(chǎn)更加海量、高效,對于海量枯燥數(shù)據(jù)的處理分析更加精確快捷,相比人工所呈現(xiàn)出的優(yōu)勢是巨大的。在大數(shù)據(jù)的支撐與信息接收個性化趨勢下,人工智能技術(shù)可以通過大數(shù)據(jù)的挖掘,對用戶進行個性化的新聞定制等。AI 主播的誕生更是基于人工智能在傳播業(yè)的智能媒體深度融合。
初代AI 合成主播由“搜狗分身”技術(shù)打造,讓AI 主播逼真的模擬人類說話時的聲音、嘴唇動作和表情,并且將三者自然匹配,創(chuàng)造出人類的AI 分身,進而幫助人類提高信息表達和傳遞的效率。隨后,僅僅過去三個月,又推出了全球首個“站立式”AI 合成主播——“新小萌”,從過去的“坐著播新聞”升級成結(jié)合肢體動作的“站立式播報”,并且豐富了手勢、優(yōu)化了表情,增加了更為豐富的神態(tài)和肢體動作,進一步采用了“搜狗分身”最新的wavernn 波形建模技術(shù),可以實現(xiàn)逼真的語音合成效果,讓AI 的聲音更具有真實情感和表現(xiàn)力。
2020 年5 月21 日,搜狗又聯(lián)合新華社推出全球首個3D AI 合成主播“新小微”。采用行業(yè)領(lǐng)先的真人掃描、面部肌肉驅(qū)動、表情肢體捕捉等技術(shù),“新小微”在外形上不僅能夠走動轉(zhuǎn)身,進行各種復雜的動作呈現(xiàn),甚至在特寫鏡頭里,連發(fā)絲與毛孔都清晰可辨,與真人的相像度大幅提升,可全方位、多視角的觀察她的情況,甚至還能改變妝發(fā)和服裝,為新聞播報添加了更多的趣味性和新鮮感。
3.AI 主播報道新聞的形式多樣。新華社客戶端的AI 合成主播頻道就采用一分鐘以內(nèi)的短視頻形式,選取國內(nèi)外最新最快的熱點新聞,滿足受眾對于新聞信息的需要。同時還在微博、微信等各個平臺,以AI 合成視頻技術(shù),發(fā)布主題熱門,形式新穎有趣的短視頻,進行知識科普與信息傳遞,甚至與受眾進行互動,語言輕松詼諧。
在2019年的兩會新聞報道中,新華社就結(jié)合AI合成主播、AR、VR等人工智能技術(shù),推出《全息交互看報告》,讓新聞受眾仿佛親臨現(xiàn)場,360°全景體驗新媒體背景下新聞報道的美麗。
1.高水平AI 合成主播制作復雜,技術(shù)要求高,費用高昂。雖然僅僅模擬外形和音色就可量產(chǎn)出一批“新聞主播”,但目前高質(zhì)量、逼真靈動的AI 合成主播的背后,仍是真人在“表演”,例如首個3D AI 主播“新小微”的原型就是新華社記者趙琬微,3D AI 主播“新小微”的建立,首先要對趙琬微進行海量的數(shù)據(jù)掃描收集,由她佩戴數(shù)據(jù)采集頭盔,并配合幾百個攝像頭對她身體各部位進行全方位打點掃描,進行細致入微的捕捉記錄。隨后,搜狗還要根據(jù)頂尖掃描還原算法及面部肌肉驅(qū)動、表情肢體捕捉等技術(shù),建立高度還原真人的3D數(shù)字模型,并通過多模態(tài)生成算法實時驅(qū)動、渲染構(gòu)建出人物模型,實現(xiàn)高度契合。同時,AI 合成主播技術(shù)要求高,研發(fā)制作成本高昂,只有新華社等大媒體,以及政府支持的各中央地方臺等,有能力推出AI 合成主播,中小型媒體公司無力支撐AI 主播的高昂費用,普及困難,應(yīng)用不夠廣泛。
2.AI 合成主播技術(shù)仍不夠成熟。目前的AI 主播,雖然可以滿足新聞播報的準確性和規(guī)范性,做到0 出錯,但對于播報中的重音、停連、語氣、節(jié)奏等還是做的不夠完善,聽起來語音不夠連貫,有些部分略顯生硬。雖能準確的讀出每個漢字的調(diào)值,但發(fā)音過于標準刻板,無法變通。例如在新聞每一部分的結(jié)尾要有收束感,調(diào)值較低,不同情境的稿件會對調(diào)值造成一定的影響,AI 主播目前還無法實現(xiàn)根據(jù)情景改變語調(diào)及情緒。
3.AI 合成主播缺乏人腦所具有的情感的獨立思考能力。情感賦能方面的缺陷也是目前AI 合成主播的一個巨大問題。在新聞播送中,我們要有“對象感”,要讓受眾感到更加親切、提升受眾專注度。對于內(nèi)容中的“內(nèi)在語”要表現(xiàn)出來,同時要調(diào)動情緒、結(jié)合自身社會經(jīng)驗,做到“情景再現(xiàn)”,讓受眾有沉浸感,感受新聞情緒,達到傳播效果。在天氣預(yù)報、政治新聞、娛樂新聞等不同情境,以及不同情緒的新聞事件中,新聞主播都應(yīng)該采取不同的語氣、情緒、狀態(tài)、肢體動作等輔助播報,如春節(jié)聯(lián)歡晚會上主持人聲音洪亮飽滿、熱情洋溢,新聞聯(lián)播中播報災(zāi)難事件時語氣沉痛、速度緩慢。但目前AI 合成主播無法做到情感賦能,缺乏“共情”能力,與受眾沒有情感上的互通。音質(zhì)中甚至還有一些難以消除的電子音感都未給受眾舒適的聽覺體驗。
AI 合成主播完全依靠冰冷的數(shù)據(jù)和技術(shù)支撐,輸入指令、輸出內(nèi)容,面對不同情緒稿件無法轉(zhuǎn)變語氣,面對突發(fā)情況時也無法及時反應(yīng)、靈活應(yīng)對,無法形成基于自己經(jīng)驗與沉淀而形成的鮮明特點與人格魅力。
4.AI 合成主播形象不夠真實親切。主播形象雖已不斷革新,愈發(fā)接近真人形態(tài),但仍有一些AI 主播形象會造成“恐怖谷”效應(yīng),及當機器人與人類相似程度達到特定程度時(大部分情況為極度擬人化),人們對他們的反應(yīng)會突然變得極其反感,哪怕機器人與人類有一點點細微差別都會非常顯眼刺目,讓人感到僵硬恐怖。給人帶來不適的觀感體驗。AI 主播目前仍稍顯僵硬的肢體與表情仍需繼續(xù)改進。
1.黨和國家大力支持。作為新一輪科技革命和產(chǎn)業(yè)變革的重要驅(qū)動力量,人工智能深刻影響著新聞行業(yè)的信息生產(chǎn)模式和傳播模式。黨和國家鼓勵新技術(shù)、新形式在傳媒領(lǐng)域的積極運用,黨的十八大以來,人工智能發(fā)展得到了全社會各行各業(yè)的高度重視。近年來,我國不斷加強人工智能技術(shù)的研發(fā)創(chuàng)新,同時人工智能技術(shù)的迅猛發(fā)展也為傳媒行業(yè)帶來了巨大變革,智能化發(fā)展是未來信息傳播領(lǐng)域的必然趨勢。人工智能技術(shù)不僅使新聞產(chǎn)品的生產(chǎn)經(jīng)營模式發(fā)生改變,還重塑了新時代的媒體業(yè)態(tài),為新聞媒體打造了新的生態(tài)環(huán)境。
2.主流媒體新聞報道轉(zhuǎn)型時期。由于受到資金等方面的限制,絕大部分AI 合成主播隸屬于主流媒體,新媒體環(huán)境下,主流媒體面臨轉(zhuǎn)型,傳統(tǒng)的新聞報道不足以滿足目前受眾的需求,新技術(shù)、新元素的引用可以有力的推動主流媒體進行轉(zhuǎn)型,將傳統(tǒng)的新聞報道形式轉(zhuǎn)變的更加多元新穎,從而吸引受眾,從而達到輿論引導與價值觀輸出的目的。
3.互聯(lián)網(wǎng)平臺助力AI 合成主播發(fā)展。AI 合成主播目前為止,主要是在互聯(lián)網(wǎng)平臺進行推廣與應(yīng)用,互聯(lián)網(wǎng)平臺的用戶大部分為中、青年人群,對于新事物的包容度較高,對于虛擬主播的接受程度較好,關(guān)心熱點話題與科技新事物,有利于現(xiàn)階段的快速推廣傳播,有利于主流價值觀的正確輸出。
1.受眾對于AI 合成主播的接受程度。雖然青年群體對AI 合成主播的接受程度較高,但還有相當一部分人并不接受AI 主播的形式,甚至對AI 形象感到厭惡和恐懼,這需要我們對此進行適當?shù)囊龑?,同時技術(shù)也要不斷革新進步,讓AI 形象更加發(fā)展完善,給人以親近感和喜愛感,解決完善語音生硬問題和情感缺失問題,帶給受眾更好的視聽體驗。
2.AI 主播與傳統(tǒng)主播之間的關(guān)系?!癆I 主播”的到來,是人工智能與新聞媒體深度融合的結(jié)果,也是技術(shù)發(fā)展的必然結(jié)果。AI 主播與真人主播不是互相取代,而是互助合作。AI 主播可承擔之前重復的、機械的工作,真人主播能夠擁有更多時間在新聞價值探究、新聞多樣化探索、價值觀輸出、輿論引導等方面深耕。如在兩會期間,AI 主播進行簡短的、基礎(chǔ)信息的播報,深入的評論與采訪等還是由傳統(tǒng)真人主播進行的。
“新小浩”的原型邱浩在采訪中說道:“AI 主播雖有強大的學習能力,可‘他’依舊是基于既有的數(shù)據(jù),那就讓‘他’來學習我吧。而最令我自信不會被超越的,是我的‘靈魂’。作為播音員要做好的就是“人”本身,人之情感,人之溫度,人之思考,而這些都是目前 AI 主播無法取代的。”
讓AI 主播物盡其用,讓真人主播人盡其才,二者通力合作、攜手并進,才是對此的最優(yōu)解。
綜上所述,AI 合成主播作為新聞報道在人工智能領(lǐng)域的新嘗試,為新聞播報領(lǐng)域提供了一種新的媒介生產(chǎn)方式和新的視覺呈現(xiàn)形式。智能取代部分人類工作已成必然,但人類只要保持學習能力,深度思考,學會掌控和利用人工智能,就不會面臨被社會淘汰出局的窘境。在短時間內(nèi)AI 主播只是對真人主播和主持人起到輔助作用,如何推動融合報道技術(shù)創(chuàng)新,創(chuàng)作優(yōu)質(zhì)的新聞內(nèi)容,吸引用戶關(guān)注,提升用戶體驗,完成再次轉(zhuǎn)型與發(fā)展,推動傳統(tǒng)主播更大發(fā)揮自身價值,依然需要我們?nèi)ゲ粩鄧L試、不斷探索。