陶萌萌 南京傳媒學(xué)院新聞傳播學(xué)院
自動化新聞可以定義為通過算法有目的地挖掘現(xiàn)有數(shù)據(jù)來創(chuàng)建新聞內(nèi)容。自然語言生成技術(shù)很大程度上支持了新聞自動化,它可以幫助記者進行新聞采集及新聞傳播,在描述性報道中大幅提升寫作效率。當下,自動化新聞在社交網(wǎng)絡(luò)及事實核查中都起到了重要作用。這種新技術(shù)在傳媒領(lǐng)域的大量應(yīng)用對業(yè)界及社會影響深遠。在實踐中,自動化新聞與記者的互動使得其定位逐步清晰,其在文化傳媒領(lǐng)域的發(fā)展前景也會更為廣闊。
近年來,記者們開始學(xué)習(xí)多媒體報道、網(wǎng)頁設(shè)計、數(shù)據(jù)分析以及算法編程,這些對生產(chǎn)自動化新聞尤為重要。自動化新聞可以定義為通過算法有目的地挖掘現(xiàn)有數(shù)據(jù)來創(chuàng)建新聞內(nèi)容[1]。盡管人們擔心自動化的新聞報道可能會被用于傳播錯誤信息,甚至?xí)屛幕瘋髅綄I(yè)人士失去工作,但如果做得合乎情理及規(guī)范,這種報道方式也會帶來諸多好處。其中包括推動事件講述進程、信息收集及協(xié)助核查基本事實等,這些是新聞業(yè)最基本且最關(guān)鍵的社會功能[2]。
盡管人們并不能完全理解其運行機制,算法和自動化在當代生活中已經(jīng)變得無處不在。人們的日常生活越來越受到背后的數(shù)學(xué)模型及數(shù)據(jù)系統(tǒng)的影響。從計算機和信息科學(xué)中的概念可以看出,算法遵循一系列預(yù)先設(shè)計的步驟或規(guī)則來解決問題。實際上,算法和自動化技術(shù)已經(jīng)導(dǎo)致人類決策被軟件增強,甚至部分被軟件所取代。這種增強和替代現(xiàn)象已經(jīng)很普遍,甚至在一些行業(yè)中占據(jù)主導(dǎo)地位。這一趨勢同樣在新聞媒體中出現(xiàn),以至于從初始階段的新聞生產(chǎn)到后期的新聞消費,算法已經(jīng)開始影響新聞業(yè)的諸多方面。
數(shù)字化新聞的理念出現(xiàn)在2000年之后,數(shù)據(jù)、代碼、軟件作為新概念來到新聞業(yè)當中,全面地發(fā)掘算法和自動化在傳媒工作中的潛在影響。到2010年代中期,完全自動化和半自動化的新聞收集、過濾、編輯和分享已經(jīng)在新聞編輯部占據(jù)越來越重要的位置[3]。也就是說,新聞生產(chǎn)的規(guī)范、模式和管理正在發(fā)生變化,甚至在更根本的層面上,關(guān)于誰(人還是機器)來從事新聞工作的問題也開始被探討。例如,一些算法被用來過濾社交媒體平臺上發(fā)布的大量信息并從中挑選出具有潛在新聞價值的內(nèi)容。
此外,通過將體育成績和財務(wù)報告的結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)化為敘事新聞文本,在較少或沒有人工干預(yù)的情況下,相關(guān)算法可被用于生成多篇自動化新聞報道。自動化過程還可以被用來傳播信息,使得消費者更多地接觸他們所喜歡的事物,這基于算法對他們行為特征和社交網(wǎng)絡(luò)的總結(jié)歸納?,F(xiàn)在看來,在算法倫理及其問責機制等課題被充分討論的基礎(chǔ)上,算法更需要被理解為人類和機器的結(jié)合。在這個進程中,自動語言生成技術(shù)在自動化新聞中也體現(xiàn)出其重要作用。
具體說,自然語言生成技術(shù)是從結(jié)構(gòu)化數(shù)據(jù)中自動生成文本的技術(shù)。它在過去十年已經(jīng)被諸多公司產(chǎn)品化、商業(yè)化。這項技術(shù)最早出現(xiàn)在20世紀50年代,是機器翻譯工作的一部分,其使用范圍在最近幾年迅速擴大。當代自動語言生產(chǎn)類產(chǎn)品主要以企業(yè)工具的形式銷售,這些工具可以幫助沒有專業(yè)知識的人從大數(shù)據(jù)中獲益?,F(xiàn)在,這些技術(shù)也越來越多地用于新聞機構(gòu)例行寫作任務(wù)的自動化,即自動化新聞。
以往對自動化新聞的研究將其歸類為定量新聞的一種形式,有時也被稱為“算法新聞”或“機器人新聞”[4]。有關(guān)研究關(guān)注的是記者對自動化的專業(yè)使用、受眾對自動化內(nèi)容的看法、自動化新聞對社會和經(jīng)濟的影響以及關(guān)于文化、倫理的問題。由于新聞機構(gòu)需要可持續(xù)的商業(yè)模式,對于媒體來說,在提高新聞內(nèi)容生產(chǎn)效率方面存在著巨大的經(jīng)濟壓力,故在新聞編輯部中對自動化新聞的使用一直呈上升之勢。
早期使用自然語言生成技術(shù)實現(xiàn)新聞自動化的例子大多局限于相對較短的文本,其生成的文本通常與人工寫作難以區(qū)分,文檔的數(shù)量也大大超過了人工編輯可能達到的數(shù)量。盡管自動化的寫作工具在被整合到出版工作的過程中取得了一定程度上的成功,但人們普遍認為,自動語言生成技術(shù)在實現(xiàn)新聞寫作自動化方面的潛力僅限于以數(shù)據(jù)呈現(xiàn)的簡單描述,其中最明顯的例子是體育和財經(jīng)類新聞的寫作。這種描述性報道可成為新聞的重要組成部分,也可以是大多數(shù)新聞編輯部的選擇之一,但自動語言生成技術(shù)尚未被證明適合生產(chǎn)長篇新聞作品,而且目前它無法做到將新聞中的故事更加精彩而生動地展現(xiàn)出來[5]。
具體說,自動化新聞是指使用算法來完成可能由人類操作的新聞相關(guān)任務(wù)。自動化可以幫助記者進行新聞采集及新聞傳播。在新聞采集方面,有學(xué)者認為,自動化新聞能夠節(jié)省記者的時間,從而使其專業(yè)水平有更多提升空間[6]。比如在體育比賽及商業(yè)服務(wù)中,自動統(tǒng)計重要事件并匯編呈現(xiàn)已被證明是卓有成效的操作方式。將這些事件做自動化處理能夠為記者提供時間和機會,將人文背景元素引入相關(guān)事件。此外,像聊天機器人可以就某些話題來接受受眾的提問并作出簡要回答,最大程度上節(jié)省人力、物力。
研究表明,到目前為止,受眾尚無法從根本上區(qū)分人和電腦制作的新聞[7]。傳媒人對自動化新聞也有復(fù)雜的認知。有來自新聞報道一線的記者看到了自動化新聞的潛力,可用其擴大信息的深度、范圍和即時性。但也有人認為這可能會對他們的職業(yè)生涯造成影響,因為自動化的應(yīng)用會減少對人類記者的需求,進而引發(fā)大量裁員。其他擔憂如數(shù)據(jù)存儲、隱私權(quán)、軟件更新及許可等,這些也被時常提及。在新聞領(lǐng)域,使用自動化最大的挑戰(zhàn)在于算法的可靠性以及所用數(shù)據(jù)的可靠性。質(zhì)量較差的數(shù)據(jù)可能會導(dǎo)致不夠理想的結(jié)果,而自動化卻可以擴大其傳播的速度和規(guī)模。
盡管自動化新聞通常是由實踐所驅(qū)動的,學(xué)術(shù)界也開始圍繞自動化新聞的理論進行思考。例如,有學(xué)者建議將人機互動作為重心來理解機器成為傳播源的理由。這樣,關(guān)于自動化新聞的研究就可被納入學(xué)術(shù)研究框架。具體講,與自動化新聞有關(guān)的人工智能技術(shù)的功能、外部關(guān)聯(lián)及其原始用途的研究可以被區(qū)分,以便后續(xù)討論能夠更加專業(yè)化。
聊天機器人是自動化新聞的新穎表現(xiàn)形式。它是一種會話式用戶界面,在諸如客戶服務(wù)等環(huán)境中很常見,但它作為新聞傳播的媒介應(yīng)用卻比較稀有。現(xiàn)在,這種情況已經(jīng)開始改變,英國廣播公司(BBC)等公共服務(wù)新聞機構(gòu)正在開發(fā)聊天機器人,用戶如果想要了解王室婚禮新聞的細節(jié),可以選擇與機器人對話,直接而迅速地獲取婚禮日期、儀式細節(jié)等一系列滿足用戶需求的信息,從而避免了其他無用信息對用戶的干擾。聊天機器人的使用在一定程度上是被社交媒體平臺的演變推動的,因為當下人們獲取信息的渠道已開始由公域社交媒體轉(zhuǎn)向私域社交媒體,BBC等公共服務(wù)媒體認為有義務(wù)讓它們的報道在受眾所選擇的平臺上出現(xiàn)。
研究顯示,聊天機器人的受眾普遍對其持積極態(tài)度,并欣賞這種非正式、口語化的新聞獲取模式,包括獲取信息的便利程度[8]。為聊天機器人提供支持的記者也普遍對其持積極態(tài)度,認為這是更優(yōu)質(zhì)的服務(wù)受眾的方式。盡管有這些積極的反饋,也有學(xué)者談到了聊天機器人依賴社交媒體平臺的網(wǎng)絡(luò)基礎(chǔ)設(shè)施可能帶來的影響和后果,包括它是否有權(quán)使用公眾數(shù)據(jù)等問題。
報道及事實核查被認為是一則優(yōu)秀新聞的基本要素。自動化新聞的重要潛在用途就是提供事實核查服務(wù)。在信息化社會中,人們對錯誤信息傳播的擔憂使得自動化的使用恰逢其時。從理論上講,自動驗證可以用來檢查社交媒體上發(fā)布及轉(zhuǎn)發(fā)的聲明。有專業(yè)人士創(chuàng)制軟件用以分辨社交媒體上信息的真?zhèn)?,他們發(fā)現(xiàn)盡管自動驗證可以對社交媒體上的虛假內(nèi)容加以限制,但信息準確性的最終判斷仍然需要人工介入。就目前而言,大多數(shù)的事實核查工作還是由人工和電腦配合完成的。
自動化新聞中的算法可以說是人類能力在機器上的增強表現(xiàn)形式。但到目前為止,完全可靠算法的實踐例證并不多見。與此同時,大型科技公司用來幫助用戶的算法卻客觀上助長了諸如性別歧視和偏見等社會負面因素。盡管有新聞工作者認為技術(shù)的進一步發(fā)展是現(xiàn)存問題的解決方案,可人們解決技術(shù)問題的能力卻是有限且不確定的。新聞業(yè)在傳統(tǒng)意義上提倡客觀,而科技公司在回應(yīng)對其算法的批評時,往往聲稱它是客觀的?,F(xiàn)在來看僅僅做到客觀仍然不夠,業(yè)界和學(xué)界需要更加適應(yīng)并熟悉自動化新聞工作中的新規(guī)律及其影響,只有這樣,對其傳播效果的討論才能更加公允。
計算機在新聞領(lǐng)域的應(yīng)用并不新鮮,人們也不斷強調(diào)在計算和新聞的交叉點上描繪最新的趨勢和技術(shù)。半個世紀以來,一直有記者在嘗試使用計算機進行數(shù)據(jù)分析。利用軟件為讀者選擇新聞并做呈現(xiàn),也有幾十年的歷史。自20世紀80年代以來,新聞出版商就開始使用推薦系統(tǒng)進行新聞個性化。如今,自動化新聞已經(jīng)被一系列新聞機構(gòu)所采用,在大規(guī)模信息收集等方面起到重要作用。
隨著時間的推移,新聞業(yè)開始全面使用計算技術(shù),包括利用自動化和算法來撰寫各類新聞文本。起初,傳統(tǒng)靜態(tài)新聞文本的自動化是研究的主要對象。隨著新聞聊天機器人的開發(fā)和部署,一些新穎的交互式界面也受到了各界的重視。學(xué)界和業(yè)界都在探討這些模仿人類交流和行為的自動化技術(shù)形式在社會、文化、規(guī)范及制度等方面的深層含義。
學(xué)者桑斯坦認為,無論是由于自己的選擇還是他人的選擇,網(wǎng)民被孤立在信息回音室中(在網(wǎng)絡(luò)空間內(nèi),人們經(jīng)常接觸相對同質(zhì)化的人群、信息和評論,會窄化自己的眼界和理解),可能會導(dǎo)致信息獲取障礙,從而形成對社會的錯誤認知[9]。既然計算技術(shù)的應(yīng)用不可避免地依賴出版商、網(wǎng)絡(luò)平臺和社會組織,故以上擔憂會在一定范疇內(nèi)持續(xù)存在。
隨著媒體和社會的數(shù)字化以及數(shù)據(jù)新聞的不斷發(fā)展,以計算技術(shù)為基礎(chǔ)的新聞報道已日臻成熟。如今,在新聞的組織、生產(chǎn)以及分發(fā)等方面,算法和相關(guān)自動化形式也逐漸顯示出其重要性。記者們相信這種新技術(shù)的發(fā)展將改變他們的工作方式,并幫助他們重新審視自己的核心技能。他們認為,來自機器新聞的競爭將使得記者專注于只有人類能做的工作。創(chuàng)造力、分析能力和個性將變得更加重要,而專業(yè)的日常工作將逐漸被自動化。當日常的新聞工作可以自動化時,記者在壓力下就必須提供更好的產(chǎn)品。在這種情形下,記者需要專注于自己的比較優(yōu)勢,而不是在自動化新聞?wù)純?yōu)的領(lǐng)域里競爭。
具體說,自動化新聞的優(yōu)點是邊際成本低、文章撰寫速度快。這種計算機生成的語言被認為可讀性相對較差。記者的寫作能力、幽默感、哲學(xué)思維和呈現(xiàn)較為復(fù)雜且多樣化句子的潛力是他們的主要競爭優(yōu)勢。人類記者具有較強的分析能力、創(chuàng)造技能以及自己的個性,這使他們能夠以獨特的視角對事件進行深入分析,仔細觀察后完成文章寫作。他們的反應(yīng)靈敏,專業(yè)能力較強,使其能夠精準報道突發(fā)性新聞、做調(diào)查性報道及完成深度分析,而當下的算法還無法涉獵這些有關(guān)高質(zhì)量新聞報道的技能。
在自動化新聞不斷發(fā)展的今天,記者的優(yōu)勢更多地體現(xiàn)在文本寫作的分析力以及創(chuàng)造性上,而不僅是客觀性和時效性。記者需要在工作中提供更深入的新聞報道和背景解析?,F(xiàn)在來看,專欄、突發(fā)新聞報道、特寫和新聞分析等文章類型是人類記者的優(yōu)勢領(lǐng)域。
總體而言,因為要完成的任務(wù)及滿足的受眾需求相似,人類記者和自動化新聞寫手可以是競爭的關(guān)系,但他們在各自完成不同任務(wù)的時候,因其特性能夠互補,故亦可被視為合作關(guān)系。此外,當專業(yè)記者利用自動化新聞的元素完成報道任務(wù)時,二者即達成了融合的狀態(tài)。日常工作自動化之后,記者將會擁有更多的時間進行深度報道。越來越多的案例顯示,新聞業(yè)的這種人機分工合作已經(jīng)日趨主流。隨著自動化新聞在當代文化傳媒領(lǐng)域的定位逐步清晰,其發(fā)展前景也將會更為廣闊。