黃磊
近年來,人工智能在新聞領(lǐng)域的應(yīng)用越來越頻繁,不少人驚呼連記者這個行業(yè)都要被機器化了么?本文將對當前新聞寫作機器人的應(yīng)用情況、應(yīng)用優(yōu)勢和不足進行說明和探討,并對其發(fā)展前景作出展望。
2015年9月10日,騰訊財經(jīng)頻道用自動化新聞寫作機器人Dreamwriter,發(fā)布了一篇名為《8月CPI漲2%創(chuàng)12個月新高》的報道,開了國內(nèi)機器人寫稿的先河。
2016年里約奧運會上,一個名為“張小明(xiaoming-bot)”的新聞機器人小試鋒芒。在奧運會開始后的13天內(nèi),共撰寫了457篇關(guān)于羽毛球、乒乓球、網(wǎng)球的消息簡訊和賽事報道,每天30篇以上。其發(fā)稿速度之快,讓人驚訝——幾乎與電視直播同時。
2017年12月1日,在武漢交警撮合下,武漢長江大橋聯(lián)手騰訊,“寫”出了全國首篇物聯(lián)網(wǎng)交管新聞。當日上午9點23分,騰訊2歲寫作機器人Dreamwriter接收到1180公里外,60歲的武漢長江大橋發(fā)出的數(shù)據(jù)。兩件“物體”合作,0.5秒內(nèi),一篇323字的新聞稿《長江大橋11月日均車流量9.2萬日高峰車流10.4萬》躍然紙上。武漢長江大橋,成了全國首個物聯(lián)網(wǎng)“通訊員”。
新聞機器人,或者叫AI機器人,早已被世界上的主流媒體所關(guān)注并加以使用。例如,國外有美聯(lián)社的Word-Smith、華盛頓郵報的Heliograf以及紐約時報的blossom等。國內(nèi)則有新華社的快筆小新、騰訊的dreamwnter、第一財經(jīng)的DT稿王等。這些寫稿機器人無一例外都運用到了大數(shù)據(jù)處理技術(shù)。
1.提升發(fā)稿速度,全天候新聞熱點監(jiān)測,提高新聞的時效性
時間對于新聞的意義非同小可。新聞機器人通過之前學習相似稿件的寫作模式,憑借其快速的信息處理能力,可以在極短的時間內(nèi)就寫出一篇符合該媒體寫作風格的作品。以“小明”為例,在奧運會期間其一篇稿件的完成時間約在2秒左右,也就是說比賽剛一結(jié)束,稿件就已經(jīng)寫好發(fā)布了。其發(fā)稿速度上要快其他媒體一步。此外,記者在長時間的報道壓力下可能忙中出錯,而身為機器“小明”可以實現(xiàn)全天候24小時監(jiān)測賽事熱點,既不漏題同時也保證了記者有充分的精力應(yīng)對關(guān)鍵比賽的詳細深度報道。
2.數(shù)據(jù)海量,規(guī)模處理
隨著大數(shù)據(jù)技術(shù)的發(fā)展,機器人寫稿能力會越來越強。據(jù)估計,當前全球存儲的數(shù)據(jù)總量以上萬艾字節(jié)測量(1艾字節(jié)=10億千兆字節(jié)),而且仍在加速增長,大約每3年實現(xiàn)一次倍增。這些數(shù)據(jù)以各種格式存在,往往難以用傳統(tǒng)數(shù)據(jù)軟件進行匹配分析。
大數(shù)據(jù)技術(shù)則能夠規(guī)?;幚磉@些信息。無論是文、圖、音視頻還是其他形式的信息,機器人編輯都可以像音樂家排列音符一樣去組合、重構(gòu)。無論天氣預報、地震預警還是賽事報道,最終都能放人機器人數(shù)據(jù)庫中,可以構(gòu)建無限可能。
3.信息抓取,精準加工
機器人寫稿的另一大優(yōu)勢就是精準。寫稿機器人生產(chǎn)新聞,可以不依賴于現(xiàn)場采訪獲取素材,而是通過對現(xiàn)有數(shù)據(jù)、資料進行快速搜集加工編制而成。在數(shù)據(jù)量足夠大、樣本足夠多的情況下,機器人寫稿可有效避免假新聞出現(xiàn)。
4.實時監(jiān)控.快速報道
寫稿機器人用機器代替人類完成對信息源的實時監(jiān)控,并利用文本解析和爬蟲技術(shù)實現(xiàn)自動信息抽取,采用算法技術(shù)并融合編輯記者團隊的經(jīng)驗和智慧,以模板和規(guī)則知識庫的方式輸出稿件。真正達到了對信息的實時監(jiān)測、實時發(fā)布。
5.數(shù)量龐大,效率極高
和傳統(tǒng)媒體人相比,寫稿機器人可以瞬間完成海量閱讀、分析并根據(jù)互聯(lián)網(wǎng)活躍點擊量數(shù)據(jù),瞬時篩選出下一個熱點新聞,然后通過后臺算法快速合成新聞。總體來看,寫稿機器人在速度和數(shù)量上有著絕對優(yōu)勢。
1.機器人對信息的深度理解不夠
新聞機器人所能做的只是在現(xiàn)有數(shù)據(jù)庫的支持下,對文章進行詞匯和語句的抓取,然后進行排列組合,對文章的深度理解能力還遠遠不能與人類相提并論。已經(jīng)有機器人記者被發(fā)現(xiàn)偽造新聞事實的情況發(fā)生。
2.扁平化新聞千篇一律,缺乏亮點和重點
由于模塊式的報道,機器人寫稿難以回避的一個問題就是千篇一律,每篇報道的結(jié)構(gòu)甚至是用詞用句都差不多,缺乏亮點和重點,難以給讀者留下印象。
3.對信息的提煉和概括能力不足
要想把一篇文章寫好,對信息的概括和提煉能力是一個記者必備的職業(yè)素質(zhì),長而空洞的文章是沒有人看的。但目前的寫作機器人顯然沒有提煉和概括的能力,提煉與概括的前提是理解,機器人對于人類語言的理解能力還十分弱,這就限制了機器人寫作的文章體裁和領(lǐng)域。
4.寫作領(lǐng)域較為單一
機器人新聞當前的應(yīng)用還停留在以使用數(shù)據(jù)為主的新聞領(lǐng)域。具體的說是在財經(jīng)和體育方面,很少能“身兼數(shù)職”、“一機多能”。這一方面是由于其初始寫作模塊的設(shè)置,功能較為單一,未能考慮到深讀學習功能;另一方面,數(shù)據(jù)壁壘的導致“小明們”不能獲取學習更多的數(shù)據(jù)資料,導致其“知之甚少”。
倫敦大學教授NeilThurman發(fā)布的比較人類記者和機器人記者的研究報告提出,機器人可以用于突發(fā)新聞事實的報道,隨后由人類記者做深度挖掘和擴充。人機協(xié)作是必然趨勢。未來的新聞稿背后也許都會站著一個人類記者和一個虛擬記者,透過不同的視角看世界。未來,機器人新聞或許有以下發(fā)展方向:
1.跨領(lǐng)域的多面手
目前來看,新聞機器人的寫作能力還僅僅停留在某一領(lǐng)域。像新華網(wǎng)的快筆小新,它其實是有3個分身,每個分身各處理一個領(lǐng)域的新聞消息。隨著其數(shù)據(jù)處理能力的增強,以及數(shù)據(jù)開源成為可能??珙I(lǐng)域的機器人新聞寫作將成為可能,這樣一來,不僅大大節(jié)約了成本,而且寫出的稿件將更加全面,不同數(shù)據(jù)庫的資料可以相互補充,取長補短。
2.人類記者、編輯的助手
將來的新聞編輯部很可能出現(xiàn)二加一的局面,即機器人記者同人類記者撰稿,機器人編輯同編輯共同審核把關(guān)。機器人記者可以對大量文本、音視頻數(shù)據(jù)進行處理,形成報道提綱或數(shù)據(jù)圖表,使得記者省去了查閱資料,整理匯總的不便,對報道重心做到心中有數(shù),下筆有神。同時,可以協(xié)助編輯校對文稿,并快速發(fā)布到各媒體終端。
3.平等的交流者
目前為止,寫作機器人還停留在單向度的接受指令,進行運算的層面。也就是說機器人還只能停留在輔助記者工作的階段。但相信在不久的將來,隨著數(shù)據(jù)量的增多,機器的運算能力的增加,以及機器對于自然語言理解能力的增強,機器人可以平等地同人類進行交流,對人類的意見進行反饋建議。
4.多平臺終端、數(shù)據(jù)庫資源的連通者
未來,隨著各機構(gòu)數(shù)據(jù)庫、不同平臺之間的不斷開源,新聞機器人可以實現(xiàn)“推”與“拉”的多平臺終端、數(shù)據(jù)庫資源連通。一方面可以將寫好的稿件快速同時上傳到多個媒體平臺:另一方面,將不同數(shù)據(jù)庫連通起來,使得數(shù)據(jù)交叉整合,發(fā)揮更大的效能。
5.媒介融合的推動者
在今后的發(fā)展中機器人甚至可以將視頻、音頻甚至虛擬現(xiàn)實技術(shù)整合起來。實現(xiàn)真正的媒介融合。新聞機器人可能是今后媒介融合的一個具體產(chǎn)物,它出現(xiàn)在新聞現(xiàn)場,根據(jù)新聞對象需要,安裝相應(yīng)的新聞模塊,裝配虛擬現(xiàn)實攝像頭,可以快速寫稿、現(xiàn)場直播、制作VR作品。
參考文獻:
[1]耿磊:《機器人寫稿的現(xiàn)狀與前景》,《新聞戰(zhàn)線》2018年第1期
[2]錢童心:《機器人上崗寫稿人類記者價值更易凸顯》,《第一財經(jīng)日報》2017年第7期