蔣枝宏(武漢大學 新聞與傳播學院,湖北 武漢 430072)
?
傳媒顛覆者:機器新聞寫作
蔣枝宏
(武漢大學 新聞與傳播學院,湖北 武漢 430072)
摘 要:隨著人工智能技術在各生產、生活領域的普及,新聞業(yè)終于迎來了機器寫作這一顛覆性寫作方式。本文梳理了機器新聞寫作的發(fā)展歷程以及國內外關于機器新聞寫作的研究成果,以期為未來的機器新聞寫作研究提供有益借鑒。
關鍵詞:機器新聞寫作;人工智能;應用;初級階段
所謂“機器寫作”,又稱“機器人寫作”,是指自動根據(jù)算法將目標數(shù)據(jù)通過自然語言生成的方式輸出文章的一種人工智能技術,核心在于自然語言生成。“機器新聞寫作”則指用這種技術進行新聞寫作,是人工智能學科在新聞領域的應用。最近20年,諸如戰(zhàn)勝國際象棋大師的機器人“深藍”、掃地機器人、面部識別、無人駕駛等我們熟悉的科技都是人工智能的研究成果,而機器人新聞寫作也屬于這一系列成果之一。
基于模板的文本生成算法研究始于20世紀90年代(Buseman & Horacek,1998;Theune,Klabbers,Odijk,De Pijper,& Krahmer,2001),但商業(yè)化應用卻是近幾年才出現(xiàn)的。2010年,美國的Automated Insights公司和Narrative Science公司分別將其研發(fā)的自然語言生成Wordsmith和Quill投放市場。兩家公司均稱其旗下自然語言生成平臺與此前的平臺不同,不是單純將數(shù)據(jù)填入模板,而是根據(jù)特定傳播目標進行個性化寫作。Narrative Science將Quill的文本生成過程概括為:第一,收錄數(shù)據(jù)。第二,計算該數(shù)據(jù)具有新聞價值的各方面。第三,識別相關角度并對其進行優(yōu)先處理。第四,將數(shù)據(jù)顯示的角度與文章觀點相連。第五,輸出文本。
由于機器新聞寫作速度快、產量大、成本低,從2010年春季開始,美國十大電視網已經開始采用Narrative Science的軟件進行體育比賽簡要報道。在2009~2010年賽季,該軟件撰寫的報道占足球賽事報道的40%(劉霞,2011)。2014年3月18日,美國加州發(fā)生4.4級地震,《洛杉磯時報》依賴自主研發(fā)的地震新聞自動生成系統(tǒng)Quakebot,僅用3分鐘就完成了新聞的生成并發(fā)表在《洛杉磯時報》網站上,引發(fā)了其他媒體的關注。同年7月,美聯(lián)社宣布與Automated Insights公司合作,采用機器進行企業(yè)的財報報道。此外,雅虎、福布斯網也已采用機器人進行特定種類的新聞寫作。
值得注意的是,機器新聞寫作仍處于初級階段,主要被用于財經、體育領域的新聞報道,因為這兩類新聞需要進行大量的數(shù)據(jù)處理和闡釋。而在地質、氣象、健康領域,機器新聞寫作也具有較大潛力。
國內大眾開始關注“機器新聞寫作”主要源于騰訊財經的一篇報道。2015年9月10日,一則名為《8月CPI同比上漲2.0% 創(chuàng)12個月新高》的文章文末注明:“本文來源:Dreamwriter,騰訊財經開發(fā)的自動化新聞寫作機器人?!边@篇機器人寫作的新聞稿引發(fā)了社交媒體大量轉載和討論。
10月14日,騰訊財經再次發(fā)布機器新聞稿件。這一次,不但與國家統(tǒng)計局的消息公布零時差,同時推出了“常規(guī)版”、“研判版”、“民生版”3個版本。3篇文章文風各異,針對不同目標用戶個性化需求。此次升級顯示出騰訊企圖打造能夠出產個性化、語言生動的寫作機器人的野心。
機器新聞寫作是新聞生產自動化的全新發(fā)展階段。從2001年谷歌新聞實現(xiàn)機器自動選編,到如今各大新聞網站根據(jù)用戶愛好、瀏覽習慣推薦新聞,聚合生成新聞網頁以及微博自動抓取新聞熱點、設置熱搜詞,都是新聞生產自動化的表現(xiàn)。但這些都還停留在編輯階段,并不涉及內容的原創(chuàng)性生產。而寫稿機器人的出現(xiàn)極大地挑戰(zhàn)著“寫稿是人類特有智力成果”的信念,因而一時之間“記者面臨失業(yè)”的言論不絕于耳。
美聯(lián)社負責人表示,采用機器人寫作企業(yè)財報報道后,季度產量由原先的300余篇變?yōu)?000余篇,且單篇文稿生產時間只需要幾分鐘,機器人的生產力可見一斑。與此同時,機器人的快速更新?lián)Q代、深度學習能力不斷增強也讓傳統(tǒng)記者倍感壓力。Narrative Science原創(chuàng)人之一甚至聲稱未來15年,機器人寫作稿件將占據(jù)90%的市場份額。
無論是作為記者的補充和輔助,亦或直接取代記者進行特定類型稿件的生產,機器新聞寫作的潛在影響力使得關于它的研究具有相當?shù)木o迫性和必要性。
(一)國外文獻綜述
國外研究者用“機器人新聞”(robotic journalism)、“機器寫的新聞”(machine-written news)、“自動內容”(automated content)、“自動新聞”(automated journalism)等名稱來指代本文所稱“機器新聞寫作”技術,稱呼方式多元,但所指內核基本一致,強調“基于數(shù)據(jù)”、“自然語言生成”、“沒有人工干預”等要素。
部分研究者籠統(tǒng)將機器新聞寫作歸入計算機新聞(computational journalism),將其視作計算機新聞的新發(fā)展,探討計算機新聞對傳統(tǒng)新聞工作流程、稿件生產、記者職責、新聞導向等方面產生的影響,僅在過程中順帶提及機器新聞寫作這一現(xiàn)象,但并沒有把它作為獨立研究對象展開分析。其中,Terry Flew、Christina Spurgeon、Anna Daniel和Adam Swift(2011)認為,計算機新聞技術能充分挖掘并解釋數(shù)據(jù),不會遺漏任何數(shù)據(jù)和數(shù)據(jù)背后潛在的新聞價值,使得原創(chuàng)性調查報道不僅生動,并且有意義。此外,還能增加調查報道與讀者的互動方式,有利于維系現(xiàn)有讀者并吸引更多讀者。然而,Joakim Karlsen和Eirik Stavelin(2012)在對挪威6家最大的媒體進行深度采訪后,得出了相反的結論。他們認為計算機新聞雖然在工具以及所需的相應技能上與傳統(tǒng)新聞不同,但新聞價值和目標仍然一致。盡管計算機新聞讓數(shù)據(jù)被更充分的利用,但通過研究,他們并未發(fā)現(xiàn)計算機新聞提升新聞業(yè)效率的證據(jù),也不認為計算機新聞會在低水平的技術工作環(huán)節(jié)替代記者?!八惴ā保╝lgorithm)是計算機新聞的關鍵,Philip M.Napoli (2013)將算法概念化,視作融合了人力和技術的媒介機構,運用體制理論(institutional theory)對算法在媒介消費和媒介生產方面起到的作用進行分析,認為算法的作用機制與媒介運行機制存在多處平行,算法已經入侵很多學界認為傳統(tǒng)媒體特有的功能,如“把關人”、內容決策、內容生產。
以“機器新聞寫作”為研究對象的論文并不多。Matt Carlson (2014)延續(xù)了計算機新聞的主流研究思路,探究新聞內容自動生產對新聞實踐的影響,他還進一步分析了其如
何影響人們對新聞的理解。Arjen van Dalen (2012)關注機器人新聞寫作對記者自我認知的沖擊,研究這種新技術的采納如何迫使傳統(tǒng)記者重新審視自身技能。
上述研究都將關注點放在機器新聞寫作技術和新聞實踐之間的關系和互動上,而2014年發(fā)表的另外兩篇論文則采用問卷調查的方式從讀者角度研究機器寫作的新聞文本的質量。Hille van der Kaa 和Emiel Krahmer(2014年)側重于比較記者讀者和普通讀者對機器新聞寫作的文稿看法、評價差異;Christer Clerwall(2014年)以學生為調查對象發(fā)放了問卷,研究讀者是否能分辨機器新聞稿和人工新聞稿,以及他們如何看待機器稿件的質量。
Patricia McCartney(2015年)的《機器新聞與護理》一文簡單介紹了機器新聞寫作的原理及當前應用,探討了其優(yōu)勢和不足,最后提出了自己的猜想:機器人寫作技術或可應用于醫(yī)學診斷,為病患開具診斷書。
(二)國內文獻綜述
國內關于機器新聞寫作的探討主要分為兩類。第一類內容覆蓋面廣,從機器新聞寫作的算法、工作原理,到發(fā)展歷史、現(xiàn)狀、可能帶來的影響幾個方面來介紹機器新聞寫作(金兼斌,2014;張鋈,2014;黃可,2015)。第二類是從某個角度切入,談機器人記者的應用(魯燁,2015;鮑廣仁,2015)、對新聞業(yè)的影響(郭佳,2014;曹素妨,2015;李旭,2015)、對新聞教育的影響(韓立新,2015)以及機器人新聞寫作的未來(曹素妨,2015)。
這些探討還停留在淺顯的談論層面,尚未進入嚴謹?shù)膶W術論證階段。因此,關于機器新聞寫作的研究還有待深入。
參考文獻:
[1] 金兼斌.機器新聞寫作:一場正在發(fā)生的革命[J].新聞與寫作,2014(9):112.
[2] 郭娟,宋頌.“機器攜手”的著作權問題研究——以機器人代寫新聞為例[J].寧德師范學院學報(哲學社會科學版),2015(2):124.
中圖分類號:G212.2
文獻標志碼:A
文章編號:1674-8883(2016)03-0046-01