蔣枝宏(武漢大學(xué) 新聞與傳播學(xué)院,湖北 武漢 430072)
?
傳媒顛覆者:機器新聞寫作
蔣枝宏
(武漢大學(xué) 新聞與傳播學(xué)院,湖北 武漢 430072)
摘 要:隨著人工智能技術(shù)在各生產(chǎn)、生活領(lǐng)域的普及,新聞業(yè)終于迎來了機器寫作這一顛覆性寫作方式。本文梳理了機器新聞寫作的發(fā)展歷程以及國內(nèi)外關(guān)于機器新聞寫作的研究成果,以期為未來的機器新聞寫作研究提供有益借鑒。
關(guān)鍵詞:機器新聞寫作;人工智能;應(yīng)用;初級階段
所謂“機器寫作”,又稱“機器人寫作”,是指自動根據(jù)算法將目標(biāo)數(shù)據(jù)通過自然語言生成的方式輸出文章的一種人工智能技術(shù),核心在于自然語言生成。“機器新聞寫作”則指用這種技術(shù)進行新聞寫作,是人工智能學(xué)科在新聞領(lǐng)域的應(yīng)用。最近20年,諸如戰(zhàn)勝國際象棋大師的機器人“深藍(lán)”、掃地機器人、面部識別、無人駕駛等我們熟悉的科技都是人工智能的研究成果,而機器人新聞寫作也屬于這一系列成果之一。
基于模板的文本生成算法研究始于20世紀(jì)90年代(Buseman & Horacek,1998;Theune,Klabbers,Odijk,De Pijper,& Krahmer,2001),但商業(yè)化應(yīng)用卻是近幾年才出現(xiàn)的。2010年,美國的Automated Insights公司和Narrative Science公司分別將其研發(fā)的自然語言生成Wordsmith和Quill投放市場。兩家公司均稱其旗下自然語言生成平臺與此前的平臺不同,不是單純將數(shù)據(jù)填入模板,而是根據(jù)特定傳播目標(biāo)進行個性化寫作。Narrative Science將Quill的文本生成過程概括為:第一,收錄數(shù)據(jù)。第二,計算該數(shù)據(jù)具有新聞價值的各方面。第三,識別相關(guān)角度并對其進行優(yōu)先處理。第四,將數(shù)據(jù)顯示的角度與文章觀點相連。第五,輸出文本。
由于機器新聞寫作速度快、產(chǎn)量大、成本低,從2010年春季開始,美國十大電視網(wǎng)已經(jīng)開始采用Narrative Science的軟件進行體育比賽簡要報道。在2009~2010年賽季,該軟件撰寫的報道占足球賽事報道的40%(劉霞,2011)。2014年3月18日,美國加州發(fā)生4.4級地震,《洛杉磯時報》依賴自主研發(fā)的地震新聞自動生成系統(tǒng)Quakebot,僅用3分鐘就完成了新聞的生成并發(fā)表在《洛杉磯時報》網(wǎng)站上,引發(fā)了其他媒體的關(guān)注。同年7月,美聯(lián)社宣布與Automated Insights公司合作,采用機器進行企業(yè)的財報報道。此外,雅虎、福布斯網(wǎng)也已采用機器人進行特定種類的新聞寫作。
值得注意的是,機器新聞寫作仍處于初級階段,主要被用于財經(jīng)、體育領(lǐng)域的新聞報道,因為這兩類新聞需要進行大量的數(shù)據(jù)處理和闡釋。而在地質(zhì)、氣象、健康領(lǐng)域,機器新聞寫作也具有較大潛力。
國內(nèi)大眾開始關(guān)注“機器新聞寫作”主要源于騰訊財經(jīng)的一篇報道。2015年9月10日,一則名為《8月CPI同比上漲2.0% 創(chuàng)12個月新高》的文章文末注明:“本文來源:Dreamwriter,騰訊財經(jīng)開發(fā)的自動化新聞寫作機器人?!边@篇機器人寫作的新聞稿引發(fā)了社交媒體大量轉(zhuǎn)載和討論。
10月14日,騰訊財經(jīng)再次發(fā)布機器新聞稿件。這一次,不但與國家統(tǒng)計局的消息公布零時差,同時推出了“常規(guī)版”、“研判版”、“民生版”3個版本。3篇文章文風(fēng)各異,針對不同目標(biāo)用戶個性化需求。此次升級顯示出騰訊企圖打造能夠出產(chǎn)個性化、語言生動的寫作機器人的野心。
機器新聞寫作是新聞生產(chǎn)自動化的全新發(fā)展階段。從2001年谷歌新聞實現(xiàn)機器自動選編,到如今各大新聞網(wǎng)站根據(jù)用戶愛好、瀏覽習(xí)慣推薦新聞,聚合生成新聞網(wǎng)頁以及微博自動抓取新聞熱點、設(shè)置熱搜詞,都是新聞生產(chǎn)自動化的表現(xiàn)。但這些都還停留在編輯階段,并不涉及內(nèi)容的原創(chuàng)性生產(chǎn)。而寫稿機器人的出現(xiàn)極大地挑戰(zhàn)著“寫稿是人類特有智力成果”的信念,因而一時之間“記者面臨失業(yè)”的言論不絕于耳。
美聯(lián)社負(fù)責(zé)人表示,采用機器人寫作企業(yè)財報報道后,季度產(chǎn)量由原先的300余篇變?yōu)?000余篇,且單篇文稿生產(chǎn)時間只需要幾分鐘,機器人的生產(chǎn)力可見一斑。與此同時,機器人的快速更新?lián)Q代、深度學(xué)習(xí)能力不斷增強也讓傳統(tǒng)記者倍感壓力。Narrative Science原創(chuàng)人之一甚至聲稱未來15年,機器人寫作稿件將占據(jù)90%的市場份額。
無論是作為記者的補充和輔助,亦或直接取代記者進行特定類型稿件的生產(chǎn),機器新聞寫作的潛在影響力使得關(guān)于它的研究具有相當(dāng)?shù)木o迫性和必要性。
(一)國外文獻綜述
國外研究者用“機器人新聞”(robotic journalism)、“機器寫的新聞”(machine-written news)、“自動內(nèi)容”(automated content)、“自動新聞”(automated journalism)等名稱來指代本文所稱“機器新聞寫作”技術(shù),稱呼方式多元,但所指內(nèi)核基本一致,強調(diào)“基于數(shù)據(jù)”、“自然語言生成”、“沒有人工干預(yù)”等要素。
部分研究者籠統(tǒng)將機器新聞寫作歸入計算機新聞(computational journalism),將其視作計算機新聞的新發(fā)展,探討計算機新聞對傳統(tǒng)新聞工作流程、稿件生產(chǎn)、記者職責(zé)、新聞導(dǎo)向等方面產(chǎn)生的影響,僅在過程中順帶提及機器新聞寫作這一現(xiàn)象,但并沒有把它作為獨立研究對象展開分析。其中,Terry Flew、Christina Spurgeon、Anna Daniel和Adam Swift(2011)認(rèn)為,計算機新聞技術(shù)能充分挖掘并解釋數(shù)據(jù),不會遺漏任何數(shù)據(jù)和數(shù)據(jù)背后潛在的新聞價值,使得原創(chuàng)性調(diào)查報道不僅生動,并且有意義。此外,還能增加調(diào)查報道與讀者的互動方式,有利于維系現(xiàn)有讀者并吸引更多讀者。然而,Joakim Karlsen和Eirik Stavelin(2012)在對挪威6家最大的媒體進行深度采訪后,得出了相反的結(jié)論。他們認(rèn)為計算機新聞雖然在工具以及所需的相應(yīng)技能上與傳統(tǒng)新聞不同,但新聞價值和目標(biāo)仍然一致。盡管計算機新聞讓數(shù)據(jù)被更充分的利用,但通過研究,他們并未發(fā)現(xiàn)計算機新聞提升新聞業(yè)效率的證據(jù),也不認(rèn)為計算機新聞會在低水平的技術(shù)工作環(huán)節(jié)替代記者?!八惴ā保╝lgorithm)是計算機新聞的關(guān)鍵,Philip M.Napoli (2013)將算法概念化,視作融合了人力和技術(shù)的媒介機構(gòu),運用體制理論(institutional theory)對算法在媒介消費和媒介生產(chǎn)方面起到的作用進行分析,認(rèn)為算法的作用機制與媒介運行機制存在多處平行,算法已經(jīng)入侵很多學(xué)界認(rèn)為傳統(tǒng)媒體特有的功能,如“把關(guān)人”、內(nèi)容決策、內(nèi)容生產(chǎn)。
以“機器新聞寫作”為研究對象的論文并不多。Matt Carlson (2014)延續(xù)了計算機新聞的主流研究思路,探究新聞內(nèi)容自動生產(chǎn)對新聞實踐的影響,他還進一步分析了其如
何影響人們對新聞的理解。Arjen van Dalen (2012)關(guān)注機器人新聞寫作對記者自我認(rèn)知的沖擊,研究這種新技術(shù)的采納如何迫使傳統(tǒng)記者重新審視自身技能。
上述研究都將關(guān)注點放在機器新聞寫作技術(shù)和新聞實踐之間的關(guān)系和互動上,而2014年發(fā)表的另外兩篇論文則采用問卷調(diào)查的方式從讀者角度研究機器寫作的新聞文本的質(zhì)量。Hille van der Kaa 和Emiel Krahmer(2014年)側(cè)重于比較記者讀者和普通讀者對機器新聞寫作的文稿看法、評價差異;Christer Clerwall(2014年)以學(xué)生為調(diào)查對象發(fā)放了問卷,研究讀者是否能分辨機器新聞稿和人工新聞稿,以及他們?nèi)绾慰创龣C器稿件的質(zhì)量。
Patricia McCartney(2015年)的《機器新聞與護理》一文簡單介紹了機器新聞寫作的原理及當(dāng)前應(yīng)用,探討了其優(yōu)勢和不足,最后提出了自己的猜想:機器人寫作技術(shù)或可應(yīng)用于醫(yī)學(xué)診斷,為病患開具診斷書。
(二)國內(nèi)文獻綜述
國內(nèi)關(guān)于機器新聞寫作的探討主要分為兩類。第一類內(nèi)容覆蓋面廣,從機器新聞寫作的算法、工作原理,到發(fā)展歷史、現(xiàn)狀、可能帶來的影響幾個方面來介紹機器新聞寫作(金兼斌,2014;張鋈,2014;黃可,2015)。第二類是從某個角度切入,談機器人記者的應(yīng)用(魯燁,2015;鮑廣仁,2015)、對新聞業(yè)的影響(郭佳,2014;曹素妨,2015;李旭,2015)、對新聞教育的影響(韓立新,2015)以及機器人新聞寫作的未來(曹素妨,2015)。
這些探討還停留在淺顯的談?wù)搶用?,尚未進入嚴(yán)謹(jǐn)?shù)膶W(xué)術(shù)論證階段。因此,關(guān)于機器新聞寫作的研究還有待深入。
參考文獻:
[1] 金兼斌.機器新聞寫作:一場正在發(fā)生的革命[J].新聞與寫作,2014(9):112.
[2] 郭娟,宋頌.“機器攜手”的著作權(quán)問題研究——以機器人代寫新聞為例[J].寧德師范學(xué)院學(xué)報(哲學(xué)社會科學(xué)版),2015(2):124.
中圖分類號:G212.2
文獻標(biāo)志碼:A
文章編號:1674-8883(2016)03-0046-01