文/成 怡
大數(shù)據(jù)時(shí)代,人們利用電子計(jì)算機(jī)的超級(jí)數(shù)據(jù)處理功能,從海量數(shù)據(jù)中尋找規(guī)律、獲得結(jié)論,從而為現(xiàn)今的工作提供有益的參考以及創(chuàng)新的動(dòng)力。人們生產(chǎn)數(shù)據(jù)、分享數(shù)據(jù)、再?gòu)臄?shù)據(jù)中獲利,生產(chǎn)量越大,分享面越寬,獲利者就相應(yīng)越多,獲利越豐厚,這就是數(shù)據(jù)紅利。產(chǎn)生數(shù)據(jù)紅利的基本條件有三:一是客觀上要有人類各個(gè)領(lǐng)域積累的云數(shù)據(jù)的存在;二是需要電子計(jì)算機(jī)的處理;三是要建立信息整理、信息服務(wù)的平臺(tái)。滿足以上基本條件,數(shù)據(jù)紅利作為推手可以衍生出無(wú)數(shù)創(chuàng)新產(chǎn)品。在數(shù)據(jù)紅利時(shí)代,各種建立在海量數(shù)據(jù)基礎(chǔ)上的智能操作,可以快速精確計(jì)算,大量節(jié)省甚至代替人力。
智能寫(xiě)作可以說(shuō)是數(shù)據(jù)紅利時(shí)代的一個(gè)鮮明個(gè)例。智能寫(xiě)作,也稱為機(jī)器人寫(xiě)作、自動(dòng)寫(xiě)作,是通過(guò)數(shù)據(jù)統(tǒng)計(jì)及深度學(xué)習(xí)等原理及方法進(jìn)行文字整理及創(chuàng)作工作,一定程度上可被視為通過(guò)智能服務(wù)介入人類的文字交流與互動(dòng)。與人工寫(xiě)作不同的是,智能寫(xiě)作不具備也不需要人腦天馬行空的想象力,其借助和利用大數(shù)據(jù)來(lái)彌補(bǔ)自身想象力的缺陷。只要數(shù)據(jù)存在,其于數(shù)據(jù)中整理、提煉的速度和準(zhǔn)確率大大超出人們的想象。
隨著人工智能技術(shù)的發(fā)展,智能寫(xiě)作在很短的時(shí)間里呈現(xiàn)了快速而穩(wěn)健的成長(zhǎng)。其發(fā)展歷史雖短卻迅猛。2009年,由美國(guó)西北大學(xué)智能信息實(shí)驗(yàn)室的學(xué)生和研究人員創(chuàng)建的寫(xiě)作軟件“StatsMonkey”寫(xiě)作了一篇體育報(bào)道,這篇報(bào)道被認(rèn)為是機(jī)器人新聞寫(xiě)作的開(kāi)山之作。2010年,西北大學(xué)的技術(shù)團(tuán)隊(duì)成立了自動(dòng)寫(xiě)作技術(shù)公司Narrative Science,并推出了更為強(qiáng)大的人工智能引擎“鵝毛筆”(Quill)。2 0 1 4年6月,美聯(lián)社開(kāi)始利用Automated Insights公司的軟件自動(dòng)生成稿件。2016年3月14日,韓國(guó)的一名人工智能記者在一家金融新聞編輯部正式上崗,僅用0.3秒就完成了一篇股市行情的新聞報(bào)道。2016年3月末,人工智能寫(xiě)出的小說(shuō)在日本入圍大獎(jiǎng)賽。
在我國(guó),2015年9月,騰訊財(cái)經(jīng)頻道率先推出智能新聞寫(xiě)作機(jī)器人“Dreamwriter”,發(fā)表簡(jiǎn)單的財(cái)經(jīng)新聞;同年11月,新華社的寫(xiě)稿機(jī)器人“快筆小新”面世,撰寫(xiě)關(guān)于體育賽事的中英文稿件和財(cái)經(jīng)信息稿件。2017年12月,在中央電視臺(tái)電視節(jié)目《機(jī)智過(guò)人》中,清華大學(xué)自然語(yǔ)言處理與社會(huì)人文計(jì)算實(shí)驗(yàn)室出品的會(huì)寫(xiě)詩(shī)的機(jī)器人“九歌”戰(zhàn)勝了陳更等3人詩(shī)歌團(tuán)隊(duì)。
以比特介質(zhì)完成的智能寫(xiě)作與以人腦介質(zhì)完成的人工寫(xiě)作相比較呈現(xiàn)了三個(gè)主要特征:強(qiáng)大的數(shù)據(jù)處理能力、強(qiáng)大的深度學(xué)習(xí)能力和強(qiáng)大的智能語(yǔ)言處理能力。
從截至目前出品的這些智能寫(xiě)作產(chǎn)品來(lái)看,智能寫(xiě)作涉獵的成熟的新聞產(chǎn)品以體育類、財(cái)經(jīng)類為主。在這些類別的新聞寫(xiě)作中,需要從大量的數(shù)據(jù)素材中提取并整理信息。體育賽事在有限的賽季中在不斷更新、比較和整理賽事數(shù)據(jù),賽事結(jié)果都在數(shù)據(jù)中體現(xiàn),賽事過(guò)程體現(xiàn)為數(shù)據(jù)的變化過(guò)程。而財(cái)經(jīng)類報(bào)道對(duì)數(shù)據(jù)的依賴上也和體育賽事報(bào)道呈現(xiàn)出同樣的特征。這體現(xiàn)了智能寫(xiě)作的最主要的特征:強(qiáng)大的數(shù)據(jù)處理能力。
而智能寫(xiě)作起初最不被看好的一面則隨其對(duì)文學(xué)創(chuàng)作的參與而被重新審視。智能寫(xiě)作內(nèi)容的“非人格化”“機(jī)械化”“表達(dá)局限”等曾被認(rèn)為是其主要短板。然而當(dāng)機(jī)器人“九歌”通過(guò)“圖靈測(cè)試”,所做的詩(shī)歌無(wú)懈可擊地騙過(guò)了詩(shī)詞專家的雙眼,打敗了國(guó)內(nèi)詩(shī)歌高手的時(shí)候,人們發(fā)現(xiàn)智能寫(xiě)作并非不能涉獵情感類、個(gè)性化主題。而最近關(guān)于晉江文學(xué)網(wǎng)站發(fā)現(xiàn)有作者使用自動(dòng)寫(xiě)稿軟件發(fā)表文學(xué)作品的作弊事件也證明了智能寫(xiě)作進(jìn)行文學(xué)創(chuàng)作幾乎可以以假亂真??梢?jiàn)智能寫(xiě)作的發(fā)展完全可以突破人類對(duì)它的刻板化印象——這又恰恰體現(xiàn)了智能寫(xiě)作的另外一個(gè)重要特征:強(qiáng)大的深度學(xué)習(xí)能力。
人工智能的數(shù)據(jù)處理能力和深度學(xué)習(xí)能力在“阿爾法狗”的運(yùn)行原理中可窺一斑。2017年5月,在中國(guó)烏鎮(zhèn)圍棋峰會(huì)上,由谷歌(Google)旗下DeepMind公司戴密斯·哈薩比斯領(lǐng)銜的團(tuán)隊(duì)開(kāi)發(fā)的人工智能“阿爾法狗”(AlphaGo)與排名世界第一的圍棋冠軍柯潔對(duì)戰(zhàn),以3∶0的總比分獲勝。阿爾法狗的工作原理主要就是“數(shù)據(jù)統(tǒng)計(jì)+深度學(xué)習(xí)”。第一代“阿爾法狗”的學(xué)習(xí)方法是通過(guò)數(shù)據(jù)統(tǒng)計(jì)的方法在結(jié)合了數(shù)百萬(wàn)人類圍棋專家的棋譜基礎(chǔ)上,加之強(qiáng)化學(xué)習(xí)和監(jiān)督學(xué)習(xí)而來(lái)。而“阿爾法狗”的升級(jí)版AlphaGoZero的學(xué)習(xí)方法則摒棄了人類數(shù)據(jù),它從一開(kāi)始就沒(méi)有接觸過(guò)人類棋譜,研發(fā)團(tuán)隊(duì)只是讓它自由隨意地在棋盤上下棋,然后進(jìn)行自我博弈。無(wú)論是在短時(shí)間掌握所有大數(shù)據(jù),還是發(fā)揮計(jì)算機(jī)本身超級(jí)計(jì)算的特長(zhǎng),人類的大腦都無(wú)法在這些方面與人工智能相匹敵。
智能寫(xiě)作的數(shù)據(jù)處理能力和深度學(xué)習(xí)能力還融合在以NLP(Natural Language Processing,自然語(yǔ)言處理)為代表的系統(tǒng)算法上,更發(fā)揮了智能寫(xiě)作與其他人工智能在語(yǔ)言溝通領(lǐng)域的優(yōu)勢(shì)。這可以成為智能寫(xiě)作的第三個(gè)特征:強(qiáng)大的智能語(yǔ)言處理能力。NLP,它研究能實(shí)現(xiàn)人與計(jì)算機(jī)之間用自然語(yǔ)言進(jìn)行有效通信的各種理論和方法,是計(jì)算機(jī)科學(xué)、人工智能、語(yǔ)言學(xué)和人類(自然)語(yǔ)言之間相互作用的領(lǐng)域。NLP的發(fā)展經(jīng)歷了從理性主義到經(jīng)驗(yàn)主義的過(guò)渡,越來(lái)越多地通過(guò)機(jī)器學(xué)習(xí)來(lái)獲取知識(shí),越來(lái)越重視統(tǒng)計(jì)方法,出現(xiàn)了強(qiáng)烈的“詞匯主義”傾向。隨著NLP及其他智能語(yǔ)言處理技術(shù)的逐漸升級(jí)與進(jìn)步,智能寫(xiě)作以及其他形式的人機(jī)溝通將越來(lái)越趨向于完美,更接近于人類思維。
從目前的發(fā)展來(lái)看,智能寫(xiě)作產(chǎn)品種類從記者到詩(shī)人再到小說(shuō)家,雖然都是同樣以文字處理為主業(yè),然則它們被社會(huì)認(rèn)可的程度卻大為不同。智能寫(xiě)作種類可以分為:已經(jīng)合法執(zhí)業(yè)的智能記者;尚不能合法寫(xiě)作的智能文學(xué)作者;尚有發(fā)展空間的其他形式智能文字處理體系,如智能公文處理體系、網(wǎng)站智能客服等。
智能記者與智能文學(xué)作者雖然都以碼字為生,但它們的境遇卻截然相反。智能記者的寫(xiě)作可以代替人工新聞寫(xiě)作中程式化及數(shù)據(jù)整合的部分為其最大的優(yōu)勢(shì)。和文學(xué)寫(xiě)作不同的是,智能新聞寫(xiě)作一開(kāi)始就并無(wú)多少爭(zhēng)議地合法化了。而智能文學(xué)寫(xiě)作面臨的問(wèn)題就復(fù)雜得多。
首先,二者在時(shí)效性上的不同以及歸屬的不同,決定了如版權(quán)、剽竊等一系列后續(xù)問(wèn)題的不同。智能記者一般是由新聞單位使用,是納入在一個(gè)組織管理系統(tǒng)中,用于為某新聞組織通過(guò)合法方式撰寫(xiě)新聞稿件。而新聞稿件的時(shí)效性要求很高,新聞稿件必須第一時(shí)間刊發(fā)才有新聞價(jià)值,也正因?yàn)樾侣劯寮臅r(shí)效性,其失去新聞吸引力并不斷被新的新聞更替的速度也很快。另外,因?yàn)槟壳案鞔笮侣剻C(jī)構(gòu)還未大批量地使用人工智能進(jìn)行新聞寫(xiě)作,針對(duì)同一新聞事件進(jìn)行寫(xiě)作的雷同率也不高,出現(xiàn)知識(shí)產(chǎn)權(quán)爭(zhēng)議問(wèn)題的幾率尚低。
文學(xué)寫(xiě)作的私人化特點(diǎn)就比較強(qiáng)調(diào)沒(méi)有組織的管理,也沒(méi)有時(shí)效性的限制。人工智能通過(guò)學(xué)習(xí)人類的文學(xué)創(chuàng)作進(jìn)行新的創(chuàng)作時(shí),會(huì)使用到人類作品中的創(chuàng)意、構(gòu)思,甚或一個(gè)句子、一個(gè)詞,乃至是原創(chuàng)中的姓名等信息。這種情況和新聞寫(xiě)作中大量地使用事件信息中的數(shù)據(jù)是不同的。如果大量地學(xué)習(xí)或模仿他人的創(chuàng)意并將其構(gòu)思在一個(gè)文學(xué)創(chuàng)作中則會(huì)受到剽竊的質(zhì)疑。
其次,二者寫(xiě)作目的的不同,決定了智能寫(xiě)作在兩個(gè)領(lǐng)域中的價(jià)值不同。新聞寫(xiě)作的目的是第一時(shí)間傳播信息。智能新聞寫(xiě)作可以非??焖俚卣蠑?shù)據(jù)信息,且在數(shù)據(jù)處理的正確率上占有絕對(duì)優(yōu)勢(shì),這個(gè)優(yōu)勢(shì)對(duì)于新聞業(yè)來(lái)說(shuō)是極具吸引力的。而文學(xué)創(chuàng)作的目的則主要是為了滿足人們情感的需要。單純辭藻的堆砌或許并沒(méi)有“那年那時(shí)那地”更能勾起人類的情感記憶。除非是為了某種特定的利益,否則寫(xiě)出自己對(duì)世界獨(dú)特的認(rèn)知和情感才是作家的創(chuàng)作目的。機(jī)器進(jìn)行文學(xué)創(chuàng)作,目前除了嘩眾取寵地引起驚嘆(如寫(xiě)詩(shī)機(jī)器人“九歌”),就是幫助他人漁利(如充斥于網(wǎng)絡(luò)的自動(dòng)寫(xiě)作軟件)。
除了高大上的智能記者、智能詩(shī)人,其實(shí)智能寫(xiě)作早已在民間網(wǎng)絡(luò)經(jīng)濟(jì)發(fā)展中悄然開(kāi)始。出于實(shí)際需要的網(wǎng)站智能客服目前仍主要以文本服務(wù)為主,同時(shí)兼容語(yǔ)音服務(wù)以及超鏈接服務(wù)的發(fā)展。網(wǎng)站語(yǔ)音客服也仍然以文本為基礎(chǔ)。這種文本的創(chuàng)作雖然仍處于固定預(yù)設(shè)的初級(jí)文本創(chuàng)作階段,但已經(jīng)萌發(fā)智能化查詢和智能解答的創(chuàng)作。這種創(chuàng)作操作簡(jiǎn)單,不像智能記者和智能詩(shī)人或是智能棋手那樣因?yàn)榧夹g(shù)尖端而顯得高深莫測(cè),其開(kāi)發(fā)成本也相對(duì)較低而能得到行業(yè)普及。由于實(shí)際經(jīng)濟(jì)發(fā)展的需求,以低廉成本代替繁忙的人工網(wǎng)站客服將使其前景可觀。
智能公文寫(xiě)作如果建立在現(xiàn)有的電子公文管理體系基礎(chǔ)之上,也是有其極為明朗的發(fā)展前景的。公文寫(xiě)作的程式化特點(diǎn),使其具有非常大的智能化操作空間。電子公文業(yè)已發(fā)展為成熟體系,并已被使用在各行各業(yè)的實(shí)際公文管理體系。但電子公文只是使用了電子介質(zhì)用于公文保存和傳遞,只有將自動(dòng)寫(xiě)作系統(tǒng)納入公文寫(xiě)作才能被視作智能公文寫(xiě)作或智能公文管理。目前的電子公文生成系統(tǒng)只是參與了公文寫(xiě)作的格式部分,尚未代替人腦對(duì)公文內(nèi)容的撰制。但其有望升級(jí)為由人工智能參與到文本內(nèi)容寫(xiě)作以及格式,甚至還包括外圍的公文保存、傳遞及查閱等一系列完整體系中去。
智能公文寫(xiě)作在未來(lái)將會(huì)有更大的、暢通無(wú)阻的發(fā)展空間。而曾經(jīng)以文字處理為主的網(wǎng)站智能客服在未來(lái)則有望擺脫智能寫(xiě)作的單一局限,而發(fā)展為全方位的人機(jī)溝通智能小秘書(shū)。
在版權(quán)、抄襲等敏感問(wèn)題得到解決之前,智能寫(xiě)作應(yīng)該首先活躍于那些程式化的、枯燥的、會(huì)消耗大量人工精力的寫(xiě)作領(lǐng)域。準(zhǔn)確、快速的智能寫(xiě)作將成為幫助人類從枯燥無(wú)趣卻又耗時(shí)費(fèi)力的寫(xiě)作中解脫出來(lái)的好助手。優(yōu)秀創(chuàng)意的誕生仍將依賴人腦,并非機(jī)器就不可能產(chǎn)生創(chuàng)意,只因創(chuàng)意的鑒定最終還是依賴人類的標(biāo)準(zhǔn)和人腦的選擇。機(jī)器可以從浩瀚的文字中組合出有趣的創(chuàng)意,但能否被肯定并使用仍然由人腦來(lái)決定。說(shuō)回版權(quán)問(wèn)題,如果有朝一日人工智能的創(chuàng)作出于效益的考慮大部分代替了人類的創(chuàng)作,而與人類的欣賞并無(wú)違和,則版權(quán)就不再有存在的意義。如若取消版權(quán),則機(jī)器替代人類進(jìn)行創(chuàng)作的動(dòng)力又將何在?文學(xué)和藝術(shù)的創(chuàng)作需要滿足雙重的興趣需求,一個(gè)在讀者那里,一個(gè)在作者那里。作為讀者,人類會(huì)去欣賞來(lái)自機(jī)器的創(chuàng)作。但作為作者,人類不會(huì)由于機(jī)器可以創(chuàng)作就不再產(chǎn)生創(chuàng)作的欲望。