◎陳雄濤
隨著芯片工藝和計(jì)算機(jī)軟件的發(fā)展,計(jì)算作為一種工具增強(qiáng)了我們處理數(shù)據(jù)的能力。當(dāng)我們在處理大量文檔時(shí),標(biāo)準(zhǔn)的新聞處理方式已經(jīng)發(fā)生了很多變化。 通過機(jī)器學(xué)習(xí),我們可以以一種機(jī)械的方式閱讀成千上萬的文檔。幾十年前,如果沒有很多人的努力,如此大規(guī)模的“閱讀”是不可能的。 現(xiàn)在,機(jī)器學(xué)習(xí),或更確切地說是自然語言處理,不再需要將數(shù)據(jù)逐行逐字地輸入文本,而是幫助我們創(chuàng)建文本摘要或?qū)⑺鼈兎譃榫哂泄餐卣鞯娜舾深?。通過計(jì)算技術(shù),我們增強(qiáng)了“讀取”成千上萬個(gè)文檔的能力。 但是,這些新功能必然會(huì)改變我們對文檔集合以及從文檔中獲取知識(shí)的看法。也就是說,我們的能力得到增強(qiáng),但我們對同一事物的觀點(diǎn)也會(huì)改變。與文本源一樣,數(shù)字圖像,音頻和視頻也都可以以數(shù)字的方式進(jìn)行計(jì)算了。 同樣,這些計(jì)算能力也改變了我們的觀點(diǎn)。 然而,我們需要注意的是某些現(xiàn)象會(huì)因?yàn)槲覀兊募夹g(shù)改進(jìn)而被忽略。
從目前的發(fā)展形勢來看,每個(gè)新聞編輯室都有一套獨(dú)立的AI工具使用方式。一個(gè)明顯的問題是我們應(yīng)該如何更好地將這些工具帶入新聞編輯室。有學(xué)者指出,在新聞編輯室中,AI技術(shù)可以在以下三類活動(dòng)中提供一些幫助:
1.在大規(guī)模數(shù)據(jù)中找出關(guān)鍵信息:在那些由于數(shù)據(jù)的規(guī)模或高復(fù)雜性而可能使人類無法勝任的特殊工作條件下,AI技術(shù)可以成為突破性的工具。 這個(gè)角色非常適合標(biāo)準(zhǔn)的新聞編輯室流程,因?yàn)榧词笰I技術(shù)發(fā)現(xiàn)了人眼看不到的情況,也可以通過標(biāo)準(zhǔn)的人類調(diào)查技術(shù)對這種發(fā)現(xiàn)進(jìn)行核查。
2.識(shí)別趨勢:AI技術(shù)的強(qiáng)大計(jì)算能力可以幫助描述數(shù)據(jù)集合的特征,這些特征可以按時(shí)間,地理位置或人口統(tǒng)計(jì)學(xué)進(jìn)行分組。 與此同時(shí),它也可以快速識(shí)別異常數(shù)據(jù)。
3.將AI技術(shù)或計(jì)算的應(yīng)用作為故事本身的課題進(jìn)行研究:由于它們是人為構(gòu)建的,因此算法存在人為偏差。通過研究它們,我們可以發(fā)現(xiàn)以前看不見的偏差。 因此,我們可以利用AI工具找到一件復(fù)雜事件的真相,并讓我們更好的去了解我們的社區(qū),城市或國家。
將AI技術(shù)整合到新聞編輯中,使得記者有可能成為業(yè)余數(shù)據(jù)科學(xué)家。AI技術(shù)可以通過以下三種方式來增強(qiáng)記者的能力:(1)幫助對文檔進(jìn)行分類和分類;(2)識(shí)別值得仔細(xì)檢查的數(shù)據(jù);(3)在大量數(shù)據(jù)中尋找關(guān)鍵信息。有研究人員指出,AI技術(shù)存在兩種工作模式:一方面是完全的自治,完全沒有人類的參與;另一方面,AI技術(shù)可以與人類協(xié)同一起工作。
盡管有很多AI工具用來撰寫新聞報(bào)道的案例,例如體育賽事總結(jié),企業(yè)收益發(fā)布,甚至是地震等等,但是很少有人會(huì)認(rèn)為新聞工作者的工作有可能被某種AI工具或者算法所完全取代。一些新聞工作者可以花時(shí)間來學(xué)習(xí)他們想要使用的AI工具。 比如可以從網(wǎng)絡(luò)上獲取示例代碼并將其應(yīng)用于事件的報(bào)道,這也會(huì)大大提高記者的工作效率。但是,除非記者對這類工具或技術(shù)相關(guān)的警告有深刻的了解,否則確實(shí)存在新聞不當(dāng)行為的風(fēng)險(xiǎn)。 有時(shí),記者發(fā)現(xiàn)標(biāo)準(zhǔn)的新聞方法可以有效地審核各種AI操作,但有時(shí)卻不行。為了避免其中的某些問題,我們建議記者應(yīng)該與熟悉該工具的研究人員聯(lián)系,雖然行業(yè)專家與實(shí)地記者和編輯之間仍然存在溝通鴻溝。
說起AI技術(shù),就必須談到數(shù)據(jù)。當(dāng)前社會(huì),數(shù)據(jù)的可獲得性不斷提高。大量的數(shù)據(jù),無論是從社交媒體還是政府網(wǎng)站,都會(huì)有辦法查詢到,這使以前一些不可能的報(bào)道成為可能。但這些大量的數(shù)據(jù)會(huì)存在很多陷阱,記者必須謹(jǐn)慎評估這種新型消息來源的可信度,尤其是在涉及AI技術(shù)的地方。 目前許多學(xué)者都強(qiáng)調(diào)了對數(shù)據(jù)的批判性思考。 比如,使用新浪微博作為其首選社交媒體平臺(tái)的記者必須謹(jǐn)慎地依靠它來分析社會(huì)的行為,思想和感受。 盡管新浪微博的開發(fā)人員的工具和數(shù)據(jù)非常易于使用,但記者們不應(yīng)該只關(guān)注它,因?yàn)樵撈脚_(tái)在從事政治和媒體工作的人們中受歡迎的程度過高。另一方面,現(xiàn)在的記者可以更方便的去使用現(xiàn)有的公共數(shù)據(jù)。 但是,有時(shí)最好的新聞報(bào)道是用尚不存在的數(shù)據(jù)完成的,記者可能必須去制作自己的數(shù)據(jù)。為了提高效率,記者應(yīng)該花多長時(shí)間來僅利用手上的有限資源來完成一個(gè)新聞報(bào)道,這是一個(gè)值得思考的問題。
對于AI這種新工具,有研究人員認(rèn)為必須對記者和新聞編輯室開發(fā)人員進(jìn)行培訓(xùn),告訴他們?nèi)绾呜?fù)責(zé)任地使用它們。 這項(xiàng)工作可能需要花費(fèi)很多錢。 對于像《湖北日報(bào)》這樣的大型新聞機(jī)構(gòu)來說,這種投資可能不是問題,但對于資源較少的小型新聞編輯室而言,這將是一個(gè)挑戰(zhàn)。新聞編輯室負(fù)責(zé)人可能面臨的一個(gè)選擇是建立,購買還是與他人合作的方式來使用AI工具。 需要指出的是,使用復(fù)雜的數(shù)據(jù)集和自定義算法進(jìn)行調(diào)查分析可能需要花費(fèi)數(shù)月的時(shí)間才能建立大型團(tuán)隊(duì)。 因此,并非所有新聞機(jī)構(gòu)都能夠自己編寫這些工具。
與學(xué)術(shù)機(jī)構(gòu)和研究人員合作可能是新聞機(jī)構(gòu)開始在其新聞編輯室中使用AI的好方法。 但是新聞編輯室和學(xué)術(shù)實(shí)驗(yàn)室的文化截然不同。 一般來說,學(xué)術(shù)研究人員可能很難很好地理解許多公認(rèn)的新聞道德規(guī)范,對于不了解同行評審研究的道德規(guī)范的新聞工作者也是如此。 這也就需要花費(fèi)時(shí)間來發(fā)展伙伴關(guān)系,以及了解這種伙伴關(guān)系將如何運(yùn)作。
由于AI技術(shù)可以在新聞業(yè)中扮演許多重要的角色,因此需要關(guān)注的是AI技術(shù)在什么時(shí)候、什么地點(diǎn)以及如何使用。一般來說AI技術(shù)的實(shí)現(xiàn)過程對讀者可能不清楚,但是記者應(yīng)該去了解該技術(shù)的實(shí)現(xiàn)過程。以聊天機(jī)器人為例,如果它是被AI技術(shù)所控制,那么它所描繪的故事是否是由一個(gè)算法所編寫出來的?讀者是否需要知道這些故事是如何編寫出來的?當(dāng)涉及到AI技術(shù)時(shí),誰將最終對故事的真實(shí)性或者其引起的錯(cuò)誤負(fù)責(zé)?如何解釋錯(cuò)誤的性質(zhì)是由人類創(chuàng)造的算法造成的?最終該追責(zé)的是人類還是算法?
在學(xué)術(shù)文獻(xiàn)中,作者需要清楚的描述所使用的AI工具是如何去進(jìn)行分析和模式識(shí)別的。但是在新聞業(yè)中,這種描述必須翻譯成非技術(shù)術(shù)語,并以簡明的方式告訴讀者,讓讀者了解人工智能是如何使用的,以及如何做出選擇。一項(xiàng)調(diào)查指出,讀者更希望記者使用清晰、可描述性的術(shù)語,而不是學(xué)術(shù)界的術(shù)語,如“機(jī)器學(xué)習(xí)”或“計(jì)算機(jī)視覺”。
因此,AI技術(shù)的透明度應(yīng)該不僅僅是分享數(shù)據(jù),也需要對算法的透明度提出一定的要求。一般來說,算法對于讀者來說是以黑盒子的形式存在的,無法進(jìn)行簡單的解釋。記者應(yīng)該盡一切努力去描述在算法構(gòu)建時(shí)所做的選擇,并突出顯示可能發(fā)生的任何偏差。事實(shí)上,人類有他們自己的偏好,因此算法在構(gòu)建的過程中也需要對讀者顯示出一定的透明性。有學(xué)者有給出一種解決的方案,即讀者通過調(diào)整AI算法的參數(shù)并觀察這些給結(jié)果所帶來的變化,從而判斷算法對結(jié)果的影響。
新聞學(xué)是一門需要對所有事實(shí)都進(jìn)行核實(shí)的一門學(xué)科,因此,新聞工作者有兩項(xiàng)主要責(zé)任:(1)核實(shí)并以清晰易懂的方式向讀者呈現(xiàn)信息,(2)解釋其有效性。這也就引申出了一個(gè)問題:關(guān)于AI工具的使用是否應(yīng)該有一個(gè)披露標(biāo)準(zhǔn)?比如,在學(xué)術(shù)界,研究論文中有一個(gè)方法論部分,其中有詳細(xì)的研究人員遵循的方案的描述。需要指出的是,AI算法在保險(xiǎn)和醫(yī)療服務(wù)行業(yè)中的應(yīng)用中,很少進(jìn)行獨(dú)立的測試。那么在新聞行業(yè)中,是否需要進(jìn)行這類的測試呢?目前的實(shí)踐證明,AI算法在保險(xiǎn)和醫(yī)療服務(wù)行業(yè)中會(huì)不可避免的存在數(shù)學(xué)偏差。那么即有沒有可能讓新聞界致力于讓這些算法負(fù)責(zé),并開發(fā)出一種系統(tǒng),在算法開發(fā)流程中建立問責(zé)制?
考慮到正在使用的工具,記者需要首先在內(nèi)部積累專業(yè)知識(shí),以便讓人們知道外界有什么,減少對領(lǐng)域?qū)<业囊蕾?,同時(shí)需要知道應(yīng)該向他們提出什么要求。有學(xué)者指出,透明度和可解釋性是有區(qū)別的。透明度將涉及到使基礎(chǔ)數(shù)據(jù)可用,讓人們能夠與之交互,而解釋性不需要透明。
我們對AI工具在新聞工作室中的使用可以得出以下的一些結(jié)論:
1.人工智能工具可以幫助記者完成以前很難在技術(shù)上實(shí)現(xiàn)的新聞報(bào)道。 雖然AI技術(shù)可能會(huì)改變新聞業(yè),但它依然難以取代新聞工作者的工作。
2.設(shè)計(jì)AI的技術(shù)人員與使用AI的記者之間既存在知識(shí)鴻溝又存在溝通鴻溝,這可能會(huì)導(dǎo)致新聞不端行為。
3.讀者應(yīng)該被告知如何使用AI工具來執(zhí)行事件分析和模式識(shí)別。
4.數(shù)據(jù)的規(guī)范化使用和披露(如何收集,存儲(chǔ),使用,分析和共享來自用戶的信息)是記者需要面對的基本問題。
5.AI技術(shù)可以幫助記者獲得更多的數(shù)據(jù),這是好的一面,但是如何保證數(shù)據(jù)的真實(shí)性仍然是一個(gè)挑戰(zhàn)。
基于于上述結(jié)論,我們給出以下建議:
1.對編輯和記者的培訓(xùn)至關(guān)重要。 隨著AI工具進(jìn)入新聞編輯室,記者需要了解如何使用新資源進(jìn)行新聞報(bào)道。
2.關(guān)于數(shù)據(jù)的規(guī)范使用和AI算法的公開披露,新聞工作者和技術(shù)人員之間必須制定一定的準(zhǔn)則并嚴(yán)格的遵守。
3.對于定制的AI技術(shù),新聞編輯室應(yīng)考慮與學(xué)術(shù)機(jī)構(gòu)建立伙伴關(guān)系。