張茜
【摘要】“今日頭條”屬于聚合類新聞客戶端的主要代表之一,“今日頭條”更新的眾多聚合類信息產(chǎn)生使“把關(guān)”模式遇到考驗,傳統(tǒng)的“把關(guān)”模式已經(jīng)不能適應(yīng)聚合類新聞客戶端未來的發(fā)展趨勢,聚合類新聞客戶端飽受考驗。本文重點運用個案分析法,通過對“今日頭條”這個聚合類新聞客戶端的代表之作展開探討,結(jié)合相關(guān)資料,探索聚合類新聞客戶端的信息審核。
【關(guān)鍵詞】今日頭條;信息審核;聚合類新聞客戶端;
中圖分類號:TN94 ? ? ? ? ? ? ? ? ?文獻標(biāo)識碼:A ? ? ? ? ? ? ? ? DOI:10.12246/j.issn.1673-0348.2021.09.056
1. 聚合類新聞客戶端信息審核流程
1.1. 聚合類新聞客戶端的內(nèi)容生產(chǎn)
聚合類客戶端的資訊通過傳統(tǒng)媒體進入平臺當(dāng)中更新信息內(nèi)容與自媒體形成的內(nèi)容兩部分所組成聚合類新聞客戶端各樣的信息資源,其內(nèi)容來源重點包括三方面:UGC(通過用戶輸出信息)、PGC(專業(yè)內(nèi)容輸出)和爬蟲技術(shù)獲得。
針對“今日頭條”展開分析,現(xiàn)階段,今日頭條不單單涵蓋了傳統(tǒng)的社交網(wǎng)站、論壇、新聞用戶網(wǎng)站以及傳統(tǒng)媒體網(wǎng)站等廣泛的內(nèi)容,同時還涵蓋了專業(yè)媒體,其頭條號數(shù)量突破了120萬個,每天都能夠為用戶提供廣泛的新穎內(nèi)容。
作為內(nèi)容分發(fā)平臺,頭條擴展了自己的內(nèi)容資源,豐富了自己的內(nèi)容形式,基于核心技術(shù)的優(yōu)勢構(gòu)建了內(nèi)容產(chǎn)品矩陣,并在新時代為用戶提供了多種內(nèi)容和信息形式需求。此外,隨著信息服務(wù)業(yè)態(tài)的更新,頭條將繼續(xù)連接和重組其自己的內(nèi)容產(chǎn)品平臺。這有效地減少了用戶在不同平臺之間切換的時間成本,并使平臺保持更新。
1.2. 聚合類新聞客戶端的信息審核——以今日頭條為例
在審核機制方面,今日頭條要求非常高,圖文信息的審核方式即是人工+機器,而視頻內(nèi)容都是通過人工模式?,F(xiàn)階段,每天今日頭條更新的內(nèi)容達到了50萬條。在人工審核方面,今日頭條的團隊人數(shù)突破了6000余人,其涵蓋了評論審核、視頻審核、圖文審核等,不單單包括六千人專業(yè)審核團隊,今日頭條還確立了打擊算法模型,專門應(yīng)對低谷低質(zhì)內(nèi)容,其識別的模式包括技術(shù)識別與人工審核。在內(nèi)容安全維護上,“今日頭條”實施了多層復(fù)檢的審核流程,即機器算法與人工編輯。系統(tǒng)算法根據(jù)風(fēng)險內(nèi)容甄別技術(shù)(低俗模型,謾罵模型以及鑒黃模型)以及泛低質(zhì)內(nèi)容甄別技術(shù)(假新聞、內(nèi)容質(zhì)量差、標(biāo)題黨、題文不符、黑稿等)對平臺內(nèi)容展開廣泛初審核,被判斷成劣質(zhì)內(nèi)容再次展開復(fù)審,還沒通過第三次審核的內(nèi)容會直接拋棄淘汰。
1.3. 聚合類新聞客戶端的內(nèi)容推廣與反饋
今日頭條屬于中國聚合類新聞客戶端發(fā)展的先鋒,其成果飽受人們重視,并且備受用戶重視,了解問題最廣泛的也是解決用戶需求方面。今日頭條在相應(yīng)地解決受眾閱讀需求量,同樣也重視反饋信息。在運用環(huán)節(jié)當(dāng)中,用戶碰到的相關(guān)建議或者問題時,都能夠依靠平臺提交,這同樣也是bug意見征集與反饋的渠道之一。
用戶的點贊、轉(zhuǎn)發(fā)、評論以及閱讀行為的運用行為都是通過數(shù)據(jù)的模式被標(biāo)記,并且展開概括與總結(jié)。平臺根據(jù)厚數(shù)據(jù)與大數(shù)據(jù)發(fā)展成用戶畫像,根據(jù)機器算法邏輯,進一步開發(fā)用戶喜歡的領(lǐng)域,展開具體的偏好分類,同時按照各個歸納標(biāo)簽展開內(nèi)容分布。最初算法程序所記載的內(nèi)容并不多,然而伴隨著應(yīng)用的群體變多,標(biāo)記信息也在不斷健全,可以說是機器比用戶還了解用戶,通過數(shù)據(jù)的標(biāo)記,算法新聞產(chǎn)出才能夠往更好的方向前進。
2. 大數(shù)據(jù)算法下信息審核模式的問題
2.1. 產(chǎn)生“過濾氣泡”形成“信息繭房”
算法通過數(shù)據(jù)抓取而形成用戶畫像,基于用戶畫像為用戶推薦相關(guān)內(nèi)容,因此在數(shù)據(jù)的引導(dǎo)之下,算法不斷給用戶提供帶有自己偏好的內(nèi)容,而一定程度上阻止了其他內(nèi)容被發(fā)現(xiàn)。在這種環(huán)境之下,誕生了“過濾氣泡”。大數(shù)據(jù)時代各平臺利用算法通過抓取預(yù)測用戶愛好,大量向用戶推送同質(zhì)化的信息,在滿足用戶興趣的同時,使得用戶在不知不覺間被自己的興趣所束縛,生活在了算法推薦造就的“過濾氣泡”當(dāng)中。
用戶在聚合類新聞客戶端篩選內(nèi)容時,絕非是針對所有內(nèi)容都一一接收,他們會根據(jù)個人本身的需求和意愿對內(nèi)容進行挑選,在信息接收過程有對相關(guān)內(nèi)容所側(cè)重或者產(chǎn)生不同的見解,通過過濾自己不認同或者有悖于自己喜好的信息,使相關(guān)的思維方式、本來的價值體系以及所獲得的信息得以統(tǒng)一,杜絕不和諧感形成。隨著長時間的積累,用戶通過選擇性注意,大量接收同質(zhì)化的信息使得個人信息面變得狹窄,選擇性接觸和選擇性注意會強化自身已有觀點,大量同質(zhì)化信息的接為自己搭建起一個信息的“繭房”。大量同質(zhì)化信息聚合而成的“信息繭房”會加劇個人意識偏見,在交流溝通中形成甚至加固話語壁壘。
2.2. 人工智能建模不完善與“把關(guān)人”標(biāo)準(zhǔn)不統(tǒng)一
在聚合類新聞客戶端里面的系統(tǒng)算法運用風(fēng)險內(nèi)容甄別技術(shù),設(shè)計無數(shù)個圖片樣本集的鑒黃模型,仍然存在漏洞,模型還需要不斷被完善。
雖然,國家網(wǎng)信辦制訂了許多相關(guān)規(guī)章條例,其目的在于監(jiān)管與控制網(wǎng)絡(luò)環(huán)境,同時新聞傳媒行業(yè)逐漸地被社會泛娛樂化所滲透,大部分的聚合新聞平臺都是由于客戶喜歡,追逐娛樂化,導(dǎo)致信息環(huán)境低俗化以及低質(zhì)化。并且,因為在算法新聞生產(chǎn)當(dāng)中中,聚合類新聞客戶端內(nèi)容盡管是按照網(wǎng)信辦以及內(nèi)部指令的要求去開展的,其推薦的前提下是按照用戶的身份特征與喜好,針對部分的推薦,審核人員的要求都是有差異的,然而只要是遵守法律的內(nèi)容都會由于用戶需求而被廣泛推薦。普通的審核人員由于沒有專業(yè)新聞素養(yǎng),導(dǎo)致受眾接收信息更加繁雜,進而導(dǎo)致網(wǎng)絡(luò)環(huán)境更加惡劣,最明顯的體現(xiàn)是標(biāo)題黨大量運用,導(dǎo)致虛假新聞廣泛進入到市場當(dāng)中,泛娛樂化現(xiàn)象十分嚴重。
2.3. 相關(guān)法律并不完善且責(zé)任追究困難
雖然,自媒體平臺企業(yè)“今日頭條”在算法技術(shù)的加持下融入了人工審核與人工編輯,然而這一平臺還是有諸多泛娛樂的現(xiàn)象。在2018年,“今日頭條”由于存在假廣告以及內(nèi)容侵權(quán)現(xiàn)象而被起訴上法庭,同時國信辦還專門與今日頭條旗下的娛樂類APP火山小視頻進行了約談。2017年至今,今日頭條與其所管轄的產(chǎn)品由于內(nèi)容低劣、廣告虛假、侵權(quán)盜權(quán)等,同時其也被權(quán)威媒體與國家部門專門點評與整頓,次數(shù)達到了20多次,這些媒體包括央視新聞、人民日報等。
多次出現(xiàn)這樣的問題說明相關(guān)法律并不完善,而且聚合類新聞客戶端的內(nèi)容生產(chǎn)很大一部分是用戶內(nèi)容生產(chǎn),當(dāng)在平臺出現(xiàn)低俗內(nèi)容時,追究到個人責(zé)任存在困難。
3. 大數(shù)據(jù)算法下信息審核模式的完善
3.1. 解決數(shù)據(jù)失衡與打破“信息繭房”
一款產(chǎn)品怎樣才可以更精準(zhǔn)地把握用戶的偏好程度,能夠用最短的時間了解用戶的口味變化,在用戶都未察覺的情況下,推薦其所喜歡的事物。所以,提高用戶新動作的百分比,減少老動作的百分比,把兩者間存在的信息更新時間差減少,能夠更好地降低數(shù)據(jù)偏差的弊端。這中間所包括的是廣泛對于大數(shù)據(jù)運用的標(biāo)準(zhǔn),同時對于公司實驗平臺提出更嚴格的標(biāo)準(zhǔn)。
用戶的使用行為是促使產(chǎn)生“信息繭房”的因素中非常重要的部分,為了減少“信息繭房”帶來的不利影響,有必要提高用戶的媒介素養(yǎng)。媒介素養(yǎng)對很多方面的能力都有要求,包括用戶選擇信息以及對媒介和渠道的認知等。互聯(lián)網(wǎng)的出現(xiàn)和發(fā)展開拓了我們接觸新資訊的通道,也為更多傳播者提供了傳播信息的平臺。因此,用戶提高媒介素養(yǎng)最重要的是樹立打破“信息繭房”的意識,積極拓展信息資源渠道。
目前,大多數(shù)聚合類新聞客戶端所采用的是算法推薦原理,首先是將用戶的信息與行為來進行從而建立“用戶畫像”,其次是運用協(xié)同過濾技術(shù),即根據(jù)分析用戶群體間的相似性來推薦內(nèi)容。為新聞客戶端設(shè)置“用戶畫像”將使推薦內(nèi)容更加準(zhǔn)確,但協(xié)同過濾技術(shù)將在某種程度上緩解算法的過濾行為并提供可能滿足用戶需求的內(nèi)容,同時將之推薦至主頁。然而,部分用戶十分被動地獲得同類信息的內(nèi)容。他們想接受他們感興趣但不了解的某些主題,或者客戶可以從其他角度打斷并推送一些新主題或新內(nèi)容。大多數(shù)用戶希望通過聚合類新聞客戶端來拓寬視野并獲得各種信息內(nèi)容。
在對聚合類新聞客戶端的的發(fā)展未來作出分析,針對今日頭條為例,能夠更好地強化對協(xié)同過濾法技術(shù)的探討與運用??蛻舳艘蟛粩嗤晟破洹坝脩舢嬒瘛奔夹g(shù),進而通過更加細化的標(biāo)簽精準(zhǔn)地推薦信息;同時,客戶還要求重視過濾算法技術(shù)的關(guān)鍵性,并需要進行更多的研究。通過相互補充并彌補彼此的缺點,這兩種技術(shù)可以在某種程度上減少“信息繭房”的影響,并拓寬用戶的內(nèi)容范圍。
3.2. 加強用戶審核入網(wǎng)并設(shè)置多重“把關(guān)人”
多重“把關(guān)人”也就是多重的審核機制,從用戶入網(wǎng)時就設(shè)立審核機制,比如:用戶實名制和人臉認證。假設(shè)用戶注冊賬號時,要求依靠登錄身份信息同時展開人臉認證。并且在注冊賬號時,與用戶簽訂協(xié)議,當(dāng)賬號出現(xiàn)問題時,用戶需要負相關(guān)責(zé)任,且不得把賬號對外出租或者轉(zhuǎn)借。現(xiàn)在網(wǎng)上出現(xiàn)很多販賣個人身份信息以及賬號的事情。終歸來說,就是審查不嚴格。
首先,在用戶申請賬號入網(wǎng)時進行身份認證以及信息審核,通過之后將進入到第二層審核即為人工智能,當(dāng)用戶在平臺發(fā)布內(nèi)容時,將運用人工智能進行算法審核。用戶發(fā)布的內(nèi)容通過算法審核后將進入第三層審核即為人工審核,人工審核由平臺人工審核和用戶所組成的審核團。
3.3. 區(qū)塊鏈技術(shù)的應(yīng)用與法律制度的完善
許多網(wǎng)絡(luò)“鍵盤俠”之所以有恃無恐的發(fā)布著不良信息的重要的原因之一就是無法追究責(zé)任,網(wǎng)絡(luò)雖非法外之地,但是治理起來困難重重,經(jīng)過原作者發(fā)布然后再經(jīng)過各方轉(zhuǎn)發(fā)之后,其在網(wǎng)絡(luò)上造成的傳播范圍之廣,影響之深是無法想象的。雖然用戶實名制已經(jīng)逐漸完善,但是目前的追查難度依然很大,在面對許多不良信息或不良視頻時依然無法做到追根溯源,即使追查到了源頭,但這中間的傳播者也無跡可尋。
那么如果我們把區(qū)塊鏈技術(shù)應(yīng)用到用戶與媒體中去,這樣一來對不法分子追根溯源就方便的多。區(qū)塊鏈技術(shù)通過P2P模式展開數(shù)據(jù)搜索與上傳,用戶或者別的一方都能夠融入系統(tǒng)展開自動化搜索,從而能夠更好地了解到對方記錄,數(shù)字加密必須要強化,不僅方便同時不易造假,極大地提高了信用的可信度,這樣一來不僅能夠找到信息的發(fā)布者,轉(zhuǎn)發(fā)這種不法信息的人也是一目了然,更重要的是區(qū)塊鏈技術(shù)可以讓用戶也成為監(jiān)督者。新媒體技術(shù)造就了“人人皆媒”的時代,希望區(qū)塊鏈技術(shù)造就一個“人人皆是把關(guān)人”的時代。一個完整的信息審核機制絕不僅僅是“人工審核+技術(shù)識別”這么簡單,“攔截”只是其中一步,更重要的是用技術(shù)手段追溯發(fā)布者,排查傳播者,給予這些人法律的嚴懲,以達到殺一儆百的目的。法律法規(guī)要健全,改進追查違法者的技術(shù),技術(shù)識別與人工審核協(xié)作,共同構(gòu)建成為一個完整的信息審核機制。
4. 結(jié)語
針對聚合類新聞客戶端,人們的個性化信息的偏好的強烈感會不斷增加,盡管提高了
聚合新聞平臺的用戶吸引性,然而也會產(chǎn)生問題,用戶信息面將會越來越少,所以耗費在這一類客戶上無價值閱讀時間必然會增長。所以在此前提下,認識算法新聞生產(chǎn)的審核機制,持續(xù)思考合理高效率的審核方式就變得更加關(guān)鍵,在用戶得到所需信息的過程當(dāng)中,使公共網(wǎng)絡(luò)信息環(huán)境更加優(yōu)質(zhì)。因此,針對聚合類客戶端算法把關(guān)的不良信息展開整頓,用戶、政府以及平臺三者都要緊密配合,業(yè)內(nèi)針對算法的持續(xù)研究在以后未來算法新聞形成與“人與機器共生”的分析當(dāng)中尤為關(guān)鍵。
參考文獻:
[1]耿偉茜.今日頭條的內(nèi)容運營策略研究[D].河北大學(xué),2018
[2]李佳音.基于個性化推薦系統(tǒng)新聞客戶端的“信息繭房”效應(yīng)研究——以“今日頭條”為例[D].中央民族大學(xué),2017.
[3]楊舒涵.算法新聞生產(chǎn)中的把關(guān)機制研究[D].山東師范大學(xué),2019