史 亮
(山西大學(xué)新聞學(xué)院,山西 太原 030006)
“算法”一詞本身并不屬于新聞與傳播學(xué)科研究的領(lǐng)域,它最早是數(shù)學(xué)或者計算機領(lǐng)域的專業(yè)名詞,但隨著時代的進步和發(fā)展,特別是互聯(lián)網(wǎng)技術(shù)、媒介技術(shù)、人工智能等技術(shù)的發(fā)展,社會進入了大數(shù)據(jù)時代,技術(shù)對于現(xiàn)代信息傳播效果的影響越來越重要,基于用戶興趣以及需求來推送新聞成為各大媒介機構(gòu)想要達成的目的之一,由此,逐步誕生出了新聞的算法推介。新聞算法的產(chǎn)生離不開海量的數(shù)據(jù)收集與分析,因此新聞的算法推介與大數(shù)據(jù)是分不開的。
大數(shù)據(jù)并非固定而應(yīng)該是一個相對的概念,相對于以往的數(shù)據(jù)概念來講,大數(shù)據(jù)所包含的信息是海量的,其衡量數(shù)據(jù)量的尺度早已經(jīng)不是傳統(tǒng)意義上的尺度所能達到的,一般的硬件和軟件是無法對這些海量數(shù)據(jù)進行分析的。大數(shù)據(jù)的內(nèi)涵以及定義在學(xué)術(shù)領(lǐng)域目前還沒有一個較為廣泛的共識。維克托·邁爾·舍恩伯格是最早研究大數(shù)據(jù)商業(yè)應(yīng)用的學(xué)者之一,他在著作《大數(shù)據(jù)時代》一書中指出大數(shù)據(jù)是采集所有數(shù)據(jù)而不采取隨機抽樣調(diào)查的方法進行分析處理,這樣一來需要處理的數(shù)據(jù)信息量過大,即體現(xiàn)的是數(shù)據(jù)的海量性(volume),此外大數(shù)據(jù)還有高速(velocity)、多樣(variety)、低價值密度(value)、真實性(veracity)。也就是大數(shù)據(jù)的5V特性。而且大數(shù)據(jù)不僅是一個在尺度上而言相對的概念,它還是不斷變化的,因為所謂的“大”和“小”其實是相對的,今天的大數(shù)據(jù)明天可能就是“小數(shù)據(jù)”。大數(shù)據(jù)還是一個具有應(yīng)用價值的概念,如果大數(shù)據(jù)不加以應(yīng)用,它就沒有任何價值,大數(shù)據(jù)在新聞傳播領(lǐng)域的應(yīng)用就誕生了新聞的算法推介。
算法新聞在影響整個新聞傳播領(lǐng)域,帶來巨大變化的同時,也造成了深刻甚至久遠(yuǎn)的影響。這種變化和影響,最為直觀的表現(xiàn)就在于新聞媒體移動客戶端的出現(xiàn)。在互聯(lián)網(wǎng)媒體高速發(fā)展的今天,新聞媒介紛紛推出客戶端,獲取眾多的終端受眾。依托互聯(lián)網(wǎng)技術(shù)以及人工智能技術(shù),一方面聚合網(wǎng)絡(luò)上海量的新聞信息,另一方面收集到用戶的瀏覽記錄,檢索偏好、關(guān)注領(lǐng)域,甚至可以精確收集到每一位用戶的年齡、職業(yè)、受教育背景、興趣愛好、終端機型等一系列信息。通過對海量數(shù)據(jù)的分析,就可以得出所謂的每一位用戶的精準(zhǔn)畫像,進而針對不同用戶來進行個性化的匹配推送,也就是推送位用戶認(rèn)為有價值或者自己喜愛的信息內(nèi)容,以吸引用戶的注意力。“算法”就是對海量數(shù)據(jù)進行收集分析并得出不同用戶畫像的一整套計算模型體系。所以總的來說,新聞的算法推介,就是利用大數(shù)據(jù)的收集與分析,實現(xiàn)有針對性的新聞推介,為用戶推送私人訂制化的新聞,根據(jù)用戶或者受眾的興趣愛好、行為習(xí)慣等推送用戶或受眾感興趣的新聞內(nèi)容。當(dāng)前,基于算法的新聞推介已經(jīng)成為眾多新聞機構(gòu)或者平臺的常態(tài)。
運用基于大數(shù)據(jù)的算法來進行新聞信息推介的方法其實由來已久。2003年百度在最開始推薦首頁新聞時可以說就是運用了比較基礎(chǔ)的算法,通過收集新聞的網(wǎng)站轉(zhuǎn)載和引用次數(shù)進行簡單分析,從而確定最熱新聞來進行推薦。
隨著大數(shù)據(jù)時代的到來,在互聯(lián)網(wǎng)技術(shù)高速發(fā)展的基礎(chǔ)上,媒介融合的趨勢越來越快,程度越來越高,從而誕生了移動新聞客戶端,而算法推介在移動新聞客戶端出現(xiàn)后開始得到大規(guī)模應(yīng)用。在自媒體時代,微博、微信等終端應(yīng)用使得個人發(fā)布的信息也可以成為新聞,新聞生產(chǎn)越來越容易,每天在互聯(lián)網(wǎng)中新聞信息的發(fā)布數(shù)量達到億萬條,再加上傳統(tǒng)媒體如報紙、門戶所發(fā)布的新聞,新聞數(shù)量激增,為實現(xiàn)個性化新聞推介提供了海量的內(nèi)容。目前我國市場上移動平臺的新聞客戶端不勝枚舉,為了在激烈的競爭中吸引到更多的流量和用戶,增強用戶粘性,推送用戶偏愛的個性化的新聞信息成為新聞客戶端的必修課。因此,無論是原創(chuàng)類新聞媒體還是聚合類的新聞媒體,在移動端推送信息都選擇了算法推介。原創(chuàng)類新聞客戶端的代表有澎湃新聞、鳳凰新聞,聚合類的客戶端的代表以今日頭條和一點資訊最為著名。
移動客戶端的大規(guī)模發(fā)展也促進了社交媒體的迅速發(fā)展,基于互聯(lián)網(wǎng)的新聞信息生產(chǎn)越來越便捷,也越來越多樣化,個人用戶、媒體機構(gòu)以及機器人都成為了新聞信息的生產(chǎn)者。應(yīng)用算法推介新聞的發(fā)展趨勢大致可以從三個方面來著眼,一是新聞信息的自動化生產(chǎn),二是新聞內(nèi)容推薦的個性化,三是新聞信息的聚合分發(fā)。
1.高效率與個性化。運用算法推介新聞信息的一大優(yōu)勢就是極大地提升了人們的信息獲取效率,這也是運用算法來推送新聞信息最為直觀的優(yōu)勢。在互聯(lián)網(wǎng)以及自媒體高度發(fā)達的今天,信息過剩成為了一個顯著的標(biāo)志。任何一個領(lǐng)域、組織、群體、階層的信息內(nèi)容幾乎都是海量的,這當(dāng)中也充斥著大量的虛假、無效的新聞信息,如何在紛繁復(fù)雜的信息海洋中塑造出引人注目并且符合用戶需求的新聞內(nèi)容,新聞媒體機構(gòu)不借助大數(shù)據(jù)算法是無法完成的。同時,如果不借助于算法推介,人們需要在無序的海量的內(nèi)容中篩選出自己需要的內(nèi)容,這無疑是在挑戰(zhàn)每個人的能力和時間?,F(xiàn)在的新聞資訊客戶端則運用算法來推送客戶感興趣的內(nèi)容,在達到個性化的同時,實際上幫助用戶省去了復(fù)雜的篩選過程,滿足了用戶高效獲取信息的迫切需求。
2.提升公眾參與度。個性化的新聞推介極大地增強了用戶反饋互動的意愿。在個人意識覺醒的今天,人們具有強烈的表達欲望。網(wǎng)絡(luò)空間成為人們直接表達個人意愿或者觀點的公共領(lǐng)域。移動新聞客戶端的出現(xiàn)和發(fā)展,一方面為網(wǎng)民提供當(dāng)下的熱點,即針對個人的“議程設(shè)置”,另一方面也為網(wǎng)民提供了交流討論的平臺。算法推送的新聞是基于用戶偏好的個性化新聞,從某種程度上講此時的“議程設(shè)置”的主體是用戶本身,用戶收到的新聞推送都是自己所關(guān)心的話題或者領(lǐng)域,那么用戶自然更愿意積極加入到新聞的討論中來。而且,算法時代移動新聞客戶端的用戶需求是在收到的信息中找到更多個性化的定制內(nèi)容,所以新興媒體在推送新聞信息時也會鼓勵用戶分享個人制作的新聞內(nèi)容,也就是我們所說的自媒體用戶,如微信的公眾號、今日頭條的個人賬號等,使得用戶也可以成為新聞內(nèi)容的生產(chǎn)者。
3.運營效率提升。相比于傳統(tǒng)的新聞媒體運營模式,基于大數(shù)據(jù)的算法新聞具有巨大的優(yōu)勢。移動客戶端的便捷性與移動性使之相較于廣播電視以及報紙等媒介更受到人們的青睞。算法新聞在新聞生產(chǎn)方面具有極高的效率,在傳統(tǒng)新聞時代,內(nèi)容采集的工作是需要人的參與的,也就是需要媒體編輯或者媒體記者的參與,但是采用算法來進行新聞信息采集,在人工編輯的同時,有些工作完全可以由機器人來完成,機器人可以在編輯報道、發(fā)布消息、精準(zhǔn)推送等方面替代或者輔助人工操作。另外,互聯(lián)網(wǎng)時代流量和關(guān)注就是金錢,移動客戶端在積累了龐大用戶群之后,強大的用戶粘性和精準(zhǔn)的用戶畫像極大提升了盈利能力。
1.缺乏有效的把關(guān)機制?!八惴〞r代”的新聞推介是基于海量的數(shù)據(jù)收集與分析,一方面通過大數(shù)據(jù)抓取海量的新聞內(nèi)容,包括主流原創(chuàng)新聞,也包括個人自媒體發(fā)布的信息;另一面匹配受眾進行精準(zhǔn)推送。相比于傳統(tǒng)的新聞發(fā)布模式,在新聞傳播過程中“把關(guān)人”的角色由新聞記者、新聞編輯開始過渡到了計算機智能算法,新聞算法的“把關(guān)”是基于用戶的瀏覽習(xí)慣和新聞偏好等從多個來源收集到的個人用戶信息,歸根到底它也是一種人造物,不可避免地會帶有人的價值觀或者選擇趨向。而用戶選擇文化產(chǎn)品與物質(zhì)產(chǎn)品的不同在于,物質(zhì)產(chǎn)品在自由市場上的趨向是物美價廉,而文化產(chǎn)品在自由市場中的趨向是低俗化、淺薄化?;诘退谆玫耐扑途驮斐闪艘苿有侣効蛻舳舜罅客扑统涑庵缺┝?,低俗淺薄的黃色新聞或者廣告,久而久之,對于個人擬態(tài)環(huán)境的影響就會作用于真實環(huán)境。
2.易形成“信息繭房”。運用算法推介的新聞通過機器的把關(guān)篩選出了自己關(guān)心的新聞信息,滿足了用戶高效獲取個性化信息的迫切需求,但不可避免的是,機器也把它認(rèn)為對用戶沒有吸引力的新聞信息全部過濾掉了,這會使個體受眾受困于“信息繭房”之中?!靶畔⒗O房”也被稱為“信息繭室”,最初是由美國學(xué)者凱斯·桑斯坦提出的,簡單地說“信息繭房”就是一個“我們只能聽到自己選擇的聲音和愉悅自己的信息的通訊領(lǐng)域”。也就是人們的信息環(huán)境會受限于自己的喜好和偏見。受眾只能接收到自己所感興趣的新聞信息,接觸到針對個人的“議程設(shè)置”,用戶成為了“把關(guān)人”和“議程設(shè)置”的主體,個體受眾之間的認(rèn)知偏差將會被無限放大,不斷地強調(diào)這種偏差的后果是,人們已有的認(rèn)知與價值觀將會根深蒂固,導(dǎo)致在熱點問題上的群體極化現(xiàn)象,受眾在極端、僵化的“信息繭房”中甚至?xí)霈F(xiàn)與主流社會價值觀相背離的認(rèn)知。
3.侵犯個人隱私?!八惴〞r代”的新聞推介是基于海量的數(shù)據(jù)收集與分析,這些數(shù)據(jù)包括對用戶個人信息的收集與分析,這也是實現(xiàn)個性化新聞推送的前提。這對于保護公民的個人隱私是存在一定的負(fù)面影響的。移動客戶端在采集用戶個人信息數(shù)據(jù)時,并未征得用戶的同意,在公民權(quán)利意識不斷增強的現(xiàn)代社會,互聯(lián)網(wǎng)媒體公司的這種做法是存在爭議的。如果互聯(lián)網(wǎng)媒體公司在收集用戶信息的過程中缺乏必要的制度和流程,很容易造成用戶信息的公開,個人信息的泄露對于用戶而言就會造成潛在的工作和生活上的不利影響。同時,這些互聯(lián)網(wǎng)媒體公司的數(shù)據(jù)庫一旦受到攻擊或者惡意侵犯,用戶的隱私信息就存在被泄露的風(fēng)險,用戶的隱私安全存在極大的隱患。
在分析新聞的算法推介所具有的優(yōu)勢以及所帶來的一些問題后我們發(fā)現(xiàn),技術(shù)的進步無時無刻不在改變著新聞傳播領(lǐng)域,新聞傳播進入“算法時代”是互聯(lián)網(wǎng)以及大數(shù)據(jù)技術(shù)發(fā)展的必然。不過我們應(yīng)該認(rèn)識到,“算法”技術(shù)不是萬能的,基于算法的新聞推送也具有兩面性,在享受到算法推送所帶來的進步的同時,也應(yīng)該正視所存在的問題和隱患,算法技術(shù)的升級不僅僅追求經(jīng)濟利益,還要更多地兼顧社會責(zé)任,如要按照主流價值觀的要求,優(yōu)化算法模型,重視人工干預(yù)和內(nèi)容審核,引入媒體平臺內(nèi)外部共同監(jiān)督機制,完善用戶個人信息保護制度等,只有這樣互聯(lián)網(wǎng)媒體才能更好地為構(gòu)建和諧社會做出貢獻。