周小玲
隨著以算法為核心技術(shù)的智能時代的到來,算法越來越多地被應用到社會各領(lǐng)域。例如,政府利用算法來實現(xiàn)智能化疫情防控;媒體依據(jù)算法對用戶進行個性化的新聞推送;商家利用算法來實現(xiàn)精準營銷;監(jiān)管部門采用算法對網(wǎng)絡(luò)暴力、色情等違法內(nèi)容進行識別與檢查;等等??梢哉f,算法的普及全方位地改變了人們的生活。然而,算法是一把雙刃劍,它在給日常生活帶來巨大便利的同時也導致了不公平、歧視、隱私泄露等一系列問題。例如,算法在增強人們的信息獲取能力,提高人們意見表達的機會的同時,也在無形中接管了信息分發(fā)的權(quán)力;在實現(xiàn)高效管理、維護社會穩(wěn)定的同時,也在無意識中增強了政府的公權(quán)力;在幫助企業(yè)優(yōu)化服務(wù)、精準營銷的同時,也暗中賦予了企業(yè)更多的支配權(quán)與控制權(quán)??梢哉f,“世界不再以我們能夠理解的方式來表達,它已經(jīng)被數(shù)據(jù)化了,任由算法闡釋,按照控制論方式重新配置”[1]。
目前學界對算法所引發(fā)的經(jīng)濟、倫理、社會治理方面的種種問題與隱患都給予了極大關(guān)注。可以看到,算法偏見、算法黑箱、算法失靈、算法倫理、算法治理、算法權(quán)力等概念層出不窮。然而,算法對學術(shù)期刊的影響卻鮮有研究者關(guān)注,相關(guān)研究大多聚焦于學術(shù)期刊在算法時代的傳播,即學術(shù)期刊如何構(gòu)建有效的傳播平臺來適應算法時代的來臨[2—4],而對算法可能給學術(shù)期刊帶來的潛在問題與現(xiàn)實困境的研究則寥寥無幾。因此,本文試圖從算法在學術(shù)期刊中的應用出發(fā),結(jié)合學術(shù)期刊的編輯工作,探討算法作為一種權(quán)力在學術(shù)期刊中的滲透與擴張,揭示算法權(quán)力對學術(shù)期刊的無形控制,并為學術(shù)期刊的自救提出解決之道。
目前,算法在學術(shù)期刊中的應用主要通過以下四種方式實現(xiàn)。
用戶畫像(user profile)是一種通過描繪用戶特征來為用戶提供精準服務(wù)的技術(shù),該技術(shù)往往需要綜合使用分類、聚類、推薦等各種算法[5],目前被廣泛地應用于圖書館、電子商務(wù)、健康醫(yī)療等領(lǐng)域。近年來,隨著相關(guān)研究的推進,很多學者將用戶畫像技術(shù)引入學術(shù)期刊研究,試圖通過構(gòu)建學術(shù)期刊的用戶畫像模型來更好地理解作者與讀者的需求、選擇更加合適的審稿專家、實現(xiàn)學術(shù)期刊微信公眾號的精準推送等。例如,有學者通過挖掘和收集學術(shù)期刊的網(wǎng)站、投稿平臺、微信公眾號上的用戶數(shù)據(jù),并按照一定的算法對這些原始數(shù)據(jù)進行過濾、整理、分析、計算,構(gòu)建作者畫像、讀者畫像與專家畫像,從而使學術(shù)期刊提供更加精準化、多樣化、社交化和個性化的服務(wù)[6]。另有學者針對學術(shù)期刊存在的“找不到”或“找不對”合適的外審專家審稿的問題,將用戶畫像技術(shù)應用到審稿人的遴選之中,通過構(gòu)建審稿人畫像模型,設(shè)計出更加有效的外審專家推薦方法,以實現(xiàn)審稿人研究方向與稿件的精準匹配[7]。還有學者試圖通過用戶畫像技術(shù)來提高學術(shù)期刊微信公眾號的精準推送功能,從而提高期刊的傳播力與影響力[8]??傊?,建立在算法基礎(chǔ)上的用戶畫像技術(shù)讓學術(shù)期刊可以精準細致地把握作者、讀者、專家的信息,從而提升學術(shù)期刊的服務(wù)質(zhì)量與水平。
算法在學術(shù)期刊中最早、最主要的應用是期刊評價。學術(shù)期刊的評價方式主要有兩種:定量評價和定性評價。由于定量評價有利于保證評價結(jié)果的客觀性,避免人的主觀性、認知及情感等因素對評價結(jié)果產(chǎn)生過多影響,所以,長期以來都備受推崇。近年來,雖然同行評議等定性評價越來越受到重視,但以文獻計量為主的定量評價仍是期刊評價中不可或缺的方法。文獻計量主要是對引文數(shù)據(jù)進行整理、排序、分析、統(tǒng)計,這為算法提供了絕佳的用武之地??梢哉f,無論是長期以來期刊評價中最倚重的傳統(tǒng)指標,如載文量、被引量、期刊影響因子(journal impact factor,英文縮寫JIF)、h指數(shù)、g指數(shù)、A指數(shù)、r指數(shù)等[9]88,還是近來新興的“期刊聲望指標(SCImago journal rank,英文縮寫SJR)與特征因子(eigen-factor,英文縮寫EF)等衍生指標”[10],都離不開算法的支撐。傳統(tǒng)的期刊評價所依據(jù)的算法往往比較簡單,主要是對引用進行統(tǒng)計,如影響因子就是對一種期刊前兩年發(fā)表的論文在統(tǒng)計當年被來源期刊引用的總次數(shù)除以該期刊在這兩年內(nèi)發(fā)表的論文總數(shù)進行的計算。這種簡單算法使得影響因子只注重引文的絕對數(shù)量,而忽視引文的實際質(zhì)量,且無法排除自引等情況,因而不斷被詬病。面對指責,期刊評價的算法不斷更新?lián)Q代,逐步出現(xiàn)了一些新型期刊評價指標,例如,“作為新型期刊評價指標的代表SJR和EF,兩者都采用了類PageRank算法模型來評價科技期刊的質(zhì)量與影響力”[9]88??傊瑹o論是傳統(tǒng)指標還是新型指標,算法在以定量分析為主的期刊評價中始終發(fā)揮著舉足輕重的作用。不過,顯而易見的是,過于依賴算法的期刊評價也帶來了一些弊端。
及時了解和掌握學術(shù)熱點和前沿,并據(jù)此來進行選題策劃,是學術(shù)期刊編輯需要掌握的基本技能之一。然而,在信息爆炸時代,不僅信息量呈幾何級增長,而且信息傳播的速度和廣度也大大增加,這導致學術(shù)熱點也在加速更迭,那么,身處信息洪流和熱點日新月異中的學術(shù)期刊編輯如何應對這一挑戰(zhàn)?越來越多的研究者提倡學術(shù)期刊編輯利用算法來挖掘與捕捉學術(shù)熱點與前沿,從而在組稿、約稿中能主動出擊、引領(lǐng)學科發(fā)展。有學者探索運用SciVal的文獻數(shù)據(jù)挖掘技術(shù)來提煉學術(shù)熱點,以此輔助學術(shù)期刊編輯及時了解和掌握研究熱點,從而實現(xiàn)精準約稿[11]。有的學者自行開發(fā)算法來進行學術(shù)熱點發(fā)現(xiàn)與熱度評價,一方面“通過詞頻統(tǒng)計和詞增長速度算法對專業(yè)領(lǐng)域內(nèi)的熱點進行識別”;另一方面“從內(nèi)容層面和傳播層面兩個維度設(shè)計并計算一系列指標,對識別到的熱點進行熱度評價與排序”,最終實現(xiàn)由數(shù)據(jù)、算法驅(qū)動的選題決策。[12]有的學者建議利用數(shù)據(jù)庫自帶的算法對學術(shù)熱點進行預測,如利用基本科學指標數(shù)據(jù)庫(Essential Science Indicators,英文縮寫ESI)的相關(guān)功能來統(tǒng)計分析作者/機構(gòu)/國家合作度、基金論文影響力、高被引期刊/機構(gòu)/熱點主題詞等信息,以獲取研究熱點。[13]有學者借助Doc2Vec方法,對期刊論文的相似度進行計算,采取共詞聚類分析、關(guān)鍵詞的詞頻統(tǒng)計等算法,計算出一定時間和范圍內(nèi)的期刊熱點選題。[14]總之,隨著技術(shù)的進步,學術(shù)期刊編輯關(guān)注學術(shù)熱點、進行選題策劃的手段日趨豐富,不過,算法在選題策劃上的應用也有局限性與不足之處,如會導致信息繭房、加劇學術(shù)期刊選題同質(zhì)化等。
目前,國內(nèi)雖然有多種學術(shù)不端檢測系統(tǒng),但其論文查重的基本原理是一致的,即查重系統(tǒng)將待檢測的論文與數(shù)據(jù)庫中的文獻進行比對,按照一定的算法進行識別,計算出重復率,并生成檢測報告單。由此可見,算法是學術(shù)不端檢測系統(tǒng)的關(guān)鍵。然而,不同檢測系統(tǒng)的重復率算法大同小異。例如,中國知網(wǎng)、萬方、大雅的查重系統(tǒng),其重復率算法是相同的,即都是“重復字數(shù)和總字數(shù)的比值”。需要注意的是,中國知網(wǎng)查重采用的是目前比較先進的模糊算法,即以句子為最小單位,如果一句話中有連續(xù)13個字符重復,并且重復字數(shù)達到該段落的5%,那么就會被標記出來[15]。而維普與PaperPass采用的重復率算法略有不同,維普使用的算法是“總相似比=復寫率+他引率+自引率”;Paper-Pass的重復率算法是“(句子1相似度+句子2相似度+……+句子n相似度)/n”[16]??陀^來講,算法的應用的確有助于發(fā)現(xiàn)抄襲、剽竊、一稿多投等學術(shù)不端行為,算法的確是防范學術(shù)不端、凈化學術(shù)生態(tài)的有力武器,但需要指出的是,查重系統(tǒng)算法目前仍有不足,這也令學術(shù)期刊與作者都頗感苦惱。
需要指出的是,算法在為學術(shù)期刊賦能的同時,也逐步異化成了一種權(quán)力,成為支配與控制學術(shù)期刊的一種強制性力量。這是因為,在一切都以數(shù)據(jù)化的面貌出現(xiàn)的智能時代,誰擁有數(shù)據(jù),誰就有權(quán)對數(shù)據(jù)進行分類、搜索、判定、過濾、推薦等算法的分析與處理[17]。而算法依據(jù)某些相關(guān)性作出的選擇、排序、分類或預測,會在有利于某些人或物的同時不利于其他人或物。如果說“權(quán)力是一種社會關(guān)系”,是某個主體“運用其擁有的資源,對他人發(fā)生強制性的影響力、控制力,促使或強迫對方按權(quán)力者的意志和價值標準作為或不作為” [18]的能力,那么可以被用來強化自己對他人的影響力和控制力的算法,儼然已經(jīng)演化為一種算法權(quán)力。正如喻國明教授所指出的:“算法的社會本質(zhì)是一種權(quán)力,技術(shù)不僅能夠賦能與賦權(quán),而且它自身就構(gòu)成一種權(quán)力的行使和對于傳統(tǒng)權(quán)力模式的替代。” [19]可見,算法不僅是一種技術(shù),還是一種操縱政治、社會和經(jīng)濟的權(quán)力手段。作為一種權(quán)力的算法,如今已經(jīng)滲透到了社會的方方面面,學術(shù)期刊也概莫能外。
算法權(quán)力通常是非常隱蔽的,其在學術(shù)期刊中的運作往往是通過對學術(shù)期刊進行分等定級與排名,滲入選題策劃、學術(shù)不端檢測以及學術(shù)信息傳播等環(huán)節(jié)來實現(xiàn)的。
通過采集各種數(shù)據(jù)對學術(shù)期刊進行分等定級與排名是一種重要的期刊評價方式,這種評價方式可以在學術(shù)期刊之間形成角逐與競爭,因而在一定程度上有助于提高學術(shù)期刊的質(zhì)量。但對評價結(jié)果的濫用與盲目追求,也使得它逐步背離了設(shè)計的初衷,因此飽受詬病。《清華大學學報》仲偉民教授曾客觀地評價了“學術(shù)評價與學術(shù)期刊的糾葛”,他指出,學術(shù)界、期刊界以及管理部門“對學術(shù)評價的批評多、肯定少,這是可以理解的,因為最近一二十年學術(shù)評價機構(gòu)對學術(shù)研究的負面影響的確越來越大,應該批評。但是,另一方面,我們也要充分看到有的學術(shù)評價機構(gòu)在與學者及管理部門的交涉及交流中,客觀上對學術(shù)研究和學術(shù)期刊也起到了很重要的正向作用”[20]。目前,國內(nèi)不同的評價機構(gòu)按照不同的標準,對學術(shù)期刊進行了各種等級區(qū)分,其中比較重要的等級劃分有核心期刊與非核心期刊、CSSCI來源期刊與非CSSCI來源期刊等;比較重要的排名有影響因子排名、人大復印資料轉(zhuǎn)載指數(shù)排名、學術(shù)影響力排名、國際影響力排名等。此外,隨著微信的盛行,還出現(xiàn)了許多與之相關(guān)的新排名,如學術(shù)期刊微信公眾號熱點文章排名、學術(shù)期刊微信傳播力排名等。這些琳瑯滿目的分級與排名讓學術(shù)期刊冰火兩重天,評級高的、排名靠前的歡呼雀躍,反之則垂頭喪氣。
等級劃分與排名的實質(zhì)是一種算法權(quán)力機制,這是因為,等級與排名都是通過某種算法被計算出來的。雖然近年來隨著學界與期刊界中有志人士的不斷推進,各大期刊評價體系都放棄了之前單純依據(jù)量化指標的計算,逐步提高了質(zhì)性內(nèi)容的權(quán)重,但即使如此,定量分析仍是學術(shù)期刊評價體系的主要方法。然而,這種計算出來的等級與排名被盲目認同后,不僅某些作者會以刊物的等級與名次作為投稿的參照,某些讀者也會更愿意閱讀等級高、排名靠前的期刊。久而久之便產(chǎn)生了馬太效應:等級越高、排名越前的期刊,其稿源就越好,其訂閱量與影響力就越大。這導致一些期刊開始刻意迎合等級與排名的算法來調(diào)整自己的辦刊方針。于是我們看到,為了擠進核心期刊或提高影響因子,有的期刊會重金買稿,即給著名學者的文章提供高稿酬;有的期刊聲明自己傾向于發(fā)表長文章,因為無論是轉(zhuǎn)載率還是影響因子的計算都是以文章被轉(zhuǎn)載或被引用的次數(shù)除以發(fā)表的文章數(shù)量總和[21],而多發(fā)篇幅長的文章就會降低文章數(shù)量總和即分母,從而期刊就可以坐享其成,即什么都不用做,只改變文章的篇幅就可以有效提高轉(zhuǎn)載率或影響因子;有的期刊明確表示自己偏愛發(fā)表基金論文,因為基金論文比是評價期刊等級與排名的重要指標之一;甚至還有期刊明確要求作者投稿的論文必須引用本刊發(fā)表過的文章……真可謂八仙過海,各顯神通。如此種種都是為了提高等級與排名??梢?,學術(shù)期刊對等級與排名的認同,讓等級與排名的算法建立了自己的霸權(quán)地位。為了迎合這些等級與排名算法的偏好,學術(shù)期刊在選稿、用稿等方面不得不刻意地投其所好,以致丟失了自己作為優(yōu)秀學術(shù)成果展示平臺的意義。奧尼爾(Cathy O' Neil)曾把算法稱為“數(shù)學殺傷性武器”,他指出“許多數(shù)學殺傷性武器都是依靠自己的內(nèi)置邏輯來定義其所處理的情況,然后再以其自己的定義證明其輸出結(jié)果的合理性的。這種模型會不斷地自我鞏固、自我發(fā)展,極具破壞力”[22]。盲目追求算法決策出的等級與排名對學術(shù)期刊造成的傷害,又一次印證了這種“數(shù)學殺傷性武器”的破壞力。
國內(nèi)的學術(shù)期刊尤其是綜合性學術(shù)期刊存在嚴重的同質(zhì)化問題,它們不僅在形式上如封面、版式上趨同,更是在選題內(nèi)容上重復,在欄目設(shè)置上相似,缺少各自的特色。對此,學界做過多方面的分析。如《天府新論》的謝蓮碧將學術(shù)期刊同質(zhì)化的原因歸結(jié)為學術(shù)資源的有限、學術(shù)熱點的相對集中,以及期刊之間激烈的競爭[23]?!陡拭C社會科學》的胡政平將學術(shù)期刊同質(zhì)化的成因總結(jié)得更為全面,不僅追溯了歷史原因如“計劃經(jīng)濟時代形成的行政化的單位制辦刊模式”“長期形成的傳統(tǒng)化的內(nèi)向式辦刊模式”,還從制度設(shè)計與執(zhí)行層面作了探討,認為失范的制度設(shè)計和長期的執(zhí)行不力是同質(zhì)化的重要因素。此外,他還從期刊自身出發(fā)深刻反省,列出了期刊主帥創(chuàng)新能力匱乏、編輯隊伍素質(zhì)欠佳等弊病[24]。以上分析固然頗有見地,然而在算法時代,我們不得不考慮一個新現(xiàn)象,即信息繭房所帶來的選題同質(zhì)化的加劇。
以往學術(shù)期刊編輯感知與獲取學術(shù)信息的方式通常有兩種:一是閱讀同行期刊,通過閱讀來尋找高頻出現(xiàn)的學術(shù)議題;二是參加各種學術(shù)會議,通過會議來了解學界動態(tài)與理論前沿?;ヂ?lián)網(wǎng)的發(fā)展讓編輯更多地依賴網(wǎng)絡(luò)來獲取信息,于是對同行期刊的閱讀從傳統(tǒng)的紙質(zhì)閱讀轉(zhuǎn)變成了現(xiàn)代的數(shù)字化閱讀,即通過中國知網(wǎng)、萬方等電子數(shù)據(jù)庫來閱讀。新冠肺炎疫情暴發(fā)后,越來越多的學術(shù)會議也開始借助騰訊會議、ZOOM等軟件實現(xiàn)了線上與線下的共享。然而,無論是通過中國知網(wǎng)、萬方等數(shù)據(jù)庫檢索信息,還是參加線上線下的各種學術(shù)會議,都是編輯主動獲取學術(shù)信息。但算法時代的降臨,改變了編輯獲取學術(shù)信息的方式,讓被動獲取信息的比重大幅提升,即越來越多的學術(shù)信息來自微信朋友圈的分享、微博熱搜的榜單、今日頭條的推薦等。關(guān)注高校、科研機構(gòu)、學術(shù)期刊等公眾號,閱覽微信朋友圈的分享,雖然有助于編輯及時把握學界最新動態(tài),了解最新研究成果,但需要引起重視的是,過于依賴學術(shù)信息的被動獲取會導致信息繭房,從而加劇選題的同質(zhì)化。
下文以微信為例做具體分析。微信極大地提升了學術(shù)信息的傳播范圍與傳播速度,但它的算法機制有可能導致信息繭房現(xiàn)象。編輯通過微信獲取信息的途徑主要有三種:第一種來源于微信的分享功能,即微信好友基于朋友圈、“看一看”、視頻號所發(fā)布、分享的內(nèi)容;第二種來源于微信的關(guān)注功能,是基于用戶關(guān)注的微信公眾號與視頻號所發(fā)布的信息;第三種來源于微信的推薦功能,如“看一看”中的“熱點廣場”、“搜一搜”中的“今日熱點”,視頻號中的“推薦”都會向用戶推薦信息。這三種信息來源都會在一定程度上造成信息繭房。首先,微信的分享與關(guān)注功能會導致個人信息繭房。這是因為,添加誰為好友與關(guān)注哪些公眾號都是用戶個人選擇的結(jié)果,這個選擇本身就已經(jīng)對繁雜的信息做了過濾,使得用戶看到的信息都是自己所偏愛的。毋庸置疑,編輯的微信好友中肯定包含大量的學者與同行,編輯所關(guān)注的公眾號中肯定不會缺少各種同行期刊等與工作相關(guān)的公眾號,而對于這些好友與公眾號的選擇,本身已經(jīng)經(jīng)過編輯本人偏好的過濾。所以編輯在微信朋友圈或公眾號中獲得的學術(shù)信息,已經(jīng)是經(jīng)個人偏好篩選后的信息了。其次,微信的推薦功能會帶來群體信息繭房。微信“看一看”中的“熱點廣場”、“搜一搜”中的“今日熱點”,視頻號中的“推薦”的形成是經(jīng)過群體信息篩選的結(jié)果,算法對用戶關(guān)注、點贊、轉(zhuǎn)發(fā)、評論、搜索的數(shù)據(jù)進行統(tǒng)計,然后向用戶推送包含出現(xiàn)頻率最高的詞的信息,這就導致同樣的信息會被反復傳播,形成信息壁壘,新的信息很難打破重圍并突顯出來。因此,編輯通過微信推薦所獲取的學術(shù)信息并不全面客觀,而是算法過濾后的“擬態(tài)環(huán)境”[25],很可能是大量重復且單一的信息。由此可見,編輯在微信中只能獲取到自己偏愛和大眾偏愛的信息。學術(shù)期刊編輯如果過于依賴微信這一信息渠道來獲取學術(shù)信息,并據(jù)此提煉選題,就會受困于信息繭房而加劇選題同質(zhì)化。
目前學術(shù)期刊基本上都采用了學術(shù)不端檢測系統(tǒng)來防范抄襲、剽竊、一稿多投等違背學術(shù)誠信與學術(shù)準則的行為。自2008年3月國內(nèi)第一個學術(shù)不端檢測系統(tǒng)PaperPass問世以來,目前我國已經(jīng)有十余種學術(shù)不端檢測系統(tǒng),主要包括中國知網(wǎng)的“學術(shù)不端文獻檢測系統(tǒng)”、武漢大學的“ROST論文反剽竊系統(tǒng)”、維普論文檢測系統(tǒng)、Gocheck論文引用檢測系統(tǒng)、萬方數(shù)據(jù)文獻相似性檢測服務(wù)、大雅相似度分析系統(tǒng)等。
十多年來的實踐經(jīng)驗證明,學術(shù)不端檢測系統(tǒng)對于發(fā)現(xiàn)學術(shù)不端行為是有效的,但不能否認的是,目前的學術(shù)不端檢測系統(tǒng)雖然經(jīng)過不斷升級仍有許多不盡如人意之處。這些不足主要是由其算法上的漏洞導致的。一方面,算法的數(shù)據(jù)來源存在盲區(qū),使系統(tǒng)無法甄別抄襲與合理引用,于是許多必要自引、合理他引,如對權(quán)威著作、歷史資料、法律法規(guī)、專業(yè)名詞、經(jīng)典詩詞、名言警句等的引用都一概被判定為抄襲,甚至論文的統(tǒng)一格式如前言、資料與方法、結(jié)論等內(nèi)容也被判定為抄襲[26]。另一方面,算法不夠智能,這導致同義詞的替換、表達方式的變更、字序的調(diào)整等簡單操作就會極大地影響檢測結(jié)果。目前國內(nèi)的學術(shù)不端檢測系統(tǒng)大多采用數(shù)字指紋技術(shù)或詞頻統(tǒng)計技術(shù),其原理在本質(zhì)上只是對字符串進行統(tǒng)計與標記,而無法從語義信息和語用信息層面理解論文的含義,因而多數(shù)只能識別文本復制類型的簡單抄襲[27],對思想觀點、研究方法上的剽竊完全束手無策。此外,檢測系統(tǒng)不能識別圖表與公式,且有些系統(tǒng)只能查中文文獻而對外文文獻無能為力[28]。
為了彌補檢測系統(tǒng)的局限,期刊界提倡系統(tǒng)檢測與人工審查相結(jié)合來判斷引用的必要性與合理性,試圖用人工來矯正算法的失靈。但是,如今很多高校、編輯部、管理機構(gòu)都把低重復率作為一個硬性指標,例如,有些高校規(guī)定畢業(yè)生論文提交評審前必須通過學術(shù)不端檢測系統(tǒng)的查重;多數(shù)編輯部把學術(shù)不端檢測作為審稿的第一步;某些管理機構(gòu)也將學術(shù)不端檢測作為必備的輔助工具,用于課題審核與職稱評定等。檢測系統(tǒng)的算法決定了一篇文章重復率的高低,這導致同一篇文章在不同的檢測系統(tǒng)中很可能具有不同的重復率[29]。這就讓檢測系統(tǒng)的算法擁有了影響甚至決定學生畢業(yè)論文是否合格、編輯部審稿是否通過、課題與職稱評定是否成功的強制性力量。而如何對算法的權(quán)力進行有效制衡、防止其異化,是一個亟待解決的問題。
算法歧視通常被理解為日常生活中基于數(shù)據(jù)的廣告所含有的種族歧視、性別歧視,以及“大數(shù)據(jù)殺熟”背后的價格歧視等。不過,僅僅將算法歧視“定義為由于算法程序的片面性呈現(xiàn)在種族、性別、職業(yè)身份等之上的消極態(tài)度,未免稍顯狹隘”[30]48,理應將其擴展為“算法程序在信息生產(chǎn)和分發(fā)過程失去客觀中立的立場,影響公眾對信息的客觀全面認知” [30]48 。正是在這個意義上,本文認為,如今的學術(shù)期刊在傳播機會上遭遇了嚴重的算法歧視。這種歧視主要表現(xiàn)為兩大類:一是搜索引擎的競價排名算法所帶來的經(jīng)濟歧視,二是搜索引擎內(nèi)置的認證歧視。
首先分析競價排名算法的經(jīng)濟歧視。算法在表面上僅僅是一種技術(shù),但其背后卻往往潛藏著強大的資本力量。競價排名算法就是這樣一種資本與技術(shù)的共謀,使學術(shù)期刊深受其害。眾所周知,在百度上隨便搜索任一學術(shù)期刊的刊名,就會出現(xiàn)一堆虛假期刊網(wǎng)站,而學術(shù)期刊真正的官方網(wǎng)站則可能淹沒在茫茫的高仿網(wǎng)站之中。雖然經(jīng)過2016年的專項治理,搜索引擎取消了對一些釣魚網(wǎng)站的推廣,亂象得到了一定程度的遏制,但即使如此,如今在網(wǎng)上搜索期刊刊名,查詢結(jié)果中仍有不少虛假網(wǎng)站位居前列。為學術(shù)黑市助紂為虐的正是競價排名算法,這一算法使付費越多的網(wǎng)站在搜索結(jié)果中排名越靠前,因而假冒網(wǎng)站可以通過付費購買競價排名服務(wù)讓自己比真實網(wǎng)站更容易被搜到。而與虛假期刊網(wǎng)站積極購買競價排名服務(wù)不同,絕大多數(shù)學術(shù)期刊為非營利機構(gòu),以傳播優(yōu)秀學術(shù)成果為己任,基本不會主動參與競價排名,因此,其真實網(wǎng)站通常都在搜索頁面中排位靠后,難以被公眾看到[31]。由此可見,競價排名算法在利益的驅(qū)動下,已經(jīng)在信息傳播的過程中失去了客觀中立的立場,它們赫然實行經(jīng)濟歧視,使得虛假的仿冒期刊網(wǎng)站也能“買”到搜索結(jié)果的前排位置,嚴重妨礙了公眾對學術(shù)信息的客觀全面的認知,致使真正的學術(shù)期刊網(wǎng)站在海量信息里遭到屏蔽,無法獲得公平的傳播機會??梢哉f,競價排名算法造成了假冒期刊網(wǎng)站與學術(shù)期刊官網(wǎng)之間的一場不公平競爭,讓學術(shù)期刊受到了來自算法的經(jīng)濟歧視。
其次分析搜索引擎的認證歧視。為了打擊山寨網(wǎng)站,搜索引擎推行認證制度,為一些知名期刊網(wǎng)站授予“官網(wǎng)”標識。例如,加入百度認證后就會有藍色背景的“官網(wǎng)”字樣,加入360認證后就會有綠色的“官網(wǎng)”字樣。事實證明,認證機制確實有效。據(jù)統(tǒng)計,實行官網(wǎng)認證后,學術(shù)期刊網(wǎng)站在國內(nèi)三大主流搜索引擎(百度、360搜索及搜狗)中的排位情況為:“前3頁出現(xiàn)正確官網(wǎng)的比例最高為百度搜索,其次為360搜索和搜狗搜索,后二者間差別不大。雖然前3頁大多有正確官網(wǎng)顯示,但正確官網(wǎng)出現(xiàn)在首頁首位的比例均偏低,都未超過50%,360搜索甚至低于10%。”[32]然而,并非所有的學術(shù)期刊都進行了認證,只有繳納一定費用才能通過認證。這樣認證機制就帶來了新歧視,即有認證的官網(wǎng)對沒有認證的官網(wǎng)的歧視。認證與否本來不影響搜索結(jié)果的排名,因為認證的主要作用是驗證網(wǎng)站的真實性和有效性,但事實上,搜索引擎的算法傾向于優(yōu)先展示自己平臺認證的網(wǎng)頁,而那些沒有進行認證的學術(shù)期刊官網(wǎng)即使是真實的,也會被算法降序甚至忽略。其實,這種優(yōu)先展示自己平臺內(nèi)容的算法早已經(jīng)是互聯(lián)網(wǎng)行業(yè)的公開秘密。比如Facebook 會在用戶信息流中優(yōu)先呈現(xiàn)自己平臺上的視頻而非 YouTube 上的視頻[33];今日頭條會向用戶優(yōu)先推薦自己平臺(頭條號)中的資訊[34]。因此搜索引擎優(yōu)先顯示自己認證的網(wǎng)站也只不過是如法炮制而已。
算法既給學術(shù)期刊帶來了機遇,也帶來了風險。它對學術(shù)期刊的未來發(fā)展的影響是多方面的。本文指出算法權(quán)力對學術(shù)期刊的規(guī)訓,并不意味著要抵制算法在學術(shù)期刊中的應用,只是希望引起學界的重視,讓算法權(quán)力能得到應有的制衡與約束,從而維護學術(shù)期刊的正當權(quán)益。當然,“批判的武器不能代替武器的批判”,要想真正從算法困境中解脫出來,除了技術(shù)開發(fā)、法律監(jiān)管等方面的完善之外,學術(shù)期刊也需要開展自救,那么學術(shù)期刊能為自己做些什么呢?
面對算法時代的到來,學術(shù)期刊應端正自己的辦刊理念,不忘自己的初心與使命,即“學術(shù)期刊只是一個學術(shù)研究成果的展示和交流平臺……展示哲學社會科學研究領(lǐng)域的高水平研究成果,支持哲學社會科學領(lǐng)域優(yōu)秀學術(shù)人才成長,促進中外哲學社會科學研究的學術(shù)交流”是它“最基本的工作內(nèi)容”[35]。因此,在期刊評價上,不應過度追求各種排名與等級劃分,而應倡導多元評價,從而發(fā)揮期刊對評價體系的引導作用,以利于期刊評價體系的優(yōu)化與完善;在選題策劃上,不要盲目追隨熱點問題,而應根據(jù)期刊特色來組織選題;在審稿上,不要單純依賴學術(shù)不端檢測系統(tǒng)的檢測報告,還要對檢測報告的數(shù)據(jù)結(jié)果進行具體分析;在期刊傳播上,要重視官網(wǎng)建設(shè)以及搜索引擎的官方認證,做好自己力所能及的事情,維護自己的法定權(quán)利。
算法時代的快速來臨,直接將新聞媒體的“把關(guān)人”從編輯轉(zhuǎn)變?yōu)樗惴?,出現(xiàn)了“算法把關(guān)”的新現(xiàn)象,編輯的主體性遭到了消解。盡管與新聞媒體相比,在學術(shù)期刊界,算法并沒有完全取代編輯,但它也滲透進了學術(shù)期刊的選題策劃、審稿、傳播等環(huán)節(jié)之中,影響著編輯的選擇與判斷,在一定程度上削弱了學術(shù)期刊編輯的主體性。要矯正、彌補算法的弊端,就需要在算法時代重新確認與強調(diào)編輯的主體性,用人的主體性來彌補物的不足,即在編輯工作中不要過多依賴算法,不要迷信數(shù)據(jù),不要完全將選題與審稿的權(quán)力讓渡給算法,而應在充分利用算法于數(shù)據(jù)分析方面的優(yōu)勢的同時,結(jié)合編輯的經(jīng)驗來選稿、用稿、審稿。2021年6月,中宣部、教育部、科技部等三部委聯(lián)合印發(fā)《關(guān)于推動學術(shù)期刊繁榮發(fā)展的意見》(簡稱《意見》),為學術(shù)期刊的繁榮發(fā)展指明了方向?!兑庖姟访鞔_提出,應“提升編輯策劃與把關(guān)能力”“切實把好政治導向關(guān)、學術(shù)質(zhì)量關(guān)和價值取向關(guān)”??梢?,算法時代下學術(shù)期刊編輯不僅不應該讓算法取代自己進行把關(guān),從而弱化自己的把關(guān)人形象,相反,應該進一步強化自己的主體性,做算法的把關(guān)人。