摘要:隨著互聯(lián)網(wǎng)技術(shù)的普及,越來(lái)越多的人進(jìn)入被算法影響的環(huán)境。算法除了輔助人們高效處理各種復(fù)雜情況,也帶來(lái)了一些負(fù)面影響,可能會(huì)對(duì)人的權(quán)利、心理健康等方面產(chǎn)生惡劣影響。本文將已產(chǎn)生的算法問題按照算法至上、算法歧視、算法黑箱進(jìn)行分類,并剖析各類算法問題產(chǎn)生的根本原因,以期為我國(guó)算法治理領(lǐng)域提供新思路。
關(guān)鍵詞:互聯(lián)網(wǎng)技術(shù);算法問題;算法治理
第50次 《中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》顯示,截至2022年6月,我國(guó)網(wǎng)民規(guī)模為10.51億。網(wǎng)民人均每周上網(wǎng)時(shí)長(zhǎng)為29.5個(gè)小時(shí),較2021年12月提升1.0個(gè)小時(shí)。[1]從數(shù)據(jù)來(lái)看,人們上網(wǎng)時(shí)間越來(lái)越長(zhǎng),無(wú)論是何種目的、何種方式、何種設(shè)備使用互聯(lián)網(wǎng),都繞不開算法。處處存在的算法在方便人類的同時(shí),也產(chǎn)生了許多不容忽視的問題,正成為威脅人們精神狀況和認(rèn)知的潛在因素??茖W(xué)地認(rèn)識(shí)算法產(chǎn)生的衍生問題及其產(chǎn)生原因,采取合理的辦法進(jìn)行規(guī)避,是人們?cè)诟咚侔l(fā)展的信息社會(huì)中逆轉(zhuǎn)被動(dòng)地位的有效選擇。
一、算法至上
算法讓人的喜好無(wú)所遁形。用戶在某電子商務(wù)平臺(tái)買過商品,其他各種電子商務(wù)平臺(tái)都會(huì)在用戶打開頁(yè)面的一瞬間推送相關(guān)商品,有時(shí)甚至把同樣的商品反復(fù)推送。這種情況就是 “頭部效應(yīng)”和 “長(zhǎng)尾效應(yīng)”的推薦算法在隱匿地干涉人們的選擇?!伴L(zhǎng)尾”與 “頭部”是一組形象的比喻,人們認(rèn)為 “頭部”代表著大眾主流,那么商家就會(huì)把一些熱門的選擇反復(fù)推送,當(dāng)用戶多次搜索相同關(guān)鍵詞時(shí),發(fā)現(xiàn)總是會(huì)有相同的商品排靠在前,即使對(duì)它無(wú)感,它也仍舊出現(xiàn)。而 “長(zhǎng)尾”雖然代表著小眾或者是邊緣角落,鑒于稱得上是頭部的商品始終只是鳳毛麟角,所以我們可以認(rèn)為世界上絕大多數(shù)事物都是長(zhǎng)尾,而推薦算法能夠發(fā)現(xiàn)這一個(gè)個(gè)的小眾圈子,將極具特色化的商品推向相應(yīng)的小眾圈子。將此效應(yīng)應(yīng)用于算法有利于企業(yè)提供有針對(duì)性的服務(wù),提升業(yè)績(jī),但是在實(shí)際使用過程中,這種算法收縮了一部分用戶自主選擇的范圍:因?yàn)槟承┥唐蜂N售量好、評(píng)價(jià)好,所以容易被推薦,因?yàn)槿菀妆煌扑],所以點(diǎn)擊率上升、購(gòu)買量上升,能持續(xù)盤踞頭部,循環(huán)往復(fù)導(dǎo)致的行為正加權(quán),讓頭部效應(yīng)更加明顯,商家又利用大數(shù)據(jù)分析用戶的瀏覽習(xí)慣,發(fā)現(xiàn)用戶頻繁關(guān)注這些商品,便給用戶打上標(biāo)簽,然后經(jīng)過用戶畫像分析后,將它認(rèn)為最可能吸引用戶下單的商品優(yōu)先展示給用戶,最后,用戶看到的東西都是千篇一律的,沒什么新意。是算法將用戶的選擇局限在一個(gè)算法認(rèn)為合理的范圍。
現(xiàn)在已經(jīng)有公司采取特定算法來(lái)取代部分管理者的職責(zé)。用算法管理人數(shù)龐大的公司似乎是資本家們降低管理成本的好途徑,HR的工作可以被取代,低效能的員工也可以通過算法發(fā)掘出來(lái)直接裁掉,算法也可以讓便利蜂便利店的員工一切行動(dòng)都要上報(bào)并聽從系統(tǒng)指揮。[2]算法裁員、AI面試官、算法監(jiān)控……當(dāng)以往暢想的新工具真正應(yīng)用于現(xiàn)實(shí)生活中時(shí)人們才發(fā)現(xiàn),原來(lái)由算法主宰的工作竟是如此令人憤懣。被算法判定為不合格的員工,會(huì)直接被 “判死刑”,沒有解釋的余地,也沒有專攻于人力資源管理的人員對(duì)員工進(jìn)行再判斷,算法直接決定了人的去留。然而,被裁的員工不見得當(dāng)真不適宜當(dāng)前公司;被AI面試官拒絕的面試者也不見得能力不足,也可能是面對(duì)機(jī)械化的面試官感到不適應(yīng);被算法監(jiān)控支配得團(tuán)團(tuán)轉(zhuǎn)毫無(wú)自主性的便利店店員,也不見得真能為店鋪帶來(lái)最大收益。企業(yè)管理中人性化溫度被冷酷無(wú)情的算法取代,工作成績(jī)由唯效率至上的算法判斷,工作能力由衡量標(biāo)準(zhǔn)死板的算法評(píng)定,工作內(nèi)容由不知疲倦的算法來(lái)安排。當(dāng)然,想要完全由算法主導(dǎo)、用數(shù)字化技術(shù)管理企業(yè)還有很長(zhǎng)的一段路要走。
二、算法歧視
算法歧視是數(shù)字經(jīng)濟(jì)社會(huì)新產(chǎn)生的現(xiàn)象,包括但不限于算法人格歧視、算法性別歧視、算法價(jià)格歧視。由人類社會(huì)現(xiàn)有的數(shù)據(jù)作為輸入樣本,存在過度代表的嫌疑,經(jīng)由算法習(xí)得后,展現(xiàn)出來(lái)自技術(shù)的偏見,這種放大偏見差距的效果會(huì)經(jīng)由算法反復(fù)傳播,并且常常被使用者忽視。心理學(xué)中存在虛幻的真相效應(yīng) (Illusory Truth Effect),是指人們?cè)诜磸?fù)接觸同一信息后,出現(xiàn)相信信息是正確的傾向。人們接觸到的技術(shù)偏見反復(fù)疊加,虛幻的真相效應(yīng)帶來(lái)的隱性記憶會(huì)導(dǎo)致個(gè)體對(duì)算法呈現(xiàn)出的偏見逐漸深信不疑,最終再次加劇人類社會(huì)中已存在的歧視事實(shí)。
美國(guó)使用預(yù)測(cè)性警務(wù)技術(shù)來(lái)預(yù)防暴力犯罪,并已為超過40萬(wàn)人評(píng)定了可能犯罪的 “高風(fēng)險(xiǎn)”等級(jí)。該工具使用種族作為預(yù)測(cè)因子,警察局會(huì)依據(jù)預(yù)測(cè)結(jié)果將警察派往他們以前監(jiān)管過的地方巡察,結(jié)果增加了對(duì)非白人社區(qū)的過度監(jiān)管。與此同時(shí),警察部門在少數(shù)族裔居民為主的貧困社區(qū)往往會(huì)更多使用預(yù)測(cè)性技術(shù)。[3]倘若新興的算法是依賴過去存在種族偏見甚至法律不完備時(shí)期產(chǎn)生的數(shù)據(jù)運(yùn)作,那么靠算法來(lái)決定哪些社區(qū)重點(diǎn)接受治安管理、哪些家庭會(huì)受到重點(diǎn)監(jiān)控、哪些個(gè)人會(huì)受到重點(diǎn)盤查,是極其荒誕無(wú)理的,這只能延續(xù)和復(fù)制刑事司法中的歧視性結(jié)構(gòu)。執(zhí)法機(jī)構(gòu)和法院都在過度依賴算法工具,使長(zhǎng)期存在的種族歧視更加固化,損害了公民的人格,破壞人權(quán),是對(duì)人格的歧視與侮辱,最終還將加劇種族之間的沖突。
算法中的性別歧視也屢見不鮮。某語(yǔ)音翻譯就已經(jīng)出現(xiàn)將幼師、小學(xué)教師職業(yè)與 “她”掛鉤,將高中教師、研究生導(dǎo)師與 “他”掛鉤的翻譯方式。亞馬遜公司篩選招聘簡(jiǎn)歷的算法系統(tǒng)會(huì)給包含 “女性”相關(guān)詞匯的簡(jiǎn)歷低分。人們常使用的人工智能助手基本默認(rèn)使用的全都是女聲。這些現(xiàn)象的產(chǎn)生是機(jī)器經(jīng)過大數(shù)據(jù)搜集后,對(duì)人們語(yǔ)言習(xí)慣的習(xí)得,這一學(xué)習(xí)固化了性別印象,潛意識(shí)傳遞出性別歧視。
大數(shù)據(jù)殺熟具有普遍性、隱蔽性、反復(fù)性。隨著智能手機(jī)的普及以及用戶對(duì)于智能手機(jī)的依賴程度加深,互聯(lián)網(wǎng)企業(yè)對(duì)于用戶的信息收集正變得越來(lái)越全面、越來(lái)越精細(xì),應(yīng)用強(qiáng)大的算力和巧妙的算法,互聯(lián)網(wǎng)公司可以從存儲(chǔ)在用戶本地終端上的數(shù)據(jù)、存儲(chǔ)在云端服務(wù)器上的數(shù)據(jù)中抽絲剝繭,追蹤和預(yù)測(cè)消費(fèi)者的興趣。沒有經(jīng)營(yíng)者愿意放棄對(duì)于用戶的分析。由于用戶的消費(fèi)習(xí)慣各不相同,受到推薦的商品、被展示的商品界面也千人千面,用戶之間很難對(duì)比,無(wú)從得知自己的消費(fèi)價(jià)格是否異于其他消費(fèi)者。相比于傳統(tǒng)的價(jià)格歧視,大數(shù)據(jù)殺熟很難被發(fā)現(xiàn),因此受害者范圍可能會(huì)更大。
三、算法黑箱
在以算法為核心的數(shù)字時(shí)代中,越來(lái)越多新型控制出現(xiàn),它們并非束縛人們的人身自由,而是隱匿在我們普通人所熟悉的操作中,對(duì)使用者的行為進(jìn)行干涉,以滿足算法設(shè)計(jì)方的意圖。其中,算法黑箱導(dǎo)致的新型控制占大多數(shù)?!八惴ê谙洹笔侵赣捎诩夹g(shù)本身具有專業(yè)性,難以被除設(shè)計(jì)人員外的使用者知悉算法的具體內(nèi)容,算法猶如一個(gè)未知的 “黑箱”,其設(shè)計(jì)目標(biāo)、意圖、信息獲取與使用、責(zé)任歸屬等信息均不透明,難以有效監(jiān)督。
風(fēng)靡一時(shí)的消除小游戲 “羊了個(gè)羊”被玩家指出是騙局:以難度高做噱頭,號(hào)稱 “據(jù)說只有0.01%的人可以通關(guān)”,實(shí)際是游戲并未精心設(shè)計(jì),游戲過程生成牌面存在完全隨機(jī)性,甚至可能在一開始就是一個(gè)死局,不可能通關(guān),吸引玩家靠觀看廣告獲得洗牌機(jī)會(huì),達(dá)到營(yíng)利的目的。由于算法不透明,用戶很難知道自己參與的活動(dòng)是否具有公平性,知情權(quán)難以得到保障。以 “羊了個(gè)羊”為例,在網(wǎng)上揭露游戲存在漏洞、明確游戲真實(shí)邏輯的有兩類人:一類是專業(yè)的程序員,通過解包等具有技術(shù)門檻的操作,直接發(fā)現(xiàn)游戲存在死局;一類是付出大量時(shí)間與精力的游戲玩家,通過反復(fù)測(cè)試得出游戲無(wú)法通關(guān)的結(jié)論。由此可見,揭露一個(gè)算法是否存在操縱概率的可能需要消耗大量的時(shí)間成本,只有少數(shù)人明白 “真實(shí)的算法”。
算法黑箱背景下概率操縱最嚴(yán)重的后果是成癮問題。類似于賭徒心理,不明真相的玩家在輕而易舉通過第一關(guān)后,獲得正向激勵(lì),在第二關(guān)中玩家一遍一遍通過看廣告得到道具來(lái)企圖通過第二關(guān),道具用光、游戲失敗后又重新開啟第一輪,再次獲得正向激勵(lì),不知不覺沉迷于其中,甚至挑戰(zhàn)上百次只為通關(guān),逐漸形成心理執(zhí)念。殊不知并非勇于嘗試就會(huì)成功,通不通關(guān)早就由設(shè)計(jì)者決定好了,注定不會(huì)通關(guān)的游戲只是希望玩家沉迷于此,多多觀看廣告,事實(shí)上他們也確實(shí)做到了。
大數(shù)據(jù)在各行各業(yè)廣泛應(yīng)用,數(shù)以億計(jì)的用戶的行為活動(dòng)以數(shù)據(jù)的形式被各種渠道、各種設(shè)備搜集捕獲,用以分析和塑造用戶畫像。信息越多,用戶畫像越精確。一些企業(yè)出于某些原因,會(huì)假借已有的搜集渠道,超出正常范圍獲取更多用戶信息。用戶不僅隱私權(quán)難以得到保障,還承擔(dān)著額外的心理壓力。假如只是將數(shù)據(jù)交由機(jī)器分析,人們對(duì)于隱私泄露的擔(dān)憂還可能小一些 (但也無(wú)法排除有員工主動(dòng)獲取服務(wù)器上的用戶信息的可能性),但是數(shù)據(jù)直接交由真人數(shù)據(jù)助理分析顯然讓用戶難以接受。自己的隱私在不知情的狀態(tài)下不僅被他人聽到,而且還有被泄露到成千上萬(wàn)人面前的風(fēng)險(xiǎn)。在機(jī)器面前還能否有自由,成為了用戶實(shí)實(shí)在在的擔(dān)憂。
四、解決方案
從現(xiàn)實(shí)情況來(lái)看,算法使用過程中產(chǎn)生的衍生問題已經(jīng)給使用者帶來(lái)很多困擾,并且衍生問題早已超過了算法設(shè)計(jì)領(lǐng)域。
產(chǎn)生各類算法問題的原因大致可分為兩類:內(nèi)生性原因和外生性原因。
內(nèi)生性原因有兩點(diǎn):其一,算法設(shè)計(jì)者本身能力不足,對(duì)于問題的理解較為片面,導(dǎo)致其設(shè)計(jì)的算法解決問題片面、數(shù)據(jù)處理不精確、算法邏輯存在漏洞,致使結(jié)果呈現(xiàn)出意料之外的問題,這是無(wú)意識(shí)的設(shè)計(jì)導(dǎo)致算法問題;其二,算法設(shè)計(jì)者囿于創(chuàng)作背景、設(shè)計(jì)思路、投資人需求、問題導(dǎo)向的綜合考慮,并不能寫出不帶有預(yù)設(shè)立場(chǎng)的代碼,明知算法結(jié)果會(huì)引起爭(zhēng)議也仍要這樣設(shè)計(jì),這是參與人有意識(shí)的設(shè)計(jì)導(dǎo)致的算法問題頻生。
要想克服掉內(nèi)生性因素,需要社會(huì)諸多方面的努力。第一,算法設(shè)計(jì)者能力不足屬于個(gè)人客觀事實(shí)。通過提升程序員職業(yè)技能,提高從業(yè)人員的職業(yè)道德素質(zhì)培養(yǎng),就能夠克服能力不足這一客觀制約,從而有效維護(hù)市場(chǎng)公平,避免惡意競(jìng)爭(zhēng),從根源切斷產(chǎn)生算法問題的途徑。第二,偏見與刻板印象是長(zhǎng)久存在的社會(huì)事實(shí)。由于自然差別的存在,人們會(huì)自我歸類,將本族成員和他族成員區(qū)分開來(lái),賦予自己一個(gè)以族群為基礎(chǔ)的社會(huì)身份,并將社會(huì)身份納入自我概念中,導(dǎo)致人們對(duì)自己族群之外的人同理心偏低。這是正常現(xiàn)象,但是以此為基礎(chǔ)固化偏見、形成對(duì)于其他群體的歧視是需要警惕的。社會(huì)層面消除偏見,倡導(dǎo)機(jī)會(huì)公平,保障人身基本權(quán)利,能為糾正人們思維中潛在的歧視觀點(diǎn)營(yíng)造良好的氛圍。這就需要小族群內(nèi)保持開放包容,增強(qiáng)交流意愿;小族群之間加強(qiáng)聯(lián)系,促進(jìn)信息互通。內(nèi)生性因素的克服能很大程度上消除算法問題的根源。
外生性原因有三點(diǎn):其一,算法輸入的數(shù)據(jù)存在瑕疵,可能會(huì)導(dǎo)致算法結(jié)果出現(xiàn)問題。例如,輸入數(shù)據(jù)樣本容量過小,算法深度學(xué)習(xí)就會(huì)不足,導(dǎo)致無(wú)法準(zhǔn)確判斷甚至?xí)e(cuò)誤判斷數(shù)據(jù)之間的相關(guān)性,美國(guó)的預(yù)測(cè)性警務(wù)技術(shù)存在算法歧視的原因就在于此。其二,算法若遭遇攻擊被惡意篡改,可能會(huì)使模型出現(xiàn)偏差,繼而出現(xiàn)錯(cuò)誤計(jì)算結(jié)果。其三,使用者不當(dāng)使用,將算法脫離最初設(shè)定場(chǎng)景使用,錯(cuò)誤解讀算法結(jié)果,也可能導(dǎo)致算法問題。
這些不以算法原設(shè)計(jì)者意志為轉(zhuǎn)移的外在可能性無(wú)法消除,只能通過推廣規(guī)范化規(guī)則對(duì)其進(jìn)行約束。第一,數(shù)據(jù)集的采集與使用目前沒有明文規(guī)范,一般都是大公司提出要求,外包給數(shù)據(jù)采集員進(jìn)行采集。實(shí)際上,在數(shù)據(jù)采集完成之后,由承包公司自行診斷數(shù)據(jù)集是否完整健康是很有必要的。只有從源頭上控制數(shù)據(jù)完整合理,才能讓算法在無(wú)明顯缺點(diǎn)的情況下達(dá)成預(yù)計(jì)效果。第二,對(duì)于程序中某些存在的容易被黑客入侵的程序漏洞我們無(wú)能為力,但還是可以采取一些方式來(lái)最大限度地保護(hù)隱私。例如,在使用智能設(shè)備前,我們應(yīng)該了解設(shè)備的隱私條款,關(guān)注它會(huì)搜集什么信息、信息是否加密、在什么情況下會(huì)將信息上傳、會(huì)有什么人接收到這些信息、這些信息將被如何使用,并且考慮智能設(shè)備是否有聯(lián)網(wǎng)的必要,在不必要時(shí)不聯(lián)網(wǎng),聯(lián)網(wǎng)前清除敏感數(shù)據(jù)能最大限度避免隱私泄露。
五、結(jié)束語(yǔ)
算法的出現(xiàn),對(duì)于依賴于計(jì)算機(jī)工作的人著實(shí)便利不少,可是所有真實(shí)存在的事物皆逃不過柯美雅定律,算法也不會(huì)是十全十美的,也會(huì)有改革的余地。隨著算法在各個(gè)應(yīng)用程序中不斷更新迭代,人們?cè)絹?lái)越發(fā)現(xiàn)算法開始主宰自己的選擇。原本豐富多彩的選擇,因?yàn)橛辛艘恍┧惴ǖ拇嬖?,人們的自由選擇度大大降低,行使權(quán)利的自由受到限制。與算法便利使用相伴而來(lái)的算法的問題已經(jīng)到了不可忽視的地步,亟須更多人的關(guān)注。
參考文獻(xiàn):
[1] 中國(guó)互聯(lián)網(wǎng)絡(luò)信息中心發(fā)布第50次《中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》[J].國(guó)家圖書館學(xué)刊,2022,31(05):12.
[2] 羅真真.算法為王,數(shù)據(jù)存疑,便利蜂的 “系統(tǒng)” 試驗(yàn)[EB/OL]. [2021-12-17].https://new.qq.com/rain/a/20211217A0CNIA00.
[3] 唐穎俠.算法黑箱強(qiáng)化偏見 數(shù)字技術(shù)加劇美國(guó)的種族歧視[N].光明日?qǐng)?bào),2022-06-20(12).
作者簡(jiǎn)介: 張卓,女,漢族,山東濟(jì)寧人,碩士研究生在讀,研究方向:公共管理。