賈文娟 顏文茜
編者按:
與技術(shù)的加速鍵一起,在迅速飛馳的過(guò)去幾年中,新職業(yè)的出現(xiàn)以年、月甚至天為單位,不斷迭代。一個(gè)職業(yè)從出現(xiàn)、迎來(lái)高峰到消失,有時(shí)我們甚至來(lái)不及去了解。但在眼花繚亂的職業(yè)迭代背后,人們卻能清晰感受到勞動(dòng)形式和狀況正在發(fā)生劃時(shí)代的改變。那么這種變化是什么樣的?這些不同對(duì)我們的生活、勞動(dòng)關(guān)系和企業(yè)發(fā)展會(huì)帶來(lái)什么樣的影響?關(guān)于這些,我們?nèi)圆簧跚宄?/p>
上海大學(xué)社會(huì)學(xué)院副教授賈文娟和她的研究團(tuán)隊(duì)從2017年起開(kāi)始針對(duì)數(shù)字時(shí)代的新業(yè)態(tài)、新勞動(dòng)問(wèn)題展開(kāi)系列研究。本篇文章改寫(xiě)自論文《認(rèn)知?jiǎng)趧?dòng)與數(shù)據(jù)標(biāo)注中的勞動(dòng)控制——以N人工智能公司為例》的研究發(fā)現(xiàn)。原文作者賈文娟及其研究團(tuán)隊(duì)深入一線進(jìn)行田野調(diào)查,以數(shù)據(jù)標(biāo)注員的工作為例,向我們揭示了當(dāng)人的認(rèn)知成為創(chuàng)造財(cái)富的資源時(shí),企業(yè)如何管理人的認(rèn)知。
1770年,奧地利宮廷中,發(fā)明家沃爾夫?qū)ゑT·肯佩倫(Wolfgang von Kempelen)為取悅瑪麗亞·特蕾莎女大公,宣稱(chēng)將表演一場(chǎng)史無(wú)前例的魔術(shù)。魔術(shù)內(nèi)容是一種可以自動(dòng)下棋的機(jī)器裝置,被稱(chēng)作“The Turk”(土耳其行棋傀儡)。這臺(tái)機(jī)器被雕刻為人形,身著土耳其長(zhǎng)袍,坐在一個(gè)帶有棋盤(pán)的木制櫥柜之后,仿佛真的具有人類(lèi)的智慧與生命。
肯佩倫宣稱(chēng)這臺(tái)機(jī)器可以打敗任何皇室成員,一位宮廷謀士應(yīng)戰(zhàn),果然不到30分鐘就被擊敗。而后的十年,肯佩倫帶著“The Turk”巡游整個(gè)歐洲并取得了驚人的戰(zhàn)績(jī),據(jù)說(shuō)他的手下敗將甚至包括本杰明·富蘭克林(Benjamin Franklin)和拿破侖。直到1857年,《國(guó)際象棋月刊》才發(fā)文揭露,贏過(guò)所有人的并非這臺(tái)機(jī)器,而是藏在櫥柜中的象棋高手。
2005年,亞馬遜推出平臺(tái)Amazon Mechanical Turk。彼時(shí),亞馬遜正在將CD碟片引入自家的產(chǎn)品線。亞馬遜希望通過(guò)該平臺(tái),借助小額的經(jīng)濟(jì)激勵(lì)招募網(wǎng)友為其工作,幫助檢查上架的CD專(zhuān)輯名是否正確,并審核封面是否適合未成年人瀏覽。這種借助人的認(rèn)知能力作為生產(chǎn)工具的方式,如今正在成為一項(xiàng)超過(guò)千億元規(guī)模的商業(yè)模式。
2022年,中國(guó)人工智能核心產(chǎn)業(yè)規(guī)模超過(guò) 4 000億元,企業(yè)數(shù)量超過(guò)3 000家,從事數(shù)據(jù)標(biāo)注的勞動(dòng)人口超過(guò)千萬(wàn)人。數(shù)據(jù)標(biāo)注員就是這個(gè)時(shí)代藏在AI背后的“象棋高手”。
隨著時(shí)間的推移,大眾對(duì)于機(jī)器越來(lái)越“智能”的現(xiàn)實(shí)早已習(xí)以為常,但對(duì)于機(jī)器是如何借助人的“智能”被設(shè)計(jì)、被訓(xùn)練與被驅(qū)動(dòng)卻知之甚少。
“人工智能”即機(jī)器模仿人的方式進(jìn)行認(rèn)知,這種認(rèn)知訓(xùn)練需要依靠大量可被機(jī)器識(shí)別的數(shù)據(jù)不斷地進(jìn)行“喂養(yǎng)“。例如,人工智能并不能天然識(shí)別出圖片上出現(xiàn)的人臉,只有當(dāng)人臉的關(guān)鍵點(diǎn)位被按照機(jī)器程序設(shè)定的方式標(biāo)注出來(lái)之后,計(jì)算機(jī)才能建立起對(duì)人臉的認(rèn)知。數(shù)據(jù)標(biāo)注員的工作,就是按照特定的方式及規(guī)范在原始數(shù)據(jù)上標(biāo)注出需要被機(jī)器學(xué)習(xí)的數(shù)據(jù)內(nèi)容。
依據(jù)算法應(yīng)用途徑的不同,數(shù)據(jù)標(biāo)注工作的類(lèi)型也是多種多樣的。常見(jiàn)的類(lèi)型有分類(lèi)標(biāo)注(從既定的標(biāo)簽中選擇數(shù)據(jù)應(yīng)當(dāng)對(duì)應(yīng)的類(lèi)型)、標(biāo)框標(biāo)注(在圖片中框選出特定目標(biāo)的位置)、區(qū)域標(biāo)注(標(biāo)注圖片中某個(gè)特殊區(qū)域)、描點(diǎn)標(biāo)注(如人臉中的關(guān)鍵點(diǎn)位標(biāo)注)和判斷類(lèi)標(biāo)注(如判斷語(yǔ)音素材的表意是否一致等)。而這些工作無(wú)一例外都會(huì)應(yīng)用到我們作為人的“默會(huì)知識(shí)”。
默會(huì)知識(shí)的概念由英國(guó)哲學(xué)家波蘭尼(Michael Polanyi)于1958年在《個(gè)體知識(shí)》一書(shū)中提出。默會(huì)知識(shí)是指一種通過(guò)實(shí)踐、經(jīng)驗(yàn)而獲得的知識(shí),難以用語(yǔ)言、文字或數(shù)字進(jìn)行表達(dá)。其本質(zhì)是一種理解力、領(lǐng)悟力和判斷力的結(jié)合,即人的認(rèn)知。
例如,人類(lèi)擅長(zhǎng)從模糊的照片中挑選出特定的物體,因?yàn)槿祟?lèi)有一種方法可以將事物與其存在的背景進(jìn)行區(qū)分。這種能力被應(yīng)用于區(qū)分人和機(jī)器的“驗(yàn)證碼”,雖然看起來(lái)都是極為簡(jiǎn)單的問(wèn)題,但需要調(diào)動(dòng)人的“默會(huì)知識(shí)”,而這一點(diǎn)對(duì)機(jī)器來(lái)說(shuō)卻非常困難,這也是驗(yàn)證碼體系成立的前提。
為數(shù)據(jù)打上標(biāo)簽是一種只需培訓(xùn)很短時(shí)間就可以上手的簡(jiǎn)單勞動(dòng)(一般半天至1天,訪談中最多的為2天),標(biāo)注員不需要掌握任何ICT(Information and Communication Technology)專(zhuān)業(yè)知識(shí)。在筆者進(jìn)行田野調(diào)研的團(tuán)隊(duì)中,標(biāo)注員常常自嘲“這個(gè)工作小學(xué)生都可以做”。某種程度而言,數(shù)據(jù)標(biāo)注員在勞動(dòng)過(guò)程中的作用與流水線工人、麥當(dāng)勞服務(wù)員是相似的。
區(qū)別在于,勞動(dòng)者不再是機(jī)械化流水線的一環(huán),而是成為幫助機(jī)器分辨和接受外界信息的感覺(jué)器官。
在工廠生產(chǎn)中,提升勞動(dòng)率的核心主要集中在提升人工的機(jī)械勞動(dòng)效率,以獲得與機(jī)器更高的配合速率,因此標(biāo)準(zhǔn)化的勞動(dòng)規(guī)范與管理能最大限度實(shí)現(xiàn)這一效果。但是,當(dāng)人的智能成為成產(chǎn)工具,傳統(tǒng)的管理方法則日漸失效,因?yàn)槿祟?lèi)的認(rèn)知方式千差萬(wàn)別。
具體到數(shù)據(jù)標(biāo)注工作,正因?yàn)橛?jì)算機(jī)無(wú)法識(shí)別現(xiàn)實(shí)的復(fù)雜可能性,才需要?jiǎng)趧?dòng)者調(diào)動(dòng)“默會(huì)知識(shí)”來(lái)補(bǔ)充機(jī)器認(rèn)知的不足,所以對(duì)標(biāo)準(zhǔn)化的過(guò)分強(qiáng)調(diào)甚至可能會(huì)阻礙勞動(dòng)者對(duì)認(rèn)知的充分發(fā)揮。
筆者及研究團(tuán)隊(duì)在進(jìn)行田野調(diào)查中發(fā)現(xiàn),認(rèn)知?jiǎng)趧?dòng)管理的核心在于推動(dòng)勞動(dòng)者認(rèn)知模式的轉(zhuǎn)換——從人類(lèi)的自然認(rèn)知模式轉(zhuǎn)化為計(jì)算機(jī)需要的產(chǎn)生式認(rèn)知模式。因此,盡管數(shù)據(jù)標(biāo)注工作的難度并不高,但提升勞動(dòng)效率卻遠(yuǎn)比想象中困難。
從田野調(diào)查的實(shí)踐來(lái)看,推動(dòng)認(rèn)知模式的轉(zhuǎn)變,需要經(jīng)歷以下幾個(gè)步驟。
(一)認(rèn)知標(biāo)準(zhǔn)化:從規(guī)則制定到實(shí)踐練習(xí)
未經(jīng)訓(xùn)練的數(shù)據(jù)標(biāo)注員,頭腦中持有的都是關(guān)于外在世界的自然認(rèn)知,并呈現(xiàn)出模糊、含混、雜亂等特征。以哆啦A夢(mèng)的圖片為例,可能會(huì)產(chǎn)生貓、機(jī)器人、機(jī)器貓等不同判斷,難以滿(mǎn)足算法模型需要的“標(biāo)準(zhǔn)數(shù)據(jù)”。因而,推動(dòng)標(biāo)注員認(rèn)知模式轉(zhuǎn)化的首要環(huán)節(jié)就是認(rèn)知標(biāo)準(zhǔn)化。
管理方通過(guò)兩種不同方式來(lái)完成,首先是用書(shū)面文件約定“標(biāo)注細(xì)則“,設(shè)定一定的認(rèn)知標(biāo)尺,通過(guò)事無(wú)巨細(xì)的流程標(biāo)注來(lái)指導(dǎo)標(biāo)注員們的具體勞動(dòng)。但文件不能窮盡現(xiàn)實(shí)中的所有情況,而針對(duì)文字內(nèi)容的理解本身也存在不小的認(rèn)知差異?;诖?,管理方又進(jìn)行標(biāo)注培訓(xùn),通過(guò)標(biāo)注示例的演示來(lái)統(tǒng)一認(rèn)知。但管理方對(duì)培訓(xùn)卻并未抱有過(guò)高的期待,單次、單純的講解培訓(xùn)并不能使標(biāo)注員完全消化和掌握細(xì)則,他們還需要在實(shí)踐中逐步練習(xí)。
(二)認(rèn)知反饋:多重反饋機(jī)制的建立
當(dāng)標(biāo)注員們領(lǐng)會(huì)了管理方的要求后,他們就要開(kāi)始在實(shí)踐中調(diào)整自己的認(rèn)知模式。但這并非是由意愿能決定的活動(dòng),因而及時(shí)反饋(調(diào)研顯示,一般為培訓(xùn)后的3至4天內(nèi))就變得重要。管理方不僅要求標(biāo)注員在工作中及時(shí)反思,發(fā)現(xiàn)認(rèn)知偏誤,還鼓勵(lì)其隨時(shí)與管理方進(jìn)行溝通,反饋出現(xiàn)的問(wèn)題。
此外,管理方也鼓勵(lì)標(biāo)注員同事之間就工作中的問(wèn)題提出討論。在及時(shí)反饋與討論中,標(biāo)注員的認(rèn)知行為逐漸走向統(tǒng)一。而在勞動(dòng)中,對(duì)于標(biāo)注員的錯(cuò)誤,管理方也會(huì)在以略帶懲罰性的公示或批評(píng)等形式警示犯錯(cuò)者的同時(shí),一同提醒并修正其他標(biāo)注員的認(rèn)知。
基于反饋與溝通在推動(dòng)認(rèn)知改變過(guò)程中的重要意義,被調(diào)研團(tuán)隊(duì)的管理方也提到了在招聘標(biāo)注員時(shí),善于溝通和表達(dá)的候選者往往更受歡迎。
(三)認(rèn)知加速的雙重策略:遏制主觀認(rèn)知與重復(fù)操作
認(rèn)知?jiǎng)趧?dòng)的推進(jìn)是個(gè)繁復(fù)、曲折的過(guò)程。在認(rèn)知標(biāo)準(zhǔn)化和認(rèn)知反饋的過(guò)程之后,還需要認(rèn)知加速來(lái)推動(dòng)標(biāo)注員最大限度提升認(rèn)知系統(tǒng)的轉(zhuǎn)化。在筆者進(jìn)行調(diào)研的團(tuán)隊(duì)中,認(rèn)知加速主要依賴(lài)以下幾個(gè)策略。
第一,標(biāo)注員全面遏制自身主觀認(rèn)知,拋棄對(duì)標(biāo)注細(xì)則和計(jì)算機(jī)邏輯的所有猶疑。有標(biāo)注員在訪談中提到,在這一階段,當(dāng)面對(duì)自己非常難以理解的矛盾時(shí),她會(huì)立刻進(jìn)行自我遏制:“不要想那么多!”有經(jīng)驗(yàn)的標(biāo)注員也會(huì)給出建議:“你不要總想著自己在圖片上看到了什么,要根據(jù)規(guī)則去想機(jī)器能識(shí)別到什么?!?/p>
第二個(gè)策略是標(biāo)注員通過(guò)持久而快速的重復(fù)操作,加快自身的認(rèn)知反應(yīng)?!斑^(guò)一段時(shí)間就會(huì)發(fā)現(xiàn),它就是一個(gè)簡(jiǎn)單的重復(fù)性勞動(dòng),一定要耐得住性子,不要想太多。”團(tuán)隊(duì)中速度最快的標(biāo)注員這樣總結(jié)自己的心得。在認(rèn)知心理學(xué)理論中,認(rèn)知行為的不斷重復(fù)能夠有效刺激動(dòng)物的認(rèn)知反應(yīng)速度,強(qiáng)化學(xué)習(xí)行為,并將一系列原本需要思考才能實(shí)現(xiàn)的知識(shí)與技能轉(zhuǎn)變?yōu)閼T性下的無(wú)意識(shí)操作。該策略與這一理論不謀而合。此外,管理方還通過(guò)漸進(jìn)地增加標(biāo)注額度等辦法,促進(jìn)提升團(tuán)隊(duì)的整體速度。
在人工智能數(shù)據(jù)工作的場(chǎng)景下,管理者從對(duì)勞動(dòng)者身體層面的物理控制,過(guò)渡為推動(dòng)認(rèn)知層面的思維轉(zhuǎn)變。對(duì)管理者而言,一方面要借助人類(lèi)的自有認(rèn)知,讓其發(fā)揮“默會(huì)知識(shí)”;另一方面又要規(guī)范勞動(dòng)者的認(rèn)知,使其按照機(jī)器需要的方式進(jìn)行。因?yàn)楣芾矸叫枰谶@兩者間尋求平衡,所以認(rèn)知?jiǎng)趧?dòng)者所面對(duì)的勞動(dòng)管理與控制也不再僵硬、刻板,而愈加呈現(xiàn)出靈活、深入的特征。
在日復(fù)一日的機(jī)械重復(fù)和相對(duì)廉價(jià)的經(jīng)濟(jì)收獲中,大多數(shù)進(jìn)行簡(jiǎn)單勞動(dòng)的數(shù)據(jù)標(biāo)注員或多或少產(chǎn)生了獲得感的缺失(筆者所調(diào)研的標(biāo)注團(tuán)隊(duì)中,56%為外包員工,工資4 000~5 000元/月;30%為實(shí)習(xí)生,酬金100~200元/天)。
“做這個(gè)是學(xué)不到任何技術(shù)的,每天都做一樣的活兒,長(zhǎng)期這樣不動(dòng)腦,腦子會(huì)生銹的?!边@是一種典型的感受,在這種情況下,勞動(dòng)者往往會(huì)把這份工作當(dāng)作特定時(shí)期的過(guò)渡,而不愿投入過(guò)多熱情。同時(shí),他們也會(huì)采取偷懶、“摸魚(yú)”等方式來(lái)爭(zhēng)取更多自由的空間,以對(duì)抗一種作為“機(jī)器感覺(jué)器官”的異化體驗(yàn)。
面對(duì)管理方嚴(yán)苛的定額要求時(shí),他們也會(huì)采取聯(lián)合限制產(chǎn)量等更加隱蔽、柔和的對(duì)抗方式。而來(lái)自產(chǎn)品經(jīng)理、算法程序員、標(biāo)注組長(zhǎng)的三方共同管理模式,也在一定程度上會(huì)對(duì)標(biāo)注員的工作帶來(lái)困擾。高流動(dòng)率是數(shù)據(jù)標(biāo)注行業(yè)人員管理所面臨的另一個(gè)重要難題。管理者雖然能在短期內(nèi)獲取盡可能多的剩余勞動(dòng),但很難從長(zhǎng)期角度阻止勞動(dòng)者的主動(dòng)逃離。
為應(yīng)對(duì)這些問(wèn)題,我們可以看到近年來(lái)數(shù)據(jù)標(biāo)注行業(yè)雇傭的勞動(dòng)力群體正在從一二線城市向經(jīng)濟(jì)欠發(fā)達(dá)地區(qū)轉(zhuǎn)移。雖然可以在一定程度上依靠經(jīng)濟(jì)利益吸引一部分較為穩(wěn)定的勞動(dòng)力,但勞動(dòng)者群體普遍教育背景的降低也會(huì)帶來(lái)認(rèn)知轉(zhuǎn)化管理難度的增加。
人類(lèi)學(xué)家瑪麗·L.格雷(Mary L. Gray)和計(jì)算機(jī)科學(xué)家西達(dá)爾特·蘇里(Siddharth Suri)在《銷(xiāo)聲匿跡:數(shù)字化工作的真正未來(lái)》一書(shū)中提到了這樣的觀點(diǎn):自動(dòng)化的最大悖論在于,使人類(lèi)免于勞動(dòng)的愿望總是給人類(lèi)帶來(lái)新的任務(wù)。而在技術(shù)走向自動(dòng)化的漫長(zhǎng)歷史中,很關(guān)鍵的一點(diǎn)是對(duì)臨時(shí)勞動(dòng)力的依賴(lài)。
今天的人工智能數(shù)據(jù)標(biāo)注員群體,就是當(dāng)下發(fā)展中臨時(shí)勞動(dòng)力的最新迭代。在這一前沿,臨時(shí)工的高峰和低谷不斷轉(zhuǎn)換,這重新定義了人類(lèi)和機(jī)器的關(guān)系。而在人與機(jī)器的動(dòng)態(tài)關(guān)系中,如何掌握身為人的主動(dòng)權(quán),對(duì)抗機(jī)器異化是每一個(gè)勞動(dòng)者時(shí)刻面對(duì)的現(xiàn)實(shí),也是管理者在各方平衡中需要謹(jǐn)慎面對(duì)的問(wèn)題。
【*論文原文:《認(rèn)知?jiǎng)趧?dòng)與數(shù)據(jù)標(biāo)注中的勞動(dòng)控制——以N人工智能公司為例》,刊載于《社會(huì)學(xué)研究》2022年第5期】