【內(nèi)容提要】在人工智能迅猛發(fā)展的背景下,東南亞地區(qū)因其地理便捷、文化趨近和年輕龐大的互聯(lián)網(wǎng)人口,日益成為AI“出?!钡臒嵬?,構(gòu)成了國(guó)際傳播的新議題。數(shù)據(jù)生命周期的視角揭示了AI“出?!痹跀?shù)據(jù)生成采集、傳輸存儲(chǔ)、處理應(yīng)用、維護(hù)解釋四個(gè)階段的數(shù)據(jù)合規(guī)問(wèn)題,促進(jìn)了國(guó)際傳播的知識(shí)生產(chǎn)轉(zhuǎn)向。相較于西方跨國(guó)公司奉行數(shù)據(jù)擢取主義造成惡性事件,我國(guó)科技企業(yè)遵循東盟國(guó)家的《個(gè)人信息保護(hù)法》和人工智能監(jiān)管法案,聯(lián)合多方主體構(gòu)建開(kāi)源數(shù)據(jù)集、在本地興建綠色高效的數(shù)據(jù)中心,為對(duì)象國(guó)培育數(shù)字人才,從而以包容、普惠和可持續(xù)發(fā)展的態(tài)度踐行了“一帶一路”倡議的“五通”理念。
一、人工智能企業(yè)“出?!睎|南亞:國(guó)際傳播的新議題
以ChatGPT的發(fā)布為標(biāo)志,從大語(yǔ)言模型(LLM)到垂類應(yīng)用的各類人工智能產(chǎn)品正在席卷世界市場(chǎng)。中國(guó)互聯(lián)網(wǎng)絡(luò)信息中心(CNNIC)的最新數(shù)據(jù)顯示,我國(guó)已擁有4500多家人工智能企業(yè),核心產(chǎn)業(yè)規(guī)模接近6000億人民幣,產(chǎn)業(yè)鏈覆蓋芯片、算法、數(shù)據(jù)、平臺(tái)、應(yīng)用等上下游環(huán)節(jié),備案上線的AI大模型就有190多個(gè)。①出于擴(kuò)大市場(chǎng)份額、強(qiáng)化技術(shù)優(yōu)勢(shì)、豐富應(yīng)用場(chǎng)景、深化經(jīng)貿(mào)合作等方面的考慮,AI“出?!眲?shì)在必行。而東南亞地區(qū)憑借便捷的地理位置、年輕龐大的人口和文化趨同性,日益成為中國(guó)科技企業(yè)出海的熱門地。據(jù)全球統(tǒng)計(jì)平臺(tái)Statista推測(cè),2024年?yáng)|南亞的人工智能市場(chǎng)規(guī)模達(dá)67.2億美元,并有望在未來(lái)五年內(nèi)以近 30% 的年復(fù)合增長(zhǎng)率形成300億美元當(dāng)量的超級(jí)市場(chǎng)。②
相較于2009年后獵豹、UC、360等工具化應(yīng)用的第一波“出?!背保约?016年后共享單車、移動(dòng)支付等移動(dòng)互聯(lián)網(wǎng)模式帶動(dòng)的第二波“出?!背?,如今以人工智能為驅(qū)動(dòng)引擎、通過(guò)技術(shù)差異化優(yōu)勢(shì)提供產(chǎn)品與服務(wù)的第三波“出?!背币呀?jīng)預(yù)示了我國(guó)科技企業(yè)在技術(shù)范式上的創(chuàng)新。 “出?!钡闹匾?,不僅在于它對(duì)新興海外市場(chǎng)的開(kāi)辟,還因?yàn)樗罱似渌袠I(yè)“出?!钡臄?shù)字基礎(chǔ)設(shè)施,具有托舉產(chǎn)業(yè)轉(zhuǎn)型升級(jí)的意義。中國(guó)的AI應(yīng)用也在積極融入東南亞百姓的衣食住行,成為其日常生活基礎(chǔ)設(shè)施。這在主流媒體宣傳之外開(kāi)辟了“講好中國(guó)故事”的新場(chǎng)所,深化了從媒介到平臺(tái)的國(guó)際傳播認(rèn)識(shí)論轉(zhuǎn)變。
在“一帶一路”倡議的語(yǔ)境下,AI“出?!睎|南亞應(yīng)視為一種基于利益共享和共同發(fā)展的理念、團(tuán)結(jié)“全球南方”、超越西方現(xiàn)代化取模式,進(jìn)而開(kāi)辟更具自主性和包容性的國(guó)際傳播道路的實(shí)踐。有鑒于此,本文將闡釋分析我國(guó)人工智能企業(yè)如何有別于西方科技公司,積極助力東南亞國(guó)家的基礎(chǔ)設(shè)施建設(shè)和社會(huì)治理,提供平等發(fā)展機(jī)會(huì),從而為推動(dòng)構(gòu)建人類命運(yùn)共同體貢獻(xiàn)力量。
二、探究AI“出?!钡臄?shù)據(jù)流動(dòng):國(guó)際傳播的知識(shí)生產(chǎn)轉(zhuǎn)向
人工智能由數(shù)據(jù)處理、機(jī)器學(xué)習(xí)和業(yè)務(wù)行動(dòng)三個(gè)部分構(gòu)成,數(shù)據(jù)(data)是貫穿產(chǎn)品全生命鏈條的核心要素。如果沒(méi)有經(jīng)過(guò)廣泛、使用預(yù)定義規(guī)則和獎(jiǎng)勵(lì)條件的大型數(shù)據(jù)庫(kù)的計(jì)算密集型訓(xùn)練,AI系統(tǒng)就無(wú)法識(shí)別任何東西、實(shí)現(xiàn)自主和理性,它本身就依賴于廣泛的政治與社會(huì)結(jié)構(gòu)。即使眾多學(xué)者均意識(shí)到了AI對(duì)國(guó)際傳播的重大影響,仍鮮有人關(guān)注數(shù)據(jù)流動(dòng)問(wèn)題,這既揭示了國(guó)際傳播研究的盲點(diǎn),也促使我們思考知識(shí)生產(chǎn)的轉(zhuǎn)向。
有學(xué)者對(duì)近十年間國(guó)內(nèi)的國(guó)際傳播研究進(jìn)行了梳理,發(fā)現(xiàn)該領(lǐng)域的研究對(duì)象已從國(guó)家主流媒體轉(zhuǎn)向參與跨國(guó)信息流動(dòng)的多元主體,其理論資源也從宏觀的國(guó)家軟實(shí)力敘事轉(zhuǎn)向微觀的跨文化共情。不過(guò),無(wú)論是文化傳播、話語(yǔ)體系、國(guó)家形象、傳播現(xiàn)象等高頻議題,或是“借船出?!薄霸齑龊!边@兩個(gè)知名隱喻,國(guó)際傳播研究始終存在著眼于“可見(jiàn)”的內(nèi)容,而忽視“不可見(jiàn)”的數(shù)據(jù)的情況。在此,人工智能只是運(yùn)輸內(nèi)容、被實(shí)體化的管道,其基礎(chǔ)設(shè)施、勞動(dòng)力、自然資源、物流、歷史等裝配(assemblage)要素并未得到充分的拆解。
本文認(rèn)為,從數(shù)據(jù)流動(dòng)的角度闡釋AI“出?!睎|南亞現(xiàn)象,可以呼應(yīng)國(guó)際傳播知識(shí)生產(chǎn)的三重轉(zhuǎn)向:對(duì)象上,從主流媒體轉(zhuǎn)向科技企業(yè);焦點(diǎn)上,從文本內(nèi)容轉(zhuǎn)向數(shù)據(jù)規(guī)制;理念上,從主體性的“宣傳”轉(zhuǎn)向主體間性的“溝通”。因?yàn)槠髽I(yè)出海后總是需要研究東道國(guó)的法律規(guī)制,與當(dāng)?shù)卣e極溝通,圍繞監(jiān)管政策調(diào)整業(yè)務(wù)模式,從而保證本地化過(guò)程中合法合規(guī)的經(jīng)營(yíng)。具體而言,摒棄數(shù)據(jù)流動(dòng)和隱私保護(hù)之間的二元對(duì)立,將數(shù)據(jù)視為數(shù)字經(jīng)濟(jì)賴以維系的生產(chǎn)資料,從東道國(guó)數(shù)據(jù)政策與企業(yè)實(shí)踐的協(xié)商中探究數(shù)據(jù)合規(guī)之道,將是可行的分析思路。這也貫徹了政策溝通、設(shè)施聯(lián)通、貿(mào)易暢通、資金融通、民心相通的“一帶一路”倡議的精神。
三、數(shù)據(jù)生命周期管理:AI“出?!睎|盟六國(guó)的數(shù)據(jù)合規(guī)審視
“棱鏡門”丑聞后,世界各國(guó)都格外重視公民隱私和數(shù)據(jù)保護(hù),因此,如何在合規(guī)條件下采集、傳輸、存儲(chǔ)、處理數(shù)據(jù)成為“出?!盇I企業(yè)必須直面的問(wèn)題。本文引入數(shù)據(jù)生命周期管理(datalifecirclemanagement,DLM)的視角來(lái)概念化數(shù)據(jù)流動(dòng)?!吧芷凇痹赣袡C(jī)體的演化規(guī)律,在引入信息工程領(lǐng)域后專指機(jī)構(gòu)管理數(shù)據(jù)的動(dòng)態(tài)過(guò)程。根據(jù)實(shí)際研究需要,數(shù)據(jù)生命周期會(huì)被劃分為不同階段:美國(guó)國(guó)家工程院院士周以真(JeannetteM.Wing)區(qū)分了數(shù)據(jù)生成、數(shù)據(jù)采集、數(shù)據(jù)處理、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)管理、數(shù)據(jù)分析、數(shù)據(jù)可視化、數(shù)據(jù)解釋八大環(huán)節(jié)。有學(xué)者在綜述英國(guó)數(shù)字管護(hù)中心、美國(guó)國(guó)家科學(xué)基金會(huì)、國(guó)際數(shù)據(jù)管理協(xié)會(huì)等模型的基礎(chǔ)上,概括出“數(shù)據(jù)創(chuàng)建一數(shù)據(jù)采集一數(shù)據(jù)傳輸一數(shù)據(jù)儲(chǔ)存-數(shù)據(jù)處理-數(shù)據(jù)使用-數(shù)據(jù)維護(hù)-數(shù)據(jù)銷毀”的關(guān)系鏈。
本文將數(shù)據(jù)生命周期管理精簡(jiǎn)為數(shù)據(jù)生成采集、傳輸存儲(chǔ)、處理應(yīng)用和維護(hù)解釋四個(gè)階段,以評(píng)估我國(guó)AI企業(yè)在東南亞的國(guó)際傳播開(kāi)展情況。需要特別注意的是,東南亞地區(qū)既存在政治、文化和法律制度上的區(qū)域特色,其內(nèi)部又并非“鐵板一塊”,各國(guó)對(duì)AI的法律監(jiān)管與合規(guī)要求有所差異。鑒于AI“出?!钡膶?shí)際情況,本文梳理了新加坡、馬來(lái)西亞、泰國(guó)、越南、印度尼西亞、菲律賓六國(guó)的人工智能法案和《個(gè)人信息保護(hù)法》,并結(jié)合產(chǎn)業(yè)具體實(shí)踐,闡釋我國(guó)科技企業(yè)的數(shù)據(jù)合規(guī)狀況。
(一)數(shù)據(jù)生成采集:個(gè)人數(shù)據(jù)保護(hù)與開(kāi)源數(shù)據(jù)工程
采集獲取訓(xùn)練數(shù)據(jù)是構(gòu)建機(jī)器學(xué)習(xí)系統(tǒng)的基礎(chǔ),AI產(chǎn)業(yè)鏈上游的訓(xùn)練數(shù)據(jù)集的質(zhì)量在很大程度上決定了下游AI產(chǎn)品的服務(wù)體驗(yàn)。目前,訓(xùn)練數(shù)據(jù)主要來(lái)源于互聯(lián)網(wǎng)上用戶主動(dòng)分享的海量?jī)?nèi)容和傳感器捕獲的地理、生物信息。東南亞作為全球第三大人口聚集區(qū),人口年齡中位數(shù)不足30歲,互聯(lián)網(wǎng)滲透率為 76% ,增長(zhǎng)潛力大,擁有充沛、可采集的數(shù)據(jù)。不過(guò),美國(guó)人工智能社會(huì)學(xué)者凱特·克勞福德(KateCrawford)指出,數(shù)據(jù)的“石油”隱喻與“越多越好”的提取指令正在剝離關(guān)心、認(rèn)同或風(fēng)險(xiǎn)相關(guān)的責(zé)任,從而營(yíng)造一種剝削、侵入和掠奪式的國(guó)際數(shù)據(jù)提取文化,背后隱含著許多行業(yè)、機(jī)構(gòu)和個(gè)人的“殖民態(tài)度”—數(shù)據(jù)就在那里等待采集—他們不希望受到質(zhì)疑或監(jiān)管。@
數(shù)據(jù)提取主義的迷思反過(guò)來(lái)凸顯了遵守對(duì)象國(guó)《個(gè)人數(shù)據(jù)保護(hù)法》(PDPA)的必要性??v觀東盟六國(guó)的數(shù)據(jù)政策,雖然它們大致奉行“發(fā)展第一,監(jiān)管第二”的準(zhǔn)則,但也都頒布了限制數(shù)據(jù)采集、保護(hù)個(gè)人信息的相關(guān)法律,它們規(guī)定AI模型所采集的預(yù)訓(xùn)練數(shù)據(jù)必須有合法的來(lái)源,并強(qiáng)調(diào)個(gè)人信息的數(shù)據(jù)采集須獲得用戶的知情同意。例如,新加坡《個(gè)人數(shù)據(jù)保護(hù)法》(PDPA)將用戶的同意權(quán)細(xì)分為明確同意、事先同意、具體同意三類。2022年二手交易平臺(tái)Carousell因未經(jīng)用戶許可的數(shù)據(jù)采集遭到新加坡個(gè)人數(shù)據(jù)保護(hù)委員會(huì)(PDPC)罰款處罰;2024年美國(guó)企業(yè)OpenAI也被曝光秘密采集優(yōu)兔(YouTube)視頻來(lái)訓(xùn)練文生視頻大模型Sora,該過(guò)程侵犯到了東南亞創(chuàng)作者的個(gè)人數(shù)據(jù)權(quán)益。
目前,“出?!盇I企業(yè)發(fā)展的痛點(diǎn)在于如何從眾多低質(zhì)量的互聯(lián)網(wǎng)信息中采集到適合模型訓(xùn)練、又合乎法律規(guī)定的數(shù)據(jù)。其中一種辦法就是采用開(kāi)源數(shù)據(jù)集,它節(jié)約成本且能在一定程度上規(guī)避知識(shí)產(chǎn)權(quán)、個(gè)人信息泄露的風(fēng)險(xiǎn),并促進(jìn)社區(qū)貢獻(xiàn),便于企業(yè)進(jìn)行基準(zhǔn)測(cè)試和比較。泰國(guó)等東道國(guó)已開(kāi)始制定內(nèi)部數(shù)據(jù)集成政策,充許組織和個(gè)人訪問(wèn)國(guó)家機(jī)構(gòu)開(kāi)放數(shù)據(jù),為AI提供合規(guī)的訓(xùn)練數(shù)據(jù)資源。而中國(guó)的企業(yè)、高校、研究院也在積極構(gòu)建大規(guī)模語(yǔ)音識(shí)別數(shù)據(jù)集,以突破東南亞語(yǔ)種繁雜的AI發(fā)展壁壘。例如,清華大學(xué)、上海交通大學(xué)聯(lián)合發(fā)起的GigaSpeech2數(shù)據(jù)集匯集了超三方小時(shí)、包含泰語(yǔ)、印尼語(yǔ)、越南語(yǔ)等小語(yǔ)種的音頻數(shù)據(jù),發(fā)布在代碼開(kāi)源社區(qū)Github、HuggingFace,供其他AI企業(yè)訓(xùn)練使用。
(二)數(shù)據(jù)傳輸存儲(chǔ):跨境數(shù)據(jù)流動(dòng)限制與本地?cái)?shù)據(jù)中心的興起
在AI企業(yè)采集到訓(xùn)練數(shù)據(jù)后,就會(huì)面臨數(shù)據(jù)跨境流動(dòng)與數(shù)據(jù)本地化之間的矛盾?!翱缇硵?shù)據(jù)流動(dòng)”是指跨越國(guó)家或地區(qū)的個(gè)人數(shù)據(jù)如姓名、身份證號(hào)、生物識(shí)別信息等,或非個(gè)人數(shù)據(jù)如智能家居、工業(yè)互聯(lián)網(wǎng)、智能駕駛等的傳輸、存儲(chǔ)和應(yīng)用,雖然它被視為數(shù)字經(jīng)濟(jì)發(fā)展的風(fēng)向標(biāo),但其風(fēng)險(xiǎn)在于本國(guó)數(shù)據(jù)被輸往海外后可能對(duì)國(guó)家安全造成不利影響,尤其是個(gè)人信息的跨境流動(dòng)會(huì)增加數(shù)據(jù)泄露風(fēng)險(xiǎn),對(duì)個(gè)人隱私和人身財(cái)產(chǎn)安全構(gòu)成威脅。例如,2024年泰國(guó)醫(yī)學(xué)科學(xué)部系統(tǒng)被黑客攻擊后,上方條公民就診記錄通過(guò)跨境數(shù)據(jù)通道被轉(zhuǎn)售至“暗網(wǎng)”。
作為回應(yīng),跨境數(shù)據(jù)流動(dòng)治理會(huì)要求“出?!逼髽I(yè)等數(shù)據(jù)傳輸方向本國(guó)監(jiān)管部門提交申請(qǐng)獲得批準(zhǔn),而母國(guó)數(shù)據(jù)中心等接受方同樣需履行監(jiān)督部門的報(bào)備程序??v觀本文所涉東盟六國(guó)《個(gè)人數(shù)據(jù)保護(hù)法》的規(guī)定,大致形成了三種跨境數(shù)據(jù)治理模式:新加坡、菲律賓屬于“自由跨境模式”,傳輸方除履行本國(guó)的法規(guī)要求之外,還可以通過(guò)《亞太經(jīng)合組織跨境隱私規(guī)則體系》認(rèn)證實(shí)現(xiàn)跨境數(shù)據(jù)傳輸,總體較為寬松;馬來(lái)西亞、印度尼西亞和泰國(guó)屬于“充分性認(rèn)定模式”,監(jiān)管部門會(huì)評(píng)估傳輸方母國(guó)的個(gè)人數(shù)據(jù)保護(hù)水平,并通過(guò)本國(guó)行政監(jiān)督、用戶知情同意、額外條款等方式確保數(shù)據(jù)傳輸?shù)陌踩?;越南屬于最?yán)格的“本地化模式”,其《網(wǎng)絡(luò)安全法》規(guī)定海外企業(yè)必須將越南的個(gè)人數(shù)據(jù)、服務(wù)使用者關(guān)系數(shù)據(jù)存儲(chǔ)在境內(nèi),并且需設(shè)立分支機(jī)構(gòu)或代表處配合政府監(jiān)管。
鑒于數(shù)據(jù)出境風(fēng)險(xiǎn)和建設(shè)本國(guó)數(shù)字基礎(chǔ)設(shè)施的需求,東南亞國(guó)家愈發(fā)提倡數(shù)據(jù)本土化(datalocalization)方案,并鼓勵(lì)海外企業(yè)在當(dāng)?shù)嘏d建數(shù)據(jù)中心。長(zhǎng)期以來(lái),除新加坡外的東盟國(guó)家整體基礎(chǔ)設(shè)施相對(duì)落后,信息通信產(chǎn)業(yè)投資不足,本地企業(yè)缺乏核心技術(shù),因此5G、數(shù)據(jù)中心、智慧城市等數(shù)字基礎(chǔ)設(shè)施的建設(shè)多依賴于跨國(guó)公司與本地國(guó)有企業(yè)的合作。?友好的政策支持、廉價(jià)而豐富的土地資源,加上可再生能源的供應(yīng),促使東南亞成為數(shù)據(jù)中心建設(shè)的沃土?;凇皵?shù)字絲綢之路”的宏觀合作框架,中國(guó)科技企業(yè)正在積極投資建設(shè)數(shù)據(jù)中心,在合規(guī)傳輸、存儲(chǔ)數(shù)據(jù)的同時(shí)賦能東南亞國(guó)家的數(shù)字化轉(zhuǎn)型:如阿里云、騰訊云和華為云已在新加坡、泰國(guó)和印度尼西亞建設(shè)了數(shù)據(jù)中心,提供云計(jì)算和人工智能基礎(chǔ)設(shè)施服務(wù);萬(wàn)國(guó)數(shù)據(jù)公司在馬來(lái)西亞柔佛投資建設(shè)了超大規(guī)模的數(shù)據(jù)中心園區(qū),還與印尼投資局達(dá)成協(xié)議共建數(shù)據(jù)中心平臺(tái)。這些企業(yè)在國(guó)內(nèi)積累了豐富的數(shù)據(jù)中心建設(shè)經(jīng)驗(yàn),掌握前沿的數(shù)據(jù)安防技術(shù),保證了模式輸出的可靠性。
此外,中國(guó)企業(yè)還采用前沿技術(shù)和理念優(yōu)化數(shù)據(jù)中心的建設(shè)運(yùn)營(yíng),在實(shí)踐中體現(xiàn)可持續(xù)發(fā)展的國(guó)際傳播理念。首先是將數(shù)據(jù)存儲(chǔ)和處理靠近數(shù)據(jù)源,減少數(shù)據(jù)跨境傳輸和泄露風(fēng)險(xiǎn)的邊緣計(jì)算(edgecomputing)技術(shù),如阿里云、華為云、騰訊云等均已推出了成熟的產(chǎn)品投放到云計(jì)算業(yè)務(wù)中;其次是減少能源消耗、碳排放量的綠色計(jì)算(greencomputing)理念,我國(guó)創(chuàng)建的246個(gè)國(guó)家綠色數(shù)據(jù)中心有半數(shù)以上達(dá)到了4A的綠色低碳等級(jí),積極響應(yīng)了《東盟能源合作行動(dòng)計(jì)劃》(APAEC)的框架。
(三)數(shù)據(jù)處理應(yīng)用:AI產(chǎn)業(yè)的雇傭勞動(dòng)與消費(fèi)場(chǎng)景
在數(shù)據(jù)經(jīng)歷采集、傳輸和存儲(chǔ)后,AI企業(yè)還需進(jìn)一步處理(processing)數(shù)據(jù),優(yōu)化算法模型,打造AI產(chǎn)品投入消費(fèi)市場(chǎng),從而提升數(shù)據(jù)的價(jià)值。在數(shù)據(jù)處理的雇傭勞動(dòng)環(huán)節(jié),常常被大眾忽視卻關(guān)鍵的是數(shù)據(jù)標(biāo)注工作:勞動(dòng)力需要標(biāo)記圖像、語(yǔ)音、文本、視頻的特征,以實(shí)現(xiàn)滿足機(jī)器學(xué)習(xí)訓(xùn)練要求的可讀數(shù)據(jù)編碼。監(jiān)督或半監(jiān)督的機(jī)器學(xué)習(xí)都非常依賴這種人工標(biāo)注。行業(yè)數(shù)據(jù)顯示,目前數(shù)據(jù)標(biāo)注工人和下游研發(fā)人員的需求比達(dá)到了驚人的1:100,人力資源的缺口可見(jiàn)一斑。①
東南亞地區(qū)承接數(shù)據(jù)標(biāo)注行業(yè)的一大優(yōu)勢(shì)在于規(guī)模龐大、薪酬低廉的青壯年人口,但科技企業(yè)對(duì)第三世界勞動(dòng)力的征用可能導(dǎo)致勞工剝削、去技能化等問(wèn)題,深化數(shù)據(jù)殖民主義問(wèn)題??萍脊綧ightyAI、ScaleAI支付給非洲和東南亞工人的日薪僅8美元;世界上最大的圖像識(shí)別數(shù)據(jù)集ImageNet依靠的也僅是時(shí)薪2美元的零工。美國(guó)《華盛頓郵報(bào)》還揭露了為臉書、微軟等科技巨頭提供服務(wù)的ScaleAI公司剝削菲律賓工人的劣跡,該公司僅以6至10美元的日薪支付其勞動(dòng),還經(jīng)常拖欠工資,很少為工人謀求救濟(jì)援助。?相比之下,華為公司攜手泰國(guó)政府培養(yǎng)了近10萬(wàn)名數(shù)字人才,包括ICT專業(yè)人士、AI高階開(kāi)發(fā)者、綠色工程師、網(wǎng)絡(luò)安全員及普通村民,創(chuàng)造了更多高附加值的就業(yè)機(jī)會(huì),響應(yīng)了東盟國(guó)家培養(yǎng)本地技術(shù)人才、為勞動(dòng)力提供轉(zhuǎn)型機(jī)會(huì)的發(fā)展訴求。
在數(shù)據(jù)應(yīng)用環(huán)節(jié),東南亞消費(fèi)市場(chǎng)展現(xiàn)了在社交、娛樂(lè)、游戲、電商領(lǐng)域的高度粘性。七麥數(shù)據(jù)顯示,零門檻視覺(jué)編輯的Canva和Wink、提供智能語(yǔ)音服務(wù)的Wiz、聊天問(wèn)答機(jī)器人PolyBuzz、QuestionAl,以及私人訂制虛擬伴侶的Talkie等中國(guó)出海企業(yè)打造的APP在東盟六國(guó)廣受歡迎。地緣文化上的接近性,使國(guó)內(nèi)主流AI應(yīng)用只需微調(diào)就能“內(nèi)銷轉(zhuǎn)出口”。許多爆款的出海應(yīng)用都與字節(jié)跳動(dòng)、阿里巴巴、騰訊等超級(jí)平臺(tái)有聯(lián)系,后者也積累了比西方AI企業(yè)更靈活而富有彈性的內(nèi)容審核體系,因而在跨文化語(yǔ)境的內(nèi)容治理上擁有更多經(jīng)驗(yàn)。除此之外,中國(guó)科技企業(yè)高度重視東南亞消費(fèi)者的訴求,甚至突破了多小語(yǔ)種訓(xùn)練障礙的瓶頸。2023年12月,阿里推出為東南亞用戶量身定制的大語(yǔ)言模型SeaLLMs,它支持越南語(yǔ)、印尼語(yǔ)、泰語(yǔ)、馬來(lái)語(yǔ)、高棉語(yǔ)、老撾語(yǔ)、緬甸語(yǔ)等絕大多數(shù)東南亞官方語(yǔ)言,直觀展現(xiàn)了智能技術(shù)對(duì)跨國(guó)溝通的賦能。
不過(guò),東盟國(guó)家對(duì)AI應(yīng)用的監(jiān)管仍值得“出?!逼髽I(yè)重視,這種約束既與強(qiáng)大的社會(huì)規(guī)范有關(guān),如新加坡社會(huì)就抵制出現(xiàn)暴力、淫穢、詐謗、歧視元素的AIGC產(chǎn)品。約束也可能源自明確的法律規(guī)定,越南的《數(shù)字技術(shù)產(chǎn)業(yè)法》會(huì)對(duì)AI產(chǎn)品進(jìn)行風(fēng)險(xiǎn)等級(jí)分類,馬來(lái)西亞的《反假新聞法令》、菲律賓的《反網(wǎng)絡(luò)虐待與性剝削法案》則嚴(yán)令禁止了利用深度偽造實(shí)施性剝削的行徑。鑒于不少AI軟件可能被不法分子用作“換臉”生成敲詐素材,企業(yè)在數(shù)據(jù)防護(hù)上需格外重視。
(四)數(shù)據(jù)維護(hù)解釋:人工智能運(yùn)行的技術(shù)與社會(huì)補(bǔ)丁
即使是事先設(shè)計(jì)再完備的AI產(chǎn)品,一旦投入當(dāng)?shù)厥袌?chǎng),也可能遇到意想不到的安全故障和風(fēng)險(xiǎn)事件。其中一大主因便是黑客對(duì)AI系統(tǒng)漏洞的試探、誘導(dǎo)和攻擊,本文聚焦的東盟六國(guó)都報(bào)告過(guò)大規(guī)模數(shù)據(jù)泄露事件。而數(shù)據(jù)維護(hù)便是敦促企業(yè)打上技術(shù)性補(bǔ)丁的重要環(huán)節(jié)。新加坡政府在其《生成式人工智能治理模型框架》中指出,企業(yè)應(yīng)建立必要的流程來(lái)監(jiān)控、報(bào)告安全事件,使事件報(bào)告機(jī)制實(shí)現(xiàn)及時(shí)通知和補(bǔ)救,支持AI系統(tǒng)的改進(jìn)。越南《人工智能開(kāi)發(fā)指南》也強(qiáng)調(diào)了AI企業(yè)應(yīng)具備抵御黑客攻擊的能力,要求事先評(píng)估其系統(tǒng)安全性。
近年來(lái),我國(guó)科技企業(yè)的安全防護(hù)意識(shí)與日俱增。字節(jié)跳動(dòng)采用先進(jìn)加密算法加固了旗下AI產(chǎn)品的數(shù)據(jù)傳輸過(guò)程,并建立了嚴(yán)格的用戶信息訪問(wèn)權(quán)限控制體系。阿里云對(duì)API接口的安全審計(jì)、騰訊云推出的全鏈路安全防護(hù)方案,都旨在杜絕數(shù)據(jù)泄露風(fēng)險(xiǎn)。而終端安全市場(chǎng)上的北信源、天空衛(wèi)士、白山云等公司也在為AI“出?!北q{護(hù)航。
除了黑客攻擊,AI數(shù)據(jù)集或算法缺陷導(dǎo)致的系統(tǒng)性偏見(jiàn)、觀點(diǎn)霸權(quán)、刻板印象、虛假信息等社會(huì)問(wèn)題則更加隱秘,它們會(huì)潛移默化融入社會(huì)肌理、改變公眾價(jià)值理念。數(shù)據(jù)解釋作為DLM中最容易被忽視的環(huán)節(jié),致力于將技術(shù)“黑箱”以不泄露商業(yè)機(jī)密的方式打開(kāi),重建AI與生活世界的聯(lián)系,為技術(shù)系統(tǒng)的運(yùn)行打上社會(huì)補(bǔ)丁。事實(shí)上,東盟六國(guó)的數(shù)據(jù)政策都在不同程度上強(qiáng)調(diào)了AI模型的透明度和可解釋性,要求企業(yè)清楚地解釋AI數(shù)據(jù)如何影響決策、對(duì)數(shù)據(jù)主體產(chǎn)生后果,并確保程序和算法以透明、公平的方式運(yùn)行。
前文談到的SeaLLM就是一個(gè)融貫社區(qū)參與的數(shù)據(jù)解釋案例。為了提升模型的可解釋性和適應(yīng)性,阿里巴巴與東南亞的開(kāi)發(fā)者社區(qū)合作,舉辦了多場(chǎng)技術(shù)研討會(huì)和黑客馬拉松比賽,邀請(qǐng)本地開(kāi)發(fā)者和小語(yǔ)種專家參與模型優(yōu)化和測(cè)試。SeaLLM還在Github上部分開(kāi)源,鼓勵(lì)東南亞開(kāi)發(fā)者貢獻(xiàn)本地化語(yǔ)料和改進(jìn)建議。這充分彰顯了我國(guó)AI“出海”企業(yè)合作共贏、共同發(fā)展的價(jià)值理念。
四、結(jié)語(yǔ)
在2025年達(dá)沃斯世界經(jīng)濟(jì)論壇上,聯(lián)合國(guó)秘書長(zhǎng)安東尼奧·古特雷斯指出,氣候變化與不受監(jiān)管的人工智能擴(kuò)張是當(dāng)今人類面臨的兩大重要挑戰(zhàn)。當(dāng)東南亞因人口、土地和能源優(yōu)勢(shì)成為海外人工智能企業(yè)投資的熱土之時(shí),殖民主義的幽靈也被傳喚,它是當(dāng)今國(guó)際傳播中最大也隱藏最深的政治、歷史與思想遺產(chǎn),很容易被忽視。正如克勞福德所述,人工智能產(chǎn)業(yè)的殖民隱患源自其“巨機(jī)器”(megamachine)的實(shí)質(zhì),背后指向一整套物質(zhì)化的供應(yīng)鏈,包括網(wǎng)絡(luò)數(shù)據(jù)集、計(jì)算周期、數(shù)據(jù)中心、硬件設(shè)備,以及制造、運(yùn)輸和體力勞動(dòng)。
本文對(duì)“出海”AI企業(yè)數(shù)據(jù)生命周期管理的梳理就勾連了上述物質(zhì)性要素裝配的過(guò)程。相較于西方跨國(guó)公司推行數(shù)據(jù)取主義,導(dǎo)致不少勞工剝削、本地居民數(shù)據(jù)泄露、隱私侵犯的負(fù)面事件,中國(guó)企業(yè)遵循東南亞國(guó)家的《個(gè)人信息保護(hù)法》和AI監(jiān)管法案,聯(lián)合科研院所構(gòu)建開(kāi)源數(shù)據(jù)集,在本地興建綠色、高效、安全計(jì)算的數(shù)據(jù)中心,為對(duì)象國(guó)培養(yǎng)數(shù)字人才,還推出支持東南亞語(yǔ)種的大語(yǔ)言模型,積極邀約本地開(kāi)發(fā)者和專家參與AI建設(shè),以包容、普惠和可持續(xù)發(fā)展的姿態(tài)踐行數(shù)據(jù)合規(guī)義務(wù)。
這種數(shù)據(jù)合規(guī)實(shí)踐反映了日益盛行的環(huán)境、社會(huì)和公司治理(ESG)理念。隨著全球政治經(jīng)濟(jì)環(huán)境趨于復(fù)雜化,政策監(jiān)管嚴(yán)格多樣,ESG日益成為我國(guó)企業(yè)進(jìn)入國(guó)際市場(chǎng)的“通行證”和“壓艙石”,東南亞市場(chǎng)雖在ESG監(jiān)管上起步晚但發(fā)展迅速。如果說(shuō)中國(guó)面向東南亞的國(guó)際傳播期望通過(guò)人工智能基礎(chǔ)設(shè)施的建設(shè)和服務(wù),助力東盟國(guó)家發(fā)展數(shù)字經(jīng)濟(jì),那么“出海”AI企業(yè)就需要秉承ESG理念,關(guān)照在地社區(qū)與生態(tài)系統(tǒng),真正邁向互聯(lián)互通的共生發(fā)展道路。
本文系國(guó)家社科基金重點(diǎn)項(xiàng)目“重大突發(fā)公共事件媒介化治理的多元協(xié)同機(jī)制研究”(項(xiàng)目批準(zhǔn)號(hào):22AXW007)的階段性研究成果。
曹系廣東外語(yǔ)外貿(mào)大學(xué)新聞與傳播學(xué)院講師,廣州城市輿情治理與國(guó)際形象傳播研究中心研究員
「注釋」
① 《生成式人工智能應(yīng)用發(fā)展報(bào)告(2024)》,中國(guó)互聯(lián)網(wǎng)絡(luò)信息中心,https://www.cnnic.net.cn/n4/2024/1216/c88-1196.html,2024年12月2日。
② Artificial Intelligence - Southeast Asia, Statista, https://www.statista.com/outlook/tmo/artificial-intelligence/southeast-asia,2024-3.
③ 張亞勤:《從工具出海到技術(shù)出海AI成中國(guó)互聯(lián)出海主引擎》,載王輝耀、苗綠:《中國(guó)企業(yè)全球化報(bào)告》(2018),北京:社會(huì)科學(xué)文獻(xiàn)出版社,2018年,第272-280頁(yè)。
④ 姬德強(qiáng)、閆伯維:《主體性探尋:“一帶一路”與國(guó)際傳播研究的想象力》,《傳媒觀察》2023年第9期,第28-35頁(yè)。
⑤ [美]凱特·克勞福德:《技術(shù)之外:社會(huì)聯(lián)結(jié)中的人工智能》(丁寧、方偉、李紅澄譯),北京:中國(guó)原子能出版社/中國(guó)科學(xué)技術(shù)出版社,2024年,第8頁(yè)。
⑥ 鐘新、蔣賢成、沈靜等:《從“媒體獨(dú)白”邁向“全民共情”:中國(guó)國(guó)際傳播10年研究的多元譜系與未來(lái)路徑》,《傳媒觀察》2023年第2期,第15-30頁(yè)。
⑦ 郭全中、李祖岳:《動(dòng)因、挑戰(zhàn)、破局:中國(guó)互聯(lián)網(wǎng)企業(yè)出海初探》,《新聞愛(ài)好者》2023年第5期,第15-19頁(yè)。
⑧ 徐、姚建華:《“看不見(jiàn)”的國(guó)際傳播:跨境數(shù)據(jù)流動(dòng)與中國(guó)應(yīng)對(duì)》,《國(guó)際傳播》2019年第6期,第47-48頁(yè)。
⑨ Wing,J.M.“The data life cycle”,Harvard Data Science Review,vo.l.no.l,2019, pp.1-6.
⑩ 郭海玲、劉仲山:《GDPR對(duì)我國(guó)跨境數(shù)字貿(mào)易企業(yè)個(gè)人數(shù)據(jù)保護(hù)研究—基于數(shù)據(jù)生命周期理論》,《情報(bào)雜志》2023年第10期,第194-201頁(yè)。
① 本文對(duì)東南亞國(guó)家人工智能法案、數(shù)據(jù)政策的資料梳理,參考了墾丁律師事務(wù)所出品的《生成式人工智能-海外合規(guī)白皮書》(東南亞篇)。
同5,第100-105頁(yè)。
王金照、李廣乾:《跨境數(shù)據(jù)流動(dòng):戰(zhàn)略與政策》,北京:中國(guó)發(fā)展出版社,2020年,第27-28頁(yè)。
① 趙祺:《中國(guó)-東盟跨境數(shù)據(jù)流動(dòng)治理合作:現(xiàn)實(shí)與路徑選擇》,《南洋問(wèn)題研究》2024年第3期,第85-98頁(yè)。
① 王勤:《東盟國(guó)家數(shù)字基礎(chǔ)設(shè)施建設(shè)的現(xiàn)狀與前景》,《南亞?wèn)|南亞研究》2022年第5期,第90-101頁(yè)。
① 中國(guó)國(guó)際問(wèn)題研究院、中國(guó)信息通信院:《中國(guó)-東盟人工智能發(fā)展與治理合作:進(jìn)展觀察和推進(jìn)建議》,https://www.ciis.org.cn/xwdt/202412/W020241208737956451968.pdf,2024年12月8日。
師天浩:《大國(guó)AI競(jìng)賽加速,東南亞正在成為中國(guó)“AI后花園”?》,《大數(shù)據(jù)時(shí)代》2021年第4期, $\overbrace{\frac{\d}{\d t}}^{\substack{\scriptscriptstyle\mathrm{AF}}}66-80\overline{{\frac{\d}{\d t}}}$ 。
Tan,R amp; Cabato, R. Behind the AI boom,an army of overseas workers in‘digital sweatshops,Washington Post,https://www.washingtonpost.com/world/2023/08/28/scale-ai-remotasks-philippines-artificial-intelligence/,2023-8-28.
① 陳昌鳳、張夢(mèng):《由數(shù)據(jù)決定?AIGC的價(jià)值觀和倫理問(wèn)題》,《新聞與寫作》2023年第4期,第15-23頁(yè)。
姜飛:《國(guó)際政治的傳播與國(guó)際傳播的政治》,《中國(guó)社會(huì)科學(xué)報(bào)》2022年3月22日,第1版。
同,第43頁(yè)。
責(zé)編:荊江