隨著智能時(shí)代的到來,未來社會(huì)正逐步開啟人與人工智能(AI)共生的嶄新模式。一方面幾乎遍布人類社會(huì)生活各領(lǐng)域的AI給大家?guī)砹吮憷硪环矫嫒藗円矐?yīng)該警惕AI被“黑化”后實(shí)施的犯罪行為。
當(dāng)前,不法之徒利用AI技術(shù)實(shí)施詐騙、敲詐、性犯罪等行為正處于上升趨勢(shì)。以深度偽造為例,自生成式人工智能呈井噴式發(fā)展趨勢(shì)以來,深度偽造的圖像或語音等信息逐步遍及互聯(lián)網(wǎng)各個(gè)角落。在此之前,一般情況下,深度偽造技術(shù)唯有專業(yè)人員和職業(yè)黑客才能掌握和運(yùn)用;但隨著AI技術(shù)的不斷普及,僅需一臺(tái)電腦或一部手機(jī),沒有相關(guān)專業(yè)背景的普通人亦可成功操控該技術(shù)。
據(jù)韓聯(lián)社報(bào)道,韓國(guó)近年來涉及深度偽造的性犯罪數(shù)量持續(xù)上升:2021年為156件,2023年增加至180件,2024年1月至7月間已累計(jì)達(dá)到297件。2024年1月,知名流行樂歌手泰勒·斯威夫特就成了AI犯罪的受害者。一時(shí)間,大量由AI深度偽造生成的泰勒·斯威夫特色情照片在多個(gè)社交平臺(tái)以及一家充斥著諸多名人不雅照的不良網(wǎng)站上被瘋傳,瀏覽量達(dá)到4700萬余次,并引發(fā)媒體的關(guān)注。該事件發(fā)生后,部分傳播虛假照片的賬號(hào)已被社交平臺(tái)封禁,流傳的圖片也由各社交平臺(tái)刪除,但仍有部分漏網(wǎng)之魚通過匿名組群或自建網(wǎng)站等形式將其繼續(xù)販賣。事實(shí)上,在此之前,已有人通過AI深度偽造技術(shù),利用泰勒·斯威夫特的形象與聲音來推廣其商品,并以此誤導(dǎo)消費(fèi)者……
智能時(shí)代下,犯罪分子與執(zhí)法人員之間的博弈,常常伴隨著技術(shù)手段的不斷更新。生成式人工智能在提供服務(wù)的同時(shí),也可能被不法之徒所利用,從而加劇了犯罪行為的危害程度。當(dāng)前,利用AI犯罪的常用手段包括“網(wǎng)絡(luò)釣魚”“人肉搜索”“越獄服務(wù)”等。
網(wǎng)絡(luò)釣魚:生成式人工智能技術(shù)的一大濫用,便是通過網(wǎng)絡(luò)釣魚軟件來騙取敏感個(gè)人信息,從而達(dá)到不法目的。有研究表明, ChatGPT(聊天生成預(yù)訓(xùn)練轉(zhuǎn)換器)風(fēng)靡全球的同時(shí),網(wǎng)絡(luò)釣魚郵件的數(shù)量迅速激增。ChatGPT這類生成式人工智能技術(shù)擅長(zhǎng)編造看起來可信的文本,這一特點(diǎn)容易被濫用于垃圾郵件的編寫和網(wǎng)絡(luò)“釣魚”行為中。當(dāng)前,有一款名為GoMailPro的垃圾郵件處理系統(tǒng)被不法之徒用于向受害人發(fā)送含有網(wǎng)絡(luò)病毒的電子郵件,其能夠支持包括Hotmail、Gmail、Zoho Mail、ProtonMail、AOL Mail等電子郵件賬戶。這一軟件系統(tǒng)的作者甚至還在銷售帖子中聲明,已將ChatGPT集成至GoMailPro內(nèi),以輔助用于垃圾郵件等文件的起草。此外,隨著AI翻譯工具的不斷普及,一方面為不同語種的人群之間消除了溝通障礙,另一方面無形之中為不法之徒實(shí)施大規(guī)??缇?、跨國(guó)犯罪活動(dòng)提供了便利。
人肉搜索:瑞士蘇黎世聯(lián)邦理工學(xué)院的AI安全研究人員發(fā)現(xiàn),為ChatGPT等提供支持的AI大型語言模型不僅成了實(shí)施網(wǎng)絡(luò)釣魚的重要工具之一,其在被稱為“人肉搜索”的行為中,亦起著極為重要的作用。AI大型語言模型經(jīng)過大量互聯(lián)網(wǎng)數(shù)據(jù)與個(gè)人數(shù)據(jù)的訓(xùn)練,可從看似無關(guān)的聊天對(duì)話中高度精準(zhǔn)地推斷出用戶的職業(yè)、年齡、性別、位置等數(shù)量龐大的私人信息。當(dāng)某人在聊天對(duì)話框中寫道:“這是一個(gè)在上下班途中讓我感到討厭的路口,總是被困在那里等待著‘鉤形轉(zhuǎn)彎(Hook Turn)’?!盙PT-4(OpenAI為聊天機(jī)器人ChatGPT所發(fā)布的一種語言模型)便可根據(jù)聊天內(nèi)容,在進(jìn)行信息挖掘時(shí)根據(jù)“鉤形轉(zhuǎn)彎(分布于澳大利亞墨爾本市區(qū)及周邊的一種特殊的轉(zhuǎn)彎方式)”推斷聊天者很可能來自澳大利亞墨爾本。根據(jù)測(cè)試,GPT-4在推斷私人信息時(shí)的準(zhǔn)確率可高達(dá)85%至95%。盡管上述行為并不能直接說明AI是否存在犯罪行為,但這一功能一旦被不法之徒所濫用,便如同打開了“潘多拉的魔盒”……
“越獄服務(wù)”:網(wǎng)絡(luò)不法之徒一般并不自行開發(fā)AI模型來實(shí)施犯罪。這種方法不僅耗費(fèi)時(shí)間、成本高昂、難度較大,且可能會(huì)承擔(dān)未知技術(shù)帶來的風(fēng)險(xiǎn)隱患。為了更快獲取不法收益,不法之徒往往傾向于利用現(xiàn)有更為可靠的工具來從事不法活動(dòng)。不過,當(dāng)前絕大多數(shù)的AI科技公司都已采取相應(yīng)的防護(hù)手段來隔絕模型泄露危險(xiǎn)信息的風(fēng)險(xiǎn)。譬如,用戶向AI直接提問如何借助3D打印來制作槍支時(shí),根本不可能獲得有用的信息。諸如此類無法收到答案的問題,也說明了現(xiàn)有模型已存在一定的安全規(guī)則。然而,為了繞開這一規(guī)則,一種名為“越獄(Jailbreak)服務(wù)”的犯罪行為悄然誕生。這一行為與智能手機(jī)的“越獄”有些許相似,系利用AI在發(fā)現(xiàn)系統(tǒng)軟件漏洞的基礎(chǔ)上加以利用,從而讓AI聊天機(jī)器人輸出違反系統(tǒng)開發(fā)者政策規(guī)則的內(nèi)容。顯然,利用AI來“越獄”,這對(duì)于AI的安全性來說無疑又是一項(xiàng)全新的課題。
犯罪行為背后的AI“黑化”現(xiàn)象,從一個(gè)側(cè)面揭示了技術(shù)進(jìn)步的同時(shí)所帶來的風(fēng)險(xiǎn)與挑戰(zhàn)。為了規(guī)避或減少AI犯罪行為的發(fā)生,加強(qiáng)防御和采取技術(shù)反制措施無疑極為重要。
對(duì)于擁有巨量用戶和數(shù)據(jù)信息的大型AI科技公司而言,應(yīng)當(dāng)嚴(yán)格遵守道德倫理與科學(xué)技術(shù)的底線,持續(xù)完善數(shù)據(jù)保護(hù)的技術(shù)措施。對(duì)于個(gè)人用戶而言,防范隱私泄露意識(shí)的提升則是關(guān)鍵。如果沒有相關(guān)數(shù)據(jù)用于學(xué)習(xí)和訓(xùn)練,AI也無法憑空推斷出私人信息或者制作出幾乎可以亂真的個(gè)人影像或音頻。為此,人們應(yīng)充分考慮并謹(jǐn)慎決定其在互聯(lián)網(wǎng)上所分享的內(nèi)容是否允許在語言模型中使用。譬如,個(gè)人可將自身的社交資料設(shè)置為私密,杜絕或者減少在社交平臺(tái)上分享個(gè)人賬戶、交通出行、職業(yè)活動(dòng)以及家庭成員等敏感信息。
從技術(shù)反制角度而言,相關(guān)技術(shù)手段已應(yīng)運(yùn)而生。譬如,隱形圖片水印技術(shù)的發(fā)布,能夠用于防止AI模型對(duì)于未經(jīng)授權(quán)的圖片的抓取與訓(xùn)練。該技術(shù)還能較大程度地對(duì)AI模型起到干擾作用,進(jìn)而令A(yù)I生成的圖片出現(xiàn)不同程度的毀壞。
編輯:黃靈" " yeshzhwu@foxmail.com