麥克·羅克德斯 蒂姆·奧賴?yán)?/p>
美國版權(quán)局最近發(fā)布指導(dǎo)意見認(rèn)定,除非人類創(chuàng)造力進(jìn)入生成人工智能圖像的提示性指令,否則人工智能所生成的輸出圖像不應(yīng)屬于版權(quán)保護(hù)的范圍。但上述規(guī)定還留下許多問題,如究竟需要多少創(chuàng)造力?它與藝術(shù)家用畫筆實現(xiàn)的創(chuàng)造力是否是一樣的問題?
還有一組案例涉及文本 (通常是小說)。有人認(rèn)為,用受到版權(quán)保護(hù)的材料訓(xùn)練模型本身就是侵犯版權(quán),即使該模型永遠(yuǎn)也不會在輸出部分中復(fù)制上述文本。但自書面語言存在以來,人類學(xué)習(xí)過程就一直包含著閱讀文本。我們花錢買書,但我們卻無需付費從書中學(xué)習(xí)。
我們該如何理解這一點?首先,目前的版權(quán)法保護(hù)“添加某些新內(nèi)容的……變革性用途”。顯而易見,這恰恰是人工智能模型在做的事。像ChatGPT這樣的大規(guī)模語言模型(LLMs)由訓(xùn)練過程中所吸收內(nèi)容的一組龐大參數(shù)構(gòu)成,它代表一個詞跟在另一個詞后面出現(xiàn)的概率。當(dāng)上述概率引擎做出一首莎士比亞從未寫過的莎士比亞體十四行詩時,哪怕這首新十四行詩水平很爛,此舉也同樣具有變革性。
技術(shù)專家加倫·拉尼爾認(rèn)為,創(chuàng)造更好的模型是一種為所有人(甚至就連那些作品被用于訓(xùn)練 AI的作者也包括在內(nèi))提供服務(wù)的公共產(chǎn)品。模型因此值得被保護(hù)且具有變革性。但拉尼爾的“數(shù)據(jù)尊嚴(yán)”理念存在一個問題:在“訓(xùn)練”現(xiàn)行的人工智能模型和以小說家杰斯明·沃德的風(fēng)格“生成輸出內(nèi)容”之間,很難進(jìn)行有意義的區(qū)分。
人工智能開發(fā)者通過進(jìn)行零散輸入并要求模型數(shù)十億次地預(yù)測下一個單詞來訓(xùn)練模型,并在此過程中,小幅調(diào)整參數(shù)以改進(jìn)其預(yù)測性。但同樣的過程也被用于生成輸出,而這本身就存在版權(quán)問題。
那么,如何在恰當(dāng)?shù)那闆r下補償作者所創(chuàng)作的作品?盡管可能無法追蹤到當(dāng)前生成型人工智能聊天機(jī)器人的數(shù)據(jù)來源,但故事并未到此為止。在自ChatGPT發(fā)布以來一年左右的時間里,開發(fā)者一直在現(xiàn)有基礎(chǔ)模型之上構(gòu)建應(yīng)用程序。許多人運用檢索增強生成功能(RAG)來讓人工智能“了解”其訓(xùn)練數(shù)據(jù)中所沒有的內(nèi)容。如果你需要生成產(chǎn)品目錄文本,你可以上傳公司數(shù)據(jù),而后,將其發(fā)送給人工智能模型并附上說明文字:“在結(jié)果中只使用此提示中所包含的數(shù)據(jù)?!?/p>
盡管“檢索增強生成”被視為某種在不經(jīng)過勞動和技能密集型培訓(xùn)的情況下使用專有信息的方式,但它也順帶在模型的響應(yīng)和創(chuàng)建響應(yīng)的文檔之間建立了聯(lián)系。這意味著我們現(xiàn)在找到了出處,從而使我們更接近實現(xiàn)拉尼爾有關(guān)數(shù)據(jù)尊嚴(yán)的愿景。
如果我們在書中出版了一位人類程序員的貨幣轉(zhuǎn)換軟件,而且,我們的語言模型在回答問題時復(fù)制了這一模型,我們就可以將此舉歸因于初始來源,并恰當(dāng)?shù)胤峙浒娑悺M瑯拥脑瓌t也可以適用于模仿瓦德的作品《唱吧!未安葬的魂靈》而創(chuàng)作的人工智能小說作品。
谷歌的“人工智能概述”,就是說明我們對“檢索增強生成功能”期望的很好例子。因為谷歌已經(jīng)擁有全世界最好的搜索引擎,其摘要引擎應(yīng)當(dāng)能通過運行搜索并將排名靠前的結(jié)果輸入大規(guī)模語言模型生成用戶所要求的概述內(nèi)容,來對提示進(jìn)行響應(yīng)。模型將提供語言和語法,但它卻從提示所包含的文檔中提取內(nèi)容。同樣,這可以提供缺失的出處。
既然我們知道有可能制作出尊重版權(quán)并補償作者的輸出作品,監(jiān)管機(jī)構(gòu)就需要加大力度。我們不應(yīng)接受頂級大規(guī)模語言模型企業(yè)的說法,稱這項任務(wù)從技術(shù)上看不可能完成。事實上,這只不過是它們能夠而且必須克服的眾多商業(yè)及道德挑戰(zhàn)中的一項內(nèi)容。
麥克·羅克德斯,奧賴?yán)襟w公司內(nèi)容戰(zhàn)略副總裁;蒂姆·奧賴?yán)瑠W賴?yán)襟w公司創(chuàng)始人兼首席執(zhí)行官,倫敦大學(xué)學(xué)院創(chuàng)新與公共目的研究所客座教授。本文已獲Project Syndicate授權(quán)。