徐 龍
隨著人工智能時(shí)代的到來(lái),機(jī)器學(xué)習(xí)技術(shù)不斷發(fā)展,越來(lái)越多的“作品”(1)人工智能生成內(nèi)容是否構(gòu)成作品是另一個(gè)問(wèn)題,國(guó)內(nèi)外已有相當(dāng)多學(xué)者對(duì)此進(jìn)行了討論。因本文不涉及該問(wèn)題的討論,不宜作出判定,故下文稱其為“內(nèi)容”“成果”“結(jié)果”。參見(jiàn)徐龍:《論人工智能創(chuàng)作之法律屬性與保護(hù)》,《東吳法律學(xué)報(bào)》2021年第1期。通過(guò)機(jī)器學(xué)習(xí)誕生。從《貝拉米畫像》《陽(yáng)光失了玻璃窗》到《I AM AI》等智能“作品”的問(wèn)世,機(jī)器學(xué)習(xí)已廣泛運(yùn)用于繪畫、文學(xué)、音樂(lè)等諸多創(chuàng)作領(lǐng)域,在交易市場(chǎng)中獲得認(rèn)可。同時(shí),人工智能創(chuàng)作已不再專屬于大型企業(yè),個(gè)人也可以借助開放性或授權(quán)性人工智能平臺(tái),通過(guò)機(jī)器學(xué)習(xí)進(jìn)行創(chuàng)作。機(jī)器學(xué)習(xí)技術(shù)的發(fā)展顛覆了人類對(duì)創(chuàng)作規(guī)律的認(rèn)知,也對(duì)現(xiàn)有的法律制度造成沖擊。機(jī)器學(xué)習(xí)可以快速、大量地生成包含輸入作品特征的新內(nèi)容,且在市場(chǎng)上獲得良好反饋。這讓人不得不思考,現(xiàn)行著作權(quán)制度框架下,機(jī)器學(xué)習(xí)是否構(gòu)成著作權(quán)侵權(quán),其造成的不利影響能否得到規(guī)制?若現(xiàn)行法無(wú)法有效規(guī)制,應(yīng)當(dāng)如何對(duì)著作權(quán)人予以保護(hù),兼顧著作權(quán)人利益和科技發(fā)展應(yīng)用,實(shí)現(xiàn)社會(huì)效益最大化?目前,學(xué)界關(guān)于機(jī)器學(xué)習(xí)的研究主要集中在其生成內(nèi)容的可著作權(quán)性,以及小部分學(xué)者的研究涉及輸入階段的大批量復(fù)制行為,卻不曾關(guān)注到批量復(fù)制的后續(xù)使用行為是否應(yīng)當(dāng)受到著作權(quán)法規(guī)制。為此,筆者將從機(jī)器學(xué)習(xí)對(duì)創(chuàng)作者的影響,機(jī)器學(xué)習(xí)的著作權(quán)侵權(quán)分析、制度困境及其出路等方面進(jìn)行分析,并提出解決方案。
通常來(lái)說(shuō),機(jī)器學(xué)習(xí)就是由人類設(shè)計(jì)初步算法模型,通過(guò)輸入數(shù)據(jù)信息,并使得算法模型在數(shù)據(jù)訓(xùn)練中不斷優(yōu)化,并生成反映輸入數(shù)據(jù)特征值的輸出內(nèi)容的過(guò)程。其技術(shù)過(guò)程大致可分為三個(gè)階段(如圖1所示):輸入階段,將選定數(shù)據(jù)樣本導(dǎo)入(input)初始模型,供算法學(xué)習(xí)與訓(xùn)練;訓(xùn)練階段,通過(guò)算法模型學(xué)習(xí)樣本數(shù)據(jù)的內(nèi)在邏輯關(guān)系,提取特征值,逐步優(yōu)化和改進(jìn)算法并完成指令;輸出階段,在前兩個(gè)階段的基礎(chǔ)上,通過(guò)算法程序?qū)?shù)據(jù)的學(xué)習(xí)評(píng)估模型并預(yù)測(cè)結(jié)果,最終輸出(output)相應(yīng)內(nèi)容。
圖1 機(jī)器學(xué)習(xí)階段構(gòu)成圖
依照是否有表達(dá)性內(nèi)容的輸出,可將機(jī)器學(xué)習(xí)分為“表達(dá)性機(jī)器學(xué)習(xí)”(expressive machine learning)和“非表達(dá)性機(jī)器學(xué)習(xí)”(non-expressive machine learning)。(2)Sobel, Benjamin L .W., “Artificial Intelligence’s Fair Use Crisis”, Columbia Journal of Law & the Arts,2017,41(1),pp.45- 49.“非表達(dá)性機(jī)器學(xué)習(xí)”指沒(méi)有表達(dá)性內(nèi)容輸出的機(jī)器學(xué)習(xí)。如人臉識(shí)別系統(tǒng),雖然開發(fā)過(guò)程中涉及對(duì)大量人臉圖像的復(fù)制,但其目的不是為了生成表達(dá)性內(nèi)容,而是為了完善人臉識(shí)別算法。這種沒(méi)有表達(dá)性內(nèi)容輸出的機(jī)器學(xué)習(xí),并非本文的研究對(duì)象。“表達(dá)性機(jī)器學(xué)習(xí)”指有表達(dá)性內(nèi)容輸出的機(jī)器學(xué)習(xí),即通過(guò)輸入作品數(shù)據(jù)供算法學(xué)習(xí),并生成具備作品集特征的表達(dá)性內(nèi)容。其作品數(shù)據(jù)可以來(lái)源于不特定的多位作者,如2019年微軟小冰舉辦的“或然世界”畫展,其訓(xùn)練數(shù)據(jù)來(lái)源于過(guò)往400年藝術(shù)史上236位著名畫家的畫作;也可以來(lái)源于某一特定作者,如2014年微軟公司與荷蘭國(guó)際銀行合作開發(fā)的“下一個(gè)倫勃朗”,其訓(xùn)練數(shù)據(jù)來(lái)自于畫家倫勃朗的346幅畫作,機(jī)器通過(guò)分析學(xué)習(xí)其繪畫風(fēng)格如顏色、服裝、主題、人物、構(gòu)圖等特征,最終生成類似倫勃朗的畫作,(3)Shlomit Yanisky-Ravid, “Generating Rembrandt: Artificial Intelligence, Copyright, and Accountability in the 3A Era”, Michigan State Law Review,2017(4),pp.659-663.再如巴黎索尼計(jì)算機(jī)科學(xué)實(shí)驗(yàn)室開發(fā)的“深度巴赫”,其訓(xùn)練數(shù)據(jù)來(lái)自于音樂(lè)家巴赫的352首樂(lè)曲,最終輸出了巴赫風(fēng)格的音樂(lè)共2503首,測(cè)評(píng)中超過(guò)一半的聽(tīng)眾誤認(rèn)為機(jī)器輸出的音樂(lè)是巴赫本人創(chuàng)作的作品。(4)Ga?tan Hadjeres, Fran?ois Pachet & Frank Nielsen, “Deepbach: A Steerable Model for Bach Chorales Generation”, Proceedings of the 34th International Conference on Machine Learning,2017,pp.1362-1371.這種有表達(dá)性內(nèi)容輸出的機(jī)器學(xué)習(xí)即是本文所要研究的對(duì)象。
隨著人工智能時(shí)代的來(lái)臨,模仿他人創(chuàng)作手法、風(fēng)格已經(jīng)不需要經(jīng)過(guò)人類辛苦且漫長(zhǎng)的學(xué)習(xí)和思考,也不需要親自動(dòng)手創(chuàng)作,而只需將作品數(shù)據(jù)輸入人工智能算法進(jìn)行機(jī)器學(xué)習(xí)即可高效實(shí)現(xiàn)。相較于人類作者學(xué)習(xí)和模仿創(chuàng)作時(shí)的費(fèi)時(shí)費(fèi)力,人工智能生成表達(dá)性內(nèi)容的高效,會(huì)對(duì)被學(xué)習(xí)作品的相關(guān)市場(chǎng)產(chǎn)生競(jìng)爭(zhēng)甚至替代效果,產(chǎn)生侵占甚至取代原作市場(chǎng)的風(fēng)險(xiǎn)。創(chuàng)作風(fēng)格、手法等特征是作者鮮明個(gè)性的體現(xiàn),往往經(jīng)過(guò)不斷摸索、淬煉而成,作品的潛在市場(chǎng)和價(jià)值與之息息相關(guān)。精心創(chuàng)作而成的作品剛剛發(fā)表,他人便可肆無(wú)忌憚地利用機(jī)器學(xué)習(xí)快速、大量地生成特征相似的內(nèi)容,對(duì)原作品的潛在市場(chǎng)和價(jià)值以及作者的創(chuàng)作熱情所造成的影響是難以估量的。
有學(xué)者認(rèn)為,若機(jī)器學(xué)習(xí)的作品來(lái)源于某一特定作者,則機(jī)器的輸出內(nèi)容會(huì)對(duì)原作品的潛在市場(chǎng)產(chǎn)生替代效果;若其學(xué)習(xí)的作品來(lái)源于多位作者,則機(jī)器學(xué)習(xí)的是不同作者間通用的大眾化表達(dá),其輸出內(nèi)容不會(huì)對(duì)原作品的潛在市場(chǎng)造成影響。(5)李安:《機(jī)器學(xué)習(xí)作品的著作權(quán)法分析》,《電子知識(shí)產(chǎn)權(quán)》2020年第6期。其實(shí),不論其學(xué)習(xí)的作品來(lái)自一人還是多人,其輸出內(nèi)容都可能對(duì)原作品的潛在市場(chǎng)和價(jià)值造成影響。因?yàn)闄C(jī)器學(xué)習(xí)所利用的內(nèi)容是每一個(gè)作品的全部表達(dá),包括其特有的獨(dú)創(chuàng)性表達(dá),而并非只針對(duì)其中通用的大眾化表達(dá)。通過(guò)對(duì)不同作者作品的學(xué)習(xí),機(jī)器學(xué)習(xí)的生成內(nèi)容有可能同時(shí)呈現(xiàn)多個(gè)作者的表達(dá)風(fēng)格。相比于再現(xiàn)某一特定作者風(fēng)格的作品,含有多個(gè)作者風(fēng)格的作品可能會(huì)對(duì)相關(guān)市場(chǎng)造成更大的影響。試想一下,原本身處同一領(lǐng)域的知名作者之間并不常出現(xiàn)合作,多位知名作者強(qiáng)強(qiáng)聯(lián)手的情形往往只存在于粉絲們幻想的情節(jié)中;現(xiàn)在,通過(guò)機(jī)器學(xué)習(xí)便可讓現(xiàn)實(shí)生活中粉絲們不敢想象的事情變成可能,這必然會(huì)對(duì)原作品市場(chǎng)產(chǎn)生影響,甚至其影響更甚于對(duì)特定作者風(fēng)格的模仿。
與此同時(shí),若允許通過(guò)機(jī)器學(xué)習(xí)肆意生成具備他人作品特征值的新內(nèi)容,久而久之將可能導(dǎo)致人類作品市場(chǎng)被大型人工智能公司所壟斷,因?yàn)槿魏我粋€(gè)先前作品都可以通過(guò)人工智能算法快速學(xué)習(xí),大量生成類似的成果,甚至包含多個(gè)作者風(fēng)格特點(diǎn)的超越性成果。掌握資本、數(shù)據(jù)和算法的大型公司通過(guò)壟斷優(yōu)質(zhì)算法和數(shù)據(jù),將可能侵占和擠壓人類創(chuàng)作的市場(chǎng)空間,以至于人類創(chuàng)作萎靡,影響文化藝術(shù)和人類精神文明的繁榮。
鑒于機(jī)器學(xué)習(xí)所導(dǎo)致的不利影響,有必要從著作權(quán)法上對(duì)其展開討論,研析現(xiàn)行著作權(quán)法框架下機(jī)器學(xué)習(xí)是否構(gòu)成侵權(quán),能否對(duì)其作出有效規(guī)制。
1.輸入階段
在輸入階段,算法程序無(wú)法像人類一樣通過(guò)閱讀來(lái)獲取信息,而必須仰賴數(shù)據(jù)的輸入,且需要將作品信息轉(zhuǎn)化為算法可讀的數(shù)據(jù)格式,包括對(duì)非數(shù)字化作品的數(shù)字化和對(duì)數(shù)字化作品的拷貝。我國(guó)《著作權(quán)法》第9條明確數(shù)字化屬于復(fù)制行為,認(rèn)為復(fù)制權(quán)是指“以……數(shù)字化等方式將作品制作一份或者多份的權(quán)利”。輸入作品數(shù)據(jù)的行為客觀上制作了一份或者多份復(fù)制品,屬于“復(fù)制行為”。同時(shí),在監(jiān)督學(xué)習(xí)(6)監(jiān)督學(xué)習(xí)(supervised learning)是機(jī)器學(xué)習(xí)的一種。在監(jiān)督學(xué)習(xí)中,需要對(duì)數(shù)據(jù)進(jìn)行分類、標(biāo)注,再用標(biāo)注的數(shù)據(jù)進(jìn)行模型的訓(xùn)練。中,工作人員需要在輸入前對(duì)數(shù)據(jù)進(jìn)行標(biāo)注(labels),如在貓臉圖面識(shí)別算法中對(duì)數(shù)據(jù)進(jìn)行“是貓”或“非貓”的標(biāo)注,使得算法根據(jù)標(biāo)注的數(shù)據(jù)進(jìn)行訓(xùn)練。監(jiān)督學(xué)習(xí)中對(duì)作品數(shù)據(jù)的標(biāo)注行為,其實(shí)是一種對(duì)作品數(shù)據(jù)的“改編行為”。此外,監(jiān)督學(xué)習(xí)還需要工作人員對(duì)作品數(shù)據(jù)進(jìn)行整理和匯總,且所有機(jī)器學(xué)習(xí)都涉及對(duì)作品數(shù)據(jù)的選擇。監(jiān)督學(xué)習(xí)對(duì)作品數(shù)據(jù)集合中的數(shù)據(jù)選擇、整理和匯總,可以視為一種“匯編行為”。
2.訓(xùn)練階段
在訓(xùn)練階段,機(jī)器學(xué)習(xí)也可能伴隨臨時(shí)副本的生成,涉及臨時(shí)復(fù)制。臨時(shí)復(fù)制件是客觀技術(shù)現(xiàn)象的產(chǎn)物,沒(méi)有被利用與傳播的獨(dú)立經(jīng)濟(jì)價(jià)值,不屬于著作權(quán)法意義上的復(fù)制行為,對(duì)此不作贅述。
3.輸出階段
一般情況下,機(jī)器學(xué)習(xí)的輸出內(nèi)容不涉及改編。即便是同人作品也必須以原作內(nèi)容為基礎(chǔ),是基于原作的人物關(guān)系和人物設(shè)定上所做的改編。相反,所謂的“人工智能作品”實(shí)際上是通過(guò)對(duì)輸入的作品數(shù)據(jù)進(jìn)行解碼、學(xué)習(xí),在算法模型下生成的反映數(shù)據(jù)特征值的內(nèi)容。創(chuàng)作風(fēng)格、手法等特征屬于思想范疇,不受著作權(quán)法保護(hù)。對(duì)創(chuàng)作風(fēng)格、手法等特征的模仿和融合等實(shí)質(zhì)性利用,都不構(gòu)成對(duì)原作品的改編。當(dāng)然,在算法存在嚴(yán)重缺陷且訓(xùn)練數(shù)據(jù)極少的極端情況下,有可能出現(xiàn)輸入作品和輸出內(nèi)容構(gòu)成實(shí)質(zhì)性相似的情形,但這種極端情形不是機(jī)器學(xué)習(xí)所要追求的目標(biāo),不作贅述。
機(jī)器學(xué)習(xí)過(guò)程中具有著作權(quán)法意義的實(shí)際上只有輸入階段的“數(shù)據(jù)處理”行為(data processing),包括對(duì)作品數(shù)據(jù)的復(fù)制行為、監(jiān)督學(xué)習(xí)中對(duì)作品數(shù)據(jù)的改編以及匯編行為。對(duì)于輸入階段的后續(xù)作品使用行為(訓(xùn)練、輸出階段行為),并不在現(xiàn)行著作權(quán)法的制度目標(biāo)內(nèi),無(wú)法直接對(duì)其調(diào)整。
我國(guó)的著作權(quán)例外規(guī)定為法定許可與合理使用。雖然現(xiàn)行法律并未設(shè)置相關(guān)的法定許可,但合理使用制度仍可使機(jī)器學(xué)習(xí)輸入階段的數(shù)據(jù)處理行為免于侵權(quán)風(fēng)險(xiǎn)。
從學(xué)理上看,輸入階段的數(shù)據(jù)處理行為屬于轉(zhuǎn)換性使用,滿足合理使用“四要素”和“三步檢驗(yàn)法”的判斷。實(shí)務(wù)中“三步檢驗(yàn)法”往往結(jié)合“四要素”作判斷,而“四要素”中最重要的當(dāng)數(shù)“行為性質(zhì)和目的”以及“對(duì)原作品潛在市場(chǎng)和價(jià)值的影響”。一是輸入階段的數(shù)據(jù)處理行為目的具有轉(zhuǎn)換性,符合轉(zhuǎn)換性使用。美國(guó)法院在“谷歌圖書館案”中認(rèn)為,為圖書檢索而大規(guī)模數(shù)字化掃描的行為,具有不同于讓公眾閱讀內(nèi)容的原始創(chuàng)作目的,屬轉(zhuǎn)換性使用。(7)Authors Guild v.Google Inc., 954 F.Supp.2d.282(2013), affirmed by 804 F.3d 202(2nd Cir.2015), cert.denied, 136 S.Ct.1658(2016).論文查重、法律數(shù)據(jù)庫(kù)涉及的數(shù)據(jù)復(fù)制行為也有類似判決。(8)A.V.v.Iparadigms.LLC., 562 F.36 630, 633 - 644 (2009); Edward White v.West and Lexis, No.12 Civ.1340 (JSR) (S.D.N.Y.Jul.3, 2014).機(jī)器學(xué)習(xí)輸入階段的數(shù)據(jù)處理行為也不同于原始創(chuàng)作目的,其對(duì)作品數(shù)據(jù)的復(fù)制、標(biāo)注、整理匯總不是為了讓公眾獲取并閱讀復(fù)制品、改編或匯編作品,而是為了讓人工智能算法對(duì)作品數(shù)據(jù)進(jìn)行機(jī)器學(xué)習(xí)并生成內(nèi)容,屬于轉(zhuǎn)換性使用。二是輸入階段的數(shù)據(jù)處理行為不會(huì)對(duì)原作品潛在市場(chǎng)和價(jià)值造成影響。輸入階段的數(shù)據(jù)處理行為僅是機(jī)器學(xué)習(xí)的內(nèi)部行為,并未就該處理結(jié)果(復(fù)制品、改編作品、匯編作品)對(duì)外使用。復(fù)制、改編或匯編行為所控制的結(jié)果也未直接表現(xiàn)在最終輸出內(nèi)容上。輸入階段行為不等同于機(jī)器學(xué)習(xí)本身。后續(xù)的算法訓(xùn)練和內(nèi)容生成并不是輸入階段的數(shù)據(jù)處理行為所控制的內(nèi)容。機(jī)器學(xué)習(xí)所復(fù)制的作品數(shù)據(jù)僅是針對(duì)輸入作品樣本的一次復(fù)制甚至臨時(shí)復(fù)制,且并未就該復(fù)制品進(jìn)行對(duì)外商業(yè)性使用,不會(huì)對(duì)原作品造成影響。改編與匯編的情形亦同。因此,輸入階段數(shù)據(jù)處理行為的結(jié)果并未對(duì)外界使用,該特定情形不會(huì)影響原作品的正常使用,也不會(huì)損害著作權(quán)人的合法權(quán)益。
從制度上看,新修訂的《著作權(quán)法》為輸入階段的數(shù)據(jù)處理行為提供了合理使用的制度空間,國(guó)外對(duì)此專設(shè)的著作權(quán)例外則進(jìn)一步佐證其合理使用的正當(dāng)性。一是《著作權(quán)法》第24條增設(shè)兜底規(guī)定并引入“三步檢驗(yàn)法”,為其構(gòu)成合理使用提供制度空間。此前,最高人民法院的指導(dǎo)性意見(jiàn)就主張?jiān)凇八囊亍被A(chǔ)上結(jié)合“三步檢驗(yàn)法”進(jìn)行判斷。(9)最高人民法院《關(guān)于充分發(fā)揮知識(shí)產(chǎn)權(quán)審判職能作用推動(dòng)社會(huì)主義文化大發(fā)展大繁榮和促進(jìn)經(jīng)濟(jì)自主協(xié)調(diào)發(fā)展若干問(wèn)題的意見(jiàn)》(法發(fā)〔2011〕18號(hào))第8條指出:“在促進(jìn)技術(shù)創(chuàng)新和商業(yè)發(fā)展確有必要的特殊情形下,考慮作品使用行為的性質(zhì)和目的、被使用作品的性質(zhì)、被使用部分的數(shù)量和質(zhì)量、使用對(duì)作品潛在市場(chǎng)或價(jià)值的影響等因素,如果該使用行為既不與作品的正常使用相沖突,也不至于不合理地?fù)p害作者的正當(dāng)利益,可以認(rèn)定為合理使用。”我國(guó)司法實(shí)踐中也有不少判決突破了窮盡式列舉的限制,將法定情形之外的行為認(rèn)定為合理使用。(10)北京市高級(jí)人民法院(2013)高民終字第1221號(hào)民事判決書;上海知識(shí)產(chǎn)權(quán)法院(2015)滬知民終字第730號(hào)民事判決書;廣州知識(shí)產(chǎn)權(quán)法院(2017)粵73民終85號(hào)民事判決書。因此,只要輸入階段的數(shù)據(jù)處理行為滿足“四要素”及“三步檢驗(yàn)法”,即可認(rèn)定構(gòu)成合理使用。二是相比于“四要素”和“三步檢驗(yàn)法”判斷的不確定性,域外國(guó)家制定了更加明確具體的規(guī)定。日本2018年修訂的《著作權(quán)法》第30條之四第2項(xiàng)將“信息分析”規(guī)定為著作權(quán)例外,(11)日本『著作権法(昭和四十五年法律第四十八號(hào))』第三十條の四第二項(xiàng)。并于第47條之五規(guī)定了三類“輕微使用”,為產(chǎn)生新知識(shí)新信息而利用計(jì)算機(jī)進(jìn)行信息檢索、信息分析并提供結(jié)果,或其他利用計(jì)算機(jī)處理信息產(chǎn)生新知識(shí)新信息并改善公民生活便利的行為,信息處理者可對(duì)他人作品進(jìn)行必要限度的復(fù)制或向公眾公開。(12)日本『著作権法(昭和四十五年法律第四十八號(hào))』第四十七條の五。歐盟議會(huì)2019年通過(guò)的《數(shù)字單一市場(chǎng)版權(quán)指令》第4條規(guī)定,以文本和數(shù)據(jù)挖掘(text and data mining)為目的,對(duì)合法獲取的作品或其他內(nèi)容進(jìn)行復(fù)制與提取的行為屬于著作權(quán)例外。(13)DIRECTIVE (EU) 2019/790 OF THE EUROPEAN PARLIAMENT AND OF THE COUNCIL of 17 April 2019 on copyright and related rights in the Digital Single Market and amending Directives 96/9/EC and 2001/29/EC, https://eur-lex.europa.eu/legal-content/EN/TXT/PDF/?uri=CELEX:32019L0790&from=EN (last visited 2021/8/10).德國(guó)、(14)Gesetz über Urheberrecht und verwandte Schutzrechte, https://www.gesetze-im-internet.de/urhg/UrhG.pdf (last visited 2021/8/10).英國(guó)、(15)The Copyright and Rights in Performances (Research, Education, Libraries and Archives) Regulations 2014, https://www.legislation.gov.uk/ukdsi/2014/9780111112755 (last visited 2021/8/10).法國(guó)(16)LOI n° 2016-1321 du 7 octobre 2016 pour une République numérique (1), https://www.legifrance.gouv.fr/loda/id/JORFTEXT000033202746/ (last visited 2021/8/10).等也對(duì)非商業(yè)性的數(shù)據(jù)處理行為做出了著作權(quán)例外規(guī)定。這些專門的著作權(quán)例外規(guī)定,進(jìn)一步佐證了輸入階段數(shù)據(jù)處理行為構(gòu)成合理使用的正當(dāng)性。
綜上,現(xiàn)行著作權(quán)法無(wú)法對(duì)機(jī)器學(xué)習(xí)所造成的不利影響作出有效規(guī)制,僅輸入階段的數(shù)據(jù)處理行為有著作權(quán)法意義,且滿足合理使用,不構(gòu)成著作權(quán)侵權(quán);輸入后續(xù)階段的行為,則不在著作權(quán)法規(guī)制目的范圍之內(nèi)。
隨著機(jī)器學(xué)習(xí)技術(shù)的不斷發(fā)展,人機(jī)合作的創(chuàng)作模式已逐漸成為常態(tài),從騰訊Dreamwriter大量生成新聞報(bào)道到個(gè)人利用GPT-3生成各類作品,(17)Tom B.Brown et al., “Language Models are Few-Shot Learners”, arXiv:2005.14165 [cs.CL22 Jul 2020], https://arxiv.org/pdf/2005.14165.pdf (last visited 2021/8/6).作品創(chuàng)作已經(jīng)從過(guò)去的人類自然創(chuàng)作模式逐漸轉(zhuǎn)變?yōu)槿藱C(jī)合作模式。然而,依據(jù)現(xiàn)行著作權(quán)法,輸入階段的作品數(shù)據(jù)處理行為應(yīng)屬合理使用,機(jī)器學(xué)習(xí)并不構(gòu)成著作權(quán)侵權(quán),無(wú)法得到有效規(guī)制。究其原因,是在機(jī)器學(xué)習(xí)的過(guò)程中,只有輸入階段的作品數(shù)據(jù)處理行為(包括復(fù)制、改編、匯編)才具有著作權(quán)法上的意義,受到著作權(quán)法的規(guī)制,之后的數(shù)據(jù)訓(xùn)練以及內(nèi)容生成并不在著作權(quán)法調(diào)整范圍內(nèi)。機(jī)器學(xué)習(xí)的不利后果正是由于輸入數(shù)據(jù)后的行為所致。輸入作品數(shù)據(jù)之后,人工智能通過(guò)學(xué)習(xí)數(shù)據(jù)集的內(nèi)在邏輯關(guān)系,輸出了包含作品數(shù)據(jù)特征的新內(nèi)容,對(duì)原作品的潛在市場(chǎng)和價(jià)值產(chǎn)生不利影響。這種對(duì)作品特征(主要指創(chuàng)作風(fēng)格)的高效模仿或多種風(fēng)格的融合性模仿,并不在現(xiàn)行著作權(quán)法立法和規(guī)制目的范圍之內(nèi)。不論是歐盟《數(shù)字單一市場(chǎng)版權(quán)指令》中的“文本和數(shù)據(jù)挖掘”行為,還是日本著作權(quán)法中的利用計(jì)算機(jī)處理信息產(chǎn)生新知識(shí)新信息的行為,都只是將其作為一種現(xiàn)行著作權(quán)的例外情形來(lái)加以規(guī)定,并未注意到機(jī)器學(xué)習(xí)本身對(duì)人類自然創(chuàng)作規(guī)律的顛覆。造成機(jī)器學(xué)習(xí)制度困境的原因就是著作權(quán)法關(guān)于機(jī)器學(xué)習(xí)這種新事物的空白和缺失。
目前學(xué)界關(guān)于機(jī)器學(xué)習(xí)的討論基本都集中在“復(fù)制”上,(18)吳漢東:《人工智能生成作品的著作權(quán)法之問(wèn)》,《中外法學(xué)》2020年第3期;張金平:《人工智能作品合理使用困境及其解決》,《環(huán)球法律評(píng)論》2019年第3期。而忽略了機(jī)器學(xué)習(xí)的核心并非“復(fù)制”,而是“學(xué)習(xí)”和“生成”,即能夠快速、大量地生成具備輸入作品特征值的新內(nèi)容。法律制度和理論研究的雙重空白,使得解決機(jī)器學(xué)習(xí)的著作權(quán)困境愈發(fā)緊迫,理論和實(shí)務(wù)都應(yīng)當(dāng)對(duì)此作出應(yīng)對(duì)。
機(jī)器學(xué)習(xí)不同于復(fù)制、改編或匯編。企圖通過(guò)復(fù)制權(quán)或其他著作權(quán)來(lái)調(diào)整機(jī)器學(xué)習(xí)對(duì)著作權(quán)人的不利影響是不現(xiàn)實(shí)的。誠(chéng)然,機(jī)器學(xué)習(xí)輸入數(shù)據(jù)時(shí)必然涉及復(fù)制,但該復(fù)制行為僅僅只是輸入階段的內(nèi)部行為,不會(huì)對(duì)外界產(chǎn)生影響。要想使得輸入數(shù)據(jù)的后續(xù)行為受復(fù)制權(quán)規(guī)制,就必須進(jìn)行擴(kuò)張解釋,將復(fù)制后使用復(fù)制品的行為視為復(fù)制行為的延續(xù)。但這種做法并不可行,因?yàn)樗鼤?huì)不正當(dāng)?shù)財(cái)U(kuò)張復(fù)制權(quán)的含義,使復(fù)制權(quán)和其他著作權(quán)的邊界變得模糊。復(fù)制行為和復(fù)制后利用復(fù)制品的行為,不論在客觀事實(shí)還是著作權(quán)法含義上都是不同的。復(fù)制是對(duì)作品內(nèi)容的原樣再現(xiàn)。復(fù)制作品數(shù)據(jù)后,再利用算法訓(xùn)練和輸出內(nèi)容的行為,已經(jīng)超出了復(fù)制權(quán)的含義。換言之,改編者在復(fù)制某一作品后,學(xué)習(xí)該復(fù)制品并進(jìn)行改編,我們不能將后續(xù)的改編行為視為前期復(fù)制行為的內(nèi)容。機(jī)器學(xué)習(xí)中的復(fù)制行為自然也不包含后續(xù)的行為。同理,通過(guò)改編權(quán)或匯編權(quán)來(lái)規(guī)制機(jī)器學(xué)習(xí)也是不可取的,因?yàn)樗鼈兺瑯硬谎蛹昂罄m(xù)的行為,并且改編或匯編行為僅僅發(fā)生在采用監(jiān)督學(xué)習(xí)算法的少數(shù)情況下,并不必然發(fā)生在所有機(jī)器學(xué)習(xí)中。
機(jī)器學(xué)習(xí)不同于以往任何一種著作權(quán)法意義上的作品使用方式。雖然其初始階段可能涉及復(fù)制,少數(shù)情形涉及改編或匯編,但機(jī)器學(xué)習(xí)有著不同于復(fù)制、改編或匯編的內(nèi)涵,即機(jī)器對(duì)過(guò)去作品創(chuàng)作風(fēng)格的高效自動(dòng)化模仿或融合性模仿的速度遠(yuǎn)超人類極限,會(huì)影響原作品市場(chǎng)和潛在價(jià)值,減損著作權(quán)人利益。在過(guò)去,受制于“思想—表達(dá)”二分法的桎梏,對(duì)他人創(chuàng)作風(fēng)格的模仿并不在著作權(quán)法規(guī)制目的范圍之內(nèi),不構(gòu)成著作權(quán)侵權(quán)。傳統(tǒng)著作權(quán)法框架下,不論是復(fù)制權(quán)、匯編權(quán)、改編權(quán)或是其他著作權(quán),都無(wú)法對(duì)其作出有效規(guī)制。因此,為避免機(jī)器學(xué)習(xí)對(duì)原作品潛在市場(chǎng)和價(jià)值的不利影響,保障著作權(quán)人的利益,有必要針對(duì)機(jī)器學(xué)習(xí)這種新型作品使用方式設(shè)置一項(xiàng)新的著作權(quán)進(jìn)行規(guī)制,未經(jīng)許可不得對(duì)新發(fā)表的作品進(jìn)行表達(dá)性機(jī)器學(xué)習(xí)。
機(jī)器學(xué)習(xí)權(quán)的權(quán)利主體應(yīng)當(dāng)是被學(xué)習(xí)作品的著作權(quán)人,一般情況下是被學(xué)習(xí)作品的創(chuàng)作者。機(jī)器學(xué)習(xí)權(quán)設(shè)置的首要目的就是保障被學(xué)習(xí)作品著作權(quán)人的利益,避免其作品的潛在市場(chǎng)和價(jià)值受影響。被學(xué)習(xí)作品的著作權(quán)人權(quán)益因機(jī)器學(xué)習(xí)受到侵害時(shí),有權(quán)請(qǐng)求加害人承擔(dān)侵權(quán)責(zé)任。
機(jī)器學(xué)習(xí)權(quán)所要保護(hù)的是著作權(quán)人在一定期限內(nèi)對(duì)其發(fā)表的作品進(jìn)行表達(dá)性機(jī)器學(xué)習(xí)的排他性壟斷權(quán)利。因此,機(jī)器學(xué)習(xí)權(quán)的內(nèi)容應(yīng)當(dāng)是未經(jīng)著作權(quán)人許可,不得隨意對(duì)其作品進(jìn)行表達(dá)性機(jī)器學(xué)習(xí)。
1.權(quán)利限制的理由
若機(jī)器學(xué)習(xí)作品都需要事前授權(quán),則會(huì)產(chǎn)生較高的交易成本,抑制人工智能產(chǎn)業(yè)發(fā)展。機(jī)器學(xué)習(xí)需要輸入大量作品數(shù)據(jù),包含在保護(hù)期內(nèi)和已過(guò)保護(hù)期的作品。若需要一一識(shí)別數(shù)據(jù)的版權(quán)狀況,并向權(quán)利人請(qǐng)求授權(quán),無(wú)疑會(huì)大大增加交易成本。就法律經(jīng)濟(jì)學(xué)而言,交易成本是對(duì)著作權(quán)進(jìn)行限制的重要理由。過(guò)高的交易成本會(huì)阻礙人工智能在創(chuàng)作領(lǐng)域的應(yīng)用和技術(shù)發(fā)展;過(guò)于嚴(yán)苛的著作權(quán)保護(hù)則會(huì)減少可供機(jī)器自由學(xué)習(xí)的作品,有可能引發(fā)算法偏見(jiàn)。著作權(quán)保護(hù)會(huì)增加高質(zhì)量作品數(shù)據(jù)的獲取難度,使人工智能訓(xùn)練者傾向于選擇“獲取限制較低但帶有偏見(jiàn)的數(shù)據(jù)集”(biased, low-friction data)來(lái)訓(xùn)練算法,譬如已過(guò)保護(hù)期處于公共領(lǐng)域的作品。訓(xùn)練算法的數(shù)據(jù)不充足、不完整,將可能導(dǎo)致算法偏見(jiàn)甚至出現(xiàn)歧視。(19)Amanda Levendowski, “How Copyright Law Can Fix Artificial Intelligence’s Implicit Bias Problem”, Washington Law Review,2018,93(2),pp.582-584.
著作權(quán)法一直都是一部利益平衡的法律,在保障著作權(quán)人權(quán)益的同時(shí)兼顧科學(xué)技術(shù)的發(fā)展。所以,在賦予著作權(quán)人對(duì)其作品進(jìn)行表達(dá)性機(jī)器學(xué)習(xí)權(quán)利的同時(shí),為避免高昂交易成本及可能出現(xiàn)的算法偏見(jiàn)風(fēng)險(xiǎn),有必要對(duì)機(jī)器學(xué)習(xí)權(quán)作出適當(dāng)限制。
2.權(quán)利限制的內(nèi)容
在時(shí)間上,對(duì)機(jī)器學(xué)習(xí)權(quán)設(shè)置為期6個(gè)月的權(quán)利衰減期,對(duì)于發(fā)表或連載完結(jié)已滿6個(gè)月的作品進(jìn)行權(quán)利限制。機(jī)器學(xué)習(xí)權(quán)設(shè)置的目的是為了保護(hù)被學(xué)習(xí)作品的潛在市場(chǎng)和價(jià)值不受影響,保障創(chuàng)作者權(quán)益,因此在制度設(shè)計(jì)上應(yīng)充分考量作品的市場(chǎng)和價(jià)值因素。自進(jìn)入互聯(lián)網(wǎng)時(shí)代以來(lái),作品傳播迅捷、高效,市場(chǎng)上充斥著各種各樣的作品。在這個(gè)資訊爆炸的時(shí)代,熱度是影響作品市場(chǎng)的重要因素,受眾要從成千上萬(wàn)的作品資訊中作出選擇,其考量因素除了自身需求等主觀因素外,客觀世界對(duì)作品的關(guān)注和熱度是一個(gè)重要的評(píng)判標(biāo)準(zhǔn)。作品的熱度代表著其受眾的數(shù)量和市場(chǎng),代表著流量和經(jīng)濟(jì)利益。各大文化藝術(shù)領(lǐng)域的創(chuàng)作者或公司為了獲得更大的市場(chǎng),更是絞盡腦汁地希望其作品及相關(guān)周邊產(chǎn)品盡可能地?cái)D上所謂的“熱搜”“熱榜”等熱門榜單,成為大眾關(guān)注的對(duì)象。一個(gè)新發(fā)布的作品之所以會(huì)因機(jī)器學(xué)習(xí)而影響其潛在市場(chǎng),是因?yàn)闄C(jī)器學(xué)習(xí)的生成內(nèi)容會(huì)分散讀者市場(chǎng)對(duì)原作品的關(guān)注和熱度。縱觀當(dāng)下各大作品流量榜單,各類作品發(fā)布后在榜單上的持續(xù)時(shí)間都相對(duì)較短。以音樂(lè)作品為例,一般情況下,很少有音樂(lè)作品能在榜單上維持超過(guò)十幾周的時(shí)間,特別優(yōu)秀的也不過(guò)半年左右。就算是連載作品,如連載漫畫、小說(shuō),當(dāng)作品完結(jié)后,其市場(chǎng)關(guān)注熱度也逐漸下降,很難維持超過(guò)6個(gè)月。因此,鑒于機(jī)器學(xué)習(xí)和互聯(lián)網(wǎng)作品傳播的特性,相較于其他著作權(quán),機(jī)器學(xué)習(xí)權(quán)獲得完全保護(hù)的時(shí)間應(yīng)當(dāng)相對(duì)較短,新發(fā)表不久的作品不被機(jī)器學(xué)習(xí)的保護(hù)需求較強(qiáng),著作權(quán)人應(yīng)當(dāng)獲得完全的保護(hù);作品發(fā)表或連載完結(jié)一段時(shí)間后熱度下降使其保護(hù)需求相對(duì)減弱,此時(shí)科技應(yīng)用和發(fā)展的利益更值得被保護(hù),權(quán)利應(yīng)當(dāng)受到弱化衰減。具體來(lái)說(shuō),以新作品發(fā)表的熱度持續(xù)時(shí)間為參考因素,初步建議可對(duì)機(jī)器學(xué)習(xí)權(quán)設(shè)定為期6個(gè)月的權(quán)利衰減期,即對(duì)于發(fā)表或連載完成時(shí)間未滿6個(gè)月的作品,未經(jīng)權(quán)利人許可,他人不得隨意對(duì)其進(jìn)行機(jī)器學(xué)習(xí);對(duì)于發(fā)表或連載完成后6個(gè)月的作品,表達(dá)性機(jī)器學(xué)習(xí)的排他性壟斷權(quán)利受到限制,權(quán)利衰減。
在方式上,對(duì)于發(fā)表或連載完成后6個(gè)月的作品,法定許可他人可以對(duì)其進(jìn)行機(jī)器學(xué)習(xí)。相比于合理使用,法定許可更能實(shí)現(xiàn)機(jī)器學(xué)習(xí)中各方的利益平衡。法定許可制度既保證了人工智能研發(fā)者可以大規(guī)模使用作品,又對(duì)著作權(quán)人的利益給予了充分尊重,彌補(bǔ)了權(quán)利限制對(duì)其利益的損害,能夠最大程度地平衡各方利益,在激勵(lì)文化藝術(shù)創(chuàng)新的同時(shí)保證科學(xué)技術(shù)的發(fā)展,實(shí)現(xiàn)交易成本最小化與資源配置的效益最大化。為此,建議對(duì)機(jī)器學(xué)習(xí)權(quán)采用法定許可進(jìn)行限制,對(duì)于發(fā)表或連載完成后6個(gè)月的作品,法定許可他人可以對(duì)其進(jìn)行機(jī)器學(xué)習(xí)。在法定許可的具體費(fèi)用計(jì)算和收取上,可通過(guò)完善著作權(quán)集體管理制度和引入?yún)^(qū)塊鏈技術(shù)來(lái)實(shí)現(xiàn)。
具體而言,第一,應(yīng)當(dāng)完善著作權(quán)集體管理,建立市場(chǎng)化分類收費(fèi)機(jī)制。針對(duì)聲音、圖像、文字等不同藝術(shù)表現(xiàn)方式分類設(shè)定標(biāo)準(zhǔn),由著作權(quán)集體管理組織代為收取報(bào)酬。在費(fèi)率的設(shè)置上,應(yīng)考慮被學(xué)習(xí)作品的市場(chǎng)價(jià)值、生成內(nèi)容的市場(chǎng)價(jià)值以及被學(xué)習(xí)作品占作品數(shù)據(jù)集合的比重等因素。第二,引入?yún)^(qū)塊鏈技術(shù),完善機(jī)器學(xué)習(xí)作品數(shù)據(jù)使用的透明度,建立機(jī)器學(xué)習(xí)數(shù)據(jù)使用公開和審核制度。機(jī)器學(xué)習(xí)的隱蔽性較強(qiáng),常常在脫機(jī)狀態(tài)下完成,現(xiàn)有制度框架下著作人很難發(fā)現(xiàn)其作品被用于機(jī)器學(xué)習(xí),并進(jìn)行相應(yīng)的維權(quán)。為此,可以考慮引入?yún)^(qū)塊鏈技術(shù),以區(qū)塊的方式將作品數(shù)據(jù)進(jìn)行固定,并以密碼學(xué)方式保證其不可篡改和不可偽造。(20)中國(guó)電子技術(shù)標(biāo)準(zhǔn)化研究院等:《中國(guó)區(qū)塊鏈技術(shù)和應(yīng)用發(fā)展白皮書(2016)》,http://www.199it.com/archives/526865.html。一旦作品在區(qū)塊鏈平臺(tái)上發(fā)表,與之相關(guān)的使用情況都會(huì)被完整、詳細(xì)地記載在分布式賬本中,以便追蹤作品使用情況及確定許可費(fèi)用。對(duì)此,最高人民法院《關(guān)于加強(qiáng)著作權(quán)和與著作權(quán)有關(guān)的權(quán)利保護(hù)的意見(jiàn)》第2條指出:“允許當(dāng)事人通過(guò)區(qū)塊鏈等方式保存、固定和提交證據(jù),有效解決知識(shí)產(chǎn)權(quán)權(quán)利人舉證難問(wèn)題?!迸c此同時(shí),要求人工智能作品發(fā)布前需將機(jī)器學(xué)習(xí)的作品數(shù)據(jù)集公開并提交著作權(quán)集體管理組織審核,由專門機(jī)構(gòu)對(duì)機(jī)器學(xué)習(xí)的作品數(shù)據(jù)中是否有發(fā)表或連載完成未滿6個(gè)月的情形予以審核確認(rèn)(詳見(jiàn)圖2)。
圖2 機(jī)器學(xué)習(xí)權(quán)制度設(shè)計(jì)圖
機(jī)器學(xué)習(xí)的發(fā)展,令包含被學(xué)習(xí)作品特征值的新內(nèi)容可在短時(shí)間內(nèi)被快速、大量地生成,減損著作權(quán)人利益,甚至可能導(dǎo)致少數(shù)大型企業(yè)通過(guò)對(duì)優(yōu)質(zhì)算法和數(shù)據(jù)的壟斷,擠壓普通創(chuàng)作者的創(chuàng)作空間。對(duì)此,現(xiàn)行著作權(quán)法無(wú)法有效規(guī)制,僅輸入階段的數(shù)據(jù)處理行為有著作權(quán)法意義,涉及復(fù)制(主要情形)、改編或匯編,且滿足合理使用,不構(gòu)成著作權(quán)侵權(quán);后續(xù)階段的批量化學(xué)習(xí)以及風(fēng)格模仿或多種風(fēng)格融合性模仿行為,卻并不在傳統(tǒng)著作權(quán)法規(guī)制范圍之內(nèi)。
面對(duì)機(jī)器學(xué)習(xí)引發(fā)的制度困境,有必要針對(duì)機(jī)器學(xué)習(xí)這種新型作品利用方式創(chuàng)設(shè)新型著作權(quán)予以規(guī)制。權(quán)利內(nèi)容為未經(jīng)著作權(quán)人許可,不得任意對(duì)他人作品進(jìn)行表達(dá)性機(jī)器學(xué)習(xí)。同時(shí),為避免過(guò)于嚴(yán)苛的著作權(quán)保護(hù)阻礙科技的創(chuàng)新和進(jìn)步,對(duì)于發(fā)表或連載完成已滿6個(gè)月、保護(hù)需求較弱的作品,法定許可他人可以進(jìn)行機(jī)器學(xué)習(xí),并完善著作權(quán)集體管理制度,建立市場(chǎng)化分類收費(fèi)機(jī)制,引入?yún)^(qū)塊鏈技術(shù),建立機(jī)器學(xué)習(xí)數(shù)據(jù)公開和審核制度,以確保權(quán)利人能夠順利獲得報(bào)酬,在激勵(lì)創(chuàng)作熱情、保護(hù)著作權(quán)人利益的同時(shí),兼顧科學(xué)技術(shù)的發(fā)展和應(yīng)用,實(shí)現(xiàn)利益平衡和社會(huì)效益的最大化。