自2022年11月,以ChatGPT為代表的生成式人工智能問世,標(biāo)志著人工智能時(shí)代的來臨。2025年初,DeepSeek將生成式人工智能發(fā)展推向高潮,引發(fā)社會(huì)廣泛關(guān)注?!渡墒饺斯ぶ悄芊?wù)管理暫行辦法》(以下簡(jiǎn)稱《暫行辦法》)將生成式人工智能技術(shù)界定為“具有文本、圖片、音頻、視頻等內(nèi)容生成能力的模型及相關(guān)技術(shù)”。當(dāng)前,作為具有類人智慧的生成技術(shù)模型,生成式人工智能在給人們生產(chǎn)生活帶來極大便利的同時(shí)也帶來諸多挑戰(zhàn),如知識(shí)產(chǎn)權(quán)保護(hù)、個(gè)人信息數(shù)據(jù)保護(hù)風(fēng)險(xiǎn)及不正當(dāng)競(jìng)爭(zhēng)等[],引發(fā)相關(guān)著作權(quán)侵權(quán)糾紛,如2023年美國(guó)作家協(xié)會(huì)對(duì)OpenAI公司提起集體訴訟,指控OpenAI公司非法使用版權(quán)所有者的版權(quán)作品作為訓(xùn)練數(shù)據(jù)訓(xùn)練大型語(yǔ)言模型(LLMS);Concord音樂集團(tuán)起訴人工智能公司Anthropic,稱被告未經(jīng)許可復(fù)制和使用出版商的歌詞作為訓(xùn)練數(shù)據(jù),直接侵犯出版商作為版權(quán)所有者的專有權(quán)。實(shí)踐證明,生成式人工智能使用量級(jí)的高質(zhì)量訓(xùn)練數(shù)據(jù)進(jìn)行智能模型訓(xùn)練雖能夠有效地避免算法偏見和算法歧視,符合社會(huì)公共利益的要求,但面臨侵權(quán)風(fēng)險(xiǎn),有關(guān)主體亟須積極探索生成式人工智能訓(xùn)練數(shù)據(jù)的著作權(quán)侵權(quán)應(yīng)對(duì)策略。
一、生成式人工智能訓(xùn)練數(shù)據(jù)的著作權(quán)侵權(quán)風(fēng)險(xiǎn)
算法、算力和數(shù)據(jù)是生成式人工智能的三大核心要素。在前兩者無明顯差異的情況下,數(shù)據(jù)成為生成式人工智能迭代更新的關(guān)鍵所在,其中訓(xùn)練數(shù)據(jù)的數(shù)量及質(zhì)量決定了智能模型類人化水平的高低。換言之,生成式人工智能語(yǔ)料庫(kù)中的訓(xùn)練數(shù)據(jù)越多、質(zhì)量越高,經(jīng)過訓(xùn)練的智能模型就越接近人類語(yǔ)言表達(dá)。因此,OpenAI等人工智能公司在研發(fā)大語(yǔ)言模型(LLMs)的過程中會(huì)使用量級(jí)的訓(xùn)練數(shù)據(jù)進(jìn)行訓(xùn)練,這容易出現(xiàn)絕大多數(shù)被用于訓(xùn)練的數(shù)據(jù)內(nèi)容仍然在著作權(quán)保護(hù)期內(nèi),且并未提前獲得授權(quán)許可等問題。客觀來講,這些未經(jīng)許可使用大量作品作為訓(xùn)練數(shù)據(jù)進(jìn)行模型訓(xùn)練的行為已經(jīng)構(gòu)成侵權(quán)。基于生成式人工智能復(fù)雜的運(yùn)行過程,文章結(jié)合階段性技術(shù)特征討論其訓(xùn)練數(shù)據(jù)存在的著作權(quán)侵權(quán)風(fēng)險(xiǎn)。
(一)輸入和訓(xùn)練階段的著作權(quán)侵權(quán)風(fēng)險(xiǎn)
當(dāng)前,生成式人工智能已經(jīng)基本形成數(shù)據(jù)輸入、模型訓(xùn)練、模型調(diào)優(yōu)、內(nèi)容輸出等階段的固定模式[2]。為了避免數(shù)據(jù)偏差帶來的模型偏見,生成式人工智能亟須通過大量、全面且優(yōu)質(zhì)的數(shù)據(jù)來進(jìn)行訓(xùn)練,這就不可避免地導(dǎo)致其數(shù)據(jù)輸入和訓(xùn)練階段存在潛在的著作權(quán)侵權(quán)風(fēng)險(xiǎn)。
在輸入階段,生成式人工智能獲取訓(xùn)練數(shù)據(jù)主要通過兩種方式。一是將文本作品數(shù)字化,形成能被算法可讀的格式,如PDF、Word等。我國(guó)著作權(quán)法將“數(shù)字化”這一方式納入復(fù)制權(quán)的規(guī)制范疇,而這種將文本作品數(shù)字化的相關(guān)復(fù)制行為有可能構(gòu)成對(duì)復(fù)制權(quán)的侵權(quán)。二是通過爬蟲技術(shù)直接爬取網(wǎng)頁(yè)或者網(wǎng)絡(luò)社區(qū)的內(nèi)容作為訓(xùn)練數(shù)據(jù),構(gòu)建語(yǔ)料庫(kù)進(jìn)行模型訓(xùn)練。在數(shù)字時(shí)代,通過爬蟲技術(shù)獲取訓(xùn)練數(shù)據(jù)集能夠滿足生成式人工智能快捷、高效、低成本進(jìn)行數(shù)據(jù)訓(xùn)練的需求,亦符合人工智能產(chǎn)業(yè)快速更新迭代的趨勢(shì),這已成為主流路徑。然而,生成式人工智能利用爬蟲技術(shù)獲取訓(xùn)練數(shù)據(jù),也有可能侵害著作權(quán)人的復(fù)制權(quán),更有可能侵害數(shù)據(jù)庫(kù)權(quán)屬方的著作權(quán)[3]。
在訓(xùn)練階段,生成式人工智能的訓(xùn)練數(shù)據(jù)使用過程類似于大腦對(duì)知識(shí)的接收、理解和吸收過程,通過將語(yǔ)言token化,學(xué)習(xí)其中蘊(yùn)含的概率關(guān)聯(lián)等。以文本作品為例,生成式人工智能對(duì)語(yǔ)料庫(kù)中的訓(xùn)練數(shù)據(jù)進(jìn)行提取,然后通過人工神經(jīng)網(wǎng)絡(luò)對(duì)詞句搭配、語(yǔ)法結(jié)構(gòu)、表達(dá)風(fēng)格等組成要素進(jìn)行識(shí)別和分類,按照各表達(dá)要素之間搭配概率大小形成序列,并通過后續(xù)不斷地反饋進(jìn)行智能模型優(yōu)化,體現(xiàn)“機(jī)器學(xué)習(xí)”的過程。在這一階段,生成式人工智能在訓(xùn)練數(shù)據(jù)上有可能侵犯著作權(quán)人的復(fù)制權(quán)、改編權(quán)和匯編權(quán)[4]。值得注意的是,模型訓(xùn)練過程伴隨著臨時(shí)副本的生成,這屬于臨時(shí)復(fù)制范疇,我國(guó)著作權(quán)法并不承認(rèn)臨時(shí)復(fù)制是復(fù)制行為,即訓(xùn)練階段的臨時(shí)復(fù)制并不構(gòu)成復(fù)制權(quán)侵權(quán)[5]。根據(jù)“接觸 + 實(shí)質(zhì)相似”的著作權(quán)侵權(quán)判斷規(guī)則,有關(guān)主體對(duì)生成式人工智能在訓(xùn)練階段將文本作品作為訓(xùn)練數(shù)據(jù)使用是否侵犯著作權(quán)人的改編權(quán)和匯編權(quán),需要結(jié)合輸出階段的生成內(nèi)容進(jìn)行判斷。
(二)生成階段的著作權(quán)侵權(quán)風(fēng)險(xiǎn)
在輸入和訓(xùn)練階段后,生成式人工智能已經(jīng)構(gòu)建能夠完成不同目標(biāo)任務(wù)的算法模型。用戶只需要向生成式人工智能發(fā)送創(chuàng)作指令(prompt),其即可通過算法處理該指令,并根據(jù)所訓(xùn)練數(shù)據(jù)生成相應(yīng)的內(nèi)容[6]。生成式人工智能利用作品作為訓(xùn)練數(shù)據(jù)生成的內(nèi)容可分為兩種:一是與訓(xùn)練數(shù)據(jù)完全不同的全新內(nèi)容;二是與訓(xùn)練數(shù)據(jù)部分相似的內(nèi)容。其中:第一種情況不會(huì)侵犯著作權(quán),會(huì)因促進(jìn)文化創(chuàng)新和傳播而被納入著作權(quán)保護(hù)范疇;第二種情況生成的內(nèi)容與訓(xùn)練數(shù)據(jù)構(gòu)成的相似部分若屬于實(shí)質(zhì)性相似,即使用相關(guān)獨(dú)創(chuàng)性表達(dá),這一使用行為可能因符合改編權(quán)或匯編權(quán)的侵權(quán)要件而構(gòu)成侵權(quán),若相似部分僅構(gòu)成對(duì)相關(guān)內(nèi)容事實(shí)性要素的使用,則可能因不符合實(shí)質(zhì)性相似這一侵權(quán)要件而免于受到規(guī)制。
二、生成式人工智能訓(xùn)練數(shù)據(jù)的著作權(quán)規(guī)制困境
目前,我國(guó)著作權(quán)法及著作權(quán)法實(shí)施條例暫無明確規(guī)范生成式人工智能訓(xùn)練數(shù)據(jù)的具體條款,學(xué)界主流觀點(diǎn)傾向于通過合理使用或法定許可來豁免訓(xùn)練數(shù)據(jù)使用行為,以適應(yīng)國(guó)家對(duì)人工智能產(chǎn)業(yè)的戰(zhàn)略布局需要。目前,這一豁免路徑既符合技術(shù)創(chuàng)新,又能在一定程度上實(shí)現(xiàn)利益平衡。然而,現(xiàn)有制度或規(guī)則并未考慮到生成式人工智能使用訓(xùn)練數(shù)據(jù)這一新情形,導(dǎo)致生成式人工智能訓(xùn)練數(shù)據(jù)仍存在諸多規(guī)制困境。
(一)侵權(quán)豁免規(guī)則的適用困境
我國(guó)著作權(quán)法的侵權(quán)豁免規(guī)則包括合理使用與法定許可兩類:前者指在特定的條件下,法律允許他人自由使用享有著作權(quán)的作品而不必征得著作權(quán)人的同意,也不必向著作權(quán)人支付報(bào)酬的規(guī)則[7;后者指在特定的情形下,法律充許他人使用享有著作權(quán)的作品而無須征得著作權(quán)人的許可,但應(yīng)當(dāng)按照規(guī)定支付報(bào)酬的規(guī)則。目前,這兩類侵權(quán)豁免規(guī)則對(duì)生成式人工智能訓(xùn)練數(shù)據(jù)均存在各自的適用困境。
1.合理使用的適用場(chǎng)景困境
我國(guó)著作權(quán)法第二十四條第一款規(guī)定十三種合理使用情形,其中第一款“個(gè)人學(xué)習(xí)、研究或者欣賞”、第二款“適當(dāng)引用”及第六款“科學(xué)研究”最有可能成為生成式人工智能侵權(quán)阻卻的事由,然而仔細(xì)分析可發(fā)現(xiàn),生成式人工智能訓(xùn)練數(shù)據(jù)使用并不符合該三種情形的構(gòu)成要件。其一,生成式人工智能研發(fā)者一般為法人或組織,并非個(gè)人,這不符合第一款的主體要件,且個(gè)人研究語(yǔ)境中的復(fù)制內(nèi)容是少量的,而生成式人工智能訓(xùn)練數(shù)據(jù)必然伴隨大量的內(nèi)容復(fù)制[7]。其二,“適當(dāng)引用”情形適用的前提是“為介紹、評(píng)論某一作品或者說明某一問題”,由于生成式人工智能使用享有著作權(quán)的數(shù)據(jù)內(nèi)容進(jìn)行訓(xùn)練是為了在學(xué)習(xí)現(xiàn)有表達(dá)基礎(chǔ)上創(chuàng)作出新內(nèi)容,因此通常無法滿足這一適用前提。其三,生成式人工智能訓(xùn)練數(shù)據(jù)難以契合“科學(xué)研究”合理使用的主體要件,此項(xiàng)適用主體是經(jīng)由國(guó)家設(shè)立的代表公共利益的教育科研機(jī)構(gòu),如經(jīng)過相關(guān)主管部門批準(zhǔn)設(shè)立且由國(guó)家財(cái)政資助的院校、科研機(jī)構(gòu)等[8],且此種情形下的創(chuàng)作內(nèi)容只能供教學(xué)或科研人員使用,而目前生成式人工智能的服務(wù)對(duì)象是不特定的公眾,故而難以被科研目的的合理使用類型所涵蓋。
2.法定許可的適用現(xiàn)實(shí)局限
與合理使用規(guī)則不同,法定許可規(guī)則被分散在我國(guó)著作權(quán)法的不同條款中,分別是第二十五條第一款“編寫教科書”法定許可、第三十五條第二款“報(bào)刊轉(zhuǎn)載”法定許可、第四十二條第二款“制作錄音制品”法定許可及第四十六條“廣播電臺(tái)、電視臺(tái)播放作品”法定許可。生成式人工智能使用作品作為訓(xùn)練數(shù)據(jù)訓(xùn)練模型不僅難以滿足這四類法定許可的適用要件,而且法定許可規(guī)則要求向著作權(quán)人支付報(bào)酬,這意味著生成式人工智能研發(fā)者除了要努力去尋找每一位著作權(quán)人獲得使用內(nèi)容許可,還要向其支付報(bào)酬,而根據(jù)市場(chǎng)的逐利性,企業(yè)為實(shí)現(xiàn)利益最大化可能會(huì)利用各種技術(shù)手段實(shí)現(xiàn)“零成本”獲取享有著作權(quán)的作品,如此更不利于著作權(quán)的保護(hù)。因此,在法定許可規(guī)則下,生成式人工智能使用享有著作權(quán)的作品作為訓(xùn)練數(shù)據(jù)面臨交易成本畸高等問題,這使得此路徑不具有現(xiàn)實(shí)的可行性[9]。
(二)司法實(shí)踐判定標(biāo)準(zhǔn)的適用困境
我國(guó)著作權(quán)法合理使用規(guī)則在立法上借鑒大陸法作者權(quán)體系的例外與限制的規(guī)范模式,納入《保護(hù)文學(xué)和藝術(shù)作品伯爾尼公約》等國(guó)際條約所規(guī)定的“三步檢驗(yàn)標(biāo)準(zhǔn)”,并增加“法律、行政法規(guī)規(guī)定的其他情形”兜底條款,增強(qiáng)條款的開放性。然而,“三步檢驗(yàn)標(biāo)準(zhǔn)”的固有缺陷使得合理使用在司法認(rèn)定中標(biāo)準(zhǔn)不統(tǒng)一,甚至出現(xiàn)雜糅適用域外標(biāo)準(zhǔn)的情況。這具體表現(xiàn)為:法官或有時(shí)直接適用美國(guó)的合理使用“四要素標(biāo)準(zhǔn)”“轉(zhuǎn)換性使用”概念;或?qū)ⅰ叭綑z驗(yàn)標(biāo)準(zhǔn)”與“四要素標(biāo)準(zhǔn)”混合進(jìn)行解釋。例如,在上海美術(shù)電影制片廠訴浙江新影年代文化傳播有限公司案中,法院認(rèn)為應(yīng)當(dāng)綜合考慮引用作品的目的、被引用作品的性質(zhì)、被引用作品占整個(gè)作品的比例以及引用是否會(huì)對(duì)原作品的正常使用造成影響等因素來認(rèn)定是否構(gòu)成合理使用。這種司法實(shí)踐判定標(biāo)準(zhǔn)理由的“拿來主義”和“要件混搭”,給我國(guó)合理使用的司法適用造成困境[10],不利于穩(wěn)定著作權(quán)人的合理預(yù)期,使得合理使用規(guī)則存在適用問題。具體到生成式人工智能訓(xùn)練數(shù)據(jù),合理使用規(guī)則存在的司法實(shí)踐判定標(biāo)準(zhǔn)的適用困境阻礙有效規(guī)制相關(guān)著作權(quán)問題。為了更好地應(yīng)對(duì)將產(chǎn)生的大量生成式人工智能訓(xùn)練數(shù)據(jù)著作權(quán)侵權(quán)案件,有關(guān)主體應(yīng)探索有效適應(yīng)司法實(shí)踐的應(yīng)對(duì)路徑。
(三)傳統(tǒng)利益平衡格局備受沖擊
著作權(quán)法合理使用制度是著作權(quán)人和社會(huì)公眾利益的平衡器[11],其功能在于平衡著作權(quán)人專有權(quán)的邊界和公眾自由獲取作品的起點(diǎn)。然而,在人工智能時(shí)代,“專有權(quán)保護(hù)一權(quán)利限制(合理使用)”的平衡正在發(fā)生根本性變化。一方面,生成式人工智能的生成內(nèi)容使得“作者中心主義”的著作權(quán)傳統(tǒng)理論根基發(fā)生動(dòng)搖,“作品是作者人格權(quán)的延伸”不再完全符合現(xiàn)實(shí)情形,“作者權(quán)應(yīng)受到著作權(quán)法嚴(yán)格保護(hù)”的傳統(tǒng)主流觀點(diǎn)也顯得力不從心,而與此相對(duì)的是合理使用的輻射范圍應(yīng)當(dāng)在一定程度上進(jìn)行擴(kuò)張逐漸成為共識(shí)。另一方面,“機(jī)器閱讀”改變作品利用的方式,即生成式人工智能通過自動(dòng)化和批量化的“閱讀”作品來獲取知識(shí)和信息[7]并將其作為訓(xùn)練數(shù)據(jù)。這種信息獲取的自由化水平?jīng)Q定了公眾文化創(chuàng)新能力和水平的高低,而合理使用作為信息獲取的制度保障,在一定程度上無法有效應(yīng)對(duì)人工智能時(shí)代的挑戰(zhàn)。
三、生成式人工智能訓(xùn)練數(shù)據(jù)的著作權(quán)侵權(quán)應(yīng)對(duì)策略
2017年7月,國(guó)務(wù)院印發(fā)的《新一代人工智能發(fā)展規(guī)劃》明確指出,搶抓人工智能發(fā)展的重大戰(zhàn)略機(jī)遇,構(gòu)筑我國(guó)人工智能發(fā)展的先發(fā)優(yōu)勢(shì)。筆者認(rèn)為,有關(guān)主體既要保證生成式人工智能信息獲取自由化的政策補(bǔ)給,又不可過度壓縮著作權(quán)人的專有權(quán)空間,確保此類制度持續(xù)維持二者之間的平衡,并盡可能降低立法和司法成本。而縱觀著作權(quán)法相關(guān)制度,擴(kuò)張適用的合理使用制度或許是當(dāng)下的最優(yōu)解。
(一)設(shè)立訓(xùn)練數(shù)據(jù)專門例外及合理義務(wù)
當(dāng)前,世界各國(guó)積極探索應(yīng)對(duì)生成式人工智能訓(xùn)練數(shù)據(jù)著作權(quán)風(fēng)險(xiǎn)的合理有效路徑,這或許可以為我國(guó)提供一定的借鑒。例如:2019年歐盟發(fā)布的《數(shù)字化單一市場(chǎng)版權(quán)指令》規(guī)定了文本數(shù)據(jù)挖掘版權(quán)例外;2018年修訂的日本著作權(quán)法規(guī)定了十分寬泛的“計(jì)算機(jī)分析例外”;美國(guó)對(duì)此雖未做出明確規(guī)定,但司法實(shí)踐通過開放性的合理使用“四要素標(biāo)準(zhǔn)”及“轉(zhuǎn)換性使用”來對(duì)類似的作品數(shù)字化使用行為做出豁免。可見,有關(guān)主體為生成式人工智能訓(xùn)練數(shù)據(jù)設(shè)置合理使用的新情形,既是發(fā)展新質(zhì)生產(chǎn)力的應(yīng)有之義,更是應(yīng)對(duì)世界各國(guó)人工智能產(chǎn)業(yè)競(jìng)爭(zhēng)的必然選擇。在具體制度設(shè)計(jì)方面,有學(xué)者認(rèn)為,基于我國(guó)著作權(quán)法及著作權(quán)法實(shí)施條例修訂情況,適應(yīng)人工智能產(chǎn)業(yè)創(chuàng)新,有關(guān)主體應(yīng)當(dāng)以著作權(quán)法實(shí)施條例為接口,引入“數(shù)據(jù)挖掘”的專門例外[12],即為生成式人工智能使用享有著作權(quán)的作品增設(shè)合理使用的專門條款,并對(duì)生成式人工智能研發(fā)者和服務(wù)提供者設(shè)置適當(dāng)?shù)臉?biāo)注義務(wù)和限制規(guī)則,這是當(dāng)下的明智之舉。有關(guān)主體應(yīng)在我國(guó)著作權(quán)法實(shí)施條例中明確生成式人工智能研發(fā)者使用作品作為訓(xùn)練數(shù)據(jù)進(jìn)行人工智能創(chuàng)作應(yīng)當(dāng)履行的標(biāo)注義務(wù),以提高相應(yīng)內(nèi)容的透明度,使得生成式人工智能訓(xùn)練數(shù)據(jù)更符合合理使用的要求。目前,《暫行辦法》對(duì)生成式人工智能的標(biāo)注義務(wù)進(jìn)行明確規(guī)定,但著作權(quán)法領(lǐng)域尚未有進(jìn)展。此外,有關(guān)主體還應(yīng)借鑒互聯(lián)網(wǎng)治理的制度經(jīng)驗(yàn),通過確立人工智能領(lǐng)域的避風(fēng)港規(guī)則,為生成式人工智能訓(xùn)練數(shù)據(jù)設(shè)立一定程度的著作權(quán)保護(hù)注意義務(wù),防止“不得不合理地?fù)p害著作權(quán)人的合法權(quán)益”成為空談。
引發(fā)知識(shí)生產(chǎn)技術(shù)革命的同時(shí),打破傳統(tǒng)著作權(quán)利益平衡格局,引發(fā)相關(guān)著作權(quán)侵權(quán)糾紛。這本質(zhì)上是傳統(tǒng)著作權(quán)產(chǎn)業(yè)與新興人工智能產(chǎn)業(yè)之間的利益分配分歧[15]。有關(guān)主體應(yīng)始終堅(jiān)持利益平衡的理念,結(jié)合現(xiàn)有制度及司法實(shí)踐困境,彌補(bǔ)制度不足,為司法實(shí)踐提供適用性與可行性,從而激發(fā)數(shù)據(jù)要素活力,助力人工智能產(chǎn)業(yè)健康可持續(xù)發(fā)展,提升我國(guó)的創(chuàng)新國(guó)際競(jìng)爭(zhēng)力。
(二)規(guī)范司法實(shí)踐判定標(biāo)準(zhǔn)
基于生成式人工智能使用享有著作權(quán)的作品作為訓(xùn)練數(shù)據(jù)屬于新生事物,且從經(jīng)濟(jì)性角度來看,法律法規(guī)的立法成本較高,在生成式人工智能的技術(shù)尚不成熟、變量因素尚不可控的情況下,筆者認(rèn)為,規(guī)范生成式人工智能訓(xùn)練數(shù)據(jù)是否構(gòu)成合理使用的司法判定標(biāo)準(zhǔn),應(yīng)當(dāng)回歸到著作權(quán)法的核心一思想與表達(dá)二分法。無論是大陸法系的“三步檢驗(yàn)標(biāo)準(zhǔn)”還是美國(guó)的“四要素標(biāo)準(zhǔn)”,其核心均在于判斷使用者對(duì)作品的使用是否構(gòu)成內(nèi)容上的實(shí)質(zhì)性使用,即是否使用作品的獨(dú)創(chuàng)性表達(dá)。著作權(quán)法保護(hù)表達(dá)而不保護(hù)思想,換言之,著作權(quán)專有權(quán)并非旨在控制所有類型的作品使用,而僅規(guī)制以公開傳播作品的表達(dá)性內(nèi)容為目的的作品使用行為[13]。在具體判斷生成式人工智能使用享有著作權(quán)的作品作為訓(xùn)練數(shù)據(jù)屬于合理使用抑或侵權(quán)使用時(shí),有關(guān)主體或可參考商標(biāo)法領(lǐng)域的“商標(biāo)性使用”與“非商標(biāo)性使用”概念,在著作權(quán)領(lǐng)域區(qū)分“表達(dá)性使用”與“非表達(dá)性使用”。其中:前者構(gòu)成對(duì)作品的消費(fèi)性使用,即對(duì)作者表達(dá)性內(nèi)容的使用,此種情形構(gòu)成侵權(quán)無可厚非[14];后者是對(duì)作品的事實(shí)性內(nèi)容的使用,即對(duì)作品的事實(shí)要素或結(jié)構(gòu)內(nèi)容的使用,此種使用可構(gòu)成合理使用。然而,在具體實(shí)踐中,司法實(shí)踐直接判斷作品使用是否屬于表達(dá)性使用易存在諸多模糊不清、難以界定之處。為此,有關(guān)主體應(yīng)結(jié)合生成式人工智能生成的內(nèi)容反向論證其對(duì)享有著作權(quán)的作品作為訓(xùn)練數(shù)據(jù)使用屬于事實(shí)要素或信息的使用,這不會(huì)損害著作權(quán)人的合法權(quán)益并排除專有權(quán)的控制范圍。
四、結(jié)語(yǔ)
2021年9月,中共中央、國(guó)務(wù)院印發(fā)的《知識(shí)產(chǎn)權(quán)強(qiáng)國(guó)建設(shè)綱要(2021—2035年)》指出,實(shí)施知識(shí)產(chǎn)權(quán)強(qiáng)國(guó)戰(zhàn)略,回應(yīng)新技術(shù)、新經(jīng)濟(jì)、新形勢(shì)對(duì)知識(shí)產(chǎn)權(quán)制度變革提出的挑戰(zhàn)。
[參考文獻(xiàn)]
[1]李振華.人工智能大模型研發(fā)應(yīng)用所涉數(shù)據(jù)權(quán)益的三大法律問題[J].數(shù)字法治,2024(06):27-33.
[2]張平.生成式人工智能著作權(quán)問題的制度回應(yīng)[J].南方傳媒研究,2024(05):21-31.
[3]彭飛榮.論算法創(chuàng)作中涉數(shù)據(jù)的著作權(quán)侵權(quán)風(fēng)險(xiǎn)及其化解[J].法律適用,2023(04):46-55.
[4]高陽(yáng),胡丹陽(yáng).機(jī)器學(xué)習(xí)對(duì)著作權(quán)合理使用制度的挑戰(zhàn)與應(yīng)對(duì)[J].電子知識(shí)產(chǎn)權(quán),2020(10):13-25.
[5]劉友華,魏遠(yuǎn)山.機(jī)器學(xué)習(xí)的著作權(quán)侵權(quán)問題及其解決[J].華東政法大學(xué)學(xué)報(bào),2019(02):68-79.
[6]焦和平.人工智能創(chuàng)作中數(shù)據(jù)獲取與利用的著作權(quán)風(fēng)險(xiǎn)及化解路徑[J].當(dāng)代法學(xué),2022(04):128-140.
[7]吳漢東.著作權(quán)合理使用制度研究[M].4版.北京:中國(guó)人民大學(xué)出版社,2020.
[8]李明德,管育鷹,唐廣良.《著作權(quán)法》專家建議稿說明[M].北京:法律出版社,2012.
[9]林秀芹.人工智能時(shí)代著作權(quán)合理使用制度的重塑[J].法學(xué)研究,2021(06):170-185.
[10]熊琦.著作權(quán)轉(zhuǎn)換性使用的本土法釋義[J].法學(xué)家,2019(02):124-134.
[11]劉宇暉.論著作權(quán)合理使用擴(kuò)張適用的路徑選擇[J].知識(shí)產(chǎn)權(quán),2018(10):59-65.
[12]萬(wàn)勇.人工智能時(shí)代著作權(quán)法合理使用制度的困境與出路[J].社會(huì)科學(xué)輯刊,2021(05):93-102.
[13]李安.機(jī)器學(xué)習(xí)作品的著作權(quán)法分析:非作品性使用、合理使用與侵權(quán)使用[J].電子知識(shí)產(chǎn)權(quán),2020(06):60-70.
[14」魏遠(yuǎn)山.生成式人工智能訓(xùn)練數(shù)據(jù)的著作權(quán)法因應(yīng):確需設(shè)置合理使用規(guī)則嗎?[J].圖書情報(bào)知識(shí),2025(01):78-88.
[15]吳家煦,來小鵬.生成式人工智能機(jī)器學(xué)習(xí)的版權(quán)困境及其制度因應(yīng)[J].編輯之友,2024(11):96-104.