李雪偉 周令非
中國電影科學(xué)技術(shù)研究所(中央宣傳部電影技術(shù)質(zhì)量檢測所),北京 100086
隨著攝錄設(shè)備的多樣化和互聯(lián)網(wǎng)技術(shù)的迅猛發(fā)展,電影盜錄及傳播變得更加容易,這使得電影的版權(quán)保護(hù)面臨著巨大的挑戰(zhàn)。院線電影盜版溯源技術(shù),通過提取隱藏在影片載體中的水印標(biāo)記信息,追蹤定位盜版流出的播放服務(wù)器和發(fā)生盜版的影廳,為電影數(shù)字版權(quán)保護(hù)提供了有力技術(shù)支撐。
為落實(shí)國家電影局《“十四五”中國電影發(fā)展規(guī)劃》中關(guān)于 “嚴(yán)厲打擊盜錄盜播等違法違規(guī)行為”和國家版權(quán)局 《版權(quán)工作 “十四五”規(guī)劃》中關(guān)于“加強(qiáng)對版權(quán)治理熱點(diǎn)難點(diǎn)問題的研究與監(jiān)管,完善打擊網(wǎng)絡(luò)侵權(quán)盜版的快速反應(yīng)機(jī)制”的相關(guān)工作要求,規(guī)范電影市場秩序、保護(hù)電影作品知識產(chǎn)權(quán),本文提出的院線電影盜版溯源技術(shù)全流程,在進(jìn)一步提高院線電影盜版溯源技術(shù)的效率和準(zhǔn)確率方面進(jìn)行了有益的探索和分享,旨在推動以數(shù)字水印為代表的電影版權(quán)保護(hù)核心技術(shù)的普及和應(yīng)用。
近年來,互聯(lián)網(wǎng)技術(shù)和流媒體技術(shù)的快速發(fā)展,為院線電影盜版溯源帶來了盜版樣本獲取難、盜版樣本質(zhì)量不穩(wěn)定等新的挑戰(zhàn),具體如下。
盜版樣本傳播隱蔽。在國家 “劍網(wǎng)行動”的打擊下,一些大型平臺的版權(quán)自律情況得到根本改善。然而,一些中小型網(wǎng)站和個(gè)人,以云盤、種子文件、個(gè)人站點(diǎn)、在線播放器等形式,對影視作品仍在進(jìn)行長期的、大量的侵權(quán)。
盜版網(wǎng)站反偵查意識增強(qiáng)。隨著對盜版影視網(wǎng)站打擊力度的不斷增大,文件分享類盜版逐漸減少,在線播放類影視盜版網(wǎng)站成為主流,且這類盜版網(wǎng)站為了防止盜鏈、提高競爭力,現(xiàn)多采用加密或加入偽視頻數(shù)據(jù)等手段防止被現(xiàn)有的視頻流下載工具獲取,即使被下載下來,得到的也只是無意義的假視頻數(shù)據(jù),使得盜版樣本的采樣和執(zhí)法機(jī)關(guān)的取證存證困難重重。
畫面質(zhì)量差。隨著智能手機(jī)攝像能力的不斷提高,現(xiàn)在院線影片盜版者多使用智能手機(jī)全程手持盜錄影片,很少再鋌而走險(xiǎn)使用體積相對較大的專業(yè)錄像設(shè)備。這種手持非專業(yè)設(shè)備拍攝的盜版影片畫面曝光極不穩(wěn)定、忽明忽暗,且全程晃動,影片畫面位置也隨之不停變化。
編碼不規(guī)范。由于盜版影視作品會被數(shù)次加入廣告、重新壓縮編碼和切片處理,其視音頻編碼文件會隨之變得不規(guī)范、甚至有錯(cuò)誤產(chǎn)生,導(dǎo)致水印提取工具無法正常工作。盜版影視網(wǎng)站為了節(jié)省流量和網(wǎng)絡(luò)帶寬,通常只使用1Mbps/s左右的低碼率提供在線播放,對數(shù)字水印的準(zhǔn)確提取提出了新挑戰(zhàn)。
針對以上現(xiàn)狀,本文提出了院線電影盜版溯源全流程方法,從發(fā)現(xiàn)盜版源入手,通過在內(nèi)部網(wǎng)站搭建盜版影視網(wǎng)站偽裝平臺,自動從多個(gè)盜版電影資源發(fā)布網(wǎng)站采集盜版影片相關(guān)信息,變被動等待盜版樣本送樣到主動監(jiān)測并獲取盜版樣本;然后對盜版樣本進(jìn)行篩選獲取,并對獲取的樣本從格式和畫面兩方面進(jìn)行復(fù)原增強(qiáng),以提高盜版溯源的檢出率;最后利用數(shù)字水印提取系統(tǒng)對上述樣本進(jìn)行數(shù)字水印信息提取,并將其與放映數(shù)據(jù)等相結(jié)合,進(jìn)而定位相關(guān)影院、影廳和確定盜錄時(shí)間,以確保溯源結(jié)果的準(zhǔn)確性。具體如圖1所示。該方法實(shí)現(xiàn)所需的相關(guān)組件構(gòu)成如圖2所示。下面對該方法中的每一部分進(jìn)行詳細(xì)介紹。
圖1 院線電影盜版溯源全流程圖
圖2 院線電影盜版溯源全流程組件構(gòu)成
本文采用多種途徑發(fā)現(xiàn)盜版資源,包括接收存儲介質(zhì)送樣、接收互聯(lián)網(wǎng)送樣、盜版影片自動監(jiān)測系統(tǒng)、網(wǎng)絡(luò)巡查、微信群監(jiān)聽、telegram 群監(jiān)聽等,其中網(wǎng)絡(luò)巡查、微信群監(jiān)聽、telegram 群監(jiān)聽等屬于手動監(jiān)測,需要大量人力和時(shí)間的投入,目前作為盜版影片自動監(jiān)測系統(tǒng)的有益補(bǔ)充。
針對盜版樣本傳播隱蔽的問題,本文提出了盜版樣本自動監(jiān)測系統(tǒng),通過研究互聯(lián)網(wǎng)上傳播盜版最多的大量無備案信息的非法電影網(wǎng)站的特點(diǎn)及更新機(jī)制,利用上線盜版影視資源網(wǎng)站向加盟盜版影視網(wǎng)站自動推送盜版影片的特點(diǎn),本文在內(nèi)部網(wǎng)絡(luò)搭建了一套盜版影視網(wǎng)站偽裝平臺,可自動從多個(gè)盜版電影“資源”網(wǎng)站采集盜版影片相關(guān)信息。該平臺與真正的盜版影視網(wǎng)站不同,其不面向互聯(lián)網(wǎng)發(fā)布盜版影片,僅進(jìn)行盜版影片信息的分析和采集。
為了加快網(wǎng)站開發(fā)速度,本文盜版影視網(wǎng)站偽裝平臺,基于CMS內(nèi)容管理系統(tǒng)搭建,CMS用于管理網(wǎng)站后臺及編輯網(wǎng)站前臺,具有可視化的網(wǎng)站編輯器,采用模塊化的設(shè)計(jì),可以減少開發(fā)成本。
本文基于CMS 的盜版影視網(wǎng)站偽裝平臺,主要包括采集對象層、采集API接口層、數(shù)據(jù)清洗層、影片采集層、數(shù)據(jù)基礎(chǔ)層、管理和安全模塊等。具體軟件架構(gòu)圖如圖3所示。該平臺首先從不同的盜版資源網(wǎng)站采集盜版資源數(shù)據(jù),然后將采集到的非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)化為易處理的結(jié)構(gòu)化數(shù)據(jù),之后對得到的結(jié)構(gòu)化數(shù)據(jù)進(jìn)行電影類篩選、去重復(fù)等數(shù)據(jù)清洗操作,最后將得到的盜版電影資源進(jìn)行展示和播放,以便工作人員快速發(fā)現(xiàn)新的院線盜版,大大節(jié)省了工作人員找院線盜版資源的時(shí)間,進(jìn)一步提高了工作效率。
圖3 盜版影視網(wǎng)站偽裝平臺軟件架構(gòu)
基于CMS的盜版影視網(wǎng)站偽裝平臺,將以往的被動委托檢測轉(zhuǎn)變?yōu)闀r(shí)效更高、覆蓋更廣的主動檢測,使得工作人員可以第一時(shí)間發(fā)現(xiàn)院線影片盜版樣本,其效率遠(yuǎn)高于人工搜索盜版影片樣本,大大提高了盜版影片的發(fā)現(xiàn)和處置速度。
發(fā)現(xiàn)盜版資源后,需要對盜版資源進(jìn)行篩選,獲取篩選后的盜版資源,并將其納入樣本庫。本文主要從盜錄源頭是否相同、盜版是否為院線盜錄和是否盜錄自國內(nèi)影院這3個(gè)維度對盜版樣本進(jìn)行篩選,并對其中的國內(nèi)院線盜錄版本進(jìn)行溯源檢測。
圖4 盜版樣本篩選方法
3.2.1 相同來源篩選
由于不同版本的盜版樣本可能是對同一個(gè)來源的盜版樣本進(jìn)行裁切、剪輯、壓縮、旋轉(zhuǎn)等處理后,以不同版本進(jìn)行發(fā)布,對這些相同來源的盜版進(jìn)行溯源會浪費(fèi)技術(shù)資源,所以本文需對相同來源的盜版樣本進(jìn)行篩選,可結(jié)合司法部 《音像制品同源性鑒定技術(shù)規(guī)范——SF/Z JD0300002-2015》進(jìn)行判斷,本文采取的具體方法如下:
盜版樣本畫面特征篩選包括:相同的畫面四角亮度衰減;相同的影廳裝置、座椅相對位置;相同特征的觀眾遮擋畫面;畫面取景的相同抖動;暗場景中相同的攝錄設(shè)備傳感器高感光度噪點(diǎn);相同的自動曝光畫面失真;相同的過曝光、欠曝失真等。
盜版樣本音頻特征篩選包括:相同的廳堂混響;相同的壓縮音頻失真;特定影片內(nèi)容節(jié)點(diǎn)時(shí)相同的觀眾聲音等。
3.2.2 院線盜錄篩選
因本文只能對院線盜錄電影進(jìn)行準(zhǔn)確溯源,對其他渠道發(fā)行的影片無法溯源,因此需要進(jìn)行院線盜錄樣本的篩選。本文主要從院線盜版電影的聲畫特征和影片發(fā)行上映信息兩方面進(jìn)行篩選。
畫面聲音特征篩選,由于院線盜錄影片只能通過使用攝錄設(shè)備拍攝屏幕的手段獲取,因此畫面必然存在攝錄設(shè)備光學(xué)鏡頭的畸變等特征,聲音必然存在影廳造成的廳堂混響??赏ㄟ^以下方法篩選是否院線盜錄影片。畫面:存在明顯的亮度邊緣衰減;畫面內(nèi)存在影廳的安全出口、座椅;畫面內(nèi)有觀眾遮擋;畫面取景存在抖動;畫面存在攝錄設(shè)備傳感器的成像噪聲;畫面存在攝錄設(shè)備自動曝光引起的忽明忽暗;畫面亮部存在因攝錄設(shè)備動態(tài)范圍不足引起的過曝或暗部細(xì)節(jié)失真等。聲音:音頻中存在明顯的廳堂混響;音頻中存在觀眾的聲音等。
影片發(fā)行上映信息篩選:查詢中國電影發(fā)行放映協(xié)會網(wǎng)站的影片上映信息,確定盜版樣本是否為院線發(fā)行;與版權(quán)方確認(rèn)影片在上映日期之前是否進(jìn)行過短期或長期的公開點(diǎn)映或試映,確定影片是否在上映前泄露。流媒體或其他高清版本篩選:因部分影片的上映檔期很短暫,院線上映與網(wǎng)絡(luò)流媒體版上映周期存在重合,故需對流媒體或其他高清版本進(jìn)行篩除:查詢各大視頻網(wǎng)站,確認(rèn)當(dāng)前流媒體版本的上線時(shí)間;咨詢國內(nèi)頭部流媒體版權(quán)商,獲知流媒體版本的上線時(shí)間。
3.2.3 影片發(fā)行區(qū)域篩選
由于我們無法對中國大陸之外的放映服務(wù)器進(jìn)行溯源,因此需對盜版樣本進(jìn)行發(fā)行區(qū)域篩選。具體方法如下:盜版樣本如果為海外發(fā)行或進(jìn)口影片,需向互聯(lián)網(wǎng)電影數(shù)據(jù)庫 (Internet Movie Database,IMDb)或電影官網(wǎng)確認(rèn)該影片的全球發(fā)行時(shí)間;判斷盜版影片的中文字幕是否為國內(nèi)放映的字幕類型(簡體楷體斜體);從字幕的幾何畸變、是否與畫面同步移動以及字幕被攝錄的損傷程度,判斷字幕是后期添加,還是影片原生;觀察畫面內(nèi)出現(xiàn)的觀眾的人種特征(高鼻梁等);監(jiān)聽音頻中觀眾聲音的語種;觀察樣本開頭是否包含國內(nèi)發(fā)行放映許可證等。
針對盜版網(wǎng)站反偵查意識增強(qiáng)的特點(diǎn),以及流媒體播放技術(shù)的快速發(fā)展,從這些非法網(wǎng)站進(jìn)行盜版樣本的無損采樣變得愈發(fā)困難。本文利用抓包工具進(jìn)行抓包發(fā)現(xiàn),這些盜版網(wǎng)站經(jīng)過技術(shù)升級,大量采用AES 加密技術(shù),更有甚者通過技術(shù)手段將標(biāo)準(zhǔn)TS切片媒體流偽裝成PNG 圖片等格式進(jìn)行傳輸,并使用私有協(xié)議解包。這使得常用下載工具無法識別、無法下載也無法合并切片的在線播放媒體流。
基于以上盜版影視網(wǎng)站的特點(diǎn),本文通過多種獲取方法相結(jié)合的方式對盜版樣本進(jìn)行獲取,具體如下:
(1) 對于常用下載工具可以下載的,使用常用下載工具進(jìn)行下載;
(2) 使用M3U8下載工具下載;
(3) 常用下載工具無法下載的情況下,使用FFmpeg與抓包工具相結(jié)合,獲取真實(shí)的在線播放列表進(jìn)行截流下載;
(4) 若以上方式均不可行,本文采用錄屏的方式對盜版樣本進(jìn)行獲取。
針對盜版樣本質(zhì)量不穩(wěn)定的問題,本文提出了盜版樣本增強(qiáng)方案,分別從樣本格式修復(fù)和樣本圖像增強(qiáng)兩方面提高盜版樣本質(zhì)量,以提高水印檢出率。
根據(jù)樣本格式或編碼的不合規(guī)程度,對樣本格式進(jìn)行多段樣本合并、編碼轉(zhuǎn)換、幀速率復(fù)原等處理;根據(jù)樣本的內(nèi)容受損程度,使用不同的影視制作工具對樣本內(nèi)容進(jìn)行重新構(gòu)圖、白平衡修復(fù)、去擠壓恢復(fù)畫幅比、跟蹤去抖動、去閃爍、對比度調(diào)整、亮度色度調(diào)整、手動關(guān)鍵幀去抖動等圖像增強(qiáng)處理。下面對復(fù)原增強(qiáng)過程中常用的方法進(jìn)行介紹。
多段樣本合并:對單一影片的多段樣本采用二進(jìn)制直接進(jìn)行合并;
編碼轉(zhuǎn)換:對水印提取軟件不兼容的編碼格式使用FFmpeg等編解碼工具進(jìn)行二次編碼或封裝;
幀速率復(fù)原:對水印提取軟件不兼容的幀速率格式使用FFmpeg等編解碼工具進(jìn)行合規(guī)的幀速率轉(zhuǎn)換;
重新構(gòu)圖:對盜版樣本中影廳、座椅等無關(guān)畫面內(nèi)容進(jìn)行裁切等處理,對盜版樣本進(jìn)行重新構(gòu)圖;
畫面跟蹤去抖動:對因手持盜錄導(dǎo)致畫面晃動嚴(yán)重的盜版樣本,使用影視后期制作軟件的畫面跟蹤穩(wěn)定功能結(jié)合手動關(guān)鍵幀實(shí)現(xiàn)樣本畫面的去抖動;
亮度色度調(diào)整:對盜版樣本中亮度、色度過低或過高等失真,使用影視后期制作軟件進(jìn)行增強(qiáng),向正常曝光的范圍進(jìn)行還原。
以上樣本增強(qiáng)方案均為手動實(shí)現(xiàn),未來將進(jìn)一步探索利用人工智能、機(jī)器學(xué)習(xí)等方法,優(yōu)化樣本增強(qiáng)方案,提高樣本質(zhì)量。
數(shù)字電影在發(fā)展之初就考慮了影片數(shù)字版權(quán)保護(hù)的策略和措施,數(shù)字電影倡導(dǎo)組織 (DCI)的《數(shù)字電影系統(tǒng)規(guī)范》[1]規(guī)定,用于放映2K/4K 數(shù)字電影的播放服務(wù)器均需具備放映時(shí)添加水印信息的功能并須通過認(rèn)證,該水印信息標(biāo)記了播放服務(wù)器品牌、設(shè)備序號、影片放映時(shí)間等信息,且必須可靠地、不可察覺地嵌入到影片放映畫面和聲音中[2]。
目前國內(nèi)影院使用的放映服務(wù)器使用的電影數(shù)字水印,均來自于兩家國外廠家。為保證溯源準(zhǔn)確無遺漏,本項(xiàng)目采用雙軌并行的工作模式,分別使用這兩種電影水印檢測工具對盜版影片樣本中的數(shù)字水印信息進(jìn)行提取,以獲取院線盜版影片內(nèi)容中綁定的水印信息,已覆蓋國內(nèi)所有影院的放映設(shè)備。
盜版樣本中的水印信息包括水印ID、服務(wù)器廠家信息和時(shí)間戳信息,本文使用水印ID 和服務(wù)器廠家信息向相應(yīng)的放映服務(wù)器廠商查證并確認(rèn)與其對應(yīng)且唯一的服務(wù)器序號,然后使用該服務(wù)器序號向放映服務(wù)器備案機(jī)構(gòu)查證該服務(wù)器的備案院線、影院、影廳和地址信息,最后結(jié)合時(shí)間戳信息確定發(fā)生院線影片盜版的放映場次,為相關(guān)執(zhí)法部門提供可信的技術(shù)依據(jù)和證據(jù)線索。具體如圖5所示。
圖5 通過水印信息溯源的流程
在現(xiàn)場放映服務(wù)器信息核驗(yàn)中,由于放映服務(wù)器違規(guī)變更放映場所和存在極少數(shù)克隆了數(shù)字水印信息的放映服務(wù)器,為確定溯源結(jié)果準(zhǔn)確無誤,本文還會對放映日志和售票記錄協(xié)查結(jié)果進(jìn)行核驗(yàn),以進(jìn)一步核驗(yàn)發(fā)生盜錄的放映場次。
本文采用以上數(shù)字水印信息建立了院線盜版溯源數(shù)據(jù)庫,該數(shù)據(jù)庫主要記錄了每次溯源的檢測記錄,包括影片名、上映時(shí)間、影片來源、畫質(zhì)特點(diǎn)、音頻特點(diǎn)、檢測結(jié)果 (水印ID、服務(wù)器廠商、服務(wù)器序號、所屬影院、所屬影廳、所屬院線)等,通過對影片盜版發(fā)生地、畫質(zhì)音頻特點(diǎn)、盜拍手法的比對,本文發(fā)現(xiàn)了幾個(gè)主要盜拍團(tuán)伙的作案特點(diǎn)及活動區(qū)域,完成了對盜錄嫌疑人的 “畫像”。同時(shí),本文還將院線盜版溯源數(shù)據(jù)庫與票務(wù)、放映機(jī)構(gòu)的放映數(shù)據(jù)、排片數(shù)據(jù)、售票數(shù)據(jù)相結(jié)合,引入觀影人數(shù)與排片場次數(shù)據(jù),通過數(shù)據(jù)篩選和比對,讓一些本不起眼的線索逐漸浮出水面,發(fā)現(xiàn)了很多票房瞞報(bào)的“幽靈場次”、不知去向的 “幽靈放映服務(wù)器”,甚至根本不存在的 “幽靈影院”,為相關(guān)部門排查與定位侵權(quán)盜錄嫌疑人提供了有力的技術(shù)支撐。
通過對盜版溯源數(shù)據(jù)的多維度分析,篩查多次發(fā)生盜錄的影院,對院線電影版權(quán)方和發(fā)行方形成預(yù)警,在超前點(diǎn)映等被盜錄風(fēng)險(xiǎn)大的情景中盡量選擇安全的影院,防患于未然,讓不法分子無機(jī)可乘。
為評估本文提出方法的有效性,體現(xiàn)保障電影版權(quán)安全對整體票房的促進(jìn)作用,本文提出了PPB院線電影盜版指數(shù):每10 億元票房的盜版源數(shù)量(Piracies per Billion Box office,PPB),見式(1)。
根據(jù)式 (1),得到2016 年到2022 年的PPB,并計(jì)算出同期的溯源成功率,具體如表1所示。
表1 2016-2022年每10億元票房盜版源數(shù)量PPB及盜版溯源成功率
將表1表示為曲線圖,如圖6、圖7所示。
從圖6可以看出,2016 年到2022 年,隨著本文盜版溯源全流程方法的不斷完善和應(yīng)用,本文負(fù)責(zé)的國內(nèi)盜版溯源成功率穩(wěn)步上升,從2016 年的72%穩(wěn)步提升至2021年、2022年的100%。
圖6 2016-2022年溯源成功率曲線圖
從圖7可以看出,從2016年到2022年,隨著盜版溯源全流程方法的逐步應(yīng)用和盜版溯源成功率的提升,全國每10億元票房的盜版源數(shù)量整體呈減少趨勢,從2017年的3.47下降到2022年的1.32。盜版溯源全流程方法對電影市場版權(quán)治理的效果明顯。
圖7 2016-2022年每10億元票房的盜版源數(shù)量 (PPB)曲線圖
本文聚焦院線電影盜版溯源問題,依托CMS內(nèi)容管理系統(tǒng)、視頻處理、水印提取、數(shù)據(jù)分析等技術(shù),構(gòu)建了“樣本自動發(fā)現(xiàn)-樣本獲取-樣本增強(qiáng)-水印提取-溯源查證-數(shù)據(jù)畫像分析”的院線電影盜版溯源全流程。從發(fā)現(xiàn)盜版樣本入手,變被動等待盜版樣本送樣到主動監(jiān)測并獲取盜版樣本,設(shè)計(jì)研發(fā)了盜版樣本自動監(jiān)測系統(tǒng),可在開放資源網(wǎng)站自動、快捷發(fā)現(xiàn)采集盜版影片相關(guān)信息,解決了院線電影盜版樣本獲取難、溯源效率低、周期長的問題;同時(shí)本文提出了盜版樣本增強(qiáng)技術(shù)措施,分別從樣本格式和樣本內(nèi)容兩個(gè)維度對樣本進(jìn)行復(fù)原增強(qiáng),解決了因盜版樣本畫面抖動、亮度不均勻等因素導(dǎo)致的數(shù)字水印檢出率低的問題;為保證溯源準(zhǔn)確無遺漏,本文采用雙軌并行的工作模式,使用兩種水印提取工具對增強(qiáng)后的盜版樣本進(jìn)行數(shù)字水印信息提取,得到相關(guān)數(shù)字水印信息;最后利用數(shù)字水印信息定位相關(guān)影院、影廳和盜錄時(shí)間。
本文提出的院線電影盜版溯源全流程,為相關(guān)管理部門和相關(guān)運(yùn)營管理機(jī)構(gòu)提供可信的技術(shù)依據(jù)和證據(jù)線索,為電影數(shù)字版權(quán)保護(hù)和電影產(chǎn)業(yè)持續(xù)健康發(fā)展提供有力技術(shù)支撐,具有顯著社會效益。
未來我們將繼續(xù)探索人工智能和機(jī)器學(xué)習(xí)等技術(shù)在該領(lǐng)域的應(yīng)用方法,繼續(xù)完善盜版溯源數(shù)據(jù)庫,進(jìn)一步優(yōu)化和改進(jìn)院線電影盜版溯源全流程方法。