王婷婷 王開西
摘要:為了充分利用短視頻資源,提出了基于短視頻分類和時長的無載體信息隱藏方法。該方法對短視頻內容進行分類,設置特定類別作為取位標志;對短視頻時長劃分區(qū)間,分別用來映射秘密消息、代表傳輸開始和結束標志、代表用戶的正常生活。分析結果表明,該方法具有5 bits/視頻的高隱寫容量、較高的隱蔽性和魯棒性。
關鍵詞:短視頻;信息隱藏;無載體;隱蔽性
中圖分類號:TP309.7
文獻標志碼:A
收稿日期:2020-10-09
基金項目:
國家自然科學基金(批準號:U1536113)資助。
通信作者:
王開西,男,博士,副教授,主要研究方向為信息隱藏等。E-mail: kxwang@qdu.edu.cn
信息隱藏是用來保護敏感信息的技術之一[1]。秘密消息可以隱藏在不同的載體中,如圖像[2]、視頻[3]、音頻[4]和文本[5]等?;谏鲜鲚d體的信息隱藏方法大多需要對載體進行修改[6],從而破壞了載體本身,而且由于存在修改的痕跡給攻擊者提供了突破口。近年來,很多學者做了大量的無載體隱寫方法的研究[7-8]。無載體隱寫方法不對載體進行修改[9],從而提高了信息隱藏的安全性。因此,無載體隱寫方法越來越受到重視。隨著互聯(lián)網的迅速發(fā)展,無載體隱寫的應用場景也變得越來越廣泛。在互聯(lián)網環(huán)境下,許多學者利用賽博空間[10]來完成信息隱藏,主要體現(xiàn)在游戲軟件和即時通信軟件中?;谟螒蜍浖姆椒ㄖ饕谢诘谝蝗朔Q射擊游戲的方法[11]和基于《魔獸世界》的方法[12];基于即時通信軟件的方法主要有基于微信朋友圈點贊行為的方法[13]和基于Twitter轉發(fā)推文的方法[14]。但是,互聯(lián)網帶來的海量網絡流量和數據資源卻沒有被研究者充分利用[15],尤其是短視頻資源沒有被充分利用。隨著互聯(lián)網時代的到來,人們的網絡生活越來越豐富,互聯(lián)網的廣泛應用在給人們帶來高度便利的同時也產生了海量的信息[16]。其中短視頻自媒體成為信息交流的重要載體。短視頻自媒體是以網絡視頻社交平臺為載體,個人或組織發(fā)布時長20分鐘以內的辨別度顯著的短視頻內容[17]。短視頻自媒體與各個行業(yè)不斷深入融合,應用場景不斷廣泛擴展。作為互聯(lián)網時代的主流信息傳播方式,短視頻逐漸成為各種網絡應用的基礎,主要體現(xiàn)在網民娛樂的新方式、新聞報道的新載體、網絡電商的新平臺、文化旅游的新市場等方面?!兜?6次中國互聯(lián)網絡發(fā)展狀況統(tǒng)計報告》顯示,截至2020年6月,中國短視頻用戶規(guī)模為8.18億,使用率高達87.0%[18]。短視頻用戶量之大、使用率之高都為信息嵌入提供了良好的應用環(huán)境。本文提出了高隱蔽性的無載體信息隱藏方法,其利用短視頻分類和時長區(qū)間,設置特定類別作為取位標志,將時長分區(qū)間作為秘密消息映射區(qū)間、傳輸開始和結束標志區(qū)間、用戶的正常生活區(qū)間。
1 方法介紹
對短視頻內容分類時,以現(xiàn)有的短視頻網站Bilibili的分類標準為例。在基于短視頻分類和時長的信息隱藏方法中,短視頻內容的類別用來做取位標志,短視頻時長用來映射秘密消息、代表傳輸開始與結束標志、代表用戶正常生活。取位標志是指需要設置幾個特定類別,確定這些類別代表取位的方式和位數。取位方式和位數用于收發(fā)雙方確定秘密消息的嵌入和提取方式。預處理短視頻時長:首先,確定可發(fā)布的短視頻最長時長,以確定一個短視頻可以代表多少位的秘密消息;然后,對短視頻的時長分區(qū)間,不同的時長區(qū)間可以用來代表秘密消息、傳輸開始和結束標志、用戶的正常生活。
1.1 短視頻分類
目前主流的短視頻平臺主要有:Bilibili、抖音、快手、火山小視頻、最右、西瓜視頻等。很多短視頻平臺都根據視頻內容的不同對用戶發(fā)布的視頻進行了分類[19],以Bilibili為例對短視頻內容分類進行說明。Bilibili內的視頻分類有以下22個類別:動漫、游戲、電競、鬼畜、時尚、音樂、科技、數碼、知識、動物圈、美食、虛擬UP主、明星、舞蹈、生活、綜藝、電影、電視劇、相聲、特攝、體育和星?!,F(xiàn)有的短視頻平臺內容分類基本相同,Bilibili的分類標準同樣適用于其他短視頻平臺。
1.2 短視頻時長
現(xiàn)有的短視頻平臺都有各自的視頻上傳時長限制。每個視頻可以隱藏的二進制秘密消息長度上限LMmax=log2時長上限。以抖音為例,普通用戶可以拍攝的時長上限為60 s。那么,普通用戶的一個短視頻可代表秘密消息的長度上限為5位。對短視頻時長分區(qū)間,分別用來代表秘密消息、傳輸開始和結束標志、用戶的正常生活。將用戶最頻繁的發(fā)布時長區(qū)間作為秘密消息映射區(qū)間,這里取時長10~41 s為秘密消息映射區(qū)間,以此代表十進制數[0,31]。將用戶最不頻繁的兩個發(fā)布時長區(qū)間作為傳輸開始和結束標志區(qū)間、用戶的正常生活區(qū)間。這里取時長1~9 s為秘密消息傳輸開始和結束標志區(qū)間,當第一次發(fā)布此時長區(qū)間內的視頻時,代表秘密消息傳輸開始,當第二次發(fā)布此時長區(qū)間內的視頻時,代表秘密消息傳輸結束;取時長42~60 s為用戶正常生活區(qū)間,當發(fā)布此區(qū)間時長的視頻時僅代表用戶的正常生活,不代表秘密消息。
2 嵌入與提取過程
在秘密消息傳輸前,收發(fā)雙方已經達成了可以保證秘密消息正常傳輸以及正確解碼的共識。在基于短視頻分類和時長的信息隱藏方法中,收發(fā)雙方需要達成的共識包括:短視頻內容的分類方式、設置類別所代表的取位方式和位數、短視頻時長區(qū)間分類的方式及其代表的內容。嵌入過程和提取過程如圖1所示。
2.1 嵌入過程
預處理:將秘密消息轉化為ASCII碼值;設置特定短視頻類別集合C={C1,C2,C3,…,Cj,…,Cm},其中j和m均為整數,均代表多種短視頻類別中的一個,如果當前視頻類別屬于C,依據雙方共識確定當前視頻代表取位方式及取幾位;確定短視頻可發(fā)布視頻最長時長并根據C的取位數對其分區(qū)間,確定秘密消息映射區(qū)間、秘密消息傳輸開始與結束標志區(qū)間、用戶正常生活區(qū)間。
Step 1 取秘密消息的ASCII碼值,得到秘密消息的二進制字符串M,長度為 LM;
Step 2 確定當前隱寫過程中會使用到的特定短視頻類別C;
Step 3 對秘密消息進行分段,每段的長度由短視頻平臺可發(fā)布時長和C決定,段數n=LM/LCj確定的取位數。分段得到M分段={m1,m2,m3,…,mi,…,mn},其中mi為分段后的秘密消息片段,1≤i≤n且i為正整數,n為正整數;
Step 4 將分段后的秘密消息二進制字符串依次轉為十進制序列M′={m′1,m′2,m′3,…,m′i,…,m′n},m′i為秘密消息片段mi的十進制序列,1≤i≤n且i為正整數,n為正整數。將m′i分別加上秘密消息映射區(qū)間的左端點數值,以確定發(fā)布視頻的時長,得到秘密消息發(fā)布視頻時長序列,M′,={m″1,m″2,m″3,…,m″i,…,m″n},其中M″為秘密消息片段映射后的視頻發(fā)布時長集合,m″i為秘密消息片段mi在秘密消息映射區(qū)間相對應的發(fā)布視頻時長,1≤i≤n且i為正整數,n為正整數;
Step 5 從秘密消息傳輸開始與結束標志區(qū)間選擇一個或兩個時長的視頻作為秘密消息傳輸開始與結束的標志,并發(fā)布此時長視頻以告知接收方傳輸開始;
Step 6 依據C和秘密消息映射區(qū)間的視頻時長序列M″依次發(fā)布視頻;
Step 7 秘密消息傳輸完畢后,發(fā)送方發(fā)布代表傳輸結束的視頻以告知接收方傳輸結束。
2.2 提取過程
特定短視頻類別集合C、映射區(qū)間、傳輸開始與結束標志為雙方共享。
Step 1 接收方實時監(jiān)測發(fā)送方的視頻發(fā)布情況,當監(jiān)測到傳輸開始標志時,按照時間發(fā)布順序依次記錄發(fā)送方發(fā)布的視頻時長和視頻內容類別;
Step 2 當監(jiān)測到傳輸結束標志時,得到視頻內容類別C和秘密消息發(fā)布視頻時長序列M″={m″1,m″2,m″3,…,m″i,…,m″n};
Step 3 將M″中的每一項分別減去秘密消息映射區(qū)間的左端點數值,得到秘密消息的十進制序列M′={m′1,m′2,m′3,…,m′i,…,m′n};
Step 4 根據C的取位方式,將秘密消息的十進制序列M′轉化為二進制比特序列,得到M分段={m1,m2,m3,…,mi,…,mn};
Step 5 得到秘密消息的二進制字符串,從而得到秘密消息。
3 具體實例
以短視頻平臺抖音為例,將抖音短視頻按照內容分類。對于普通用戶而言,抖音的可發(fā)布視頻時長為60 s。假設發(fā)送方需要傳輸秘密消息“Qing Dao”給接收方,下面介紹嵌入過程和提取過程。
3.1 嵌入過程
預處理:將秘密消息轉化為ASCII碼值。設置當前選用的特定短視頻類別集合Cj:C1=生活類,如果當前視頻類別屬于生活類,依據雙方共識確定當前視頻代表自左向右取5位;C2=體育類,如果當前視頻類別屬于體育類,依據雙方共識確定當前視頻代表自右向左取4位;C3=美食類,如果當前視頻類別屬于美食類,依據雙方共識確定當前視頻代表自右向左取3位;C4=動漫類,如果當前視頻類別屬于動漫類,依據雙方共識確定當前視頻代表自右向左取2位;C5=明星類,如果當前視頻類別屬于明星類,依據雙方共識確定當前視頻代表自右向左取1位。確定抖音可發(fā)布視頻最長時長為60 s。對可發(fā)布時長分區(qū)間,確定秘密消息映射區(qū)間10~41s、秘密消息傳輸開始與結束標志區(qū)間1~9 s、用戶正常生活區(qū)間42~60 s。
Step 1 對秘密消息“Qing Dao”進行預處理,取其ASCII碼值,得到秘密消息的二進制字符串M=01010001 01101001 01101110 01100111 01000100 01100001 01101111,長度LM=56 bits;
Step 2 確定當前隱寫過程中會使用到的特定短視頻類別C1=生活類,C5=明星類;
Step 3 對秘密消息進行分段,段數n=LM/LCj確定的取位數=56/5=12,段長=log260=5 bits。分段得到M分段={01010,00101,10100,10110,11100,11001,11010,00100,01100,00101,10111,1};
Step 4 將分段后的秘密消息二進制字符串依次轉為十進制序列M′={10,5,20,22,28,25,26,4,12,5,23,1}。將m′i分別加上秘密消息映射區(qū)間的左端點數值,以確定發(fā)布視頻的時長,得到秘密消息發(fā)布視頻時長序列,M″={20,15,30,32,38,35,36,14,22,15,33,11};
Step 5 從秘密消息傳輸開始與結束標志區(qū)間1~9 s中選擇5 s和6 s時長的視頻分別作為秘密消息傳輸開始與結束的標志,并發(fā)布5 s的視頻告知接收方傳輸開始;
Step 6 依次發(fā)布時長為20 s,15 s,30 s,32 s,38 s,35 s,36 s,14 s,22 s,15 s,33 s,11 s的視頻,其中最后一個視頻內容為明星類,其余均為生活類;
Step 7 秘密消息傳輸完畢后,發(fā)送方發(fā)布6 s時長的視頻告知接收方傳輸結束。
3.2 提取過程
當前選用的特定短視頻類別集合Cj、映射區(qū)間、傳輸開始與結束標志為雙方共享。
Step 1 接收方實時監(jiān)測發(fā)送方的視頻發(fā)布情況,當監(jiān)測到5 s時長的視頻時,按照時間發(fā)布順序依次記錄發(fā)送方發(fā)布的視頻時長和視頻內容類別;
Step 2 當監(jiān)測到6 s時長的視頻時,得到C1=生活類,C5=明星類和M″={20,15,30,32,38,35,36,14,22,15,33,11};
Step 3 將M″中的每一項分別減去秘密消息映射區(qū)間的左端點值10,得到秘密消息的十進制序列M′={10,5,20,22,28,25,26,4,12,5,23,1};
Step 4 根據C1和C2的取位方式,將秘密消息的十進制序列M′轉化為二進制比特序列,得到M分段={01010,00101,10100,10110,1110,11001,11010,00100,01100,00101,10111,1};
Step 5 得到秘密消息的二進制字符串M=01010001 01101001 01101110 01100111 01000100 01100001 01101111,從而得到秘密消息“Qing Dao”。
4 性能分析
與現(xiàn)有的信息隱藏方法相同,從四個方面進行性能分析:隱寫容量、隱蔽性、魯棒性和方法對比。分析結果表明,基于短視頻分類和時長的信息隱藏方法具有較高的隱寫容量、較強的隱蔽性和魯棒性。
4.1 隱寫容量
隱寫容量Capcity定義為單個視頻可以攜帶的最長秘密消息位數?;诙桃曨l分類和時長的信息隱藏方法的隱寫容量取決于短視頻平臺可發(fā)布視頻的最長時長Lmax,Capcity=log2Lmax。短視頻平臺可發(fā)布視頻的最長時長是由平臺本身確定的,對普通用戶而言,抖音、快手、火山小視頻等可發(fā)布的最長時長分別為60 s、5 min、60 s等,可發(fā)布視頻時長越長,隱寫容量越大。當Lmax=60 s時,隱寫容量取得最小值Capcitymin=log260=5 bits/視頻。
4.2 隱蔽性
短視頻平臺數量不斷增加,視頻內容不斷豐富,活躍用戶日趨增多。在海量的短視頻資源中進行信息隱藏,攻擊者不易檢測異常。正是由于短視頻的海量性特征,使用短視頻分類和時長的信息隱藏方法才具有更高的隱蔽性。在信息隱藏的過程中,秘密消息根據C進行分段和確定進制間的轉換,可以在發(fā)送過程中通過規(guī)則性的變換C來增加分段以及進制轉換的多樣性,以此來達到更好的隱蔽效果。比如,可設置一些視頻類別代表自右向左取位或借鑒二分查找的思想設置取位方式。
4.3 魯棒性
基于短視頻分類和時長的信息隱藏更多地依賴于短視頻平臺的健壯性,如果短視頻平臺出現(xiàn)異常,那么秘密消息傳輸就很難成功。如果攻擊者企圖篡改短視頻內容和時長從而影響秘密消息的傳輸,那么,首先要攻擊短視頻平臺,但是,現(xiàn)存的短視頻平臺已經相當成熟,不易攻擊。隨著技術的發(fā)展,以后可能會出現(xiàn)的其他短視頻平臺的健壯性也不會存在問題。因此,基于短視頻分類和時長的方法具有良好的魯棒性。
4.4 方法對比
本文從上述三個方面與其他方法進行了性能對比,結果如表1所示?;谖⑿排笥讶c贊行為的方法[13]和基于Twitter轉發(fā)推文的方法[14]分別利用了時下流行的高穩(wěn)健性社交軟件隱藏秘密消息,這使得上述兩種方法具有高度的魯棒性。微信產生了海量的朋友圈資源,推特產生了海量的推文資源,點贊朋友圈與轉發(fā)推文均是用戶的高頻操作,這使得上述兩種方法均具有高度的隱蔽性。對比可知,基于短視頻分類和時長的信息隱藏方法具有較高的隱寫容量、高隱蔽性和強魯棒性。
5 結論
對發(fā)布的短視頻時長劃分區(qū)間,分別用來映射秘密消息、代表傳輸開始和結束標志、代表用戶正常生活。對短視頻的內容進行分類,從而作為秘密消息取位方式和位數。利用短視頻的分類和時長實現(xiàn)了隱藏容量高、隱蔽性和魯棒性強的無載體信息隱藏方法,彌補了短視頻信息隱藏領域的空缺?;诒狙芯康某晒?,為進一步提高隱寫容量,可以選取發(fā)布時長更長的短視頻平臺實施信息隱藏,也可以結合不同的短視頻平臺對其進行編碼。為了進一步增強隱蔽性,可以在隱寫過程中穿插代表用于正常生活的視頻來躲避竊密者的攻擊。
參考文獻
[1]WANG Z H, CHANG C C, KIEU T D, et al. Emoticon-based text steganography in chat[C]// 2009 Asia-Pacific Conference on Computational Intelligence and Industrial Applications (PACIIA). Wuhan, 2009: 457-460.
[2]陳嘉勇, 王超, 張衛(wèi)明,等.安全的密文域圖像隱寫術[J].電子與信息學報, 2012,34(7):1721-1726.
[3]胡洋, 張春田, 蘇育挺.基于H.264/AVC的視頻信息隱藏算法[J].電子學報, 2008,36(4):690-694.
[4]楊婉霞, 孫東紅, 黃永峰.基于語音編碼中自適應碼本的隱藏信息方法[J].計算機工程與設計, 2013, 34(8):2656-2661.
[5]甘燦, 孫星明, 劉玉玲,等.一種改進的基于同義詞替換的中文文本信息隱藏方法[J].東南大學學報(自然科學版),2007(S1):137-140.
[6]張建軍.基于文本集常見詞的無載體信息隱藏技術研究[D].長沙:湖南大學,2018.
[7]于翔美,王開西.基于漢字筆畫編碼矩陣的文本隱寫方法[J].青島大學學報(自然科學版),2019,32(2):43-47+54.
[8]王建業(yè),郭振波,王開西.基于漢字數學表達式的無載體文本隱寫方法[J].青島大學學報(自然科學版),2019,32(1):81-86.
[9]周志立, 曹燚, 孫星明.基于圖像Bag-of-Words模型的無載體信息隱藏[J]. 應用科學學報, 2016,34(5):527-536.
[10] 張新鵬,錢振興,李晟.信息隱藏研究展望[J].應用科學學報, 2016, 34(5): 475-489.
[11] SEBASTIAN Z, ARMITAGE G, BRANCH P. Covert channels in multiplayer first person shooter online games[C]// 33rd Annual IEEE Conference on Local Computer Networks. Montreal, 2008:204-211.
[12] ROWE B, DARYL J. A behavior-based covert channel in a MMO[C]//The 2014 International Conference on Security and Management. Las Vegas ,2014.
[13] ZHANG X P. Behavior steganography in social network[C]// 12th International Conference on Intelligent Information Hiding and Multimedia Signal Processing (IIH-MSP). Taiwan, 2016: 21-23.
[14] LI S, ANTHONY T S H, WANG Z, et al. Lost in the digital wild: Hiding information in digital activities[C]// MPS '18: Proceedings of the 2nd International Workshop on Multimedia Privacy and Security. Qingdao, 2018:27-37.
[15] 張平, 崔琪楣, 侯延昭, 等.移動大數據時代:無線網絡的挑戰(zhàn)與機遇[J]. Science Bulletin, 2015, 60(5):433-438.
[16] 顧亞奇.社交媒體時代短視頻的多重文化圖景[J].中國人民大學學報, 2020, 34(3):142-150.
[17] 孫小燕, 朱伯玉. 短視頻自媒體的發(fā)展現(xiàn)狀與趨勢[J].青年記者, 2020, 20(52):92-93.
[18] 中國互聯(lián)網絡信息中心.《第46次中國互聯(lián)網絡發(fā)展狀況統(tǒng)計報告》[R].北京,2020.
[19] 宋剛. 基于多種特征的視頻分類研究[D].重慶:西南大學,2010.
Method of Information Hiding Based on Short Videos′
Classification and Lengths
WANG Ting-ting, WANG Kai-xi
(College of Computer Science & Technology, Qingdao University, Qingdao 266071, China)
Abstract:
In order to make full use of these resources, a carrier-free information hiding method based on short video classification and lengths was proposed. Short videos′ content is classified and some specific categories is set as the flag of taking bits; Short videos′ lengths are divided into intervals, which are used to map secret messages, represent the start and end of transmission marks, and represent the normal life of users. The analysis results show that this method has high capacity(5bits/video), high concealment and robustness.
Keywords:
short videos; information hiding; carrier-free; concealment