李杰++李靜
摘 要: 為了實(shí)現(xiàn)視頻監(jiān)控的實(shí)時傳輸和網(wǎng)絡(luò)控制功能,提出基于Web架構(gòu)拓?fù)淇刂频囊曨l監(jiān)控系統(tǒng)。該系統(tǒng)分為三層體系結(jié)構(gòu),分別為感知控制層、網(wǎng)絡(luò)傳輸層和應(yīng)用服務(wù)層。采用自適應(yīng)差分調(diào)制技術(shù)進(jìn)行視頻的量化編碼,設(shè)計(jì)優(yōu)化的視頻編碼算法降低視頻傳輸延時和保證良好的輸出品質(zhì)。采用集中式拓?fù)浜头植际酵負(fù)湎嘟Y(jié)合的方式進(jìn)行視頻監(jiān)控多媒體拓?fù)淇刂?,?gòu)建Web服務(wù)器的信令,進(jìn)行服務(wù)器結(jié)構(gòu)優(yōu)化設(shè)計(jì),在RTP協(xié)議棧下進(jìn)行Web視頻監(jiān)控系統(tǒng)的API接口設(shè)計(jì),實(shí)現(xiàn)視頻監(jiān)控的輸出控制。實(shí)驗(yàn)結(jié)果表明,該系統(tǒng)能提高監(jiān)控視頻傳輸?shù)谋U媛剩瑏G包率較低,輸出延時較小,保證了視頻監(jiān)控輸出的質(zhì)量和實(shí)時性。
關(guān)鍵詞: Web架構(gòu); 視頻監(jiān)控系統(tǒng); 量化編碼; 延時; 丟包
中圖分類號: TN948.4?34; TP391 文獻(xiàn)標(biāo)識碼: A 文章編號: 1004?373X(2017)21?0027?04
Research and implementation of video surveillance system based on Web architecture
LI Jie, LI Jing
(Yinchuan Energy Institute, Yinchuan 750001, China)
Abstract: In order to realize the real?time transmission and network control functions of the video surveillance, a video surveillance system based on Web architecture topology control is proposed. The system includes three?layer architecture of perceived control layer, network transmission layer and application service layer. The adaptive differential modulation technology is used for the quantization coding of the video. The optimized video coding algorithm is designed to reduce the video transmission delay and guarantee the high output quality. The mode combining the distributed topology and centralized topology is adopted to perform the multimedia topology control of video surveillance. The signaling of Web server is constructed to carry out the structure optimization design of the server. The API interface of Web video monitoring system is designed in the RTP protocol stack to control the output of video monitoring. The experimental results show that the system can improve the fidelity of surveillance video transmission, reduce the packet loss rate and output delay, and ensure the output quality and real?time performance of video monitoring.
Keywords: Web architecture; video surveillance system; quantization coding; time delay; packet loss
0 引 言
隨著多媒體網(wǎng)絡(luò)技術(shù)的迅速普及,信息技術(shù)和通信技術(shù)不斷融合,網(wǎng)絡(luò)用戶的視頻傳輸和處理需求呈爆炸式增長態(tài)勢。網(wǎng)絡(luò)多媒體視頻和圖像文件傳輸迅速增長,需要在Web環(huán)境下進(jìn)行視頻和圖像的監(jiān)控和識別,將視頻監(jiān)控系統(tǒng)融入到Web架構(gòu)體系中,實(shí)現(xiàn)在線視頻監(jiān)控識別,提高對視頻信息的實(shí)時甄別和遠(yuǎn)程控制能力[1]。
視頻監(jiān)控系統(tǒng)的Web架構(gòu)是一項(xiàng)系統(tǒng)的網(wǎng)絡(luò)工程,需要進(jìn)行視頻監(jiān)控的編碼技術(shù)設(shè)計(jì)、網(wǎng)絡(luò)模型構(gòu)建、網(wǎng)絡(luò)服務(wù)器及網(wǎng)絡(luò)協(xié)議設(shè)計(jì)、視頻輸出API接口設(shè)計(jì)等[2]。視頻監(jiān)控系統(tǒng)的Web架構(gòu)重點(diǎn)在于傳輸層協(xié)議的設(shè)計(jì),目前主要采用的是傳輸控制協(xié)議(TCP)、用戶數(shù)據(jù)協(xié)議(UDP)[3]。例如,文獻(xiàn)[4]中提出一種基于Open Core核心的Android平臺視頻監(jiān)控系統(tǒng)設(shè)計(jì)方法,實(shí)現(xiàn)視頻監(jiān)控系統(tǒng)的通信網(wǎng)構(gòu)建,但是該系統(tǒng)存在傳輸時延較大、實(shí)時性較差的問題?;贗Pv6的嵌入式視頻監(jiān)控系統(tǒng)設(shè)計(jì)方法,提高了監(jiān)控視頻輸出的穩(wěn)定性,但是該系統(tǒng)的抗干擾能力不強(qiáng),輸出視頻的像素誤差較大。文獻(xiàn)[5]對視頻動態(tài)監(jiān)控的編碼算法進(jìn)行改進(jìn)設(shè)計(jì),提高了交通視頻車輛檢索識別的準(zhǔn)確性,但該方法在道路視頻監(jiān)控中容易出現(xiàn)時滯和失真,視頻在Web和車聯(lián)網(wǎng)環(huán)境下的丟包問題需要得到解決。
針對上述問題,提出基于Web的視頻監(jiān)控系統(tǒng),首先進(jìn)行視頻監(jiān)控系統(tǒng)的總體架構(gòu)分析,然后進(jìn)行系統(tǒng)模塊化設(shè)計(jì),監(jiān)控系統(tǒng)設(shè)計(jì)主要包括視頻編碼算法設(shè)計(jì)、監(jiān)控系統(tǒng)的Web控制協(xié)議設(shè)計(jì)、服務(wù)器設(shè)計(jì)、編碼轉(zhuǎn)換API接口設(shè)計(jì)等,最后進(jìn)行系統(tǒng)測試分析,得出有效性結(jié)論。endprint
1 系統(tǒng)總體設(shè)計(jì)架構(gòu)
1.1 系統(tǒng)功能體系總體結(jié)構(gòu)
在Web架構(gòu)環(huán)境下,視頻監(jiān)控系統(tǒng)分為三層體系結(jié)構(gòu),分別為感知控制層、網(wǎng)絡(luò)傳輸層和應(yīng)用服務(wù)層。其中,感知控制層通過多媒體信息采集設(shè)備進(jìn)行視頻信息采集,多媒體信息采集設(shè)備通常為視頻監(jiān)控探頭和無線傳感器,采用物聯(lián)網(wǎng)和無線射頻識別技術(shù)進(jìn)行監(jiān)控系統(tǒng)感知設(shè)備的物物相連,采用無線自組網(wǎng)技術(shù)實(shí)現(xiàn)視頻監(jiān)控信息的分布式協(xié)同處理與Web集成控制。運(yùn)用低速和中高速的網(wǎng)絡(luò)傳輸技術(shù)構(gòu)建視頻監(jiān)控的物聯(lián)網(wǎng)異構(gòu)網(wǎng)絡(luò),利用實(shí)時傳輸協(xié)議提供視頻的端到端傳遞服務(wù),建立異構(gòu)網(wǎng)、移動通信網(wǎng)。數(shù)據(jù)發(fā)送者周期性地傳送編碼的視頻信息到中央處理器,考慮到帶寬和資源受限的影響,在網(wǎng)絡(luò)支撐層傳送少量會話控制信息,實(shí)現(xiàn)高能效、精準(zhǔn)、可靠的視頻信息傳輸和編碼。在感知控制層進(jìn)行多媒體信息封裝和視頻信息云存儲,在云存儲模型下構(gòu)建視頻監(jiān)控的信息存儲單元,使用開放的服務(wù)訪問接口與網(wǎng)絡(luò)控制接口實(shí)現(xiàn)視頻輸出顯示和調(diào)閱。根據(jù)上述設(shè)計(jì)原理分析,得到本文設(shè)計(jì)的基于Web架構(gòu)的視頻監(jiān)控系統(tǒng)的三層體系結(jié)構(gòu)模型,如圖1所示。
1.2 系統(tǒng)設(shè)計(jì)技術(shù)指標(biāo)
Web架構(gòu)下視頻監(jiān)控系統(tǒng)的設(shè)計(jì)技術(shù)指標(biāo):平均端到端延時為0.25 s,平均送達(dá)率為15 Kb/s,數(shù)據(jù)包分組送達(dá)率為2.76 Kb/s,視頻幀差采樣率為8 Kb/s,比特率為64 Kb/s,能實(shí)現(xiàn)對視頻監(jiān)控信息的8通道同步、異步采樣,視頻的輸出峰值信噪比大于20 dB,傳輸誤碼率低于0.045,滿足高清視頻監(jiān)控和無損傳輸?shù)囊蟆8鶕?jù)上述對視頻監(jiān)控系統(tǒng)的總體架構(gòu)和功能技術(shù)指標(biāo)分析,進(jìn)行視頻監(jiān)控的編碼設(shè)計(jì)和模塊化設(shè)計(jì)。
2 視頻編碼技術(shù)
為了提高視頻監(jiān)控的效率和性能,并能有效地利用網(wǎng)絡(luò)資源,需要進(jìn)行視頻編碼設(shè)計(jì)[6],設(shè)計(jì)優(yōu)化的視頻編碼算法降低視頻傳輸延時和保證良好的輸出品質(zhì)。本文采用自適應(yīng)差分調(diào)制技術(shù)進(jìn)行視頻的量化編碼,編碼算法的設(shè)計(jì)描述如下:以每個視頻幀組為一個編碼數(shù)據(jù)包單元,對視頻中的圖像幀進(jìn)行[n]級空間分解,采用如下的自適應(yīng)差分控制函數(shù)進(jìn)行視頻幀序列的時空交替變換:
[h(i,2j)=h(i,2j-1)+h(i,2j+1)2v(2i,j)=v(2i-1,j)+v(2i+1,j)2d(i,2j)=d(i,2j-1)+d(i,2j+1)2] (1)
在視頻幀差的奇偶位置對視頻輸出偶序列進(jìn)行幀內(nèi)分解,給定視頻編碼的碼書長度為[N,]在視頻像素值邊界上的視頻恢復(fù)的傳遞函數(shù)為:
[h(i,352)=h(i,351)v(288,j)=v(287,j)d(i,352)=d(i,351)] (2)
式中:[h,v]和[d]分別表示當(dāng)前像素點(diǎn)、幀差像素點(diǎn)和量化信道上的傳輸編碼信息。
采用方向性奇偶拆分方法把視頻編碼信息構(gòu)成一個2×2×2的立方塊,生成一個嵌入位流,統(tǒng)計(jì)整個分辨率空間中的像素,通過共軛結(jié)構(gòu)代數(shù)碼激勵,得到像素特征分布坐標(biāo)集合為:
[O(i,j,k)=(2i-1,2j-1,2k-1),(2i-1,2j,2k-1),(2i,2j-1,2k-1),(2i,2j,2k-1),(2i-1,2j-1,2k),(2i-1,2j,2k),(2i,2j-1,2k),(2j,2j,2k)] (3)
設(shè)[C(i,j,k)]代表坐標(biāo)[(i,j,k)]的系數(shù),對采集的視頻監(jiān)控編碼序列進(jìn)行壓縮,采用自適應(yīng)測試函數(shù)差分脈沖編碼調(diào)制:
[Sn(T)=1,maxC(i,j,k)≥2n(i,j,k)∈T0,other] (4)
引入最小閾值([Tmin])和最小輸出位([bitmin])進(jìn)行碼書訓(xùn)練,提高解碼視頻的輸出圖像質(zhì)量。在不改變像素空間劃分的情況下,通過向量量化編碼,修正視頻序列各組的訓(xùn)練樣本,求取編碼閾值,得到新的求取編碼輸出視頻序列[xP(An)=x(sj),j=1,2,…,N。]綜上分析,采用自適應(yīng)差分調(diào)制技術(shù)補(bǔ)償來消除幀間冗余,進(jìn)行向量量化編碼,在視頻監(jiān)控系統(tǒng)的輸出端采用聯(lián)合解碼得到質(zhì)量更高的視頻圖像。
3 系統(tǒng)關(guān)鍵模塊
3.1 視頻監(jiān)控系統(tǒng)的Web協(xié)議
為了實(shí)現(xiàn)視頻監(jiān)控系統(tǒng)的Web控制,構(gòu)建Web協(xié)議,采用集中式拓?fù)浜头植际酵負(fù)湎嘟Y(jié)合的方式進(jìn)行視頻監(jiān)控多媒體拓?fù)淇刂?,設(shè)計(jì)的Web協(xié)議分為物理層、網(wǎng)絡(luò)層、傳輸層和應(yīng)用層[7]。其中,物理層采用以太網(wǎng)組網(wǎng)構(gòu)建監(jiān)控體系的觀測節(jié)點(diǎn)感知視場,通過自組織方式構(gòu)成網(wǎng)絡(luò),視頻監(jiān)控節(jié)點(diǎn)向Web網(wǎng)絡(luò)發(fā)布監(jiān)控輸出請求和控制指令;在網(wǎng)絡(luò)層中采用 IPv6 傳感節(jié)點(diǎn)和IPv6 路由進(jìn)行自組網(wǎng)設(shè)計(jì),采用一種自組織、結(jié)構(gòu)開放的協(xié)議模型將數(shù)據(jù)傳回到匯聚節(jié)點(diǎn),每發(fā)送一個RTP分組包,分信源標(biāo)識的個數(shù)加1,最大程度上保證了輸入視頻和輸出的同一性。
在傳輸層利用UDP協(xié)議構(gòu)建數(shù)據(jù)信息編碼的規(guī)則庫,主要分為模型庫、知識規(guī)則庫、日志庫、仿真庫以及其他規(guī)則庫,在應(yīng)用層輸出SIP消息,其中SIP消息由一個起始行(Start?Line)、一個或多個狀態(tài)碼組成的消息頭構(gòu)成,通過集中式的拓?fù)浣Y(jié)構(gòu)進(jìn)行用戶尋址或定位,采用統(tǒng)一資源定位符SIP URI(Unified Resource Identification)進(jìn)行視頻幀格式編碼和屬性調(diào)整。最后進(jìn)行媒體封裝和程序控制,實(shí)現(xiàn)視頻監(jiān)控信息的存儲和調(diào)度。視頻監(jiān)控系統(tǒng)的Web協(xié)議的體系結(jié)構(gòu)如圖2所示。
根據(jù)上述視頻監(jiān)控系統(tǒng)的Web協(xié)議設(shè)計(jì)規(guī)范,進(jìn)行協(xié)議狀態(tài)碼設(shè)計(jì),在Web架構(gòu)下視頻監(jiān)控系統(tǒng)的數(shù)據(jù)包傳輸定義了五種控制協(xié)議類型,見表1。
3.2 服務(wù)器結(jié)構(gòu)設(shè)計(jì)
視頻監(jiān)控系統(tǒng)的Web架構(gòu)的核心是網(wǎng)絡(luò)服務(wù)器結(jié)構(gòu)設(shè)計(jì),服務(wù)器架構(gòu)過程即信令控制過程,采用集中式和分布式兩種形式進(jìn)行信令拓?fù)淇刂?,集中式媒體拓?fù)淇刂疲谝曨l監(jiān)控的網(wǎng)絡(luò)Sink節(jié)點(diǎn)建立一個點(diǎn)到點(diǎn)的信令連接,由SIP協(xié)議棧發(fā)起視頻監(jiān)控終端用戶之間的會話,用戶終端響應(yīng)的狀態(tài)碼設(shè)定如下。endprint
1XX:時間戳指響應(yīng)。即視頻監(jiān)控輸入的時間戳指設(shè)定,通過視頻編碼將視頻信息輸入到Web服務(wù)器中,請求處理,時間戳完成第一視頻幀序列的時間采樣。
2XX:同步源標(biāo)識。同步源標(biāo)識用來標(biāo)識輸入視頻幀和輸出視頻幀的對應(yīng)差異性,使得視頻監(jiān)控控制端能正確地接收到視頻監(jiān)控信息并做出相應(yīng)的處理。
3XX:數(shù)據(jù)流和控制流分離。需要重定向端到端的數(shù)據(jù)傳輸服務(wù),RTP頭部和負(fù)載數(shù)據(jù)壓縮視頻數(shù)據(jù),完成同步源標(biāo)識。
4XX:客戶出錯響應(yīng)。視頻監(jiān)控的終端在服務(wù)器上注冊用戶信息,剔除或者邀請指定的人進(jìn)行視頻保存數(shù)據(jù)的查閱和回放,但視頻幀出現(xiàn)冗余和差錯時,輸出校正字結(jié)構(gòu)。
5XX:服務(wù)器出錯響應(yīng)。表示請求合法但是服務(wù)器無法完成此請求。
6XX:媒體流分發(fā)。MIXER使用RTP協(xié)議接收一組相同類型的媒體流后,通過層次性的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)進(jìn)行數(shù)據(jù)分發(fā)控制。
SIP能夠支持五種多媒體通信的通信功能用戶尋址或定位。根據(jù)上述對視頻監(jiān)控系統(tǒng)的用戶終端響應(yīng)的狀態(tài)碼設(shè)定,構(gòu)建控制服務(wù)器,設(shè)定SIP協(xié)議棧的控制字為:
輸出視頻監(jiān)控流媒體(media)文件:媒體的類型如音頻、視頻、圖像。
資源控制端口(port):在PSTN網(wǎng)關(guān)標(biāo)識一個端口號。
傳輸(transport):采用UDP,RTP/AVP協(xié)議配置進(jìn)行視頻監(jiān)控信息寫入,并通過一組混合編碼規(guī)則進(jìn)行數(shù)據(jù)編碼和傳輸控制。
格式列表(format?list):在服務(wù)器中建立Web云存儲格式列表,進(jìn)行監(jiān)控視頻的云存儲設(shè)計(jì)。格式列表設(shè)計(jì)為:
[o=]<監(jiān)控視頻名><狀態(tài)標(biāo)識><版本>
為保證輸出視頻幀的惟一性,在云存儲格式列表中建立會話標(biāo)識位,由ast_sip_config類函數(shù)提供會話界面,從數(shù)據(jù)庫中讀取調(diào)閱的監(jiān)控視頻文件名,采用NTP時戳t=<起始時間><終止時間>設(shè)定監(jiān)控視頻的起止時間。在Web輸出端輸出包含監(jiān)控視頻的各種信息,并完成大規(guī)模視頻信息的線性編碼轉(zhuǎn)換和云存儲。由此完成了對Web架構(gòu)下的視頻監(jiān)控系統(tǒng)服務(wù)器結(jié)構(gòu)設(shè)計(jì), 服務(wù)器中建立了相應(yīng)的套接字來實(shí)現(xiàn)監(jiān)控視頻的傳遞和訪問。
4 系統(tǒng)測試分析
系統(tǒng)測試的環(huán)境為:CPU為Inter Pentium 4 2.0 GHz,顯卡為nVIDIA+256 MB顯存,Web架構(gòu)體系為1 000 Mb/s的以太網(wǎng)交換機(jī)。利用Visual C++7.0作為仿真工具進(jìn)行視頻編碼設(shè)計(jì),首先定義了一個地址結(jié)構(gòu)變量sockClient,并給其成員賦值,在兩臺機(jī)器上運(yùn)行服務(wù)器端程序和客戶端程序,設(shè)定視頻監(jiān)控輸入端的服務(wù)器地址為192.168.6.69,端口為1500,Web客戶端的服務(wù)器地址為192.168.76.676,端口為1800,根據(jù)客戶機(jī)/服務(wù)器模型,開發(fā)視頻編碼程序,并將監(jiān)控視頻輸入到Web MFC應(yīng)用程序中,在視頻接收端創(chuàng)建圖像顯示線程,視頻監(jiān)控的采樣間隔設(shè)定為10 ms,視頻數(shù)據(jù)包大小為1 024×100 B,測試時間為25 s,以6組監(jiān)控視頻樣本集為測試樣本,測試集詳細(xì)參數(shù)設(shè)定見表2。
以上述監(jiān)控視頻場景為測試樣本,采用本文設(shè)計(jì)的Web架構(gòu)的視頻監(jiān)控系統(tǒng)測試監(jiān)控時間延遲和輸出視頻的保真率,并將本文設(shè)計(jì)系統(tǒng)和傳統(tǒng)方法進(jìn)行對比,得到結(jié)果如圖3,圖4所示。
分析圖3結(jié)果得知,隨著視頻傳輸規(guī)模的增大,傳統(tǒng)的視頻監(jiān)控系統(tǒng)時間延遲不斷增大,導(dǎo)致輸出視頻的實(shí)時性不好,而本文設(shè)計(jì)的系統(tǒng)時間延遲穩(wěn)定在0.10 s,具有較好的視頻監(jiān)控實(shí)時性。分析圖4結(jié)果得知,采用本文方法進(jìn)行視頻監(jiān)控輸出的保真率較好,視頻輸出質(zhì)量較高。視頻監(jiān)控系統(tǒng)的網(wǎng)絡(luò)測試性能見表3。
分析表3結(jié)果得知,采用本文設(shè)計(jì)的Web視頻監(jiān)控系統(tǒng),丟包數(shù)明顯下降,在發(fā)送端堆積待發(fā)視頻幀數(shù)減少,從而保證了視頻輸出端顯示的視頻畫面像素值更高,保證了輸出端與發(fā)送端采集視頻畫面的同步變化。由于本文設(shè)計(jì)系統(tǒng)采用Web架構(gòu)設(shè)計(jì),且利用了編碼算法進(jìn)行視頻處理,所以CPU占用資源較傳統(tǒng)方法要高。
5 結(jié) 語
本文研究了Web架構(gòu)下的視頻監(jiān)控系統(tǒng)優(yōu)化設(shè)計(jì)方法,系統(tǒng)采用三層體系結(jié)構(gòu)模型,采用自適應(yīng)差分調(diào)制技術(shù)進(jìn)行視頻的量化編碼,進(jìn)行視頻監(jiān)控系統(tǒng)的Web協(xié)議設(shè)計(jì),根據(jù)集中式媒體拓?fù)淇刂品椒ㄟM(jìn)行服務(wù)器結(jié)構(gòu)設(shè)計(jì),在RTP協(xié)議棧下進(jìn)行Web視頻監(jiān)控系統(tǒng)的API接口設(shè)計(jì),實(shí)現(xiàn)監(jiān)控系統(tǒng)的程序開發(fā)。系統(tǒng)測試結(jié)果表明,該系統(tǒng)能提高視頻監(jiān)控的輸出畫面質(zhì)量和實(shí)時性,降低了視頻Web傳輸?shù)膩G包率,性能較優(yōu)。
參考文獻(xiàn)
[1] HUANG Y, PAISLEY J, LIN Q, et al. Bayesian nonparametric dictionary learning for compressed sensing MRI [J]. IEEE transactions on image processing, 2014, 23(12): 5007?5019.
[2] SHEN L, SUN G, HUANG Q, et al. Multi?level discriminative dictionary learning with application to large scale image classification [J]. IEEE transactions on image processing, 2015, 24(10): 3109?3123.
[3] THIAGARAJAN J J, RAMAMURTHY K N, SPANIAS A. Learning stable multilevel dictionaries for space representations [J]. IEEE transactions on neural networks & learning systems, 2015, 26(9): 1913?1926.
[4] 李元元.基于Open Core核心的Android平臺視頻監(jiān)控系統(tǒng)設(shè)計(jì)[J].科技通報(bào),2012,28(10):193?195.
[5] 張子龍,薛靜,喬鴻海,等.基于改進(jìn) SURF算法的交通視頻車輛檢索方法研究[J].西北工業(yè)大學(xué)學(xué)報(bào),2014,32(2):297?301.
[6] BARTOLINI N, CALAMONERI T, LA PORTAT T F. et al. Autonomous deployment of heterogeneous mobile sensors [J]. IEEE transactions on mobile computing, 2011, 10(6): 753?766.
[7] LIN T Y, SANTOSO H A, WU K R. Global sensor deployment and local coverage?aware recovery schemes for smart environments [J]. IEEE transactions on mobile computing, 2015, 14(7): 1382?1396.