宋昕一 杜正洋 董佳
摘 ?要:受疫情影響,各高校的教學工作均以線上“云課堂”的形式開展,但現(xiàn)有攝像頭捕捉內(nèi)容時控制遲緩,導致學生在課堂學習時效率低下。攝像裝置功能的改善問題亟待解決。隨著視頻識別技術(shù)的廣泛發(fā)展與應(yīng)用,現(xiàn)將此技術(shù)應(yīng)用在攝像頭處,實現(xiàn)攝像頭高精度的自動跟隨捕捉拍攝,提高課堂教學質(zhì)量。項目一方面可運用于高校課堂的云教學,另一方面也可運用于公司的演講,遠距離視頻匯報或教輔機構(gòu)的教學,用途廣泛且便捷高效。
關(guān)鍵詞:攝像頭;視頻識別;人工智能;邊緣計算
中圖分類號:TP391.41 ? ? ?文獻標識碼:A 文章編號:2096-4706(2020)23-0028-03
Camera Device Based on Video Recognition System
SONG Xinyi,DU Zhengyang,DONG Jia
(University of Shanghai for Science and Technology,Shanghai ?200093)
Abstract:Affected by the epidemic,the teaching work in colleges is carried out in the form of online “cloud classroom”,but the control of the existing cameras to capture the content is slow,resulting in the low efficiency of students in classroom learning. It is urgent to solve the problem of improving the function of camera device. With the wide development and application of video recognition technology,this technology is now applied to the camera to realize the high-precision automatic follow capture of the camera and improve the quality of classroom teaching. On the one hand,the project can be used in cloud teaching in college classroom,on the other hand,it can also be used in the companys speech,long-distance video reporting or teaching in teaching auxiliary institutions,which is widely used,convenient and efficient.
Keywords:camera;video recognition;artificial intelligence;edge computing
0 ?引 ?言
基于攝像頭的相關(guān)設(shè)計是一個涉及范圍很廣的課題,尤其是近年來隨著技術(shù)的不斷發(fā)展,攝像頭識別的相關(guān)技術(shù)研究逐漸增多。在去年的線上教學過程中,我校主要通過攝像頭向?qū)W生傳送課堂信息。但實際上,課堂攝像頭只能較為粗略地捕捉顯示畫面,存在延遲的情況,導致課堂信息未能及時準確地傳送至學生端。在了解了攝像裝置存在的一些問題后,作者進行了相關(guān)研究,并在學校多位教師的指導下,擬設(shè)計出一款基于視頻識別系統(tǒng)的多功能攝像裝置。系統(tǒng)可控制攝像頭自動縮放、移動等相關(guān)功能,智能捕捉教師的運動軌跡,進而達到提高教學質(zhì)量與學習效率的目的;此外,該系統(tǒng)還可針對拍攝內(nèi)容在微信小程序上實現(xiàn)錄播的功能。大大提升了課堂的教學效率。
1 ?研究現(xiàn)狀
針對特定的數(shù)據(jù)信息進行相應(yīng)的篩選識別技術(shù)已經(jīng)廣泛應(yīng)用于各個領(lǐng)域。目前大多為利用虹膜與指紋的特定性進行識別,但兩者存在的不足之處有成本高昂、可復制性高,不適合大范圍應(yīng)用,隨著相關(guān)技術(shù)的發(fā)展,視頻識別技術(shù)浮出水面,視頻識別簡單來說就是根據(jù)研究對象的某些特征,對其進行識別并分類。通過將視頻劃分為一幀幀的圖像,從中提取大量的數(shù)據(jù),利用訓練的算法,將所提取的數(shù)據(jù)與要匹配的人的信息進行比對,若匹配值達到一定數(shù)值,則代表識別成功。視頻識別技術(shù)的研究意義在于:充分利用現(xiàn)有的技術(shù)與先進設(shè)備代替人工識別,在提高識別精度與效率的同時還可以大大節(jié)約成本。隨著實踐活動范圍的擴大和科學技術(shù)水平的提高,我們還可以實現(xiàn)通過人物的任意部位進行特定識別。
2 ?項目設(shè)計方案
2.1 ?視頻識別系統(tǒng)設(shè)計方案
對于視頻系統(tǒng)設(shè)計方案如圖1所示,將其分為上課前與上課中兩部分,運用兩個攝像頭,1號攝像頭用來確定老師所在位置以及黑板邊界,2號攝像頭則負責錄制工作。上課前先調(diào)適好攝像頭,之后通過1號攝像頭確定黑板邊界,從而確定2號攝像頭的拍攝范圍以及焦距大小,然后準備進入上課中的模式。進入上課中模式后,通過1號攝像頭來捕捉與確定老師的位置,從而確保老師始終在2號攝像頭鏡頭范圍之內(nèi)。而當1號攝像頭識別到老師走出黑板范圍以外時,則控制2號攝像頭調(diào)整焦距與進行相應(yīng)轉(zhuǎn)動,保證畫面能夠?qū)崟r拍攝到老師與黑板。通過這個識別系統(tǒng)可以確保攝像頭既不會跟丟老師,又能使同學們可以看到黑板上的內(nèi)容。
2.2 ?機械結(jié)構(gòu)設(shè)計方案
系統(tǒng)的機械結(jié)構(gòu)以一體化為目標,在測試階段為了便于尋找最優(yōu)角度,要求結(jié)構(gòu)靈活,在攝像過程中使攝像頭可自動捕捉面板范圍,鎖定拍攝內(nèi)容,使面板內(nèi)容的呈現(xiàn)可以根據(jù)教師的講解內(nèi)容而變化?;诖嗽O(shè)計了以下兩種機械結(jié)構(gòu)方案。
方案一:球形攝像頭——球形攝像頭采用圓球狀造型,一般安裝在墻壁較高處進行攝像,其機械結(jié)構(gòu)如圖2所示。
該攝像頭采用球形旋轉(zhuǎn)識別裝置來識別拍攝對象,縮小了攝像頭旋轉(zhuǎn)識別的范圍,但是此裝置需固定在墻面上,不便于拆取移動,另外安裝所涉及的零件較多,經(jīng)濟性略差,使得裝置很難得到大范圍應(yīng)用。此外。該裝置需設(shè)計得相對小巧,相應(yīng)零件選取較復雜,內(nèi)部開發(fā)板、舵機等零件不易選取設(shè)計,控制復雜。
方案二:雙攝像頭三腳架攝像平臺——主要由捕捉攝像頭、拍攝攝像頭、支架和箱體組成,支架包括立柱、三腳支架兩部分,如圖3所示。
該攝像平臺對目前市場上已存在的攝像頭的機械結(jié)構(gòu)進行了改進和創(chuàng)新,攝像頭箱體和立柱的連接部分為非對稱鏤空結(jié)構(gòu),采用阻尼轉(zhuǎn)軸進行連接,減輕了系統(tǒng)整體重量并且便于安裝;攝像頭箱體可以進行180°旋轉(zhuǎn),方便實時調(diào)節(jié)視角,增強攝影效果。三腳架設(shè)計為中空可伸縮機構(gòu)模式;通過滑軌,立柱可以進行調(diào)節(jié)并固定在任意高度;攝像頭箱體能夠跟隨立柱上下移動或自身進行90°旋轉(zhuǎn),便于鎖定各位置的面板內(nèi)容。
該裝置結(jié)構(gòu)設(shè)計簡單,可由3D打印完成,經(jīng)濟性較好;整體裝置小巧輕便,便于移動操作,適合在學校各教學室移動使用;攝像平臺的立柱可調(diào),可以滿足不同教室面板高度的差異變化,提高了拍攝效果;適合大批量生產(chǎn)和推廣。
綜合以上情況,選用方案二作為多功能攝像頭平臺的機械結(jié)構(gòu)。
3 ?項目技術(shù)關(guān)鍵
3.1 ?目標檢測技術(shù)
目標檢測技術(shù)在本項目中用于檢測老師所在的位置。目標檢測技術(shù)本質(zhì)上是先將視頻分成幀圖像,依次識別每張圖像,然后再將圖像合成視頻。該項目中識別教師的問題可以通過滑動窗口的辦法來解決。在掃描較大圖像的較小區(qū)域,可以通過滑動窗口的方式解決定位問題,進而實現(xiàn)在同一圖像的不同尺度下重復掃描。而對于滑動窗口帶來的區(qū)域重疊問題可以用“支持向量機(SVM)”來解決。
3.2 ?邊緣檢測技術(shù)
該項目需要通過邊緣檢測技術(shù)來檢測黑板,邊緣檢測技術(shù)主要是利用導數(shù)、微分計算亮度的變化,針對圖像邊界變化明顯的點來進行標識檢測。在實際中存在諸多干擾因素導致檢測率低,主要包括噪聲、鏡面反射、聚焦模糊等干擾因素,造成無法判定相鄰點梯度變化值的邊界閾值。本項目主要通過濾波抑躁以及相應(yīng)銳化的方式來提高檢測精度。
4 ?模型選取
4.1 ?Harr特征
Haar特征分為四類:邊緣特征、線性特征、中心特征和對角線特征,共同組合成特征模板。特征模板內(nèi)有白色和黑色兩種矩形,并定義該模板的特征值為白色矩形像素和減去黑色矩形像素和的差值。Haar特征值反映了圖像的灰度變化情況。在確定了特征形式后Harr-like特征的數(shù)量就取決于訓練樣本圖像矩陣的大小,特征模板可以置于子窗口內(nèi)的任意放置,一種形態(tài)稱為一種特征,找出所有子窗口的特征是進行弱分類訓練的基礎(chǔ)。
4.2 ?級聯(lián)分類器
級聯(lián)分類器的功能包括獲得特征類型getFeatureType,計算有序或無序特征等操作。由于Harr特征數(shù)量過多,幾乎已經(jīng)超過任何一種機器學習算法的輸入特征數(shù)量極限(2001年),因此直接訓練一個分類器是不現(xiàn)實的,本項目級聯(lián)分類器的策略是,將若干個強分類器由簡單到復雜排列,希望經(jīng)過訓練使每個強分類器都有較高檢測率,而誤識率可以降低。于是項目使用多個弱分類器組成一個強分類器的方法進行訓練。在本系統(tǒng)中,每一個弱分類器只針對一個單獨的特征:
hj(x)=
其中,hj為級聯(lián)分類器的特征;x為分類器的屬性;fj為分類器的檢測率;θj為分類器標準檢測率。
該級聯(lián)分類器使用AdaBoost方法進行訓練,訓練分類器的同時也篩選特征,最終分類器的級數(shù)與使用的特征數(shù)量相同(每個分類器只使用一個特征)。最終的分類器為:
hj(x)=
T為級聯(lián)分類器的數(shù)量,同時也是選擇特征的數(shù)量,為了減少計算量,在計算Harr特征時,級聯(lián)分類器未使用的特征可以不納入計算范圍;at為單個分類器的權(quán)重,在訓練過程中得到;t為使用分類器的標號,進行區(qū)分;ht為分類器的級數(shù)。
OpenCV自帶了一些級聯(lián)分類器,可以用于識別人臉,五官和人體等等,在Python下的使用方法為:
face_cascade=cv2.CascadeClassifier(“./haarcascades/haarcascade_frontalface_alt2.xml”
faces=face_cascade.detectMultiScale(gray, scaleFactor=1.3, minNeighbors=2,
minSize=(60,60), maxSize=(300,300))
首先調(diào)用cv2.CascadeClassifier(),打開一個級聯(lián)分類器,這里載入的xml為OpenCV自帶的人臉識別級聯(lián)分類器,隨后調(diào)用.detectMultiScale()方法進行識別,參數(shù)含義為:
(1)第一個參數(shù)image:待識別圖片必須是灰度圖片。
(2)第二個參數(shù)scaleFactor:被檢測對象的尺度變化,合理范圍為1.1~1.4,該參數(shù)越大檢測越細致,速度越慢。
(3)第三參數(shù)minNeighbors:每個候選框需要保留多少個領(lǐng)域,該參數(shù)越大,一個候選框越難被接受。
(4)第四個和第五個參數(shù)minSize和maxSize:目標的最小尺寸和最大尺寸,當目標超過這一范圍時無法識別。
該函數(shù)返回一個list,其中每個元素為一個有4個元素的list,分別是[x,y,w,h],可直接用于繪制矩形框。訓練級聯(lián)分類器選擇FDDB數(shù)據(jù)集訓練針對人臉的級聯(lián)分類器。
5 ?結(jié) ?論
本項目主要通過OpenCV自帶的Harr和級聯(lián)分類器實現(xiàn)人臉檢測進而完成視頻識別,在實際搭建完畢的測試中,攝像頭基本可以實現(xiàn)自動跟蹤捕捉人物的移動軌跡,從而進行一系列的移動操作,在一定程度上大大提高了課堂的效率性。但攝像平臺后期在微信小程序中的錄播回放功能,因涉及到各個模塊的交互,開發(fā)周期較長,目前仍在完善中。
參考文獻:
[1] 施巍松,劉芳,孫輝等.邊緣計算 [M].北京:科學出版社,2018:1-3.
[2] 熊凱龍,范方亮,汪保玉,等.基于一種新的級聯(lián)分類器的目標檢測系統(tǒng) [J].現(xiàn)代電子技術(shù),2020,43(1):48-52.
[3] 馬原野,韋莎,史揚,等.邊緣計算及其標準化工作探索 [J].信息技術(shù)與標準化,2017(9):29-32.
[4] 夏國淼.基于HLA的多嵌入式人臉識別系統(tǒng)的研究與實現(xiàn) [D].南昌:江西師范大學.
[5]朱紅高.圖像邊緣檢測技術(shù)研究現(xiàn)狀 [J].制造業(yè)自動化,2010,32(1):45-47.
[6] 趙志成.人臉檢測與識別算法研究及Android平臺實現(xiàn) [D].西安:西安電子科技大學,2014.
作者簡介:宋昕(2000—),女,漢族,山西忻州人,本科在讀,研究方向:電氣工程及其自動化;杜正洋(2000—),男,漢族,上海人,本科在讀,研究方向:電氣工程及其自動化;董佳(2000—),女,漢族,黑龍江牡丹江人,本科在讀,研究方向:電氣工程及其自動化。