• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于人工智能的三維多媒體視覺圖像識別研究

      2021-06-17 09:04:26唐曉
      電子制作 2021年8期
      關(guān)鍵詞:圖像識別特征提取樣本

      唐曉

      (鄭州工業(yè)應(yīng)用技術(shù)學(xué)院信息工程學(xué)院,河南鄭州,451150)

      0 引言

      人眼能夠通過以往經(jīng)驗,對二維圖像進(jìn)行快速感應(yīng)從而實現(xiàn)從二維圖像到三維圖像的轉(zhuǎn)換。多媒體傳播時代的到來,出現(xiàn)了一種結(jié)合上述人眼識別的方式,出現(xiàn)了一種人工智能圖像識別技術(shù),并在人們的日常生活當(dāng)中得到了廣泛的應(yīng)用,例如在衛(wèi)星定位、生物醫(yī)學(xué)等領(lǐng)域當(dāng)中,均應(yīng)用了人工智能識別技術(shù)[1]。但當(dāng)前,隨著人們對圖像識別要求的不斷提高,在沿用傳統(tǒng)的圖像識別方法時,容易出現(xiàn)識別精度不符合要求、識別時間過長、識別結(jié)果與實際相差較大等問題[2]。因此,當(dāng)前該領(lǐng)域研究人員逐漸將研究重點轉(zhuǎn)向?qū)τ行ёR別方法的研究當(dāng)中。對此,本文通過開展基于人工智能的三維多媒體視覺圖像識別研究,為研究人員提供全新的識別方法設(shè)計思路。

      1 基于人工智能的三維多媒體視覺圖像識別方法設(shè)計

      ■1.1 三維多媒體視覺圖像特征提取

      在傳統(tǒng)視覺圖像識別方法的基礎(chǔ)上,結(jié)合三維多媒體圖像中各項規(guī)律,對圖像特征進(jìn)行提取。采用多尺度幾何分析工具,實現(xiàn)對多媒體視覺圖像的切波變換,對圖像進(jìn)行三維最優(yōu)逼近,從而方便獲取圖像當(dāng)中的各類型信息及特征。

      首先利用層疊分類器對三維多媒體視覺圖像進(jìn)行分類,在保留圖像窗口的條件下,過濾掉所有非識別圖像窗口,在保證漏檢率低的基礎(chǔ)上將大部分非識別區(qū)域進(jìn)行過濾。

      其次,完成對原始三維多媒體視覺圖像的剪切波變換后,對子圖像獲取,利用多方向局部二值模式,在已經(jīng)獲取到的剪切波變換圖像上得出半徑為a的圓形區(qū)域,并找出其中對應(yīng)的n個特征采集點[3]。根據(jù)多方向局部二值模式給出其算子的表達(dá)式為:

      公式(1)中,Pq表示為多方向局部二值模式算子;iq表示為三維多媒體視覺圖像中心點像素值;ic表示為三維多媒體視覺圖像中相鄰點的像素值大??;m表示為剪切參數(shù),m值通常取[0,1]。根據(jù)公式(1)計算得出多方向局部二值模式算子后,按照圖1所示流程對三維多媒體視覺圖像特征進(jìn)行提取和編碼。

      圖1 三維多媒體視覺圖像特征提取與編碼流程

      根據(jù)圖1特征提取和編碼流程得出,在特征提取過程中需要完成365維的編碼,為了方便后續(xù)識別,對其閾值化結(jié)果采用均值處理的方式進(jìn)行編碼。設(shè)定一個二進(jìn)制序列,并設(shè)定其從0到1和從1到0的過程不超過兩次[4]。根據(jù)三維多媒體視覺圖像在各個方向上的紋理圖像,進(jìn)一步將其劃分為一個5×5的矩形區(qū)域。通過對各個方向上的聯(lián)合直方圖進(jìn)行連接,得到一個完整的三維多媒體視覺圖像特征量,再利用可編程計數(shù)器陣列,對三維多媒體視覺圖像上的特征進(jìn)行降維處理。最終得到需要進(jìn)行識別的圖像特征表示。表1為降維處理后,三維多媒體視覺圖像維數(shù)及保留原始圖像信息百分比對應(yīng)關(guān)系。

      表1 降維后圖像維數(shù)與原始圖像信息百分比對應(yīng)表

      結(jié)合表1中的數(shù)據(jù),在對三維多媒體視覺圖像特征進(jìn)行提取時,應(yīng)當(dāng)根據(jù)實際需要選擇不同的降維維數(shù),其中降維維數(shù)為20時,圖像信息保留百分比最低,識別訓(xùn)練時間最長;降維維數(shù)為55時,圖像信息保留百分比最高,識別訓(xùn)練時間最短。

      ■1.2 識別圖像變化特征生成

      在完成視覺圖像特征提取的基礎(chǔ)上,應(yīng)根據(jù)識別圖像的變化,進(jìn)行識別特征的生成。在此過程中,假定獲取的圖像中存在動態(tài)的關(guān)鍵點,此時可利用動態(tài)點的變化,進(jìn)行多媒體幾何投影[5]。此過程可用如下計算公式表示。

      公式(2)中:S(c)表示為在繪制圖像過程中,多媒體環(huán)境下識別到的關(guān)鍵點。其中c的取值為c={c;z;v},將c中的二維圖像與三維空間圖像進(jìn)行對比,并使用小孔成像設(shè)備,在現(xiàn)實環(huán)境中,對特征信息進(jìn)行透視轉(zhuǎn)換。假定在一個相同的二維圖像環(huán)境中,存在圖像坐標(biāo)、點坐標(biāo)、坐標(biāo)軸、坐標(biāo)系均在同一水平面上,此時可認(rèn)為識別的特征數(shù)據(jù)存在統(tǒng)一性。為此,結(jié)合cs;co與c之間的三維目標(biāo)關(guān)系,進(jìn)行視覺目標(biāo)共性的轉(zhuǎn)換,轉(zhuǎn)換過程如下計算公式所示。

      公式(3)中:cs表示為識別到的原始圖像;co表示為三維坐標(biāo)圖像中,視覺目標(biāo)的對應(yīng)點。根據(jù)目前已知的圖像變化特征,將其應(yīng)用到實際中,進(jìn)行多媒體設(shè)備對圖像的平移、旋轉(zhuǎn)等操作處理。假定Q;E;R分別表示為三維圖像下的矩陣方向,則可認(rèn)為生成特征生成的過程如下。

      公式(4)中:U表示識別圖像特征的旋轉(zhuǎn)角度;Y表示為識別圖像特征的平移角度。根據(jù)上述計算公式,輸出具體數(shù)值,完成對圖像變化特征的生成。

      ■1.3 基于人工智能的圖像特征識別

      在完成圖像特征生成的基礎(chǔ)上,引入人工智能技術(shù),對圖像特征進(jìn)行最終識別,此過程中,使用智能化技術(shù)提供識別行為的稀疏表示法,構(gòu)建一個智能化的識別模型,并采用梯度限制的方式,對圖像目標(biāo)函數(shù)的最小值進(jìn)行投影,輸出優(yōu)化后的最小值,根據(jù)函數(shù)的梯度方向,進(jìn)行特征識別。此時,假定存在一個三維圖像樣本數(shù)據(jù)集合,且集合內(nèi)樣本數(shù)據(jù)量充足,此時,可按照第j個訓(xùn)練矩陣中,J的數(shù)據(jù)樣本字典進(jìn)行三維視覺的訓(xùn)練。其中J的取值范圍表示為Iα?β,用m表示為j類圖像的字典矩陣,q表示為大于0的系數(shù),則智能提取的過程可用如下計算公式表示。

      公式(5)中,g表示為樣本訓(xùn)練集合。使用機(jī)器算法與智能化技術(shù)的結(jié)合,利用牛頓內(nèi)點方法對目標(biāo)函數(shù)進(jìn)行約束,尋找約束范圍中的(g,0)取值區(qū)域,根據(jù)g中的樣本數(shù)量,得到g的最小值樣本集合,以此為依據(jù),定位函數(shù)的梯度方向,遵循此方向進(jìn)行圖像稀疏投影的分類,輸出分類結(jié)構(gòu),并認(rèn)為結(jié)構(gòu)密集區(qū)域存在特征圖像數(shù)據(jù),反之不存在特征圖像數(shù)據(jù),綜上所述,完成對圖像特征的識別。

      2 對比實驗

      本文選擇三維多媒體視覺圖像中的某一人體動作視覺圖像作為實驗對象,分別利用本文提出的基于人工智能的三維多媒體視覺圖像識別方法,和傳統(tǒng)圖像識別方法對該實驗對象進(jìn)行識別,以此完成對兩種識別方法的應(yīng)用效果對比。為實現(xiàn)對實驗結(jié)果的定量分析,本文按照人工智能識別率RR準(zhǔn)則作為標(biāo)準(zhǔn),對其正確識別率γ進(jìn)行計算:

      公式(6)中,K'表示為本文識別方法或傳統(tǒng)識別方法準(zhǔn)確識別視覺圖像樣本個數(shù);K表示為實驗過程中供進(jìn)行識別的樣本總數(shù)。本文實驗當(dāng)中選用的實驗對象為ORL人體動作三維多媒體視覺圖像庫當(dāng)中的500組視覺圖像,其中共包含了50人,每個人在不同的環(huán)境下,完成了10張不同動作和形態(tài)的視覺圖像展現(xiàn)。為確保實驗的客觀性,兩種識別方法在應(yīng)用過程中,均設(shè)置115×98的分辨率,灰度均在256級。根據(jù)上述實驗準(zhǔn)備,完成實驗,并隨機(jī)抽取100組識別結(jié)果,利用本文上述計算公式(6)對其正確識別率γ進(jìn)行計算,并求解出每組平均γ值,將實驗結(jié)果記錄如表2所示。

      表2 兩種識別方法實驗結(jié)果對比表

      根據(jù)表2中的數(shù)據(jù)結(jié)果進(jìn)一步得出,本文識別方法平均γ值明顯高于傳統(tǒng)識別方法平均γ值。因此,通過實驗證明,本文提出的基于人工智能的三維多媒體視覺圖像識別方法在實際應(yīng)用中具有更高的識別準(zhǔn)確性。同時,在實驗過程中,通過對其識別時間進(jìn)行比較得出,無論是在對三維多媒體視覺圖像的特征提取,還是在識別過程中,本文識別方法耗時均明顯小于傳統(tǒng)識別方法耗時。因此,進(jìn)一步證明本文識別方法具有更加重要的現(xiàn)實意義。

      3 結(jié)束語

      當(dāng)前三維多媒體技術(shù)的快速發(fā)展,使得圖像識別技術(shù)的出現(xiàn)為人們的日常生活帶來了諸多便利,針對傳統(tǒng)識別方法存在的精度不高、識別結(jié)果準(zhǔn)確率低等問題,本文通過引入人工智能技術(shù),對其進(jìn)行了創(chuàng)新研究。將本文提出的識別方法應(yīng)用到實際當(dāng)中,能夠有效增強(qiáng)識別性能,具有更高的實用價值。但由于研究能力的有限本文僅針對三維多媒體視覺圖像中的灰度圖像進(jìn)行了研究,而對于彩色視覺圖像的識別內(nèi)容并未涉及,因此在后續(xù)的研究中還將針對彩色視覺圖像進(jìn)行更加深入的研究,從而提高識別方法的實用性范圍。

      猜你喜歡
      圖像識別特征提取樣本
      用樣本估計總體復(fù)習(xí)點撥
      基于Resnet-50的貓狗圖像識別
      電子制作(2019年16期)2019-09-27 09:34:50
      高速公路圖像識別技術(shù)應(yīng)用探討
      基于Daubechies(dbN)的飛行器音頻特征提取
      電子制作(2018年19期)2018-11-14 02:37:08
      圖像識別在物聯(lián)網(wǎng)上的應(yīng)用
      電子制作(2018年19期)2018-11-14 02:37:04
      推動醫(yī)改的“直銷樣本”
      圖像識別在水質(zhì)檢測中的應(yīng)用
      電子制作(2018年14期)2018-08-21 01:38:16
      Bagging RCSP腦電特征提取算法
      隨機(jī)微分方程的樣本Lyapunov二次型估計
      村企共贏的樣本
      阿荣旗| 静安区| 滦南县| 望谟县| 修武县| 德庆县| 平顺县| 克什克腾旗| 五华县| 加查县| 聊城市| 横峰县| 马尔康县| 高要市| 汉川市| 罗江县| 清丰县| 奉节县| 宝丰县| 昌黎县| 汝城县| 镶黄旗| 三都| 分宜县| 长宁区| 阜新| 东平县| 肥城市| 南部县| 宝坻区| 天镇县| 开江县| 保德县| 宣威市| 湖南省| 正宁县| 金华市| 永吉县| 巨野县| 班玛县| 芒康县|