• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于流形正則協(xié)同訓(xùn)練模型的行為識別方法

      2018-03-16 07:17:56劉向陽李陽姜樹明王帥
      山東科學(xué) 2018年1期
      關(guān)鍵詞:拉普拉斯正則分類器

      劉向陽, 李陽, 姜樹明, 王帥

      (山東省科學(xué)院情報(bào)研究所,山東 濟(jì)南 250014)

      近年來,動作行為識別成為計(jì)算機(jī)視覺、模式識別等領(lǐng)域的一個(gè)研究熱點(diǎn),廣泛應(yīng)用于人機(jī)交互[1-2]、運(yùn)動視頻分析[3]和視頻監(jiān)控[4]等領(lǐng)域。目前國內(nèi)外有關(guān)人體動作行為識別的研究取得了重要進(jìn)展,但人體運(yùn)動的多變化性,以及視角、光照、遮擋等問題使得識別的精確性成為研究難題。現(xiàn)有的行為識別模型大都是基于監(jiān)督學(xué)習(xí)框架的,然而現(xiàn)實(shí)應(yīng)用中,大多數(shù)都是未標(biāo)記且多特征描述的數(shù)據(jù),對樣本進(jìn)行標(biāo)記是一個(gè)費(fèi)時(shí)費(fèi)力的工作。

      協(xié)同訓(xùn)練算法(co-training)[5-7]是半監(jiān)督學(xué)習(xí)中的重要風(fēng)范(paradigm)之一,能夠很好地解決上述問題。該算法利用兩個(gè)或者多個(gè)學(xué)習(xí)器,以迭代的方式結(jié)合多視角信息。在學(xué)習(xí)過程中,挑選出置信度高的未標(biāo)記樣本進(jìn)行相互標(biāo)記,互換信息,更新模型以提高分類器識別效果。協(xié)同訓(xùn)練算法是一種非常具有研究價(jià)值的學(xué)習(xí)算法,目前協(xié)同訓(xùn)練及其相關(guān)改進(jìn)算法[8]已應(yīng)用于自然語言處理[9]、模式識別[10]等領(lǐng)域,但是在人行為識別領(lǐng)域應(yīng)用甚少。

      標(biāo)準(zhǔn)協(xié)同訓(xùn)練算法[6]及其相關(guān)改進(jìn)算法[11-12]利用各視角上標(biāo)記樣本訓(xùn)練初始分類器,通常采用傳統(tǒng)分類方法,如支持向量機(jī)[13](support vector machine, SVM)、決策樹(decision tree)、樸素貝葉斯(naive Bayes,NB)等分類算法。當(dāng)標(biāo)記樣本數(shù)目較少時(shí),僅僅利用有標(biāo)記樣本訓(xùn)練所得的分類器的性能較弱,容易對未標(biāo)記樣本預(yù)測錯(cuò)誤,如果被添加到對方標(biāo)記樣本集,就給對方引入了噪聲信息,且噪聲會在迭代過程中不斷積累,會導(dǎo)致最終分類器性能下降,無法得到用戶滿意的結(jié)果。

      本文引入流形正則化的半監(jiān)督方法來訓(xùn)練初始分類器,建立拉普拉斯正則化[14-15]的協(xié)同訓(xùn)練(Laplacian-regularized co-training, LapCo)模型,并將其應(yīng)用到動作識別中。該算法模型在訓(xùn)練初始分類器時(shí),添加laplacian正則利用大量未標(biāo)記信息,更好地探索數(shù)據(jù)邊緣分布的內(nèi)在幾何特性,提高初始分類器性能,避免引入噪聲從而提高動作識別的精確度。

      1 流形正則協(xié)同訓(xùn)練模型

      半監(jiān)督學(xué)習(xí)模型LapCo的目的是為了在訓(xùn)練過程中利用大量未標(biāo)記數(shù)據(jù)的信息來提高識別分類性能,類似于標(biāo)準(zhǔn)的協(xié)同訓(xùn)練,LapCo算法也采用迭代的方式工作。首先,分別在不同的視角上利用樣本訓(xùn)練初始分類器,然后初始分類器對未標(biāo)記樣本進(jìn)行預(yù)測,挑選出置信度高的未標(biāo)記樣本添加到標(biāo)記樣本集中,重新訓(xùn)練分類器,迭代幾次或達(dá)到一定精確度條件后停止。

      在LapCo中,本文采用的是拉普拉斯正則支持向量機(jī)(Laplacian regularized support vector machines(LapSVMs))算法來訓(xùn)練分類器,該算法在標(biāo)準(zhǔn)支持向量機(jī)(support vector machines, SVMs)的基礎(chǔ)上加入拉普拉斯流形正則項(xiàng),在訓(xùn)練過程中,拉普拉斯流形正則利用大量未標(biāo)記樣本的信息來提高初始分類器性能,從而避免迭代過程引入噪聲,以提高最終分類器性能。

      對于核函數(shù)K:X×X→R,存在一個(gè)相關(guān)的希爾伯特再生核空間與相對應(yīng)的范數(shù)‖‖K,對于SVMs,目標(biāo)函數(shù)為:

      (1)

      其中,(1-yif(xi))+=max(0,1-yif(xi))表示邊界函數(shù),γ為控制函數(shù)復(fù)雜度的參數(shù)。

      流形假設(shè)[15]指的是當(dāng)高維空間的數(shù)據(jù)映射到低維空間中,如果兩個(gè)樣本在低維流形上同處于一個(gè)局部領(lǐng)域內(nèi),則有較大概率有相同的性質(zhì),其標(biāo)記也相似,這一假設(shè)體現(xiàn)了決策函數(shù)在局部空間具有平滑性。在SVMs的基礎(chǔ)上引入Laplacian正則懲罰項(xiàng),則拉普拉斯正則支持向量機(jī)(LapSVMs)的目標(biāo)函數(shù)為:

      (2)

      由表示定理[18]可得上述問題的解為:

      (3)

      引入拉格朗日乘子,得

      (4)

      (5)

      其中,

      通過在SVM目標(biāo)函數(shù)中添加一個(gè)二次型范數(shù),形成LapSVMs,將最優(yōu)解β*加入(4)中,解得膨脹系數(shù)α*,值得注意的是,當(dāng)膨脹系數(shù)為0時(shí),上述就變?yōu)闃?biāo)準(zhǔn)的SVMs問題。

      2 行為識別實(shí)驗(yàn)及結(jié)果

      2.1 數(shù)據(jù)庫

      為了驗(yàn)證本文提出LapCo模型在行為識別中的有效性,我們在動作數(shù)據(jù)集UCF-iphone上進(jìn)行了大量驗(yàn)證實(shí)驗(yàn)。UCF-iphone 數(shù)據(jù)集由佛羅里達(dá)中心大學(xué)提供,是由10個(gè)志愿者在腰部佩戴iphone手機(jī),做一系列的重復(fù)動作,如跳、跑、爬樓梯、下樓梯、騎車等9個(gè)動作 (biking,climbing,descending,exercise biking,jump roping, running,standing,treadmill walking,walking),由內(nèi)嵌到手機(jī)里的慣性測量裝置(Inertial measurement unit, IMU)采集數(shù)據(jù),每個(gè)動作重復(fù)記錄5次,慣性測量裝置(60 Hz)同時(shí)記錄瞬時(shí)三維加速度(加速度計(jì))、角速度(陀螺儀)和方向(磁力計(jì)),手動采樣500個(gè)(8.33 s)。由不同測量裝置采集的數(shù)據(jù)可以看作是不同視角。

      2.2 實(shí)驗(yàn)設(shè)置

      我們隨機(jī)選取了UCF-iphone數(shù)據(jù)集上4類動作,采用角速度數(shù)據(jù)為一個(gè)視角,加速度數(shù)據(jù)為另一個(gè)視角。為了驗(yàn)證本文提出LapCo模型的有效性,我們還與標(biāo)準(zhǔn)協(xié)同訓(xùn)練算法(Std-Co)做了對比實(shí)驗(yàn)。本文實(shí)驗(yàn)選取任意兩類進(jìn)行二分類實(shí)驗(yàn),數(shù)據(jù)集4類,共進(jìn)行了6組實(shí)驗(yàn)。在每組實(shí)驗(yàn)中,從訓(xùn)練集中隨機(jī)挑選1,5,10,15,…,50個(gè)樣本作為有標(biāo)記樣本,其余的作為未標(biāo)記的樣本。為了綜合評判算法的性能,我們采用平均識別正確率(average precision, AP)來展示實(shí)驗(yàn)結(jié)果。

      2.3 實(shí)驗(yàn)結(jié)果

      圖1表示的是兩種方法在4類數(shù)據(jù)集上的平均識別正確率AP值。每一個(gè)子圖代表的是一類動作的識別結(jié)果。橫軸表示有標(biāo)記的樣本數(shù),縱軸表示平均識別率。虛線表示Std-Co的識別結(jié)果,實(shí)線表示本文提出的LapCo的識別結(jié)果。隨著標(biāo)記樣本數(shù)目的增加,兩種方法的識別結(jié)果都會提高。在大多數(shù)情況下,實(shí)線要高于虛線,由此可得,本文提出的LapCo識別效果要好于Std-Co。

      圖1 不同方法在4類數(shù)據(jù)集上的平均精確度均值Fig.1 Average precision of different methods for four classes

      3 結(jié)語

      協(xié)同訓(xùn)練是多視角學(xué)習(xí)中[19]典型的算法之一,能有效地結(jié)合多視角之間的信息,相互補(bǔ)充完善。為獲得更好的識別精確度,關(guān)鍵在于如何有效地利用大量的未標(biāo)記數(shù)據(jù)信息,為此,本文提出一種基于流形正則協(xié)同訓(xùn)練模型,即基于拉普拉斯正則的協(xié)同訓(xùn)練(LapCo)算法,并將其應(yīng)用到行為識別中。LapCo在訓(xùn)練過程中,引入的拉普拉斯正則能利用大量未標(biāo)記信息,更好地探索數(shù)據(jù)邊緣分布的內(nèi)在幾何特性,從而提高初始分類器性能。在動作數(shù)據(jù)集UCF-iphone上的大量實(shí)驗(yàn)結(jié)果表明,本文提出的LapCo能提高動作識別精確度。引入的拉普拉斯正則參數(shù)雖然不多,但參數(shù)值調(diào)整范圍比較大,采用手動調(diào)整參數(shù)到最優(yōu)結(jié)果需耗費(fèi)較多時(shí)間和精力。如何在較短時(shí)間內(nèi),自動獲取最好的實(shí)驗(yàn)參數(shù),提高算法效率,是下一步需要改進(jìn)的問題。

      [1]MOKHBER A, ACHARD C, MILGRAM M. Recognition of human behavior by space-time silhouette characterization[J]. Pattern Recognition Letters, 2008, 29(1): 81-89.

      [2]POLAT E, YEASIN M, SHARMA R. Robust tracking of human body parts for collaborative human computer interaction[J]. Computer Vision and Image Understanding, 2003, 89(1): 44-69.

      [3]LEWIS C, BRAND C, CHERRY G, et al. Adapting user interface design methods to the design of educational activities[M]//Proceedings of the SIGCHI conference on human factors in computing systems. New York, NY, US:ACM Press/Addison-Wesley Publishing Co., 1998: 619-626.

      [4]AYERS D, SHAH M. Monitoring human behavior from video taken in an office environment[J]. Image and Vision Computing, 2001, 19(12): 833-846.

      [5]周志華,王玨.機(jī)器學(xué)習(xí)及其應(yīng)用[M].北京:清華大學(xué)出版社,2007.

      [6]BLUM A, MITCHELL T. Combining labeled and unlabeled data with cotraining[M]//Proceedings of the eleventh annual conference on Computational learning theory. New York, NY, US:ACM, 1998: 92-100.

      [7]NIGAM K, GHANI R. Analyzing the effectiveness and applicability of cotraining[M]//Proceedings of the ninth international conference on Information and knowledge management. New York, NY, US:ACM, 2000: 86-93.

      [8]BALCAN M F, BLUM A, YANG K. Co-training and expansion: Towards bridging theory and practice[C]// Proceedings of the 17th international conference on neural information processing systems. Cambridge, MA, US: MIT Press ,2004: 89-96.

      [9]SARKAR A. Applying co-training methods to statistical parsing[C]//Proceedings of the second meeting of the North American chapter of the association for computational linguistics on language technologies. Stroudsburg, PA, US :Association for Computational Linguistics, 2001: 1-8.

      [10]PIERCE D, CARDIE C. Limitations of co-training for natural language learning from large datasets[EB/OL].[2017-03-04].. http://www.aclweb.org/anthology/W01-0501.

      [11]ABNEY S.Bootstrapping[EB/OL].[2017-03-04]. http://delivery.acm.org/10.1145/1080000/1073143/p360-abney.pdf?ip=218.

      57.145.1&id=1073143&acc=OPEN&key=4D4702B0C3E38B35%2E4D4702B0C3E38B35%2E4D4702B0C3E38B35%2E6D2181445

      11F3437&CFID=841997444&CFTOKEN=14396075&__acm__=1513668499_91c8cfe6ab532cfec81740b5270b979c.

      [12]LI Y, TAO D P, LIU W F, et al. Co-regularization for classification[C]// Proceedings 2014 IEEE International Conference on Security, Pattern Analysis, and Cybernetics (SPAC). [S.l.]:IEEE, 2014: 218-222.

      [13]CORINNA C, VAPNIK V. Support-vector networks[J]. Machine learning, 1995, 20(3): 273-297.

      [14]BELKIN M, NIYOGI P. Laplacian eigenmaps and spectral techniques for embedding and clustering [EB/OL].[2017-03-04]. http://papers.nips.cc/paper/1961-laplacian-eigenmaps-and-spectral-techniques-for-embedding-and-clustering.pdf .

      [15]BELKIN M, NIYOGI P, SINDHWANI V. Manifold regularization: a geometric framework for learning from labeled and unlabeled examples[J]. Journal of Machine Learning Research, 2006,7:2399-2434.

      [16]CHAPELLE O, SCH18LKOPF B, ZIEN A. Semi-supervised learning using semi-definite programming[M]. Cambridge, MA, US: MIT Press, 2006.

      [17]SHAHSHAHANI B M, LANDGREBE D A. The effect of unlabeled samples in reducing the small sample size problem and mitigating the Hughes phenomenon[J]. IEEE transactions on geoscience and remote sensing, 1994, 32(5): 1087-1095.

      [18]WARDETZKY M,MATHUR S,KALBERER F,et al. Discrete laplace operators:No free lunch[EB/OL].[2017-03-04]. http://www3.math.tu-berlin.de/geometrie/Lehre/SS12/MathVisII/nofreelunch.pdf .

      [19]WU Y, CHANG E Y, CHANG K C C, et al. Optimal multimodal fusion for multimedia data analysis[C]//Proceedings of the 12th annual ACM international conference on Multimedia. New York, NY, US: ACM, 2004: 572-579.

      猜你喜歡
      拉普拉斯正則分類器
      剩余有限Minimax可解群的4階正則自同構(gòu)
      類似于VNL環(huán)的環(huán)
      BP-GA光照分類器在車道線識別中的應(yīng)用
      電子測試(2018年1期)2018-04-18 11:52:35
      加權(quán)空-譜與最近鄰分類器相結(jié)合的高光譜圖像分類
      結(jié)合模糊(C+P)均值聚類和SP-V-支持向量機(jī)的TSK分類器
      基于超拉普拉斯分布的磁化率重建算法
      有限秩的可解群的正則自同構(gòu)
      位移性在拉普拉斯變換中的應(yīng)用
      基于LLE降維和BP_Adaboost分類器的GIS局部放電模式識別
      含有一個(gè)參數(shù)的p-拉普拉斯方程正解的存在性
      全州县| 饶平县| 安图县| 台南县| 闽清县| 天祝| 佛坪县| 垦利县| 海口市| 怀远县| 平乡县| 靖边县| 哈尔滨市| 卫辉市| 汕尾市| 搜索| 阿克陶县| 辽中县| 中卫市| 金华市| 汉中市| 车致| 宜丰县| 阿克陶县| 杭锦后旗| 乐安县| 青冈县| 筠连县| 黎川县| 娄底市| 余庆县| 紫金县| 山西省| 石泉县| 清远市| 望城县| 宣城市| 陆良县| 五常市| 彭泽县| 中西区|