邢開顏+李梅
摘要:信號是消息的載體,現(xiàn)代社會的信號種類繁多,分類復(fù)雜,對信號分類結(jié)果的要求也越來越高,用傳統(tǒng)的方法對信號進(jìn)行分類已經(jīng)不再適用。數(shù)據(jù)挖掘(Data rnining)是從大量數(shù)據(jù)中挖掘有趣模式和知識的過程,適合對大量的信號進(jìn)行分類,為人們的工作提供便利。本文簡述了數(shù)據(jù)挖掘分類算法在雷達(dá)信號、心電信號、音頻信號和通信信號四種信號分類識別中的應(yīng)用,介紹了信號分類的過程及其優(yōu)缺點(diǎn),找出信號分類識別的發(fā)展方向,為未來信號的分類識別研究莫定基礎(chǔ)。
關(guān)鍵詞:人工智能;信號分類;數(shù)據(jù)挖掘;神經(jīng)網(wǎng)絡(luò);支持向量機(jī)
引言
信號是表示消息的物理量,是運(yùn)載消息的工具,是消息的載體。信號在我們的生活中無處不在,類型多種多樣,包含大量的信息,易受到各種噪聲的干擾,現(xiàn)代社會對信號分類的性能要求很高,這些都給信號的分類識別帶來了難度,用傳統(tǒng)的方法對信號進(jìn)行分類識別已不能滿足人們的需求,尋找新的信號分類方法是很有必要的。
數(shù)據(jù)挖掘(Data mining)是從大量的、不完全的、模糊的、有噪聲的以及具有隨性的數(shù)據(jù)中,對隱含的、具有潛在作用和有意義知識進(jìn)行提取的過程,可以幫助人們在“大數(shù)據(jù)”中獲得需要的信息,數(shù)據(jù)挖掘有眾多的分類算法,這些分類算法各有千秋,為信號的分類識別提供了新的思路,與哪些傳統(tǒng)方法相比,分類算法的分類正確性更高,計(jì)算速度更快,更適合處理大量的數(shù)據(jù),也更具有智能性,如心電信號、腦電信號的自動識別方便醫(yī)生的診斷,雷達(dá)信號的智能識別提高了作戰(zhàn)效率等,這些識別方法中都有分類算法的應(yīng)用。
本文主要介紹了數(shù)據(jù)挖掘分類算法在雷達(dá)信號、心電信號、音頻信號、通信信號的分類識別中的應(yīng)用,比較了各種分類算法的性能,在此基礎(chǔ)上分析了信號分類的發(fā)展方向。
1基本分類算法簡介
數(shù)據(jù)挖掘的分類方法有很多,如神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、決策樹、回歸分析、貝葉斯等,但在信號的分類中主要使用的分類方法為神經(jīng)網(wǎng)絡(luò)與支持向量機(jī),故主要對這兩種算法做簡單介紹。
1.1人工神經(jīng)網(wǎng)絡(luò)(ANN)
人工神經(jīng)網(wǎng)絡(luò)(ArtificialNeuralNetwork,ANN)是20世紀(jì)80年代以來人工智能領(lǐng)域興起的研究熱點(diǎn),由大量節(jié)點(diǎn)相互聯(lián)接而成,每個(gè)節(jié)點(diǎn)代表一種特定的輸出函數(shù)激勵(lì)函數(shù)(Ctivation Function),每兩個(gè)節(jié)點(diǎn)間的連接表示對通過該連接信號的加權(quán),這相當(dāng)于人工神經(jīng)網(wǎng)絡(luò)的記憶,網(wǎng)絡(luò)的輸出則依據(jù)網(wǎng)絡(luò)的連接方式、權(quán)重值和激勵(lì)函數(shù)的不同而不同。
神經(jīng)網(wǎng)絡(luò)具有信息分布式存貯、大規(guī)模自適應(yīng)并行處理、高度的容錯(cuò)性等特點(diǎn),適合在缺乏屬性與類之間聯(lián)系的知識時(shí)使用。但ANN的訓(xùn)練時(shí)間長,可解釋性差,需要的參數(shù)多,很多參數(shù)通常要靠經(jīng)驗(yàn)確定,這些特點(diǎn)影響了其應(yīng)用,在此基礎(chǔ)上對ANN進(jìn)行了改進(jìn),隨后又提出了BP網(wǎng)絡(luò)、徑向基函數(shù)(Radial basis function,RBF)神經(jīng)網(wǎng)絡(luò)、概率神經(jīng)網(wǎng)絡(luò)(Probabilistic Neural Networks,PNN)、小波神經(jīng)網(wǎng)絡(luò)(Wavelet Neural Network,WNN)、模糊神經(jīng)網(wǎng)絡(luò)(Fuzzy Neural Network,F(xiàn)NN)等等。
近十幾年來,ANN的研究工作不斷深入,在模式識別、智能機(jī)器人、自動控制、預(yù)測估計(jì)、生物、醫(yī)學(xué)、經(jīng)濟(jì)等領(lǐng)域已成功地解決了許多現(xiàn)代計(jì)算機(jī)難以解決的實(shí)際問題,表現(xiàn)出了良好的智能特性。
1.2支持向量機(jī)(SVM)
支持向量機(jī)(Support Vector Machine,SVM)是Corinna Cortes和Vapnik等人于1995年提出的,是在統(tǒng)計(jì)學(xué)理論的基礎(chǔ)上發(fā)展出的一種新的模式識別方法,它以結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則為理論基礎(chǔ),通過適當(dāng)?shù)剡x擇函數(shù)子集及該子集中的判別函數(shù),使學(xué)習(xí)機(jī)器的實(shí)際風(fēng)險(xiǎn)達(dá)到最小,保證了通過有限訓(xùn)練樣本得到的小誤差分類器,對獨(dú)立測試集的測試誤差仍然較小。SVM具有較好的泛化能力和魯棒性,算法復(fù)雜度與特征空間的維度無關(guān),且局部最優(yōu)解一定是全局最優(yōu)解,這使得SVM在解決小樣本、非線性及高維模式識別中表現(xiàn)出許多特有的優(yōu)勢,并能夠推廣應(yīng)用到函數(shù)擬合等其他機(jī)器學(xué)習(xí)問題中。但SVM的核函數(shù)必須滿足Mercer條件,隨著訓(xùn)練樣本的增多其訓(xùn)練時(shí)間也成倍數(shù)增加,支持向量的數(shù)目隨訓(xùn)練樣本集的大小線性增加。
核函數(shù)的定義并不困難,根據(jù)泛函的有關(guān)理論,只要一種函數(shù)K滿足Mercer條件,它就對應(yīng)某一變換空間的內(nèi)積,表1中為SVM常用的核函數(shù)類型:
在選取SVM算法的核函數(shù)時(shí),通常采用的方法有三種。一是利用專家的先驗(yàn)知識預(yù)先選定核函數(shù)。二是采用Cross-Validation方法,即在進(jìn)行核函數(shù)選取時(shí),分別試用不同的核函數(shù),歸納誤差最小的核函數(shù)就是最好的核函數(shù)。三是采用由Smits等人提出的混合核函數(shù)方法,將不同的核函數(shù)結(jié)合起來后會有更好的特性,這是混合核函數(shù)方法的基本思想,也是目前選取核函數(shù)的主流方法。
2應(yīng)用
2.1雷達(dá)信號
雷達(dá)信號的分類識別是現(xiàn)代電子情報(bào)偵察系統(tǒng)的重要組成部分,也是衡量電子對抗設(shè)備先進(jìn)程度的重要標(biāo)志。隨著現(xiàn)代武器系統(tǒng)的發(fā)展,戰(zhàn)場電磁環(huán)境十分復(fù)雜,雷達(dá)體制多、波形復(fù)雜,獲取雷達(dá)的完整參數(shù)比較困難,這也對雷達(dá)信號識別系統(tǒng)提出了很高的要求。其中,特征提取和分類器設(shè)計(jì)是雷達(dá)信號識別的關(guān)鍵,利用傳統(tǒng)的特征參數(shù)進(jìn)行雷達(dá)信號的識別已經(jīng)不能滿足現(xiàn)代雷達(dá)對抗的要求,因此,需要更精確有效的識別方法。
ANN可以處理一些環(huán)境信息十分復(fù)雜、背景知識不清楚、樣本有較大缺損或畸變的模式識別問題,很適合對雷達(dá)信號進(jìn)行分類,但是由于其訓(xùn)練時(shí)間長、實(shí)時(shí)性差,并不適合應(yīng)用到瞬息萬變的現(xiàn)代戰(zhàn)場中,故對神經(jīng)網(wǎng)絡(luò)算法的改進(jìn)是很有必要的。唐斌、胡光銳將免疫RBF網(wǎng)絡(luò)為子網(wǎng)絡(luò)來改進(jìn)神經(jīng)網(wǎng)絡(luò)的性能,該方法提取RBF網(wǎng)絡(luò)核函數(shù)寬度的先驗(yàn)知識作為疫苗構(gòu)成免疫算子,縮小了算法搜索空間的范圍,進(jìn)而改善傳統(tǒng)神經(jīng)網(wǎng)絡(luò)訓(xùn)練時(shí)間長,擴(kuò)充、修改、維護(hù)難等缺陷,提高了算法的收斂速度和性能,用免疫RBF網(wǎng)絡(luò)陣列對各種雷達(dá)的體制和用途識別都有較高的正確識別率,明顯優(yōu)于BP網(wǎng)絡(luò)。但隨著雷達(dá)信號的不斷增加,傳統(tǒng)的識別參數(shù)難以滿足實(shí)際需要,可將關(guān)聯(lián)特征和神經(jīng)網(wǎng)絡(luò)相結(jié)合,利用關(guān)聯(lián)維數(shù)可以衡量信號的關(guān)聯(lián)復(fù)雜度的特征這一特點(diǎn),將關(guān)聯(lián)曲線上不同的點(diǎn)作為雷達(dá)信號的特征向量,作為神經(jīng)網(wǎng)絡(luò)的輸入進(jìn)而進(jìn)行識別分類,該方法在信噪比大于-5dB時(shí)就可以達(dá)到很高的識別率,適合于各種體制雷達(dá)信號的特征提取與識別。在現(xiàn)今這種雷達(dá)體制多變的環(huán)境下,這種特征提取方法有很廣泛的應(yīng)用價(jià)值。另外,傳統(tǒng)的加權(quán)M距離法與ANN結(jié)合,可以克服該識別法中各參數(shù)平等對待的缺點(diǎn)和專家設(shè)置權(quán)值法中人為因素的影響,綜合考慮了各參數(shù)的影響,較大地提高了識別的準(zhǔn)確性和可靠性。
與神經(jīng)網(wǎng)絡(luò)相比,SVM適合處理高維數(shù)據(jù),有很強(qiáng)的泛化能力,為雷達(dá)信號的分類識別提供了新的思路。胡奎、朱成文在MATLAB環(huán)境下模擬了不同核函數(shù)的支持向量機(jī)對雷達(dá)信號的分類效果,實(shí)驗(yàn)表明同時(shí)使用波達(dá)方向(DOA)、載頻(RF)和脈沖寬度(PW)三個(gè)參數(shù)作為分類參數(shù)時(shí)效果最好,因?yàn)檫@三個(gè)參數(shù)包含了雷達(dá)數(shù)據(jù)的絕大部分信息,有利于得到較好的分類結(jié)果。余志斌提出了一種增量模糊學(xué)習(xí)支持向量機(jī)算法(IFSVM),根據(jù)不同的雷達(dá)信號訓(xùn)練樣本距離類中心差異和樣本間的親疏程度,賦予每個(gè)分類樣本不同的類隸屬度,有較好的識別精度和魯棒性,在訓(xùn)練數(shù)據(jù)量大時(shí),IFSVM的時(shí)間代價(jià)比SVM的要小,但當(dāng)特征參數(shù)在空間成較大范圍的帶狀分布時(shí),時(shí)間復(fù)雜度會增大,處理效果會降低。
2.2心電信號
心血管疾病是威脅人類生命的主要疾病之一,心電圖(ECG)是診斷心血管疾病的重要依據(jù),是臨床診斷中不可缺少的常規(guī)檢查技術(shù),但不同的心臟疾病反映在ECG上的波形迥異,相同的病理也會呈現(xiàn)出不同的心電波形,所以通過計(jì)算機(jī)自動分析心電圖的診斷精度仍然不能達(dá)到臨床醫(yī)生的診斷要求,其最終結(jié)論尚需要專家的具體分析和決策。因此設(shè)計(jì)并實(shí)現(xiàn)更加精確有效的心電信號自動分類算法仍然具有非常重要的研究意義。
基于小波變換理論,小波神經(jīng)網(wǎng)絡(luò)已經(jīng)被廣泛的應(yīng)用于信號的表達(dá)和分類,將其應(yīng)用到ECG信號的分類中可以獲得不錯(cuò)的分類結(jié)果,其訓(xùn)練周期及對ECG信號的正確識別率都比BP網(wǎng)絡(luò)表現(xiàn)的更好,且具有很強(qiáng)的泛化能力,對未學(xué)習(xí)過的ECG信號仍有很高的識別率,這是BP神經(jīng)網(wǎng)絡(luò)所無法比擬的。在此基礎(chǔ)上,劉春玲、王旭將具有一層感知機(jī)的小波神經(jīng)網(wǎng)絡(luò)應(yīng)用于ECG信號的分類,同時(shí)在Roberto KH和Takashi Yoneyama提出的小波節(jié)點(diǎn)的初始化的基礎(chǔ)上進(jìn)行了改進(jìn),通過對MIT-BIH心電失常數(shù)據(jù)庫中的樣本數(shù)據(jù)進(jìn)行實(shí)驗(yàn),與常規(guī)的小波網(wǎng)絡(luò)相比分類性能得到了顯著提高。
根據(jù)ECG信號的時(shí)頻分布特征性和心率失常信號特點(diǎn),可以提取心電信號的時(shí)域特征、小波域特征和高階統(tǒng)計(jì)量特征,作為ECG信號自動分析系統(tǒng)的特征信息集,再通過SVM分類器對ECG信號進(jìn)行分類測試,實(shí)驗(yàn)表明該方法分類結(jié)果精確度高、分類速度快,在很大程度上克服了傳統(tǒng)機(jī)器學(xué)習(xí)中的維數(shù)災(zāi)難及局部最小等問題。其中維數(shù)災(zāi)難(Curse of Dimensionality)是指在涉及到向量的計(jì)算的問題中,隨著維數(shù)的增加,計(jì)算量呈指數(shù)倍增長的一種現(xiàn)象。為了解決這一問題,可以先利用非負(fù)矩陣分解(NMF)對數(shù)據(jù)進(jìn)行降維,然后運(yùn)用SVM進(jìn)行ECG信號的分類。在由高維數(shù)據(jù)向低維數(shù)據(jù)轉(zhuǎn)換的過程中,NMF能更好地保留原始數(shù)據(jù)的信息,提供更好的特征向量,進(jìn)而提高分類的準(zhǔn)確度。選取MIT-BIH數(shù)據(jù)庫中的四類ECG信號進(jìn)行訓(xùn)練和測試,最終的分類準(zhǔn)確度均達(dá)到了98%以上,但是NMF計(jì)算的時(shí)間相對要長一些,仍需要改進(jìn)算法,以達(dá)到更好的實(shí)時(shí)性。
為了減少SVM算法的收斂時(shí)間,李哲設(shè)計(jì)了一種基于稀疏表示的最小二乘支持向量機(jī)(LS-SVM)的ECG信號分類算法,其中,LS-SVM算法的關(guān)鍵就是用等式約束代替支持向量機(jī)的不等式約束,將支持向量機(jī)中的二次規(guī)劃問題轉(zhuǎn)化為求線性方程組的解,這樣就達(dá)到了減少算法收斂時(shí)間的目的。選取MIT-BIH數(shù)據(jù)庫上的五種ECG信號,先對特征向量進(jìn)行稀疏表示,然后通過LS-SVM進(jìn)行分,正確率可以達(dá)到98.93%,該方法既保證充分挖掘數(shù)據(jù)的特點(diǎn)又能提高泛化能力,適合進(jìn)行推廣。
2.3音頻信號
近年來,音頻信號處理已經(jīng)變成了計(jì)算機(jī)應(yīng)用的一個(gè)重要分支。音頻信號分類有兩個(gè)步驟:先將一個(gè)音頻信號通過特征提取技術(shù)簡化成一個(gè)參數(shù)集,再用不同的算法對參數(shù)集進(jìn)行加工完成分類。能否正確提取信號特征并將這些特征信號放到相應(yīng)的類別中決定了分類算法的效果。
小波神經(jīng)網(wǎng)絡(luò)在音頻信號分類識別中也有應(yīng)用,但分類時(shí)音頻信號的模板和樣本信號周期不同會使得網(wǎng)絡(luò)參數(shù)差異較大,為此何強(qiáng)等人提出了自適應(yīng)周期小波神經(jīng)網(wǎng)絡(luò)(APWNN),該方法能夠在網(wǎng)絡(luò)參數(shù)的計(jì)算中自動去除信號周期因素的影響。同等條件下對特定人的元音進(jìn)行分類識別,APWNN網(wǎng)絡(luò)和小波神經(jīng)網(wǎng)絡(luò)的正確識別率分別為87.50%和13.54%,可見,APWNN能夠有效克服被識別信號的周期變化對分類的影響,有利于信號分類。但APWNN算法采用連續(xù)時(shí)頻域特征提取,小波基函數(shù)的尺度和平移系數(shù)都是連續(xù)可變的,計(jì)算APWNN參數(shù)時(shí)耗時(shí)的迭代運(yùn)算,需要想辦法提高運(yùn)算速度。
在小波變換的基礎(chǔ)上,結(jié)合SVM和模糊積分進(jìn)行信號的特征提取,可有效地對音頻信號進(jìn)行分類,用該方法對各種聲音集進(jìn)行分類,準(zhǔn)確率較高,算法速度快,較好地體現(xiàn)了模糊學(xué)的精髓,彌補(bǔ)了一般算法只判別一次的不足,有較好的應(yīng)用前景。而李劍等人提出基于選擇性集成SVM的語音、話帶數(shù)據(jù)信號分類方法,根據(jù)集成算法的差異性定義,采用兩層級聯(lián)結(jié)構(gòu)的動態(tài)疊加算法完成決策輸出,在訓(xùn)練階段能準(zhǔn)確地選擇具有較高識別精度和差異性的成員分類器,在測試階段對各成員分類器進(jìn)行動態(tài)集成,提高運(yùn)算速度和抗噪聲性能,保證最終的分類結(jié)果最優(yōu),適合推廣。
2.4通信信號
通信信號的分類,又稱信號的調(diào)制識別,基本任務(wù)是在多信號有噪聲等復(fù)雜環(huán)境下確定信號的調(diào)制方式和載波頻率、碼元速率等信號參數(shù),為信號的進(jìn)一步分析和處理提供依據(jù)。隨著現(xiàn)代通信的發(fā)展,通信系統(tǒng)呈現(xiàn)出多樣化的趨勢,通信信號調(diào)制類型自動識別日益受到重視,在信號確認(rèn)、干擾辨識、無線電偵聽、電子對抗、信號檢測和威脅分析等領(lǐng)域應(yīng)用廣泛。信號調(diào)制類型自動識別是后續(xù)工作的前提和基礎(chǔ),但通信信號在傳播過程中會受到信道噪聲的污染,增加了信號識別的難度。
2.4.1基于ANN的通信信號分類
由于ANN能快速解決復(fù)雜分類問題,具有容錯(cuò)能力,對噪聲和不完整數(shù)據(jù)輸入不敏感等優(yōu)點(diǎn),使得ANN在通信信號自動分類識別問題上能夠取得令人滿意的結(jié)果。但也存在一些問題,如BP網(wǎng)絡(luò)收斂速度慢且易陷入局部最小,可用共軛梯度法對BP網(wǎng)絡(luò)進(jìn)行改進(jìn),通過選擇權(quán)向量的更新方向?yàn)檎`差函數(shù)的共軛梯度方向,可以顯著提高收斂速度和正確識別率,改善BP網(wǎng)絡(luò)的局部極小問題,在信號的信噪比不小于2dB時(shí),都能對信號進(jìn)行正確識別。
鄒月嫻等人將級聯(lián)神經(jīng)網(wǎng)絡(luò)分類識別器應(yīng)用于通信信號的分選和識別,選擇二值自適應(yīng)共振(ARTl)神經(jīng)網(wǎng)絡(luò)完成對輸入信號的分類,確定輸入信號類型是否已被網(wǎng)絡(luò)存儲,當(dāng)發(fā)現(xiàn)新出現(xiàn)的信號時(shí)進(jìn)行標(biāo)記,再用BP網(wǎng)絡(luò)識別該信號類型,這樣可以充分利用信號的所有特征,該方法在信號噪聲比為3dB的情況下提取的復(fù)合特征能被ARTl網(wǎng)絡(luò)和BP網(wǎng)絡(luò)以一定的概率正確存儲和識別,且該方法對信號噪聲比的要求與傳統(tǒng)方法相比降低了近10dB,在低信噪比條件下,其正確識別率遠(yuǎn)優(yōu)于傳統(tǒng)信號分類識別器的識別結(jié)果。隨后,苗建蘇、傅豐林用RBF神經(jīng)網(wǎng)絡(luò)對通信信號進(jìn)行分類,其中RBF可以將信號的矢量特征降維,有利于信號的分類識別。模擬實(shí)驗(yàn)表明,該方法分類精度高、訓(xùn)練速度快、占用存儲空間少、容錯(cuò)性強(qiáng),由于是分布式存儲,該網(wǎng)絡(luò)易于硬件實(shí)現(xiàn)。在用RBF網(wǎng)絡(luò)進(jìn)行通信信號分類之前,可以對信號數(shù)據(jù)進(jìn)行處理,可用離散傅里葉變換(DFT)和小波變換方法提取信號的頻譜、瞬時(shí)幅度、瞬時(shí)頻率和瞬時(shí)相位,構(gòu)成信號的特征向量,將特征向量通過RBF神經(jīng)網(wǎng)絡(luò)獲得最終的分類結(jié)果,該方法在信噪比為6dB時(shí)對信號的識別依然可以保持較高的識別率,具有一定的抗干擾能力,基本上可以滿足應(yīng)用的要求。將小波變換與RBF網(wǎng)絡(luò)相結(jié)合進(jìn)行通信信號的分類可以獲得不錯(cuò)的效果,在MATLAB上進(jìn)行仿真實(shí)驗(yàn),結(jié)果表明分類識別率隨著信噪比的增加而增加,在SNR-5dB時(shí)信號的平均識別率為98.58%,在SNR-0dB時(shí)信號的平均識別率為99.83%,可見該方法的分類性能很高,并且對噪聲不敏感,有很好的抗噪聲能力。
2.4.2基于SVM的通信信號分類
在信號的實(shí)際傳輸中,得到的訓(xùn)練樣本數(shù)是十分有限的,這時(shí)很多方法都難以取得理想的分類效果,即使在有限訓(xùn)練樣本情況下,采用復(fù)雜的學(xué)習(xí)機(jī)使學(xué)習(xí)誤差更小,但推廣性卻往往變差。韓鋼等人提出一種基于高階累積量和SVM的數(shù)字信號自動調(diào)制識別方法,即將接收信號的四階、六階累積量作為分類特征向量,利用SVM將分類特征向量映射到一個(gè)高維空間,并在高維空間中構(gòu)造最優(yōu)分類超平面以實(shí)現(xiàn)信號分類。這種方法對高斯噪聲和星座圖由于信號初始相位而引人的旋轉(zhuǎn)具有良好的穩(wěn)健性,并避免了神經(jīng)網(wǎng)絡(luò)中的過學(xué)習(xí)和局部極小等缺陷,有良好的分類性能和穩(wěn)健性,但對于SVM的二次規(guī)劃,需要的時(shí)間比較長,特別是在訓(xùn)練樣本數(shù)較大的情況下。馮祥等人通過提取觀測樣本累積量的識別特征矢量來區(qū)分不同的信號類型,再將特征向量映射到高維空間中用SVM加以分類。仿真實(shí)驗(yàn)表明,該方法在較大的信噪比范圍內(nèi)對全球移動通信系統(tǒng)(GSM)、碼分多址(CDMA)、正交頻分復(fù)用技術(shù)(OFDM)三種信號均有較高的識別率,當(dāng)信噪比大于5dB時(shí),對三種信號的正確識別率接近0.99,因而該分類算法有較好的推廣能力,克服了對模型過分依賴的問題,不同參數(shù)的徑向基核函數(shù)或多項(xiàng)式核函數(shù)對算法的性能沒有明顯的影響。王玉婧將高階累積量、小波變換與SVM相結(jié)合,用來對調(diào)制信號進(jìn)行分類。仿真實(shí)驗(yàn)證明,這種方法是可行的,既解決了小波特征對調(diào)相信號之間識別性能偏低的問題,又實(shí)現(xiàn)了對OFDM信號和其他多種單載波通信信號的分類,并且由于SVM對小樣本信號具有良好的性能,所有該方法在數(shù)據(jù)長度有限的情況下仍能達(dá)到良好的識別性能。
由于不同的核函數(shù)對SVM的分類性能影響很大,可采用并行組合的SVM分類器進(jìn)行通信信號的識別,通過對比不同核函數(shù)下SVM的分類結(jié)果,選擇識別率高的作為最后的判決類型。對實(shí)際采集的六種調(diào)制信號,分別通過線性核函數(shù)的SVM分類器、高斯核函數(shù)的SVM分類器和并行組合的SVM分類器,最終結(jié)果表明,并行組合的SVM分類器對信號具有很好的分類性能,優(yōu)于單個(gè)SVM分類器。
遺傳算法(GA)是模擬生物進(jìn)化過程中的自然選擇和遺傳變異的一種隨機(jī)優(yōu)化方法,具有很強(qiáng)的全局搜索能力,并且這種搜索能力不依賴于特定的求解模型。利用GA算法的全局尋優(yōu)能力優(yōu)化SVM中的核函數(shù)的兩個(gè)參數(shù),再用優(yōu)化后的SVM進(jìn)行分類。通過對數(shù)字通信信號的分類仿真,表明了其良好的優(yōu)越性,提高了訓(xùn)練速度,說明在通信領(lǐng)域遺傳優(yōu)化SVM具有很好的應(yīng)用前景。
3總結(jié)與展望
數(shù)據(jù)挖掘的分類算法為信號的分類識別帶來新的活力,不論是直接應(yīng)用分類算法,還是將分類算法與傳統(tǒng)的方法相結(jié)合,都具有各自的特點(diǎn)和潛力。但是分類算法在信號的分類識別中的應(yīng)用還不成熟,未挖掘出其真正的潛力,還有很多問題亟待解決,主要體現(xiàn)在:
1)很多信號中混有干擾和噪聲,這些會影響分類的最終結(jié)果,在分類前需要進(jìn)行數(shù)據(jù)的預(yù)處理,可以采用小波變換、傅里葉變換等時(shí)頻分析方法濾除噪聲和干擾,提取出有用信號特征再進(jìn)行分類,可以提高分類的準(zhǔn)確性。
2)數(shù)據(jù)挖掘的分類算法有很多,如決策樹、回歸分析、貝葉斯、神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)等等,目前在信號分類中應(yīng)用最廣的是神經(jīng)網(wǎng)絡(luò)和支持向量機(jī),可以嘗試用其他的分類模型進(jìn)行信號的分類,擴(kuò)大分類算法在信號識別中的應(yīng)用范圍。
3)可將數(shù)據(jù)挖掘的分類算法與其他方法相結(jié)合進(jìn)行算法的優(yōu)化,提高算法的分類性能、學(xué)習(xí)能力和收斂速度等,例如與遺傳算法、模糊控制、粗糙集理論等相融合,必將成為今后信號分類識別的研究熱點(diǎn)。
對上述問題的深入研究必將促進(jìn)數(shù)據(jù)挖掘分類算法在信號分類識別領(lǐng)域中的應(yīng)用和發(fā)展,在信號的智能識別領(lǐng)域中展現(xiàn)出更加光明的前景。