蒲倩
【摘要】函數(shù)性數(shù)據(jù)分析(FDA)是一種新型數(shù)據(jù)分析方法,該種分析方法是建立在函數(shù)角度基礎(chǔ)上,強調(diào)將函數(shù)數(shù)據(jù)作為整體進行分析,函數(shù)性數(shù)據(jù)有效豐富了數(shù)據(jù)分析領(lǐng)域,為解決數(shù)據(jù)問題提供了強有力的支撐,該種技術(shù)屬于探索性技術(shù),對函數(shù)通特征描述與特征提取到起到了理想的成效,數(shù)性數(shù)據(jù)分析有著很大的優(yōu)越性,能夠通過微分曲線與導(dǎo)數(shù)曲線來處理信息,本文主要討論函數(shù)性數(shù)據(jù)分析中的主成分分析.
【關(guān)鍵詞】函數(shù)性數(shù)據(jù)分析;主成分分析;討論
在人們的日常生活中,常常需要處理各種各樣的數(shù)據(jù),其中很多數(shù)據(jù)是有函數(shù)特征的,如氣象數(shù)據(jù)、證券交易數(shù)據(jù)等等,函數(shù)性數(shù)據(jù)分析(FDA)是一種新型數(shù)據(jù)分析方法,該種分析方法是建立在函數(shù)角度基礎(chǔ)上,強調(diào)將函數(shù)數(shù)據(jù)作為整體進行分析.
與傳統(tǒng)數(shù)據(jù)分析方法相比而言,函數(shù)性數(shù)據(jù)分析有著很大的優(yōu)越性,能夠通過微分曲線與導(dǎo)數(shù)曲線來處理信息,截至目前為止,各界的專家學者已經(jīng)針對函數(shù)性數(shù)據(jù)進行了深入的分析,下面就針對函數(shù)性數(shù)據(jù)分析的主成分進行相應(yīng)的介紹.
一、傳統(tǒng)主成分分析
主成分分析在1901年開始在正交回歸分析中得到了應(yīng)用,在1933年,主成分分析法得到了一定的發(fā)展,該種分析方式能夠?qū)⒏呔S空間問題變成低維空間問題,這樣即可將問題直觀化、簡單化,雖然該種分析法會損失部分數(shù)據(jù),但是卻抓住了主要問題,對問題的分析十分有益.在技術(shù)水平的發(fā)展之下,主分析法十分的重要,從幾何角度進行分析,該種分析方式能夠?qū)⒃甲兞拷M合成新坐標,新指標伸縮情況主要由樣本協(xié)方差矩陣進行表示,新變量之間并無密切的關(guān)系,可以看出,使用主成分分析法能夠很好地避免多重共線問題的發(fā)生.
從本質(zhì)上而言,主成分分析是線性映射法,該種方法是不適宜應(yīng)用在非線性問題處理中的,在這一背景下,一些學者提出主曲線方法、核主成分分析法、主曲面方法、多層感知器方法等多種主成分分析法,該種這些數(shù)據(jù)分析法的應(yīng)用還存在一些弊端,因此,就需要使用新型主成分分析法,函數(shù)性數(shù)據(jù)分析法正是在這一基礎(chǔ)上產(chǎn)生.
二、函數(shù)性數(shù)據(jù)主成分分析
1.函數(shù)性數(shù)據(jù)的特征
顧名思義,函數(shù)性數(shù)據(jù)就是一種采用函數(shù)來表現(xiàn)的數(shù)據(jù),具有函數(shù)性的特征,在分析數(shù)據(jù)時,若觀測點過于密集,那么數(shù)據(jù)則會表現(xiàn)出函數(shù)性特征,采用該種分析法時,需要將數(shù)據(jù)作為獨立項進行分析,不能將其看作數(shù)據(jù)點序列.該種分析方式最早由一位加拿大學者提出,在提出伊始,強調(diào)采用現(xiàn)代緊密數(shù)據(jù)系統(tǒng)來獲取數(shù)據(jù),在獲取數(shù)據(jù)時,需要將其作為動態(tài)概念,并不能將其作為靜態(tài)概念,如果采用傳統(tǒng)分析法就難以提升分析的準確性,因此,就需要進一步來擴展分析方法.近年來,很多學者開始對函數(shù)性數(shù)據(jù)進行了深入的分析,但是,這一技術(shù)依然處在初級發(fā)展階段,還需要進行深入的研究.
關(guān)于函數(shù)性數(shù)據(jù)x函數(shù)形式,需要將數(shù)據(jù)假定為是一種連續(xù)產(chǎn)生的過程,但是在實際觀測過程中,很難得到離散性數(shù)據(jù),實際觀測的數(shù)據(jù)也常常含有噪聲,因此,在接收到觀測數(shù)據(jù)之后,需要對樣本開展函數(shù)擬合,這種擬合方式是多種多樣的,常用的有插值法與平滑法.若接收到的觀測數(shù)據(jù)沒有誤差,即可使用插值法進行擬合;如果接收的數(shù)據(jù)存在誤差,就需要使用平滑法進行擬合.
2.函數(shù)性數(shù)據(jù)主成分分析
在實際應(yīng)用過程中,觀測數(shù)據(jù)常常存在著比樣本量大的情況,如果未進行處理就直接分析,那么是無法得出理想的分析解決的.為了解決這一問題,可以使用兩種方法,即將觀測時間區(qū)域減少或者偏最小二乘,如果變量多重共線性嚴重,使用該種分析法雖然能夠有效解決問題,但是卻存在很多噪聲.在遇到該種情況時,即可使用偏最小二乘法來進行回歸建模.
函數(shù)性數(shù)據(jù)樣本協(xié)方差矩陣是一種函數(shù)模式,常常會產(chǎn)生高維協(xié)方差矩陣,該種矩陣表示對變量實施了重復(fù)性檢測,且每次得到的數(shù)據(jù)都生成了函數(shù)數(shù)據(jù).在特征方程上,可以使用如下的表達方式:
三、函數(shù)性共同主成分
共同主成分已經(jīng)在形態(tài)進化工作中得到了廣泛的應(yīng)用,分析共同主成分能夠有效解決共同主成分結(jié)構(gòu)與協(xié)方差矩陣比例等問題,一般情況下,在建立好矩陣之后需要使用KL展開式進行分析,為了得到函數(shù)結(jié)構(gòu)與動態(tài)特征,可以使用函數(shù)主成分與因子荷載分布來進行確定.在應(yīng)用KL展開式時,需要應(yīng)用到相互正交函數(shù),KL展開式有著理想的收斂性,在展開其他類型時,也可以得出很好的效果.采用該種方法之后,即可將問題簡單化,但是由于因子載荷之間存在一定的差異,就需要對函數(shù)性數(shù)據(jù)主成分進行相應(yīng)的驗證.
四、結(jié) 語
綜上所述,函數(shù)性數(shù)據(jù)有效豐富了數(shù)據(jù)分析領(lǐng)域,為解決數(shù)據(jù)問題提供了強有力的支撐.該種技術(shù)屬于探索性技術(shù),對函數(shù)通特征描述與特征提取到起到了理想的成效,但是,由于各種因素的影響,函數(shù)性數(shù)據(jù)主成分分析只能夠解決單樣本問題,難以解決兩樣本以上的問題,因此,在使用該種問題進行分析時,還需要綜合各類因素解決推斷與檢驗的難題.