李珺
摘 要:隨著我國進(jìn)入到大數(shù)據(jù)時(shí)代以來,需要描述和分析的數(shù)據(jù)種類多樣化,數(shù)據(jù)量急劇增加,而為了能夠準(zhǔn)確展示出各數(shù)據(jù)的具體特征,并深刻把握數(shù)據(jù)之間的變化規(guī)律和數(shù)據(jù)來源等信息內(nèi)容,人們通常會(huì)選擇使用函數(shù)型數(shù)據(jù)分析法,即通過將原本離散的數(shù)據(jù)轉(zhuǎn)化成函數(shù)形式,從而通過分析函數(shù)型數(shù)據(jù)探索數(shù)據(jù)之間的關(guān)聯(lián)性?;诖耍疚膶⑼ㄟ^對(duì)幾種函數(shù)型數(shù)據(jù)分析方法進(jìn)行簡要介紹,從動(dòng)作識(shí)別和CPI分析兩個(gè)方面對(duì)函數(shù)型數(shù)據(jù)分析法的實(shí)際運(yùn)用進(jìn)行初步探究。
關(guān)鍵詞:函數(shù)型數(shù)據(jù) 數(shù)據(jù)分析 主成分
引言
作為一種非參數(shù)統(tǒng)計(jì)的分析方法,函數(shù)型數(shù)據(jù)分析可以擺脫以往統(tǒng)計(jì)方法對(duì)于參數(shù)的限制,其通過重點(diǎn)研究變化的曲線軌跡,在直接打包處理海量數(shù)據(jù)的基礎(chǔ)之上,立足全局的高度對(duì)數(shù)據(jù)中的規(guī)律和關(guān)系進(jìn)行有效反映,進(jìn)而有利于幫助人們解決和處理大量數(shù)據(jù)的描述與分析問題。
一、函數(shù)型數(shù)據(jù)分析的常用方法
1.方差分析
在函數(shù)型數(shù)據(jù)的方差分析當(dāng)中,通過將某因素第j類影響下的第i個(gè)觀測(cè)函數(shù)設(shè)為,其中j=1,2,3,……J而i=1,2,3,……n,則可以用:這一模型進(jìn)行表示。在這一模型當(dāng)中, 則為共同均值函數(shù),而和則分別表示第j個(gè)水平影響函數(shù)以及誤差函數(shù)。通過對(duì)其進(jìn)行進(jìn)一步簡化后可以得到: 在對(duì)殘差平方和進(jìn)行定義之后,通過利用經(jīng)典方差分析以及數(shù)值計(jì)算法可以獲得相應(yīng)的參數(shù)函數(shù)[1]。此時(shí)通過利用光滑參數(shù)可以對(duì)參數(shù)函數(shù)平滑度進(jìn)行有效控制,假設(shè)兩個(gè)基函數(shù)系統(tǒng)與均能夠線性表出Y(t)和β(t),則通過對(duì)模型進(jìn)行變換后即可得到:
2.聚類分析
所謂聚類分析指的就是通過將數(shù)據(jù)按照其具體類別進(jìn)行明確劃分,類別相近的數(shù)據(jù)將被統(tǒng)一劃分至一個(gè)簇當(dāng)中,簇與簇之間的對(duì)象則具有明顯的差異性。通過搜集整理大量數(shù)據(jù)信息并對(duì)其進(jìn)行聚類分析,能夠有效掌握各數(shù)據(jù)源之間的內(nèi)在關(guān)聯(lián)。而在對(duì)函數(shù)相似性進(jìn)行衡量的過程中,本文則主要使用歐式距離這一指標(biāo)。基于函數(shù)型數(shù)據(jù)下的歐氏距離中,函數(shù)和之間的歐式距離表示為:
通過對(duì)其進(jìn)行簡化之后即可對(duì)兩個(gè)曲線間的歐式距離進(jìn)行精確計(jì)算,但由于此種方式下計(jì)算量相對(duì)較大,因此在函數(shù)型數(shù)據(jù)聚類分析當(dāng)中,可以將點(diǎn)與點(diǎn)之間的歐式距離與之間的差值設(shè)定為一個(gè)常數(shù),因此對(duì)其進(jìn)行簡化變形之后可以得到:
3.主成分分析
在函數(shù)型數(shù)據(jù)分析當(dāng)中,主成分分析指的就是通過將變量等同于一種函數(shù)形式,并將樣本協(xié)方差矩陣轉(zhuǎn)換成函數(shù)形式,此時(shí)觀測(cè)矩陣重復(fù)N次觀測(cè)統(tǒng)一變量,從而其在每一次觀測(cè)過程中獲得的數(shù)據(jù)均可以構(gòu)成一個(gè)函數(shù)型數(shù)據(jù),該函數(shù)型數(shù)據(jù)可以用表示[2]。假設(shè)在區(qū)間[a,b]當(dāng)中有任意一組觀測(cè)函數(shù),區(qū)間平方可積函數(shù)為,在的情況下取最值,則其第一主成分系數(shù)函數(shù)為,第一主成分得分便為。其中權(quán)重函數(shù)就是該函數(shù)型主成分分析當(dāng)中的特征
函數(shù)。
二、函數(shù)型數(shù)據(jù)分析方法的實(shí)際運(yùn)用
1.動(dòng)作識(shí)別
在將函數(shù)型數(shù)據(jù)分析法運(yùn)用在動(dòng)作識(shí)別的過程中,首先需要構(gòu)建函數(shù)型數(shù)據(jù)曲線x(t),令,其中β(t)為函數(shù)型回歸光滑因子。根據(jù)相關(guān)研究資料顯示,研究人員通過在依次在人體的左右手腕部以及左右腳踝和腰部位置上綁定傳感器,并通過將采樣頻率恒定在30Hz,隨后其通過對(duì)13名男性和7名女性采集者進(jìn)行動(dòng)作采集,最終獲得了1300個(gè)樣本。由于在此次試驗(yàn)當(dāng)中總共設(shè)置了五個(gè)測(cè)量單元,因此根據(jù)其在研究當(dāng)中羅列出的樣本函數(shù)矩陣可知,當(dāng)采樣頻率控制在30Hz時(shí),傳感器序列當(dāng)中選取的45個(gè)點(diǎn)均獲取了較為精準(zhǔn)的實(shí)驗(yàn)結(jié)果,平均每1.5秒便會(huì)完成一個(gè)行為動(dòng)作。因此研究人員按通過將人的運(yùn)動(dòng)周期時(shí)間設(shè)定為1.5秒,并利用函數(shù)型數(shù)據(jù)分析中的歐氏距離聚類分析方法,將周期數(shù)據(jù)長度設(shè)定為45個(gè)點(diǎn),并隨機(jī)從樣本函數(shù)矩陣當(dāng)中選擇某一元素函數(shù),將其作為周期的起始點(diǎn),也就是人在運(yùn)動(dòng)過程中腳部抬起的最高點(diǎn)。通過其給出的相關(guān)數(shù)據(jù)對(duì)比示意圖可以得知,在采用函數(shù)型數(shù)據(jù)分析方法下,研究人員不僅能夠有效完成對(duì)人體動(dòng)作的識(shí)別,同時(shí)也可以較為精確地周期提取運(yùn)動(dòng)數(shù)據(jù)函數(shù)。
2.CPI分析
消費(fèi)者物價(jià)指數(shù)本身就是一種非周期性的函數(shù)數(shù)據(jù),因此通過采用函數(shù)型數(shù)據(jù)分析法,同樣能夠有效幫助人們完成對(duì)消費(fèi)者物價(jià)指數(shù)的深入分析。根據(jù)曹建新(2017)等人的研究可知,其通過選擇2014年至2017年上半年的豬肉價(jià)格同比指數(shù),發(fā)現(xiàn)隨著季節(jié)的變化,豬肉價(jià)格指數(shù)也隨之出現(xiàn)相應(yīng)變動(dòng)。其在研究中指出,通過對(duì)選取的消費(fèi)價(jià)格數(shù)據(jù)進(jìn)行擬合之后,擬合曲線比較光滑,因此證明曲線中存在一階和二階導(dǎo)數(shù)[3]。其隨后通過將橫縱坐標(biāo)分別設(shè)置為函數(shù)中的一階導(dǎo)數(shù)和二階導(dǎo)數(shù),在重新繪制相平面圖后,其發(fā)現(xiàn)代表速度的一階導(dǎo)數(shù)和代表加速度的二階導(dǎo)數(shù)之間具有交替變化的情況。因此在函數(shù)型數(shù)據(jù)分析法的指導(dǎo)下,曹建新等人首先通過對(duì)變動(dòng)曲線進(jìn)行擬合,并將勻滑函數(shù)曲線中相對(duì)應(yīng)函數(shù)值,從原始數(shù)據(jù)序列當(dāng)中排除,以獲得真正的季節(jié)變動(dòng)成分以及誤差項(xiàng),隨后通過借助擬合基函數(shù)的方式,完成擬合季節(jié)變動(dòng)成分,進(jìn)而發(fā)現(xiàn)豬肉價(jià)格每三到四年或進(jìn)入到一個(gè)波動(dòng)變化時(shí)期,但隨后價(jià)格將會(huì)逐漸回落至正常狀態(tài),而后再次進(jìn)入到波動(dòng)變化時(shí)期。根據(jù)其繪制的函數(shù)曲線可知,豬肉價(jià)格指數(shù)波動(dòng)變化幅度較大的情況下,季節(jié)變動(dòng)幅度也較大,反之季節(jié)變動(dòng)幅度則相對(duì)較小。政府以及相關(guān)部門通過利用函數(shù)型數(shù)據(jù)分析法對(duì)消費(fèi)價(jià)格指數(shù)等信息數(shù)據(jù)進(jìn)行深入分析,對(duì)其決策決議的制定具有極大的參考意義。
結(jié)語
本文主要通過對(duì)幾種函數(shù)型數(shù)據(jù)分析法進(jìn)行簡要介紹,并從消費(fèi)者價(jià)格指數(shù)和人體動(dòng)作識(shí)別兩個(gè)方面,對(duì)函數(shù)型數(shù)據(jù)分析法目前的實(shí)際應(yīng)用進(jìn)行分析,證明了函數(shù)型數(shù)據(jù)分析法對(duì)于處理和解決海量數(shù)據(jù)信息的優(yōu)越性。相信隨著研究層次的不斷加深,未來函數(shù)型數(shù)據(jù)分析法的種類和應(yīng)用領(lǐng)域還將得到進(jìn)一步發(fā)展。
參考文獻(xiàn)
[1]曲愛麗.基于函數(shù)型數(shù)據(jù)分析的滬深權(quán)證市場(chǎng)研究一以蝶式權(quán)證為例[D].廈門:廈門大學(xué).2014.
[2]嚴(yán)明義.函數(shù)性數(shù)據(jù)的統(tǒng)計(jì)分析:思想、方法和應(yīng)用.統(tǒng)計(jì)研究[J]. 2017,11(02):87-94.
[3]曹建新,劉宇峰.廣東省豬肉價(jià)格上漲對(duì)消費(fèi)價(jià)格指數(shù)的影響分析[J].粵港澳市場(chǎng)與價(jià)格.2017 ,33(07) :19-21.endprint