摘要:本文首先對統(tǒng)計流形的基本幾何量及其統(tǒng)計意義進(jìn)行闡述,探究了隨機(jī)游走模型度量平坦的一個條件,并計算出了J-散度。
關(guān)鍵詞:統(tǒng)計流形;隨機(jī)游走;散度
統(tǒng)計學(xué)中的微分幾何方法已經(jīng)成為統(tǒng)計學(xué)的令人矚目的分支,在統(tǒng)計推斷、隨機(jī)分布控制等領(lǐng)域有著成功的應(yīng)用。Karl Pearson在1905年第一次提出了random walk,隨機(jī)游走是由一系列隨機(jī)步伐所形成的的活動模型。如今隨機(jī)游走模型已被應(yīng)用于諸多領(lǐng)域:生態(tài)學(xué)、經(jīng)濟(jì)學(xué)、心理學(xué)、計算機(jī)科學(xué)等。隨機(jī)游走模型的幾何結(jié)構(gòu)屬于信息幾何的研究領(lǐng)域,是應(yīng)用幾何的新領(lǐng)域。應(yīng)用信息幾何的方法去研究隨機(jī)游走模型的幾何結(jié)構(gòu)可以更加直觀、系統(tǒng)地把握隨機(jī)游走模型的統(tǒng)計分布性質(zhì),為其在更多領(lǐng)域的的應(yīng)用帶來了新的研究方法。
1 統(tǒng)計流形的概念
對于統(tǒng)計分布流形 ,其中 為歐氏空間 中的開集, 是密度函數(shù),我們引入Fisher信息矩陣:
這里E為數(shù)學(xué)期望.這樣便在S上引入了黎曼度量,稱為Fisher度量。其Levi-Civita聯(lián)絡(luò) 系數(shù)為:
進(jìn)一步可定義 聯(lián)絡(luò)
其中
統(tǒng)計流形 的黎曼曲率張量為
令 ,則
里奇曲率張量 為:
若統(tǒng)計流形(M,g)上一對無撓的仿射聯(lián)絡(luò) 和 滿足:
則稱 和 是關(guān)于g的對偶聯(lián)絡(luò)。顯然 和 是一對對偶聯(lián)絡(luò)。
2 散度函數(shù)
散度函數(shù)是刻畫兩個統(tǒng)計分布差異程度的量,其定義為:
定義2.1 在局部坐標(biāo)系下,散度函數(shù)D :M×M→R定義為一個光滑函數(shù),滿足 :
(1) , ? ∈ V 等式成立當(dāng)且僅當(dāng) ;
(2)
(3) 是正定的
引理2.1(Eguchi,1983).散度函數(shù)可導(dǎo)出一對無撓的仿射聯(lián)絡(luò)滿足:
對于兩個給定的臨近的密度函數(shù), 和 ,我們定義J-散度為:
運(yùn)用泰勒展式可以得到:
即J-散度函數(shù)是距離微元的平方。
3 隨機(jī)游走模型
隨機(jī)游走模型的概率密度函數(shù)為:
,
的期望和方差分別為: .
運(yùn)用公式 可以得到 信息陣為:
協(xié)方差矩陣 .
相應(yīng)的黎曼聯(lián)絡(luò)系數(shù):
由黎曼曲率張量: 得:
其余分量為0
于是我們得到:
定理3.1 隨機(jī)游走模型是平坦統(tǒng)計結(jié)構(gòu)當(dāng)且僅當(dāng)
類似地可以得到里奇曲率張量由里奇曲率張量為:
.
4 隨機(jī)游走模型上的J-散度
定理4.1 隨機(jī)游走模型的J-散度(2.1)滿足下列方程:
證明:
而
由于密度函數(shù)滿足 故可得到
同理可得
于是 證畢。
參考文獻(xiàn):
[1]韋博成.統(tǒng)計推斷與微分幾何[M].清華大學(xué)出版社,1983.
[2]ZHANG,Jun: A note on curvature ofαconnectoins ona statistical anifold[J]. Annals of Institute of Statistical Mathematics,2006.
[3]何會民.基于隨機(jī)游走模型和KL-divergence的聚類算法[J].計算機(jī)工程,2008.