葉瑞松
(汕頭大學(xué) 數(shù)學(xué)系, 廣東 汕頭515063)
在概率論與數(shù)理統(tǒng)計(jì)的教學(xué)中,兩個(gè)一維連續(xù)型隨機(jī)變量的函數(shù)的分布及其相關(guān)的概率計(jì)算均比較復(fù)雜.很多大學(xué)生對(duì)這部分內(nèi)容的學(xué)習(xí)常常理不清頭緒,普遍不能夠很好地掌握這部分內(nèi)容,學(xué)習(xí)費(fèi)力,效率不佳,可以說(shuō)是事倍功半,從而導(dǎo)致失去進(jìn)一步學(xué)習(xí)的興趣;對(duì)數(shù)學(xué)專業(yè)的學(xué)生來(lái)說(shuō),也將影響其繼續(xù)學(xué)習(xí)后續(xù)隨機(jī)數(shù)學(xué)的相關(guān)課程.這其中的原因主要有兩個(gè):① 兩個(gè)一維連續(xù)型變量的函數(shù)的分布及其概率的計(jì)算過(guò)程涉及較為復(fù)雜的二重積分計(jì)算, 包括積分區(qū)域的不規(guī)則,二次積分上下限的確定,累次積分的準(zhǔn)確計(jì)算等問(wèn)題.②傳統(tǒng)教材上的例子多數(shù)脫離實(shí)際,是純粹理想的數(shù)學(xué)構(gòu)造,學(xué)生在學(xué)習(xí)過(guò)程未能切身體會(huì)其實(shí)實(shí)在在的應(yīng)用背景,學(xué)習(xí)上提不起興趣[1-4].
筆者根據(jù)多年在信號(hào)、圖像信息領(lǐng)域中經(jīng)常碰到兩幅圖像信息或兩個(gè)信號(hào)之間的求和模運(yùn)算的實(shí)際問(wèn)題,發(fā)現(xiàn)研究?jī)蓚€(gè)一維隨機(jī)變量X,Y之和的模函數(shù)Z=mod(X+Y,L)的分布及其概率計(jì)算,無(wú)論在理論上還是應(yīng)用中均很有意義[5].這個(gè)函數(shù)在教材中是未作介紹的,但實(shí)際上這個(gè)函數(shù)在圖像信息加密和編碼中均發(fā)揮了很重要的作用,對(duì)這個(gè)函數(shù)的分布的研究很有必要,所得的結(jié)果可以用來(lái)指導(dǎo)圖像信息加密和編碼的應(yīng)用研究.這是對(duì)概率論教材中例子的很好補(bǔ)充.由于該函數(shù)具有很強(qiáng)的應(yīng)用背景,對(duì)工科學(xué)生來(lái)講,能讓他們明白該函數(shù)應(yīng)用的領(lǐng)域,了解該函數(shù)的應(yīng)用價(jià)值,這對(duì)提高他們進(jìn)一步學(xué)習(xí)概率統(tǒng)計(jì)的興趣,有很好的激勵(lì)作用.
目前大多書(shū)概率統(tǒng)計(jì)的教科書(shū)對(duì)兩個(gè)隨機(jī)變量的和函數(shù)的分布問(wèn)題均有介紹,但是這個(gè)和函數(shù)的分布在應(yīng)用中需要改造才能加以應(yīng)用[6-8].本文針對(duì)圖像加密領(lǐng)域中兩個(gè)一維隨機(jī)變量和的模函數(shù),分別對(duì)連續(xù)型和離散型的情況進(jìn)行討論.雖然在工程應(yīng)用中碰到的隨機(jī)變量問(wèn)題均是離散型的,但是也有必要對(duì)其連續(xù)型的情況做理論上的探討,進(jìn)一步提升學(xué)生的數(shù)學(xué)理論素養(yǎng).論文從理論上證明了兩種情況下的分布函數(shù)的相關(guān)結(jié)果,介紹了該函數(shù)在圖像信息安全領(lǐng)域的一個(gè)應(yīng)用,并用數(shù)值例子驗(yàn)證了相關(guān)的理論結(jié)果.
首先介紹模函數(shù)mod(s,t),該函數(shù)是一個(gè)二元函數(shù),當(dāng)兩個(gè)自變量均是整數(shù)時(shí),模函數(shù)就是求余數(shù).當(dāng)兩個(gè)變量是一般的實(shí)數(shù)時(shí),表示取模,返回余數(shù),具體地講,就是將s寫(xiě)成t與一個(gè)整數(shù)k的乘積和一個(gè)落在[0,t)之間的余數(shù)之和的形式s=kt+r, 那么mod(s,t)的函數(shù)值就是r.將這個(gè)模函數(shù)應(yīng)用到隨機(jī)變量的場(chǎng)合,引進(jìn)兩個(gè)一維隨機(jī)變量X,Y之和的模函數(shù),這是對(duì)傳統(tǒng)教材上的兩個(gè)隨機(jī)變量的和函數(shù)的一個(gè)推廣.
一般灰度圖像的亮度值的范圍在理論上均是歸一化為區(qū)間[0,1),所以本文的模函數(shù)中的模t一般設(shè)為1, 從而函數(shù)值的值域也是[0,1).一般的灰度圖像的亮度值可以取值0, 所以本文所說(shuō)的服從均勻分布的隨機(jī)變量在取值0時(shí),其概率或概率密度與一些教材上的定義稍有不同, 不同之處在于隨機(jī)變量取值0可以具有正的概率或概率密度.如果兩個(gè)隨機(jī)變量X,Y均是區(qū)間[0,1)上的均勻分布,將有下面的定理1.
定理1假設(shè)連續(xù)型隨機(jī)變量X,Y相互獨(dú)立,均服從區(qū)間[0,1)上的均勻分布,即X,Y~U[0,1).則Z=mod(X+Y,1)的分布也是U[0,1).
圖1 函數(shù)Z=mod(X+Y,1)的分布 函數(shù)計(jì)算示意圖
證由于X,Y相互獨(dú)立,且服從相同的均勻分布U[0,1),其概率密度函數(shù)為
所以二維隨機(jī)變量(X,Y)的聯(lián)合概率密度函數(shù)為
而Z=mod(X+Y,1)的取值在[0,1),假設(shè)Z的分布函數(shù)為F(z),則
(i)對(duì)任意的z≥1,F(xiàn)(z)=P(Z≤z}=1;
(ii)對(duì)任意的z<0,F(xiàn)(z)=P(Z≤z}=0;
(iii)對(duì)任意的0≤z<1,
F(z)=P(Z≤z}=P{mod(X+Y,1)≤z}=P{0≤X+Y≤z}+P{1≤X+Y≤1+z}
其中,當(dāng)0≤z<1時(shí),分布函數(shù)的計(jì)算可以參看圖1. 從上面計(jì)算所得知道Z~U[0,1).
將隨機(jī)變量離散化,得到兩個(gè)隨機(jī)變量和的模函數(shù)的離散型問(wèn)題,其結(jié)果可以用到數(shù)字圖像的加密領(lǐng)域中設(shè)計(jì)兩幅圖像和的模函數(shù).模函數(shù)以及和函數(shù)的變量均是整數(shù),所以有針對(duì)性地選取模為2的冪次數(shù)2m,其中m為某一個(gè)正整數(shù).具體的應(yīng)用場(chǎng)合就是數(shù)字圖像,一幅灰度圖像的亮度值可以用m比特的整數(shù)來(lái)表示,m比特的整數(shù)隨機(jī)變量總共可表示2m個(gè)不同的值{0,1,2,…,2m-1},也就是說(shuō),如果隨機(jī)變量X,Y表示m比特的圖像的亮度,其取值范圍就是{0,1,2,…,2m-1}. 比如m=8比特的數(shù)字圖像,有28=256個(gè)不同灰度層次.定理1的離散型版本即是下面的定理2.
定理2假設(shè)離散型隨機(jī)變量X,Y相互獨(dú)立,服從相同的均勻分布:
X(Y)01…2m-1pk2-m2-m…2-m
則Z=mod(X+Y,2m)的分布和X,Y的分布相同.
證Z=mod(X+Y,2m)的取值范圍為{0,1,2,…,2m-1},所以要得到其分布律,只要計(jì)算0≤k≤2m-1時(shí),對(duì)應(yīng)的概率P(Z=k}:
P(Z=k}=P{mod(X+Y,2m)=k}=P{X+Y=k}+P{X+Y=2m+k}
=(2-m)2×(k+1)+(2-m)2×(2m-1-k)=2-m.
所以Z=mod(X+Y,2m)服從和X相同的分布.
到此,得到兩個(gè)一維相互獨(dú)立的均勻分布隨機(jī)變量和的模函數(shù)的相關(guān)結(jié)論.在實(shí)際應(yīng)用場(chǎng)合,均勻分布一般對(duì)應(yīng)類(lèi)似噪聲的信號(hào)、圖像信息.服從均勻分布的隨機(jī)變量所表示的圖像一般是一幅具有明確內(nèi)容的明文圖像經(jīng)過(guò)加密而得到的密文圖像.在應(yīng)用中,很自然會(huì)碰到一個(gè)問(wèn)題,就是一幅具有自然內(nèi)容的明文圖像的加密問(wèn)題,其中一種辦法就是改變圖像每個(gè)像素的亮度值,從而遮掩了自然圖像的內(nèi)容.密碼學(xué)要求密文圖像要接近均勻分布,越逼近均勻分布,加密性能越好.所以有必要對(duì)這個(gè)問(wèn)題進(jìn)行探討,如何實(shí)現(xiàn)這個(gè)加密要求的理想效果,理論上有下面的定理3. 定理3中隨機(jī)變量X表示某一幅模擬圖像的連續(xù)型隨機(jī)變量,其灰度值的范圍已經(jīng)歸一化到單位區(qū)間[0,1),所以其概率密度函數(shù)只是在[0,1)取值,而在[0,1)外的概率密度均為0.
定理3假設(shè)連續(xù)型隨機(jī)變量X,Y相互獨(dú)立,Y~U[0,1),X的概率密度函數(shù)為
則Z=mod(X+Y,1)的分布也是U[0,1).
證Z的取值范圍為[0,1),設(shè)Z的分布函數(shù)為F(z),則
(i)對(duì)任意的z≥1,F(xiàn)(z)=P(Z≤z}=1;
(ii)對(duì)任意的z<0,F(xiàn)(z)=P(Z≤z}=0;
(iii)對(duì)任意的0≤z<1,
F(z)=P(Z≤z}=P{mod(X+Y,1)≤z}=P{0≤X+Y≤z}+P{1≤X+Y≤1+z}.
由于(X,Y)的聯(lián)合概率密度函數(shù)為
和定理1一樣,計(jì)算當(dāng)0≤z<1時(shí)的分布函數(shù),可以參看圖1,但是這里的計(jì)算不能使用Ω1,Ω2的面積作為概率值,需要計(jì)算其累次積分.
F(z)=P(Z≤z}=P{(X,Y)∈Ω1}+P{(X,Y)∈Ω2}
所以和定理1結(jié)論一樣,Z~U[0,1).
同樣將定理3中的隨機(jī)變量離散化,應(yīng)用到數(shù)字圖像處理的領(lǐng)域中,也有相應(yīng)的離散型的定理4.
定理4假設(shè)離散型隨機(jī)變量X,Y相互獨(dú)立,X服從離散均勻分布:
X01…2m-1pk2-m2-m…2-m
Y的分布律為
Y01…2m-1pkp0p1…p2m-1
則Z=mod(X+Y,2m)的分布和X的分布相同,也是離散均勻分布.
證Z=mod(X+Y,2m)的取值范圍為{0,1,2,…,2m-1},當(dāng)0≤k≤2m-1時(shí),
P(Z=k}=P{mod(X+Y,2m)=k}=P{X+Y=k}+P{X+Y=2m+k}
=2-m×pk+2-m×pk-1+…+2-m×p0+2-m×p2m-1+…+2-m×pk+1
證明完畢.
更一般地,如果服從均勻分布的隨機(jī)變量X與另一個(gè)服從任意分布的隨機(jī)變量Y相互獨(dú)立的話,則可以證明X與Y之和的模函數(shù)也一定服從X同樣的分布,即有下面的定理5.
定理5假設(shè)隨機(jī)變量X,Y相互獨(dú)立,X~U[0,b),b>0,Y為任意分布的隨機(jī)變量,則Z=mod(X+Y,b)的分布也是U[0,b),且與Y相互獨(dú)立.
證該定理的證明分兩步完成.
① 對(duì)任意常數(shù)y,證明Z=mod(X+y,b)~U[0,b).假設(shè)y=kb+a,其中k為整數(shù),而0≤a (i) 對(duì)任意的z≥b,F(xiàn)(z)=P(Z≤z}=1; (ii) 對(duì)任意的z<0,F(xiàn)(z)=P(Z≤z}=0; (iii) 對(duì)任意的0≤z F(z)=P(Z≤z}=P{mod(X+a,b)≤z}=P{0≤X+a≤z}+P{b≤X+a≤b+z}. 當(dāng)a≤z F(z)=P{0≤X≤z-a}+P{b-a≤X≤b-a+z}