全 然
(河南工業(yè)大學(xué)理學(xué)院,鄭州450001)
同濟(jì)大學(xué)數(shù)學(xué)系編的高等數(shù)學(xué)是國(guó)內(nèi)大部分理工科非數(shù)學(xué)本科專(zhuān)業(yè)采用的經(jīng)典教材[1],華東師范大學(xué)數(shù)學(xué)科學(xué)學(xué)院編的數(shù)學(xué)分析是國(guó)內(nèi)大部分?jǐn)?shù)學(xué)本科專(zhuān)業(yè)采用的經(jīng)典教材[2],兩套教材都對(duì)函數(shù)的凸性進(jìn)行了定義.文獻(xiàn)[1]基于區(qū)間上任意兩點(diǎn)的中點(diǎn)來(lái)定義函數(shù)的凸性,即所謂中點(diǎn)凸,而文獻(xiàn)[2]則是基于任意兩點(diǎn)的凸組合來(lái)定義函數(shù)的凸性.筆者在講授高等數(shù)學(xué)[1]時(shí),一直認(rèn)為兩種定義是等價(jià)的,但并沒(méi)有去深究在什么條件下等價(jià),為什么等價(jià).
近來(lái),筆者想探究這兩種凸性定義是否等價(jià)的愿望愈發(fā)強(qiáng)烈,于是對(duì)兩種凸性的定義進(jìn)行了認(rèn)真研究.為了討論方便,如果沒(méi)有特別指明,下文所述區(qū)間I既可以是閉區(qū)間也可以是開(kāi)區(qū)間,區(qū)間I0表示去掉區(qū)間I的端點(diǎn)后形成的開(kāi)區(qū)間,如果I是開(kāi)區(qū)間,則I0=I.研究發(fā)現(xiàn),詹森(Jensen)最早定義了函數(shù)的凸性并對(duì)其進(jìn)行了系統(tǒng)研究[3-8],該定義具體如下.
定義1[3-8]設(shè)函數(shù)f(x)在區(qū)間I上有定義,如果對(duì)I上任意兩點(diǎn)x1,x2恒有
(1)
則稱(chēng)f(x)在區(qū)間I上是J凸的,或者稱(chēng)f(x)在區(qū)間I上是J凸函數(shù).
文獻(xiàn)[2]中凸性定義是國(guó)內(nèi)外大多數(shù)文獻(xiàn)所采用的定義[2,5-9],具體如下.
定義2[2]設(shè)f(x)在區(qū)間I上有定義,如果對(duì)I上任意兩點(diǎn)x1,x2和任意實(shí)數(shù)λ∈(0,1)恒有
f(λx1+(1-λ)x2)≤λf(x1)+(1-λ)f(x2),
(2)
則稱(chēng)f(x)在區(qū)間I上是凸的,或者稱(chēng)f(x)在區(qū)間I上是凸函數(shù).
從表面形式上看,以上兩種定義并不一樣.而且易知凸函數(shù)一定是J凸函數(shù),反之未必成立.通過(guò)進(jìn)一步探究高等數(shù)學(xué)和數(shù)學(xué)分析教材[1]、[2]、[10-12]發(fā)現(xiàn):
(i) 文獻(xiàn)[1]和[10]的凸性定義類(lèi)似定義1,利用式(1)進(jìn)行定義,而文獻(xiàn)[2]、[11]和[12]的凸性定義類(lèi)似定義2,利用式(2)進(jìn)行定義;
(ii) 文獻(xiàn)[1]和[12]要求函數(shù)具有連續(xù)性,而文獻(xiàn)[2]、[10]和[11]則沒(méi)有連續(xù)性的要求.
所以筆者的“今惑”是:
(i) 定義1和定義2這兩種凸性定義是否等價(jià),為什么?
(ii) 在什么條件下這兩種凸性定義等價(jià)?
本文基于筆者自己的“今惑”和相關(guān)參考文獻(xiàn),研究梳理這兩種凸性定義的“前世”:
(i) 兩種凸性定義的早期發(fā)展歷史;
(ii) 兩種凸性定義的性質(zhì)以及它們等價(jià)需要的條件.
自從函數(shù)凸性在19世紀(jì)末20世紀(jì)初被提出并定義之后[3-8],便得到了廣泛研究[13-27],時(shí)至今日,函數(shù)凸性的定義更是達(dá)到了十幾種之多[16-18],定義1和定義2這兩種凸性定義的等價(jià)性也是許多文獻(xiàn)研究的重要內(nèi)容.一方面,由于開(kāi)區(qū)間上的凸函數(shù)連續(xù),而開(kāi)區(qū)間上的J凸函數(shù)不一定連續(xù)[5,28],這意味著函數(shù)兩種凸性定義并不等價(jià).另一方面,易知滿足定義1的函數(shù)不一定滿足定義2,但滿足定義2的函數(shù)一定滿足定義1.這意味著滿足定義1的函數(shù)即J凸函數(shù)更廣泛,所需條件更弱.所以主要是在定義1上增加條件,進(jìn)而討論證明定義1和定義2這兩種凸性定義等價(jià).這些增加的條件大致可以分為四類(lèi):第一類(lèi),函數(shù)具有連續(xù)性;第二類(lèi),函數(shù)具有可微性;第三類(lèi),函數(shù)具有半連續(xù)性,包括上半連續(xù)和下半連續(xù);第四類(lèi),函數(shù)具有有界性.由定義2可以證明凸函數(shù)在開(kāi)區(qū)間內(nèi)連續(xù)[2],又由于連續(xù)性是許多函數(shù)都具有的一個(gè)基本性質(zhì),所以大多數(shù)文獻(xiàn)都是直接或間接利用函數(shù)的連續(xù)性[5-8],[16-21]來(lái)討論證明兩種凸性定義的等價(jià)性.文獻(xiàn)[16]以及[19-21]又進(jìn)一步基于函數(shù)的可微性來(lái)討論證明兩種凸性定義的等價(jià)性;文獻(xiàn)[22-25]是在半連續(xù)條件下討論證明兩種凸性定義的等價(jià)性;文獻(xiàn)[7]、[17-19]則是在有界性條件下討論證明兩種凸性定義的等價(jià)性.當(dāng)然,相當(dāng)多的文獻(xiàn)同時(shí)討論了多種凸性定義的等價(jià)性,而且往往是采用循環(huán)的方式進(jìn)行證明,如文獻(xiàn)[16-18]和[21]分別討論了十三種、八種、十七種和四種凸性定義的等價(jià)性.
下文將通過(guò)研究梳理函數(shù)兩種凸性定義的前世,即(i)兩種凸性定義的早期發(fā)展歷史;(ii)兩種凸性定義的性質(zhì)以及它們等價(jià)需要的條件,以釋筆者的今惑,即(i)兩種凸性定義是否等價(jià),為什么?(ii)在什么條件下這兩種凸性定義等價(jià)?
盡管H?lder、Stolz和Hadamard分別于1889年、1893年和1896年(早于詹森)已經(jīng)研究了函數(shù)的凸性[5,8],但大部分學(xué)者認(rèn)為是詹森在1905和1906年首先定義了函數(shù)的凸性,即定義1,并對(duì)函數(shù)凸性進(jìn)行了系統(tǒng)的研究,詹森還證明了下面的結(jié)論1[3-8].
結(jié)論1[3-4]若f(x)為區(qū)間I上的J凸函數(shù),則對(duì)于任意點(diǎn)x1,…,xn∈I以及任意滿足λ1+…+λn=1的非負(fù)有理數(shù)λ1,…,λn,有
(3)
結(jié)論1的證明可參見(jiàn)文獻(xiàn)[6]和[8].需要指出的是,人們隨后將式(3)推廣為式(2)來(lái)定義函數(shù)凸性[26-27],即定義2,又進(jìn)一步把結(jié)論1推廣為如下結(jié)論.
結(jié)論2[6](i) 函數(shù)f(x)為區(qū)間I上J凸函數(shù)的充要條件是式(3)對(duì)于任意點(diǎn)x1,…,xn∈I以及任意滿足λ1+…+λn=1的非負(fù)有理數(shù)λ1,…,λn均成立;
(ii)f(x)為I上凸函數(shù)的充要條件是式(3)對(duì)于任意點(diǎn)x1,…,xn∈I以及滿足λ1+…+λn=1的任意非負(fù)實(shí)數(shù)λ1,…,λn均成立.
結(jié)論2的證明詳見(jiàn)文獻(xiàn)[6].需要說(shuō)明的是,結(jié)論2的第一部分是一個(gè)充要條件,給出了J凸函數(shù)的一個(gè)等價(jià)命題,而結(jié)論1只是J凸函數(shù)的一個(gè)必要條件,結(jié)論2更強(qiáng);同時(shí),結(jié)論2還給出了凸函數(shù)的一個(gè)等價(jià)形式,甚至有學(xué)者把這個(gè)等價(jià)形式作為凸函數(shù)的定義[6,16,18].有人將式(3)稱(chēng)為詹森不等式[5-6],也有人將式(1)-(3)均稱(chēng)為詹森不等式[26-27].
下面討論兩種凸性定義的相關(guān)性質(zhì).
首先討論凸函數(shù)與連續(xù)的關(guān)系.
結(jié)論3(i) 若函數(shù)f(x)為區(qū)間I上的J凸函數(shù),則其在區(qū)間I的內(nèi)部I0內(nèi)不一定連續(xù);
(ii) 若函數(shù)f(x)為區(qū)間I上的凸函數(shù),則其在I0內(nèi)連續(xù).
需要說(shuō)明的是,第一,文獻(xiàn)[28]構(gòu)造了一類(lèi)J凸函數(shù),并證明其在I0內(nèi)不連續(xù);第二,結(jié)論3中第二個(gè)結(jié)論的證明方法比較多,文獻(xiàn)[2]通過(guò)一個(gè)例題證明了凸函數(shù)在I0內(nèi)任一點(diǎn)處的左、右導(dǎo)數(shù)均存在,從而得到函數(shù)的連續(xù)性,文獻(xiàn)[6]中第4頁(yè)給出了一種基于利普希茨連續(xù)的證明方法來(lái)證明函數(shù)的連續(xù)性,其他證明方法這里就不再一一列舉;第三,閉區(qū)間上的凸函數(shù)不一定連續(xù),如
雖然該函數(shù)在區(qū)間[-1,1]上是凸的,但在該區(qū)間上不連續(xù).
下面結(jié)論4是由詹森首先給出并證明[3-4],說(shuō)明J凸函數(shù)在比較弱的條件下也具有連續(xù)性.
結(jié)論4若函數(shù)f(x)在開(kāi)區(qū)間I內(nèi)為J凸函數(shù)且有上界,則f(x)在I內(nèi)連續(xù).
Bernstein和Doetsch于1915年在更弱的條件下,證明了J凸函數(shù)的連續(xù)性[29],即下面的結(jié)論5.
結(jié)論5若f(x)在開(kāi)區(qū)間I內(nèi)為J凸函數(shù)且在I內(nèi)某一點(diǎn)的鄰域內(nèi)有上界,則其在I內(nèi)連續(xù).
結(jié)論5的詳細(xì)證明可參見(jiàn)文獻(xiàn)[6]和[7].結(jié)論3~5給出了一定條件下(J)凸函數(shù)具有連續(xù)性,其實(shí)在連續(xù)的條件下,兩種凸性定義等價(jià),具體見(jiàn)下面結(jié)論6和結(jié)論7.
結(jié)論6[20]若函數(shù)f(x)在區(qū)間I上連續(xù),則定義1與定義2等價(jià),即兩種凸性定義等價(jià).
結(jié)論7[19]f(x)在區(qū)間I上為凸函數(shù)的充要條件是f(x)在I上為J凸函數(shù)且在I0內(nèi)連續(xù).
結(jié)論6和結(jié)論7的證明分別詳見(jiàn)文獻(xiàn)[20]和[19],兩個(gè)結(jié)論的實(shí)質(zhì)是J凸函數(shù)在增加連續(xù)性的條件下和凸函數(shù)等價(jià).其實(shí),連續(xù)并不是一個(gè)很強(qiáng)的條件,包括初等函數(shù)在內(nèi)的許多函數(shù)都具有連續(xù)性.結(jié)論6和結(jié)論7表明:
結(jié)論8若函數(shù)f(x)在區(qū)間I上連續(xù),則兩種凸性定義等價(jià).
接下來(lái)將討論凸函數(shù)與可微的關(guān)系.由結(jié)論3的第一個(gè)結(jié)論易知,J凸函數(shù)在開(kāi)區(qū)間I內(nèi)的左導(dǎo)數(shù)或右導(dǎo)數(shù)可能不存在,這說(shuō)明J凸函數(shù)的可導(dǎo)性可能較差,但凸函數(shù)的可導(dǎo)性相對(duì)較好,具體見(jiàn)下面的結(jié)論9和結(jié)論10.
結(jié)論9[6,20]設(shè)函數(shù)f(x)為區(qū)間I上的凸函數(shù),則對(duì)于?x∈I0,左右導(dǎo)數(shù)f′-(x),f′+(x)都存在,且f′-(x),f′+(x)均為增函數(shù),f′-(x)≤f′+(x),?x∈I0.
結(jié)論10[6]設(shè)f(x)為開(kāi)區(qū)間I上的凸函數(shù),集合E為f(x)的不可導(dǎo)點(diǎn)構(gòu)成的集合,則E是可數(shù)的,且f′(x)在IE上連續(xù).
結(jié)論9的證明詳見(jiàn)文獻(xiàn)[6]和[20],結(jié)論10的證明詳見(jiàn)文獻(xiàn)[6].需要說(shuō)明的是,Stolz在1893年已經(jīng)證明[8],如果f(x)在區(qū)間I上連續(xù)且滿足式(1),則其在I的任一內(nèi)點(diǎn)處的左右導(dǎo)數(shù)都存在.這是必然的結(jié)果.這是因?yàn)椋鬴(x)在區(qū)間I上連續(xù)且滿足式(1),則說(shuō)明f(x)為區(qū)間I上連續(xù)的J凸函數(shù),從而由結(jié)論7可知f(x)為區(qū)間I上的凸函數(shù),進(jìn)一步由結(jié)論9可知f(x)在I0內(nèi)的左右導(dǎo)數(shù)都存在.
在函數(shù)可導(dǎo)的條件下,可得到如下判斷函數(shù)是否為凸函數(shù)的兩個(gè)結(jié)論.
結(jié)論11[20](i)若f(x)在區(qū)間I上可導(dǎo),則f(x)為I上凸函數(shù)的充要條件是f′(x)在I上單調(diào)遞增;
(ii) 若f(x)在I上二階可導(dǎo),則f(x)為I上凸函數(shù)的充要條件是f″(x)≥0.
結(jié)論12若函數(shù)f(x)在區(qū)間I上可導(dǎo),則定義1與定義2等價(jià),即兩種凸性定義等價(jià).
結(jié)論11的證明詳見(jiàn)文獻(xiàn)[20].也可以這樣理解結(jié)論12,如果函數(shù)f(x)在區(qū)間I上可導(dǎo),則f(x)在區(qū)間I上連續(xù),故由結(jié)論8可知,兩種凸性定義等價(jià),故結(jié)論12正確.
前面討論了在連續(xù)或可微的條件下,兩種凸性定義等價(jià),下面結(jié)論說(shuō)明在更弱的半連續(xù)條件下兩種凸性定義也等價(jià).
結(jié)論13[22-24]若函數(shù)f(x)是區(qū)間I上的上半連續(xù)函數(shù),則兩種凸性定義等價(jià).
結(jié)論14[22-24]若函數(shù)f(x)是區(qū)間I上的下半連續(xù)函數(shù),則兩種凸性定義等價(jià).
結(jié)論15[22-24]函數(shù)f(x)是區(qū)間I上凸函數(shù)的充要條件是f(x)既是I上的J凸函數(shù)又是I上的上半連續(xù)函數(shù).
結(jié)論13~15的證明詳見(jiàn)文獻(xiàn)[22-24].正如文獻(xiàn)[24]所述,由結(jié)論14可知,如果f(x)在區(qū)間I下半連續(xù)且在I上是J凸函數(shù),則f(x)在I上一定是凸函數(shù),從而由結(jié)論15可知f(x)在I上為上半連續(xù)函數(shù),所以f(x)是I上的連續(xù)函數(shù).因此結(jié)論14中的下半連續(xù)函數(shù)這一等價(jià)前提條件可以改為連續(xù)函數(shù),二者是一回事.將結(jié)論13和14合二為一,即為
結(jié)論16若函數(shù)f(x)是區(qū)間I上的上半連續(xù)函數(shù)或下半連續(xù)函數(shù),則兩種凸性定義等價(jià).
最后討論凸函數(shù)與有界的關(guān)系,具體見(jiàn)下面的三個(gè)結(jié)論.
結(jié)論17[19]若函數(shù)f(x)是區(qū)間I上的凸函數(shù),則f(x)在I的任一閉子區(qū)間上有界.
結(jié)論18[19]函數(shù)f(x)是區(qū)間I上凸函數(shù)的充要條件是f(x)既是I上的J凸函數(shù)又在I的任一閉子區(qū)間上有上界.
結(jié)論19若函數(shù)f(x)在區(qū)間I的某一子區(qū)間上有上界,則兩種凸性定義等價(jià).
結(jié)論17和18的證明詳見(jiàn)文獻(xiàn)[19].對(duì)于結(jié)論19,由前面結(jié)論5可知,如果J凸函數(shù)f(x)在區(qū)間I的某一子區(qū)間上有上界,則f(x)在I0內(nèi)連續(xù),從而由結(jié)論7可知f(x)是I上的凸函數(shù),故結(jié)論19正確.
本文系統(tǒng)、全面、深入總結(jié)了兩種凸性定義的早期發(fā)展歷史及已有的一些研究成果;期望幫助對(duì)兩種凸性定義等價(jià)性了解不深入的高校教師及相關(guān)人員更好的了解兩種凸性定義的早期發(fā)展歷史;把握凸函數(shù)的連續(xù)性、可微性、半連續(xù)性和有界性以及在連續(xù)、可微、半連續(xù)和有界等任一條件下兩種凸性定義等價(jià)性.
致謝作者非常感謝相關(guān)參考文獻(xiàn)給予本文的啟示以及審稿專(zhuān)家提出的寶貴意見(jiàn).