管山林, 馬江濤, 郭 震
(云南師范大學(xué)數(shù)學(xué)學(xué)院,昆明650500)
n元二次函數(shù)求極值的問題在線性規(guī)劃、最優(yōu)化理論等理論中是非常重要的一類問題.因此很多學(xué)者都對這類問題進行了研究.參考文獻(xiàn)[1]討論了極值點的公式,參考文獻(xiàn)[2]討論了齊次情形極值存在的條件,參考文獻(xiàn)[3]給出了一些極值存在的條件和極值公式的討論,參考文獻(xiàn)[4]討論了極值存在的條件,參考文獻(xiàn)[5]進行了極值存在條件的討論和一次項消去的充要條件,參考文獻(xiàn)[6]給出了正定和負(fù)定情況的極值公式的行列式表達(dá),參考文獻(xiàn)[7]討論了n元二次函數(shù)正定的充要條件,參考文獻(xiàn)[8]給出了二元二次函數(shù)的極值公式, 并進行了n元二次函數(shù)極值存在必要條件的討論,參考文獻(xiàn)[9]給出了正定和負(fù)定情況相對完善的極值存在條件和極值公式的總結(jié)歸納,參考文獻(xiàn)[10]從最優(yōu)化的角度討論了齊次情形的公式.
針對該問題的研究現(xiàn)狀, 待解決的問題是給出完整的極值存在的充要條件, 非滿秩(半正定或者半負(fù)定)情形極值公式如何表達(dá), 以及如何統(tǒng)一非滿秩(半正定或者半負(fù)定)和滿秩(半定或者負(fù)定)的極值公式. 本文完整的討論了極值存在的充要條件和極值的一般公式,得出了統(tǒng)一而簡潔的結(jié)果. 這對于教師教學(xué)和學(xué)生學(xué)習(xí)、理解、記憶都是有非常幫助的.
設(shè)f(x)=f(x1,…,xn)為n元二次函數(shù), 其表達(dá)式為
其中apq關(guān)于指標(biāo)p,q是對稱的, 其中1≤p≤n+1, 1≤q≤n+1(總可以選到系數(shù)使得apq是對稱的).記矩陣A=(apq), det(A)為A的行列式,Apq為矩陣A中元素apq的代數(shù)余子式.類似的, 記矩陣A0=(aij), 其中1≤i≤n, 1≤j≤n, det(A0)為A0的行列式, (A0)i為A0的第i個順序主子式.O為n階零矩陣.
定理1設(shè)f(x)是上述形式的n元二次函數(shù)(A0≠O), 則
(i)f(x)極值存在(且唯一)當(dāng)且僅當(dāng)下列情況之一成立:
① (A0)i>0,?1≤i≤n或者(-1)i(A0)i>0,?1≤i≤n.此時其極值點和極值分別為
若(A0)i>0,?1≤i≤n, 則f(x0)是極小值; 若(-1)i(A0)i>0,?1≤i≤n, 則f(x0)是極大值.
② det(A0)=0,rank(A)≤rank(A0)+1且A0所有主子式非負(fù)或者所有奇數(shù)階主子式非正, 偶數(shù)階主子式非負(fù), 此時若A0的秩為k, 則極值點的全體構(gòu)成了維數(shù)為n-k的空間, 其極值為
其中C0,detC0(C,detC)分別為選定A中r1,…,rk(r1,…,rk,n+1)行和列的主子矩陣和非零主子式(主子式), 1≤r1,…,rk≤n.若所有奇數(shù)階主子式非正, 偶數(shù)階主子式非負(fù), 則極值是極大值; 若A0所有主子式非負(fù), 則極值是極小值.
(ii)f(x)極值不存在當(dāng)且僅當(dāng)A0既非半正定也非半負(fù)定或者rank(A)≥rank(A0)+2.
?f=(fx1,fx2,…,fxn)=0,
即
或者用矩陣形式等價地
A0x0=-γn+1.
(i)若det(A0)≠0, 則由Cramer法則知
其中第二個等號是把第i列-γn+1移動到最后一列(先將第i列與第i+1列交換, 再將第i+1列與第i+2列交換,…, 將第n-1列與第n列交換)并把負(fù)號提到行列式外面并且利用了(-1)2i=1, 最后一個等號用到了A的代數(shù)余子式的定義.于是
其中第二個等號用到了臨界點方程組, 第四個等號是利用Laplace展開定理對det(A)按n+1行展開, 并且注意到det(A0)=An+1,n+1.此時臨界點和臨界值分別為
(ii) 若det(A0)=0, 設(shè)A0的秩為k(不妨臨設(shè)k≠0, 如果k等于零則A0=O, 這說明f(x)不是二次函數(shù), 矛盾).可斷言: 臨界點方程組有解當(dāng)且僅當(dāng)rank(A)≤rank(A0)+1.事實上, 如果rank(A)≥rank(A0)+2, 記[A0,γn+1]和[A0,-γn+1]分別為
則
rank([A0,γn+1])≥rank(A)-1≥rank(A0)+1>rank(A0),
其中第一個不等式是因為矩陣A比矩陣[A0,γn+1]增加了一行, 而增加一行要么不改變秩, 要么秩增加1(這是線性代數(shù)中的一個結(jié)論, 即rank(A)≤rank([A0,γn+1])+1).第二個不等式是由假設(shè)rank(A)≥rank(A0)+2推得.這說明
rank(A0) 注意到 其中I為n階單位陣.這說明 rank([A0,γn+1])=rank([A0,-γn+1]). 因此 rank(A0) 即臨界點方程組系數(shù)矩陣的秩小于增廣矩陣的秩, 由Cramer法則知臨界點方程組無解.另一方面, 設(shè)rank(A)≤rank(A0)+1, 若rank(A0)≠rank([A0,γn+1]), 注意到[A0,γn+1]比A0多一列, 于是 rank(A0)+1=rank([A0,γn+1]), 記 A0=[γ1,…,γn],[A0,γn+1]=[γ1,…,γn,γn+1]. 則對任意的λ1,…,λn, 有 γn+1≠λ1γ1+…+λnγn. 同時轉(zhuǎn)置可得 于是 這說明 rank(A)=rank([A0,γn+1])+1=rank(A0)+2, 這與假設(shè)矛盾.于是rank(A0)=rank([A0,γn+1]), 由Cramer法則知臨界點方程組有解.這就證明了斷言.因此只考慮rank(A)≤rank(A0)+1的情形, 由線性方程組的一般理論知其解構(gòu)成了維數(shù)為n-k的空間.不失一般性, 不妨設(shè)其第1,2,…,k行和列對應(yīng)的子式detC0不為零.按上述記號, 有 由Cramer法則可解得當(dāng)1≤i≤k時, 的秩為k.事實上, 若不然, 設(shè)Mα的秩為k+1, 則臨界點方程中有效方程組的個數(shù)必然大于等于k+1, 矛盾.對Mα的行列式使用Laplace展開定理, 和前面的計算類似有 其中第二個等號是合并同類項之后是i,j交換位置(因為最終的求和結(jié)果是與求和指標(biāo)i,j無關(guān)的, 所以交換位置不影響求和的最終結(jié)果), 并且利用了對稱矩陣的伴隨矩陣仍然是對稱矩陣的事實以及aαi=aiα.第三個等式是利用了上述detMα=0展開的結(jié)果和上述detC展開的結(jié)果.可斷言:f(x0)與主子式非零對應(yīng)的矩陣C0的選取無關(guān).不失一般性, 不妨設(shè)另一個主子式非零的矩陣D0和對應(yīng)的矩陣D為 注意到矩陣中如果存在線性相關(guān)的兩個向量, 則其行列式必然為零.故不失一般性, 只需考慮第k+1行和第一行之間之間具有線性相關(guān)性, 即 (ak+1,1,ak+1,2,…,ak+1,n+1)=λ(a11,a12,…,a1,n+1). 注意到A的對稱性 ak+1,k+1=λa1,k+1=λak+1,1=λ2a1,1,an+1,k+1=ak+1,n+1=λa1,n+1=λan+1,1. 于是有 其中第二個等號用到了A的對稱性和第一行與第k+1行的線性相關(guān)性, 第三個等號是先將第k行的公因子λ和第k列的公因子λ提到行列式外面, 然后將第k行移動到了第一行(先將第k行與第k-1行互換位置, 再將第k-1行與第k-2行互換位置,…,第二行與第一行互換位置), 最后將第k列移動到了第一列(先將第k列與第k-1列互換位置, 再將第k-1列與第k-2列互換位置,…,第二列與第一列互換位置).通過上述類似的替換和行列變換有 即 這就證明了斷言. 下面討論極值的存在性與極大極小性: 令x=x0+x′,其中x0是某個固定的臨界點.進一步計算得 其中λ1,λ2,…,λn是A0的所有特征值.則 ① 若rank(A)≥rank(A0)+2, 根據(jù)上面的討論, 臨界點方程組系數(shù)矩陣的秩小于增廣矩陣的秩, 由Cramer法則知臨界點方程無解, 故極值不存在; ② 若A0不是半正定或者半負(fù)定的, 該條件成立當(dāng)且僅當(dāng)λi是有正有負(fù)的.此時由f(x)-f(x0)表達(dá)式知極值不存在; ③ 若(A0)i>0,?1≤i≤n或者(-1)i(A0)i>0,?1≤i≤n, 該條件成立當(dāng)且僅當(dāng)A0的特征值全為正或者全為負(fù).此時結(jié)合f(x)-f(x0)的表達(dá)知極值是存在唯一的.由上面的討論知其極值點和極值分別為 顯然若(A0)i>0,?1≤i≤n, 則f(x0)是極小值; 若(-1)i(A0)i>0,?1≤i≤n, 則A是極大值; ④ 若det(A0)=0,rank(A)≤rank(A0)+1且A0所有主子式非負(fù)或者所有奇數(shù)階主子式非正, 偶數(shù)階主子式非負(fù), 該條件成立當(dāng)且僅當(dāng)A0非滿秩, 臨界點方程組有解且A0的所有特征值λi是非負(fù)或者非正.注意到A0≠O(否則f(x)不是二次函數(shù)), 這說明特征值不全為零.此時由f(x)-f(x0)的表達(dá)知極值是存在且唯一.而A0所有主子式非負(fù)當(dāng)且僅當(dāng)特征值非負(fù), 此時極值是極小值.同理A0所有奇數(shù)階主子式非正, 偶數(shù)階主子式非負(fù)當(dāng)且僅當(dāng)特征值非正, 此時極值是極大值.若設(shè)A0的秩為k,C和C0的記號同上(并且容易驗證此時是C0正定或者負(fù)定的), 則由上面的討論知極值為 且極值點的全體構(gòu)成了維數(shù)為n-k的空間. 作為定理的一個推論, 得到了關(guān)于二元二次函數(shù)的極值結(jié)果. 推論1設(shè)f(x,y)是上述形式的二元二次函數(shù)(A0≠O),則f(x,y)極值存在(且唯一)當(dāng)且僅當(dāng)下列情況之一成立: (i) det(A0)>0.此時其極值點和極值點分別為 并且若a11>0或者a22>0, 則f(x0,y0)是極小值;若a11<0或者a22<0, 則f(x0,y0)是極大值. (ii) det(A0)=0 且det(A)=0.此時極值點構(gòu)成了二維平面上的一條直線.其極值為 并且若a11>0或者a22>0, 則極值為極小值; 若a11<0或者a22<0, 則極值為極大值. 解按照上述記號, 矩陣A為 顯然det(A0)=det(A)=0, rank(A0)=2, rank(A)=3且A0的所有主子式均非負(fù).注意到 3=rank(A)≤rank(A0)+1=2+1=3, 由定理1,f(x)的極小值存在.取第一行第二行, 第一列第二列構(gòu)成的主子式對應(yīng)的矩陣C0, 則直接的計算表明 detC0=2, detC=-3. 這說明極小值與主子式的選取無關(guān). 解按上述記號, 矩陣A為 直接的計算表明 det(A0)=0, rank(A0)=2, det(A)=0, rank(A)=3. 并且A0的所有奇數(shù)階主子式非正, 偶數(shù)階主子式非負(fù)(即A0所有特征值非正), 并且 3=rank(A)≤rank(A0)+1=2+1=3, 根據(jù)定理1,f(x)存在極大值, 取第一行第二行, 第一列第二列構(gòu)成的主子式對應(yīng)的矩陣C0, 則直接的計算表明detC0=5, detC=-30.于是該極大值為f(x0)=-6,.事實上, 還可以驗證與主子式的選取無關(guān).取第二行第三行, 第二列第三列構(gòu)成的主子式對應(yīng)的矩陣D0, 則detD0=5,detD=-30; 取第一行第三行, 第一列第三列構(gòu)成的主子式為E0, detE0=5,detE=-30.于是 這說明極大值與主子式的選取無關(guān). 解按上述記號, 矩陣A為 直接的計算表明, det(A0)=22≠0,det(A)=-360.并且A0的所有順序主子式均大于零, 由定理1可知f(x)存在極小值, 并且極小值點和極小值分別為 注 上述例子說明, 當(dāng)A0是正定矩陣, 即使A不具有半正定性(注意到det(A)<0, 這說明特征值必有一個是負(fù)的, 因此不可能半正定),f(x)的極小值也是存在的. 解按上述記號, 矩陣A為 直接的計算表明, det(A0)=-11≠0, det(A)=44.并且A0的奇數(shù)階順序主子式小于0, 偶數(shù)階順序主子式大于0.由定理1可知f(x)存在極大值, 并且極大值點和極大值分別為 解按上述記號, 矩陣A為 直接的計算表明, det(A0)=-1<0, det(A)=0.并且A0所有一階主子式為正, 二階主子式為負(fù).這說明A0既非半正定也非半負(fù)定.由定理1知,f(x)的極值是不存在的. 解按上述記號, 矩陣A為 直接的計算表明, det(A0)=0, rank(A0)=1, det(A)=-4, rank(A)=3.顯然 rank(A)=3≥rank(A0)+2=3, 根據(jù)定理1,f(x)的極值是不存在的. 例7設(shè)f(x)=ax2+2bx+c為一元二次函數(shù)(a≠0), 求f(x)的極值. 解按上述記號, 矩陣A為 直接的計算表明, det(A0)=a≠0, rank(A0)=1, det(A)=ac-b2, 根據(jù)定理1,f(x)的極值存在且唯一.其極值點和極值分別為 并且a>0時f(x0)為極小值,a<0時f(x0)為極大值.這就從n元二次函數(shù)的極值問題的角度重新解釋了一元二次函數(shù)的極值問題. 本文將n元二次函數(shù)求極值的公式化簡為兩個行列式的比值, 結(jié)果簡潔且具有一般性(不受矩陣的秩的約束), 在實際應(yīng)用中也非常方便. 致謝非常感謝本文審稿專家和編輯提出的寶貴的修改意見.3 例 題
4 結(jié) 論