王積建 ,陳笑緣,茹永梅
(1.浙江工貿(mào)職業(yè)技術(shù)學(xué)院,浙江 溫州 325027;2.浙江商業(yè)職業(yè)技術(shù)學(xué)院,浙江 杭州 310053)
截止2011年,全國大學(xué)生數(shù)學(xué)建模競賽已成功舉辦了 20年.由于賽題質(zhì)量是競賽成功舉辦的關(guān)鍵因素之一,所以通過對賽題質(zhì)量進(jìn)行綜合評價和分析,篩選出優(yōu)質(zhì)賽題,提煉出影響賽題質(zhì)量的指標(biāo)體系,對于指導(dǎo)今后的命題工作具有十分重要的意義.
針對全國大學(xué)生數(shù)學(xué)建模競賽試題質(zhì)量的綜合評價問題,在過去20年間從來沒有研究過. 本課題組受全國大學(xué)生數(shù)學(xué)建模競賽組委會委托,對專科組的24個賽題進(jìn)行了質(zhì)量評價.首先建立了綜合評價指標(biāo)體系,然后通過向有關(guān)專家和競賽指導(dǎo)老師、參賽學(xué)生發(fā)放問卷,獲得評價指標(biāo)的相對重要性數(shù)據(jù)和賽題質(zhì)量分?jǐn)?shù).最后通過建立綜合評價模型,得到了24個賽題的綜合評價值及其排序. 但由于這些排序結(jié)果并不能直接顯示哪些賽題屬于“優(yōu)”,哪些賽題屬于“良”,也就無法將這些賽題進(jìn)行恰當(dāng)?shù)貧w類,因而無法概括提取優(yōu)質(zhì)賽題的特征. 鑒于此,本文在綜合評價的基礎(chǔ)上,使用費(fèi)歇爾(Fisher)最優(yōu)分割法對這些賽題進(jìn)行最優(yōu)分類,為總結(jié)提煉優(yōu)質(zhì)賽題的特征做準(zhǔn)備.
設(shè)有序樣品依次為 X1,X2,...,Xn(Xi為m維向量).
用D(i,j)表示這一類的直徑,常用的直徑有:
當(dāng)1m=時,也可以定義直徑為:
其中X%G是該類數(shù)據(jù)的均值、中位數(shù)或眾數(shù).
2)定義分類的損失函數(shù).用 b(n,k)表示將n個有序樣品分為k類的某一種分法.常記分法b(n,k)為:
定義上述分類法的損失函數(shù)為
4)最優(yōu)解的求法.首先找分點(diǎn)jk,使得(6)式達(dá)到極小,即
然后找分點(diǎn)jk-1,使它滿足
5)分類數(shù)k的確定方法
以歷屆全國大學(xué)生數(shù)學(xué)建模競賽(CUMCM)??平M試題為分類對象.選取了從1999年專科組獨(dú)立于本科組競賽以來,截止2010年的12年的C、D題,一共24個賽題,以X1~X24表示.
計算出24個賽題的綜合評價值,并按照綜合評價值從大到小排序,結(jié)果如表1的第3、4列所示.綜合評價值越大,表示賽題質(zhì)量越好.
為了使用最優(yōu)分割法對這些賽題進(jìn)行有序分類,將所有賽題按照綜合評價值從大到小的順序重新排列,形成有序樣品 B1~B24,見表2.排序靠前的賽題質(zhì)量較好.
1)計算直徑.由于樣品指標(biāo)的維數(shù)m=1,所以使用(3)式計算直徑,其中GX%是該類樣品評價值的均值,按照(1)式直徑的計算結(jié)果見表3(使用MATLAB軟件編程計算).
4)確定最優(yōu)分類.將24個賽題分為7類,結(jié)果見表6.
考慮到本文的研究目的是將這些 24個賽題的質(zhì)量分出等級,以便于能對今后的命題具有指導(dǎo)意義. 若劃分過細(xì),則不利于提煉類特征. 因此,將其劃分為5個等級,即優(yōu)、較優(yōu)、中、較差、差這5個等級;或者劃分為3個等級,即優(yōu)、中、差這3個等級.
以上3種分類結(jié)果匯總見表2,將其分類結(jié)果標(biāo)示在原賽題上,結(jié)果見表1的第6、7、8列.
表1 所有24個賽題的綜合評價結(jié)果及排序
表2 有序樣品及其綜合評價值
表3 直徑D(i , j)的計算結(jié)果(乘以10000)
表4 最小分類損失函數(shù)L[b*(l , k)]的計算結(jié)果(乘以10000)
表5 與最小分類損失函數(shù)L[b*(l , k)]相對應(yīng)的分點(diǎn)
圖1 損失函數(shù)L[b*(n , k)] (乘以10000)隨k變化的趨勢
表6 將24個賽題分為7類的分類結(jié)果
以劃分7類為例.令yi=xBi-xBi+1,i=1 ,2,...,23,其中xBi表示有序樣品Bi的綜合評價值,yi表示有序樣品 Bi與的綜合評價值的一階差分值.將yii=1,2,...,23)用圖形表示出來,如圖2所示(橫坐標(biāo)表示B1~B23,縱坐標(biāo)表示一階差分值 yi).
從圖2可以看出,B1與 B2差距很大,B5與 B6差距很大,B6與B7差距很大,B7與B8差距很大,B10與B11差距很大,B12與B13差距很大,B17與B18差距很大,B19與B20差距很大,B21與B22差距很大,故他們每之間應(yīng)當(dāng)成為分界點(diǎn),這樣一來就要分為9類.由于分類數(shù)的限制,必須減少2類.
將 B1~B24的綜合評價值用圖形表示出來,如圖3所示(橫坐標(biāo)表示 B1~B24,縱坐標(biāo)表示綜合評價值).
從圖3可以看出,在B6與B7,B10與B11,B19與B20這三者的落差中,B5與B8之間的落差最大,這里必須截斷,否則類內(nèi)離差平方和必然增大,故將B6B7,B合并為一類可以達(dá)到截斷的目的.而B10與B11、B19與B20可以融入所在類別之中,恰好分為7類.
圖2 B1~B23的一階差分值
圖3 B1~B24的綜合評價值的變化趨勢
綜上所述,最優(yōu)分割法得到的分類結(jié)果是符合實(shí)際的.
[1] 方開泰.有序樣品的一些聚類方法[J].應(yīng)用數(shù)學(xué)學(xué)報,1982,5(1):94-101.
[2] 高惠璇.應(yīng)用多元統(tǒng)計分析[M].北京:北京大學(xué)出版社,2005:253-255.
[3] 張世英,黃違洪.最優(yōu)分割法的適用性及一類有序樣品的聚類方法[J].應(yīng)用數(shù)學(xué)學(xué)報,1987,10(2):138-144.
[4] 王鶴春,王家斌.基于主成分分析與最優(yōu)分割理論對實(shí)習(xí)成績綜合評定的研究與分析[J].?dāng)?shù)學(xué)的實(shí)踐與認(rèn)識,2009,39(12):21-26.
[5] 彭志行,鮑昌俊,趙楊,等.加權(quán)馬爾可夫鏈在傳染病發(fā)病情況預(yù)測分析中的應(yīng)用[J].?dāng)?shù)學(xué)的實(shí)踐與認(rèn)識,2009,39(27):92-99.
[6] 趙欣,鄒良超,倪林.基于有序聚類的模糊加權(quán)馬爾可夫模型在降雨預(yù)測中的應(yīng)用[J].江西農(nóng)業(yè)學(xué)報,2009,21(2):110-113.
深圳職業(yè)技術(shù)學(xué)院學(xué)報2013年1期