李寧
摘 要: 對于城市的建筑商品房價(jià)格,不同城市的商品房銷售價(jià)格不同,而且影響城市商品房銷售價(jià)格的因素多種多樣,多元統(tǒng)計(jì)分析方法可以有效地分析出多元數(shù)據(jù)指標(biāo)對于某一個(gè)指標(biāo)數(shù)據(jù)的影響。本文通過建立商品房銷售價(jià)格與城市的發(fā)展指標(biāo)之間聯(lián)系的數(shù)學(xué)模型,分析了城市的發(fā)展指標(biāo)對于建筑商品房平均售價(jià)的影響程度。首先通過對中國統(tǒng)計(jì)年鑒中35個(gè)大中城市的經(jīng)濟(jì)發(fā)展指標(biāo)進(jìn)行主成分分析,用得到的較少個(gè)數(shù)的綜合主成分指標(biāo)替代原始數(shù)據(jù),然后初步分析建筑銷售均價(jià)與城市發(fā)展指標(biāo)的關(guān)系,并對選定的價(jià)格方程進(jìn)行多元回歸分析,建立商品房價(jià)格和城市經(jīng)濟(jì)發(fā)展指標(biāo)間關(guān)系的數(shù)學(xué)評價(jià)模型。于此同時(shí),由于城市商品房銷售價(jià)格與經(jīng)濟(jì)發(fā)展指標(biāo)間的的關(guān)系不確定性,我們又針對主成分分析的弊端設(shè)計(jì)了非線性的主成分分析的評價(jià)方式,并進(jìn)行了比較和統(tǒng)計(jì)分析。
關(guān)鍵詞: 多元統(tǒng)計(jì)分析;非線性主成分分析;多元回歸分析;城市建筑價(jià)格影響因素
引言
城市的建筑產(chǎn)品是一種異質(zhì)性商品,建筑產(chǎn)品在決定使用價(jià)值的各個(gè)因素上面會(huì)有明顯的差異,如城市的人口、經(jīng)濟(jì)發(fā)展指標(biāo)和建筑面積等因素都與城市建筑商品房均價(jià)有一定的關(guān)聯(lián)。對于眾多影響因素,指標(biāo)數(shù)量過多會(huì)使課題的復(fù)雜性加大。我們希望可以通過較少的指標(biāo)個(gè)數(shù)得到的比較多的信息量。主成分分析對數(shù)據(jù)指標(biāo)數(shù)目的降維將使得問題更為簡單方便。[1]
而且由于建筑價(jià)格影響因素可能是非線性的,所以我們也將非線性主成分分析法與傳統(tǒng)主成分方法進(jìn)行比較,并結(jié)合多元線性回歸分析和spss軟件,對城市建筑商品房均價(jià)建立非線性的綜合評價(jià)體系模型。
1綜合評價(jià)體系的多元統(tǒng)計(jì)分析方法概述
1.1城市經(jīng)濟(jì)發(fā)展指標(biāo)的主成分分析
對于決定建筑商品房價(jià)格的城市經(jīng)濟(jì)發(fā)展指標(biāo),指標(biāo)之間有一定的關(guān)聯(lián)性,可以理解為這兩個(gè)指標(biāo)之間對于決定建筑商品房價(jià)格的信息有一定的重疊。主成分分析是數(shù)學(xué)中的一種降維方法,它可以根據(jù)實(shí)際的需求把原來的指標(biāo)重新組合成一組新的相互間線性無關(guān)的綜合指標(biāo),也就是從其中抽取出少數(shù)幾個(gè)主成分,這些主成分將盡可能多地表達(dá)原始變量的信息。通過對多個(gè)城市建筑樣本和城市發(fā)展指標(biāo)數(shù)據(jù)的壓縮、解釋,它也可以用來尋找影響城市商品房價(jià)格的綜合指標(biāo),然后適當(dāng)?shù)卣f明綜合指標(biāo)所涵蓋的信息意義,以便于更加清晰地了解問題的內(nèi)在發(fā)展規(guī)律。
1.2非線性主成分分析
主成分分析法只能處理線性問題,實(shí)際問題例如城市建筑商品房影響因素這一問題中,不僅變量間有可能會(huì)有非線性的關(guān)系,而且主成分和原始變量間也存在著非線性的關(guān)系。此時(shí)如果只是進(jìn)行線性化數(shù)據(jù)處理,必然影響研究結(jié)果的準(zhǔn)確度。
非線性主成分分析法的方法有很多種[2],而在這之中,“對數(shù)中心化”是其中較為實(shí)用的一種的方法。
設(shè)有n個(gè)城市,p個(gè)經(jīng)濟(jì)發(fā)展指標(biāo)。
(1)首先對原始指標(biāo)的數(shù)據(jù)做對數(shù)中心化數(shù)據(jù)變換:
(2)計(jì)算對數(shù)中心化后的數(shù)據(jù)的樣本協(xié)方差矩陣
(3)利用樣本協(xié)方差矩陣S 求原始數(shù)據(jù)的主成分。設(shè)它們的特征值為λ1 ≥λ2 ≥… ≥λp ≥0 并且這些特征值相應(yīng)的特征向量為ep,從而得到主成分為
剩下的步驟和傳統(tǒng)線性的主成分分析方法一樣。
與傳統(tǒng)的主成分分析相比,非線性的主成分分析法有2處提高: 1.原始指標(biāo)通過對數(shù)中心化這一變換,主成分被表示為原始變量的非線性組合;2.非線性的主成分分析法的出發(fā)點(diǎn)不再是相關(guān)系數(shù)矩陣,而是協(xié)方差矩陣。這兩處提高將會(huì)使用較少的主成分反映更多的原始變量的信息,從而大大地提高數(shù)據(jù)降維的效果。
1.3主成分的多元回歸分析
本文中的實(shí)例應(yīng)用中我們將以城市建筑商品房價(jià)格Y為因變量,主成分F1,F(xiàn)2,…,F(xiàn)k為自變量,利用線性回歸方程方法可以建立綜合評價(jià)體系的數(shù)學(xué)方程模型:
將主成分F1,F(xiàn)2,…,F(xiàn)k的表達(dá)式,就能得到綜合評價(jià)體系模型。
2建筑價(jià)格綜合評價(jià)體系的數(shù)據(jù)收集與計(jì)算過程
我們搜集了中國統(tǒng)計(jì)年鑒2015年的統(tǒng)計(jì)數(shù)據(jù),根據(jù)相關(guān)領(lǐng)域的研究,依據(jù)全面性、系統(tǒng)性、可比性、科學(xué)性和可取得性的原則[5],選擇了中國35個(gè)主要城市建筑商品房價(jià)格受到的城市經(jīng)濟(jì)發(fā)展指標(biāo)影響因素如下:總?cè)丝冢╔1),人均gdp(X2),居民消費(fèi)指數(shù)(X3),人均公共財(cái)政收入(X4),人均公共財(cái)政支出(X5),平均工資(X6),人均消費(fèi)品零售額(X7),人均居民儲(chǔ)蓄存款(X8),人均住房面積(X9),建筑造價(jià)(X10)。
3綜合評價(jià)體系的最終構(gòu)建過程與結(jié)果分析
3.1非線性主成分分析與傳統(tǒng)主成分分析的結(jié)果對比
我們在多元統(tǒng)計(jì)分析的數(shù)據(jù)搜集和分析時(shí),往往需要收集到不同量綱的數(shù)據(jù),比如總?cè)丝冢ㄈf人),人均gdp(元)。我們已經(jīng)對《中國統(tǒng)計(jì)年鑒》城市經(jīng)濟(jì)指標(biāo)數(shù)據(jù)標(biāo)準(zhǔn)化,得到了標(biāo)準(zhǔn)化矩陣。
(1) 利用對數(shù)中心化的方法對城市經(jīng)濟(jì)發(fā)展的原始指標(biāo)數(shù)據(jù)進(jìn)行處理。
(2) 對對數(shù)中心化處理后的樣本(lnXij)的協(xié)方差矩陣進(jìn)行非線性的主成分分析。相關(guān)系數(shù)矩陣計(jì)算出的特征值及其累積貢獻(xiàn)率見表1。
非線性主成分分析與普通線性主成分分析的特征值及累積貢獻(xiàn)率的對比結(jié)果如下表所示:
由上表可以看出,非線性主成分分析的第一主成分比傳統(tǒng)主成分分析法所攜帶的信息量高了13個(gè)百分點(diǎn),非線性主成分分析法的前2個(gè)主成分的累計(jì)貢獻(xiàn)率超過了90%,而傳統(tǒng)方法前5個(gè)主成分才能超過90%,非線性主成分分析法可以用更多的主成分提取較多的原始指標(biāo)信息,所以非線性主成分分析法更加適用于分析城市建筑商品房價(jià)格的影響指標(biāo)因素。
根據(jù)貢獻(xiàn)率大于85%原則,提取前2個(gè)特征值為主成分,進(jìn)一步分析非線性主成分載荷矩陣得出[a1,a2]。進(jìn)一步計(jì)算出主成分的特征向量[t1,t2]。
主成分和原指標(biāo)之間的關(guān)系式,可以通過主成分的載荷矩陣求出。
表2中的系數(shù)為aij,主成分和原指標(biāo)之間的關(guān)系式分別為:
主成分:
3.2非線性主成分分析的回歸模型
分別將原始指標(biāo)數(shù)據(jù)對數(shù)中心化后的數(shù)據(jù)lnXij代入方程,求得Fi( i = 1,2,3,4) ,然后將Fi當(dāng)作自變量,將各城市商品房銷售均價(jià)Y的對數(shù)中心化數(shù)據(jù)lnY作為因變量,回歸方程的系數(shù)矩陣如下:
由表3可以得出回歸系數(shù)估計(jì)值為:β1=8769.800得到城市商品房銷售價(jià)格的回歸方程:
式中: lnY 為商品房銷售價(jià)格的標(biāo)準(zhǔn)化數(shù)據(jù); Fi為各主成分的值,i = 1,2,3.
把式帶入方程:
原始指標(biāo)數(shù)據(jù)在回歸模型方程中的系數(shù)以及標(biāo)準(zhǔn)化后的系數(shù)如下表:
因此反映城市經(jīng)濟(jì)發(fā)展指標(biāo)與商品房價(jià)格關(guān)系的回歸模型標(biāo)準(zhǔn)化方程為:
其中,βk為表5中回歸方程系數(shù)。
3.3模型分析
通過對數(shù)中心化的數(shù)據(jù)lnY與lnX的多元回歸方程可以看出城市經(jīng)濟(jì)指標(biāo)對于城市建筑價(jià)格的影響程度,繼而分析出其中間的關(guān)系。
多元回歸分析的假設(shè)檢驗(yàn)結(jié)果如表4,由表中可以得出判定系數(shù)為0.736,回歸方程的擬合程度較好。F值為44.572,顯著度為0.000,表明回歸極顯著。
同時(shí),由表5中標(biāo)準(zhǔn)化后的系數(shù)對比可以看出,城市經(jīng)濟(jì)發(fā)展指標(biāo)對于房價(jià)的影響可以分為以下四個(gè)等級:
(1)人均gdp(X2),人均公共財(cái)政收入(X4),人均公共財(cái)政支出(X5),人均消費(fèi)品零售額(X7),人均居民儲(chǔ)蓄存款(X8)的系數(shù)均大于0.3,這說明這些城市的經(jīng)濟(jì)指標(biāo)很大程度上決定了城市商品房平均價(jià)格。
(2) lnX1,lnX6,lnX10所對應(yīng)的原始數(shù)據(jù)中城市經(jīng)濟(jì)指標(biāo)總?cè)丝冢╔1),平均工資(X6),建筑造價(jià)(X10)的系數(shù)在0.1左右,他們作為城市經(jīng)濟(jì)指標(biāo)對于城市建筑商品房的價(jià)格也產(chǎn)生了一定影響。
(3)而人均住房面積(X9)雖然也在一定程度上影響了城市房價(jià),但影響程度要遠(yuǎn)低于直接反映城市居民經(jīng)濟(jì)水平的指標(biāo)。
(4)居民消費(fèi)指數(shù)(X3)對樣本數(shù)據(jù)中城市房價(jià)產(chǎn)生的影響可以忽略不計(jì)。
結(jié)論
對于城市建筑商品房價(jià)格的影響因素,除了其決定的城市經(jīng)濟(jì)發(fā)展指標(biāo)較多外,為了建立更標(biāo)準(zhǔn)的模型,需要利用更多的城市樣本數(shù)據(jù),而且城市商品房價(jià)格與城市發(fā)展指標(biāo)間的關(guān)系可能不是單純的線性關(guān)系。為了解決以上問題,我們通過引入非線性主成分分析法,將決定房價(jià)的多個(gè)指標(biāo)因素化為了少數(shù)幾個(gè)綜合指標(biāo),相比于傳統(tǒng)的主成分分析法,既能在盡可能多地保留原是變了信息并相互獨(dú)立的同時(shí),也減少了主成分的個(gè)數(shù),提高了分析和計(jì)算的準(zhǔn)確性。最后將非線性主成分分析后的綜合指標(biāo)進(jìn)行了多元線性回歸,擬合程度與檢驗(yàn)結(jié)果符合預(yù)期。將主成分與原始變量間關(guān)系方程帶入后的回歸方程結(jié)果,可以分析出原始城市經(jīng)濟(jì)發(fā)展指標(biāo)對于城市建筑商品房價(jià)格的影響程度,并且對根據(jù)城市經(jīng)濟(jì)發(fā)展指標(biāo)進(jìn)行房價(jià)估計(jì)有一定的預(yù)測作用。本文所介紹的基于多元統(tǒng)計(jì)分析方法的綜合評價(jià)體系可以較好地適用于城市房價(jià)影響因素重要性的判斷,同時(shí)對于其他實(shí)際生活或科研中多指標(biāo)因素決定的問題有一定的適用性。
參考文獻(xiàn)
[1]Abraham B. and J.Ledolier. Statistica l for Forecasting. New York:1983.
[2]張祟甫,陳述云.成分?jǐn)?shù)據(jù)主成分分析及其應(yīng)用[J].數(shù)理統(tǒng)計(jì)與管理, 1996( 4).
[3]鄒淵淵,伍岳慶,姚宇.基于主成分和回歸分析的煙葉質(zhì)量分析模型[J].計(jì)算機(jī)應(yīng)用,2011年z2期.
[4]彭魯鳳.城市住宅價(jià)格空間分異的模式和原因—對杭州的實(shí)證分析[D].浙江大學(xué)碩士論文,2010-01-01.
[5]韋國堅(jiān).上海市城市住宅價(jià)格空間分異實(shí)證研究[D].浙江大學(xué)碩士論文,2013-05-01.