[摘要] 商品交易市場專業(yè)化指數是用來衡量某地區(qū)各類商品交易市場經濟總量在各類交易市場之間的集中程度?;谇叭说难芯炕A,作者給出了億元商品交易市場專業(yè)化指數計算公式,并將空間關聯(lián)規(guī)則分析引入商品交易市場專業(yè)化水平與其他經濟因素的關聯(lián)分析中。在指定的最小支持度和可信度閾值下,獲得了3條有意義的商品交易市場專業(yè)化水平與其他經濟因素之間關聯(lián)規(guī)則。通過這些關聯(lián)規(guī)則,可以對一地區(qū)商品交易市場的專業(yè)化水平進行預測,為市場合理規(guī)劃和建設提供決策支持。
[關鍵詞] 億元商品交易市場 專業(yè)化 關聯(lián)規(guī)則 數據挖掘
億元商品交易市場是指年成交額為1億元及以上的大型和特大型市場(以后億元商品交易市場簡稱商品交易市場)。經過幾十年的發(fā)展,中國商品交易市場呈現出規(guī)?;?、規(guī)范化、專業(yè)化、信息化和高效益化等特征,豐富了人們的物質、精神生活,增強了區(qū)域合作,推動了城鄉(xiāng)的立體化發(fā)展。目前有關商品交易市場的研究多集中于政策研究和基于統(tǒng)計數據的發(fā)展趨勢分析。在專業(yè)商品交易市場方面,更多的學者是不同區(qū)域的專業(yè)市場進行統(tǒng)計分析,以發(fā)現其發(fā)展變化的規(guī)律。游產業(yè)的發(fā)展,加強區(qū)域合作,形成高度區(qū)域一體化,合作立體化。尋找專業(yè)化水平高低和相應的區(qū)域其他因子之間關聯(lián)關系對區(qū)域商品交易市場的規(guī)劃和建設都有著重大的意義。商品交易市場專業(yè)化的影響因素是分布于一定的區(qū)域內,同時具有屬性信息和空間信息,并且相互之間存在一定相關性。影響因素分析的方法,一般是多元回歸分析或經驗模型。首先這些方法不能處理空間信息,其次它們要求數據要滿足統(tǒng)計獨立性。因此,傳統(tǒng)的分析方法無法反應它們之間一種共生或因果關聯(lián)模式。鑒于以上原因,本文將可以同時處理空間和非空間信息的空間關聯(lián)分析引入區(qū)域商品交易市場的專業(yè)化研究中,通過分析相應影響或者共生因素,挖掘其與區(qū)域商品交易市場專業(yè)化之間的關聯(lián)模式,為我國億元商品交易市場的合理規(guī)劃和建設提供參考依據。
一、數據來源
本文所用有關億元商品交易市場數據來源于2001年到2007年中國商品交易市場統(tǒng)計年鑒(該統(tǒng)計年鑒最早起始于2001年)。此統(tǒng)計數據包括中國大陸地區(qū)的省、地區(qū)和直轄市,缺少西藏自治區(qū)、香港、澳門、臺灣地區(qū)的相關統(tǒng)計數據。市場成交額反應了市場的規(guī)模,被用于進行商品交易市場專業(yè)化指數計算。專業(yè)化指數是指一個地區(qū)所有類型專業(yè)化市場的成交額或其他指標在該地區(qū)中所有類型專業(yè)市場中的分布情況。因此,專業(yè)市場的分類對專業(yè)化指數有著很重要的影響。本文采用中國商品交易市場統(tǒng)計年鑒對專業(yè)化市場的分類方法將億元商品專業(yè)市場分成,紡織品服鞋帽裝市場,食品飲料煙酒市場,家具市場等21類市場(詳見中國商品交易市場統(tǒng)計年鑒)。
參與億元商品交易市場專業(yè)化關聯(lián)分析的要素主要包括,城鎮(zhèn)居民恩格爾指數,農村居民恩格爾指數,人口密度,公路密度,鐵路密度,個私經濟發(fā)展水平,貿易競爭,城市化水平,第二產業(yè)占所有產業(yè)比重,市場化水平,鄰域專業(yè)化水平。這些數據主要來源于2001到2007年的中國統(tǒng)計年鑒和中國人口統(tǒng)計年鑒。其中有些因素是通過計算得到,例如貿易競爭水平是通過出口額與進口額的比值得到。
二、研究方法
1.商品交易市場的專業(yè)化測度方法。在產業(yè)經濟學中,區(qū)位商常被用于衡量區(qū)域內部的某一部門專業(yè)化水平的高低,如商建初等利用區(qū)位商研究了長三角地區(qū)工業(yè)的行業(yè)專業(yè)化程度;宗剛等利用?指數及區(qū)位商對北京產業(yè)結構進行研究。區(qū)位商反映的是一個研究區(qū)域內某一產業(yè)是否具有比較優(yōu)勢,但無法反映各種產業(yè)在空間上聚集后專業(yè)化的程度。賀燦飛等在研究中國制造業(yè)的省區(qū)專業(yè)化時,引入了一個專業(yè)化測度方法來度量各省區(qū)的諸產業(yè)相對集中指標。當研究區(qū)域中所有產值或其他考察變量集中于一個產業(yè)時,專業(yè)化指數應該最高,理論上應該是1,然而該公式測算的結果為(n-1)/n,只有當n趨于無窮大時才能得到1。當專業(yè)化水平較高時,n越大,計算的專業(yè)化指數就越精確。商品交易市場專業(yè)化指研究區(qū)域內所有類型交易市場的交易額或從業(yè)人口總數在各類交易市場間的集中程度。當交易額或其他參數在各類交易市場之間平均分布,專業(yè)化指數最小,是0;當交易額或其他參數集中于某一類市場,專業(yè)化指數最高,是1。為了正確衡量商品交易市場的專業(yè)化水平,本文對賀燦飛等人提出的模型進行改進,并用其對中國億元商品交易市場的專業(yè)化水平進行度量。商品交易市場專業(yè)化指數的計算公式如下:
(1)
(1)式中,S是研究區(qū)域中商品交易市場類型的個數; 為研究區(qū)域中每類交易市場占所有類型交易市場的總成交額的比重的平均值;VAjn,VAkn 為研究區(qū)域n中j,k兩種類型商品交易市場的成交額;VAn為研究區(qū)域n中所有類型商品交易市場的成交額。當研究區(qū)域中的商品交易市場類型個數為1時,不采用該計算公式,專業(yè)化指數為1。
2.空間關聯(lián)規(guī)則。Agrawal等于1993年首先對顧客交易數據中購買物品之間的關聯(lián)問題進行研究,提出了關聯(lián)規(guī)則的概念,并給出了相應挖掘的算法。Koprski K對傳統(tǒng)的關聯(lián)規(guī)則進行了拓展,并成功地將其引入了空間數據挖掘領域。從此諸多地學工作者和區(qū)域經濟學家對空間關聯(lián)規(guī)則挖掘進行了大量的研究,主要包括概念,挖掘過程,挖掘算法等。這些基礎性的研究工作大大地促進了空間關聯(lián)規(guī)則在各領域中的應用??臻g關聯(lián)規(guī)則是通過蘊含表達式來進行描述,如A→B(c%,s%)。A和B是交集為空(A∩B=φ)的謂詞集合,且二者中至少包含一個空間謂詞。s%,是規(guī)則的支持度,指A和B在所有空間事務中同時發(fā)生的概率,P(A∩B)。c%,規(guī)則的可信度,指在所有空間事務中A發(fā)生的前提下B發(fā)生的概率,P(B/A)。非空間謂詞,指常規(guī)的邏輯謂詞??臻g謂詞是包含空間關系的邏輯謂詞。除了可信度和支持度,很多學者還開發(fā)出了其他的指標對空間關聯(lián)規(guī)則進行衡量。蘊含表達形式直觀、簡單、明了。如規(guī)則,is-a(x,house)∧close-to(x,urban center)→is-expensive(x)(100%,95%)。該規(guī)則表明:95%靠近市中心的房子價格都高,該規(guī)則的正確率為100%。
3.鄰域專業(yè)化空間滯后。一個研究區(qū)域的商品交易市場專業(yè)化的水平不但與該區(qū)域中的經濟因素有關,而且還受到其鄰域商品交易市場專業(yè)化程度的影響。本文中通過專業(yè)化指數滯后來反映鄰域專業(yè)水平對當前研究區(qū)域商品交易市場專業(yè)化的影響。專業(yè)化指數滯后計算公式如式(2)所示。
(2)
S是鄰域億元商品交易市場專業(yè)化指數空間滯后,N是研究區(qū)域的鄰域個數,pn和λn分別是第n相鄰區(qū)域的專業(yè)化指數和相應的權重。
三、億元商品交易市場區(qū)域專業(yè)化關聯(lián)分析
1.億元商品交易市場區(qū)域專業(yè)化計算。關聯(lián)規(guī)則分析要求數據表中的屬性是離散的數值或符號。在進行關聯(lián)分析之前,應該將連續(xù)的專業(yè)化指數轉換成離散的專業(yè)化水平。本文將商品交易市場專業(yè)化劃分成三個等級:高專業(yè)化水平,中等專業(yè)化水平和低專業(yè)化水平。下圖展示了2005年各省區(qū)億元商品交易市場專業(yè)化水平的分布情況。
說明:①(a)是億元商品交易市場專業(yè)化指數(連續(xù))分布圖,(b)是離散化億元商品交易市場專業(yè)化水平分布圖②統(tǒng)計數據主要包括大陸省區(qū)億元商品交易市場成交額數據。西藏地區(qū)和港澳臺地區(qū)沒有統(tǒng)計數據,專業(yè)化指數設為0。③為統(tǒng)一數據,專業(yè)化計算過程中沒有包含計算機市場、通訊器材市場和花卉市場。
連續(xù)型專業(yè)化指數可以更精確地表示商品交易市場的專業(yè)化水平,但是其不符合人們的思維習慣,比較抽象不易理解。離散型的專業(yè)指數很容易被人們接受和理解,但精度不是很高。由于關聯(lián)分析的需要,我們需要將連續(xù)的專業(yè)化指數進行離散化處理。
2.億元商品交易市場區(qū)域專業(yè)化關聯(lián)因素分析。關聯(lián)規(guī)則分析可以發(fā)現專業(yè)化水平和區(qū)域其他因素之間讓人感興趣的關聯(lián)知識。關聯(lián)規(guī)則的支持度反映該規(guī)則在挖掘數據中的覆蓋度;可信度反映規(guī)則的正確度。在對挖掘規(guī)則沒有限制的情況下,會有大量的關聯(lián)規(guī)則成為挖掘結果,但其中只有很小的一部分是有意義的。最小置信度和支持度分別設置為80%和10%。除了規(guī)則模版、最小支持度和置信度,我們通過專業(yè)知識對的挖掘結果進行分析評估來得出最終有意義的關聯(lián)規(guī)則,如表1所示。
結合中國億元商品交易市場的專業(yè)背景知識,這里我們得到了3條有用的規(guī)則。它們的支持度和置信度分別在14%和81%以上。其中第一規(guī)則說明:如果一個地區(qū)的城市化水平中等,第二產業(yè)占所有產業(yè)的比重高,市場化水平低,人口密度低,高速公路密度低,該地區(qū)的億元商品交易市場專業(yè)化是中等水平,該規(guī)則的支持度是14.29%,置信度是90%。
四、討論與結論
商品交易市場專業(yè)化影響因素是分布于一定的區(qū)域空間中,具有屬性信息和空間信息,且相互之間存在一定的相關性。由于空間信息的存在和統(tǒng)計獨立性假設的無法滿足,從而使得傳統(tǒng)的分析方法無能為力。空間關聯(lián)規(guī)則可以反映要素的空間、非空間信息之間的關系,適合進行商品交易市場專業(yè)化關聯(lián)分析??臻g關聯(lián)規(guī)則分析要求數據表中的數據項是離散的,然而專業(yè)指數和影響因素數據都是連續(xù)的。連續(xù)數據離散化是空間關聯(lián)分析的第一步工作。上圖顯示了2005年中國億元商品交易市場省區(qū)專業(yè)化指數連續(xù)值和離散值的空間分布情況。通過對比我們可以發(fā)現:連續(xù)數據表達更精確;離散數據表達更易理解。上表顯示了空間關聯(lián)分析獲得的強關聯(lián)規(guī)則。在指定的最小置信度和最小支持度下,我們只能獲得后件為商品交易市場專業(yè)化是中等水平的關聯(lián)規(guī)則。不同的關聯(lián)規(guī)則前件,對應的置信度和支持度也各不相同。連續(xù)數據離散化是關聯(lián)分析前最為重要的數據處理過程。不同的離散化方法得到的離散化結果存在很大的差異,最終影響關聯(lián)分析的結果。本文中采用的等距離離散化方法將所有連續(xù)數據轉換成三個等級的離散值:高、中和低。由于專業(yè)化指數和影響因素的連續(xù)數值集中于一個很窄的數據范圍內,從而導致了離散化后數據集中于中水平等級。如最終的挖掘結果所示,所有強規(guī)則的后件都是專業(yè)化水平中,其他兩個等級為后件的規(guī)則都被最小支持度和可信度過濾掉了。同時缺失數據的插值算法和統(tǒng)計數據本身的精度對離散化的結果也有著重要的影響。商品交易市場專業(yè)化是衡量一個地區(qū)所有商品交易市場的經濟總量在各類交易市場之間的集中程度,其反映了經濟總量的一種分布模式?;谇叭说难芯炕A,作者給出了商品交易市場專業(yè)化指數的計算公式??臻g關聯(lián)規(guī)則被用于對商品交易市場專業(yè)化與其影響因素之間關聯(lián)分析,如最后分析結果所示,我們得到了三條有趣的關聯(lián)規(guī)則。這些規(guī)則可以用來預測一個地區(qū)商品交易市場專業(yè)化的水平,也可以為商品交易市場的規(guī)劃與建設提供決策支持。
注:張雪伍為通訊作者
參考文獻:
[1]任興洲:我國商品批發(fā)交易市場的發(fā)展現狀與趨勢[J].經濟縱橫, 2000, (8): 26~27
[2]王克臣李敏:入世五年我國億元商品交易市場快步走過[J].數據, 2007, (7): 28~30
[3]楊松:北京商品交易市場的發(fā)展模式及管制方式 (一) [J]. 中國市場, 2007, (30): 24~27