摘 要:更新投入產出(input-output,IO)表作為一種非調查技術一直受到普遍重視。已有的文獻強調整合目標表的信息,在不同程度上忽視了保持初始表的原有結構。本文提出添加保零約束以保持初始表的零值結構,并采用九種更新方法,將中國1997年和2002年的IO表分別向前和倒推更新到2000年的IO表。通過與現(xiàn)有2000年的IO延長表進行比較檢驗,我們發(fā)現(xiàn):第一,添加保零約束不僅能繼承初始表的零值結構,而且極大提高了各種更新方法計算結果的精度;第二,添加保零約束不僅提高了各種更新方法的局部精度,而且提高了整體精度,其中以交叉熵法的精度提高最大;第三,以1997年為初始表的更新結果好于以2002年為初始表的倒推更新結果暗示著現(xiàn)有的2000年IO延長表有待于必要的修正。
關鍵詞:投入產出表;更新;保零約束
中圖分類號:F223 文獻標識碼:A 文章編號:1003-5192(2008)02-0055-07
Comparative Research on Improving Input-output Updating Methods with Zero-preservation Constraints
FAN Jin1, WAN Xing2, HU Han-hui2
(1. Research Center of Jiangsu Applied Economics, Jiangsu Administration Institute, Nanjing
210004, China; 2. School of Economics and Management, Southeast University, Nanjing 210096, China)
Abstract:Updating input-output (IO) tables is always highlighted as a non-survey technique. Existing literatures attach importance to integrating information about target tables, and neglect preserving the structure of the original table. The paper proposes adding zero-preservation constraints so as to keep the zero structure of the original table, and adopts nine updating methods forecasting China’s IO table from 1997 to 2000 and backcasting China’s IO table from 2002 to 2000. The updating results are compared with available IO table of 2000. The following findings are obtained: first, zero-preservation constraints can both inherit the zero structure of the original table and upgrade updating accuracy of methods; second, both partitive and holistic accuracy are upgraded, and the method of cross entropy enjoy the largest improvement among all methods; third, the fact that an updating result from 1997 IO table is better than that from 2002 IO table implies that existing IO table of 2000 should be revised.
Key words:input-output table; updating; zero-preservation constraint
1 引言
投入產出(Input-Output, IO)技術,作為研究經濟系統(tǒng)各部分(作為生產單位或消費單位的產業(yè)部門、行業(yè)和產品等)間表現(xiàn)為投入與產出的相互依存關系的經濟數(shù)量分析方法,自諾貝爾經濟學獎得主Leontief提出以后,已發(fā)展成為一項較為成熟的理論[1]。由于編制一張IO表需要大量的人力、物力以及時間投入,以至于每年編一張表既不可能也無必要,而且即使是在編表年份,當年IO表的公布一般也要滯后2~3年,所以缺乏時效性一直成為影響IO表和CGE模型研究的最主要的瓶頸之一。為此,對各種用于更新、建立新的IO表的非調查(或半調查)技術的研究一直受到最普遍的重視。
IO表的更新是基于目標表的可得信息,一般是行列和信息等,將初始表更新為所要的目標表。更新過程實質是最大限度地繼承初始表的結構,并充分利用關于目標表的現(xiàn)有信息。這里IO表的結構指IO表矩陣所具有的數(shù)學特征。其直接影響到IO表更新過程中能否求得可行解。已有文獻將較多注意力放在整合目標表的現(xiàn)有信息,然而由于大量IO表更新問題中初始表和目標表的間隔時間并不長(通常為1~3年,因為普查表每5年才實施和公布一次),因此,保持初始表與更新表結構的連續(xù)性和一致性非常重要[2]。
由于產業(yè)結構和技術的特點,因此IO表中存在大量零值單元格。一般認為IO系數(shù)是以緩慢和穩(wěn)定的方式演化的[3],故而短期內初始表和目標表的零值結構應該非常接近,甚至可以近似相同。在IO表更新中,保持初始表的零值結構不僅具有合理的經濟學意義,而且在數(shù)學上也有利于模型的優(yōu)化求解。本文將嘗試添加保零約束條件,保持IO初始表的零值結構。本文研究目的是解決以下問題:在IO表更新過程中,如果我們添加保零約束,對更新精度有什么影響?就不同方法而言,這種影響的作用程度如何?從時間維度看,順序更新和倒推更新是否會改變這種影響?
2.1 幾種代表性IO表更新方法
作者將已有的IO表更新的方法大致分為三類:統(tǒng)計學更新法、優(yōu)化更新法以及宏觀經濟更新方法[2]。由Stone所提出的RAS方法一直就是研究人員進行IO表更新的最基本工具[4, 5]。隨著運籌學的發(fā)展,特別是求解非線性規(guī)劃的各種算法和軟件的發(fā)展,優(yōu)化方法成為IO表更新的主流方法之一。第三類方法目前尚不多見。已有的研究包括用CGE模型模擬的方法對IO表進行更新[6],以及建立經濟計量投入產出模型更新IO表[7]。鑒于第三類方法需要建立更加復雜的模型,且需要大量外生信息,故目前應用還不廣泛。本文僅選用第一類和第二類方法中部分代表更新技術進行IO表更新。
表的直接消耗系數(shù)、目標年IO表的直接消耗列系數(shù)之和以及目標年IO表的直接消耗行系數(shù)之和。如無特別的說明,下文中這些字母具有相同的含義。(2)式和(3)式為加總約束,(4)式為非負約束qij≥0。
2.1.3 加權絕對值法
考慮到IO表方陣中不同系數(shù)對更新精度有著不同的影響,我們可以在目標方程中賦予系數(shù)變化不同的權重,如(5) 式[8],其約束條件同樣為(2)、(3)及(4)式。我們稱(5)式為加權絕對值法。(5)式暗含對大系數(shù)的變動施加較大的懲罰。
2.1.4 標準化絕對值法
與(5)式類似,改變目標方程的權重得到(6) 式[9],其約束條件同樣為(2)、(3)及(4)式。我們稱(6)式為標準化絕對值距離(normalized absolute difference)。(6)式暗含著對小系數(shù)的變動施加較大的懲罰。
2.1.5 最小二乘法
minz=∑i∑jaij-qij2(7)
(7)式為最小二乘法的目標函數(shù),其約束條件為 (2)、(3)及(4)式。最小二乘法借鑒了計量經濟學中對參數(shù)的估計方法,將初始系數(shù)和更新系數(shù)差值的平方作為距離,即目標函數(shù)。
2.1.6 加權最小二乘法
考慮到IO表方陣中不同系數(shù)對更新精度有著不同的影響,我們可以在目標方程中賦予系數(shù)變化不同的權重,如(8) 式[10],其約束條件同樣為(2)、(3)及(4)式。我們稱(8)式為加權最小二乘法。(8)式暗含對大系數(shù)的變動施加較大的懲罰。
2.1.7 標準化最小二乘法
與(8)式類似,改變目標方程的權重得到(9) 式[10],其約束條件同樣為(2)、(3)及(4)式。我們稱(9)式為標準化絕對值距離(normalized least square)。(9)式暗含對小系數(shù)的變動施加較大的懲罰。
2.1.8 交叉熵(cross entropy)法
上世紀90年代以來,研究人員將信息理論中的熵方法運用到IO表的更新中[11~13]。交叉熵方法的估計程序是最小化新的和先驗估計概率距離的交叉熵指標。運用到IO表更新中,該問題就是通過最小化新舊IO表的交叉熵,尋找一個新的更新表,使其接近初始表。其數(shù)學表達式如(10)式所示,其約束條件同(2)、(3)及(4)式。
因此,我們可以用初始表和更新表的直接消耗系數(shù)列向量夾角的余弦作為目標函數(shù),如(11)式所示[14],其約束條件同(2)、(3)及(4)式。(11)式中ai×1和qi×1分別表示初始IO表和更新表的列向量,〈ai×1,qi×1〉表示這兩個列向量內積,‖ai×1‖和‖qi×1‖表示這兩個列向量的范數(shù)。
2.2 添加保零約束
以上2.1.2~2.1.9共計8種優(yōu)化更新方法都采用了加總約束(2)及(3)式和非負約束(4)式。在實際求解過程中,由于添加了非負約束,最優(yōu)解往往取在非負約束的邊界,即零值處求得,因而導致更新所得目標表可能存在大量零值。所以,采用非負約束使得更新不能有效繼承初始表的零值結構。我們用(12)與(13)式表征的保零約束取代非負約束。
保零約束具有兩重含義:(12)式保證了初始系數(shù)為零,則對應的更新系數(shù)也為零。(13)式保證了若初始系數(shù)不為零,則對應的更新系數(shù)也不為零。(13)式中δ為一大于零的正數(shù),其具體數(shù)值由程序調試決定,我們選取能得到最高更新精度的δ值,一般取0.5左右。
保零約束的意義不僅在于有利于數(shù)學規(guī)劃的求解,而且也有恰當?shù)慕洕鷮W含義。IO系數(shù)的變化反映了技術變遷,而技術變遷導致了新資本的積累,但是,新技術和新資本的使用將是一個漫長的過程,在相當長時間內它們將與舊技術和舊資本共存[3]。因此,我們認為:IO系數(shù)是以緩慢和穩(wěn)定的方式演化的,在較短時期內,IO表應保持其結構,其中也包括零值結構。
3 實證檢驗
3.1 檢驗方法的說明
本文以中國1997年與2002年的實際IO表為初始IO表,分別將其更新到2000年的現(xiàn)有IO表。1997年和2002年的IO表為普查得到,文中我們稱之為實際表,2000年的IO表是基于1997年的實際表延長得到,本中我們稱之為現(xiàn)有表。2002年公布的IO表采用了新的產業(yè)分類標準(GB/T 4754-2002),而在此以前公布的IO表都是基于舊的產業(yè)分類標準(GB/T 4754-94),這將影響各產業(yè)數(shù)據(jù)的統(tǒng)計口徑。為了使更新的結論具有可比性,根據(jù)2002年的122部門和42部門IO表,以及1997年的40部門和124部門IO表,按照國家統(tǒng)計局國民經濟核算司對三張IO表的解釋,我們建立了具有對應關系的1997和2002年37部門IO表。兩張對應IO表建立的過程如下:首先將IO表的部門進行歸并,得到部門對應一致的1997和2002年IO表,其次,將兩張IO表中的各個部門的數(shù)據(jù)口徑相統(tǒng)一。
我們利用GAMS22.4軟件編寫了上述共計9種方法的更新程序,具體包括RAS法、交叉熵法、Cosine法、絕對值距離法、加權絕對值距離法、標準化絕對值距離法、最小二乘法、加權最小二乘法、標準化最小二乘法。選擇GAMS22.4軟件中內嵌的PANLP作為上述程序的求解器,經過調試后,所有9種方法皆可以求得全局最優(yōu)解。
我們認為,一個好的IO表更新方法應該滿足下列條件:第一,接近性,即指更新所得IO表和實際IO表單元格值的接近程度。精度可以分為部分精度(partitive accuracy)和整體精度(holistic accuracy)[15]。前者反映了每個直接消耗系數(shù)與實際值的接近程度,可以直接通過比較直接消耗系數(shù)得到;后者強調更新后的IO表代表實際經濟結構的能力,我們可以通過比較更新后列昂惕夫逆矩陣與現(xiàn)有2000年IO表的列昂惕夫逆矩陣表示整體精度。第二,保零性,即更新表是否保持了初始表的零值結構,這有兩層含義:一方面,初始表為零的單元格,更新表也應該為零;另一方面初始表不為零的單元格,更新表也應該不為零。第三,方向性,即對各單元格值而言,更新IO表所反映的各單元格變化方向應和實際IO表所反映的變化方向相一致。
迄今為止用來度量IO表或SAM更新接近程度的指標很多,但是沒有哪個指標全面優(yōu)于其他指標。各指標滿足了特定的要求,在特定方面具有領先優(yōu)勢??紤]到這一點,一些研究人員采用一攬子互為補充的指標來度量IO表或SAM更新的誤差[14,16]。
本文將采用STPE(standardized total percentage error)以及SWAD(standardized weighted absolute difference)進行檢驗。STPE表示對矩陣的平均誤差。STPE的缺點是平均地看待所有系數(shù)的變動,而不同系數(shù)對更新精度的影響并不一樣。我們希望對更新精度影響較大的大系數(shù)變化較小。作為對STPE的補充,我們采用SWAD指標,以對大系數(shù)變動的偏差施加更大的懲罰。STPE及SWAD指標的計算公式如下
其中bij表示目標年IO表的實際直接消耗系數(shù),qij表示更新所得到的IO表的直接消耗系數(shù)。接近程度檢驗的計算結果見表1與表2。
保零檢驗具有實際經濟意義。IO表第二象限中的零值單元格表示對應該單元格的兩個部門之間沒有發(fā)生交易。由于一個國家(或地區(qū))在一定時期內其產業(yè)結構和技術水平具有相對穩(wěn)定性,所以在此期間內IO表零值單元格將仍然保持零值,非零值單元格保持非零值??缙趯嶋HIO表的比較也印證了該假設基本正確:1997年中國IO表有145個零值直接消耗系數(shù),2002年中國IO表有142個零值直接消耗系數(shù),這兩張IO表中有135個對應零值單元格。在各種更新方法的程序設計過程中,我們加入了保零約束(4)式和(5)式,并且比較了是否添加保零約束對IO表更新精度的影響。
方向檢驗同樣具有實際經濟意義。從1997年到2000年或從2000年到2002年中國的產業(yè)結構發(fā)生了特定方向的變化。經濟中的這種實際變化方向可以由不同投入產出表中直接消耗系數(shù)的變化方向反映出來。將1997年或2002年的初始IO表中直接消耗系數(shù)和2000年現(xiàn)有IO表中的直接消耗系數(shù)相比較,我們可以確定各系數(shù)實際的方向變化。將1997年或2002年的初始IO表中直接消耗系數(shù)和我們更新所得2000年目標IO表相比較,可以確定我們更新所反映的變化方向。更新所反映的變化方向和實際變化方向是否相一致,方向檢驗可以回答這個問題。
我們將未通過保零檢驗或方向檢驗的IO系數(shù)統(tǒng)稱為問題系數(shù)。本文中問題系數(shù)的個數(shù)應該是未通過保零檢驗的系數(shù)的個數(shù)加上未通過方向檢驗的系數(shù)的個數(shù)再減去同時未通過兩種檢驗的系數(shù)的個數(shù)。問題系數(shù)的個數(shù)越多,更新誤差越大,因此問題系數(shù)在一定程度上反映了IO表更新的精度。保零檢驗和方向檢驗的結果見表3和表4。
3.2 檢驗結果
第一,優(yōu)化類方法加上保零約束后,無論是從部分精度還是從整體精度角度,各方法接近程度指標的檢驗結果都有所改善。雖然保零約束改善了各優(yōu)化方法的更新結果,但是只有交叉熵法和標準化最小二乘法能夠取得與RAS方法相近或相同的更新精度。
第二,保零約束對各種方法更新結果的改進程度相差較大。我們可以發(fā)現(xiàn),添加保零約束后,標準化最小二乘法和Cosine法的更新精度變動很小,交叉熵法的更新精度提高最大。奇怪的是,在以往用交叉熵法更新IO表的文獻中,并沒有添加保零約束,而交叉熵的更新結果也是最好的[17]。我們認為這可能有以下原因:第一,以往的學者直接將RAS方法用于交叉熵法的更新,而RAS方法自動滿足保零性,從表1和表2可以看出,RAS方法相當于添加了保零約束的交叉熵法;第二,有些學者可能加上了本文中的約束(4)[16],我們試驗發(fā)現(xiàn)在矩陣較小的情況下,交叉熵法在只加約束(4)的情況下,就能得到和同時加約束(4)和約束(5)相近的結果。
第三,從整體精度看,即使不添加保零約束,所有方法的更新精度都不比初始表差;從部分精度看,若不添加保零約束則四種更新方法的部分精度不如初始表,即加權絕對值、交叉熵、標準化絕對值和加權最小二乘法。經過測算發(fā)現(xiàn),添加保零約束后,STPE指標所反映的不同方法部分精度和整體精度的提高幾乎相同,而SWAD指標所反映的不同方法部分精度和整體精度的提高相差較大。這反映了保零約束對IO表更新的影響具有平均效應。
表3和表4顯示:
第一,添加保零約束后,除了標準化最小二乘法從2002年倒推更新的結果略有下降外,其他方法更新結果中問題系數(shù)的個數(shù)均有不同程度的下降,而且絕大多數(shù)方法在添加保零檢驗后,不僅繼承了初始表的零值結構,而且方向檢驗的結果也得到改善。 第二,各種方法在添加保零約束前后的表現(xiàn)相差較大。我們可以看出,即使不添加保零約束,標準化類方法和交叉熵法也基本滿足保零要求,而其他方法則與初始表的零值結構相差甚遠。第三,從時間維度進行比較,無論是否添加保零約束,各種方法從1997年到2000年更新結果中問題系數(shù)的個數(shù)要小于該方法從2002年倒推更新結果中問題系數(shù)的個數(shù)。這和上面接近程度檢驗中的計算結果類似。
表1~表4的更新結果都顯示,無論從接近程度檢驗、方向檢驗或保零檢驗結果看,從1997年到2000的更新結果要好于從2002年到2000年的倒推更新結果。這絲毫不奇怪,2000年現(xiàn)有表是以1997年普查表為基礎,采用重點系數(shù)調查方法延長所得。因此2000年現(xiàn)有IO表在一定程度上繼承了1997年IO表的結構。然而這也可能導致現(xiàn)有2000年IO表偏離實際。一般認為技術系數(shù)是以緩慢和穩(wěn)定的方式演化的[3],而2002年在時間距離上比1997年更接近2000年,因此,我們有理由相信2000年的IO表結構應更加接近2002年的IO表結構。此外,特別需要指出的是,2006年8月正式公布的2002年IO表已經根據(jù)2004年第一次全國經濟普查數(shù)據(jù)進行了必要的修正。所以,增添保零約束,以2002年IO表對現(xiàn)有2000年IO表進行修正不僅是必要的,而且是必需的。
4 結論
在IO表更新技術的研究中,較多文獻將注意力放在合理利用有關目標年的信息,比如外生估計重點系數(shù),添加有關外生系數(shù)可靠度的信息。然而,如果預測年份之間間隔不長(比如1~3年),則最大限度保持初始年IO表的結構對提高更新精度同樣大有益處。本文所提出的具有兩重含義的保零約束正滿足了該要求。
本文通過實證研究發(fā)現(xiàn),添加保零約束后,無論從接近程度檢驗,還是從方向檢驗看,各優(yōu)化方法的更新精度都得到了提高。添加保零約束對各種方法的改進效果并不一致,從接近程度指標看,添加保零約束不僅提高了各優(yōu)化方法的局部精度,而且提高了整體精度,其中交叉熵法的精度提高最大。
從時間維度看,無論是否添加保零約束,從1997年IO表順序更新到2000年IO表的更新結果都要好于相應方法從2002年倒推更新的結果。這是由于2000年現(xiàn)有IO表是由1997年IO表延長而來,在很大程度上保留了1997年IO表的結構。這暗示著我們甚至可以利用最新的2002年IO表,通過添加保零約束對原有的1997年IO表進行必要的修正。
此外,由于IO是社會核算矩陣(Social Accounting Matrices, SAM)的核心部分,而SAM將IO表與宏觀經濟賬戶統(tǒng)一在一個平衡、封閉的框架中,其中包含了家庭、企業(yè)、政府和國外等部門,因此它反映了生產、活動、要素和其他各經濟部門間的聯(lián)系。所以,本文所使用的添加保零約束的IO更新方法同樣也適用于SAM更新。
參 考 文 獻:
[1]鐘契夫,陳錫康,劉起運.投入產出分析[M].北京:中國財政經濟出版社,1993.
[2]范金,萬興.投入產出表和社會核算矩陣更新研究綜述[J].數(shù)量經濟技術經濟研究,2007,(5):113-122.[3]Miguel A T, Padlo D R. Projection of input-output tables by means of mathematical programming based on the hypothesis of stable structural evolution[J]. Economic Systems Research, 2005, 17(1): 1-24.
[4]唐小我.RAS 方法的改進算法[J].電子科技大學學報,1992,(1):98-103.
[5]Junius T, Oosterhaven J. The solution of updating or regionalizing a matrix with both positive and negative entries[J]. Economic Systems Research, 2003, 15(1): 87-96.
[6]Benjamin L B, Ahmadi-Esfahani F Z. Updating an input-output table for use in policy analysis[J]. Australian Journal of Agricultural and Resource Economics, 1998, 44(4): 573-603.
[7]Israilevich P R, Hewings G D, Sonis M. Forecasting structural change with a regional econometric input-output model[J]. Journal of Regional Science, 1997, 37(4): 565-590.
[8]Lahr M L. Reconciling domestication techniques, the notion of re-exports, and some comments on regional accounting[J]. Economic Systems Research, 2001, 13: 166-179.
[9]Matuszewski T, Pitts P R, Sawyer J A. Linear programming estimates of changes in input-output coefficients[J]. Canadian Journal of Economics and Political Science, 1964, 30: 203-211.
[10]Friedlander D. A technique for estimating contingency tables[J]. Journal of the Royal Statistical Society, 1961, 124: 412-420.
[11]Golan A, Judge G, Robinson S. Recovering information from incomplete or partial multisectoral economic data[J]. Review of Economics and Statistics, 1994, 76(3): 541-549.
[12]Thissen M, Logfren H. A new approach to SAM updating with an application to egypt[J]. Environment and Planning, 1998, 30(11): 1991-2003.
[13]Robinson S, Cattaneo A, El-Said M. Updating and estimating a social accounting matrix using cross entropy methods[J]. Economic Systems Research, 2001, 13(1): 47-64.
[14]Jalili A R. Evaluating relative performances of four non-survey techniques of updating input-output coefficients[J]. Economics of Planning, 2000, 33(3): 221-237.
[15]Jensen R C. The concept of accuracy in regional input-output models[J]. International Regional Science Review, 1980, 5(2): 139-154.
[16]Cardenete M A, Sancho F. Sensitivity of CGE simulation results to competing SAM updates[J]. Review of Regional Studies, 2004, 34(1): 37-56.
[17]Jackson R W, Murray A T. Alternative input-output matrix updating formulations[J]. Economic Systems Research, 2004, 16(2): 135-148.
注:“本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文?!?/p>