文/林展 陳志武
當(dāng)代新史學(xué)的發(fā)展,上發(fā)了“史料之革命”,擴(kuò)展了史料的范圍,形成了多元的史料體系,進(jìn)而也上發(fā)了歷史資料的“大爆炸”。這一發(fā)展的最新表現(xiàn)是歷史數(shù)據(jù)庫(kù)的大量出現(xiàn)。量化歷史在如何利用大規(guī)模數(shù)據(jù)庫(kù)方面,已經(jīng)形成了較為完善的分析方法。本文希望在量化歷史研究步驟及其對(duì)歷史研究的價(jià)值這兩方面提出一些初步的想法。
量化歷史研究是交叉學(xué)科,是用社會(huì)科學(xué)理論和量化分析方法來(lái)研究歷史,其目的是發(fā)現(xiàn)歷史規(guī)律,即人類行為和人類社會(huì)的規(guī)律。量化歷史研究稱這些規(guī)律為因果關(guān)系;量化歷史研究的過(guò)程,就是發(fā)現(xiàn)因果關(guān)系的過(guò)程。
理解量化歷史研究的含義,一般需要結(jié)合三個(gè)角度,即社會(huì)科學(xué)理論、量化分析方法、歷史學(xué)。
第一個(gè)角度是量化歷史研究廣泛借鑒社會(huì)科學(xué)的理論。理論對(duì)于歷史研究的價(jià)值在于為分析、理解歷史提供一個(gè)基準(zhǔn)和框架。這一框架能夠幫助研究者從紛繁復(fù)雜的史料中快速梳理出研究的起點(diǎn)、參照系或靶子,成為理解歷史的重要工具。
第二個(gè)角度是量化分析方法。這包括統(tǒng)計(jì)學(xué)、計(jì)量經(jīng)濟(jì)學(xué)、人工智能等領(lǐng)域的方法。量化方法是不斷發(fā)展的,新的方法不斷出現(xiàn),能夠處理的數(shù)據(jù)量越來(lái)越多、效率越來(lái)越高,發(fā)現(xiàn)的結(jié)論也會(huì)越來(lái)越可靠。目前在社會(huì)科學(xué)研究中,實(shí)證研究正在從統(tǒng)計(jì)推斷向因果推斷轉(zhuǎn)變,這種轉(zhuǎn)變被稱為“可信性革命”。這場(chǎng)革命的核心是基于隨機(jī)試驗(yàn)的思想來(lái)獲得因果關(guān)系,即規(guī)律性認(rèn)識(shí)。
第三個(gè)角度是量化歷史研究與歷史學(xué)的關(guān)系。兩者的關(guān)系體現(xiàn)在量化方法不是要取代傳統(tǒng)歷史研究方法,而是對(duì)后者的一種補(bǔ)充。量化史學(xué)同樣注重對(duì)歷史文獻(xiàn)的考證、確認(rèn),這一點(diǎn)沒(méi)有區(qū)別。
量化歷史是新史學(xué)的重要組成部分,盡管新史學(xué)有不同的含義,但一般都強(qiáng)調(diào)盡可能結(jié)合人文社會(huì)科學(xué)的知識(shí)和方法來(lái)研究歷史。隨著人文社會(huì)科學(xué)研究方法的量化程度大大提高,量化分析已經(jīng)在社會(huì)科學(xué)研究中唱主角,在人文學(xué)科中的影響也越來(lái)越大。
典型的量化歷史研究大致分為五個(gè)步驟:提出問(wèn)題和假說(shuō);尋找史料和數(shù)據(jù);對(duì)數(shù)據(jù)進(jìn)行量化分析,尋找因果關(guān)系;對(duì)發(fā)現(xiàn)的因果關(guān)系進(jìn)行解釋和尋找作用機(jī)制;論文寫(xiě)作。在此,我們以圍繞《新教倫理與資本主義精神》展開(kāi)的量化研究為例,討論量化歷史研究的主要步驟。
在《新教倫理與資本主義精神》一書(shū)中,韋伯指出,新教倫理越強(qiáng)的地方,經(jīng)濟(jì)可能越繁榮,這被認(rèn)為是關(guān)于文化與經(jīng)濟(jì)發(fā)展最重要的論斷。為表述方便,我們暫時(shí)稱之為“韋伯假說(shuō)”。韋伯假說(shuō)隱含了新教倫理可能影響經(jīng)濟(jì)發(fā)展的途徑:一是新教徒工作更為努力;二是新教徒儲(chǔ)蓄更多,進(jìn)而投資更多,從而提高了長(zhǎng)期的生產(chǎn)率。上述兩種途徑使得新教倫理推動(dòng)了資本主義發(fā)展。
但這只是解釋資本主義經(jīng)濟(jì)發(fā)展的觀點(diǎn)之一。對(duì)于這一觀點(diǎn),是否應(yīng)該接受?如何來(lái)檢驗(yàn)?如果基于史料,正如韋伯所發(fā)現(xiàn)的,新教徒數(shù)量越多的地方,經(jīng)濟(jì)發(fā)展更好,就能斷定新教倫理推動(dòng)了資本主義發(fā)展嗎?對(duì)上述問(wèn)題的回答,構(gòu)成了一項(xiàng)典型的量化歷史研究。
這一研究由兩位經(jīng)濟(jì)學(xué)家貝克爾(Becker)和沃斯曼(Woessmann)完成。他們利用19世紀(jì)普魯士452個(gè)縣(郡)級(jí)政區(qū)的調(diào)查數(shù)據(jù),發(fā)現(xiàn)新教徒占比越高的地區(qū),經(jīng)濟(jì)發(fā)展確實(shí)越好,這與韋伯的發(fā)現(xiàn)一致。但是,當(dāng)他們將各地平均識(shí)字率的差別和新教徒占比的差別放到一起時(shí),發(fā)現(xiàn)后者的影響消失了。他們認(rèn)為,新教之所以推動(dòng)了經(jīng)濟(jì)增長(zhǎng),主要是由于馬丁·路德呼吁所有人自己去閱讀《圣經(jīng)》并直接跟上帝對(duì)話,從而(意料之外地)提高了讀寫(xiě)能力,促進(jìn)了人力資本的提升。因此,是人力資本,而不是新教的思想倫理,推動(dòng)了經(jīng)濟(jì)的增長(zhǎng)。
下面結(jié)合貝克爾和沃斯曼的研究和其他的量化歷史研究,對(duì)量化歷史研究的步驟進(jìn)行詳細(xì)說(shuō)明。
量化歷史研究的第一步是提出問(wèn)題和假說(shuō)。在韋伯假說(shuō)中,研究的問(wèn)題是新教倫理是否導(dǎo)致了資本主義的增長(zhǎng)。相對(duì)于研究問(wèn)題,假說(shuō)則更進(jìn)一步,認(rèn)為新教倫理導(dǎo)致了資本主義增長(zhǎng)。假說(shuō)是對(duì)人類行為和社會(huì)規(guī)律的一個(gè)猜測(cè)(猜想)。這個(gè)猜測(cè)是對(duì)其關(guān)心的變量關(guān)系的一個(gè)明確表述。比如儒家文化阻礙了創(chuàng)新,儒家文化減少了社會(huì)沖突,等等。由于是假說(shuō),其可能會(huì)被數(shù)據(jù)所證偽。
上面的假說(shuō),基本上都涉及兩個(gè)變量,比如韋伯假說(shuō)中,涉及新教倫理和資本主義經(jīng)濟(jì)發(fā)展。在量化歷史研究中,把希望解釋的對(duì)象叫作被解釋變量,把用來(lái)解釋的對(duì)象叫作解釋變量。韋伯假說(shuō)中的被解釋變量是資本主義經(jīng)濟(jì)發(fā)展,解釋變量是新教倫理。影響資本主義發(fā)展的因素很多,這些因素和新教倫理共同影響了資本主義發(fā)展,為了發(fā)現(xiàn)新教倫理這個(gè)單一因素的作用,需要把其他影響因素的效果也揭示出來(lái),排除出去。這些其他的影響因素,一般稱之為控制變量。
假說(shuō)被提出之后,研究的路線圖也就形成了。一個(gè)假說(shuō)需要證明解釋變量如何影響被解釋變量,因此首先需要對(duì)被解釋變量和解釋變量進(jìn)行度量,然后通過(guò)量化方法尋求兩者之間的關(guān)系,以及對(duì)這種關(guān)系進(jìn)行解釋。
即使在定性研究中,也存在大量的假說(shuō),只是由于研究者沒(méi)有特意強(qiáng)調(diào),不容易被人察覺(jué)。傳統(tǒng)的歷史研究,避免帶著問(wèn)題閱讀史料,那么量化歷史研究先提出問(wèn)題和假說(shuō),再去收集整理史料的好處是什么?
首先提出問(wèn)題和假說(shuō)的好處,一是可以方便跟已有文獻(xiàn)對(duì)話,確定新的貢獻(xiàn)在哪里。史料可能證實(shí)也可能證偽提出的問(wèn)題或假說(shuō),如果是證偽,已有的觀點(diǎn)會(huì)被推翻,則更容易形成重要的發(fā)現(xiàn)。定性研究的特點(diǎn)在于,常常會(huì)有很多的假說(shuō)放在一起討論,這有利于揭示更多歷史細(xì)節(jié),但不利于將復(fù)雜的歷史條分縷析,將其中的規(guī)律揭示出來(lái)。二是便于與不同學(xué)科交流,回答不同學(xué)科的重要問(wèn)題。比如對(duì)韋伯假說(shuō)的研究,雖然討論的是普魯士的情況,但其基本問(wèn)題是文化如何影響經(jīng)濟(jì)發(fā)展,研究者可以在這一問(wèn)題之下,討論基督教在中國(guó)的發(fā)展、儒家文化等對(duì)中國(guó)經(jīng)濟(jì)的影響。這不僅有利于在這些重大問(wèn)題中提供中國(guó)經(jīng)驗(yàn)、中國(guó)故事,也有利于知識(shí)的積累。三是可以基于要驗(yàn)證的假說(shuō),從被解釋變量、解釋變量和控制變量的角度,高效率地組織史料。最后需要指出的是,量化歷史在研究開(kāi)始就提出問(wèn)題和假說(shuō),但這不是預(yù)設(shè)結(jié)論,而是猜測(cè),這個(gè)猜測(cè)可能被史料證實(shí),也可能被證偽。
提出問(wèn)題和假說(shuō)之后,我們需要尋找史料來(lái)建立數(shù)據(jù)庫(kù),即找到被解釋變量、解釋變量、控制變量等度量指標(biāo)和數(shù)據(jù)。
在拿到相關(guān)的史料和數(shù)據(jù)之后,量化方法并非像很多批評(píng)所說(shuō)的那樣,對(duì)數(shù)據(jù)和史料拿來(lái)就用,而是先從不同的維度對(duì)它們的質(zhì)量進(jìn)行檢驗(yàn)。下面主要從量化歷史的角度討論如何理解史料,重點(diǎn)是理解史料的代表性問(wèn)題。
在歷史研究中,拿到的史料往往只是所關(guān)心的研究對(duì)象的一部分,只能夠基于拿到的史料去開(kāi)展研究。盡管隨著歷史大數(shù)據(jù)時(shí)代的到來(lái),有時(shí)候可以拿到關(guān)于研究對(duì)象的全部史料,但這樣的情況還比較少見(jiàn)?;谘芯繉?duì)象的部分信息對(duì)研究對(duì)象的特征進(jìn)行分析,是統(tǒng)計(jì)學(xué)研究的核心之一。這里就涉及總體、樣本和隨機(jī)抽樣的概念。
在統(tǒng)計(jì)分析時(shí),把研究對(duì)象的全體稱為總體,每一個(gè)研究對(duì)象稱為個(gè)體,把從總體中抽取的一部分個(gè)體稱為樣本。什么對(duì)象是總體,取決于研究問(wèn)題。如果希望知道清代中國(guó)的命案率,如果是以省為分析單位,那么每個(gè)省在每一年的命案率就是一個(gè)總體。如果只分析其中的一個(gè)或幾個(gè)省,就是樣本。如果只分析乾隆朝的命案,也是一個(gè)樣本。前者是基于空間、后者是基于時(shí)間的抽樣。
對(duì)于歷史研究而言,基于空間和時(shí)間的抽樣是非常常見(jiàn)的。一個(gè)典型的歷史研究常常會(huì)限定地域和時(shí)期。做這樣的限定,是為了避免將不同時(shí)期、不同地區(qū)的史料混用。這一方法有其特有的優(yōu)勢(shì),也是目前歷史研究中常用的方法,但從實(shí)證研究、發(fā)現(xiàn)規(guī)律的角度看,這可能會(huì)帶來(lái)選擇性偏差,研究結(jié)果不一定帶有普遍性。
選擇性偏差是指由于選擇的樣本不是隨機(jī)抽取的,所以不能基于這些樣本的特征推斷總體的特征。隨機(jī)抽取是指保證總體中每個(gè)樣本被抽中的概率都是一樣的。例如,不能夠基于江南的經(jīng)濟(jì)發(fā)展水平去推斷整個(gè)中國(guó)的經(jīng)濟(jì)發(fā)展水平。這樣的選擇性偏差非常明顯,也很容易被察覺(jué),但歷史研究中,還有大量不容易察覺(jué)到的選擇性偏差問(wèn)題。例如,傳統(tǒng)經(jīng)濟(jì)史研究中的“選精”“集粹”問(wèn)題,其實(shí)質(zhì)就是一個(gè)基于樣本推斷總體的問(wèn)題。
具體而言,如果我們希望知道北宋整個(gè)朝代的年均畝產(chǎn)量,那么北宋所有土地上每一年的畝產(chǎn)量就是一個(gè)總體。由于不知道這個(gè)總體的規(guī)模有多大,不妨做一個(gè)假定。假設(shè)北宋耕地有7億畝,平均每塊耕地面積為70畝,那么耕地?cái)?shù)量就有1 000萬(wàn)塊;再假設(shè)是一年一熟制,北宋總共存續(xù)了167年,那么理論上,北宋畝產(chǎn)量的觀察值應(yīng)該有16.7億個(gè);因此要精確地知道宋代的畝產(chǎn)量這個(gè)總體幾乎不可能。如果研究者拿到了16 700個(gè)北宋畝產(chǎn)量的歷史記載,那么這1萬(wàn)多個(gè)畝產(chǎn)量占全體畝產(chǎn)量的比例約為十萬(wàn)分之一。然而,這十萬(wàn)分之一的樣本能否推斷總體呢?
由于研究者拿到的史料通常是樣本,但希望了解的是總體,如何由樣本推斷總體就成為挑戰(zhàn)。這種挑戰(zhàn)在定性和定量研究中都存在,盡管定性研究中不用這套術(shù)語(yǔ),但不代表這個(gè)挑戰(zhàn)不存在。定量研究的好處在于,可以明確展示這種挑戰(zhàn),同時(shí)利用已有的量化方法克服這種挑戰(zhàn)。
基于總體和樣本的理解,可以知道,歷史大數(shù)據(jù)或增加數(shù)據(jù)量,并不必然會(huì)解決“選精”與“集粹”的問(wèn)題。應(yīng)對(duì)選擇性偏差,基于非隨機(jī)抽樣的樣本來(lái)推斷總體的特征,是量化分析方法特別是計(jì)量經(jīng)濟(jì)學(xué)分析方法的核心關(guān)注之一。
在提出問(wèn)題和收集數(shù)據(jù)之后,第三步是量化分析。量化分析方法主要有三類。第一是對(duì)數(shù)據(jù)進(jìn)行描述統(tǒng)計(jì),主要包括數(shù)據(jù)的來(lái)源、處理過(guò)程,觀察值也即樣本量的多少,每個(gè)變量的統(tǒng)計(jì)特征,比如平均值、方差等。描述統(tǒng)計(jì)主要針對(duì)單個(gè)變量進(jìn)行分析。這一方法比較簡(jiǎn)單,在歷史學(xué)研究中較常見(jiàn),不贅述。第二是相關(guān)性分析,主要分析方法包括畫(huà)散點(diǎn)圖、畫(huà)地圖、計(jì)算相關(guān)系數(shù)等。這一方法主要用于分析兩個(gè)變量之間的關(guān)系。第三是因果關(guān)系分析,通常使用多元回歸分析的方法,重點(diǎn)是處理內(nèi)生性問(wèn)題和發(fā)現(xiàn)作用機(jī)制。
提出假說(shuō)實(shí)際上是提出一個(gè)相關(guān)關(guān)系。相關(guān)關(guān)系分為三種,分別指正相關(guān)、負(fù)相關(guān)和不相關(guān)。正相關(guān)是指兩個(gè)變量朝相同的方向變動(dòng),比如新教徒數(shù)量越多的地區(qū),經(jīng)濟(jì)發(fā)展水平越高。負(fù)相關(guān)是指兩個(gè)變量往相反的方向變動(dòng),比如儒家文化越發(fā)達(dá)的地方,發(fā)生暴力沖突的次數(shù)會(huì)更少。不相關(guān)是指兩個(gè)變量的變動(dòng)沒(méi)有關(guān)聯(lián)。韋伯在《新教倫理與資本主義精神》中開(kāi)篇就提到他所發(fā)現(xiàn)的相關(guān)性。這種相關(guān)性構(gòu)成了這一專著的起點(diǎn)和基石。
韋伯顯然沒(méi)有滿足于只是發(fā)現(xiàn)新教徒數(shù)量與經(jīng)濟(jì)發(fā)展之間的相關(guān)性,而是繼續(xù)追尋背后的因果關(guān)系。因果關(guān)系的基本含義是改變一個(gè)變量的值,就可以使另一個(gè)變量的值改變。相關(guān)關(guān)系不等于因果關(guān)系,相關(guān)關(guān)系中可能隱含有因果關(guān)系,也可能沒(méi)有,一般需要進(jìn)一步證明。
學(xué)界早已注意到,在定性研究中,本身就隱含了眾多的因果推斷。由于通常情況下,歷史學(xué)家沒(méi)有明確意識(shí)到其中包含的某種函數(shù)關(guān)系,更難想到在可能的條件下用量化方法檢驗(yàn)。這使得這些論斷,即使經(jīng)過(guò)一定史實(shí)檢驗(yàn),陳述的時(shí)候也顯得缺乏說(shuō)服力,經(jīng)不住計(jì)量檢驗(yàn)。
導(dǎo)致相關(guān)關(guān)系不等于因果關(guān)系的問(wèn)題,一般也稱為內(nèi)生性問(wèn)題。造成內(nèi)生性問(wèn)題的主要原因,一種是遺漏變量,一種是反向因果。遺漏變量是指有一個(gè)變量在研究過(guò)程中沒(méi)有被考慮到,一旦這個(gè)變量被考慮進(jìn)來(lái),就能夠解釋為什么之前觀察的兩個(gè)變量之間存在相關(guān)關(guān)系。比如在韋伯假說(shuō)中,一旦考慮到人力資本這個(gè)變量,就會(huì)看到新教徒數(shù)量與經(jīng)濟(jì)發(fā)展水平之間沒(méi)有了相關(guān)關(guān)系。這時(shí)候的人力資本,就是一個(gè)遺漏變量。反向因果是指因果關(guān)系的影響方向與預(yù)判的方向是相反的,或者存在互為因果的情況。比如,在韋伯假說(shuō)中,就可能存在經(jīng)濟(jì)發(fā)展?jié)摿υ酱蟮牡貐^(qū),越可能選擇新教。這時(shí)候就不能得出結(jié)論說(shuō)是新教徒越多的地方,經(jīng)濟(jì)越發(fā)展。
既然因果關(guān)系是研究的目的,因果推斷在定性研究中也很常見(jiàn),那么,如何來(lái)進(jìn)行因果推斷呢?
在自然科學(xué)中,可以通過(guò)重復(fù)試驗(yàn)來(lái)解決這一挑戰(zhàn)。通過(guò)將影響實(shí)驗(yàn)結(jié)果的其他因素都控制住,考察一個(gè)因素變動(dòng)帶來(lái)的影響。在醫(yī)學(xué)中,一般要通過(guò)大樣本雙盲對(duì)照試驗(yàn)發(fā)現(xiàn)因果關(guān)系,其背后的原理就是實(shí)驗(yàn)方法。以醫(yī)學(xué)中對(duì)藥物有效性的驗(yàn)證為例,在什么情況下,才能夠說(shuō)一種藥物對(duì)于某種疾病有效?在新型冠狀病毒疫情治療案例中,一種藥物對(duì)某位美國(guó)患者有明顯的療效,是否就可以下判斷說(shuō)這種藥物是有效的呢?這里面至少存在兩個(gè)問(wèn)題需要解決,首先是這個(gè)患者不僅僅只服用了這種藥物,可能也服用了其他的藥物,或者是使用了其他的治療方式,到底是哪一種藥物或治療方式起作用,需要區(qū)分開(kāi),但是我們只能觀察到多個(gè)因素共同起作用的結(jié)果。其次是某些疾病即使是不吃藥,有些人也能自愈,因而就有可能遺漏掉患者會(huì)自愈這個(gè)影響因素。為了證明某種藥物的作用,通常需要做大規(guī)模隨機(jī)對(duì)照試驗(yàn)。
歷史不能夠做試驗(yàn),但研究者發(fā)現(xiàn),在某些情況下,歷史可以很好地充當(dāng)實(shí)驗(yàn)室。在量化歷史中,一般稱之為(準(zhǔn))自然試驗(yàn),即依靠歷史事件模擬隨機(jī)對(duì)照試驗(yàn),將歷史對(duì)象分為對(duì)照組和處理組。貝克爾和沃斯曼對(duì)于韋伯假說(shuō)的檢驗(yàn)就是利用準(zhǔn)自然試驗(yàn)的方法,這也是目前量化歷史研究中最為常用的方法?;跉v史自然實(shí)驗(yàn)的思路,實(shí)證研究方法有工具變量法、差分方法、斷點(diǎn)回歸方法等。
上述發(fā)現(xiàn)因果關(guān)系方法的實(shí)現(xiàn),都需要通過(guò)回歸分析。回歸分析是一種統(tǒng)計(jì)方法,通過(guò)建立統(tǒng)計(jì)模型,用一個(gè)或多個(gè)解釋變量來(lái)解釋被解釋變量。在量化歷史研究中,多元回歸分析是最為常用的方法。
還是以韋伯假說(shuō)為例,我們能夠觀察到的是不同地區(qū)的經(jīng)濟(jì)發(fā)展水平,但影響經(jīng)濟(jì)發(fā)展的因素很多?;诮?jīng)濟(jì)增長(zhǎng)理論,直接原因有技術(shù)、物質(zhì)資本、人力資本等,而根本原因則有制度、地理、文化等。這么多因素共同作用,影響了一個(gè)地區(qū)的經(jīng)濟(jì)發(fā)展。如何將新教倫理與其他因素分離出來(lái)呢?如果觀察到一個(gè)縣(郡),新教徒的數(shù)量很多,但經(jīng)濟(jì)發(fā)展較慢,能否就說(shuō)新教倫理對(duì)于經(jīng)濟(jì)增長(zhǎng)起到了反向的作用,即新教徒數(shù)量越多,經(jīng)濟(jì)發(fā)展越差,或者沒(méi)有影響。這里可能遺漏了另外的影響因素。具體來(lái)說(shuō),假如新教倫理平均可以讓經(jīng)濟(jì)增長(zhǎng)快1%,但另外一個(gè)因素可以讓經(jīng)濟(jì)增長(zhǎng)慢2%,最后,雖然看到一個(gè)地區(qū)新教徒數(shù)量很多,但是經(jīng)濟(jì)增長(zhǎng)還可能是負(fù)的。出現(xiàn)這樣的問(wèn)題,正是因?yàn)檫z漏了重要的其他影響因素。多元回歸分析正是將重要的影響因素都盡可能考慮到,并將不同因素的影響剝離開(kāi)的方法。
通過(guò)上面步驟建立因果關(guān)系后,還需要知道為什么這種因果關(guān)系會(huì)發(fā)生,即作用機(jī)制是什么。在對(duì)“韋伯假說(shuō)”的論證中,貝克爾和沃斯曼發(fā)現(xiàn)新教徒數(shù)量越多的地方,經(jīng)濟(jì)增長(zhǎng)越快,起作用的機(jī)制是新教徒的識(shí)字率更高,而不是新教倫理。
機(jī)制研究是量化分析的核心組成部分,其價(jià)值在于揭示發(fā)現(xiàn)的因果關(guān)系是如何起作用的,其原理在哪里,也是對(duì)因果關(guān)系的進(jìn)一步支撐。對(duì)于作用機(jī)制的分析,一般需要從三個(gè)方面進(jìn)行。第一,起作用的機(jī)制變量,比如人力資本,必須與解釋變量高度相關(guān),即新教倫理越高的地方,人力資本應(yīng)該越高。第二,需要說(shuō)明機(jī)制變量與被解釋變量高度相關(guān),即人力資本越多的地方,經(jīng)濟(jì)發(fā)展?fàn)顩r更好。第三,需要說(shuō)明,當(dāng)同時(shí)考慮作用機(jī)制變量和解釋變量之后,解釋變量的解釋力變小或消失,即系數(shù)在統(tǒng)計(jì)上顯著性下降或不顯著;而機(jī)制變量有很強(qiáng)的解釋力,即系數(shù)在統(tǒng)計(jì)上顯著。也就是說(shuō),當(dāng)不同的解釋出現(xiàn)的時(shí)候,最好的辦法是使用“賽馬模式”,將可能的解釋變量都放到同一個(gè)多元回歸模型中進(jìn)行分析。
量化歷史是新史學(xué)的重要組成部分,量化方法對(duì)歷史學(xué)的價(jià)值主要體現(xiàn)在三個(gè)方面。
一是應(yīng)對(duì)歷史大數(shù)據(jù)的挑戰(zhàn),幫助分析復(fù)雜的歷史。隨著大規(guī)模史料的出版、公開(kāi)、數(shù)據(jù)庫(kù)化,歷史大數(shù)據(jù)時(shí)代已經(jīng)到來(lái)。
歷史大數(shù)據(jù)包含兩層含義。第一是史料接近全樣本,也就是可以掌握研究對(duì)象的總體。比如關(guān)于清代官員的信息,由于有縉紳錄和地方志,清代中后期絕大多數(shù)官員的信息都能夠得到還原。根據(jù)前述樣本與總體關(guān)系,隨著歷史學(xué)家掌握總體,統(tǒng)計(jì)推斷帶來(lái)的挑戰(zhàn)會(huì)下降,但因果推斷的挑戰(zhàn)依然存在,需要應(yīng)用最新的量化方法來(lái)應(yīng)對(duì)。第二是數(shù)據(jù)量巨大。比如,僅清代刑科題本檔案就有近65萬(wàn)件。歷史大數(shù)據(jù)出現(xiàn)之后,使用定性方法顯然難以將這么多的數(shù)據(jù)作一個(gè)整體分析,從中得出經(jīng)驗(yàn)性的認(rèn)識(shí),但量化分析方法卻可以較好地應(yīng)對(duì)這種挑戰(zhàn)。因?yàn)閿?shù)據(jù)量的加大很大程度上只是對(duì)計(jì)算機(jī)計(jì)算能力提出了更高的要求,而量化分析的基本原理沒(méi)有發(fā)生大的變化。
二是識(shí)別歷史的長(zhǎng)期影響,形成貫通性認(rèn)識(shí)。歷史的長(zhǎng)期影響,是人們關(guān)心歷史的重要原因。今天很多重要的社會(huì)結(jié)構(gòu)性特征,都與歷史有關(guān)。比如,儒家文化對(duì)今天中國(guó)人的影響。那如何識(shí)別出歷史的影響呢?實(shí)際上,在量化歷史研究中,有很多這方面的研究,一般被稱之為“遺產(chǎn)(legacy)”研究。
一個(gè)例子是科舉制度的長(zhǎng)期影響。陳婷等結(jié)合歷史上的科舉數(shù)據(jù)、今天的統(tǒng)計(jì)數(shù)據(jù)和大量微觀調(diào)查數(shù)據(jù),發(fā)現(xiàn)科舉制度即使廢除了,那些歷史上出進(jìn)士較多的地區(qū),今天平均的受教育年限更長(zhǎng),對(duì)教育的重視程度更高。之所以產(chǎn)生這樣的影響,主要是由于對(duì)教育觀念的重視。
量化方法對(duì)歷史長(zhǎng)期影響的分析,也有助于形成貫通性的認(rèn)識(shí)。盡管強(qiáng)調(diào)時(shí)間性和打通斷代是歷史學(xué)研究的重要訴求,但中國(guó)悠久的歷史留存下來(lái)的史料汗牛充棟,要從中對(duì)某些歷史特征進(jìn)行長(zhǎng)時(shí)段的描述,具有挑戰(zhàn)性。這種困難,通過(guò)簡(jiǎn)單的量化分析,就可以得到緩解?;跁r(shí)間序列數(shù)據(jù)和面板數(shù)據(jù),可以快速地對(duì)歷史時(shí)期非常重要的歷史事件進(jìn)行長(zhǎng)時(shí)段的描述、與世界其他地區(qū)已有的研究進(jìn)行對(duì)比。更重要的是,這有助于改善知識(shí)創(chuàng)造和積累的方式,以后的學(xué)者可以在此基礎(chǔ)上作進(jìn)一步的推進(jìn),而不需要從頭開(kāi)始閱讀史料。
三是推動(dòng)歷史學(xué)與社會(huì)科學(xué)的交流與對(duì)話。史學(xué)被認(rèn)為是一切社會(huì)科學(xué)的基礎(chǔ),應(yīng)該成為社會(huì)科學(xué)理論創(chuàng)新的源泉,但從實(shí)際情況看,史學(xué)還沒(méi)有起到應(yīng)有的作用。
量化歷史直接從問(wèn)題和假說(shuō)出發(fā)開(kāi)始研究,這些問(wèn)題和假說(shuō)也受到不同社會(huì)科學(xué)的關(guān)注。如果假說(shuō)得到證實(shí),由于歷史提供的實(shí)驗(yàn)室,使得理論被接受的可能性和可靠性得到增強(qiáng),基于中國(guó)歷史的例子也可以很好地融入社會(huì)科學(xué)理論之中。如果假說(shuō)和理論被證偽,則會(huì)更好地推動(dòng)理論的修改,形成重要的理論創(chuàng)新,這正是社會(huì)科學(xué)真實(shí)的發(fā)展過(guò)程。比如,諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主米爾頓·弗里德曼等人通過(guò)對(duì)1867—1960年美國(guó)貨幣史的量化歷史研究,推導(dǎo)出了著名的貨幣層次理論及貨幣供應(yīng)理論,是對(duì)經(jīng)濟(jì)學(xué)理論的重要貢獻(xiàn)。當(dāng)然,歷史的作用不僅僅是社會(huì)科學(xué)理論的實(shí)驗(yàn)室,對(duì)于理論的證實(shí)和證偽還可以從不同的角度增進(jìn)對(duì)歷史的認(rèn)識(shí)。
隨著歷史大數(shù)據(jù)時(shí)代的到來(lái),如何高效處理大規(guī)模史料并從中獲得規(guī)律性認(rèn)識(shí),是當(dāng)代歷史學(xué)面臨的新挑戰(zhàn)。量化方法經(jīng)過(guò)數(shù)十年的發(fā)展,已經(jīng)在應(yīng)對(duì)大規(guī)模數(shù)據(jù)庫(kù)、發(fā)現(xiàn)因果關(guān)系方面走在了前面。將量化分析方法和歷史大數(shù)據(jù)結(jié)合起來(lái),是新史學(xué)的重要內(nèi)容,也是一種必然趨勢(shì)。
強(qiáng)調(diào)量化歷史研究的優(yōu)勢(shì),并非意味著這些優(yōu)勢(shì)很快就能夠?qū)崿F(xiàn),一項(xiàng)好的量化歷史研究需要很多條件的配合,也需要大量堅(jiān)實(shí)的工作。而量化歷史研究作為一個(gè)新興的領(lǐng)域,仍然處于不斷完善的過(guò)程之中。在使用量化歷史研究方法的過(guò)程中,也需要注意其適用的條件,任何一種方法都有其適用的范圍和局限,一項(xiàng)研究的發(fā)展也需要學(xué)術(shù)共同體的監(jiān)督和批評(píng)。量化方法作為“史無(wú)定法”中方法的一種,在歷史大數(shù)據(jù)時(shí)代,作用將越來(lái)越大。