張浩然
(廣東財經(jīng)大學 經(jīng)濟學院,廣東 廣州)
回歸分析是《計量經(jīng)濟學》《統(tǒng)計學》《社會調(diào)查(研究)方法》《醫(yī)學統(tǒng)計學》等課程的核心內(nèi)容,它在自然科學、經(jīng)濟學、管理學等領(lǐng)域的定量分析中有著廣泛的應用[1]。同時,經(jīng)濟學、管理學、法學、理學、工學、醫(yī)學等多個學科門類的課程也應用到回歸分析。例如,國內(nèi)權(quán)威的城市規(guī)劃教材,同濟大學吳志強主編的《城市規(guī)劃原理(第四版)》專門介紹了回歸分析,用于預測規(guī)劃期末城市人口規(guī)模,作為規(guī)劃城市建設(shè)用地的依據(jù)。在社會科學領(lǐng)域中,經(jīng)濟學、管理學、社會學和心理學都是基于數(shù)據(jù)的學科,回歸分析無疑是最重要的分析工具之一。在循證醫(yī)學(Evidence-Based Medicine)方面,作為國際公認的腫瘤治療規(guī)范標準NCCN 指南(National Comprehensive Cancer Network,美國國立綜合癌癥網(wǎng)絡(luò))參考了很多基于隨機對照試驗和回歸分析的文獻。讀懂醫(yī)學領(lǐng)域四大頂刊:新英格蘭醫(yī)學雜志(NEJM)、美國醫(yī)學會雜志(JAMA)、柳葉刀(Lancet)、英國醫(yī)學期刊(BMJ)也需要必要的回歸分析方法,由此可見回歸分析在教學和研究中的重要性。
就回歸分析的教學而言,最好采用計量經(jīng)濟學的教學體系。計量經(jīng)濟學是數(shù)學、統(tǒng)計學和經(jīng)濟學三者結(jié)合[2]的一門文理滲透的方法論課程,也被一些數(shù)學出身的學者稱為經(jīng)濟計量學。如果采用合適的教學手段,本科的計量經(jīng)濟學教學可以使學生讀懂《美國社會學評論》等權(quán)威期刊多數(shù)論文的回歸分析部分,而社會學普遍使用的教材艾爾巴比的《社會研究方法》則無法實現(xiàn)這一目的[3]。 鑒于此,本文從回歸分析教學中存在的實際問題出發(fā),進一步提出相應的對策,為回歸分析的教學實踐提供參考。
現(xiàn)有回歸分析教學和經(jīng)驗研究存在較大的距離[4]。比如,在社會科學和醫(yī)學的經(jīng)驗研究中,因果關(guān)系的識別處于核心地位,但傳統(tǒng)的回歸分析教學并沒有將因果推斷作為核心,對于魯賓因果模型和各種識別方法關(guān)注較少,基本沒有涉及倍差法、斷點回歸等現(xiàn)代專題。現(xiàn)有教學內(nèi)容花費了很多篇幅介紹異方差、自相關(guān)的檢驗與修正,卻沒有介紹大樣本條件下普遍采用的異方差、聚類穩(wěn)健標準誤,不利于學生掌握實用的統(tǒng)計方法。實際上,現(xiàn)代經(jīng)濟學中的因果推斷方法對于學生理解經(jīng)濟學、社會學、教育心理學、管理學和醫(yī)學等方面的教材和論文有很大幫助。比如,格里格和津巴多主編的本科層次普通心理學經(jīng)典教科書《心理學與生活(第19 版)》第3 章的案例就基于雙重差分方法探討了后葉催產(chǎn)激素與信任的關(guān)系。
在本科教學階段,學生花費了大量時間進行給定假設(shè)條件下的數(shù)學證明,但對于假設(shè)的含義及其與因果識別的關(guān)系缺乏直觀的理解。財經(jīng)類專業(yè)的本科生學習了統(tǒng)計學和計量經(jīng)濟學課程,雖然掌握了一定的矩陣推導技巧,卻不能夠基于理論的指導建立合適的回歸模型,缺乏實際應用能力。
國內(nèi)教材選擇的一些案例大多基于宏觀或自編數(shù)據(jù),缺少生動有趣的案例,難以把機制說清楚,不利于激發(fā)學生的學習興趣。國外較為流行的《基本無害的計量經(jīng)濟學》在探討選擇性偏誤時選擇的案例是否曾因病在醫(yī)院過夜與自評健康水平的關(guān)系,雖然不是狹義的經(jīng)濟學問題,但非常直觀,有助于培養(yǎng)社會科學直覺,加深對問題的理解。
財經(jīng)類專業(yè)本科層次的回歸分析課程應在正確理解現(xiàn)代統(tǒng)計學和經(jīng)濟計量學分析框架和方法的前提下,合理設(shè)計教學體系和教學內(nèi)容,基于大城市的生產(chǎn)率優(yōu)勢、婚前同居與離婚率、大氣污染與預期壽命等典型案例,盡可能避免(或緩解)由內(nèi)生性問題所產(chǎn)生的估計偏誤,結(jié)合Stata 等統(tǒng)計軟件的使用,系統(tǒng)介紹和探討社會科學研究方法,展現(xiàn)社會科學的定量研究邏輯體系,引導學生以科學思維思考社會問題。具體來說,應該在以下幾個方面有所突破:
在教材方面,最好結(jié)合中國的實際情況,選擇經(jīng)典教材。通過教學實踐,斯托克和沃森、伍德里奇以及安格里斯特的經(jīng)典教材被國內(nèi)外高校普遍采用。哥倫比亞大學經(jīng)濟系本科生的計量經(jīng)濟學教材選擇的是斯托克(Stock)和沃森(Watson)的Introduction to Econometrics,該教材結(jié)構(gòu)較為完整,國內(nèi)已有漢語翻譯版,是合適的選擇。同時,2021 年諾貝爾經(jīng)濟學獎獲得者安格里斯特(Angrist)的《精通計量:從原因到結(jié)果的探尋之旅》體系新穎,但不夠全面,該教材將因果推斷作為本科計量經(jīng)濟學教學的核心重新構(gòu)建了本科計量經(jīng)濟學的教學體系,可以與其他經(jīng)典教材互為補充。在國內(nèi)教材方面,葉阿忠的《計量經(jīng)濟學》(中國人民大學出版社,2021 年出版)由于是初版,有一些小錯誤,但結(jié)構(gòu)相對新穎,也有較為豐富的案例。在課外讀物方面,邱嘉平的《因果推斷實用計量方法》縮短了計量經(jīng)濟學理論學習與經(jīng)驗研究的距離,為學生畢業(yè)論文的撰寫提供了有益的指導;李井奎著的《大偵探經(jīng)濟學》則提供了豐富有趣的教學案例。
就回歸分析的教學內(nèi)容而言,應在第一節(jié)課就介紹隨機對照試驗和因果推斷,并貫穿教學過程始終。教學應以實驗和準實驗作為基準,將與因果效應密切相關(guān)的內(nèi)生性問題的處理作為教學的核心。課程內(nèi)容側(cè)重于對微觀尺度的信息建模,利用現(xiàn)代統(tǒng)計和計量方法識別變量之間的因果關(guān)系。為了保證統(tǒng)計推斷的有效性,課程應考慮引入異方差穩(wěn)健標準誤和聚類穩(wěn)健標準誤,刪減異方差檢驗等相關(guān)內(nèi)容,即不再將異方差作為一種需要解決的問題,而是在模型設(shè)定時就允許異方差存在,并采用異方差穩(wěn)健標準誤。
課程體系可以依次包括以下內(nèi)容:(1)隨機實驗;(2)多元線性回歸模型;(3)多元回歸專題(介紹對數(shù)模型、交互項模型等本質(zhì)線性回歸模型);(4)實踐中的工具變量;(5)斷點回歸設(shè)計;(6)面板數(shù)據(jù)、固定效應和雙重差分方法;(7)非標準的標準誤問題;(8)數(shù)據(jù)來源與預處理;(9)Stata 或R 軟件操作與案例。與傳統(tǒng)教學內(nèi)容不同,課程將工具變量、斷點回歸和雙重差分等現(xiàn)代計量方法納入教學體系。
在回歸模型的應用中,無論是總體回歸模型的設(shè)定、內(nèi)生性處理還是結(jié)果的解釋都需要經(jīng)濟學、政治學、社會學和管理學等相關(guān)理論的指導。專業(yè)學術(shù)論文不僅需要干凈的識別,還要闡述內(nèi)在影響機制,這些都需要理論的指導。因而在進行課堂教學時需要對涉及的理論進行適度的回顧和討論。在課堂教學中,還應該結(jié)合學術(shù)論文引導學生掌握回歸分析結(jié)果的呈現(xiàn)方式,能夠根據(jù)表格信息對影響程度和顯著性水平進行解讀。對于跨學科問題,回歸分析的教學不僅僅需要統(tǒng)計學和經(jīng)濟計量學的支撐,而且需要經(jīng)濟學、政治學、社會學、心理學、管理學、人文地理學等學科基礎(chǔ)的支持,因而需要教師根據(jù)學生所在專業(yè)進行自主學習,拓寬知識面。
教學過程應該注重理論與應用相結(jié)合,全面系統(tǒng)地對回歸分析的理論和方法進行介紹,不僅涵蓋多元回歸分析等基本的回歸方法,而且也應將面板數(shù)據(jù)回歸方法納入教學體系。在授課過程中應重點討論經(jīng)驗研究中面臨的內(nèi)部有效應和外部有效問題,如遺漏變量、雙向因果關(guān)系、函數(shù)形式誤設(shè)、變量測量誤差、選擇偏誤等。由于本科生數(shù)學基礎(chǔ)參差不齊,因此在回歸分析教學過程中除了必要的數(shù)學推導,還應對統(tǒng)計思想進行直觀的講授[5]。
回歸分析是應用性課程,為了引導學生基于社會經(jīng)濟現(xiàn)象構(gòu)建合適的回歸模型,需要學生熟練使用統(tǒng)計軟件[6]。目前,國內(nèi)高校普遍采用的Eviews 軟件更擅長時間序列模型,擴展性不足。哥倫比亞大學經(jīng)濟系、中大嶺南學院等國內(nèi)外知名院系普遍采用Stata 或R??紤]到Stata 功能全面[7],在社會科學和醫(yī)學領(lǐng)域普遍應用,較R 更容易掌握,筆者推薦采用Stata 進行實驗教學。為了彌補Stata 在大數(shù)據(jù)處理和數(shù)據(jù)抓取方面的不足,網(wǎng)絡(luò)爬蟲部分內(nèi)容可以采用Python 進行教學,為學生未來的深造和就業(yè)打下更堅實基礎(chǔ)。
近年來,回歸分析方法在政治學、社會學等其他社會科學和醫(yī)學領(lǐng)域得到了廣泛的應用。因而在教學過程中,案例可以不完全來源于狹義的經(jīng)濟學。比如在因果推斷方面,可以舉一些有趣的現(xiàn)實案例:婚前同居與離婚率;離婚與子女發(fā)展;父母入獄與子女發(fā)展;讀書與賺錢;學區(qū)房溢價;就業(yè)的性別歧視等等。通過以上案例的分析增強學生對內(nèi)生性問題的理解,取得更好的教學效果。
教學案例的選擇最好來源于重要的學術(shù)刊物或領(lǐng)域杰出學者的工作論文,并根據(jù)學生所在學校和專業(yè)進行適當取舍。例如,對于地理科學學院的學生,斷點回歸部分的案例可以采用2020 年克拉克獎獲得者哈佛大學經(jīng)濟系Dell教授基于地理斷點回歸(spatial regression discontinuity)的系列研究,如非法交易網(wǎng)絡(luò)與墨西哥毒品戰(zhàn)爭[8]等。自然地理與資源環(huán)境、人文地理與城鄉(xiāng)規(guī)劃、地理信息科學等專業(yè)的學生先期學習過地理信息系統(tǒng)理論和軟件等相關(guān)課程,熟悉Arcgis 空間分析功能,能夠從專業(yè)的角度更好地理解回歸方法。
對于二本財經(jīng)院校的財經(jīng)類專業(yè)學生,斷點回歸的案例可以選擇賈瑞雪和李宏彬的工作論文“The Value of Elite Education in China”,該文章利用了高考一本線提供的自然實驗,發(fā)現(xiàn)一流大學教育可以使工資提升30%-40%。二本財經(jīng)院校財經(jīng)類專業(yè)學生高考時的分數(shù)線有些達到了一本線,但是最終進入二本院校,對與自身經(jīng)歷息息相關(guān)的研究主題感興趣。從高考錄取分數(shù)線切入講授斷點回歸,更加清晰易懂,又能夠兼顧對工具變量排他性約束的討論,能夠獲得較好的教學效果。對于非洲留學生的教學,Nunn 關(guān)于非洲奴隸貿(mào)易的長期影響的系列文章以及Acemoglu 關(guān)于《發(fā)展差異的殖民地起源》的經(jīng)典文獻都是較好的選擇。筆者在教學的過程中發(fā)現(xiàn)所在學校非洲留學生學習意愿普遍不足,漢語水平無法滿足學習需要,但英文水平較佳,采用非洲主題的經(jīng)典英文文獻能夠便于學生理解教學內(nèi)容,取得較好的教學效果。對于社會學和社會心理學專業(yè)的學生,文章可以取材于較新的社會學權(quán)威刊物,如《American Sociological Review》以及《社會學研究》。二本院校社會學相關(guān)專業(yè)本科生對于以費孝通為代表的人類學民族學研究范式較為熟悉,但統(tǒng)計訓練普遍不足。一個學期的回歸分析課程應該可以使本科生較好地理解多數(shù)采用回歸分析方法的社會學學術(shù)論文。
倍差法的案例選擇可以來自“雙重差分小公主”錢楠筠(Nancy Qian)關(guān)于消失的女性與茶葉價格等相關(guān)研究,能夠兼顧嚴謹性和趣味性,并加深學生對發(fā)展中國家男女性別失衡問題的理解。另外一些研究,如發(fā)表在《經(jīng)濟研究》上的《香煙、美酒和收入》采用微觀入戶調(diào)查數(shù)據(jù)發(fā)現(xiàn)飲酒對收入具有顯著的提升作用,使個體收入提升7%,且飲酒對女性收入的影響大于男性。而吸煙對收入的影響較小,且在統(tǒng)計上不顯著[9]。該研究采用家庭成員吸煙和飲酒比例作為工具變量,可能無法滿足工具變量的外生性假設(shè),從而無法干凈地識別吸煙、飲酒對收入的因果效應,在嚴謹性方面有不足之處,但其研究主題具有重要的現(xiàn)實意義和一定的趣味性,也可以作為案例來源,需在授課過程中適當討論工具變量的識別假設(shè)是否得到滿足,如果不滿足將對估計結(jié)果產(chǎn)生怎樣的影響等問題。
在數(shù)據(jù)選擇方面,應根據(jù)學生所學專業(yè)進行篩選。比如,對會計學和金融學專業(yè)的學生,應多采用工業(yè)企業(yè)數(shù)據(jù)庫、上市公司等企業(yè)數(shù)據(jù),關(guān)注公司金融等領(lǐng)域的研究主題,對人力資源、勞動和社會保障專業(yè)的學生,應多采用中國家庭追蹤調(diào)查(CFPS)、中國勞動力動態(tài)調(diào)查(CLDS)等微觀調(diào)查數(shù)據(jù),對經(jīng)濟學專業(yè)的學生,應多采用統(tǒng)計和普查數(shù)據(jù),對數(shù)學和計算機專業(yè)的學生,應引導學生多通過網(wǎng)絡(luò)爬蟲方法獲取數(shù)據(jù)。
就非社會科學專業(yè)的學生而言,可以加強回歸預測方面的教學,應該盡可能獲取來自真實產(chǎn)業(yè)環(huán)境的數(shù)據(jù)[10],如二手房掛牌價格、五星級酒店掛牌價格、電影票房數(shù)據(jù)等,在回歸分析的教學過程中適當融入機器學習方法。在教學內(nèi)容和案例的選擇方面,不應將視角局限于傳統(tǒng)的經(jīng)濟學領(lǐng)域,而應適當補充一點有趣的醫(yī)學、心理學、政治學、社會學和管理學高質(zhì)量期刊的案例以及真實的商業(yè)數(shù)據(jù),加深學生對于回歸分析基本方法的理解,提高學生的學習興趣和社會科學的分析能力,拓展學生的就業(yè)渠道。