——神經(jīng)經(jīng)濟學“生理效用”理論解析"/>
江 晴 吳逸群
當實證主義傳統(tǒng)遇到“大腦黑箱”——神經(jīng)經(jīng)濟學“生理效用”理論解析
江 晴 吳逸群
[摘 要]神經(jīng)經(jīng)濟學關(guān)于人類決策行為的最新研究對實證主義傳統(tǒng)諱莫如深的“大腦黑箱”進行了深刻剖析。本文通過對神經(jīng)經(jīng)濟學“生理效用”理論和DDM模型及其應用價值的深入解讀,發(fā)現(xiàn)大腦決策過程實則是神經(jīng)系統(tǒng)對“滿意程度”的生物計算和評估過程,即一個對決策價值信號賦值與比較的過程。這些研究第一次系統(tǒng)地在人們的內(nèi)在神經(jīng)活動與外在決策行為之間建立起了一種直觀的聯(lián)系,且認為如果決策行為是由大腦對決策價值進行適應性編碼產(chǎn)生的,那么無論決策的情境有何差異,其在大腦決策機制中都有著相似的編碼過程。因此存在一個對跨情境選擇行為和反應時間做出一般預測的可能性,稱為共同決策機制。這為解決簡單情況下離散選擇的樣本外預測提供了新思路。顯然,神經(jīng)經(jīng)濟學正在深層次上悄然改變著經(jīng)典經(jīng)濟學的固有思維模式,為決策理論的微觀基礎(chǔ)提供了全新的科學詮釋。
[關(guān)鍵詞]生理效用 DDM模型 大腦黑箱 實證主義傳統(tǒng) 決策行為
實證主義傳統(tǒng)*實證主義傳統(tǒng)是以新古典經(jīng)濟學為代表的主流經(jīng)濟學的標志性研究方法。其哲學思想可追溯到19世紀孔德反對形而上學而強調(diào)經(jīng)驗證實的“實證哲學”。發(fā)展到20世紀上半葉,克里克等人結(jié)合邏輯分析方法將實證分為“邏輯實證”和“經(jīng)驗實證”兩個環(huán)節(jié),創(chuàng)立了“新實證主義”。由于“新實證主義”更加強調(diào)前者的重要性,故又被稱作“邏輯實證主義”,其研究模式是在建立假設(shè)的前提下,通過邏輯推演得到數(shù)理模型,強調(diào)精密計量檢驗的結(jié)果。本文所論述的實證主義傳統(tǒng)是指這里的“邏輯實證主義”。主導下的新古典經(jīng)濟學對決策行為的研究以效用為邏輯起點,認為個體的決策過程就是最大化自身效用的過程。顯然,效用的本質(zhì)是心理學的范疇,而心理又是人腦的功能。然而,新古典經(jīng)濟學卻回避了這個原本不容忽視的核心機制,簡單牽強地將大腦視為“黑箱”,致使傳統(tǒng)經(jīng)濟學決策理論只能用假設(shè)出來的外在尺度表示滿意程度?;谛в米畲蠡睦硇赃x擇模型也不過是“as if”(好像)的模型,即假設(shè)個體滿足一致性公理的前提下,就“好像”存在著一個能將選擇結(jié)果與效用相聯(lián)系的效用函數(shù),且其選擇行為“好像”是在最大化這個潛在的效用函數(shù)。而更致命的是由此產(chǎn)生的期望效用理論和貼現(xiàn)效用理論成為新古典經(jīng)濟學決策理論的基石,并用精美的數(shù)學語言描述個體以自身利益最大化為目標的決策過程。這些理性選擇模型忽視了產(chǎn)生決策行為的真實生理過程,而僅把決策行為看作是機械的計算過程。這雖然實現(xiàn)了經(jīng)濟學體系內(nèi)部的邏輯自洽,卻因偏離人類真實的行為邏輯而日益受到不斷涌現(xiàn)的“異象”挑戰(zhàn)。
神經(jīng)經(jīng)濟學*Neuroeconomics是Neurology(神經(jīng)生物學)與Economics(經(jīng)濟學)的合成詞,最早于1996年由喬治梅森大學的Kevin McCabe提出。中國關(guān)于神經(jīng)經(jīng)濟學的研究尚處于起步階段。最初國內(nèi)學者曾將Neuroeconomics譯為“神經(jīng)元經(jīng)濟學”,近年來隨著Neuromanagement(神經(jīng)管理學)、Neuroethics(神經(jīng)倫理學)、Neuromarketing(神經(jīng)營銷學)等以Neuro為前綴命名的學科被相繼命名為“神經(jīng)某某學”,國內(nèi)學界也按慣例將Neuroecomics統(tǒng)稱作“神經(jīng)經(jīng)濟學”。本文沿用“神經(jīng)經(jīng)濟學”提法。從神經(jīng)生物學、心理學角度對經(jīng)濟學決策行為進行探討,借助功能磁共振成像技術(shù)(fMRI)、腦電圖(EEG)、正電子發(fā)射計算機斷層掃描(PET)、單光子發(fā)射斷層掃描(SPECT)、經(jīng)顱磁刺激(TMS)等先進的腦成像技術(shù)將決策研究深入到個體行為的內(nèi)在神經(jīng)基礎(chǔ),正視被實證主義傳統(tǒng)所忽視的一個重要問題:作為生物人的經(jīng)濟個體其真實的決策過程、基礎(chǔ)、規(guī)律是什么?更值得關(guān)注的是——當這個被視為不可得知的“大腦黑箱”被打開后,以實證主義傳統(tǒng)為代表的經(jīng)典經(jīng)濟學將面臨怎樣的改寫?
在此背景下,本文基于神經(jīng)經(jīng)濟學生理效用理論和DDM模型的解讀,對經(jīng)濟學決策理論的發(fā)展做出評述,并對實證主義傳統(tǒng)“效用”理論的微觀基礎(chǔ)進行神經(jīng)經(jīng)濟學視角的反思。
傳統(tǒng)“效用”理論對決策行為的描述采用的是簡單的代數(shù)形式。而神經(jīng)經(jīng)濟學認為個體的決策行為源于大腦活動,受到大腦不同的神經(jīng)結(jié)構(gòu)控制,是神經(jīng)系統(tǒng)對搜集的信息進行編碼和處理的產(chǎn)物。據(jù)此,神經(jīng)經(jīng)濟學家Glimcher等(2005)[1]提出了生理效用理論(physiological utility theory),認為神經(jīng)系統(tǒng)會對“滿意程度”進行真實生物計算和評估。研究者通過對猴子的神經(jīng)生物學實驗發(fā)現(xiàn)猴腦側(cè)頂葉的神經(jīng)元負責對眼睛掃視動作的相對期望效用進行編碼。即猴腦中側(cè)頂葉區(qū)域神經(jīng)元細胞的行為方式并非“好像”(as if)某種效用函數(shù),而“確實就是”(as is)某種生理效用函數(shù)。這一發(fā)現(xiàn)又被進一步推廣至人類,Glimcher等人用fMRI研究驗證了人腦中與側(cè)頂葉處于相同位置的頂內(nèi)溝具有同樣的活動特征。
這里的“生理效用”函數(shù)并不完全等同于實證主義傳統(tǒng)決策理論中的“效用”函數(shù),在基于價值的選擇(value-based choice)領(lǐng)域,表現(xiàn)為對“決策價值”(decision value)的計算與比較。現(xiàn)有研究對大腦做出簡單選擇(simple choice)時的這個工作機理已經(jīng)逐漸達成了共識。一致認為大腦中確實存在著“決策價值”信號,神經(jīng)系統(tǒng)首先會對選項進行評估賦值,然后通過比較它們的大小做出選擇。[2-4]顯然,這些研究已經(jīng)突破實證主義的邏輯框架,從生理變量角度關(guān)注決策行為。
近年來在大腦決策神經(jīng)計算機制的研究方面,神經(jīng)經(jīng)濟學取得了新的進展,建立了以神經(jīng)活動為基礎(chǔ)的決策模型。這些模型的計算結(jié)果具有“生理效用”的特征,是決策過程中大腦活動的真實反映,因而能對個體決策行為做出“as is”(確實就是)的解釋。
根據(jù)簡單選擇領(lǐng)域的研究,神經(jīng)經(jīng)濟學決策模型中的核心變量“決策價值”是神經(jīng)計算的結(jié)果,其編碼過程位于腹內(nèi)側(cè)前額葉皮層(ventral medial prefrontal cortex)(Harris等,2011[5]),該腦區(qū)不僅能對簡單選擇進行編碼,而且同樣適用于博弈、金錢的延遲支付和慈善捐贈等更加復雜的情形。不同于傳統(tǒng)經(jīng)濟理論中決策者事先已知自己的偏好并進行排序的理論假設(shè),神經(jīng)經(jīng)濟學認為個體會在選擇時對選項進行即時評價,且每個選項的決策價值由其多重屬性所決定。因此,令di(x)表示選項x的第i維屬性,則選項x的決策價值為:
vx=∑widi(x)
(1)
其中wi是第i維屬性的權(quán)重。
對決策價值進行比較是決策過程的關(guān)鍵步驟,在這方面的研究中尤其值得關(guān)注的是漂移擴散模型(drift-diffusion model)*漂移擴散模型(DDM)是序貫抽樣模型(sequential sampling models)的一種。序貫抽樣模型是被廣泛應用于心理和認知科學的動態(tài)決策模型,其基本觀點是決策者在做出選擇時,大腦中選擇信息會連續(xù)、隨機地累積,直至達到一個可以判斷選項偏好的閥值。,即DDM模型。DDM最早由心理學家Ratcliff提出并被廣泛應用于認知科學的研究,其對二元認知決策和基于價值決策的心理測量數(shù)據(jù)做出了準確描述(Ratcliff, 1978[6];Raticliff 和 Smith,2004[7];Raticliff 和McKoon,2008[8])。在經(jīng)濟學的決策研究中,DDM模型解決的是簡單情況下的隨機選擇問題,并為隨機效用模型(random utility models,RUMs)*隨機效用模型(RUMs)是對離散選擇行為做出經(jīng)濟學解釋的基礎(chǔ),由Daniel McFadden發(fā)展并應用于計量經(jīng)濟學。提供了神經(jīng)生理學基礎(chǔ)。[9]DDM模型認為大腦中的噪音會使個體對選項決策效用的評價具有隨機性,決策者對x和y兩個選項做出選擇的過程就是不斷計算兩者之間相對決策價值(relative decision value,RDV)的動態(tài)過程。RDV信號能夠衡量兩個選項價值評估的差異,并一直演變(evolve)直到達到一個預設(shè)的門檻值,即選擇屏障(choice barrier)±B。RDV若達到+B,表明決策者選擇x選項,而達到-B則表明選擇y選項。RDV隨時間變化的過程可以由以下方程表示:
Vt=Vt-1+μt+εt
(2)
其中,Vt代表t時刻的相對決策價值(RDV),μt代表達到門檻值的速度的漂移率,εt代表均值為0,方差為σ2的服從獨立同分布的高斯白噪聲。假設(shè)這個過程從V(0)=0處開始(因此對于x、y這兩個選項不存在初始偏見),并且觀察到的反應時間包括一段不對價值進行計算比較的非決策時間(non-decision time,NDT)。
式(2)中的漂移率μt是兩個選項價值差異的函數(shù)。假設(shè)該函數(shù)為線性,則漂移率可以表示為μt=d(vx-vy),其中d為常數(shù),vx、vy分別表示x、y這兩個選項的決策價值。從而,式(2)可以重寫為
Vt=Vt-1+d(vx-vy)+εt
(3)
根據(jù)這一模型,決策者做出決策所用的時間長短即反應時間(response time,RT)取決于選項之間決策價值的差異vx-vy,兩者之間的差異越大則RDV變動的斜率越陡峭,做出決策的時間越短,反之則越長,從而在反應時間和選擇問題之間建立起了清晰而明確的聯(lián)系。
DDM所描述的決策過程如圖1所示。不同于實證主義傳統(tǒng)的純粹數(shù)理模型,上述神經(jīng)經(jīng)濟學模型的最大特點在于能夠模仿腦神經(jīng)的真實工作機制,展現(xiàn)與大腦進行簡單決策時相近的算法。因為神經(jīng)元傳遞信息用的是“有或者沒有”的信號——動作電位,這一信號只有在對神經(jīng)元的輸入達到一個關(guān)鍵門檻時才會出現(xiàn)。[10]腦神經(jīng)科學研究也確實發(fā)現(xiàn)非人靈長類在進行認知決策時其側(cè)頂葉皮層有著與DDM計算機制類似的神經(jīng)活動(Shadlen和New Some,1996[11],2001[12]),而人類在進行選擇任務時該機制存在于背內(nèi)側(cè)前額葉皮層(Armel等,2008[13])。
圖1 漂移擴散模型(Drift-Diffusion Model)決策機制的圖解
DDM對于簡單決策過程中選擇行為和反應時間的解釋力已經(jīng)得到了神經(jīng)科學研究的證實。Mormann等(2010)[14]通過真實情境下的食物選擇實驗,第一次從行為神經(jīng)科學角度檢驗了DDM在基于價值的選擇領(lǐng)域的應用效果。他們首先讓被試者對備選食物的喜好程度評分,用來衡量每個選項的決策價值。然后向被試者隨機展示兩種食物的圖片,讓其從中選擇更愿意在實驗結(jié)束后吃掉的那項,并記錄反應時間和選擇正確率。在之后的模型擬合過程中,他們發(fā)現(xiàn)的確可以得到相關(guān)參數(shù)使DDM模型的預測與觀察到的選擇行為及反應時間分布之間具有顯著的定量匹配度。
上文介紹的是DDM基本的標準形式。在此基礎(chǔ)上,考慮到注視(visual fixations)*注視(visual fixations)這里也即注意力(attention),涉及大腦在不同情境下配置計算資源(computational resources)的能力,這種配置計算資源的能力在決策過程中非常重要,因為大腦的計算資源是稀缺資源,會隨能量的消耗而減少。對決策價值比較過程的引導作用,神經(jīng)經(jīng)濟學家又進一步提出了注視調(diào)節(jié)下的漂移擴散模型(attentional drift-diffusion model),即aDDM模型(Krajbich等,2010[15])。其核心思想是決策者對某一選項的注視會導致暫時的漂移偏差,從而造成對該選項的選擇偏好。aDDM與基本的DDM最大的區(qū)別在于每個特定的瞬間RDV變動的斜率都取決于注視的定位,且該斜率與被注視項和未被注視項之間的權(quán)重差異成比例。這個權(quán)重差異使得未被注視項的價值相對低于被注視項,從而令選擇行為偏向于獲得更多注視的選項。以對左右兩個選項進行的二元選擇為例,aDDM的表達式為:
(4)
(5)
隨后,Krajbich和Rangel(2011)[17]又成功擴展了aDDM的數(shù)學形式,將其應用于三元選擇領(lǐng)域。該模型與二元情況下的關(guān)鍵區(qū)別在于有三個相對價值信號,每個選項對應一個信號。支持相應選項的證據(jù)(evidence)以不同的速率累積,該速率取決于備選項的價值及其是否被注視。例如,當被試者注視左邊選項時相應的累積速率可用下式表示:
(6)
(7)
(8)
這里的Et代表t時刻積累的支持相應選項的證據(jù),d為常數(shù),v代表每個選項的決策價值,θ(0<θ<1)是反映對被注視選項偏好的參數(shù),εt是方差為σ2的高斯白噪聲。則各選項的相對價值信號可作如下定義:
(9)
(10)
(11)
在將注視納入考察后,DDM模型在神經(jīng)經(jīng)濟學決策理論中的研究已經(jīng)從二元選擇領(lǐng)域擴展到了多元領(lǐng)域,而其應用價值主要得益于獨特的模型結(jié)構(gòu)和新變量的引入。
DDM的一大優(yōu)勢是能夠結(jié)合反應時間和選擇數(shù)據(jù)提高樣本外預測*樣本外預測(out-of-sample prediction)即根據(jù)樣本內(nèi)的觀測值建模,再使用該模型預測樣本外的值。的精確度,該優(yōu)勢在與二元選擇情況下的傳統(tǒng)模型——logistic回歸模型的對比中得到了驗證(Clithero和Rangel,2013[18])。樣本外預測效果的檢驗建立在兩個數(shù)據(jù)集的基礎(chǔ)上,數(shù)據(jù)來自實驗室中由相同個體做出的選擇。第一個數(shù)據(jù)集從“是或否”的選擇任務(YN-Task)中產(chǎn)生。在該任務中一共有N種不同的零食選項,每種零食都出現(xiàn)T次,此外還有一個固定不變的參照項。每一輪試驗中,被試者都面臨其中一個零食選項的圖片,并決定是愿意選擇該零食并在實驗結(jié)束后吃掉(選擇“是”,ct=Yes),還是更愿意吃參照選項所示的零食(選擇“不是”,ct=No)。由此,每個被試者都產(chǎn)生一個N×T次決策的數(shù)據(jù)集。第二個數(shù)據(jù)集描述的則是“二選一”的強迫選擇任務(2AFC-Task)的結(jié)果,在該任務中被試者要在YN-Task中出現(xiàn)過的所有可能的非參照選項對中做出選擇。每一輪試驗中被試者都面臨呈現(xiàn)在電腦屏幕左右兩邊的兩種零食圖片,并必須從中選擇更愿意在實驗結(jié)束后吃掉的那項(ct=Left或者ct=Right)。由此,每個被試者都產(chǎn)生一個N(N-1)/2次決策的數(shù)據(jù)集。在實驗中第一個任務先于第二個任務完成,并且每個任務中被試者的選擇結(jié)果(ct)和反應時間(rtt)數(shù)據(jù)都被記錄下來。
樣本外預測的基本思想是用第一個數(shù)據(jù)集中的數(shù)據(jù)分別建立傳統(tǒng)的logistic模型和神經(jīng)經(jīng)濟學的DDM模型,來分別預測2AFC-Task中的選擇情況。
用logistic模型進行預測包括兩個步驟。第一步,用來自YN-Task的數(shù)據(jù)估計以下logistic選擇概率:
(12)
第二步,在假設(shè)logistic模型同樣可以描述2AFC-Task選擇過程的前提下,以上所估計的參數(shù)就可以用于預測選擇行為,如下式:
(13)
用DDM進行預測同樣包括類似的兩個步驟。第一步,用來自YN-Task的數(shù)據(jù)估計DDM的三個自由參數(shù):(1)門檻值的大小(B);(2)每個選項i的漂移率(μi,這里的i代表非參照項);(3)非選擇時間(NDT)。在這里不失一般性地設(shè)定σ2=1,然后利用最大似然估計擬合參數(shù)值。令L(ct,brtt|B,μIt,NDT)表示每個被試者在第t輪試驗觀測值的似然值,其中brtt代表反應時間。則每個被試者全部數(shù)據(jù)集的對數(shù)似然函數(shù)可以定義為:
(14)
第二步,假設(shè)DDM同樣可以描述2AFC-Task選擇過程,由于DDM做出的預測符合logistic選擇曲線形式,可以用下式預測任務二中的選擇行為。
(15)
這兩種情況都是用來自于YN-Task中的數(shù)據(jù)估計每個選項的價值,然后再將估計所得的價值用于logistic形式的選擇函數(shù),來預測2AFC-Task中的選擇。兩者最大的區(qū)別在于預測中所用價值的估計方式不同。在傳統(tǒng)的logistic模型中,價值是通過對選擇數(shù)據(jù)的logistic回歸得到的,而不涉及反應時間。而DDM則同時使用選擇數(shù)據(jù)和反應時間來估計模型的自由參數(shù)。
根據(jù)以上方法,研究者分別用模擬數(shù)據(jù)和真實的實驗數(shù)據(jù)進行實證研究,結(jié)果表明在任意情況下DDM的預測效果都優(yōu)于logistic回歸模型。雖然在兩個選項類似或者差異很大的情況下這一優(yōu)勢并不明顯,但在中間狀態(tài)下,DDM能夠大幅提高預測精度(有時達到50%)。此外,在穩(wěn)健性檢驗中,他們將反應時間(RT)引入到基本的logistic模型中,并將其樣本外預測表現(xiàn)與DDM進行比較。結(jié)果發(fā)現(xiàn)擴展后的logistic模型仍不能提高預測能力,從而進一步證實了DDM在進行樣本外預測時的優(yōu)勢不是僅來自于新數(shù)據(jù)(反應時間)的引入,而是基于模型自身的結(jié)構(gòu)優(yōu)勢。這項研究為解決簡單情況下離散選擇的樣本外預測提供了新思路。
此外,實證主義傳統(tǒng)決策理論的研究模式是針對不同決策情境分別建立數(shù)學模型,而以DDM為代表的神經(jīng)經(jīng)濟學決策模型則試圖描述決策行為統(tǒng)一的一般過程。即如果決策行為是由大腦對決策價值進行適應性編碼產(chǎn)生的,那么無論不同決策情境下所考慮的選項的實際值如何,其在大腦決策機制中的輸入范圍都可能非常相似。例如從100美元中得到50美元和從20點中得到10點,都是對于得到總量中二分之一的主觀價值評價,有著相同的決策價值編碼。因此在外部影響因素一致的情況下可以跨情境地對選擇行為和反應時間做出預測。Krajbich等(2015)[19]研究證明最初用于研究食物選擇的aDDM的擴展式,同樣可以對四個不同社會偏好決策實驗中的決策行為和反應時間做出準確預測。他們指出這種跨越了不同實驗被試者、決策標的、選擇環(huán)境的模型穩(wěn)健性預示著大腦在決策時采用的是一致過程。而且已有研究表明,被試者在做出食物選擇和社會偏好決策時都激活了腹內(nèi)側(cè)前額葉皮層和紋狀體這些相同的腦區(qū)。[20-23]因此,盡管不同決策情境下的選擇有很大差異,我們依然有理由相信其中存在著共同決策機制。
根據(jù)神經(jīng)經(jīng)濟學的生理效用理論,個體決策所依據(jù)的“效用”不再是心理上難以測量的感知,或是實證主義傳統(tǒng)下抽象的數(shù)學概念,而是以真實神經(jīng)反應為基礎(chǔ)的生理計算的結(jié)果。這種全新的研究視角不僅促進了新的決策理論模型的發(fā)展,而且使我們從神經(jīng)元層面反思異象對傳統(tǒng)“效用”理論的挑戰(zhàn)。
在風險與不確定決策中,期望效用理論假定決策者的偏好服從一系列公理,然后用期望效用函數(shù)將各種不同情形下的發(fā)生概率與效用相乘并加總,進而得到最終期望效用最大的方案。然而,后續(xù)的經(jīng)濟學研究發(fā)現(xiàn)人類的行為邏輯與實證主義傳統(tǒng)的數(shù)學邏輯并不一致。Allais(1952)提出的阿萊斯悖論(Allais paradox)*法國諾貝爾經(jīng)濟學獎得主Allais(1952)提出的阿萊斯悖論,指出人們在決策時對確定性結(jié)果的偏好更勝于不確定的結(jié)果。和Ellsberg(1961)提出的埃爾斯伯格悖論(Ellsberg paradox)*Ellsberg(1961)提出埃爾斯伯格悖論,發(fā)現(xiàn)個體在決策時表現(xiàn)出模糊厭惡,即人們對于已知概率的偏好優(yōu)于未知概率。都表明現(xiàn)實中個體的決策行為會系統(tǒng)地偏離期望效用理論的效用最大化原則,個體的偏好并不服從經(jīng)典決策理論的線性假設(shè)。為了解釋這些異象,行為經(jīng)濟學家Kahneman和Tverksy(1979)[24]提出了前景理論(prospect theory),認為現(xiàn)實經(jīng)濟行為中普遍存在“損失厭惡”*損失厭惡(loss aversion)是指人們面對同樣數(shù)量的收益和損失時,感到損失令他們產(chǎn)生更大的情緒影響,其反應了人們的風險偏好并不是一致的,當涉及的是收益時,人們表現(xiàn)為風險厭惡;當涉及的是損失時,人們則表現(xiàn)為風險尋求。和“稟賦效應”*稟賦效應(endowment effect)是與損失厭惡相關(guān)聯(lián)的現(xiàn)象,即投資者偏好堅持他們已有的東西而不愿意與別人進行交易以換得更好的替代品。因為放棄一項資產(chǎn)的痛苦程度大于得到一項資產(chǎn)的喜悅程度,所以個體行為者為了得到資產(chǎn)的“支付意愿”(willingness to pay)要小于因為放棄資產(chǎn)的“接受意愿”(willingness to accept)。。個體在決策時依據(jù)的不是特定風險狀態(tài)下可能結(jié)果的絕對效用值,而是以某個參照點為基準,把決策結(jié)果編碼為相對收益或損失。這一行為決策理論的神經(jīng)基礎(chǔ)早在Breiter等(2001)[25]的fMRI研究和Holroyd等(2004)[26]的EEG研究中得到了驗證。
近年來,神經(jīng)經(jīng)濟學的研究進一步從神經(jīng)機制角度證實了前景理論中一些原理假設(shè)的合理性。Sokol-Hessner等(2013)[27]發(fā)現(xiàn)在收益情形下被試者杏仁核的血氧水平依賴(BOLD)信號高于損失情形下的水平,說明損失厭惡的產(chǎn)生與杏仁核有關(guān);且被試者在情感上對金融損失反應的調(diào)節(jié)會減少杏仁核的活動,從而減輕損失厭惡。而De Martino等(2010)[28]的研究發(fā)現(xiàn)患有選擇性雙邊杏仁核損壞的自閉癥患者并沒有表現(xiàn)出損失厭惡,這從側(cè)面證實了杏仁核對損失厭惡的產(chǎn)生具有關(guān)鍵作用。
Chumbley等(2014)[29]的研究則發(fā)現(xiàn)損失厭惡程度與下丘腦-垂體-腎上腺軸區(qū)的皮質(zhì)醇激素水平有關(guān),其中慢性皮質(zhì)醇水平較低的被試者表現(xiàn)出更強的損失厭惡。與此相反,有更高內(nèi)源性皮質(zhì)醇水平的被試者則能更加公正地衡量損失和收益,其損失厭惡程度更低。國內(nèi)學者對損失厭惡的研究也取得了一定進展。黃達強(2014)[30]進行的功能性近紅外腦成像(fNIRS)實驗結(jié)果顯示,在收益情境下被試者的左背外側(cè)前額葉皮層被明顯抑制,而在損失情境下則是右背外側(cè)前額葉皮層被明顯抑制。這一結(jié)論與神經(jīng)科學理論相吻合,通常大腦皮質(zhì)左前額葉背外側(cè)區(qū)參與正面情緒的產(chǎn)生和調(diào)節(jié),而右前額葉背外側(cè)區(qū)參與負面情緒的產(chǎn)生和調(diào)節(jié)。可見,損失厭惡是一種人類在長期進化過程中獲得的適應性心理本能,并且可以通過模塊化大腦結(jié)構(gòu)進行遺傳,一直以來都是影響人類決策行為的重要因素。
此外,神經(jīng)經(jīng)濟學對Ellsberg(1961)提出的模糊厭惡*模糊厭惡(Ambiguity Aversion)是由于信息的不完全和投資者的有限理性而產(chǎn)生的一種心理偏差,指人們面對風險決策和模糊決策時傾向選擇已知概率的風險方案而規(guī)避模糊方案。的研究也取得了一定進展。Hsu等(2005)[31]和Chew等(2008)[32]的神經(jīng)成像研究都顯示大腦杏仁核活動與模糊厭惡或者熟悉度偏誤相關(guān)。近年來對于腦神經(jīng)科學的研究又發(fā)現(xiàn)5-羥色胺運轉(zhuǎn)體基因連鎖多肽區(qū)(5-HTTLPR)具有調(diào)節(jié)杏仁核活動的作用(Hariri等,2002[33];Roiser等,2009[34])。在此基礎(chǔ)上,Chew等(2012)[35]在一項實驗室實驗中探究了模糊厭惡和熟悉度偏好的神經(jīng)遺傳學基礎(chǔ)。研究表明5-羥色胺轉(zhuǎn)運體基因只跟熟悉度偏誤有關(guān),這驗證了之前的研究結(jié)果;而多巴胺D5受體基因和雌激素受體β基因僅與模糊厭惡相關(guān)。由此證明熟悉度偏誤和模糊厭惡有著不同的神經(jīng)遺傳機制。這一研究成果為解釋國際貿(mào)易和證券市場上的“本地市場偏誤”提供了新視角。
神經(jīng)經(jīng)濟學的以上研究成果為行為經(jīng)濟學對傳統(tǒng)“效用”理論的修正提供了生理依據(jù),證實了個體決策行為受到神經(jīng)活動等生理因素的調(diào)節(jié),而不是代數(shù)效用模型所能簡單描述的。為了進一步解釋損失厭惡、模糊厭惡等現(xiàn)象對決策行為的影響,還需將激素、基因等更多的生理變量納入到神經(jīng)經(jīng)濟學決策模型中。
準雙曲線模型在McClure等(2004)[37]設(shè)計的實驗中得到了神經(jīng)經(jīng)濟學的證實。他們利用fMRI考察了與被試者即時或延遲效用決策相關(guān)的神經(jīng)機制。實驗中,被試者需要選擇是在短期內(nèi)獲得較小金額還是在延期后獲得更大金額。研究顯示,當被試者選擇即期收益或短期延遲收益時,大腦負責控制情緒的邊緣系統(tǒng)區(qū)域的內(nèi)側(cè)前額葉皮質(zhì)、腹側(cè)紋狀體、后扣帶回被明顯激活。而當被試者選擇長期延遲較大金額收益時,大腦與控制理性決策相關(guān)的背外側(cè)前額葉皮層、眶額葉外側(cè)皮層被更強烈地激活。他們的研究成果一方面為準雙曲線貼現(xiàn)模型提供了一定的神經(jīng)科學證據(jù),另一方面表明人們的跨期決策行為是大腦各神經(jīng)系統(tǒng)合作與競爭的結(jié)果。這也支持了大腦存在二元神經(jīng)系統(tǒng)的理論*神經(jīng)經(jīng)濟學領(lǐng)域的雙系統(tǒng)理論認為決策行為受大腦的二元系統(tǒng)即系統(tǒng)1和系統(tǒng)2支配。系統(tǒng)1負責情感,可以自動、快速地做出反應,而不需要一點努力或者控制;系統(tǒng)2負責理性,需要腦力活動,包括復雜的計算。,即期收益的選擇受大腦情感系統(tǒng)控制,而延期收益的選擇則受大腦認知系統(tǒng)的控制,跨期決策取決于兩個系統(tǒng)間的相互作用。隨后,F(xiàn)inger人(2010)[38]的研究顯示在經(jīng)顱磁刺激擾亂了背外側(cè)前額葉皮層功能的情況下,被試者具有更高的貼現(xiàn)率,更加偏好即期收益。從而驗證了背外側(cè)前額葉皮層具有抑制即期收益傾向的功能。
然而,在近期的一些神經(jīng)經(jīng)濟學研究中準雙曲線貼現(xiàn)模型和二元神經(jīng)系統(tǒng)理論遭到了質(zhì)疑。Kable和Glimcher(2007)[39]進行了類似的實驗卻得到了與前述研究相悖的結(jié)果。他們用fMRI考察了被試者在一個固定的即期收益和變動的延遲收益間進行反復選擇時的BOLD信號。結(jié)果發(fā)現(xiàn)被試者在選擇延遲收益時,大腦的腹側(cè)紋狀體、內(nèi)側(cè)前額葉皮質(zhì)和后扣帶回這些之前被認為與即期收益選擇相關(guān)的情感控制區(qū)域也被顯著激活了。由此推測上述邊緣區(qū)域負責對即期收益與延遲收益的主觀評價編碼,而不存在β系統(tǒng)或δ系統(tǒng)的鮮明劃分。這一研究成果也得到了其他神經(jīng)經(jīng)濟學家的支持,Ballard和Kutson(2009)[40]、Peters和Büchel(2010)[41]及Sellitto等(2011)[42]在研究跨期決策時均發(fā)現(xiàn)決策者的內(nèi)側(cè)前額葉皮質(zhì)和后扣帶回在即期收益與延遲收益兩種選擇情形下都會被激活。
從行為經(jīng)濟學對傳統(tǒng)貼現(xiàn)效用理論的修正以及神經(jīng)經(jīng)濟學利用大腦成像技術(shù)的研究結(jié)果可知,無論是指數(shù)貼現(xiàn)模型還是準雙曲線貼現(xiàn)模型,它們對跨期決策過程的解釋都遭到了質(zhì)疑。原因在于兩者之間的差異僅是模型假設(shè)的改變,而本質(zhì)上仍都沿用邏輯實證主義的范式,沒有深入到“大腦黑箱”內(nèi)部。神經(jīng)經(jīng)濟學決策模型則直接從神經(jīng)編碼過程出發(fā)揭示決策產(chǎn)生的真實機制,為研究個體決策行為提供了統(tǒng)一的新思路。
神經(jīng)經(jīng)濟學將腦科學技術(shù)應用于經(jīng)濟學研究不僅是對主流經(jīng)濟學方法論的創(chuàng)新,而且從大腦神經(jīng)元層面重新詮釋了經(jīng)濟學決策行為研究的微觀基礎(chǔ)。
雖然目前還沒有能夠充分描述大腦決策過程的系統(tǒng)模型,但神經(jīng)經(jīng)濟學現(xiàn)有的研究成果已經(jīng)初具“as is”(確實就是)模型的雛形。不同于實證主義傳統(tǒng)將大腦視為“黑箱”的純代數(shù)模型,以DDM為代表的神經(jīng)經(jīng)濟學模型能夠從生理角度出發(fā),在內(nèi)在神經(jīng)活動與外在決策行為間建立起直接聯(lián)系,這種聯(lián)系必然更接近真實。此外在將注視、反應時間等實證主義傳統(tǒng)模型所忽視的因素考慮在內(nèi)后,神經(jīng)經(jīng)濟學研究豐富了經(jīng)濟學決策模型的形式,提高了預測精度。
更值得關(guān)注的是,現(xiàn)有研究指出大腦在不同情境下的決策機制是相似的,因而基于決策價值信號計算的神經(jīng)經(jīng)濟學模型能夠描述產(chǎn)生決策行為的一般過程。前文所述的腹內(nèi)側(cè)前額葉皮層能夠?qū)唵芜x擇和復雜選擇情況下的決策價值編碼,及DDM框架下大腦在進行二元和三元選擇時有著相似的計算過程的研究成果也在一定程度上支持了這一觀點。我們可以預見神經(jīng)經(jīng)濟學將用共同決策機制代替實證主義傳統(tǒng)針對不同情境建立多個決策模型的理論框架。而想要得到充分描述大腦決策過程的可靠模型并解釋更復雜的決策行為,需要進一步密切腦科學與經(jīng)濟學之間的銜接,用經(jīng)濟學的思維將神經(jīng)元活動轉(zhuǎn)換為定量化的研究工具。
相信隨著大腦成像技術(shù)的日漸成熟和神經(jīng)經(jīng)濟學家的不懈努力,決策的“大腦黑箱”將被進一步打開。神經(jīng)經(jīng)濟學將最終以更詳細的神經(jīng)活動描述替代實證主義傳統(tǒng)的簡單數(shù)學思想,從而對決策行為做出更準確的解釋和預測。
[1]Glimcher P W, Dorris M C, Bayer H M. Physiological Utility Theory and the Neuroeconomics of Choice [J].Games and Economic Behavior, 2005, 52 (2): 213-256.
[2]Rangel A, Camerer C, Montague P R. A Framework for Studying the Neurobiology of Value-based Decision Making [J].Nature Reviews Neuroscience, 2008, 9 (7): 545-556.
[3]Wallis J D. Orbitofrontal Cortex and its Contribution to Decision-making [J].Annual Review of Neuroscience, 2007, 30 (1): 31-56.
[4]Padoa-Schioppa C, Assad J A. Neurons in the Orbitofrontal Cortex Encode Economic Value [J].Nature, 2006, 441 (7090): 223-226.
[5]Harris A, Adolphs R, Camerer C, Rangel A. Dynamic Construction of Stimulus Values in the Ventromedial Prefrontal Cortex [J].Plos One, 2011, 6 (6): 2235-2239.
[6]Ratcliff R. A Theory of Memory Retrieval [J].Psychological Review, 1978, 85 (2): 59.
[7]Ratcliff R, Smith P L. A Comparison of Sequential Sampling Models for Two-choice Reaction Time [J].Psychological Review, 2004, 111 (2): 333-367.
[8]Ratcliff R, McKoon G. The Diffusion Decision Model: Theory and Data for Two-choice Decision Tasks [J].Neural Computation, 2008, 20 (4): 873-922.
[9]Fehr E, Rangel A. Neuroeconomic Foundations of Economic Choice-Recent Advances [J].The Journal of Economic Perspectives, 2011, 25 (4):3-30.
[10]Krajbich I, Oud B, Fehr E. Benefits of Neuroeconomic Modeling: New Policy Interventions and Predictors of Preference [J].The American Economic Review, 2014, 104 (5): 501-506.
[11]Shadlen M N, Newsome W T. Motion Perception: Seeing and Deciding [J].Proceedings of the National Academy of Sciences, 1996, 93 (2): 628-633.
[12]Shadlen M N, Newsome W T. Neural Basis of a Perceptual Decision in the Parietal Cortex (area LIP) of the Rhesus Monkey [J].Journal of Neurophysiology, 2001, 86 (4): 1916-1936.
[13]Armel K C, Beaumel A, Rangel A. Biasing Simple Choices by Manipulating Relative Visual Attention [J].Judgment and Decision Making, 2008, 3 (5): 396-403.
[14]Mormann M M, Malmaud J, Huth A, et al. The Drift Diffusion Model can Account for the Accuracy and Reaction Times of Value-Based Choice under High and Low Time Pressure [J].Judgement and Decision Making, 2010, 5 (6): 437-449.
[15]Krajbich I, Armel C, Rangel A. Visual Fixations and the Computation and Comparison of Value in Simple Choice [J].Nature Neuroscience, 2010, 13 (10): 1292-1298.
[16]Shimojo S, Simion C, Shimojo E, et al. Gaze Bias Both Reflects and Influences Preference [J].Nature Neuroscience, 2003, 6 (12): 1317-1322.
[17]Krajbich I, Rangel A. Multialternative Drift-Diffusion Model Predicts the Relationship between Visual Fixations and Choice in Value-based Decisions [J].Proceedings of the National Academy of Sciences, 2011, 108 (33): 13852-13857.
[18]Clithero J A, Rangel A. Combining Response Times and Choice Data Using a Neuroeconomic Model of the Decision Process Improves Out-of-Sample Predictions [Z].Unpublished, 2013.
[19]Krajbich I, Hare T, Bartling B, et al. A Common Mechanism Underlying Food Choice and Social Decisions [J].Plos Computational Biology, 2015, 11 (10): e1004371.
[20]Hare T A, Schultz W, Camerer C F, et al. Transformation of Stimulus Value Signals into Motor Commands during Simple Choice [J].Proceedings of the National Academy of Sciences, 2011, 108 (44): 18120-18125.
[21]Levy D J, Glimcher P W. Comparing Apples and Oranges: Using Reward-specific and Reward-general Subjective Value Representation in the Brain [J].The Journal of Neuroscience, 2011, 31 (41): 14693-14707.
[22]Hare T A, Camerer C F, Knoepfle D T, et al. Value Computations in Ventral Medial Prefrontal Cortex during Charitable Decision Making Incorporate Input from Regions Involved in Social Cognition [J].The Journal of Neuroscience, 2010, 30 (2): 583-590.
[23]Chib V S, Rangel A, Shimojo S, et al. Evidence for a Common Representation of Decision Values for Dissimilar Goods in Human Ventromedial Prefrontal Cortex [J].The Journal of Neuroscience, 2009, 29 (39): 12315-12320.
[24]Kahneman D, Tversky A. Prospect Theory: An Analysis of Decision under Risk [J].Econometrica: Journal of the Econometric Society, 1979, 47 (2): 263-291.
[25]Breiter H C, Aharon I, Kahneman D, et al. Functional Imaging of Neural Responses to Expectancy and Experience of Monetary Gains and Losses [J].Neuron, 2001, 30 (2): 619-639.
[26]Holroyd C B, Larsen J T, Cohen J D. Context Dependence of the Event-related Brain Potential Associated with Reward and Punishment [J].Psychophysiology, 2004, 41 (2): 245-253.
[27]Sokol-Hessner P, Camerer C F, Phelps E A. Emotion Regulation Reduces Loss Aversion and Decreases Amygdala Responses to Losses [J].Social Cognitive and Affective Neuroscience, 2013, 8 (3): 341-350.
[28]De Martino B, Camerer C F, Adolphs R. Amygdala Damage Eliminates Monetary Loss Aversion [J].Proceedings of the National Academy of Sciences, 2010, 107 (8): 3788-3792.
[29]Chumbley J R, Krajbich I, Engelmann J B, et al. Endogenous Cortisol Predicts Decreased Loss Aversion in Young Men [J].Psychological Science, 2014, 25 (11): 2102-2105.
[30]黃達強. 損失厭惡與偏好的異質(zhì)性——來自神經(jīng)經(jīng)濟學的證據(jù)[J].南方經(jīng)濟,2014(7):88-93.
[31]Hsu M, Bhatt M, Adolphs R, et al. Neural Systems Responding to Degrees of Uncertainty in Human Decision-making [J].Science, 2005, 310 (5754): 1680-1683.
[32]Chew S H, Li K K, Chark R, et al. Source Preference and Ambiguity Aversion: Models and Evidence from Behavioral and Neuroimaging Experiments [J].Advances in Health Economics and Health Services Research, 2008, 20 (8): 179-201.
[33]Hariri A R, Mattay V S, Tessitore A, et al. Serotonin Transporter Genetic Variation and the Response of the Human Amygdala [J].Science, 2002, 297 (5580): 400-403.
[34]Roiser J P, de Martino B, Tan G C Y, et al. A Genetically Mediated Bias in Decision Making Driven by Failure of Amygdala Control [J].The Journal of Neuroscience, 2009, 29 (18): 5985-5991.
[35]Chew S H, Ebstein R P, Zhong S. Ambiguity Aversion and Familiarity Bias: Evidence from Behavioral and Gene Association Studies [J].Journal of Risk and Uncertainty, 2012, 44 (1): 1-18.
[36]Laibson D. Golden Eggs and Hyperbolic Discounting [J].Quarterly Journal of Economics, 1997: 112 (2): 443-477.
[37]McClure S M, Laibson D I, Loewenstein G, et al. Separate Neural Systems Value Immediate and Delayed Monetary Rewards [J].Science, 2004, 306 (5695): 503-507.
[38]Figner B, Knoch D, Johnson E J, et al. Lateral Prefrontal Cortex and Self-control in Intertemporal Choice [J].Nature Neuroscience, 2010, 13 (5): 538-539.
[39]Kable J W, Glimcher P W. The Neural Correlates of Subjective Value during Intertemporal Choice [J].Nature Neuroscience, 2007, 10 (12): 1625-1633.
[40]Ballard K, Knutson B. Dissociable Neural Representations of Future Reward Magnitude and Delay during Temporal Discounting [J].Neuroimage, 2009, 45 (1): 143-150.
[41]Peters J, Büchel C. Neural Representations of Subjective Reward Value [J].Behavioural Brain Research, 2010, 213 (2): 135-141.
[42]Sellitto M, Ciaramelli E, di Pellegrino G. The Neurobiology of Intertemporal Choice: Insight from Imaging and Lesion Studies [J].Reviews in the Neurosciences, 2011, 22 (5): 565-574.
When Positivism Tradition Encounters the “Black Box”:A Review on “Physiological Utility” Theory of Neuroeconomics
JIANG Qing WU Yi-qun
Abstract:The latest neuroeconomics researches on decision-making behavior are the efforts of probing into the “black box” of human brain,which is carefully concealed in positivism tradition.Through in-depth interpretation of the “physiological utility” theory and drift-diffusion model(DDM),this paper shows that the decision-making process of the brain is actually the process that nervous system calculates and evaluates the “desirability”,namely a process of assigning and comparing the decision value signals.These studies initiate the systematic connections between individuals’ internal neural activity and external decision-making behavior.Furthermore,if the value coding in the brain is subject to adaptive coding,the decision-making mechanism of the brain has similar coding process no matter how different the contexts are.Therefore,there probably exists a common mechanism that enables people to make the general predictions of choice behavior and reaction time in various domains,called common decision mechanism.These studies provide a new way to solve out-of-sample prediction problem at the scene of simple discrete choice.Obviously,neuroeconomics is gradually changing the inherent thinking mode of classical economics,and it provides a new scientific explanation for the micro-foundation of decision theory.
Key words:Physiological utility DDM Black box Positivism tradition Decision-making behavior
[中圖分類號]F016
A
1000-1549(2006)11-0095-09
[收稿日期]2016-05-16
[作者簡介]江晴,女,1960年2月生,武漢大學經(jīng)濟與管理學院教授,經(jīng)濟學博士,研究方向為貨幣經(jīng)濟學、公司金融;吳逸群,女,1991年10月生,武漢大學經(jīng)濟與管理學院研究生,研究方向為貨幣經(jīng)濟學、公司金融。
[基金項目]國家社科基金項目“貨幣經(jīng)濟中的實證主義傳統(tǒng)與實驗經(jīng)濟學思想史解析”(項目編號:13BJL013)。
感謝匿名評審人提出的修改建議,筆者已做了相應修改,本文文責自負。
李 晟 張安平)