王薇薇
(遼寧師范大學(xué)心理學(xué)院 遼寧 大連 116029)
Nowak 和Sigmund(2005)在《自然》雜志上所發(fā)表的論文開篇即提出:“人類是互惠最忠實的擁護者”[1]。在人類社會早期,人們便懂得互惠合作有助于提高彼此生存和繁衍的概率(例如輪流狩獵和守家);即使是文明程度遠高于早期社會的當(dāng)今,互惠現(xiàn)象仍普遍存在于你我之間:國外一項研究中發(fā)現(xiàn),至少六成以上的人在博弈中做出了互惠決策[2]。由此可見,互惠早已根植于人類漫長進化的歲月之中[3]。然而,互惠關(guān)系既可以體現(xiàn)為共同體的合作及利益關(guān)系,也可以體現(xiàn)為一種包含著沖突的對抗關(guān)系,所以,對互惠產(chǎn)生及發(fā)展的研究可以減少人們在交往之間的沖突或矛盾,為人們之間進一步的合作等行為提供一種解釋[4]。
雖然目前國外對互惠已有大量的研究,但對于互惠的概念界定仍然并不統(tǒng)一??偟膩碚f,大多數(shù)研究將互惠視為一種行為動機、個人偏好或行為傾向。例如,Trivers 認為互惠是一種善待友善的人,愿意犧牲自己的利益為其提供幫助的行為傾向[5]。也有學(xué)者將互惠視為一種規(guī)范或準則。例如,Gouldner 將互惠定義為 “構(gòu)筑給予幫助和回報義務(wù)的道德規(guī)范”,這種規(guī)范是指各方在交換過程中一系列被大家所認可的準則,即一方為另一方提供幫助或給予其某種資源時,后者有義務(wù)回報給予過其幫助的人[6]。另外,Wu 等人認為互惠即一種交換的潛在機制,當(dāng)一個人給予另一個人一些資源的同時就建立了一種義務(wù),即后者在未來某時對前者回報價值相當(dāng)?shù)馁Y源的義務(wù)[7]。此外,Carter從進化的視角看待互惠,認為互惠即合作的一種進化模式,是一種自發(fā)地合作或投資,并期待在未來得到對方的回饋的行為[8]。
在人類社會的進化過程中,根據(jù)回報預(yù)期來自對象的不同,可將互惠具體分為直接互惠和間接互惠。直接互惠是指個體愿意付出一定的成本,去幫助善待自己的人,或懲罰背叛自己的人[8]。直接互惠通常發(fā)生在兩個個體之間,且個體所得回報來自于行為接受者[5]?!爸苯印币馕吨鴥蓚€個體之間的利益交換,這樣,兩個個體都能獲得凈利益。如果將直接互惠形容為“投桃報李”,那么間接互惠則是“你投我桃,我報別人李”(如圖1),助人者所得到的報答不是來自受助者,而是被其他助人者幫助的其他受助者[9]。具體而言,Nowak 和Sigmund 又將間接互惠分為受惠者會出于感激之情而對第三方個體做出互惠行為(A 幫助了B,B會繼續(xù)幫助C) 和個體由于幫助他人而在未來得到來自第三方的幫助的間接互惠(A 幫助了B,因此會得到C 的幫助)[1]。
圖1 直接互惠與間接互惠
人類的各種行為及其心理機制正如自然界各種生物一樣,由進化而來,在這個過程中所形成的心理和神經(jīng)機制,正是我們之所以為“人”的核心所在?;セ莸姆毖芘c進化正是在這樣一種自然選擇與進化的過程中不斷遺傳、演變的過程。物競天擇,進化產(chǎn)生于個體間的激烈競爭,自然選擇往往傾向于強者與自私者,似乎這樣的個體或基因更有利于自身的繁衍和生存。但是,人類社會中的很多情況都是圍繞互惠合作的方式進行組織的[10]。例如,我國農(nóng)村盛行的“幫工”與“還工”互惠勞動交換;兒童蕩秋千游戲中也有“你推我一次,我推你一次”的互惠合作游戲體驗。有研究在細菌、植物、魚、鳥、鼠和靈長類動物中均發(fā)現(xiàn)存在互惠互利的合作模式[11-12]。自然選擇如何促進互惠行為?隨著進化心理學(xué)的興起,關(guān)于互惠的研究具有了一個全新的視角。
進化心理學(xué)將達爾文的進化論方法運用于人性的理解,強調(diào)“自然選擇”,其中心觀點認為心靈是一種進化的、適應(yīng)的器官,而不是一塊白板,心靈由進化形成的各種先天傾向組成,如喜歡甜食的傾向、鑒別不同面孔的傾向、厭惡糞便的傾向等,這些先天的傾向都是由于種系進化而形成的[13]。大量的研究表明,個體的互惠傾向具有跨文化、跨種族及年齡的一致性,而且,人類早在嬰兒時期便具有了一定的互惠行為。例如,Meristo 和Surian 在研究中采用期望違背范式,證明了10 個月大的嬰兒便具有互惠的傾向,當(dāng)嬰兒看到慷慨的人得到獎勵和表現(xiàn)自私的人反而得到更多資源兩種情景后,其對后一種情景的注視時間明顯較長[14]。以上對于嬰兒互惠行為的相關(guān)研究證明,個體是由于某種生物基因促成了互惠的產(chǎn)生和發(fā)展,并且這種進化有可能并不是后天才習(xí)得的。
同時,神經(jīng)系統(tǒng)由進化產(chǎn)生,有研究表明互惠本身已經(jīng)在進化過程中影響并改變了人類的大腦結(jié)構(gòu)。Moretto,Sellitto 和di Pellegrino 在研究中提出這一證據(jù)體現(xiàn)在人類大腦的腹內(nèi)側(cè)前額葉皮質(zhì)(ventromedial prefrontal cortex,vmPFC)中[15]其 在實驗中設(shè)置了人類與同伴互動的信任游戲和與電腦互動的游戲,要求vmPFC 受損患者、非額葉受損病人和健康控制組被試分別完成上述兩項任務(wù),結(jié)果發(fā)現(xiàn)相較于其他兩組被試,vmPFC 受損患者表現(xiàn)出更低的互惠行為。
依據(jù)進化心理學(xué),通過自然選擇的進化是復(fù)雜的神經(jīng)回路和相應(yīng)的心理機制產(chǎn)生和發(fā)展的動力源泉,由此可知心理機制的物質(zhì)基礎(chǔ)——神經(jīng)回路的建立有著生存的目的?;セ莸纳窠?jīng)回路(或心理機制)被自然“選中”,在漫長的進化過程中改變了個體的動機和情感機制,內(nèi)化為人的一種本性,具備這一機制的有機體有更大的生存機遇[16]。
關(guān)于互惠的概念,無論何種定義都涉及個體在博弈中的得失,即成本或收益。在進化生物學(xué)中,成本和收益是用達爾文的適應(yīng)性來衡量的,“成功”便意味著進化與繁殖[1]。進化心理學(xué)視角下對互惠的研究,是在進化博弈論(Evolutionary Game Theory,EGT)的指導(dǎo)下,將人類的各種行為看作策略(即一種“基因”),看各種策略在進化壓力下的表現(xiàn),以及能否成功抵抗其他策略的“入侵”,能否成功“入侵”其他策略(穩(wěn)定進化),或能否被自然選擇(復(fù)制子動態(tài))。雖然已有眾多研究者提出互惠在進化上是穩(wěn)定的,不會受到搭便車等策略的侵略,但是在各種類型互惠的演變中,其具體的演化過程和影響因素仍然是不明確的[17]。因此,文章在進化心理學(xué)視角下梳理直接互惠、間接互惠和強互惠的進化與發(fā)展,可以為我們更好地理解個體的互惠行為提供一個新的理論平臺,能夠為互惠行為的產(chǎn)生與發(fā)展提供更為有效、簡潔的解釋。
直接互惠模型(Models of Direct Reciprocity)假定,將一個群體中的個體兩兩隨機進行配對,隨機選取其中一個個體作為互惠者,另一個體作為受惠者,并且互惠者能夠以足夠的成本c 來幫助對方,使之得到收益b(b>c)。換句話說,直接互惠的產(chǎn)生需要基于相同的兩個個體之間的重復(fù)社會交往:A 對B 的行為取決于B 先前對A 的行為[18]。
根據(jù)直接互惠關(guān)系中雙方回報結(jié)構(gòu)的不同,研究者常采用經(jīng)典的重復(fù)囚徒博弈(prisoner’s dilemma,PD)來探究個體的直接互惠行為。在每輪博弈過程中,兩個個體只有兩種選擇:合作或者背叛。博弈的結(jié)果及兩人所得報酬將取決于雙方不同的選擇(如表1):兩人均選擇合作報酬最大(R,R),兩人均選擇背叛則報酬最小(P,P),一人合作而另一人背叛則背叛者受益大于合作者。
表1 囚徒困境中參與者的收益矩陣
該博弈只存在一個納什均衡,即兩個參與者都選擇背叛策略。然而進化博弈論認為,囚徒困境中的參與者所做的決策并不是因為理性的計算,而是行為策略的成功進化[1],“雙輸”的結(jié)果基本不會出現(xiàn)在人類的真實博弈中?!耙匝肋€牙” 策略(tit-for-tat,TFT),即在第一步選擇合作,其后的每一步都跟隨對方上一輪的選擇為最優(yōu)解;另一種更加嚴格的TFT 策略被稱為觸發(fā)策略(trigger strategies),指個體雖然會保持合作,但如果對方背叛一次,個體從此便會一直選擇拒絕合作[19]。研究者指出,TFT 是人類互惠博弈中最為有效且成功演化的一種策略。例如,Axelrod 組織了一個人們通過計算機程序與同一個對手重復(fù)進行囚徒困境博弈的錦標賽,結(jié)果TFT 策略取得了最后的勝利,即使改變博弈的次數(shù),該策略依然是一個進化穩(wěn)定的策略[9]。
那么,TFT 策略是怎樣成功進化的呢 Bó和Fréchette 假定在重復(fù)囚徒困境環(huán)境下的博弈中,隨機配對兩名個體進行博弈,并且下一回合發(fā)生的概率為ω(0≤ω≤1),ω 越大則表示下一輪博弈將發(fā)生的可能性越高。每一位參與者將考慮以下幾種策略:1.總是背叛(ALLD),即每一步都選擇背叛對方;2.TFT;3.總是合作(ALLC);4.其他(如合作與背叛交替)。當(dāng)且僅當(dāng)ω 足夠大時,TFT 是集體穩(wěn)定的。從進化的視角看來,在所有的入侵策略中最大的威脅來自“總是背叛”和“合作與背叛交替”。具體而言,當(dāng)且僅當(dāng)ω≥(T-R)/(T-P)時,TFT不能被ALLD 侵入;當(dāng)且僅當(dāng)ω≥(T-R)/(R-S)時,TFT 不能被“合作與背叛交替”侵入。概括來說,當(dāng)且僅當(dāng)ω 大于(T-R)/(T-P)和(T-R)/(R-S)中的較大者時,TFT 不能被二者侵入,從而TFT 不能被其他任何策略侵入,符合被進化“自然選擇”的模式,從而是一種穩(wěn)定的行為策略[20]。相似的結(jié)論也在Rand、Ohtsuki 和Nowak 的研究中得到了證實。模型進一步假設(shè),博弈的過程已經(jīng)經(jīng)歷了多代人,每一代人都經(jīng)歷了一系列回合的交往,并且在每一回合中,每個人都同時處在兩個角色中。其結(jié)果發(fā)現(xiàn)當(dāng)選擇互惠合作的個人成本增加時,互惠合作很難維持下去;而當(dāng)幫助的收益增加,或下一輪發(fā)生概率增加時,產(chǎn)生合作或互惠則更容易[21]??偟膩碚f,要使個體做出互惠的決策,需要幫助或合作的成本可以被未來互動的可能性所衡量的未來利益所抵消便可以實現(xiàn),由此可知,直接互惠策略的進化受到了兩個因素的制約:下一輪博弈發(fā)生的可能性以及個體本身的成本和收益情況。
首先,“下一輪發(fā)生的可能性” 是直接互惠的核心機制,也恰恰是其最大的局限所在——個體在直接互惠中做出合作行為的一個前提是需要知道這一段關(guān)系能維持多久[22]。關(guān)于互惠進化的相關(guān)理論研究證明,當(dāng)個體未來與同一個體反復(fù)互動的機會足夠高時,自然選擇可以在雙邊互動中支持互惠的行為[5],因為從長遠來看,合作—互惠—合作是個體的真正利益所在。相似地,經(jīng)濟博弈相關(guān)理論研究表明,只要重復(fù)交往的機會足夠高,理性的利己主義者便可以在短期的背叛動機和追求長期穩(wěn)定利益中建立平衡。如果打破雙方之間的互惠平衡是一種潛在的威脅,那么選擇背叛雖然有短期效益,但還有長期的成本,因此,在雙方的重復(fù)交往中,互惠合作是一種漸進的穩(wěn)定進化結(jié)果[1]。
例如上文中提到兒童輪流蕩秋千的例子,如果知道這是最后一次游戲,你還愿意去幫助另外一個小朋友嗎? 相似地,Sebastián -Enesco 和Warneken 在研究中制造虛擬的多輪次互惠情景分享實驗,結(jié)果發(fā)現(xiàn)5 歲的兒童可以表現(xiàn)出互惠行為并且穩(wěn)定地表現(xiàn)出TFT 策略[23]。正如中美貿(mào)易戰(zhàn)爭,對于兩國未來持久、多方面深層次合作的影響,只有長期彼此合作才會使雙方達到共贏的局面,而單方面破壞合作既是不明智的,也是不合理的。
此外,有研究者提出個體在博弈中的收益也是影響互惠進化的重要因素之一[24-26]。對直接利益的追求可能是個體互惠行為產(chǎn)生的一大動因,例如當(dāng)你知道可能會獲得1 萬元的報酬時,就比在會獲得10 元報酬的情況下更容易選擇合作或幫助。同時,有研究者提出“雙重動機”理論,認為個體在互惠行為過程中不僅要注重物質(zhì)利益的最大化,同時也要追求非物質(zhì)利益的最大化,具體而言可分為實際收益(物質(zhì)財富的增加) 和精神收益(精神上獲得的滿足)兩種。
一方面,Vaish、Hepach 和Tomasello 認為這種精神收益可能來自“快樂”[27],他們在實驗中發(fā)現(xiàn),3歲的兒童在做出給予等行為后便會報告出“快樂”的情感體驗。由此可見“快樂”作為一種積極的情感體驗,對于兒童而言也是一種自我精神收益,它可以在某種程度上抵消物質(zhì)利益損失所帶來的悲傷、憤怒等不良情緒,更容易促進個體的互惠行為[28]。另一方面,個體在互惠行為中所獲得的另外一種精神收益是“感恩”:當(dāng)一個人通過他人的良好意愿而獲得利益時,他就會產(chǎn)生積極的情緒,并會心存感激地做出回應(yīng)[29]。研究發(fā)現(xiàn),感恩為個體帶來的情緒體驗比單純的積極情緒(比如快樂)更能促進個體的互惠行為。例如,如果個體得知對方是有意識地做出互惠行為時,他們會報告出更多的感激體驗,并同樣表現(xiàn)出更多的互惠行為[30]。但是,也有研究者提出這種精神體驗可能不完全是感恩,有可能是個體在收到饋贈之后所產(chǎn)生的一種 “負債感”,認為自己有義務(wù)償還那些給予他們好處的人。
總之,只有相同的兩個個體之間存在持續(xù)重復(fù)交往的可能性,并且個體對未來的收益足夠重視時,雙方直接互惠的關(guān)系才能維持下來。然而,在人類社會多邊互動中,人們之間的合作關(guān)系往往是短暫的且并不知道下一輪合作還是否會存在,從而互惠在進化均衡中發(fā)展前景十分有限[31],這一點似乎成了互惠進化發(fā)展的一道阻礙,因此接下來我們將討論間接互惠情景。
不同于直接互惠,雖然在間接互惠的模型(Models of Indirect Reciprocity) 中每個個體可以參與多回合博弈,但是任意兩個參與者只能重復(fù)進行一次博弈,因而直接互惠中“下一輪次”的威脅不復(fù)存在?;セ菀肜^續(xù)繁衍進化,就必須有替代的強化合作機制[32]。
在直接互惠中,由于個體本身的獎勵或懲罰均來自對手,所以其合作機制被稱為個體強化。而間接互惠中個體的獎懲來自群體內(nèi)的其他成員,因而研究者將這種合作機制稱為團體強化[33]。團體強化要想發(fā)揮作用,則必須存在一定的中間機制。因為在間接互惠過程中,其成功進化依賴于對方在前一(幾)輪中的表現(xiàn),個體良好的聲譽或形象將有利于雙方間接互惠的進行[34]。關(guān)于團體強化中間機制最具有代表性的兩個模型是Nowak 和Sigmund 建立的基于“形象分”策略的間接互惠模型和Panchanathan 和Boyd 建立的基于 “聲望”策略的間接互惠模型[35-36]。
在最基本的形象分間接互惠模型中,每個個體都有一個形象分(good,G 或者bad,B),如果互惠者在博弈中選擇幫助對方,他的形象分會變?yōu)镚,否則為B。受惠者形象分不變[35]。從進化的角度來看,整個群體中共有合作者、背叛者和觀察者三種類型,并且不同于直接互惠,個體在間接互惠過程中的策略除ALLC 和ALLD 以外,還有與形象分為G 的人合作(Disc) 和與形象分為B 的人合作(pDisc)兩種策略,當(dāng)觀察者做出判斷后,其本身的形象分也會發(fā)生改變。由此,整個間接互惠的過程便形成了一種“規(guī)范”,正是這種規(guī)范定義了個體的形象評估系統(tǒng),而形象評估反過來又會影響每個行為策略所獲得的回報,進而影響它們在人群中的代表性[37]。
類似于直接互惠中的TFT,間接互惠中也存在這樣一種策略:個體是否選擇合作(幫助)取決于觀察對方上一輪是否與別人合作(幫助)。Nowak和Sigmund 所提出的互惠進化動力理論認為,在間接互惠中沒有觀察者的情況下,背叛者勝出;在沒有合作者的情況下,背叛者和觀察者形成了一個雙穩(wěn)態(tài)系統(tǒng),根據(jù)初始條件,要么一個策略勝出,要么另一個策略勝出;在沒有背叛者的情況下,觀察者和合作者處于平衡狀態(tài)[1]。然而,當(dāng)觀察者的數(shù)量低于一定的閾值之后,這種平衡便會被打破,背叛策略將成功入侵。當(dāng)三種策略都存在時,將導(dǎo)致兩種結(jié)果:只存在背叛者或兩種利他行為的混合。以上過程可以看作是一種基本的道德評價體系,在這種決策環(huán)境中,個體的“形象分”便是一個主導(dǎo)因素。
圖2 互惠基本進化動力理論(Nowak & Sigmund,2005)
進化心理學(xué)家認為,間接互惠傾向的“基因”存在于不同的個體之中,這種傾向會直接影響個體的生理。因為個體很容易將生活中的事情按照“好”或者“壞”來進行分類,這種對社會交往的分類反映出了人類進化而來的間接互惠傾向[1]??梢哉f,在進化過程中,間接互惠傾向的發(fā)展是推動人類大腦發(fā)展不同于其他物種的顯著特征之一。然而這種分類也存在一定的問題,比如個體的形象分數(shù)只能由歷史回合中做出幫助行為的次數(shù)來決定,而不考慮其背后動機[32]。
基于聲譽的間接互惠模型同上述“形象分”策略的間接互惠模型類似,但是在這一模型中,觀察者在觀察到背叛時,后者不加區(qū)分,而前者需要區(qū)分正當(dāng)背叛或不正當(dāng)背叛(如果個體在作為互惠者時選擇不幫助好名聲的受惠者,那么他自己的名聲則會變?yōu)锽,如果他不幫助壞名聲的受惠者,那么他的名聲則不變)。
關(guān)于自然選擇如何促進間接互惠行為問題的一種解釋可能是 “如果大家都知道我從不還他人李子,那我也將永遠得不到一個桃子”,這便是基于“聲譽”的間接互惠進化觀點[1]。該理論認為,“聲譽” 在間接互惠的建立和發(fā)展過程中具有十分重要的作用。具體而言,樂于互惠的個體會更受人歡迎,其行為也會有更多積極和正面的評價,從而建立良好的聲譽。良好的聲譽又可以幫助個體在未來的合作、分享等親社會關(guān)系中獲得長期利益,并且有助于個體在未來的博弈中被更多的施惠者所選擇[38]。關(guān)于這一點,最早由Alexander 提出的“聲望”互惠進化機制也證明了這一觀點。他認為聲望的建立可以為個體與他人的合作提供潛在的優(yōu)勢,個體產(chǎn)生間接互惠行為的動機不是個人利益的得失,而是害怕在群體中受到懲罰、排擠,降低自己的聲譽或喪失身份[9]。相似地,聲譽管理理論認為,個體在交往過程中會對自己及對方的聲譽進行管理[39],個體做出互惠的行為是希望在群體中獲得“好名聲”,從而在以后的交往中獲益[40]??梢?,互惠的進化有賴于人們對自身聲譽的管理??傊?,聲譽作為強化互惠進化的一種中間機制,是調(diào)動個體間接互惠行為的杠桿[41]。
Leimar 和Hammerstein 使用計算機模擬發(fā)現(xiàn),聲譽策略比形象分策略更加具有進化穩(wěn)定性。然而不同于形象分策略的是,在聲譽策略中個體不僅要分析施惠者的名聲,還要分析其意圖。所以在這種環(huán)境下,個體需要基于對方的聲譽來選擇是否做出幫助行為,并且需要判斷對手上回合行為背后的意圖[42]。據(jù)此,有研究者提出了基于意圖的互惠模型(intention-based models of reciprocity),認為在間接互惠中,意圖是個體做出互惠判斷的重要因素之一[43]。
自孩童時期開始,人類便十分善于將意圖與行為聯(lián)系起來。例如,3 歲兒童可以正確識別他人的意圖,并且明顯地偏愛好人的角色;到4 歲左右時,兒童就可以對彼此在博弈中的意圖進行考量,即使是作為第三方觀察者,兒童也愿意將更多的資源分給善意的角色[44-45]。研究者常采用最后通牒游戲(UG)探究意圖對個體互惠行為的影響。在UG 中,隨機分配被試兒童的任務(wù)角色(分配者/回應(yīng)者),由分配者來決定如何分配主試所給予的資源,回應(yīng)者則有權(quán)同意或者拒絕該分配方案。若回應(yīng)者接受,則按提議分配資源;若回應(yīng)者拒絕,則雙方一無所得。研究者認為,接受者如果在UG 中選擇拒絕往往不是因為分配的結(jié)果,而是因為對方分配行為的意圖。比如,分配者在(4:0)和(3:1)的分配選擇中選擇了(3:1),以及在(2:2)和(3:1)中選擇了(3:1),二者雖然對于接受者來說得到資源的數(shù)量是一樣的,但前者出于善意而后者出于惡意。
盡管不同模型在細節(jié)上不完全相同,但在間接互惠前提的假設(shè)下,使得人們先前的行為可以被其他人觀察到,如此便使得個體可以有選擇地與另一個體進行互惠合作[46]。由此以往,非互惠者將處于不利地位,互惠則可以成功進化傳播。因此,間接互惠作為多種形式合作相互作用的紐帶,其對群體中其他成員的評價推動了間接互惠的成功進化,即使觀察者只是在遠處觀察,并不直接參與互惠,也可以提供一種有力的中間強化機制來引導(dǎo)、支持那些選擇互惠合作的人。
然而,正是由于聲譽和信息在間接互惠模型中的重要性,所以,無論是基于“形象分”策略的間接互惠模型或是基于 “聲望” 策略的間接互惠模型,與傳統(tǒng)的直接互惠模型相比,都會受到信息不完全的影響:信息的不完全性越強,互惠與合作的均衡則越難維持和進化。另外,Santo 提出間接互惠模型忽略了個體在互動中的主動性策略,只強調(diào)了其本身的適應(yīng)性驅(qū)動機制采用的策略,并且沒有考慮個體出現(xiàn)的新行為模式[47]。因此,有學(xué)者將新行為策略出現(xiàn)的過程比喻為“基因環(huán)境中的生物突變”[48]。例如,當(dāng)一個群體的成員從遵守社會規(guī)范中獲益時,行為者可能會遵守該規(guī)范并懲罰違反者,即使這種行為不能由自私自利、以結(jié)果為導(dǎo)向的前提所激勵,這種行為,我們稱之為強互惠[49]。
現(xiàn)代科學(xué)研究常常試圖證明人之所以為“人”的特殊之處,高度發(fā)達的社會性便是其中一個顯著的特征。雖然關(guān)于直接互惠模型的研究證明互惠的進化依賴于利益及未來合作可能性的大小,但人類互惠發(fā)展的同時也進化出了一種強大且有別于其他物種的規(guī)范實施手段——強互惠。強互惠模型(Strong Reciprocity Model,SRM)是指個體為服從集體更大的利益而進行合作,并不惜花費個人成本去懲罰那些違反規(guī)范的人[49],其本質(zhì)在于不考慮利益損失及未來的回報。強互惠的存在極大地增強了人類社會合作的穩(wěn)定性。
關(guān)于強互惠的進化機制,不同學(xué)者提出了不同的看法。有學(xué)者提出強互惠在進化過程中最大的威脅來自利他主義(altruism)。有別于前者,后者中個體的行為是無條件發(fā)生的,即不受到對方之前行為的影響。這一特點仍然可以使用PD 來闡明:A,B 兩個體如果都合作,雙方的回報為(5,5);如果都背叛則回報為(2,2);如果A 合作而B 背叛雙方回報為(0,7),反之則為(7,0)。在正常的互惠關(guān)系中,如果B 發(fā)現(xiàn)A 在上一輪博弈中背叛了自己,那本輪中B 也將毫不留情地選擇背叛;然而如果B 是利他主義者,即使A 叛變了B 也不會因此背叛。因此,有研究者將利他行為等同于一種“無條件的仁慈”[50],這種利他主義行為將威脅強互惠的成功進化。然而Fehr 認為強互惠與利他主義或親緣選擇理論所激發(fā)的動機無關(guān)[51]。Gintis 依據(jù)廣義群體淘汰理論,提出人類強互惠的成功進化依賴于個體為維護群體利益而自愿做出的犧牲行為[52]。具體而言,在人類的進化環(huán)境中,群體都將面臨滅絕的威脅(戰(zhàn)爭、饑荒、自然災(zāi)害等),此時,利他行為或間接互惠行為都無法維持群體內(nèi)持續(xù)的合作以提升群體存活的概率,因為未來得到回報的可能性太渺茫。同時,親緣選擇理論在進化過程中也不適用,群體中的大多數(shù)可能并不存在親緣關(guān)系。然而,如果群體中存在“懲罰背叛者”的角色,便可以使群體的利益平均化,從而群體間的淘汰壓力上升,而群體內(nèi)的淘汰壓力減小。因此,擁有這樣角色的群體更有可能在進化的威脅中生存下來。
另外,Johnson、Stopka 和Knights 認為,強互惠是人類在過去進化出的一種動機或機制,也是人類的大腦在漫長的進化過程中為了能夠適應(yīng)最新社會環(huán)境的一種自我進化[53]。例如,F(xiàn)ehr 等人通過正電子發(fā)射線斷層掃描技術(shù)觀察了強互惠行為的神經(jīng)基礎(chǔ),結(jié)果發(fā)現(xiàn)在沒有外部補償?shù)臈l件下,合作剩余促使合作得以維持的社會規(guī)范內(nèi)部化,即人類在長期進化的過程中形成了一種自我激勵機制,這種機制是由位于中腦系統(tǒng)的尾核來執(zhí)行的,它使行為主體從強互惠行為本身獲得某種滿足,無須依賴外界的激勵和補償[51]。
總體而言, 進化心理學(xué)視角下的互惠理論模型大多基于如下兩個前提:一是個體選擇互惠必然是為了自身現(xiàn)在的付出能在未來的交換中得到回報,二是個體在未來可能獲得的潛在回報大于現(xiàn)階段所付出的代價。只有滿足上述前提,互惠才能得到成功進化。
互惠在人類社會層面具有深厚而重大的意義,我國自古便有“來而不往非禮也”的說法。然而,互惠行為雖然可以為個體帶來長期的回報,但常常也會伴隨個體短期內(nèi)的利益損失。正所謂“物競天擇,適者生存”,人類的各種行為及其心理機制正如自然界各種生物一樣,由進化而來并且一直面臨著各種“入侵”的威脅?;セ莸姆毖芘c進化正是在這樣一種自然選擇與進化的過程中不斷遺傳、演變的過程,這也正是心理學(xué)家、經(jīng)濟學(xué)家和社會學(xué)家所關(guān)注的重點之一。眾多研究者從動物或人的視角,采用觀察實驗、行為實驗或是功能性磁共振成像技術(shù),來嘗試解決一個帶有根本性的問題——在漫長而又殘酷的進化進程中, 互惠是如何抵抗種種入侵,成功繁衍進化的?
我國古語云“滴水之恩,當(dāng)涌泉相報”,國外也有“你抓我背,我搔你癢”的說法,這都體現(xiàn)出直接互惠可以為施惠者帶來長期回報的特點。同時,直接互惠的進化又會受到個體的收益、下一輪交往發(fā)生的可能性等因素的影響,間接互惠的繁衍又依賴于形象分、聲譽等中間機制的作用,為了抵抗群體在進化過程中的多種威脅,人類逐漸演化出“強互惠”機制,更加規(guī)范、鞏固了互惠在進化中的穩(wěn)定性。從進化視角探討互惠為深入理解和研究個體的互惠行為提供了一個良好的平臺,然而,如下幾個問題仍然值得研究者在未來進一步關(guān)注:
首先,以往進化心理學(xué)視角下有關(guān)直接互惠的研究多將焦點集中于個體是否會獲益(物質(zhì)報酬、現(xiàn)金獎勵等),并且到目前為止關(guān)于人類互惠的相關(guān)研究多集中于實驗室研究,個體在博弈中所獲的物質(zhì)收益也是實驗主試所提前準備好的,是一筆“ 意外收獲”。 正因如此,Danková 和Servátka 認為這種方式會引起個體的 “房產(chǎn)效應(yīng)(house money effect)”[54],并且他在研究中發(fā)現(xiàn),如果個體在博弈中的成本是自己的“血汗錢”,那么其互惠行為的成本將大大增加。另外,在現(xiàn)實生活中,互惠行為所帶給個體的收益不僅包括物質(zhì)獎勵,還有合作后的滿足、助人后的愉悅等[27],那么,在互惠的進化過程中物質(zhì)與精神收益對個體行為的影響是否始終一致?身處戰(zhàn)亂、食不果腹的年代,互惠的進化是否具有更大的壓力?相反,物質(zhì)生活豐富的當(dāng)今,一句贊美或夸獎是否可能替代互惠結(jié)果中的現(xiàn)金獎勵?我們所說的人類“長期繁衍進化過程”,不僅僅是一個生物意義上的進化,還是一種在社會意義上的進化。人類在外在的約束條件下的選擇和行為會影響人類的生理,這種影響的機理是什么,仍需科學(xué)工作者在未來做出進一步的科學(xué)解釋,這也正是跨學(xué)科研究人類行為的意義所在。據(jù)以上猜想,未來的研究可納入收益特點、社會變遷等因素來考察現(xiàn)實情境中的互惠行為。
其次,間接互惠中形象分策略和聲譽策略需要建立在信息已知的前提下,并且,這兩種聲譽機制都是個體在博弈過程中逐漸獲得的,可謂一種后天的特征,但是在實際生活中,某個個體的行為(或者后天特征)不可能被所有人觀察到。所以有學(xué)者提出,這一前提在大多數(shù)情況下是不成立的[32]。那么,個體的某些先天特征是否會影響其間接互惠策略呢?據(jù)此,有研究者將個體本身具有的某種屬性定義為標簽(tag),并且標簽會隨著互惠博弈的進行而發(fā)生變化。例如,Zhao、Eamonn 和Smillie在研究中強調(diào)了友善、誠實等人格特質(zhì)對個體互惠行為的影響作用[55],那么,具有誠實品格的個體是否更加渴望被人尊重?他們是否更加看重互惠行為對其聲譽所產(chǎn)生的影響?這一問題值得未來進一步的研究。
最后,雖然互惠規(guī)范本身具有跨文化的一致性的特點[6],但是Jung 等人認為,個體對于互惠規(guī)范的理解和應(yīng)用可能存在文化差異,不同的社會價值觀會導(dǎo)致個體不同的互惠期望[3]。例如,中國文化認為在人際交往中要注重謙卑、和諧,兒童便會受到其父母“和諧禮讓”教育觀念的影響,而西方兒童則更為注重對自身利益的維護。相似地,Zefferman 提出了規(guī)范心理學(xué)假說,他認為個體行為的策略反映了其社會學(xué)習(xí)的文化規(guī)范[56]。這正是因為在人類進化史的過程中,文化規(guī)范是各不相同的,因此通過基因—文化共同進化的過程,人類進化出了采用特定社會中成功策略的機制?,F(xiàn)有的研究往往集中于同一群體或種族的互惠行為,跨文化的互惠研究相對較少。因此,在未來的研究中應(yīng)注重比較不同文化背景下互惠的發(fā)生發(fā)展差異,并考慮針對不同文化背景、社會關(guān)系的群體進行考察,從而了解不同文化背景所帶來的偏差對互惠進化所產(chǎn)生的影響。