趙 偉 侯聰聰 白 晨
(中國科學技術信息研究所,北京 100038)
科技信息資源是一個國家重要的戰(zhàn)略性資源,網絡平臺是信息共享的主要載體,基于網絡平臺的科技信息資源共享過程中涉及不同利益相關方復雜的利益博弈關系。信息提供方、共享平臺、用戶和政府等各類主體之間可能存在顯性或隱性的利益沖突,且缺乏有效機制達到各方的利益均衡,因此各方往往缺乏共享信息的動力。本文試圖基于已構建的科技信息資源網絡共享博弈模型,采用模擬實驗進行驗證和分析,進一步明確各相關主體之間的利益關系,為推動我國科技信息資源共享和服務利用提供借鑒。
信息共享作為資源配置的有效方式之一,可以顯著提升資源的利用效率。但是,只有基于相對公平原則,使每一個利益相關方的支付和獲得相匹配,才能使其愿意積極參與信息共建和共享。如何實現信息提供者、網絡平臺、用戶、政府等相關管理者等各方利益的均衡,建立合理的利益分配機制來促進各方參與資源共享,成為信息共享和服務利用效率最大化的關鍵所在,而博弈論可以為此提供良好的理論和方法支撐。
目前,已有相關研究主要圍繞企業(yè)和圖書館資源共享過程中各相關方的利益沖突問題開展分析。其中,在針對企業(yè)開展的相關研究中,Shapley最早將博弈論的思想應用于信息共享過程中的剩余收益分配問題研究并提出了“Shapley”分配法[1];Rosenthal[2]著重研究了供應鏈各方在信息共享過程中的利益博弈方式和共享模式;勞幗齡[3]基于博弈論方法,針對企業(yè)信息共享中各方的得益問題以及獎懲措施開展研究;Pavlova等[4]建立了多廠委員會的信息共享模式,通過博弈分析提出最低費用補貼制度。
圍繞圖書館信息共享相關研究,劉春麗[5]基于博弈論方法和模型,進行大小圖書館在信息共享過程中的各方利益關系分析;裴雷[6]開展了博弈論在信息資源共享中的應用研究綜述;馬小琪等[7]采用演化博弈理論構建了館際信息共享的博弈模型,分析館際之間合作演化趨勢,并提出推動資源共享的措施和建議。
此外,李雪松等[8]利用博弈論思想提出虛擬社區(qū)信息共享模型和實施設想;蔡海燕[9]針對高校信息共享過程中的博弈問題開展研究,分析外界干預對自發(fā)地陷入囚徒困境的可能影響;蔡小慎等[10]圍繞公共資源交易領域中不同主體間的競合博弈關系開展研究,并提出實現各方利益多贏的機制與措施。
綜上所述,雖然學者們將博弈論理論和方法應用于信息共享的研究不斷增多,但是其中的利益分配機制研究更多地仍停留在理論層面上,而偏應用的算法、模型及其驗證研究十分有限。對于涉及相對復雜利益關系的信息共享過程,各方的決策行為是彼此反饋和動態(tài)博弈的。因此,利用博弈論對信息共享過程中的復雜利益關系進行分析,構建有效的資源共享機制具有重要的參考價值。
鑒于在利用博弈論構建相關數理模型中可能存在的忽略主觀因素等方法缺陷,有必要采用模擬實驗方法開展進一步驗證[11]。經典的博弈實驗包括困境博弈、公共品博弈等。
從1950 年Melvin Dresher與Merrill Flood在蘭德公司實施的囚徒困境博弈實驗,到Flood從合作性收益劃分的視角分析其本源問題,再到John Nash剖析反復博弈可能帶來的缺陷,并提出“接近于均衡”的其他策略出現的可能,學者們圍繞博弈實驗不斷探索。20 世紀60 年代以后,學者們利用博弈實驗開始對一次博弈、有限博弈和無限博弈加以區(qū)別,從而使其研究更加深入。而后,隨著公共品博弈的出現,Vernon Smith通過進行系列博弈實驗,證明了分散激勵機制存在的可能性,提出可用以解決公共品博弈的搭便車問題[12]。于是,公共品博弈實驗研究形成3 條路徑:一是認為搭便車和林達爾均衡情況均可能發(fā)生,并繼續(xù)基于更廣泛的樣本來尋求實驗結果的穩(wěn)定性;二是嘗試分析實驗研究中可能存在的異常情況,進一步優(yōu)化理論和方法體系;三是研究擺脫困境的各種機制。而后,博弈實驗經濟學的方法也隨著信息化發(fā)展逐步轉為線上模式,章平[11]嘗試通過利用Z-tree平臺來開展線上仿真博弈實驗,既能夠提高研究效率,又可以降低誤差。
Z-tree是蘇黎世大學開發(fā)的用于經濟學實驗的平臺?;赯-tree平臺開展模擬實驗對博弈論模型進行驗證的研究日趨成熟。于同奎等[13]基于實驗經濟學方法,分析驗證了引入懲罰機制對社會賄賂現象的負反饋作用;曹興等[14]通過Z-tree平臺,驗證了所構建的企業(yè)間合作博弈模型的有效性和顯著性;趙吉利用Z-tree平臺嘗試進行了囚徒困境博弈模擬實驗,驗證非理性對博弈策略選擇產生的影響[15]。
在基于網絡平臺的科技信息資源共享過程中,涉及的利益相關方主要包括信息提供方、共享平臺、平臺用戶以及政府等管理部門,它們共同構成了博弈主體。各相關方都為尋求自身利益的最大化而不斷與其他主體發(fā)生博弈,這是博弈發(fā)生的前提[16]。在博弈過程中,信息共享涉及的相關方之間的決策行為需完全符合博弈分析的先決條件,主要體現在以下幾個方面。
(1)各利益相關方近似理性的經紀人。即博弈中各利益相關方的偏好是明確且堅持的,在科技信息網絡共享過程中,所有博弈主體都將爭取個體利益的最大化。
(2)博弈要素完全具備。博弈要素主要包括參與人、信息、策略、行動、次序、得益、結果、均衡[17],科技信息網絡共享過程將涉及各博弈主體、科技信息資源、各主體的決策選擇、實施行動及其相關排序,通過決策選擇而付出成本并獲得收益,基于此形成博弈結果,并實現博弈均衡。由此可見,科技信息網絡共享過程具備全部博弈要素。
(3)資源共享具有顯著的外部效應[18]。即在博弈過程中,每個獨立主體都必將受到其他相關方決策行為的影響,從而調整或改變自身決策。
侯聰聰等[16]建立了人類遺傳資源樣本信息網絡共享博弈模型,分別包括資源提供方與共享平臺之間、信息需求方與共享平臺之間、政府與共享平臺之間的博弈模型。本文擬在此研究基礎上,采用模擬實驗來驗證已構建的博弈模型的可行性和可靠性。而針對不同組的利益相關方而言,其模擬驗證和數據分析均采用相同的技術和方法,因此受篇幅所限,本文僅以資源提供方及共享平臺博弈分析為例開展進一步相關研究。
博弈存在的必要要素包括:參與人、策略、得益。在侯聰聰等[16]針對人類遺傳資源樣本信息共享構建的信息提供方與共享平臺之間的博弈模型中,博弈相關方主要包括信息提供方與共享平臺,其中信息提供方可能的策略集={提供信息,不提供信息};共享平臺可能的策略集={積極推動共享,不積極推動共享}。對于平臺而言,促進共享的方式可能包括制定統(tǒng)一的標準規(guī)范體系、強化信息共享制度體系建設、加強網絡平臺功能建設等。支付是所有利益相關方從博弈中取得收益的方式,是各方最關注的問題[19]。
資源提供方的支付假設[16]包括:
假設1:若信息提供方不愿將資源提供給平臺,則提供方只需支付資源本身的采集、加工、存儲等建設成本B;并僅獲得利用自身資源的收益D。
假設2:若信息提供方愿意將資源提供給平臺,則與(1)相比,還需要付出C個單位的額外成本。其中,C是將信息提供方的共享信息分享給平臺的有關成本,包括為滿足平臺制定的統(tǒng)一數據標準進行的數據規(guī)范化成本以及信息傳輸成本等。信息提供方得到的收益將根據平臺參與共享的積極性而進一步分為兩種情況:一是平臺不積極參與信息共享時所得到的收益A,二是平臺積極參與共享時獲得的收益A+L(其中L為與平臺不積極促進共享相比,信息提供方獲得的額外收益)。
共享平臺的支付假設[16]包括:
假設3:若平臺參與資源共享的積極性不高,則其支付成本主要包括平臺的建設成本和運維成本G。此外,還可能損失H(I,J)個收益,如造成更少的信息集成和服務機會所帶來的機會損失I、社會形象損失J等。
假設4:若平臺積極參與資源共享,則其需支付成本G+K,其中K為積極推動共享所需的平臺宣傳推廣、吸納更多提供方加入、發(fā)展更多用戶等附加成本。M為平臺所獲得的全部經濟收益和社會收益。即使一些信息提供方和用戶不積極參與基于平臺的資源共享,但平臺仍可采取積極策略,擴大平臺的行業(yè)影響和聲譽,從而取得良好的后期收益N。提供方及共享平臺成本—收益情況如表1 所示,支付矩陣如表2 所示。
表1 提供方及共享平臺成本-收益表
表2 提供方及共享平臺博弈得益矩陣
博弈模型的建立是基于完全理性人的前提下開展的。但在現實中,博弈雙方實際上無法做到完全理性,而是將受到自身偏好、博弈目標等多因素影響,各利益相關方的決策行為也可能會隨著時間和影響因素的變化而發(fā)生改變[20]。因此,本文采用仿真實驗對建立的博弈模型進行驗證。
本文將通過博弈模型實驗,在模型設置的假設條件下分析信息共享各方之間可能存在的復雜博弈關系,并驗證基于模型得出的相關結論的可靠性。信息共享過程中各方在博弈過程中的決策行為主要包括:博弈的均衡、收斂問題以及利益相關方的行為模式動態(tài)調整特征[17]。
3.1.1 實驗工具
實驗根據研究目的和設計的情景,通過ZTree平臺來完成。主試通過服務器軟件來控制整個程序的實施,向被試發(fā)出指令,并將根據信息共享過程的進展賦予相應參數;被試通過客戶端軟件接受實驗指令并選擇其決策行為[17]。
3.1.2 實驗過程
基于構建的博弈模型,組織20 名碩士生參與本次博弈控制實驗,并隨機分為10 組實驗對,每組實驗對分別擔任參與信息共享過程的信息提供方和網絡平臺的角色,但被試的角色被隨機分配且始終固定。為了提高被試積極參與實驗的動力,還置入了獎勵機制,根據被試參與決策所獲得的相應支付的累計情況進行排名,來引發(fā)被試對其獲得獎勵支付的觸動。在每一輪實驗中,每個角色除了能夠得知自身的決策收益外,也可獲知同一實驗對中另一方的決策信息。整個實驗共進行30 輪次。
支付矩陣的建立是博弈控制實驗中關鍵環(huán)節(jié),需要將已構建的博弈得益矩陣轉化為實數矩陣。本文設計了專家問卷,依據專家智慧來建立支付矩陣。
3.2.1 信息提供方得益賦值
當平臺方積極參與信息共享時,假設信息提供方將其信息提供給共享平臺所獲得的收益為8;當平臺不積極參與共享,而信息提供方仍然進行信息提供行為時,平臺能夠為其帶來的信息分享機會以及由此帶來的附加收益必將有所減少,因此將提供方收益暫賦值為6。
當信息提供方拒絕向平臺提供資源時,其資源本身無法通過平臺被終端用戶獲得和使用,則提供方的得益只能通過非共享平臺渠道,并將低于信息提供方提供資源但平臺不積極推動共享時的收益,因此將提供方收益的賦值降低為4;當雙方對共享過程均持不積極態(tài)度時,無論平臺是否積極參與共享都不會增加或減少提供方的收益,因此將此種情況下提供方的收益仍設定為4。
3.2.2 共享平臺得益賦值
若信息提供方選擇提供信息資源,那么平臺積極參與資源共享可獲得的收益賦值為6;反之,平臺將可能因其共享動力不足、提供的服務有限而降低用戶使用平臺資源的可能性,并帶來負面社會成本和機會成本,此時設定平臺獲得的收益為4。
若信息提供方不向平臺提供資源,那么平臺積極參與資源共享時一方面將付出平臺的建設成本、宣傳推廣成本、運營成本等,另一方面也將獲得擴大知名度和社會認可度等一定的收益。但對于一個共享平臺而言,資源規(guī)模是保障其良好服務和運行的核心因素之一,因共享資源量受限必將對平臺收益產生較大負面影響,因此對平臺的收益賦值為2;而平臺不積極參與共享時將進一步降低平臺收益,故賦值為-2。
表3 為提供方及共享平臺博弈得益矩陣轉化得到的實數矩陣,其中矩陣中的數字采用專家咨詢法,經專家多次賦值和反饋而形成的,僅代表收益的相對大小,而非真實收益。
表3 提供方及共享平臺博弈得益實數矩陣
基于信息提供方與共享平臺建立的博弈得益實數矩陣,進一步采取適當的促進各方積極參與信息共享的措施可獲得不同情境下的改進矩陣。情景1:降低信息提供方信息規(guī)范化、信息傳輸等共享成本或增加共享資源規(guī)模、提高資源質量等,可得到進階矩陣1(表4);情景2:減少信息提供方不通過平臺而通過其他方式所取得的收益,從而得到進階矩陣2(表5);情景3:減少共享平臺積極推動共享的附加成本,可得到進階矩陣3(表6);情景4:提高平臺不積極參與信息共享的成本,可得到進階矩陣4(表7)。
表4 進階矩陣1(降低C值,增加A、L值)
表5 進階矩陣2(降低D值)
表6 進階矩陣3(降低K值)
表7 進階矩陣4(增加H值)
在上述實驗基礎上,將針對參與本次實驗全部成員的30 輪決策信息開展進一步分析。為了排除可能的實驗成員個人因素干擾,首先需對獲得的實驗數據開展預處理,對在實驗全過程中均采取同一決策選擇的數據予以剔除,而后開展數據的收斂性分析和假設檢驗分析。
3.3.1 收斂性分析
基于對實驗決策數據的統(tǒng)計分析可以看到,被試在第1 輪~第15 輪的決策選擇變化明顯,即該階段可被視為實驗成員不斷適應和逐步優(yōu)化自身博弈決策的階段。在此階段中,被試針對被賦予的實驗參數和要求而做出的決策選擇不斷調整,以使其自身收益最大化;在第15 輪過后,大部分被試的決策選擇都趨于相對穩(wěn)定狀態(tài)。在此狀態(tài)下,實驗成員維持的是其認為更有利于自身利益的決策。因此,本文將第15 輪決策作為分界線,將之后輪次的相對穩(wěn)定決策行為視為穩(wěn)定收斂。
表8 給出了信息提供方與平臺之間均衡收斂的分布情況。可以看出,在本次實驗中,參與基礎矩陣的實驗人員收斂在(提供,積極推動共享)決策選擇的比例為40%;進階矩陣1 通過進一步降低信息規(guī)范化、信息傳輸等共享成本或努力增加共享收益而穩(wěn)定在(提供,積極推動共享)決策選擇的收斂率為62.5%;進階矩陣2 通過減少信息提供方通過平臺以外的其他方式所取得的收益,從而穩(wěn)定在(提供,積極推動共享)的收斂率為62.5%;進階矩陣3 通過減少平臺積極推動共享的附加成本,其穩(wěn)定在(提供,積極推動共享)決策選擇的收斂比例是75%;進階矩陣4 通過提高平臺不積極參與信息共享的成本后,收斂在(提供,積極推動共享)的比例為85.7%。
表8 信息提供方與平臺均衡收斂的分布情況
3.3.2 假設檢驗分析
通過收斂率分析可以看到上述各種情景下針對各方提高參與資源共享積極性措施的效果,但相關結論的嚴謹性仍有待進一步驗證。本文采取假設檢驗的方法進行分析,將信息提供方向平臺提供資源、平臺積極開展宣傳推廣及制定利益分配機制等博弈雙方相互協作的決策行為統(tǒng)稱為“合作”。
圖1 為信息提供方與共享平臺兩者間相互博弈合作率的分布情況。從圖1 可以看到,在實驗的初始時期,合作率的變化幅度較明顯,此時各方處于“試探”和調整決策期,經過一定輪次后,各方的決策行為趨于相對穩(wěn)定。此外,各個情景下的進階矩陣1 ~進階矩陣4 的合作率普遍高于基礎矩陣,且比基礎矩陣更早地收斂于相對穩(wěn)定狀態(tài)。
圖1 信息提供方與共享平臺博弈合作率分布情況
為確保相關研究結論的嚴謹性,在開展假設檢驗驗證時,提出如下假設:
開展顯著性檢驗,首先需選擇適當的假設檢驗方法,判斷信息提供方與共享平臺之間的合作率數據是否符合正態(tài)分布,因其樣本量小于5 000,故選擇Shapiro-Wilk(S-W檢驗)。由表9 中的統(tǒng)計結果可知,sig.值均小于0.05,因此該5 組數據均不符合正態(tài)分布,只能采取未知分布類型的非參數統(tǒng)計檢驗,本文采用秩和檢驗方法加以分析。
表9 信息提供方與共享平臺合作率數據正態(tài)性檢驗
采用SPSS分別對基礎矩陣和進階矩陣1 ~進階矩陣4 進行兩個獨立組的秩和檢驗,獲得的基礎矩陣與進階矩陣1 分別對應的決策數據的顯著性雙側值為0.026,小于0.05,因此原假設不成立,而接受備擇假設。結果表明,在0.05的顯著性水平下,針對博弈雙方做出改進后的合作率分布與未改進前的總體分布存在差異,基于建立的基礎矩陣,進一步采取降低向平臺共享資源的成本或增加共享資源規(guī)模、提高信息質量等措施可帶來更多收益,有助于提高信息共享效率。同理,基礎矩陣對應的決策數據與進階矩陣2、進階矩陣3、進階矩陣4 對應的決策數據的顯著性雙側值分別為0.022、0.032、0.001,均小于0.05,因此對信息提供方和共享平臺采取的一系列措施能夠有效提高博弈雙方合作率,促進信息共享并實現雙方共贏。
本文通過Z-tree平臺模擬基于網絡平臺的科技信息資源共享利益相關方的博弈場景,設計并開展博弈實驗。實驗結果表明,通過建立資源提供方及共享平臺之間博弈模型,并對其進行求解分析所得出的促進科技信息資源共享的措施是切實有效的。
本文主要是通過在Z-tree平臺上編程并借助局域網開展模擬控制實驗。在后續(xù)相關研究中可進一步嘗試采用情景實驗方法,力圖更加接近真實情況,減少實驗誤差。