• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    企業(yè)數據聯(lián)邦學習的收益分享機制研究

    2023-06-15 05:19:38張瀟揚竇一凡張成洪黃麗華
    預測 2023年2期
    關鍵詞:數據量邊際效用

    張瀟揚, 竇一凡, 張成洪, 黃麗華

    (復旦大學 管理學院,上海 200433)

    1 引言

    數據作為最具時代特征的生產要素,逐漸成為我國深化發(fā)展數字經濟、推動企業(yè)和社會治理數字化轉型的核心引擎。企業(yè)推進數字化轉型,走向數據智能驅動的運營需要多模態(tài)多來源的數據為創(chuàng)新提供原料[1,2]。然而,“數據孤島”已成為當下束縛企業(yè)進一步探索數據價值,社會進一步推動數字經濟發(fā)展的“卡脖子”問題。推進數據要素流通,促進企業(yè)間的數據融合使用和協(xié)同創(chuàng)新[3],已成為釋放數據的戰(zhàn)略基礎資源作用[4]的不二之舉。

    以聯(lián)邦學習為代表的隱私計算方式已成為推動數據流通的重要的技術解決方案。傳統(tǒng)的機器學習方法往往需要依賴于數據資源的跨組織聚合以形成數字產品,但面臨著嚴峻的隱私保護、安全與合規(guī)挑戰(zhàn)[5]。相較而言,聯(lián)邦學習是一種既聯(lián)合多方又不共享各方數據資源的分布式學習框架,在保障數據隱私保護、安全及合法合規(guī)的基礎上,實現數據共享,共同建模[5-7]。

    然而,技術的逐漸完善并未帶來應用的廣泛普及,以及數據要素流通的繁榮。我國在數據市場的早期探索中發(fā)現了包括交易成本問題[8]、數據價值評估問題[9]等諸多問題。其中作為數據治理體系的重要組成部分[10],激勵企業(yè)參與的收益分享機制設計已成為推進數據要素流通的重要問題,也是聯(lián)邦學習中的重要研究問題[5,11-13]。目前已有一些文獻提出了聯(lián)邦學習中可能的收益分享機制,包括平等收益分享機制、個體收益分享機制與邊際收益(損失)分享機制[14-17]等。在此基礎上,Zhang等[18]討論了上述機制如何激勵具有相同數據量的數據提供方參與聯(lián)邦數據投入的問題。然而,在實踐中,具有相同數據量的參與者的情形有限,更多的情形是來自不同行業(yè)、擁有不同規(guī)模數據的企業(yè)參與聯(lián)邦學習的應用探索。比如,百度點石聯(lián)邦學習平臺作為聯(lián)邦學習的發(fā)起者,支持政府部門的政務數據、銀行機構等不同行業(yè)的參與者一起進行聯(lián)邦學習的應用探索。其中政府部門、銀行機構等均擁有高質量的數據,但是數據規(guī)模和數據內容均不同??梢姡?lián)邦學習的主要挑戰(zhàn)之一是如何激勵擁有不同規(guī)模的異質數據的參與者參與聯(lián)邦學習[18],但目前仍沒有關于異質數據提供方在不同收益分享機制下如何進行是否參與聯(lián)邦學習的決策方面的相關討論。

    針對上述問題,本文從經濟學的視角提出了一個完全信息下的靜態(tài)模型來考察聯(lián)邦學習各方的參與激勵。具體而言,本文基于上海富數科技公司正在開展的聯(lián)邦學習應用的一個實際案例來研究在不同收益分享機制下異質數據提供方如何進行聯(lián)邦決策,以及聯(lián)邦如何達成的問題,其中數據提供方處于不同的行業(yè),數據規(guī)模存在差異。本文的目標是分析聯(lián)邦學習平臺該如何設計最優(yōu)的收益分享機制,以吸引異質數據提供方加入聯(lián)邦。本文的發(fā)現彌補了聯(lián)邦學習相關文獻的空白,并且對于數據要素流通實踐具有指導意義。

    2 文獻綜述

    聯(lián)邦學習的概念最早由谷歌公司提出,其主要思想是基于分布在多個設備上的數據集構建機器學習模型,并防止數據泄漏[19,20]。之后,Yang等[5]將聯(lián)邦學習定義為所有保護隱私的去中心化協(xié)作的機器學習技術。傳統(tǒng)機器學習方法直接將數據于本地聚合并建模,而聯(lián)邦學習的核心思想是在多個數據源共同參與模型訓練時不需要進行數據資源的跨域流通,而是通過交互模型中間參數進行模型聯(lián)合訓練,以實現數據隱私保護和數據共享分析的平衡,達到“數據不動算法動”的數據應用模式[5-7,11]。在隱私保護的同時,聯(lián)邦學習并沒有犧牲模型的準確度,諸如SecureBoost[21],CORK[22]等算法能達到與將數據聚合的集中式非隱私保護方法相同的準確度,即無損聯(lián)邦學習(lossless federatedlearning)。梁鋒等[11]提出了目前聯(lián)邦學習存在的主要問題,包括客戶端資源受限問題(如計算、通信資源)、客戶端在線率低、貢獻與回報不平問題等。其中前兩種問題已有多種技術解決方案,如節(jié)省服務端的計算成本的聯(lián)邦矩陣分解算法(federatedMF)[23]、通過本地多次迭代訓練來降低通信成本等[24]。本文的研究旨在利用激勵機制設計來解決貢獻與回報不平等問題。

    當下,聯(lián)邦學習激勵機制設計問題得到了廣泛關注。目前已有大量文獻提出相應解決方案,可以劃分為貢獻度驅動[17]、信譽值驅動[25,26]與資源分配驅動[27-30]的激勵機制設計三類[13]。貢獻度驅動激勵機制關注如何吸引更多的數據量與更高數據質量。如Yu等[16]綜合考慮貢獻、模型成本、模型遺憾與模型時間遺憾等因素,提出了聯(lián)邦激勵方案(federatedlearningincentive,FLI)。該方案能夠在保證公平的同時,激勵提供大量高質量數據的數據所有者。在信譽值驅動方面,urRehman等[26]提出了一個基于區(qū)塊鏈的信譽系統(tǒng)。通過智能合約,該系統(tǒng)能夠聚合、計算和記錄聯(lián)邦學習中每個參與者的聲譽,從而激勵參與者良性行為。但該方法面臨評分機制不夠客觀,缺乏質量分析等問題。對此,Kang等[25]提出了一個基于契約理論的激勵機制。該機制利用聲譽衡量可靠性和可信賴性,激勵擁有高質量數據的高聲譽設備參與學習。資源分配驅動激勵機制關注如何在異構客戶端之間進行資源配置問題[27-30],包括計算資源配置與通信資源配置。如Zhan和Zhang[29]實現了模型訓練時間與參數服務器支付之間的最優(yōu)權衡,Pandey等[28]通過構建效率成本模型,在模型參數交換過程中考慮傳播效率。

    本文關注以數據量作為貢獻度的激勵機制設計問題,主要參考了平等收益分享機制、個體收益分享機制、邊際收益/損失分享機制[14-17]。平等收益分享機制(egalitarianprofitsharing)是一種收益平攤的方法,其不足之處在于會導致“搭便車”現象,即不同貢獻度的數據提供方獲得相同的收益,這會迫使高貢獻度數據提供方不愿意參與聯(lián)邦學習[14,15]。個體收益分享機制(individualprofit sharing)的核心思想是通過衡量只有該參與者參加到活動中時產生的收益[14]來分配給每個參與者。邊際收益分享機制(marginalgainprofitsharing)和邊際損失分享機制(marginallossprofitsharing)分別衡量參與者加入和離開聯(lián)邦時整體聯(lián)邦學習績效價值的改變[15],來對參與者進行收益分配。從以上分享機制出發(fā),Zhang等[18]檢驗了一個連接同質數據提供者的平臺該如何選擇最優(yōu)的激勵機制以實現利潤最大化。然而,聯(lián)邦學習的主要挑戰(zhàn)之一是如何激勵擁有大量數據的客戶在其本地數據集上訓練算法[18],本文的模型考慮了異質數據提供者在不同的激勵機制下會如何進行數據聯(lián)邦加入決策。

    3 研究模型的構建

    3.1 一個實踐案例

    上海富數科技有限公司(https://www.fudata.cn/,以下簡稱富數科技)成立于2016年,是我國目前隱私安全計算的領跑者,專注于聯(lián)邦學習、多方安全計算、匿蹤查詢等加密計算領域。該公司2021年入選福布斯中國企業(yè)科技50強,自主研發(fā)的隱私計算產品Avatar平臺與商業(yè)應用落地處于市場領先地位,是我國首批獲得銀行卡檢測中心、中國信通院、中國公安部的權威認證的公司,落地場景覆蓋金融、政務、運營商、電力等各個數據相關領域。

    有一個典型的應用場景是基于非金融數據的增信評估。消費信貸的征信評估往往以二代征信數據以及貸款申請信息為主要評估基礎,而非金融數據有很強的預測性,但并未大規(guī)模應用于信用評估中。如何合規(guī)合法地引入外部非金融數據為銀行征信賦能是一個非常重要的聯(lián)邦學習的需求應用。

    富數科技基于其聯(lián)邦學習引擎,可以對來自電信運營商、銀聯(lián)、航信數據以及其他數據資源等不同企業(yè)的千萬級數據、幾千個維度,通過多方數據源進行聯(lián)合建模,并通過持牌個人征信公司進行輸出,為銀行的消費信貸提供合規(guī)有效的行業(yè)賦能,如圖1所示。

    圖1 聯(lián)邦學習的應用場景:非金融數據的增信評估

    3.2 基本模型

    基于圖1所示,我們考慮聯(lián)邦發(fā)起方作為中心節(jié)點,連接異質數據的參與者構成的數據聯(lián)邦網絡。該網絡聯(lián)邦發(fā)起方是為聯(lián)邦學習提供基礎設施服務的富數科技,提供服務平臺的同時也提供聯(lián)邦學習算法。我們假設該富數科技(聯(lián)邦發(fā)起方)是收支平衡的,即不參與提供數據與收益分享,將聯(lián)邦學習取得的收益分享給各數據提供方。

    數據提供方的數據存在異質性。簡便起見,我們考慮兩類異質的企業(yè),即擁有數據分別為dA(如電信運營商)和dB(如銀聯(lián)。不失一般性,我們將dA標準化為1)的A類企業(yè)和B類企業(yè),對應企業(yè)數量為NA和NB。該網絡中每個數據提供方為策略性(strategic)的,在觀測到公開信息(數據量)后,他們能夠推測其他數據提供方的決策,并選擇是否加入聯(lián)邦。假定同類企業(yè)面臨著相同的權衡,因此會做出相同的聯(lián)邦決策。我們記i類企業(yè)的聯(lián)邦決策為si={0,1},i∈{A,B}。

    選擇加入數據聯(lián)邦(即si=1)的數據提供者能夠通過聯(lián)邦學習實現數據的跨組織協(xié)作。這類似于傳統(tǒng)機器學習中直接將數據聚合為總訓練集,對應總數據量我們用常替代彈性生產函數(CES productionfunction)衡量數據聯(lián)邦總產出g(d)為

    其中δ∈(0,1)表示聯(lián)邦學習效率,k∈[0,1]表示算法利用數據的能力。一方面,隨著訓練數據的增加,模型的精確度更加難以提高[18],即算法的精確度關于數據量規(guī)模報酬遞減,我們利用k∈(0,1)來表示該特征。另一方面,如 SecureBoost[21],CORK[22]等無損聯(lián)邦學習的算法能達到與將數據聚合的集中式非隱私保護方法相同的準確度,因此考慮無損聯(lián)邦學習的場景,即δ=1。

    此外,數據提供方加入聯(lián)邦需要支付成本,如企業(yè)數據加工成本以及在聯(lián)邦計算過程中產生的計算、硬件設施及通信成本。我們考慮線性成本函數形式如下

    其中c表示固定邊際成本。

    3.3 收益分享機制

    正如2.1節(jié)中的討論,我們考慮三種收益分享機制,即平等收益分享機制、個體收益分享機制與邊際效用分享機制。在三種機制下,參與方i從聯(lián)邦總收益R中獲得的收益ri為

    其中vi表示參與方i的貢獻度,表示所有加入聯(lián)邦的企業(yè)貢獻度之和。在不同機制下,參與方的貢獻度衡量方式不同,對此我們說明如下。

    (1)平等收益分享機制:沿用Yang等[14],Gollapudi等[15]中關于平等分配的討論,數據聯(lián)邦的產出平均分配給所有參與方,即各參與方擁有相同的貢獻度

    (2)個體收益分享機制:沿用Yang等[14]中個體收益分享方法,參與方的貢獻度衡量為其單獨形成聯(lián)邦時產生的收益,即

    (3)邊際效用分享機制:邊際效用分享機制綜合了Gollapudi等[15]中邊際收益/損失分享機制,其中兩種方法的衡量都是基于序貫的。在靜態(tài)的模型中,我們將以上兩種機制統(tǒng)一為邊際效用分享機制,該機制將參與方的貢獻度衡量為其加入/離開時產生的邊際效用/損失,即

    3.4 企業(yè)效用與決策

    綜上,我們考慮數據提供方i(i∈{A,B})的權衡。簡便起見,我們記數據提供方i在平等分享機制、個體收益分享機制、邊際效用分享機制的效用分別為UEiM,UIiM,UMiM。可見,若全部數據提供方選擇加入聯(lián)邦時,數據提供方i(i∈{A,B})加入聯(lián)邦的收益為

    數據提供方i選擇加入聯(lián)邦(si=1)當且僅當Uξi≥Ui0,其中ξ表示不同的分享機制,Ui0表示數據提供方i的外部選擇,我們不妨設為0,即Ui0=0。以上條件表明,只有加入聯(lián)邦后根據不同分享機制所獲得總利潤的收益分成不小于該數據提供方加入聯(lián)邦所需要的成本(如數據處理成本、協(xié)調成本等),數據提供方才會選擇加入聯(lián)邦(si=1)。否則,數據提供方選擇不加入聯(lián)邦(si=0),不會參與為由發(fā)起方提供的算法提供數據。

    為了更好地闡述模型的合理性,我們還需要對以下幾點進行說明。首先,上述模式是靜態(tài)模型中的自由數據聯(lián)邦,假設數據提供方在加入聯(lián)邦后取得一次性收益并支付成本?,F實中,數據聯(lián)邦中往往是動態(tài)并且多次學習的。上述模型可以認為是將多次學習的收益或多周期的收益支付等過程一并計算到一次性收益中,這沒有犧牲一般性。其次,我們認為聯(lián)邦學習模型結果是競爭性的,即假設聯(lián)邦學習模型只能由發(fā)起方(或數據聯(lián)邦)利用,而各數據參與方并不能獨立地使用該模型,該假設在很多聯(lián)邦學習場景是成立的。最后,我們沒有在產出中考慮數據(或算法)的不確定性。加入不確定性與參與方預期可能出現難以找到均衡或者多均衡解的情況,我們將其放到未來工作中。

    4 分析結果

    基于上述討論,首先,我們檢查在參與方數據存在異質性的情況下會如何進行加入聯(lián)邦的決策。我們定義聯(lián)邦決策可行域為數據提供方愿意加入聯(lián)邦的條件,結合我們在3.4節(jié)中的討論,數據提供方i選擇加入聯(lián)邦(si=1)當且僅當Uξi≥Ui0(=0)。進一步,我們定義聯(lián)邦決策邊界為數據提供方選擇加入聯(lián)邦的最低條件(下界),即數據提供方i的聯(lián)邦決策邊界為Uξi=0。其次,我們檢查數據聯(lián)邦會如何形成。我們定義聯(lián)邦形成可行域為聯(lián)邦能夠形成的條件。具體來說,由于數據提供方的策略性,即便數據提供方i選擇加入聯(lián)邦,但數據提供方j選擇不加入,聯(lián)邦依然不能形成。因此,聯(lián)邦形成需要所有數據提供方收益為正,即對任意數據提供方i,有Uξi≥Ui0(=0)。同樣的,我們定義聯(lián)邦形成邊界是所有數據提供方都選擇加入聯(lián)邦時的最低條件(下界)。在此基礎上,我們對比不同機制對于數據提供方異質性的兼容能力。最后,我們采用數值試驗的形式對以上部分進行補充。

    4.1 分析結論

    我們首先討論聯(lián)邦決策邊界,可以得到命題1。

    命題1當數據存在異質性時(即dA≠dB),在三種機制下數據提供方聯(lián)邦決策邊界均不同。

    證明在三種機制下UA=0與UB=0有且僅有一組解,即dB=dA。

    不妨假設dB≥dA(=1),考慮數據提供方的決策邊界Uξi=0,A類企業(yè)與B類企業(yè)決策交點的必要條件是整個聯(lián)邦收支平衡,即

    將(5)式帶入(6)式可以解出交點的必要條件是

    在三種收益分享機制下,(7)式帶入UξA=0與UξB=0,可以分別得到

    (1)平等收益分享機制

    (2)個體收益分享機制

    (3)邊際效用分享機制

    對于平等收益分享機制與個體收益分享機制,易知解的必要條件為dB=dA。

    對于邊際效用分享機制,易知dB=dA時等式(10-1)和(10-2)同時成立。我們證明,當dB>dA時,有

    若(11)式成立,則(10-1)式和(10-2)式不同時成立,即證。

    實際上,(11)式等價于

    對(12)式左右同時除以dkB+1,并記dA/dB為x∈(0,1),記NAx+NB為y∈(1,+∞),整理為

    可證左式關于x=0與x=1的極限均為0,并且為凸函數(convex,二階導恒為正),因此成立。

    命題1告訴我們,當權衡數據聯(lián)邦的收益成本時,數據存在異質性的方可能有不同的決策。如圖2所示,在三種不同的分享機制下,A類企業(yè)(實線)與B類企業(yè)(虛線)的聯(lián)邦決策邊界均僅有一個交點,即兩者數據相同時(即圖2中交點位于dB=dA時)。當數據存在異質性時,數據提供方聯(lián)邦決策邊界不同。

    圖2 企業(yè)聯(lián)邦決策與聯(lián)邦形成(NA=NB=1,c=0.7)

    從圖2中可見,異質性數據提供方的決策在不同機制下存在差異。由此,我們進一步探索聯(lián)邦形成邊界,得到命題2。

    命題2當數據存在異質性時(即dA≠dB),在三種機制下聯(lián)邦達成邊界有差異,具體來說:

    (1)在平等收益分享機制與個體收益分享機制中,若擁有數據量較大的數據提供方愿意加入,則數據量較小的數據提供方一定愿意加入,聯(lián)邦形成邊界與數據量大的數據提供方聯(lián)邦決策邊界相同。

    (2)在邊際效用分享機制中,若擁有數據量較小的數據提供方愿意加入,則數據量較大的數據提供方一定愿意加入,聯(lián)邦達成邊界與數據量小的數據提供方聯(lián)邦決策邊界相同。

    證明不妨設dB>dA=1,我們分別證明:

    (1)在平等收益分享機制與個體收益分享機制中,若UB>0,則UA>0。

    由(5)式,在平等收益分享機制中,UEAM>UEBM,易知若UEBM>0,則UEAM>0。在個體收益分享機制中,UIBM>0等價于

    而cd1B-k>cd1A-k,則有

    這等價于UIMA>0,即證。

    (2)在邊際效用分享機制中,若UA>0,則UB>0。

    由(5)式,在邊際效用分享機制中,UMMA>0等價于

    同命題1中的證明,我們有

    因此有

    整理即為UMMB>0。

    命題2告訴我們,不同的收益分享機制會給擁有異質性數據的參與方帶來不同的權衡。如圖2所示,在三種機制下,數據提供方都傾向于在算法能力較強時(即k更大時)選擇加入聯(lián)邦,這是由于算法能力的提高能夠把“蛋糕”做大,帶來更高的總收益。然而,數據提供方還需要關注“蛋糕”的分配問題,即收益分享機制。在平等收益分享機制與個體收益分享機制中,數據量更大的數據提供方更難加入聯(lián)邦,而邊際效用分享機制則相反。這意味著,在“蛋糕”的分配上,平等收益分享機制與個體收益分享機制更傾向于小數據提供方,而邊際效用分享機制更傾向于大數據提供方。

    與傳統(tǒng)機器學習相比,聯(lián)邦學習對計算與通信提出了更高的要求。目前已有諸多文獻提出了技術解決方案[23,24]。若企業(yè)通過該類方法降低邊際成本c(如圖3所示,邊際成本由圖2中0.7降為0.6),結合(5)式,聯(lián)邦成本下降導致企業(yè)更可能加入聯(lián)邦(體現在聯(lián)邦決策邊界下移),聯(lián)邦也因此更容易形成(體現在聯(lián)邦形成邊界下移)。由此,我們得到推論1如下。

    圖3 企業(yè)聯(lián)邦決策與聯(lián)邦形成(NA=NB=1,c=0.6)

    推論1當加入聯(lián)邦成本降低時,企業(yè)更可能加入聯(lián)邦,聯(lián)邦更容易達成。

    在實踐中,企業(yè)在邊際成本上可能存在差異。結合命題2與推論1,若數據量較小企業(yè)面臨更高的邊際成本,如擁有較差的計算、通信資源,或者較低的數據質量,則應當在機制設計上傾向于小企業(yè),如選擇個體收益分享機制。反之,若數據量較大企業(yè)面臨更高的邊際成本,則應考慮采用邊際效用分享機制。

    若平臺希望通過補貼的方式來促進聯(lián)邦的達成以實現社會最優(yōu),我們可以得到推論2如下。

    推論2當數據存在異質性時(即dA≠dB),在三種機制下,社會最優(yōu)的聯(lián)邦發(fā)起方(或平臺)的補貼策略不同。具體來說,對于平等收益分享機制與個體收益分享機制,應當補貼數據量較大的數據提供方;對于邊際效用分享機制,應當補貼數據量較小的數據提供方。

    在分析了三種機制下的參與方的聯(lián)邦決策與聯(lián)邦達成的基礎上進一步討論聯(lián)邦中參與方數據的異質性問題。假設dB>dA=1,并且使用dB/dA∈(1,+∞)來衡量企業(yè)數據的異質性,并假設dB/dA越大則表明企業(yè)數據的異質性越強。我們首先對比平等收益分享機制與個體收益分享機制對于數據異質性的兼容能力,得到命題3如下。

    命題3當數據存在異質性時(即dA≠dB),個體收益分享機制比平等收益分享機制更容易兼容異質性數據提供方。

    證明對于任意dB滿足UEAM>0,UEBM>0,則其一定滿足UIMA>0,UIMB>0。

    根據命題2,在平等收益分享機制與個體收益分享機制中,若UB>0,則UA>0。因此,我們只需要證明對于任意dB滿足UEBM>0,則其一定滿足UIBM>0。實際上,對于dB>dA=1,由(5)式易知UIBM>UEBM,因此成立。

    由命題2可知,平等收益分享機制與個體收益分享機制的聯(lián)邦達成邊界均為數據量較大的參與方的聯(lián)邦決策邊界。由此我們繪制個體收益分享機制與平等收益分享機制下聯(lián)邦可行域如圖4所示,其中黑色虛線與灰色虛線分別代表個體收益分享機制與平等分享機制下的聯(lián)邦形成邊界??梢钥闯觯降仁找娣窒頇C制下聯(lián)邦可行域始終是個體收益分享機制的子集。因此,當k一定時,個體收益分享機制能夠允許異質性更強的數據提供方加入聯(lián)邦。

    圖4 個體收益分享機制與平等收益分享機制比較——聯(lián)邦可行域(NA=NB=2,c=0.3)

    4.2 數值觀察

    接下來,我們采用數值解對以上討論進行補充。由命題2可知,不同于平等收益分享機制,邊際效用分享機制的聯(lián)邦形成邊界為數據量較小的數據提供方的聯(lián)邦決策邊界。我們繪制邊際效用分享機制與平等收益分享機制下聯(lián)邦的可行域如圖5所示,其中黑色實線與灰色虛線分別代表邊際效用分享機制與平等收益分享機制下的聯(lián)邦形成邊界。從圖5中可以發(fā)現,當聯(lián)邦成本較小時,平等收益分享機制與邊際效用分享機制的聯(lián)邦形成邊界有交點(即圖5a中灰色虛線與黑色實線存在交點),而當聯(lián)邦成本較大時(如圖5b),平等收益分享機制聯(lián)邦可行域是邊際效用分享機制聯(lián)邦可行域的子集。因此,可以得出觀察1。

    圖5 邊際效用分享機制與平等收益分享機制比較——聯(lián)邦可行域(NA=NB=1)

    觀察1當數據存在異質性時(即dA≠dB),若數據成本較大,則邊際效用分享機制比平等收益分享機制更容易兼容異質性數據提供方。

    最后,我們考慮算法能力如何影響聯(lián)邦關于數據提供方異質性的兼容能力。以個體收益分享機制為例,如圖6所示,隨著算法利用數據能力的提高,聯(lián)邦能夠兼容異質性更強的數據提供方(即圖6中虛線變“高”)。因此,可以得出觀察2。

    圖6 數據提供方異質性與算法能力(以個體收益分享機制為例)(NA=NB=2,c=0.5)

    觀察2當數據存在異質性時(即dA≠dB),在三種機制下聯(lián)邦可兼容數據提供方的異質性關于算法利用數據能力(即k)均呈單調遞增。

    5 研究結論與啟示

    本文從聯(lián)邦學習的應用實踐出發(fā),討論了異質數據提供方在不同的收益分享機制下會如何進行聯(lián)邦決策的問題。研究發(fā)現,在平等收益分享機制與個體收益分享機制中,數據量較大的數據提供方更難加入數據聯(lián)邦,這表明兩種機制的分配更偏向小數據提供方。而邊際效用分享機制則相反。進一步,本文檢驗了平臺該如何設計最優(yōu)的收益分享機制,以吸引異質數據提供方加入聯(lián)邦。研究發(fā)現,個體收益分享機制與邊際效用分享機制能夠兼容異質性更強的數據提供方。這表示這兩種機制更能夠吸引數據量大的數據提供方加入聯(lián)邦學習以共同建模。

    在實踐上,本文的研究對基于聯(lián)邦學習的數據要素流通給出了管理學的見解。首先,異質數據提供方的激勵機制設計應結合考慮數據提供方的數據規(guī)模與算法能力。當潛在聯(lián)邦網絡中企業(yè)數據異質性較強時,只有當算法能力較強時聯(lián)邦才有可能達成,即利用算法能夠創(chuàng)造更多的產出。反之,若算法不能夠帶來更高的價值,則聯(lián)邦學習僅在企業(yè)數據異質性較弱時才可以達成。另外,若聯(lián)邦邊際成本降低,則聯(lián)邦網絡更容易達成。其次,就聯(lián)邦學習平臺而言,選擇個體收益分享機制與邊際效用分享機制能夠激勵數據規(guī)模大的數據提供方加入聯(lián)邦當中。另外,若平臺希望通過補貼策略來激勵數據提供方參與數據聯(lián)邦,則應該在采用個體收益分享機制時補貼數據量較大的數據提供方,在采用邊際效用分享機制時補貼數據量較小的數據提供方。

    猜你喜歡
    數據量邊際效用
    隨身新配飾
    基于大數據量的初至層析成像算法優(yōu)化
    計算Lyapunov指數的模糊C均值聚類小數據量法
    高刷新率不容易顯示器需求與接口標準帶寬
    寬帶信號采集與大數據量傳輸系統(tǒng)設計與研究
    電子制作(2019年13期)2020-01-14 03:15:18
    小學美術課堂板書的四種效用
    少兒美術(2019年7期)2019-12-14 08:06:22
    追求騎行訓練的邊際收益
    社會治理的邊際成本分析
    消費導刊(2018年8期)2018-05-25 13:20:20
    納米硫酸鋇及其對聚合物的改性效用
    中國塑料(2016年9期)2016-06-13 03:18:48
    幾種常見葉面肥在大蒜田效用試驗
    延庆县| 介休市| 榆中县| 丰都县| 广水市| 久治县| 石泉县| 林芝县| 宁德市| 右玉县| 乐东| 疏附县| 施甸县| 会泽县| 临海市| 东阳市| 政和县| 关岭| 秦安县| 赤峰市| 清苑县| 肥东县| 舟曲县| 临潭县| 海淀区| 永州市| 巢湖市| 汽车| 板桥市| 伊宁市| 溧水县| 浦东新区| 大田县| 贵德县| 小金县| 绵竹市| 黔西县| 德阳市| 绥滨县| 文昌市| 滕州市|