孫睿,李超*,王偉,童恩棟,王健,劉吉強(qiáng)
基于區(qū)塊鏈的聯(lián)邦學(xué)習(xí)研究進(jìn)展
孫睿1,2,李超1,2*,王偉1,2,童恩棟1,2,王健1,2,劉吉強(qiáng)1,2
(1.智能交通數(shù)據(jù)安全與隱私保護(hù)技術(shù)北京市重點(diǎn)實(shí)驗(yàn)室(北京交通大學(xué)),北京 100044; 2.北京交通大學(xué) 計(jì)算機(jī)與信息技術(shù)學(xué)院,北京 100044)(?通信作者電子郵箱li.chao@bjtu.edu.cn)
聯(lián)邦學(xué)習(xí)(FL)是一種能夠?qū)崿F(xiàn)用戶數(shù)據(jù)不出本地的新型隱私保護(hù)學(xué)習(xí)范式。隨著相關(guān)研究工作的不斷深入,F(xiàn)L的單點(diǎn)故障及可信性缺乏等不足之處逐漸受到重視。近年來,起源于比特幣的區(qū)塊鏈技術(shù)取得迅速發(fā)展,它開創(chuàng)性地構(gòu)建了去中心化的信任,為FL的發(fā)展提供了一種新的可能。對(duì)現(xiàn)有基于區(qū)塊鏈的FL框架進(jìn)行對(duì)比分析,深入討論區(qū)塊鏈與FL相結(jié)合所解決的FL重要問題,并闡述了基于區(qū)塊鏈的FL技術(shù)在物聯(lián)網(wǎng)(IoT)、工業(yè)物聯(lián)網(wǎng)(IIoT)、車聯(lián)網(wǎng)(IoV)、醫(yī)療服務(wù)等多個(gè)領(lǐng)域的應(yīng)用前景。
聯(lián)邦學(xué)習(xí);區(qū)塊鏈;結(jié)構(gòu)框架;融合應(yīng)用;隱私保護(hù)
隨著GDPR(General Data Protection Regulation)等隱私保護(hù)法案的出現(xiàn),用戶私人數(shù)據(jù)在中央服務(wù)器的直接使用受到了極大限制[1],能夠保障用戶隱私的機(jī)器學(xué)習(xí)方法開始獲得工業(yè)界與學(xué)術(shù)界的廣泛重視。2016年,谷歌提出了聯(lián)邦學(xué)習(xí)(Federated Learning, FL)這一新范式[2],能夠?qū)崿F(xiàn)用戶數(shù)據(jù)不出設(shè)備本地的模型訓(xùn)練。聯(lián)邦學(xué)習(xí)的主要思想是使大量存儲(chǔ)本地?cái)?shù)據(jù)的用戶設(shè)備(稱為客戶端)能夠在本地協(xié)作地訓(xùn)練單個(gè)機(jī)器學(xué)習(xí)模型,而無需共享其原始數(shù)據(jù)。在聯(lián)邦學(xué)習(xí)中,中央服務(wù)器負(fù)責(zé)聚合所有客戶端提交的參數(shù),對(duì)全局模型進(jìn)行更新,并將更新后的模型反饋給客戶端,使客戶端能夠在未來的迭代中繼續(xù)進(jìn)行本地訓(xùn)練,以不斷從客戶端的本地?cái)?shù)據(jù)中獲益[3]。由于其“數(shù)據(jù)不動(dòng)模型動(dòng),數(shù)據(jù)可用不可見”的隱私特性,近年來,聯(lián)邦學(xué)習(xí)受到研究者的高度關(guān)注。
然而,聯(lián)邦學(xué)習(xí)也存在很多獨(dú)特的挑戰(zhàn)。首先,聯(lián)邦學(xué)習(xí)通常需要大量用戶的參與,這些用戶身份背景各異,行為方式復(fù)雜,難以相互信任,且增加了誠(chéng)實(shí)用戶隱私泄露的風(fēng)險(xiǎn)。其次,在聯(lián)邦學(xué)習(xí)過程中,全局模型的獲得需要通過用戶的多輪迭代進(jìn)行模型更新,這產(chǎn)生了大量的通信成本,以及在網(wǎng)絡(luò)傳輸過程中額外的存儲(chǔ)開銷。此外,不誠(chéng)實(shí)的參與者和易受攻擊的中央服務(wù)器可能會(huì)影響全局模型的安全性[4]。最后,本地設(shè)備可能是惡意的或易受攻擊的,這可能導(dǎo)致傳輸?shù)男畔⒈恍孤痘虼鄹模?]。
近年來,起源于比特幣的區(qū)塊鏈技術(shù)取得迅速發(fā)展[6]。區(qū)塊鏈建立在去中心化的對(duì)等網(wǎng)絡(luò)之上,交易以數(shù)據(jù)形式由全網(wǎng)節(jié)點(diǎn)備份,交易順序和內(nèi)容的一致性和不可篡改性由共識(shí)機(jī)制保障。區(qū)塊鏈開創(chuàng)性地構(gòu)建了去中心化的信任,使人們可以選擇信任區(qū)塊鏈底層密碼學(xué)技術(shù)的可靠性及對(duì)等網(wǎng)絡(luò)中大部分節(jié)點(diǎn)的誠(chéng)實(shí)性,而無需被迫信任單一實(shí)體[7]。區(qū)塊鏈構(gòu)建的去中心化信任實(shí)現(xiàn)方式為聯(lián)邦學(xué)習(xí)的發(fā)展提供了一種新的可能。例如,聯(lián)邦學(xué)習(xí)不僅可以利用區(qū)塊鏈共識(shí)機(jī)制提供的一致性在不可信環(huán)境中建立可信交互,還可以利用區(qū)塊鏈激勵(lì)機(jī)制提供的經(jīng)濟(jì)屬性有效促進(jìn)聯(lián)邦學(xué)習(xí)中信息的共享。
本文調(diào)查研究的對(duì)象包括從2019年至2021年在期刊、會(huì)議以及預(yù)印本上發(fā)表的論文。本文所收集的文獻(xiàn)涵蓋了區(qū)塊鏈技術(shù)與聯(lián)邦學(xué)習(xí)技術(shù)相互融合的近期研究工作。本研究主要遵循以下原則收集這些論文:1)在現(xiàn)有的搜索引擎中搜索關(guān)鍵詞,找到相關(guān)文獻(xiàn);2)根據(jù)所選論文中的參考文獻(xiàn),再找到本研究所需要的論文。
在統(tǒng)計(jì)過程中可以發(fā)現(xiàn),雖然目前基于區(qū)塊鏈的聯(lián)邦學(xué)習(xí)(Blockchain?based Federated Learning, BFL)技術(shù)還處于早期發(fā)展階段,相關(guān)的文獻(xiàn)研究較少,但是BFL架構(gòu)正受到越來越多人的關(guān)注,處于持續(xù)發(fā)展的狀態(tài)。這些BFL研究工作通常采用不同BFL框架,面向不同聯(lián)邦學(xué)習(xí)中存在的重要問題(如:?jiǎn)吸c(diǎn)故障、缺乏激勵(lì)機(jī)制、投毒攻擊),且面向不同應(yīng)用領(lǐng)域(如:物聯(lián)網(wǎng)(Internet of Things, IoT)、工業(yè)物聯(lián)網(wǎng)(Industrial Internet of Things, IIoT)、車聯(lián)網(wǎng)(Internet of Vehicles,IoV)、醫(yī)療服務(wù)領(lǐng)域)。
目前,已有少數(shù)幾篇文獻(xiàn)討論了區(qū)塊鏈與聯(lián)邦學(xué)習(xí)的結(jié)合。文獻(xiàn)[8]介紹了部分現(xiàn)有BFL研究工作所使用的區(qū)塊鏈種類和平臺(tái),以及BFL框架的對(duì)比;文獻(xiàn)[9]對(duì)部分現(xiàn)有BFL框架、BFL基礎(chǔ)設(shè)施以及BFL應(yīng)用進(jìn)行了對(duì)比總結(jié);文獻(xiàn)[10]進(jìn)行了面向聯(lián)邦學(xué)習(xí)的調(diào)查研究工作,其中所涉及的聯(lián)邦學(xué)習(xí)架構(gòu)、通信效率、獎(jiǎng)勵(lì)機(jī)制、隱私保護(hù)、安全聚合方案等方面的對(duì)比也包含了一些BFL架構(gòu);文獻(xiàn)[11]對(duì)BFL進(jìn)行了綜述,介紹了聯(lián)邦學(xué)習(xí)的不足,并從架構(gòu)特點(diǎn)、資源分配等方面對(duì)現(xiàn)有聯(lián)邦學(xué)習(xí)進(jìn)行研究,最后總結(jié)了基于區(qū)塊鏈的聯(lián)邦學(xué)習(xí)架構(gòu)在人工智能領(lǐng)域的未來發(fā)展;類似地,文獻(xiàn)[12]也論述了現(xiàn)有聯(lián)邦學(xué)習(xí)機(jī)制存在的問題和不足,并說明了將區(qū)塊鏈技術(shù)與聯(lián)邦學(xué)習(xí)結(jié)合之后對(duì)進(jìn)一步完善聯(lián)邦學(xué)習(xí)模型的展望??梢钥吹?,這些綜述工作主要集中于BFL框架及其在人工智能領(lǐng)域的應(yīng)用前景,缺乏對(duì)BFL面向的重要問題的深入分析和BFL在更廣泛場(chǎng)景應(yīng)用前景的展開討論。因此,本文從BFL框架出發(fā),深入討論區(qū)塊鏈與聯(lián)邦學(xué)習(xí)相結(jié)合所解決的聯(lián)邦學(xué)習(xí)重要問題,進(jìn)而闡述BFL在物聯(lián)網(wǎng)、工業(yè)物聯(lián)網(wǎng)、車聯(lián)網(wǎng)、醫(yī)療服務(wù)等多個(gè)領(lǐng)域的應(yīng)用前景,對(duì)現(xiàn)有BFL研究工作在基礎(chǔ)架構(gòu)、核心技術(shù)、應(yīng)用前景三個(gè)層面進(jìn)行了全面且完整的分析和對(duì)比工作,總結(jié)出區(qū)塊鏈與聯(lián)邦學(xué)習(xí)相結(jié)合的創(chuàng)新與應(yīng)用方向。
本章對(duì)本文收集的文獻(xiàn)中提出的BFL框架進(jìn)行總結(jié)與對(duì)比,針對(duì)其不同的設(shè)計(jì)思路進(jìn)行分析。圖1展示了本文總結(jié)的BFL框架分類示意圖。
圖1 BFL框架分類
首先,傳統(tǒng)聯(lián)邦學(xué)習(xí)框架通常由一個(gè)中央服務(wù)器(server)和多個(gè)用戶(或設(shè)備、客戶端)組成。早期的典型BFL框架普遍利用去中心化的區(qū)塊鏈取代傳統(tǒng)聯(lián)邦學(xué)習(xí)框架中的中央服務(wù)器(server),其主要目的是解決中央服務(wù)器造成的單點(diǎn)信任及故障等問題[13-16]。該類框架的范例如圖2所示,用戶將本地模型提交給維護(hù)區(qū)塊鏈的礦工(miner),礦工執(zhí)行交叉驗(yàn)證、模型聚合等步驟,并基于共識(shí)機(jī)制生成一致的全局模型,隨后利用區(qū)塊存儲(chǔ)和傳播該全局模型,使用戶能夠從區(qū)塊中將一致的全局模型下載到本地,進(jìn)行下一輪訓(xùn)練。除了利用區(qū)塊鏈取代中央服務(wù)器,這一類典型框架還通常具備兩個(gè)特性。在模型聚合前,通過引入交叉驗(yàn)證等機(jī)制,能夠保證參與全局模型更新的本地模型符合全局模型更新的方向,防止惡意用戶利用惡意模型破壞全局模型的安全性。此外,通過引入獎(jiǎng)勵(lì)機(jī)制,能夠激勵(lì)用戶貢獻(xiàn)優(yōu)質(zhì)數(shù)據(jù)并積極參與訓(xùn)練,有效緩解聯(lián)邦學(xué)習(xí)中的公平性問題,防止貢獻(xiàn)不同的用戶獲得相似獎(jiǎng)勵(lì),導(dǎo)致用戶消極怠工。
在這一類典型框架的基礎(chǔ)上,一些BFL框架在共識(shí)機(jī)制、獎(jiǎng)勵(lì)機(jī)制等方面進(jìn)一步創(chuàng)新。文獻(xiàn)[1]中提出的BFLC(Blockchain?based Federated Learning framework with Committee consensus)框架,沒有采用常見的工作量證明(Proof of Work, PoW)共識(shí)機(jī)制,而是提出了委員會(huì)共識(shí)機(jī)制(Committee Consensus Mechanism, CCM)。這一機(jī)制的特色是利用由部分誠(chéng)實(shí)節(jié)點(diǎn)組成的委員會(huì)執(zhí)行模型局部梯度驗(yàn)證和區(qū)塊生成等步驟。由于只有部分節(jié)點(diǎn)參與本地模型驗(yàn)證及全局模型更新,聯(lián)邦學(xué)習(xí)的整體效率獲得了顯著提升。該機(jī)制要求委員會(huì)以外的節(jié)點(diǎn)將本地模型發(fā)送給委員會(huì)節(jié)點(diǎn)進(jìn)行驗(yàn)證打分,只允許合格的模型參與全局模型更新。在該機(jī)制中,為提升安全性,基于節(jié)點(diǎn)歷史表現(xiàn)分?jǐn)?shù)及智能合約,周期性更替委員會(huì)成員。文獻(xiàn)[17]中引入深度強(qiáng)化學(xué)習(xí)(Deep Reinforcement Learning),尋求能夠最小化系統(tǒng)時(shí)延、能耗及獎(jiǎng)勵(lì)總額的最優(yōu)系統(tǒng)參數(shù),包括用戶訓(xùn)練本地模型時(shí)的建議數(shù)據(jù)量和能耗,以及區(qū)塊生成速率。文獻(xiàn)[18]中提出了FLChain(Federated Learning via mec?enabled blockChain network)框架,該框架同時(shí)包含移動(dòng)設(shè)備和邊緣設(shè)備,其中移動(dòng)設(shè)備主要負(fù)責(zé)使用設(shè)備上的數(shù)據(jù)樣本進(jìn)行本地模型更新,邊緣設(shè)備一方面為資源受限的移動(dòng)設(shè)備提供較充足的網(wǎng)絡(luò)資源,另一方面充當(dāng)FLChain區(qū)塊鏈網(wǎng)絡(luò)中的節(jié)點(diǎn),對(duì)區(qū)塊鏈進(jìn)行維護(hù)。FLChain使用了聯(lián)盟區(qū)塊鏈超級(jí)賬本fabric中的通道技術(shù),利用通道的隔離特性,增強(qiáng)全局模型訓(xùn)練的安全性,并提供一定程度的數(shù)據(jù)隱私保護(hù)。文獻(xiàn)[19]中提出了一種名為CrowdSFL(Crowd computing Secure framework based on blockchain and Federated Learning)的眾包BFL框架,其主要目的是降低眾包過程中用戶開銷并保障眾包安全性。在CrowdSFL中,整個(gè)眾包系統(tǒng)基于區(qū)塊鏈構(gòu)建,每一個(gè)參與者都擁有獨(dú)立的區(qū)塊鏈賬戶。CrowdSFL提出了由智能合約控制的數(shù)據(jù)交互模式,能夠保證數(shù)據(jù)以正確的格式上傳并保存到區(qū)塊中。
圖2 典型BFL框架
上述BFL框架均采用單一類型的區(qū)塊鏈取代傳統(tǒng)聯(lián)邦學(xué)習(xí)中的中央服務(wù)器,近年來,少數(shù)工作提出了由更復(fù)雜的多級(jí)區(qū)塊鏈取代中央服務(wù)器的BFL框架。文獻(xiàn)[20]中提出了一種基于混合區(qū)塊鏈的BFL框架PermiDAG(Permissioned blockchain and the local Directed Acyclic Graph),該框架中的混合區(qū)塊鏈以運(yùn)行在路邊單元(Road Side Unit, RSU)的許可區(qū)塊鏈作為主鏈,同時(shí)允許車輛節(jié)點(diǎn)組成多個(gè)本地有向無環(huán)圖(Directed Acyclic Graph, DAG)。作為主鏈的許可區(qū)塊鏈負(fù)責(zé)記錄數(shù)據(jù)共享的相關(guān)信息以及全局模型聚合的相關(guān)參數(shù)。車輛節(jié)點(diǎn)組成的多個(gè)本地DAG則用來提升數(shù)據(jù)共享的效率,并將數(shù)據(jù)共享事件以及訓(xùn)練過的模型參數(shù)作為交易存儲(chǔ)在塊中。同時(shí),基于本地DAG,鄰近的車輛節(jié)點(diǎn)相互通信,獲得附近車輛的本地模型,并利用這些模型提升自己的本地模型,實(shí)現(xiàn)異步學(xué)習(xí)的過程。此外,文獻(xiàn)[21]中提出的BFEL(Blockchain?empowered Federated Edge Learning)框架也采用了多級(jí)區(qū)塊鏈的結(jié)構(gòu)。該框架包含應(yīng)用層和區(qū)塊鏈層兩部分,其中應(yīng)用層主要負(fù)責(zé)執(zhí)行聯(lián)邦學(xué)習(xí)過程。該框架中的區(qū)塊鏈層同時(shí)包含一條基于公有區(qū)塊鏈的主鏈,和多條基于聯(lián)盟區(qū)塊鏈的子鏈。通過利用多個(gè)子鏈設(shè)置訪問權(quán)限,該框架能夠提升數(shù)據(jù)隱私保障能力,實(shí)現(xiàn)性能隔離。
上述BFL框架均采用單一或多級(jí)區(qū)塊鏈取代傳統(tǒng)聯(lián)邦學(xué)習(xí)中的中央服務(wù)器,然而,在一些BFL框架中,區(qū)塊鏈既沒有直接取代中央服務(wù)器,也沒有直接參與到傳統(tǒng)聯(lián)邦學(xué)習(xí)過程中。例如,在文獻(xiàn)[22]中提出的BFL框架中,區(qū)塊鏈僅用于實(shí)現(xiàn)數(shù)據(jù)共享的功能。該框架中的區(qū)塊鏈內(nèi)存在三種不同類型的交易:1)檢索交易,允許節(jié)點(diǎn)將請(qǐng)求的模型信息通知其他節(jié)點(diǎn);2)模型交易,允許節(jié)點(diǎn)將模型訓(xùn)練的數(shù)據(jù)傳給其他節(jié)點(diǎn);3)數(shù)據(jù)共享交易,允許節(jié)點(diǎn)將共享的數(shù)據(jù)返回給請(qǐng)求者。具體來說,數(shù)據(jù)請(qǐng)求者(requester)將數(shù)據(jù)共享請(qǐng)求發(fā)送給區(qū)塊鏈,區(qū)塊鏈進(jìn)行檢索交易,查看緩存中是否已包含相應(yīng)數(shù)據(jù):若存在,區(qū)塊鏈將查詢結(jié)果以及所請(qǐng)求的數(shù)據(jù)模型直接返回給請(qǐng)求者,并生成數(shù)據(jù)共享交易;若不存在,區(qū)塊鏈將進(jìn)行多方信息檢索,組建模型訓(xùn)練委員會(huì),利用模型交易進(jìn)行模型訓(xùn)練,生成請(qǐng)求者所需要的模型,在將模型返回給請(qǐng)求者的同時(shí)進(jìn)行緩存,以備未來之需。在文獻(xiàn)[23]中提出的fine?grained FL框架中,聯(lián)邦學(xué)習(xí)的執(zhí)行主要發(fā)生在云節(jié)點(diǎn)和霧節(jié)點(diǎn),該框架中的區(qū)塊鏈不直接參與聯(lián)邦學(xué)習(xí),主要負(fù)責(zé)計(jì)算和存儲(chǔ)參與聯(lián)邦學(xué)習(xí)的各節(jié)點(diǎn)聲譽(yù)。此外,在文獻(xiàn)[24]中提出的用于工業(yè)物聯(lián)網(wǎng)內(nèi)設(shè)備故障檢測(cè)的BFL框架中,區(qū)塊鏈主要用于對(duì)客戶端數(shù)據(jù)進(jìn)行可信存儲(chǔ)和驗(yàn)證。在該框架中,客戶端定期創(chuàng)建Merkle樹組織傳感器收集的數(shù)據(jù),并將Merkle root存儲(chǔ)在區(qū)塊鏈中。在未來發(fā)生爭(zhēng)議時(shí),存儲(chǔ)在區(qū)塊鏈中的Merkle root可被用作證據(jù)幫助解決爭(zhēng)議。文獻(xiàn)[25]中提出的一種基于聯(lián)盟區(qū)塊鏈的BFL框架,目的是在數(shù)字孿生無線網(wǎng)絡(luò)模型中提升邊緣計(jì)算能力。該框架由多類終端用戶組成,如:物聯(lián)網(wǎng)設(shè)備、移動(dòng)設(shè)備、基站以及宏基站。其中,基站負(fù)責(zé)執(zhí)行聯(lián)邦學(xué)習(xí)的本地訓(xùn)練,宏基站則充當(dāng)聯(lián)邦學(xué)習(xí)的中央服務(wù)器。由于聯(lián)邦學(xué)習(xí)無法解決孿生終端用戶之間缺乏信任的問題,該框架引入聯(lián)盟區(qū)塊鏈增強(qiáng)系統(tǒng)安全性,利用區(qū)塊鏈記錄數(shù)字孿生過程中的數(shù)據(jù),并通過控制訪問權(quán)限來管理用戶。
表1對(duì)不同BFL框架進(jìn)行總結(jié)對(duì)比。
表1 不同BFL框架對(duì)比
本章總結(jié)了BFL面向的聯(lián)邦學(xué)習(xí)中的重要問題,以及相應(yīng)的解決辦法或是對(duì)聯(lián)邦學(xué)習(xí)相應(yīng)不足之處的改善方法。
聯(lián)邦學(xué)習(xí)主要存在以下五類重要問題:
1)單點(diǎn)故障:聯(lián)邦學(xué)習(xí)的中央服務(wù)器容易受到惡意更新的影響,致使全局模型更新產(chǎn)生缺陷,從而影響所有本地模型更新,降低局部模型更新的準(zhǔn)確性。另外,聯(lián)邦學(xué)習(xí)需要本地設(shè)備上傳本地模型更新到中央服務(wù)器,當(dāng)同時(shí)傳輸?shù)脑O(shè)備模型過多時(shí),會(huì)導(dǎo)致網(wǎng)絡(luò)過載。
2)缺乏激勵(lì)機(jī)制:聯(lián)邦學(xué)習(xí)通常假定每個(gè)本地設(shè)備都自愿將數(shù)據(jù)資源貢獻(xiàn)給全局模型,但是這并不符合實(shí)際。參與者缺乏激勵(lì)機(jī)制,就會(huì)影響參與者的動(dòng)力,甚至一些參與者不貢獻(xiàn)數(shù)據(jù)也獲得相應(yīng)獎(jiǎng)勵(lì),導(dǎo)致了不公平的經(jīng)濟(jì)補(bǔ)償。
3)投毒攻擊:惡意用戶可能通過故意上傳精心計(jì)算的惡意本地訓(xùn)練模型以影響全局模型訓(xùn)練,有目的性地破壞機(jī)器學(xué)習(xí)的預(yù)測(cè)結(jié)果。這主要是因?yàn)槁?lián)邦學(xué)習(xí)缺乏審計(jì)惡意用戶或是惡意模型更新的能力。
4)缺少隱私政策:盡管訓(xùn)練數(shù)據(jù)資源存儲(chǔ)在本地設(shè)備中,聯(lián)邦學(xué)習(xí)框架也可能會(huì)導(dǎo)致訓(xùn)練數(shù)據(jù)的隱私泄露。
5)效率低下:由于聯(lián)邦學(xué)習(xí)需要客戶端與服務(wù)器進(jìn)行通信,傳輸本地學(xué)習(xí)模型,進(jìn)行多輪模型訓(xùn)練迭代后進(jìn)行局部或全局模型更新等,客戶端與服務(wù)器的通信效率以及模型訓(xùn)練的效率也會(huì)影響聯(lián)邦學(xué)習(xí)的性能。
為了解決單點(diǎn)故障問題,BFL通常采用區(qū)塊鏈分布式節(jié)點(diǎn)代替聯(lián)邦學(xué)習(xí)中的中央服務(wù)器。很多研究中設(shè)計(jì)的結(jié)構(gòu)框架都提到解決單點(diǎn)故障的問題[13,26-28]。例如,文獻(xiàn)[14]通過將區(qū)塊鏈與聯(lián)邦學(xué)習(xí)結(jié)合,實(shí)現(xiàn)了去中心化隱私保護(hù),從而防止邊緣計(jì)算場(chǎng)景中的單點(diǎn)故障問題。在文獻(xiàn)[29]提出的方案中,區(qū)塊鏈可以選擇特定的工業(yè)4.0設(shè)備來領(lǐng)導(dǎo)一輪學(xué)習(xí),從而代替原本的中央服務(wù)器,以有效防止單點(diǎn)故障。該方案在原本的聯(lián)邦學(xué)習(xí)架構(gòu)中,引入礦工節(jié)點(diǎn),由礦工節(jié)點(diǎn)進(jìn)行本地設(shè)備的模型更新。每個(gè)本地設(shè)備計(jì)算并將本地模型更新上傳到相關(guān)礦工節(jié)點(diǎn)上,但并不把原始數(shù)據(jù)上傳給礦工節(jié)點(diǎn)。接著,通過共識(shí)機(jī)制記錄并驗(yàn)證本地模型更新,聚合本地設(shè)備上傳的模型更新,并將更新區(qū)塊附加到區(qū)塊鏈,本地設(shè)備可以從區(qū)塊鏈中的區(qū)塊下載模型更新。此外,現(xiàn)有的BFL工作采用了多種不同類型的區(qū)塊鏈共識(shí)機(jī)制保障一致性,包括:工作證明(PoW),拜占庭容錯(cuò)(Byzantine Fault Tolerance, BFT)[18],權(quán)益證明(Proof of Stake, PoS),代理權(quán)益證明(Delegated Proof of Stake, DPoS)[20],驗(yàn)證證明(Proof of Verifying, PoV)[21],訓(xùn)練質(zhì)量證明(Proof of Training Quality, PoQ)[22],權(quán)利證明(Proof of Authority, PoA)[26],聯(lián)邦證明(Proof of Federation, PoF)[30]以及委員會(huì)共識(shí)(CCM)[1]。為了解決缺乏激勵(lì)機(jī)制問題,BFL通常利用區(qū)塊鏈技術(shù)構(gòu)建面向期望行為的激勵(lì)機(jī)制,或面向異常行為的懲罰機(jī)制,從而激發(fā)本地用戶產(chǎn)生對(duì)全局模型更新作出貢獻(xiàn)的積極性。例如,文獻(xiàn)[13-15]中所提出的激勵(lì)機(jī)制包括數(shù)據(jù)獎(jiǎng)勵(lì)和挖礦獎(jiǎng)勵(lì)兩個(gè)方面,終端設(shè)備的數(shù)據(jù)獎(jiǎng)勵(lì)從其相應(yīng)的礦工那里接收,獎(jiǎng)勵(lì)的數(shù)量與其數(shù)據(jù)樣本的大小成線性正比。當(dāng)?shù)V工完成模型聚合并生成區(qū)塊后,能夠從區(qū)塊鏈網(wǎng)絡(luò)中獲得挖礦獎(jiǎng)勵(lì),挖礦獎(jiǎng)勵(lì)的數(shù)量和其所綁定的終端設(shè)備的聚合數(shù)據(jù)樣本數(shù)量成線性正比。文獻(xiàn)[1]提出了一種貢獻(xiàn)利益共享的激勵(lì)方式,在每一輪模型更新聚合后,管理者們會(huì)根據(jù)提交的模型更新的分?jǐn)?shù)向相應(yīng)的節(jié)點(diǎn)分配獎(jiǎng)勵(lì)。文獻(xiàn)[26]中提出了基于聲譽(yù)的激勵(lì)機(jī)制,在上傳本地模型后,驗(yàn)證者使用預(yù)先約定的方法計(jì)算聲譽(yù),并消除不滿意的更新:如果提交的更新通過了驗(yàn)證,該提交者的聲譽(yù)就會(huì)增加;反之聲譽(yù)會(huì)減小,最后根據(jù)提交者的聲譽(yù),進(jìn)行獎(jiǎng)勵(lì)。文獻(xiàn)[24]根據(jù)在本地模型訓(xùn)練中使用的客戶數(shù)據(jù)的大小和質(zhì)心距離,設(shè)計(jì)了一種基于智能合約的激勵(lì)機(jī)制。在文獻(xiàn)[31]提出的方案中,誠(chéng)實(shí)的訓(xùn)練者可以根據(jù)訓(xùn)練好的模型的貢獻(xiàn)獲得可觀的分區(qū)利潤(rùn),而惡意模型會(huì)被及時(shí)發(fā)現(xiàn)并受到嚴(yán)厲的懲罰,并通過評(píng)估訓(xùn)練者的可靠性和貢獻(xiàn)進(jìn)行獎(jiǎng)勵(lì)。文獻(xiàn)[8]引入一種具有競(jìng)爭(zhēng)力的模型更新方法,從而使worker的利潤(rùn)最大化,實(shí)現(xiàn)激勵(lì)的目的。該方法也要求在某一輪更新中,所選擇的每個(gè)worker選擇前一輪worker提交的最優(yōu)模型更新,并用它們更新自己的模型,每一個(gè)worker的獎(jiǎng)勵(lì)由下一輪的worker投票結(jié)果決定。
為了解決投毒攻擊問題,BFL通常利用部署在區(qū)塊鏈中的共識(shí)機(jī)制,進(jìn)行模型更新驗(yàn)證,從而有效防止投毒攻擊。文獻(xiàn)[14]中提出用區(qū)塊鏈系統(tǒng)取代中央服務(wù)器,以利用區(qū)塊鏈不可篡改的特性消除投毒攻擊。文獻(xiàn)[21]中提出了驗(yàn)證證明(PoV)共識(shí)機(jī)制,用來協(xié)作驗(yàn)證預(yù)定義礦工之間的本地模型的更新質(zhì)量。在該方案中,只有經(jīng)過驗(yàn)證的模型更新,才可以存儲(chǔ)在塊中,從而防止投毒攻擊。為了減少惡意的投毒模型更新,文獻(xiàn)[26]中提出了一種基于聲譽(yù)的眾包激勵(lì)機(jī)制。在這種機(jī)制下,如果用戶被檢測(cè)到是惡意更新,其更新模型會(huì)被拒絕,不僅在本輪更新中不能收獲獎(jiǎng)勵(lì),還會(huì)降低其聲譽(yù),從而影響未來收益,得到懲罰。文獻(xiàn)[32]中提出了一種計(jì)分機(jī)制來判斷設(shè)備是否為會(huì)進(jìn)行投毒攻擊的惡意設(shè)備,從而選擇參與模型更新的訓(xùn)練者,以抵御投毒攻擊。文獻(xiàn)[30]中提出了一種multi?Krum(multiple?Krum)的共識(shí)機(jī)制,會(huì)拒絕與大多數(shù)模型更新方向相反的模型更新。在每一輪更新中,由多數(shù)投票選出驗(yàn)證同行委員會(huì),委員會(huì)使用multi?Krum拒絕惡意的模型更新,從而防止投毒攻擊。文獻(xiàn)[33]中提出了一種分散驗(yàn)證機(jī)制來驗(yàn)證局部模型更新,該機(jī)制對(duì)每個(gè)模型的有效性進(jìn)行投票,通過投票結(jié)果來排除潛在的惡意設(shè)備。
為了防止隱私泄露,一些BFL方案會(huì)設(shè)計(jì)額外的隱私政策。例如,文獻(xiàn)[34]中通過使用同態(tài)加密方法來保護(hù)訓(xùn)練模型的隱私。文獻(xiàn)[22]將差分隱私集成到聯(lián)邦學(xué)習(xí)中來保護(hù)數(shù)據(jù)隱私。同樣,在文獻(xiàn)[30]中也使用了差分隱私來保護(hù)數(shù)據(jù)隱私安全,該文獻(xiàn)提出的系統(tǒng)還進(jìn)一步使用了可驗(yàn)證的秘密共享方案來進(jìn)行模型安全聚合,從而保護(hù)個(gè)人隱私安全。文獻(xiàn)[35]通過結(jié)合區(qū)塊鏈和聯(lián)邦學(xué)習(xí)技術(shù),設(shè)計(jì)面向輕量級(jí)網(wǎng)絡(luò)設(shè)備的入侵檢測(cè)算法,從而在共享數(shù)據(jù)的同時(shí)保護(hù)網(wǎng)絡(luò)用戶的數(shù)據(jù)隱私。文獻(xiàn)[36]利用區(qū)塊鏈去中心化、防篡改等特點(diǎn),將數(shù)據(jù)記錄及其他重要信息存儲(chǔ)在區(qū)塊鏈上,而完整數(shù)據(jù)則加密存儲(chǔ)在分布式數(shù)據(jù)庫(kù),從而實(shí)現(xiàn)用戶數(shù)據(jù)的安全存儲(chǔ),防止用戶隱私數(shù)據(jù)泄露。
最后,為了解決效率低下問題,BFL方案通常采用各類方法降低需要傳輸?shù)臄?shù)據(jù)量。文獻(xiàn)[14]中提出的方案將具體的相關(guān)數(shù)據(jù)保存在鏈外的分布式哈希表中,僅在區(qū)塊鏈上存儲(chǔ)指針,從而降低傳輸數(shù)據(jù)量。文獻(xiàn)[20]中提出了邊緣數(shù)據(jù)學(xué)習(xí)模型的異步聯(lián)邦學(xué)習(xí)方案,通過選擇參與節(jié)點(diǎn),進(jìn)一步提高聯(lián)邦學(xué)習(xí)的學(xué)效率。文獻(xiàn)[1]中提出了委員會(huì)共識(shí)機(jī)制(CCM),在將局部梯度附加到鏈上之前驗(yàn)證局部梯度。在這種機(jī)制下,只有幾個(gè)節(jié)點(diǎn)來驗(yàn)證模型更新,而無需向每個(gè)節(jié)點(diǎn)廣播并達(dá)成協(xié)議,從而提高模型驗(yàn)證的效率。文獻(xiàn)[21]中提出了一種梯度壓縮方案,該方案能夠在不影響學(xué)習(xí)精度的情況下提高由區(qū)塊鏈?zhǔn)跈?quán)的聯(lián)邦邊緣學(xué)習(xí)的通信效率。另外,文獻(xiàn)[37]中提出了一種在聯(lián)邦學(xué)習(xí)中添加超參數(shù)優(yōu)化和彈性權(quán)重合并的方法,從而提高模型訓(xùn)練的精度和效率。
表2對(duì)BFL解決的重要問題進(jìn)行了總結(jié)。
表2 部分BFL解決的問題
目前,基于區(qū)塊鏈的聯(lián)邦學(xué)習(xí)(BFL)技術(shù)已經(jīng)被應(yīng)用到許多行業(yè)領(lǐng)域,本文對(duì)當(dāng)前BFL技術(shù)在物聯(lián)網(wǎng)、工業(yè)物聯(lián)網(wǎng)、車聯(lián)網(wǎng)、醫(yī)療服務(wù)等多個(gè)領(lǐng)域的應(yīng)用前景進(jìn)行了總結(jié)。
在物聯(lián)網(wǎng)領(lǐng)域,很多敏感信息會(huì)存儲(chǔ)在物聯(lián)網(wǎng)設(shè)備當(dāng)中。文獻(xiàn)[22]構(gòu)建了一個(gè)分布式多方數(shù)據(jù)共享的模型,并通過差分隱私進(jìn)一步保證數(shù)據(jù)的真實(shí)性,使得設(shè)備可以安全準(zhǔn)確地檢索數(shù)據(jù)。不同于常見的PoW共識(shí)算法,文獻(xiàn)[22]中使用了PoQ共識(shí)算法用于驗(yàn)證訓(xùn)練模型,以提升計(jì)算資源的利用效率。面向工業(yè)物聯(lián)網(wǎng)(IIoT)的故障檢測(cè)場(chǎng)景,文獻(xiàn)[24,38]中提出了一種名為質(zhì)心距離加權(quán)聯(lián)邦平均的聯(lián)邦平均算法。此算法考慮到每個(gè)客戶端數(shù)據(jù)集的正類和負(fù)類之間的距離,能夠減少IIoT設(shè)備故障檢測(cè)中數(shù)據(jù)異構(gòu)問題的影響。為了幫助家電制造商提高服務(wù)質(zhì)量并優(yōu)化家電功能,文獻(xiàn)[26]中提出了分層眾包的聯(lián)邦學(xué)習(xí)系統(tǒng),利用區(qū)塊鏈技術(shù)防止惡意模型更新。為了使6G網(wǎng)絡(luò)更加安全高效地應(yīng)用到物聯(lián)網(wǎng)中,文獻(xiàn)[39]中提出了區(qū)塊鏈和聯(lián)邦學(xué)習(xí)相結(jié)合的架構(gòu),結(jié)合移動(dòng)邊緣計(jì)算和設(shè)備到設(shè)備(Device to Device, D2D)通信,應(yīng)對(duì)6G網(wǎng)絡(luò)面臨的挑戰(zhàn)。
BFL也能夠給醫(yī)療服務(wù)帶來巨大進(jìn)步。通常來說,對(duì)于患者的遠(yuǎn)程檢測(cè)或是某些人工智能輔助診斷都需要很多患者的疾病信息。然而,很多醫(yī)療信息中包含著患者的敏感信息,這些數(shù)據(jù)對(duì)某些攻擊者具有很高的內(nèi)在價(jià)值。因此,BFL正被逐步應(yīng)用到醫(yī)學(xué)領(lǐng)域。文獻(xiàn)[40]中為醫(yī)療保健聯(lián)盟提出了一種BFL方案,該方案建立了一套兼容以太坊生態(tài)系統(tǒng)的企業(yè)級(jí)區(qū)塊鏈組件,且集成了一系列隱私保護(hù)技術(shù)。文獻(xiàn)[40]中還提出了一種新的安全聚合協(xié)議,將其作為運(yùn)行在AMD公司的可信硬件環(huán)境SEV(Secure Encrypted Virtualization)中,以保證隱私數(shù)據(jù)的安全。文獻(xiàn)[41]在醫(yī)療領(lǐng)域提出了基于區(qū)塊鏈的聯(lián)邦學(xué)習(xí)框架,將智能合約應(yīng)用于聯(lián)邦學(xué)習(xí)算法的數(shù)據(jù)聚合過程中,以確保數(shù)據(jù)共享時(shí)的透明度和使用許可,并通過基于大量患者信息的訓(xùn)練來預(yù)測(cè)糖尿病的風(fēng)險(xiǎn)。此外,文獻(xiàn)[42]中開發(fā)了基于BFL的面向醫(yī)療物聯(lián)網(wǎng)(Internet of Medical Things,IoMT)設(shè)備的輕量級(jí)安全和隱私算法。文獻(xiàn)[43]中不僅提出了可以應(yīng)用于醫(yī)療物聯(lián)網(wǎng)的可信任的BFL框架,還設(shè)計(jì)了面向數(shù)據(jù)分類的新冠病毒應(yīng)用程序,可以學(xué)習(xí)全球的新冠病毒診斷相關(guān)模型。該方案不僅包含可信的、防篡改的梯度挖掘方法和基于去中心化共識(shí)的聚合器,還為負(fù)責(zé)聚合的區(qū)塊鏈節(jié)點(diǎn)增加額外的安全性。文獻(xiàn)[44]中也提出了應(yīng)用于醫(yī)療保健的BFL方案,其目標(biāo)是實(shí)現(xiàn)患者醫(yī)療信息的保護(hù)和共享,并構(gòu)建一個(gè)全球?qū)崟r(shí)應(yīng)用模型。另外,文獻(xiàn)[45]中提出了一個(gè)BFL框架,該框架可以使用最新數(shù)據(jù),通過基于膠囊網(wǎng)絡(luò)的分割和分類掃描肺部CT圖像,在醫(yī)院之間共享數(shù)據(jù)來提高新冠病毒的識(shí)別率,同時(shí)實(shí)現(xiàn)患者的隱私保護(hù)。為了實(shí)現(xiàn)醫(yī)療健康數(shù)據(jù)的安全可靠共享和智能處理,文獻(xiàn)[46]提出了一種基于BFL的健康醫(yī)療共享體系。文獻(xiàn)[47]提出的方案首先利用區(qū)塊鏈構(gòu)建虛擬數(shù)據(jù)中心,可以使各個(gè)數(shù)據(jù)擁有方上傳相關(guān)的醫(yī)學(xué)數(shù)據(jù),該數(shù)據(jù)并不是原始數(shù)據(jù),而是包含原始數(shù)據(jù)一些特征屬性的元數(shù)據(jù)。接著,在進(jìn)行模型訓(xùn)練和學(xué)習(xí)后,研究機(jī)構(gòu)就可以獲取相關(guān)數(shù)據(jù)的研究結(jié)果,從而獲得高質(zhì)量數(shù)據(jù),并將數(shù)據(jù)應(yīng)用到慢性疾病的預(yù)防管理中。
BFL方案也已廣泛應(yīng)用于車聯(lián)網(wǎng)(IoV),以實(shí)現(xiàn)數(shù)據(jù)共享和自動(dòng)駕駛。Pokhrel等[15]提出了一種完全去中心化的的BFL框架,該框架實(shí)現(xiàn)了IoV中端到端的可信通信,并且通信延遲也在可接受范圍內(nèi),從而促進(jìn)自動(dòng)化車輛的有效通信。文獻(xiàn)[15]采用BFL驗(yàn)證車載機(jī)器學(xué)習(xí)(on?Verhicle Machine Learning,oVML)的模型更新,提高了自動(dòng)化車輛的性能和隱私安全性。Lu等[20]提出了一種BFL框架,由路邊單元維護(hù)的主許可區(qū)塊鏈和車輛運(yùn)行的本地有向無環(huán)圖(Directed Acyclic Graph, DAG)組成,用于在IoV中進(jìn)行高效數(shù)據(jù)共享。另外,文獻(xiàn)[20]中還提出了基于邊緣數(shù)據(jù)的異步聯(lián)邦學(xué)習(xí)方案,通過委托權(quán)益證明(DPoS)選擇優(yōu)化的參與節(jié)點(diǎn),從而提高聯(lián)邦學(xué)習(xí)的效率。文獻(xiàn)[48]中提出了一種基于區(qū)塊鏈的分層聯(lián)邦學(xué)習(xí)算法,減少了存儲(chǔ)消耗,提高了訓(xùn)練精度。所提出的基于BFL的知識(shí)共享方式,能夠提高車內(nèi)網(wǎng)絡(luò)的可靠性和安全性,并利用學(xué)習(xí)證明(Proof of Learning, PoL)共識(shí)機(jī)制,實(shí)現(xiàn)了一種輕量級(jí)區(qū)塊鏈,避免了計(jì)算能力浪費(fèi)。
此外,BFL正被逐步推廣到其他多個(gè)領(lǐng)域。在內(nèi)容緩存領(lǐng)域,文獻(xiàn)[49]提出了一種新的算法,即稱為CREAT(blockchain?assisted Compressed algoRithm of fEderated leArning applied for conTent caching)的采用區(qū)塊鏈技術(shù)輔助的聯(lián)邦學(xué)習(xí)算法,以預(yù)測(cè)緩存文件,并提高緩存命中率。在位置預(yù)測(cè)領(lǐng)域,文獻(xiàn)[50]提出的方案采用BFL在用戶的移動(dòng)設(shè)備上進(jìn)行本地培訓(xùn),從而在利用這些數(shù)據(jù)進(jìn)行更好的位置預(yù)測(cè)的同時(shí)保護(hù)用戶的隱私。在移動(dòng)眾感知領(lǐng)域,文獻(xiàn)[51]提出了SFAC(Secure Federated learning for UAV?assisted Crowdsensing)架構(gòu),一種用于無人機(jī)輔助移動(dòng)眾感知(Mobile Crowd Sensing,MCS)的安全聯(lián)邦學(xué)習(xí)框架,并利用局部差分隱私保護(hù)數(shù)據(jù)提供方的隱私。另外,BFL也被應(yīng)用到災(zāi)難響應(yīng)領(lǐng)域,文獻(xiàn)[52]中提出一種由區(qū)塊鏈?zhǔn)跈?quán)的BFL架構(gòu),將在未來6G網(wǎng)絡(luò)中利用無人機(jī)上的無線移動(dòng)模塊實(shí)現(xiàn)災(zāi)難響應(yīng)系統(tǒng)。此外,BFL也被應(yīng)用到新聞推薦領(lǐng)域,文獻(xiàn)[53]中提出了一種基于聯(lián)邦學(xué)習(xí)的云邊端協(xié)同過濾算法推薦系統(tǒng)。該系統(tǒng)利用差分隱私技術(shù)向訓(xùn)練模型中添加噪聲,進(jìn)一步防止了數(shù)據(jù)隱私的暴露。
表3對(duì)不同BFL在不同領(lǐng)域的應(yīng)用進(jìn)行了對(duì)比。
表3 BFL的應(yīng)用總結(jié)
區(qū)塊鏈的引入有助于解決傳統(tǒng)聯(lián)邦學(xué)習(xí)存在的部分重要問題。然而,區(qū)塊鏈與聯(lián)邦學(xué)習(xí)的結(jié)合也面臨區(qū)塊鏈本身帶來的問題,有待研究者不斷探索。
首先,多數(shù)區(qū)塊鏈系統(tǒng)缺乏足夠強(qiáng)力的隱私保護(hù)手段,因而BFL框架需要引入差分隱私、同態(tài)加密等隱私保護(hù)技術(shù),對(duì)放置在區(qū)塊鏈上的數(shù)據(jù)進(jìn)行額外保護(hù)。例如,文獻(xiàn)[22,30]中均在模型提取的過程中使用差分隱私來加入噪聲,從而保護(hù)個(gè)體數(shù)據(jù)的隱私。文獻(xiàn)[30]還提出了一種可驗(yàn)證的秘密共享方案來進(jìn)行模型安全聚合。除此之外,文獻(xiàn)[34]中通過使用同態(tài)加密算法對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行加密來保護(hù)訓(xùn)練模型的隱私。對(duì)于現(xiàn)存BFL框架來說,如何更好地平衡隱私保護(hù)的開銷與訓(xùn)練的準(zhǔn)確性仍是亟待解決的關(guān)鍵問題。
其次,盡管BFL框架可以通過合理設(shè)計(jì)共識(shí)機(jī)制對(duì)投毒攻擊進(jìn)行一定程度的抵御,多數(shù)區(qū)塊鏈共識(shí)算法卻面臨本身的安全風(fēng)險(xiǎn)。例如,在最常見的PoW共識(shí)算法中,由于各個(gè)礦工接收區(qū)塊存在時(shí)延,很有可能發(fā)生分叉(forking)問題。文獻(xiàn)[13]通過引入ACK(ACKnowledge character),在等待時(shí)間內(nèi)確定是否發(fā)生分叉,如發(fā)生分叉就重新進(jìn)行挖礦,以此緩解該問題。近期的一些研究提出了新的共識(shí)算法,但是這些共識(shí)算法的安全性普遍缺乏理論證明和實(shí)際驗(yàn)證。因此,如何構(gòu)建可證明安全的BFL共識(shí)算法仍是亟待解決的關(guān)鍵問題。
本文介紹了區(qū)塊鏈技術(shù)與聯(lián)邦學(xué)習(xí)技術(shù)相結(jié)合的基于區(qū)塊鏈的聯(lián)邦學(xué)習(xí)(BFL)研究領(lǐng)域發(fā)展現(xiàn)狀,通過廣泛調(diào)查研究現(xiàn)有BFL領(lǐng)域的相關(guān)科研文獻(xiàn),對(duì)現(xiàn)有BFL工作在基礎(chǔ)架構(gòu)、核心技術(shù)、應(yīng)用前景三個(gè)層面進(jìn)行了全面、完整的分析和對(duì)比工作,總結(jié)了區(qū)塊鏈與聯(lián)邦學(xué)習(xí)相結(jié)合的創(chuàng)新與應(yīng)用方向。目前來看,BFL領(lǐng)域仍處于初期發(fā)展階段,多數(shù)研究工作僅通過引入?yún)^(qū)塊鏈技術(shù)解決聯(lián)邦學(xué)習(xí)的單點(diǎn)信任問題,缺乏在隱私、效率、公平性等方面的進(jìn)一步探索。此外,多數(shù)研究工作仍停留在理論階段,且部分工作提出的BFL框架并不完整,導(dǎo)致這些工作提出的BFL技術(shù)在實(shí)際場(chǎng)景中的可用性可能存在不足。隨著區(qū)塊鏈和聯(lián)邦學(xué)習(xí)這兩個(gè)熱門領(lǐng)域的快速發(fā)展,作為其交叉領(lǐng)域的BFL能夠汲取這兩個(gè)領(lǐng)域的技術(shù)精華,進(jìn)而交融出獨(dú)特的創(chuàng)新性技術(shù)反哺這兩個(gè)領(lǐng)域,建立一種可信的隱私保護(hù)學(xué)習(xí)范式,為多個(gè)應(yīng)用領(lǐng)域的相關(guān)行業(yè)帶來巨大變革。
[1] LI Y Z, CHEN C, LIU N, et al. A blockchain?based decentralized federated learning framework with committee consensus[J]. IEEE Network, 2021, 35(1): 234-241.
[2] McMAHAN H B, MOORE E, RAMAGE D, et al. Communication? efficient learning of deep networks from decentralized data[C]// Proceedings of the 20th International Conference on Artificial Intelligence and Statistics. New York: JMLR.org, 2017:1273-1282.
[3] KONE?NY J, McMAHAN H B, YU F X, et al. Federated learning: Strategies for improving communication efficiency[EB/OL]. (2017-10-30)[2021-07-13].https://arxiv.org/pdf/1610.05492.pdf.
[4] LI L, FAN Y X, TSE M, et al. A review of applications in federated learning[J]. Computers and Industrial Engineering, 2020, 149: No.106854.
[5] LI T, SAHU A K, TALWALKAR A, et al. Federated learning: challenges, methods, and future directions[J]. IEEE Signal Processing Magazine, 2020, 37(3):50-60.
[6] NAKAMOTO S. Bitcoin: a peer?to?peer electronic cash system[EB/OL]. [2021-07-15].https://bitcoin.org/bitcoin.pdf.
[7] ZHENG Z B, XIE S A, DAI H N, et al. Blockchain challenges and opportunities: a survey[J]. International Journal of Web and Grid Services, 2018, 14(4): 352-375.
[8] TOYODA K, ZHANG A N. Mechanism design for an incentive? aware blockchain?enabled federated learning platform[C]// Proceedings of the 2019 IEEE International Conference on Big Data. Piscataway: IEEE, 2019: 395-403.
[9] HOU D K, ZHANG J, MAN K L, et al. A systematic literature review of blockchain?based federated learning: architectures, applications and issues[C]// Proceedings of the 2nd Information Communication Technologies Conference. Piscataway: IEEE, 2021: 302-307.
[10] WAHAB O A, MOURAD A, OTROK H, et al. Federated machine learning: survey, multi?level classification, desirable criteria and future directions in communication and networking systems[J]. IEEE Communications Surveys and Tutorials, 2021, 23(2): 1342-1397.
[11] 李凌霄,袁莎,金銀玉. 基于區(qū)塊鏈的聯(lián)邦學(xué)習(xí)技術(shù)綜述[J]. 計(jì)算機(jī)應(yīng)用研究, 2021, 38(11):3222-3230.(LI L X, YUAN S, JIN Y Y. Review of blockchain?based federated learning[J]. Application Research of Computers, 2021, 38(11):3222-3230.)
[12] 邵俊,藺靜茹. 基于區(qū)塊鏈的聯(lián)邦學(xué)習(xí)應(yīng)用研究[J]. 中國(guó)新通信, 2021, 23(5):124-125.(SHAO J, LIN J R. Application research of federated learning based on blockchain[J]. China New Telecommunications, 2021, 23(5):124-125.)
[13] KIM H, PARK J, BENNIS M, et al. Blockchained on?device federated learning[J]. IEEE Communications Letters, 2020, 24(6):1279-1283.
[14] QU Y Y, GAO L X, LUAN T H, et al. Decentralized privacy using blockchain?enabled federated learning in fog computing[J]. IEEE Internet of Things Journal, 2020, 7(6):5071-5083.
[15] POKHREL S R, CHOI J. Federated learning with blockchain for autonomous vehicles: analysis and design challenges[J]. IEEE Transactions on Communications, 2020, 68(8): 4734-4746.
[16] AWAN S, LI F J, LUO B, et al. Poster: a reliable and accountable privacy?preserving federated learning framework using the blockchain[C]// Proceedings of the 2019 ACM SIGSAC Conference on Computer and Communications Security. New York: ACM, 2019: 2561-2563.
[17] HIEU N Q, ANH T T, LUONG N C, et al. Resource management for blockchain?enabled federated learning: a deep reinforcement learning approach[EB/OL]. (2020-05-01)[2021-08-20].https://arxiv.org/pdf/2004.04104.pdf.
[18] MAJEED U, HONG C S. FLchain: federated learning via MEC? enabled blockchain network[C]// Proceedings of the 20th Asia? Pacific Network Operations and Management Symposium. Piscataway: IEEE, 2019: 1-4.
[19] LI Z Y, LIU J, HAO J L, et al. CrowdSFL: a secure crowd computing framework based on blockchain and federated learning[J]. Electronics, 2020, 9(5): No.773.
[20] LU Y L, HUANG X H, ZHANG K, et al. Blockchain empowered asynchronous federated learning for secure data sharing in internet of vehicles[J]. IEEE Transactions on Vehicular Technology, 2020, 69(4): 4298-4311.
[21] KANG J W, XIONG Z H, JIANG C X, et al. Scalable and communication?efficient decentralized federated edge learning with multi?blockchain framework[C]// Proceedings of the 2020 International Conference on Blockchain and Trustworthy Systems, CCIS 1267. Singapore: Springer, 2020: 152-165.
[22] LU Y L, HUANG X H, DAI Y Y, et al. Blockchain and federated learning for privacy?preserved data sharing in industrial IoT[J]. IEEE Transactions on Industrial Informatics, 2020, 16(6): 4177-4186.
[23] UR REHAMN M H, SALAH K, DAMIANI E, et al. Towards blockchain?based reputation?aware federated learning[C]// Proceedings of the 2020 IEEE Conference on Computer Communications Workshops. Piscataway: IEEE, 2020:183-188.
[24] ZHANG W S, LU Q H, YU Q Y, et al. Blockchain?based federated learning for failure detection in industrial IoT[J]. IEEE Internet of Things Journal, 2021, 8(7):5926-5937.
[25] LU Y L, HUANG X H, ZHANG K, et al. Low?latency federated learning and blockchain for edge association in digital twin empowered 6G networks[J]. IEEE Transactions on Industrial Informatics, 2021, 17(7): 5098-5107.
[26] ZHAO Y, ZHAO J, JIANG L S, et al. Privacy?preserving blockchain?based federated learning for IoT devices[J]. IEEE Internet of Things Journal, 2021, 8(3): 1817-1829.
[27] MA C, LI J, SHI L, et al. When federated learning meets blockchain: a new distributed learning paradigm[J]. IEEE Computational Intelligence Magazine, 2022, 17(3): 26-33.
[28] NAGAR A. Privacy?preserving blockchain based federated learning with differential data sharing[EB/OL]. (2019-12-10)[2021-08-21].https://arxiv.org/ftp/arxiv/papers/1912/1912.04859.pdf.
[29] QU Y Y, POKHREL S R, GARG S, et al. A blockchained federated learning framework for cognitive computing in industry 4.0 networks[J]. IEEE Transactions on Industrial Informatics, 2021, 17(4): 2964-2973.
[30] SHAYAN M, FUNG C, YOON C J M, et al. Biscotti: a blockchain system for private and secure federated learning[J]. IEEE Transactions on Parallel and Distributed Systems, 2021, 32(7): 1513-1525.
[31] BAO X L, SU C, XIONG Y, et al. FLChain: a blockchain for auditable federated learning with trust and incentive[C]// Proceedings of the 5th International Conference on Big Data Computing and Communications. Piscataway: IEEE, 2019: 151-159.
[32] ZHANG K S, HUANG H W, GUO S, et al. Blockchain?based participant selection for federated learning[C]// Proceedings of the 2020 International Conference on Blockchain and Trustworthy Systems, CCIS 1267. Singapore: Springer, 2020: 112-125.
[33] CHEN H, ASIF S A, PARK J, et al. Robust blockchained federated learning with model validation and proof?of?stake inspired consensus[EB/OL]. (2021-01-09)[2021-08-23].https://arxiv.org/pdf/2101.03300.pdf.
[34] MARTINEZ I, FRANCIS S, HAFID A S. Record and reward federated learning contributions with blockchain[C]// Proceedings of the 2019 International Conference on Cyber?Enabled Distributed Computing and Knowledge Discovery. Piscataway: IEEE, 2019: 50-57.
[35] 任濤,金若辰,羅詠梅. 融合區(qū)塊鏈與聯(lián)邦學(xué)習(xí)的網(wǎng)絡(luò)入侵檢測(cè)算法[J]. 信息網(wǎng)絡(luò)安全, 2021, 21(7):27-34.(REN T, JIN R C, LUO Y M. Network intrusion detection algorithm integrating blockchain and federated learning[J]. Netinfo Security, 2021, 21(7):27-34.)
[36] 馮濤,焦瀅,方君麗,等. 基于聯(lián)盟區(qū)塊鏈的醫(yī)療健康數(shù)據(jù)安全模型[J]. 計(jì)算機(jī)科學(xué), 2020, 47(4): 305-311.(FENG T, JIAO Y, FANG J L, et al. Medical health data security model based on alliance blockchain[J]. Computer Science, 2020, 47(4): 305-311.)
[37] KUMAR S, DUTTA S, CHATTURVEDI S, et al. Strategies for enhancing training and privacy in blockchain enabled federated learning[C]// Proceedings of the IEEE 6th International Conference on Multimedia Big Data. Piscataway: IEEE, 2020: 333-340.
[38] 中國(guó)石油大學(xué)(華東). 一種基于區(qū)塊鏈和聯(lián)邦學(xué)習(xí)的物聯(lián)網(wǎng)設(shè)備故障檢測(cè)方法: 202011087722.7[P]. 2021-01-05.(China University of Petroleum (East China). A failure detection method for Internet of things device based on blockchain and federated learning: 202011087722.7[P]. 2021-01-05.)
[39] 代玥玥,張科,張彥. 區(qū)塊鏈賦能6G[J]. 物聯(lián)網(wǎng)學(xué)報(bào), 2020, 4(1):111-120.(DAI Y Y, ZHANG K, ZHANG Y. Blockchain empowered 6G[J]. Chinese Journal on Internet of Things, 2020, 4(1): 111-120.)
[40] PASSERAT?PALMBACH J, FARNAN T, MILLER R, et al. A blockchain?orchestrated federated learning architecture for healthcare consortia[EB/OL]. (2019-10-12)[2021-08-24].https://arxiv.org/pdf/1910.12603.pdf.
[41] EL RIFAI O, BIOTTEAU M, DE BOISSEZON X, et al. Blockchain?based federated learning in medicine[C]// Proceedings of the 2020 International Conference on Artificial Intelligence in Medicine, LNCS 12299. Cham: Springer, 2020: 214-224.
[42] POLAP D, SRIVASTAVA G, JOLFAEI A, et al. Blockchain technology and neural networks for the Internet of Medical Things[C]// Proceedings of the 2020 IEEE Conference on Computer Communications Workshops. Piscataway: IEEE, 2020: 508-513.
[43] RAHMAN M A, HOSSAIN M S, ISLAM M S, et al. Secure and provenance enhanced Internet of health things framework: a blockchain managed federated learning approach[J]. IEEE Access, 2020, 8: 205071-205087.
[44] AICH S, SINAI N K, KUMAR S, et al. Protecting personal healthcare record using blockchain & federated learning technologies[C]// Proceedings of the 23rd International Conference on Advanced Communication Technology. Piscataway: IEEE, 2021: 109-112.
[45] KUMAR R, KHAN A A, KUMAR J, et al. Blockchain?federated? learning and deep learning models for COVID-19 detection using CT imaging[J]. IEEE Sensors Journal, 2021, 21(14): 16301-16314.
[46] 邢丹,徐琦,姚俊明. 邊緣計(jì)算環(huán)境下基于區(qū)塊鏈和聯(lián)邦學(xué)習(xí)的醫(yī)療健康數(shù)據(jù)共享模型[J]. 醫(yī)學(xué)信息學(xué)雜志, 2021, 42(2):33-37.(XING D, XU Q, YAO J M. Medical and health data sharing model based on blockchain and federated learning in the edge computing environment[J]. Journal of Medical Informatics, 2021, 42(2): 33-37.)
[47] 李錚. 一種支持隱私與權(quán)益保護(hù)的數(shù)據(jù)聯(lián)合利用系統(tǒng)方案[J]. 信息與電腦, 2020, 32(14): 4-7.(LI Z. A scheme of data joint utilization system supporting privacy and rights protection[J]. China Computer & Communication, 2020, 32(14): 4-7.)
[48] CHAI H Y, LENG S P, CHEN Y J, et al. A hierarchical blockchain?enabled federated learning algorithm for knowledge sharing in internet of vehicles[J]. IEEE Transactions on Intelligent Transportation Systems, 2021, 22(7): 3975-3986.
[49] CUI L Z, SU X X, MING Z X, et al. CREAT: blockchain? assisted compression algorithm of federated learning for content caching in edge computing[J]. IEEE Internet of Things Journal, 2022, 9(16): 14151-14161.
[50] HALIM S M, KHAN L, THURAISINGHAM B. Next?location prediction using federated learning on a blockchain[C]// Proceedings of the IEEE 2nd International Conference on Cognitive Machine Intelligence. Piscataway: IEEE, 2020: 244-250.
[51] WANG Y T, SU Z, ZHANG N, et al. Learning in the air: secure federated learning for UAV?assisted crowdsensing[J]. IEEE Transactions on Network Science and Engineering, 2021, 8(2): 1055-1069.
[52] POKHREL S R. Federated learning meets blockchain at 6G edge: a drone?assisted networking for disaster response[C]// Proceedings of the 2nd ACM MobiCom Workshop on Drone Assisted Wireless Communications for 5G and Beyond. New York: ACM, 2020: 49-54.
[53] WANG Y C, TIAN Y Y, YIN X Y, et al. A trusted recommendation scheme for privacy protection based on federated learning[J]. CCF Transactions on Networking, 2020, 3(3/4):218-228.
Research progress of blockchain?based federated learning
SUN Rui1,2, LI Chao1,2*, WANG Wei1,2, TONG Endong1,2, WANG Jian1,2, LIU Jiqiang1,2
(1(),100044,;2,,100044,)
Federated Learning (FL) is a novel privacy?preserving learning paradigm that can keep users data locally. With the progress of the research on FL, the shortcomings of FL, such as single point of failure and lack of credibility, are gradually gaining attention. In recent years, the blockchain technology originated from Bitcoin has achieved rapid development, which pioneers the construction of decentralized trust and provides a new possibility for the development of FL. The existing research works on blockchain?based FL were reviewed, the frameworks for blockchain?based FL were compared and analyzed. Then, key points of FL solved by the combination of blockchain and FL were discussed. Finally, the application prospects of blockchain?based FL were presented in various fields, such as Internet of Things (IoT), Industrial Internet of Things (IIoT), Internet of Vehicles (IoV) and medical services.
Federated Learning (FL); blockchain; structural framework; fusion application; privacy protection
This work is partially supported by National Key Research and Development Program of China (2020YFB2103802), Fundamental Research Funds for Central Universities (2019RC038).
SUN Rui, born in 1998, M. S. candidate. Her research interests include blockchain.
LI Chao, born in 1988, Ph. D., lecturer. His research interests include blockchain.
WANG Wei, born in 1976, Ph. D., professor. His research interests include network and system, industrial Internet, blockchain.
TONG Endong, born in 1986, Ph. D., lecturer. His research interests include service computing, artificial intelligence.
WANG Jian, born in 1975, Ph. D., associate professor. His research interests include password application, blockchain, network security.
LIU Jiqiang, born in 1973, Ph. D., professor. His research interests include trusted computing, privacy protection, Internet of Things.
TP309.2
A
1001-9081(2022)11-3413-08
10.11772/j.issn.1001-9081.2021111934
2021?11?14;
2021?12?08;
2021?12?23。
國(guó)家重點(diǎn)研發(fā)計(jì)劃項(xiàng)目(2020YFB2103802);中央高?;究蒲袠I(yè)務(wù)費(fèi)專項(xiàng)資金資助項(xiàng)目(2019RC038)。
孫睿(1998—),女,吉林扶余人,碩士研究生,主要研究方向:區(qū)塊鏈;李超(1988—),男,甘肅天水人,講師,博士,CCF會(huì)員,主要研究方向:區(qū)塊鏈;王偉(1976—),男,湖北英山人,教授,博士,主要研究方向:網(wǎng)絡(luò)與系統(tǒng)、工業(yè)互聯(lián)網(wǎng)、區(qū)塊鏈;童恩棟(1986—),男,山東聊城人,講師,博士,主要研究方向:服務(wù)計(jì)算、人工智能;王?。?975—),男,山東煙臺(tái)人,副教授,博士,主要研究方向:密碼應(yīng)用、區(qū)塊鏈、網(wǎng)絡(luò)安全;劉吉強(qiáng)(1973—),男,山東煙臺(tái)人,教授,博士,主要研究方向:可信計(jì)算、隱私保護(hù)、物聯(lián)網(wǎng)。