摘要:信息數(shù)據(jù)共享階段的傳遞機(jī)制存在銜接漏洞,導(dǎo)致數(shù)據(jù)安全性難以得到保障。為此,文章提出基于區(qū)塊鏈技術(shù)的高校產(chǎn)教融合平臺信息數(shù)據(jù)共享方法。該方法采用實(shí)用拜占庭容錯算法為數(shù)據(jù)共享建立了高效且可靠的共識機(jī)制,結(jié)合區(qū)塊鏈技術(shù)與余弦相似度分析,利用NC-CS節(jié)點(diǎn)分類算法實(shí)現(xiàn)高校產(chǎn)教融合平臺信息數(shù)據(jù)共享。在測試結(jié)果中,當(dāng)并發(fā)請求數(shù)量達(dá)到80人次時(shí)開始出現(xiàn)信息丟失,并未出現(xiàn)明顯的爆發(fā)性增長。
關(guān)鍵詞:區(qū)塊鏈技術(shù);信息數(shù)據(jù)共享;實(shí)用拜占庭容錯算法;余弦相似度;NC-CS節(jié)點(diǎn)分類算法
中圖分類號:TP393" 文獻(xiàn)標(biāo)志碼:A
0 引言
數(shù)據(jù)共享階段,受數(shù)據(jù)在多部門、組織之間頻繁交換和共享狀態(tài)的影響,數(shù)據(jù)在傳輸過程中容易被第三方截獲并篡改[1]。由于系統(tǒng)和數(shù)據(jù)安全的責(zé)權(quán)邊界較為模糊,權(quán)限控制不足,數(shù)據(jù)超范圍共享和數(shù)據(jù)暴露風(fēng)險(xiǎn)加大。另一方面,高級持續(xù)性威脅(Advanced Persistent Threat,APT)攻擊[2],隱蔽性高、感知困難,使得傳統(tǒng)的安全檢測、防御技術(shù)難以應(yīng)對[3]。如果數(shù)據(jù)在傳輸過程中未采用有效的加密和驗(yàn)證措施,就極易被篡改[4]。黃楊楊[5]提出了以屬性Logistic混沌映射為基礎(chǔ)的數(shù)據(jù)安全共享方法,借助Logistic混沌映射的非線性屬性,使得生成的密鑰序列難以被破解,從而有效防止數(shù)據(jù)在傳輸過程中被篡改。該方法結(jié)合屬性基加密技術(shù),可以根據(jù)用戶的屬性分配密鑰,實(shí)現(xiàn)細(xì)粒度的訪問控制。這不僅提高了加密的靈活性,還增強(qiáng)了數(shù)據(jù)共享的安全性。但是Logistic混沌映射生成密鑰序列的計(jì)算過程相對復(fù)雜,對計(jì)算資源要求較高。申童童等[6]提出了以Fabric和屬性加密為基礎(chǔ)的數(shù)據(jù)安全共享方案,借助Fabric作為Hyperledger下屬區(qū)塊鏈框架的特性,確保在傳輸和存儲過程中數(shù)據(jù)的完整性和真實(shí)性。同時(shí),結(jié)合屬性加密和區(qū)塊鏈技術(shù),既實(shí)現(xiàn)了細(xì)粒度的訪問控制,又確保了數(shù)據(jù)在區(qū)塊鏈上的安全存儲和傳輸。但是,在實(shí)際應(yīng)用過程中,共識機(jī)制和存儲能力可能會成為限制其性能的關(guān)鍵因素。
在此基礎(chǔ)上,本文提出了基于區(qū)塊鏈技術(shù)的高校產(chǎn)教融合平臺信息數(shù)據(jù)共享方法,通過對比分析的方式對設(shè)計(jì)共享方法的性能加以測試。
1 高校產(chǎn)教融合平臺信息數(shù)據(jù)共享方法設(shè)計(jì)
1.1 信息數(shù)據(jù)共享共識機(jī)制構(gòu)建
考慮到大部分高校產(chǎn)教融合平臺均為分布式系統(tǒng),針對此,本文采用實(shí)用拜占庭容錯算法建立共識機(jī)制[7],以確保其能夠適用于后續(xù)區(qū)塊鏈的嵌入以及需要高容錯性的分布式高校產(chǎn)教融合平臺。信息數(shù)據(jù)共享共識機(jī)制流程如圖1所示。
實(shí)用拜占庭容錯算法的具體執(zhí)行流程如下。采用輪轉(zhuǎn)機(jī)制選定主節(jié)點(diǎn),每個節(jié)點(diǎn)在一個特定的時(shí)間段內(nèi)扮演主節(jié)點(diǎn)的角色,這段時(shí)間被稱為一個視圖[8]。具體的選擇標(biāo)準(zhǔn)以評價(jià)值作為指標(biāo),其計(jì)算方式可以表示為:
Pe(n)=∑λixi(1)
∑λi=1(2)
其中,Pe(i)為節(jié)點(diǎn)n的評價(jià)值;λi為與節(jié)點(diǎn)n權(quán)益相對應(yīng)的指標(biāo)權(quán)重值;xi為與節(jié)點(diǎn)n權(quán)益相對應(yīng)的指標(biāo),具體包括硬盤容量、硬盤IO速率、內(nèi)存容量、CPU內(nèi)核數(shù)、CPU頻率以及網(wǎng)絡(luò)帶寬。
這樣的設(shè)計(jì)確保了系統(tǒng)的公平性和去中心化特性。當(dāng)客戶端發(fā)起一個請求時(shí),首先將該請求發(fā)送給當(dāng)前視圖的主節(jié)點(diǎn)[9]。主節(jié)點(diǎn)在接收到請求后,進(jìn)行一系列校驗(yàn),包括驗(yàn)證請求的合法性、簽名,以確保請求的真實(shí)性和完整性。具體校驗(yàn)方式可以表示為:
f(x)=Frsign×Sign(ski,PKset,R)(3)
其中,f(x)為校驗(yàn)函數(shù);Frsign為合法性校驗(yàn)函數(shù);Sign(ski,PKset,R)為請求的簽名;PKset為設(shè)置的序列號;ski為請求內(nèi)容;R為視圖號關(guān)鍵信息。
在此基礎(chǔ)上,主節(jié)點(diǎn)請求分配一個唯一的序列號,該序列號用于確保請求在高校產(chǎn)教融合平臺中的有序處理[10]。此時(shí),主節(jié)點(diǎn)構(gòu)造一個預(yù)準(zhǔn)備消息,該消息包含請求內(nèi)容、序列號、視圖號關(guān)鍵信息,將其廣播給所有的副節(jié)點(diǎn)。具體可以表示為:
G=Sign(ski,PKset,R)(4)
其中,G為預(yù)準(zhǔn)備消息;ski為請求內(nèi)容;PKset為設(shè)置的序列號;R為視圖號關(guān)鍵信息。
副節(jié)點(diǎn)在接收到預(yù)準(zhǔn)備消息后,進(jìn)行同樣的校驗(yàn)過程。如果校驗(yàn)通過,副節(jié)點(diǎn)進(jìn)入準(zhǔn)備階段,構(gòu)造準(zhǔn)備消息廣播給高校產(chǎn)教融合平臺中的其他所有節(jié)點(diǎn),以表明自己已經(jīng)準(zhǔn)備好執(zhí)行該請求。準(zhǔn)備消息傳播至每個節(jié)點(diǎn)并收集到來自其他節(jié)點(diǎn)的準(zhǔn)備消息后,當(dāng)節(jié)點(diǎn)收集到足夠數(shù)量的(該研究設(shè)置對應(yīng)的標(biāo)準(zhǔn)為超過2/3的節(jié)點(diǎn))有效準(zhǔn)備消息時(shí),則認(rèn)為該請求已經(jīng)得到了足夠的支持,構(gòu)造確認(rèn)消息進(jìn)行廣播。借助這一步驟,確保系統(tǒng)中的大多數(shù)節(jié)點(diǎn)對請求的執(zhí)行達(dá)成共識。最后,在確認(rèn)消息廣播之后,所有節(jié)點(diǎn)執(zhí)行客戶端的請求,將執(zhí)行結(jié)果作為響應(yīng)消息發(fā)送給客戶端??蛻舳嗽谑盏阶銐驍?shù)量的(該研究設(shè)置對應(yīng)的標(biāo)準(zhǔn)為超過1/3的節(jié)點(diǎn))響應(yīng)結(jié)果后,即可確定其為請求的最終執(zhí)行結(jié)果。
通過上述信息數(shù)據(jù)共享共識機(jī)制的構(gòu)建,提高了高校產(chǎn)教融合平臺的容錯性,同時(shí)確保了即使在部分節(jié)點(diǎn)出現(xiàn)故障或異常的情況下,信息數(shù)據(jù)共享也能保持正確性和一致性。
1.2 基于區(qū)塊鏈技術(shù)的平臺信息數(shù)據(jù)共享
在構(gòu)建高校產(chǎn)教融合平臺信息數(shù)據(jù)共享邏輯的過程中,引入了區(qū)塊鏈技術(shù),在其中嵌入了鄰域共識-調(diào)頻變標(biāo)(Neighborhood Consensus - Chirp Scaling,NC-CS)節(jié)點(diǎn)分類算法,通過余弦相似度分析,為數(shù)據(jù)的高效整合與共享提供基礎(chǔ)。該共享方法的核心在于精準(zhǔn)識別并分類擁有相似數(shù)據(jù)特征的節(jié)點(diǎn),從而促進(jìn)相同或相關(guān)領(lǐng)域內(nèi)的數(shù)據(jù)流通與合作。
NC-CS算法依賴于區(qū)塊鏈技術(shù)的去中心化、透明性和不可篡改性,確保每個參與節(jié)點(diǎn)的數(shù)據(jù)摘要在加入共享網(wǎng)絡(luò)前都能得到公正、安全的處理。通過構(gòu)建向量空間模型(Vector Space Model,VSM),算法將復(fù)雜多維度的數(shù)據(jù)摘要轉(zhuǎn)化為簡潔的向量來表示,利用這一過程簡化數(shù)據(jù)處理流程,同時(shí)增強(qiáng)數(shù)據(jù)間的可比性。具體的向量空間模型可以表示為
X={pe(n1),pe(n2),...,pe(ni)}(5)
其中,X為區(qū)塊鏈中每個參與節(jié)點(diǎn)的向量空間模型。結(jié)合式(5)所示的VSM可以看出,每個特征項(xiàng)及其對應(yīng)的權(quán)重共同構(gòu)成描述數(shù)據(jù)特性的向量,其中權(quán)重反映了特征項(xiàng)在數(shù)據(jù)中的重要程度。借助這種設(shè)計(jì),無論是文本信息,還是圖像特征,都能通過特征提取和權(quán)重分配轉(zhuǎn)化為統(tǒng)一的向量格式。
在此基礎(chǔ)上,余弦相似度以其對向量方向敏感、對向量大小不敏感的特性,在衡量文本相似度及其他類型數(shù)據(jù)相似性方面具有較高的可靠性。因此,本文設(shè)計(jì)了NC-CS算法,利用余弦相似度,計(jì)算新加入節(jié)點(diǎn)與已有節(jié)點(diǎn)之間數(shù)據(jù)摘要向量的相似程度。
Sim(X,Y)=∑ni=1(xi·yi)x2iyi2(6)
其中,Sim(X,Y)為請求信息對應(yīng)文本向量與高校產(chǎn)教融合平臺信息數(shù)據(jù)文本向量之間的相似度。
按照式(6)所示的方式,通過比較2個向量在n維空間中的夾角余弦值,迅速識別出數(shù)據(jù)特征相似的節(jié)點(diǎn)。當(dāng)計(jì)算出的相似度超過預(yù)設(shè)的閾值時(shí),將新節(jié)點(diǎn)歸入相應(yīng)的共享小組,實(shí)現(xiàn)基于數(shù)據(jù)特征的精準(zhǔn)分組。區(qū)塊鏈技術(shù)的平臺信息數(shù)據(jù)共享方式如圖2所示。
綜上所述,通過結(jié)合區(qū)塊鏈技術(shù)與余弦相似度分析,利用NC-CS節(jié)點(diǎn)分類算法實(shí)現(xiàn)高校產(chǎn)教融合平臺信息數(shù)據(jù)共享。
2 測試與分析
2.1 測試準(zhǔn)備
在具體的測試過程中,以某高校產(chǎn)教融合平臺A為基礎(chǔ)開展測試分析。A高校產(chǎn)教融合平臺是推動該院校教育與產(chǎn)業(yè)深度融合的重要載體,主要通過整合高校教育資源與產(chǎn)業(yè)資源,達(dá)到資源共享、優(yōu)勢互補(bǔ)的目的。在此基礎(chǔ)上,對A高校產(chǎn)教融合平臺的信息數(shù)據(jù)構(gòu)成情況進(jìn)行分析。其中,身份管理模塊的用戶信息庫主要存儲高校師生與企業(yè)員工的基本信息,包括姓名、身份證號、職務(wù)、所屬單位等,用于身份驗(yàn)證與權(quán)限管理。角色分配工具主要根據(jù)用戶身份(如教師、學(xué)生、企業(yè)員工等)分配不同的系統(tǒng)權(quán)限,確保數(shù)據(jù)的安全性與訪問的合規(guī)性。在資源庫中,存儲了高校優(yōu)質(zhì)課程資源、企業(yè)實(shí)際案例、行業(yè)技術(shù)標(biāo)準(zhǔn)、校企聯(lián)合開展的科研項(xiàng)目、技術(shù)服務(wù)項(xiàng)目、專利、軟件著作權(quán)等多元數(shù)據(jù)信息。高校產(chǎn)教融合平臺共享信息數(shù)據(jù)規(guī)模如表1所示。
為加強(qiáng)高校與企業(yè)之間的深度合作,需要為平臺構(gòu)建安全高效的共享機(jī)制。在測試階段,分別采用本文設(shè)計(jì)的信息數(shù)據(jù)共享方法以及以屬性Logistic混沌映射為基礎(chǔ)的數(shù)據(jù)安全共享方法、以Fabric和屬性加密為基礎(chǔ)的數(shù)據(jù)安全共享方法開展具體的應(yīng)用分析。通過對3種不同方法的測試結(jié)果進(jìn)行對比,客觀評價(jià)本文設(shè)計(jì)共享方法的應(yīng)用效果和價(jià)值。
2.2 測試結(jié)果與分析
在分析不同方法應(yīng)用效果的過程中,該研究將不同并發(fā)請求下,共享階段的信息丟失量作為評價(jià)指標(biāo),測試結(jié)果如表2所示。
從表2可以看出,在3種不同共享方法下,對應(yīng)的數(shù)據(jù)信息丟失量表現(xiàn)出了較為明顯的差異。其中,在屬性Logistic混沌映射方法下,當(dāng)并發(fā)請求數(shù)量達(dá)到30人次時(shí),開始出現(xiàn)信息丟失,信息丟失規(guī)模呈現(xiàn)出隨著并發(fā)請求數(shù)量增加穩(wěn)定增長的發(fā)展趨勢,當(dāng)并發(fā)請求數(shù)量達(dá)到100人次時(shí),信息丟失量達(dá)到了9條;在Fabric和屬性加密方法下,雖然當(dāng)并發(fā)請求數(shù)量達(dá)到50人次時(shí)才開始出現(xiàn)信息丟失情況,但是其發(fā)展較為迅速,當(dāng)并發(fā)請求數(shù)量達(dá)到100人次時(shí),信息丟失量達(dá)到了12條;在本文設(shè)計(jì)方法下,當(dāng)并發(fā)請求數(shù)量達(dá)到80人次時(shí)才開始出現(xiàn)信息丟失,并未出現(xiàn)明顯的爆發(fā)性增長。
測試結(jié)果表明,本文設(shè)計(jì)的高校產(chǎn)教融合平臺信息數(shù)據(jù)共享方法可以有效保障數(shù)據(jù)的安全。
3 結(jié)語
本文圍繞基于區(qū)塊鏈技術(shù)的高校產(chǎn)教融合平臺信息數(shù)據(jù)共享方法進(jìn)行了探討與設(shè)計(jì)。通過構(gòu)建信息數(shù)據(jù)共享共識機(jī)制,實(shí)現(xiàn)了參與主體間的高效協(xié)同與信任,為產(chǎn)教融合過程中的數(shù)據(jù)流通提供了有力保障?;趨^(qū)塊鏈技術(shù)的平臺信息數(shù)據(jù)共享方案,不僅提升了數(shù)據(jù)的安全性與透明度,還促進(jìn)了資源的優(yōu)化配置與高效利用。經(jīng)過嚴(yán)格的測試與分析,結(jié)果表明該方法具有可行性與有效性,展現(xiàn)了區(qū)塊鏈技術(shù)在推動高校產(chǎn)教融合深度發(fā)展方面的潛力。未來,隨著技術(shù)的不斷進(jìn)步與應(yīng)用的持續(xù)深化,基于區(qū)塊鏈的高校產(chǎn)教融合平臺將能夠進(jìn)一步發(fā)揮作用。
參考文獻(xiàn)
[1]陳雪,張路.公共信用信息中心數(shù)據(jù)處理的權(quán)力證成、利益協(xié)調(diào)與環(huán)節(jié)標(biāo)準(zhǔn)明確[J].征信,2024(7):14-22.
[2]張萌,牟冬梅,鄧君.基于SD模型的醫(yī)療機(jī)構(gòu)間醫(yī)療數(shù)據(jù)共享影響因素研究[J].現(xiàn)代情報(bào),2024(12):1-19.
[3]彭貽希,金燚,陳志德,等.聯(lián)盟鏈下的高效車聯(lián)網(wǎng)數(shù)據(jù)安全共享研究[J].情報(bào)探索,2024(7):49-55.
[4]劉云朋,張婷.數(shù)字政府背景下基于PDCA理論的政務(wù)大數(shù)據(jù)共享模型研究[J].中國信息化,2024(6):99-100,88.
[5]黃楊楊.屬性Logistic混沌映射下的物聯(lián)網(wǎng)隱私數(shù)據(jù)安全共享[J].現(xiàn)代電子技術(shù),2024(13):97-101.
[6]申童童,黃保華.基于Fabric和屬性加密的數(shù)據(jù)安全共享方案[J].廣西大學(xué)學(xué)報(bào)(自然科學(xué)版),2024(3):585-594.
[7]王伯超.第三次國土調(diào)查共享服務(wù)平臺數(shù)據(jù)銜接技術(shù)研究[J].測繪與空間地理信息,2024(6):155-158,163.
[8]陳曄婷,宋語嫣,朱銳,等.基于三方演化博弈的企業(yè)數(shù)據(jù)共享治理機(jī)制研究[J].經(jīng)濟(jì)管理學(xué)刊,2024(2):267-290.
[9]舒雨姍,唐偉忠,龐偉赟,等.基于Greenplum的鐵路數(shù)據(jù)共享平臺設(shè)計(jì)[J].鐵路計(jì)算機(jī)應(yīng)用,2024(6):57-66.
[10]劉晨磊,孫語蔚,王梓炫,等.基于區(qū)塊鏈的軟件定義網(wǎng)絡(luò)數(shù)據(jù)安全共享研究進(jìn)展[J].南京郵電大學(xué)學(xué)報(bào)(自然科學(xué)版),2024(21):1-19.
(編輯 王永超編輯)
Information and data sharing method of university industry-education integration platform
based on blockchain technology
XIE" Wenda
(Computer Engineering Technical College (Artificial
Intelligence College), Guangdong Polytechnic of Science and Technology, Zhuhai 519090, China)
Abstract:" Due to the connection loopholes in the transmission mechanism of information and data sharing stage, the security of data is difficult to be guaranteed. Therefore, the article proposes the research on the information and data sharing method of the university industry-education integration platform based on blockchain technology. In this study, an efficient and reliable consensus mechanism for data sharing was established by using practical Byzantine fault tolerance. In combination with blockchain technology and cosine similarity analysis, NC-CS node classification algorithm was used to realize information and data sharing on the university-production-education fusion platform. In the test results, when the number of concurrent requests reached 80, the information began to lose, and there was no obvious explosive growth.
Key words: blockchain technology; information and data sharing; practical Byzantine fault tolerance; cosine similarity; NC-CS node classification algorithm