摘要:工業(yè)遺產(chǎn)作為人類文明從農(nóng)業(yè)社會(huì)向工業(yè)時(shí)代轉(zhuǎn)型的核心見證,其保護(hù)與再生對(duì)延續(xù)城市文脈、推動(dòng)可持續(xù)發(fā)展具有戰(zhàn)略意義?,F(xiàn)聚焦數(shù)據(jù)確權(quán)技術(shù)在工業(yè)遺產(chǎn)數(shù)字化開發(fā)中的應(yīng)用機(jī)制,系統(tǒng)探討如何通過技術(shù)創(chuàng)新破解數(shù)字資源利用中的權(quán)屬困境。研究以建筑物點(diǎn)云數(shù)據(jù)確權(quán)為例,闡明技術(shù)流程,通過激光掃描獲取空間坐標(biāo)等多維數(shù)據(jù),經(jīng)特征提取、編碼后生成唯一哈希值,結(jié)合區(qū)塊鏈存證確保數(shù)據(jù)不可篡改。案例驗(yàn)證表明,廠房建筑點(diǎn)云數(shù)據(jù)經(jīng)MD5算法生成的數(shù)字指紋,可有效支持?jǐn)?shù)據(jù)溯源與公開驗(yàn)證。
近年來,我國工業(yè)遺產(chǎn)數(shù)字化保護(hù)和開發(fā)備受關(guān)注,區(qū)塊鏈、人工智能、云計(jì)算、大數(shù)據(jù)、互聯(lián)網(wǎng)等技術(shù)全面助力文化遺產(chǎn)數(shù)字化工作。但目前,仍存在數(shù)據(jù)孤島化、壁壘化以及地域文化屬性不足等問題?!稊?shù)字中國建設(shè)整體布局規(guī)劃》強(qiáng)調(diào)要加快構(gòu)建數(shù)據(jù)基礎(chǔ)制度,激活數(shù)據(jù)要素潛能,促進(jìn)數(shù)據(jù)要素價(jià)值有效釋放,增強(qiáng)經(jīng)濟(jì)發(fā)展新動(dòng)能,構(gòu)筑國家競(jìng)爭(zhēng)新優(yōu)勢(shì)[1]。數(shù)據(jù)作為繼土地、勞動(dòng)力、資本、技術(shù)之后的第五要素,日益融入文化內(nèi)容生產(chǎn)、運(yùn)營和流通的全環(huán)節(jié)與全鏈條[2]。以版權(quán)確權(quán)為核心的數(shù)據(jù)確權(quán)機(jī)制,可以推動(dòng)數(shù)據(jù)產(chǎn)權(quán)結(jié)構(gòu)性分置和有序流通,是推進(jìn)文化數(shù)字化戰(zhàn)略實(shí)施的重要措施。如何利用工業(yè)遺產(chǎn)確權(quán)數(shù)據(jù)賦能工業(yè)文化創(chuàng)新發(fā)展,成為亟待研究的工業(yè)遺產(chǎn)相關(guān)課題。
工業(yè)遺產(chǎn)數(shù)字確權(quán)的時(shí)代背景
國內(nèi)數(shù)字確權(quán)研究在政策驅(qū)動(dòng)下快速發(fā)展。中共中央、國務(wù)院印發(fā)的《數(shù)字中國建設(shè)整體布局規(guī)劃》及“數(shù)據(jù)二十條”強(qiáng)調(diào),要加快構(gòu)建數(shù)據(jù)基礎(chǔ)制度,激活數(shù)據(jù)要素潛能,促進(jìn)數(shù)據(jù)要素價(jià)值有效釋放,增強(qiáng)經(jīng)濟(jì)發(fā)展新動(dòng)能,構(gòu)筑國家競(jìng)爭(zhēng)新優(yōu)勢(shì)。孫寶林強(qiáng)調(diào),數(shù)據(jù)確權(quán)是解決數(shù)據(jù)要素市場(chǎng)化產(chǎn)生的交易安全與信任的關(guān)鍵,將數(shù)字文化產(chǎn)品納入知識(shí)產(chǎn)權(quán)體系中,實(shí)現(xiàn)數(shù)據(jù)價(jià)值的釋放和轉(zhuǎn)化[3]。《國家數(shù)據(jù)標(biāo)準(zhǔn)體系建設(shè)指南》明確提出文化遺產(chǎn)數(shù)據(jù)確權(quán)要求,敦煌研究院率先應(yīng)用區(qū)塊鏈技術(shù)對(duì)壁畫數(shù)字資源進(jìn)行哈希存證,為工業(yè)遺產(chǎn)領(lǐng)域提供了重要借鑒。工業(yè)遺產(chǎn)作為人類文明演進(jìn)的關(guān)鍵物質(zhì)見證,承載著從傳統(tǒng)農(nóng)業(yè)社會(huì)向現(xiàn)代工業(yè)文明轉(zhuǎn)型的歷史記憶[4]。然而,工業(yè)遺產(chǎn)數(shù)字化確權(quán)仍面臨獨(dú)特挑戰(zhàn)。其一,數(shù)據(jù)復(fù)雜度高,機(jī)械圖紙、工藝流程檔案等非結(jié)構(gòu)化數(shù)據(jù)占比超過60%,傳統(tǒng)確權(quán)方案適配性不足;其二,多方協(xié)作需求迫切,政府、企業(yè)與社區(qū)間的權(quán)責(zé)劃分缺乏制度化設(shè)計(jì)。針對(duì)上述問題,清華大學(xué)團(tuán)隊(duì)提出“文化遺產(chǎn)數(shù)字共同體”概念,試圖通過智能合約實(shí)現(xiàn)自動(dòng)化權(quán)益分配,但其在工業(yè)遺產(chǎn)場(chǎng)景中的實(shí)踐驗(yàn)證仍待深化[5]。目前,首個(gè)國家工業(yè)遺產(chǎn)工業(yè)文化數(shù)字藏品“上海船廠”上線,該數(shù)字藏品應(yīng)用了三維建模、區(qū)塊鏈技術(shù),并通過小程序進(jìn)行展示。
數(shù)據(jù)確權(quán)對(duì)工業(yè)遺產(chǎn)數(shù)字化戰(zhàn)略的重要意義
在數(shù)字技術(shù)飛速發(fā)展的當(dāng)下,文化資源數(shù)字化已成為推動(dòng)文化產(chǎn)業(yè)轉(zhuǎn)型升級(jí)、提升文化傳播效能的關(guān)鍵力量。數(shù)據(jù)確權(quán)作為工業(yè)遺產(chǎn)數(shù)字化進(jìn)程中不可或缺的基礎(chǔ)環(huán)節(jié),從權(quán)利來源、流轉(zhuǎn)、保護(hù)等維度,為工業(yè)遺產(chǎn)數(shù)字化戰(zhàn)略的順利實(shí)施提供了全方位的支撐。
夯實(shí)工業(yè)遺產(chǎn)數(shù)字化的產(chǎn)權(quán)基石
數(shù)據(jù)確權(quán),是明確數(shù)據(jù)要素資源權(quán)利內(nèi)容、類型及權(quán)屬關(guān)系的關(guān)鍵過程[6]。這一過程包含兩個(gè)核心層面。其一,精準(zhǔn)識(shí)別數(shù)據(jù)權(quán)利主體,解決“誰擁有數(shù)據(jù)”的問題;其二,清晰界定權(quán)利內(nèi)容,明確權(quán)利人的具體權(quán)益范圍。文化資源數(shù)字化廣泛融合了學(xué)術(shù)理論、新聞出版、文化旅游等領(lǐng)域的文化資源,涵蓋文字、圖片、音視頻等形態(tài)的數(shù)據(jù)[7]。隨著工業(yè)遺產(chǎn)數(shù)字化進(jìn)程的加速,海量文化數(shù)據(jù)資源不斷涌現(xiàn)。然而,當(dāng)前工業(yè)遺產(chǎn)數(shù)據(jù)產(chǎn)權(quán)模糊、確權(quán)困難等問題,嚴(yán)重制約了文化數(shù)據(jù)要素的有效形成和價(jià)值挖掘。只有明確了文化數(shù)據(jù)的權(quán)屬,才能夯實(shí)產(chǎn)權(quán)基礎(chǔ),促進(jìn)數(shù)據(jù)的授權(quán)交易與市場(chǎng)化流轉(zhuǎn),釋放數(shù)據(jù)的潛在價(jià)值。
激發(fā)文化數(shù)據(jù)要素市場(chǎng)活力
從權(quán)利流轉(zhuǎn)與配置的角度看,數(shù)據(jù)確權(quán)是數(shù)據(jù)資源交易授權(quán)與流轉(zhuǎn)的核心依據(jù),將為工業(yè)遺產(chǎn)數(shù)字化帶來顯著的流量紅利和市場(chǎng)活力。數(shù)據(jù)資源的交易與流通,必須以清晰的權(quán)屬關(guān)系為前提。通過數(shù)據(jù)確權(quán),能夠?yàn)閿?shù)據(jù)資源提供具有公信力的權(quán)屬證明,理順數(shù)據(jù)生產(chǎn)者、所有者和使用者之間的權(quán)利關(guān)系,有效激發(fā)數(shù)據(jù)要素市場(chǎng)的潛力,促進(jìn)數(shù)據(jù)資源的高效配置與流通[8]。因此,數(shù)據(jù)確權(quán)是解決數(shù)據(jù)要素市場(chǎng)化過程中交易安全與信任問題的關(guān)鍵所在。同時(shí),只有明確了數(shù)據(jù)權(quán)屬,才能對(duì)工業(yè)遺產(chǎn)進(jìn)行科學(xué)估值,實(shí)現(xiàn)數(shù)據(jù)資源向數(shù)據(jù)資產(chǎn)的轉(zhuǎn)化,并開展數(shù)據(jù)資產(chǎn)的授權(quán)交易,推動(dòng)數(shù)據(jù)價(jià)值的釋放與轉(zhuǎn)化。
保障數(shù)據(jù)資源安全
在權(quán)利保護(hù)與維護(hù)方面,數(shù)據(jù)確權(quán)是數(shù)據(jù)資源運(yùn)營、開發(fā)和使用的重要保障,為工業(yè)遺產(chǎn)數(shù)字化的實(shí)施提供了堅(jiān)實(shí)支撐。數(shù)據(jù)資源具有重要的財(cái)產(chǎn)屬性和市場(chǎng)價(jià)值,但在互聯(lián)網(wǎng)環(huán)境下,數(shù)據(jù)的易復(fù)制性和低侵權(quán)成本,使數(shù)據(jù)權(quán)益面臨嚴(yán)峻挑戰(zhàn)。數(shù)據(jù)權(quán)利歸屬不清晰,是導(dǎo)致數(shù)據(jù)領(lǐng)域舉證難、維權(quán)難的根本原因[9]。通過數(shù)據(jù)確權(quán),能夠?yàn)楣I(yè)遺產(chǎn)的數(shù)據(jù)保護(hù)、數(shù)據(jù)管理和數(shù)據(jù)要素市場(chǎng)化配置提供有力保障。
工業(yè)遺產(chǎn)數(shù)字確權(quán)的基本方法
數(shù)據(jù)采集
點(diǎn)云數(shù)據(jù)(point cloud data)是工業(yè)遺產(chǎn)數(shù)據(jù)確權(quán)的基礎(chǔ)。點(diǎn)云數(shù)據(jù)是指在一個(gè)三維坐標(biāo)系統(tǒng)中的一組向量的集合。掃描資料以點(diǎn)的形式記錄,每一個(gè)點(diǎn)包含有三維坐標(biāo),并且可以攜帶有關(guān)該點(diǎn)屬性的其他信息,如顏色、反射率、強(qiáng)度等,通常由激光掃描儀、相機(jī)、三維掃描儀等設(shè)備獲取,并以大量離散點(diǎn)的坐標(biāo)及相關(guān)屬性來描述建筑的外觀、結(jié)構(gòu)等特征,其數(shù)據(jù)主要包括以下幾方面。
坐標(biāo)信息。建筑點(diǎn)云數(shù)據(jù)中的每個(gè)點(diǎn)都包含三維坐標(biāo)值(X,Y,Z),精確地表示了該點(diǎn)在空間中的位置,如建筑的墻角點(diǎn)、門窗邊框點(diǎn)、屋頂邊緣點(diǎn)等的坐標(biāo),通過這些坐標(biāo)能構(gòu)建出建筑的基本框架和輪廓。
強(qiáng)度信息。激光反射回波的強(qiáng)度也會(huì)被記錄下來,不同的建筑材料對(duì)激光的反射強(qiáng)度不同,如金屬材質(zhì)的反射強(qiáng)度較高,而玻璃、木材等材質(zhì)的反射強(qiáng)度相對(duì)較低。根據(jù)強(qiáng)度信息可以在一定程度上區(qū)分建筑的不同材質(zhì)部分。
顏色信息。部分先進(jìn)的激光掃描設(shè)備或多源數(shù)據(jù)融合技術(shù)還能為每個(gè)點(diǎn)賦予顏色值(R,G,B),使點(diǎn)云數(shù)據(jù)呈現(xiàn)出建筑的真實(shí)色彩,更直觀地反映建筑的外觀特征,如建筑墻面的顏色、裝飾線條的色彩等。
法向量信息。法向量描述了每個(gè)點(diǎn)在其所在表面的法線方向,它對(duì)于分析建筑表面的朝向、曲率等幾何特性非常重要。例如,在分析建筑的曲面屋頂或傾斜墻面時(shí),法向量能幫助確定表面的方向和變化趨勢(shì)。
生成數(shù)字指紋
數(shù)字指紋在區(qū)塊鏈上的生成和驗(yàn)證過程基于哈希函數(shù)和Merkle樹等數(shù)據(jù)結(jié)構(gòu),確保數(shù)據(jù)的完整性和真實(shí)性。通過為數(shù)據(jù)生成唯一的哈希值(數(shù)字指紋),并將其存儲(chǔ)在區(qū)塊鏈上,可以實(shí)現(xiàn)對(duì)數(shù)據(jù)的不可篡改和可驗(yàn)證性。這為版權(quán)保護(hù)、數(shù)據(jù)完整性驗(yàn)證等領(lǐng)域提供了強(qiáng)大的技術(shù)支撐。哈希(hash)算法是實(shí)現(xiàn)信息完整性的有效方法,是工業(yè)遺產(chǎn)數(shù)據(jù)確權(quán)的重要技術(shù)手段。Hash算法可以將數(shù)據(jù)轉(zhuǎn)換為一個(gè)標(biāo)志,這個(gè)標(biāo)志和源數(shù)據(jù)的每個(gè)字節(jié)都緊密相關(guān),難以找到逆向規(guī)律[10]。使用Hash算法不僅能提高存儲(chǔ)空間的利用率和數(shù)據(jù)的查詢效率,還可用作數(shù)字簽名,增強(qiáng)數(shù)據(jù)傳遞的安全性,并且能夠快速地對(duì)給定的點(diǎn)云數(shù)據(jù)計(jì)算出哈希值,具有較高效率。
1.點(diǎn)云特征提取
從點(diǎn)云數(shù)據(jù)中提取有代表性的特征,這些特征應(yīng)該能夠捕捉點(diǎn)云的關(guān)鍵信息,如幾何特征、拓?fù)涮卣鞯?。常見的特征包括點(diǎn)的坐標(biāo)、法向量、曲率、點(diǎn)云的局部密度等。
①計(jì)算點(diǎn)云的質(zhì)心:
②計(jì)算每個(gè)點(diǎn)到質(zhì)心的距離:,
③計(jì)算點(diǎn)云的平均距離:
2.特征編碼
將提取的特征進(jìn)行編碼,轉(zhuǎn)化為數(shù)字向量或矩陣的形式,以便計(jì)算機(jī)進(jìn)行處理和比較。編碼方式可以根據(jù)具體的算法和需求進(jìn)行選擇。例如,使用主成分分析(PCA)將特征投影到低維空間,或者使用哈希函數(shù)將特征映射為固定長度的哈希值。將質(zhì)心坐標(biāo)和平均距離組成一個(gè)特征向量:。
3.生成數(shù)據(jù)指紋
根據(jù)編碼后的特征,通過特定算法生成唯一的數(shù)字指紋。可以簡單地將編碼后的特征進(jìn)行串聯(lián)、求和,或使用更復(fù)雜的加密算法計(jì)算,最終得到一個(gè)固定長度的數(shù)字序列作為點(diǎn)云數(shù)據(jù)的指紋。使用簡單的哈希函數(shù),如將特征向量的每個(gè)元素乘以一個(gè)固定的系數(shù),求和并取整,得到一個(gè)整數(shù)值作為指紋。
實(shí)際應(yīng)用中,點(diǎn)云數(shù)據(jù)會(huì)更復(fù)雜,特征提取和編碼的方法也會(huì)更高級(jí)和多樣化,可能會(huì)使用到機(jī)器學(xué)習(xí)中的深度學(xué)習(xí)模型自動(dòng)提取更復(fù)雜的特征,再通過專門的哈希算法或加密技術(shù)生成更安全、更唯一的數(shù)字指紋。
工業(yè)遺產(chǎn)數(shù)字確權(quán)實(shí)證示例
數(shù)字指紋的生成
本文以確權(quán)對(duì)象為一個(gè)簡易三層廠房A為例。確權(quán)對(duì)象尺寸為長20米,寬15米,每層高3米。使用激光掃描儀對(duì)其進(jìn)行掃描獲取點(diǎn)云數(shù)據(jù),如下表。
以表中點(diǎn)云數(shù)據(jù)為基礎(chǔ)使用MD5生成哈希值,將上述點(diǎn)位坐標(biāo)數(shù)據(jù)按圖表從左到右順序整理成相應(yīng)字符串,再利用Python中的MD5庫函數(shù)計(jì)算哈希值。在下述代碼中,首先定義了包含點(diǎn)云數(shù)據(jù)的列表points,每個(gè)點(diǎn)包含名稱(name)和坐標(biāo)(coordinates)字段,由于未獲取到強(qiáng)度信息的定義與數(shù)據(jù),因此未對(duì)強(qiáng)度信息相關(guān)數(shù)據(jù)進(jìn)行整理。其次,通過雙重for循環(huán)將points列表坐標(biāo)數(shù)據(jù)取出,并將名稱和坐標(biāo)組合成一個(gè)字符串,通過不停的疊加進(jìn)而形成一個(gè)完整的字符串。再次,使用Python的hashlib.md5()創(chuàng)建MD5哈希對(duì)象,并使用update方法將字符串pointstr的字節(jié)流(通過encode('utf-8')轉(zhuǎn)換)傳入。最后,通過hexdigest方法獲取計(jì)算得到的哈希值,并將其打印輸出。最終,上述代碼計(jì)算出的哈希值為:f39d86d8967c25699959a4677c67c376,這個(gè)哈希值在一定程度上可以作為廠房A數(shù)字指紋(如圖)。本文因篇幅有限,未納入對(duì)象的強(qiáng)度信息、色彩信息、法向量信息,這些信息可以參考上述方法一并生成哈希值。
圖 使用 MD5 生成哈希值全過程(Python界面截圖)
值得注意的是,不同編程語言計(jì)算MD5哈希值的方式可能略有不同,每次運(yùn)行結(jié)果可能因數(shù)據(jù)順序等因素略有不同。但基本原理都是將數(shù)據(jù)轉(zhuǎn)換為字節(jié)流后輸入到MD5算法中進(jìn)行計(jì)算,計(jì)算得到32位十六進(jìn)制字符串,哈希值可以作為廠房A點(diǎn)云數(shù)據(jù)的數(shù)字指紋,用于數(shù)據(jù)的標(biāo)識(shí)、驗(yàn)證和比對(duì)等操作。
數(shù)字指紋的使用
區(qū)塊鏈存證。將哈希值存儲(chǔ)在區(qū)塊鏈上。由于區(qū)塊鏈的去中心化、不可篡改等特性,一旦哈希值被記錄在區(qū)塊鏈上,就可以確保其真實(shí)性和完整性。任何人都可以查看區(qū)塊鏈上的哈希值記錄,驗(yàn)證廠房A點(diǎn)云數(shù)據(jù)的存證情況,從而提高存證的透明度。其他用戶可以通過獲取原始數(shù)據(jù)并計(jì)算哈希值,與區(qū)塊鏈上的哈希值進(jìn)行對(duì)比,以驗(yàn)證數(shù)據(jù)是否與存證時(shí)一致,確保數(shù)據(jù)未被非法修改。
數(shù)據(jù)溯源。結(jié)合時(shí)間戳等信息,哈希值可以用于數(shù)據(jù)溯源。每當(dāng)廠房A點(diǎn)云數(shù)據(jù)發(fā)生變化或進(jìn)行存證操作時(shí),都會(huì)生成一個(gè)新的哈希值,并記錄相應(yīng)的時(shí)間戳。通過查看哈希值的變化序列和對(duì)應(yīng)的時(shí)間戳,可以清晰了解數(shù)據(jù)的變更歷史和存證時(shí)間順序,使數(shù)據(jù)的來源和演變過程透明可查。這有助于追蹤數(shù)據(jù)的更新情況,明確數(shù)據(jù)在不同時(shí)間點(diǎn)的狀態(tài),為廠房A數(shù)據(jù)的管理和審計(jì)提供有力支持。
公開驗(yàn)證。將哈希值公開在特定的平臺(tái)或數(shù)據(jù)庫中,供相關(guān)方進(jìn)行驗(yàn)證。廠房A項(xiàng)目的參與方、監(jiān)管機(jī)構(gòu)或其他感興趣的人員都可以獲取哈希值,并通過計(jì)算原始數(shù)據(jù)的哈希值驗(yàn)證數(shù)據(jù)的一致性。這種公開驗(yàn)證的方式增加了存證的透明度,使得數(shù)據(jù)的存儲(chǔ)和使用處于各方的監(jiān)督之下,減少了數(shù)據(jù)被篡改或偽造的可能性,保障了廠房A數(shù)據(jù)存證的可信度和公正性。
數(shù)據(jù)確權(quán)作為工業(yè)遺產(chǎn)數(shù)字化戰(zhàn)略的核心機(jī)制,在權(quán)利界定、流轉(zhuǎn)配置與安全保護(hù)中發(fā)揮關(guān)鍵作用。一是可以起到產(chǎn)權(quán)基石作用。通過精準(zhǔn)識(shí)別數(shù)據(jù)主體與權(quán)益范圍,破解“數(shù)據(jù)孤島”困境,為文化數(shù)據(jù)市場(chǎng)化提供法律保障。二是具備市場(chǎng)激活價(jià)值。依托區(qū)塊鏈與智能合約技術(shù),構(gòu)建“數(shù)據(jù)—資產(chǎn)—價(jià)值”轉(zhuǎn)化鏈條,釋放工業(yè)遺產(chǎn)的文化與經(jīng)濟(jì)潛能。同時(shí),數(shù)據(jù)確權(quán)存在一些技術(shù)實(shí)踐挑戰(zhàn),如需攻克非結(jié)構(gòu)化數(shù)據(jù)確權(quán)適配性、跨鏈互通性等難題,推動(dòng)標(biāo)準(zhǔn)化體系與協(xié)作機(jī)制建設(shè)等。
未來,應(yīng)深化“文化遺產(chǎn)數(shù)字共同體”理論,探索多方協(xié)同治理模式。開發(fā)面向工業(yè)遺產(chǎn)的專用確權(quán)工具(如AI驅(qū)動(dòng)的異構(gòu)數(shù)據(jù)解析算法)。構(gòu)建“文化—技術(shù)—政策”三位一體的數(shù)字版權(quán)治理生態(tài)。數(shù)據(jù)確權(quán)不僅是技術(shù)命題,更是文化再生的戰(zhàn)略引擎。通過制度創(chuàng)新與技術(shù)突破,工業(yè)遺產(chǎn)將從“沉睡的檔案”轉(zhuǎn)化為“活化的文化資產(chǎn)”,為數(shù)字中國建設(shè)注入可持續(xù)的文化動(dòng)能。
本文為2023年安徽省社科規(guī)劃項(xiàng)目“皖江流域工業(yè)遺產(chǎn)數(shù)字化保護(hù)與應(yīng)用”(AHSKYY2023D040)階段性成果之一。
(作者單位:安徽工業(yè)大學(xué)藝術(shù)與設(shè)計(jì)學(xué)院)