數(shù)據(jù)要素化是數(shù)字中國(guó)建設(shè)尤其是數(shù)字經(jīng)濟(jì)發(fā)展過程中出現(xiàn)的經(jīng)濟(jì)領(lǐng)域概念,其核心在于實(shí)現(xiàn)從數(shù)據(jù)到數(shù)據(jù)要素的轉(zhuǎn)化,這一過程一般被分為三個(gè)階段:數(shù)據(jù)資源化、數(shù)據(jù)資產(chǎn)化、數(shù)據(jù)資本化[1]或者數(shù)據(jù)資源化、資源要素化、要素價(jià)值化[2]??傊?,其核心目標(biāo)都是通過優(yōu)化數(shù)據(jù)全生命周期(包括采集、處理、分析、應(yīng)用等)流程,深度挖掘數(shù)據(jù)的經(jīng)濟(jì)與社會(huì)價(jià)值,進(jìn)而達(dá)成數(shù)據(jù)資源的資產(chǎn)化與價(jià)值化管理。[3]
隨著《數(shù)據(jù)要素 × ”三年行動(dòng)計(jì)劃(2024一2026年)》的發(fā)布,我國(guó)數(shù)據(jù)要素化進(jìn)程加速,推動(dòng)了檔案學(xué)界圍繞數(shù)據(jù)要素價(jià)值、檔案數(shù)字轉(zhuǎn)型等議題的深入研究。截至2025年4月底,筆者以“檔案”和“數(shù)據(jù)要素”為主題詞,通過CNKI學(xué)術(shù)搜索獲取相關(guān)文章50篇。主要研究?jī)?nèi)容已形成三個(gè)向度:一是檔案數(shù)據(jù)要素化的理論探討與基礎(chǔ)研究。如周文泓[4]從數(shù)據(jù)要素化的宏觀背景出發(fā),探討了檔案領(lǐng)域與數(shù)據(jù)要素化的關(guān)系,強(qiáng)調(diào)檔案領(lǐng)域需要深刻洞察并充分理解數(shù)據(jù)要素化,并提出了檔案領(lǐng)域應(yīng)如何融入數(shù)據(jù)要素化的關(guān)鍵議題;許曉彤[5]則從歷史源流的角度分析了檔案數(shù)據(jù)要素化的演變,明確了檔案數(shù)據(jù)要素化的相關(guān)概念,探索了檔案數(shù)據(jù)要素化的價(jià)值空間與發(fā)展方向。二是檔案數(shù)據(jù)要素價(jià)值內(nèi)涵、實(shí)現(xiàn)與價(jià)值鏈模型等。如楊鵬[6從檔案數(shù)據(jù)的基本屬性與運(yùn)行特征出發(fā),探索了檔案數(shù)據(jù)要素價(jià)值的概念內(nèi)涵、功能特征等理論基礎(chǔ),并歸納總結(jié)了檔案數(shù)據(jù)要素價(jià)值實(shí)現(xiàn)的規(guī)律與方式;楊智勇[]通過借鑒企業(yè)價(jià)值鏈理論,提出了檔案數(shù)據(jù)價(jià)值的實(shí)現(xiàn)框架,明晰影響檔案數(shù)據(jù)價(jià)值實(shí)現(xiàn)的具體因素。三是檔案數(shù)據(jù)要素流通以及可能面臨的分級(jí)分類、隱私和確權(quán)問題等。如蘇會(huì)靈[8提出檔案數(shù)據(jù)要素化需要滿足的必要條件,并分析了檔案數(shù)據(jù)流通中的關(guān)鍵問題與對(duì)策;付虓°則探討了數(shù)據(jù)要素流通對(duì)檔案分級(jí)分類管理提出的新要求,以及傳統(tǒng)分類方法的靜態(tài)封閉屬性與數(shù)據(jù)環(huán)境的開放動(dòng)態(tài)特征之間的矛盾。
上述研究成果雖為檔案數(shù)據(jù)要素化轉(zhuǎn)型提供了初步理論框架,但聚焦高校融媒體檔案這一特殊場(chǎng)景的研究仍顯不足,缺乏對(duì)多模態(tài)數(shù)據(jù)要素轉(zhuǎn)化規(guī)律的深度解析,且尚未構(gòu)建適配高等教育場(chǎng)景的要素流通模型,導(dǎo)致數(shù)據(jù)價(jià)值釋放路徑模糊。這種理論滯后性與高校融媒體檔案管理實(shí)踐的發(fā)展形成鮮明反差。隨著媒體融合的深人推進(jìn),高校已形成涵蓋官網(wǎng)、微博、微信、抖音、B站等新興媒體與電視、廣播、報(bào)刊等傳統(tǒng)媒體的“融媒體”矩陣。通過現(xiàn)代信息技術(shù)整合這些媒體資源最終形成的融媒體檔案,包含了文字、圖片、音頻、視頻等多種表現(xiàn)形式。如何將數(shù)據(jù)要素化的實(shí)現(xiàn)邏輯嵌人高校融媒體檔案管理場(chǎng)景,破解多模態(tài)數(shù)據(jù)整合、跨學(xué)科價(jià)值挖掘等實(shí)踐難題,成為當(dāng)下研究的關(guān)鍵。本文以東南大學(xué)為例,通過解析其在數(shù)據(jù)采集、治理、應(yīng)用等方面面臨的問題瓶頸,探索融媒體檔案從“資源”到“要素”的轉(zhuǎn)型路徑,以期構(gòu)建適配高校特性的要素化轉(zhuǎn)型框架,填補(bǔ)現(xiàn)有研究的不足。
1轉(zhuǎn)型基礎(chǔ):東南大學(xué)融媒體檔案管理的典型實(shí)踐探索
1.1國(guó)內(nèi)外高校融媒體檔案管理的實(shí)踐現(xiàn)狀
當(dāng)前,國(guó)內(nèi)外高校融媒體檔案管理的實(shí)踐聚焦于網(wǎng)頁(yè)與社交媒體歸檔,且將這兩類檔案分開界定與管理,尚未形成統(tǒng)一的融媒體檔案管理理論框架。國(guó)外方面,以歐美高校為代表,多數(shù)依托美國(guó)互聯(lián)網(wǎng)檔案館(InternetArchive)開展網(wǎng)頁(yè)歸檔技術(shù)標(biāo)準(zhǔn)化探索。例如哈佛大學(xué)圖書館、加州大學(xué)洛杉磯分校圖書館等合作的網(wǎng)頁(yè)歸檔協(xié)作平臺(tái)“Cobweb”。此外,密歇根大學(xué)在網(wǎng)頁(yè)歸檔項(xiàng)目中增加了“博客和社交媒體”專題;杜克大學(xué)檔案館在“大學(xué)檔案館網(wǎng)絡(luò)收藏”項(xiàng)目中有選擇地添加Twitter、Facebook和Instagram等社交媒體內(nèi)容。[10]但這些實(shí)踐場(chǎng)景局限于圖文社交媒體與傳統(tǒng)網(wǎng)頁(yè)的靜態(tài)資源整合,缺乏對(duì)交互式內(nèi)容以及實(shí)時(shí)動(dòng)態(tài)內(nèi)容等的抓取。國(guó)內(nèi)方面,早期實(shí)踐以北京大學(xué)的“中國(guó)Web信息博物館”和國(guó)家圖書館的“網(wǎng)絡(luò)信息資源采集與保存試驗(yàn)項(xiàng)目”(WebInformationCollectionandPreservation,簡(jiǎn)稱WICP)為引l領(lǐng),并逐步在高校中擴(kuò)展。經(jīng)調(diào)研,近年來重慶大學(xué)、西南大學(xué)、天津大學(xué)、哈爾濱工業(yè)大學(xué)、西南財(cái)經(jīng)大學(xué)等高校紛紛開展融媒體檔案歸檔,但其數(shù)據(jù)規(guī)模有限,僅對(duì)校園官網(wǎng)主頁(yè)欄目以及學(xué)校微信主公眾號(hào)進(jìn)行歸檔,對(duì)二級(jí)單位網(wǎng)站以及抖音、B站等新興媒體的覆蓋能力不足。
1.2東南大學(xué)的典型實(shí)踐探索
相較于上述國(guó)內(nèi)外其他高校的實(shí)踐,東南大學(xué)在數(shù)據(jù)規(guī)模、制度創(chuàng)新與技術(shù)應(yīng)用等方面成為國(guó)內(nèi)高校融媒體檔案管理的先行者。通過資源整合、標(biāo)準(zhǔn)治理與服務(wù)創(chuàng)新,率先構(gòu)建了覆蓋多源媒體、貫通全生命周期的融媒體檔案管理體系,為數(shù)據(jù)要素化轉(zhuǎn)型奠定了堅(jiān)實(shí)的基礎(chǔ)
(1)資源整合:“主動(dòng) + 被動(dòng)”雙軌采集機(jī)制
一方面,進(jìn)行校內(nèi)平臺(tái)全量主動(dòng)歸檔。依托智慧校園網(wǎng)站群平臺(tái),實(shí)現(xiàn)官網(wǎng)主站及100余個(gè)二級(jí)單位網(wǎng)站(涵蓋院系、職能部門、重點(diǎn)實(shí)驗(yàn)室等)的實(shí)時(shí)主動(dòng)歸檔與自動(dòng)更新。截至2025年4月底,累計(jì)歸檔數(shù)據(jù)95萬余條,日均新增500余條。另一方面,實(shí)行校外網(wǎng)站及自媒體平臺(tái)定向被動(dòng)抓取。以網(wǎng)站群平臺(tái)歸檔的轉(zhuǎn)載鏈接為準(zhǔn),定向抓取校外媒體相關(guān)新聞及微博、微信、抖音、B站等官方自媒體內(nèi)容。通過多種技術(shù)適配結(jié)合,突破平臺(tái)內(nèi)容與格式限制,如抖音MP4視頻解析、微信公眾號(hào)SVG內(nèi)容提取等,截至2025年4月底,累計(jì)歸檔校外媒體及官方自媒體數(shù)據(jù)7萬余條。
(2)標(biāo)準(zhǔn)治理:數(shù)據(jù)規(guī)范性與質(zhì)量保障
依據(jù)國(guó)家相關(guān)標(biāo)準(zhǔn)規(guī)范制定《東南大學(xué)網(wǎng)站網(wǎng)頁(yè)歸檔管理辦法》,明確歸檔范圍涵蓋中英文主站、二級(jí)單位網(wǎng)站(包括院系、職能部門、重點(diǎn)實(shí)驗(yàn)室等)校外媒體站點(diǎn)及官方微博、微信等平臺(tái)。內(nèi)容包括文本內(nèi)容(純文本)可視內(nèi)容(可視化圖像、HTML布局與樣式表等)多媒體資源(圖片、音視頻)及元數(shù)據(jù)(文件題名、網(wǎng)站名稱、網(wǎng)址、欄目、責(zé)任者、發(fā)布時(shí)間、最后修改時(shí)間等20項(xiàng)字段),并規(guī)定了歸檔文件的通用格式,如HTML、JPG、MP4等。「11]同時(shí)通過“四性檢測(cè)”機(jī)制強(qiáng)化融媒體檔案的全流程質(zhì)量管控,以制度和技術(shù)確保檔案資源的規(guī)范性與可靠性。
(3)服務(wù)創(chuàng)新:從數(shù)據(jù)關(guān)聯(lián)到智能賦能
東南大學(xué)以“校園新聞知識(shí)圖譜”為知識(shí)服務(wù)突破口,基于1992年至2023年評(píng)選出的校園十大新聞,通過AI技術(shù)對(duì)館藏的90多萬條融媒體檔案數(shù)據(jù)進(jìn)行智能分類,提取事件、人物、機(jī)構(gòu)、學(xué)科、榮譽(yù)等核心實(shí)體,構(gòu)建了“實(shí)體一關(guān)系一屬性”三元模型;依托館藏檔案資源和互聯(lián)網(wǎng)數(shù)據(jù)資源(包括圖片、文檔、音視頻、網(wǎng)絡(luò)資源等各種形式),構(gòu)建了涵蓋十大新聞圖譜、單新聞圖譜、機(jī)構(gòu)關(guān)系網(wǎng)狀圖譜、新聞分類各年度圖譜等多類型、多層級(jí)的知識(shí)網(wǎng)絡(luò)。在此基礎(chǔ)上,東南大學(xué)構(gòu)建了多模態(tài)檢索系統(tǒng),包括全文檢索、關(guān)鍵詞檢索、字段組合篩選等;提供關(guān)聯(lián)導(dǎo)航,用戶可以通過點(diǎn)擊圖譜節(jié)點(diǎn)查看詳情并鏈接到關(guān)聯(lián)新聞,例如點(diǎn)擊節(jié)點(diǎn)上的某教授可以查看其歷年獲獎(jiǎng)記錄及科研成果的相關(guān)新聞。此外,通過多維交互的動(dòng)態(tài)圖表實(shí)現(xiàn)直觀的數(shù)據(jù)動(dòng)態(tài)可視化分析,如年度新聞分類占比圖、各類新聞年度變化趨勢(shì)圖、機(jī)構(gòu)合作頻次熱力圖等,有效提高了用戶對(duì)數(shù)據(jù)的理解和洞察力,初步實(shí)現(xiàn)了高校融媒體檔案服務(wù)從“被動(dòng)查詢”向“主動(dòng)賦能”的范式轉(zhuǎn)型。
2困境解析:數(shù)據(jù)要素化轉(zhuǎn)型的核心障礙
東南大學(xué)在融媒體檔案管理領(lǐng)域雖取得了一定的成果,但在數(shù)據(jù)要素化背景下仍面臨多重挑戰(zhàn),這些問題嚴(yán)重制約了檔案數(shù)據(jù)從“資源保管”向“要素賦能”的躍遷。
2.1數(shù)據(jù)資源缺陷,安全風(fēng)險(xiǎn)突出
數(shù)據(jù)要素化進(jìn)程需要各類檔案數(shù)據(jù)資源向可流通、可交易的數(shù)據(jù)要素高效轉(zhuǎn)化,其中數(shù)據(jù)資源的集成化管理是首要環(huán)節(jié)。隨著信息技術(shù)的發(fā)展和宣傳工作的不斷拓展,平臺(tái)、賬號(hào)數(shù)量不斷增加,平臺(tái)異構(gòu)性與技術(shù)壁壘導(dǎo)致數(shù)據(jù)采集存在明顯盲區(qū)。不同平臺(tái)內(nèi)容與格式的差異,使得技術(shù)實(shí)現(xiàn)復(fù)雜度提高,例如動(dòng)態(tài)媒體(如直播、彈幕、瀑布流等)交互式內(nèi)容(如H5頁(yè)面)圖文混排(如小紅書)等難以歸檔。東南大學(xué)在實(shí)踐過程中雖已實(shí)現(xiàn)絕大部分融媒體檔案的歸檔,但在新興媒體形態(tài)與原生用戶生成內(nèi)容(UGC)的采集上仍面臨嚴(yán)峻挑戰(zhàn)。不同自媒體平臺(tái)內(nèi)容存在差異,采集過程中面臨著不同的技術(shù)難點(diǎn)(見表1),大大提高了技術(shù)適配復(fù)雜性。例如,僅能抓取微博、微信、抖音和B站等自媒體平臺(tái)上的官網(wǎng)轉(zhuǎn)發(fā)信息,未能覆蓋平臺(tái)的歷史消息以及小紅書、視頻號(hào)等,直播、H5頁(yè)面等交互式內(nèi)容以及用戶評(píng)論、彈幕等也未被納入歸檔范圍。此外,多平臺(tái)交叉發(fā)布與迭代更新機(jī)制缺失,導(dǎo)致數(shù)據(jù)冗余與質(zhì)量受損。例如,重要新聞會(huì)同時(shí)在多個(gè)平臺(tái)、網(wǎng)站和欄目發(fā)布,信息可能會(huì)在修改后多次歸檔,目前僅能依據(jù)“網(wǎng)站名稱”“欄目路徑”“最后修改時(shí)間”等字段區(qū)分,因此需進(jìn)行清洗、去重、校驗(yàn)等處理,對(duì)技術(shù)的依賴性大大增加。
然而,數(shù)據(jù)要素化加速了技術(shù)環(huán)境的快速演變,例如出現(xiàn)新的編碼標(biāo)準(zhǔn)、文件格式等,技術(shù)適配的復(fù)雜性直接增加了格式轉(zhuǎn)換或數(shù)據(jù)遷移風(fēng)險(xiǎn)。同時(shí),數(shù)據(jù)要素化要求部分檔案信息公開以促進(jìn)數(shù)據(jù)流通和利用,這就使得檔案信息的共享和敏感信息保護(hù)之間具有一種矛盾的關(guān)系。[2]高校融媒體檔案涉及職稱評(píng)定、發(fā)展對(duì)象、獲獎(jiǎng)人員、獎(jiǎng)學(xué)金人員、助學(xué)金人員的通知、公告、公示,附件中可能會(huì)包含學(xué)生學(xué)籍信息、師生身份證號(hào)碼、銀行卡號(hào)、手機(jī)號(hào)、家庭住址等,也可能會(huì)涉及學(xué)術(shù)創(chuàng)新、科技前沿、知識(shí)產(chǎn)權(quán)或發(fā)展戰(zhàn)略等敏感信息,如科研項(xiàng)目的研究進(jìn)展、財(cái)務(wù)數(shù)據(jù)等。特別是當(dāng)多個(gè)公
表1不同自媒體平臺(tái)內(nèi)容及采集技術(shù)難點(diǎn)
開的檔案數(shù)據(jù)集被整合時(shí),在人工智能技術(shù)加持下,原本經(jīng)過匿名化處理的檔案數(shù)據(jù)從傳統(tǒng)的私密信息泄露風(fēng)險(xiǎn)轉(zhuǎn)為抽象的隱私數(shù)據(jù)關(guān)聯(lián)挖掘侵權(quán)風(fēng)險(xiǎn)[13],敏感信息處理機(jī)制薄弱將會(huì)嚴(yán)重制約數(shù)據(jù)流通合規(guī)性與價(jià)值轉(zhuǎn)化效能。
2.2技術(shù)應(yīng)用淺層,服務(wù)能力不足
數(shù)據(jù)要素價(jià)值釋放依賴于智能化服務(wù)能力,然而技術(shù)淺層化應(yīng)用則會(huì)導(dǎo)致檔案數(shù)據(jù)“沉睡”,難以支撐精準(zhǔn)決策與個(gè)性化需求。具體來看,一方面,當(dāng)前東南大學(xué)在智能技術(shù)應(yīng)用與服務(wù)創(chuàng)新層面仍處于初級(jí)階段,雖有知識(shí)圖譜作為核心工具,但也僅呈現(xiàn)實(shí)體間基礎(chǔ)關(guān)聯(lián),實(shí)際仍停留在靜態(tài)關(guān)聯(lián)層面,例如“十大新聞”僅能展示事件、機(jī)構(gòu)、人物的基礎(chǔ)關(guān)系,缺乏AI驅(qū)動(dòng)的趨勢(shì)預(yù)判與熱點(diǎn)發(fā)現(xiàn)能力。另一方面,當(dāng)前服務(wù)模式仍以被動(dòng)查詢?yōu)橹?,未能?shí)現(xiàn)從“資源供給”向“需求驅(qū)動(dòng)”的轉(zhuǎn)型,檢索功能存在機(jī)械化問題,系統(tǒng)僅支持關(guān)鍵詞匹配,無法理解自然語(yǔ)言語(yǔ)義,例如搜索“近三年計(jì)算機(jī)學(xué)院獲獎(jiǎng)情況”時(shí),系統(tǒng)返回2800條含“計(jì)算機(jī)”“獲獎(jiǎng)”等字眼的新聞,關(guān)聯(lián)性不足。同時(shí),知識(shí)圖譜僅支持點(diǎn)擊節(jié)點(diǎn)查看詳情,缺乏沉浸式探索、用戶畫像以及智能推薦等個(gè)性化功能。此外,知識(shí)圖譜平臺(tái)獨(dú)立于檔案管理系統(tǒng)運(yùn)行,融媒體檔案數(shù)據(jù)同步更新滯后,并且相關(guān)檔案如科研成果、教學(xué)案例、影像資料等需人工從檔案管理系統(tǒng)下載整理,系統(tǒng)協(xié)同性的不足帶來動(dòng)態(tài)事件無法實(shí)時(shí)關(guān)聯(lián)、跨業(yè)務(wù)聯(lián)動(dòng)缺失、用戶體驗(yàn)滯后等問題。
此外,現(xiàn)有團(tuán)隊(duì)的知識(shí)體系與技能儲(chǔ)備難以匹配復(fù)雜的數(shù)據(jù)要素化轉(zhuǎn)型,直接導(dǎo)致服務(wù)創(chuàng)新動(dòng)能不足。融媒體檔案管理涉及網(wǎng)頁(yè)抓取、數(shù)據(jù)清洗、可視化分析等高技術(shù)門檻任務(wù),而現(xiàn)有團(tuán)隊(duì)以傳統(tǒng)檔案管理背景為主,信息技術(shù)、數(shù)據(jù)分析、用戶體驗(yàn)設(shè)計(jì)等跨學(xué)科技能嚴(yán)重不足,關(guān)鍵技術(shù)環(huán)節(jié)完全依賴軟件公司外包??鐚W(xué)科人才的結(jié)構(gòu)性缺失,不僅制約了關(guān)鍵技術(shù)落地,更使得檔案服務(wù)難以突破“保管查詢”的原始功能,無法響應(yīng)數(shù)據(jù)要素化背景下精準(zhǔn)化、場(chǎng)景化的高階需求。
2.3價(jià)值轉(zhuǎn)化阻滯,流通機(jī)制障礙
數(shù)據(jù)要素化的本質(zhì)是構(gòu)建“生產(chǎn)一流通一應(yīng)用”的價(jià)值閉環(huán),而東南大學(xué)融媒體檔案的價(jià)值轉(zhuǎn)化鏈條尚未貫通,數(shù)據(jù)要素流通生態(tài)存在制度性缺陷,導(dǎo)致數(shù)據(jù)資源難以轉(zhuǎn)化為可交易、可增值的生產(chǎn)要素。一方面,融媒體檔案要素識(shí)別體系存在空白,數(shù)據(jù)資產(chǎn)化根基較為薄弱。目前尚未建立數(shù)據(jù)要素分類標(biāo)準(zhǔn),例如未對(duì)教學(xué)類、科研類、文化類等數(shù)據(jù)進(jìn)行明確區(qū)分,導(dǎo)致數(shù)據(jù)混雜。同時(shí),缺乏要素價(jià)值評(píng)估工具,無法量化數(shù)據(jù)的稀缺性。另一方面,融媒體檔案的權(quán)益管理機(jī)制相對(duì)滯后,導(dǎo)致流通的合規(guī)性風(fēng)險(xiǎn)較高。官方平臺(tái)轉(zhuǎn)發(fā)的師生個(gè)人創(chuàng)作內(nèi)容的版權(quán)歸屬尚未明確,例如學(xué)生自媒體作品、教師科普視頻等,數(shù)據(jù)使用的收益分配機(jī)制也未建立,貢獻(xiàn)者無法獲得知識(shí)產(chǎn)權(quán)分成或?qū)W術(shù)影響力激勵(lì)等。同時(shí),還缺乏合法合規(guī)的流通授權(quán)機(jī)制以及敏感數(shù)據(jù)開放的動(dòng)態(tài)審計(jì)機(jī)制。
此外,數(shù)據(jù)要素價(jià)值釋放還依賴開放共享的生態(tài),東南大學(xué)雖已建成融媒體檔案專題數(shù)據(jù)庫(kù),但數(shù)據(jù)資源相對(duì)封閉,服務(wù)范圍局限在校內(nèi),與傳統(tǒng)檔案資源相比利用率低。知識(shí)圖譜平臺(tái)尚未開放試用,檔案館也未與教務(wù)處、科研院及各院系等單位建立常態(tài)化協(xié)作機(jī)制,導(dǎo)致校內(nèi)協(xié)同低效,融媒體檔案資源價(jià)值難以充分釋放,無法助力教學(xué)科研、學(xué)科評(píng)估、管理決策等工作。同時(shí),外部流通受阻,缺乏校際協(xié)同機(jī)制,非密數(shù)據(jù)未能實(shí)現(xiàn)跨校共享,數(shù)據(jù)交易平臺(tái)與定價(jià)機(jī)制等數(shù)據(jù)要素市場(chǎng)化探索更是一片空白,阻礙了跨域價(jià)值共創(chuàng)。
3實(shí)踐進(jìn)路:數(shù)據(jù)要素化驅(qū)動(dòng)下的轉(zhuǎn)型路徑
融媒體檔案從數(shù)據(jù)資源到數(shù)據(jù)要素的轉(zhuǎn)變,需要經(jīng)歷數(shù)據(jù)資源化、資源要素化以及要素價(jià)值化的過程。文章提出數(shù)據(jù)治理體系升級(jí)、知識(shí)服務(wù)智能躍遷、要素流通生態(tài)構(gòu)建三大轉(zhuǎn)型路徑,通過數(shù)據(jù)治理體系升級(jí)使資源數(shù)量規(guī)?;c質(zhì)量標(biāo)準(zhǔn)化,確保檔案數(shù)據(jù)真實(shí)完整、安全可靠、可信可用,將檔案數(shù)據(jù)加工轉(zhuǎn)化為可投入生產(chǎn)的檔案數(shù)據(jù)要素。[14]以知識(shí)服務(wù)智能躍遷和要素流通生態(tài)構(gòu)建,確保融媒體檔案數(shù)據(jù)開發(fā)智能化、服務(wù)專業(yè)化、要素協(xié)同化與流通高效化,從而形成檔案數(shù)據(jù)生產(chǎn)力,釋放融媒體檔案數(shù)據(jù)要素價(jià)值與信息紅利[15],進(jìn)一步提升高校融媒體檔案管理的整體水平,全面賦能高校建設(shè)。
3.1數(shù)據(jù)治理體系升級(jí):從全域采集到安全管理
從數(shù)據(jù)要素的規(guī)模性特點(diǎn)可以看出,單個(gè)或少量的數(shù)據(jù)難以發(fā)揮較大的應(yīng)用價(jià)值。因此,數(shù)據(jù)要素化轉(zhuǎn)型的根基在于構(gòu)建高質(zhì)量、安全可信的融媒體數(shù)據(jù)資源池,將先進(jìn)技術(shù)與精細(xì)管理流程相結(jié)合,能夠構(gòu)建從采集、清洗、管理到安全防護(hù)的全鏈路優(yōu)化治理體系。
(1)優(yōu)化數(shù)據(jù)集成與采集
強(qiáng)化數(shù)據(jù)集成與管理能夠?yàn)槿诿襟w檔案數(shù)據(jù)要素化轉(zhuǎn)型奠定堅(jiān)實(shí)的數(shù)據(jù)資源基礎(chǔ),從根源上筑牢融媒體檔案數(shù)據(jù)要素價(jià)值底色和成色。通過打造全面統(tǒng)一的融媒體檔案數(shù)據(jù)集成平臺(tái),自動(dòng)識(shí)別和接入各類數(shù)據(jù)源。依托智慧校園網(wǎng)站群系統(tǒng),深化校內(nèi)網(wǎng)站的“觸發(fā)即歸檔”機(jī)制,同時(shí)開發(fā)多平臺(tái)適配工具,對(duì)不同自媒體平臺(tái)采用高度適配且差異化的采集和歸檔方式,將充分發(fā)揮AI大數(shù)據(jù)模型的智能分析能力,精準(zhǔn)提取融媒體檔案的元數(shù)據(jù),確保分散于不同源頭的檔案數(shù)據(jù)能夠精準(zhǔn)、快速地集成至統(tǒng)一的數(shù)據(jù)資源池。
(2)強(qiáng)化質(zhì)量控制機(jī)制
保證數(shù)據(jù)質(zhì)量是實(shí)現(xiàn)融媒體檔案數(shù)據(jù)要素價(jià)值的關(guān)鍵,應(yīng)建立嚴(yán)格且精細(xì)的數(shù)據(jù)質(zhì)量控制機(jī)制。制定全面的數(shù)據(jù)質(zhì)量規(guī)范標(biāo)準(zhǔn),著重把控完整性校驗(yàn)(確保數(shù)據(jù)無缺失)唯一性識(shí)別(避免數(shù)據(jù)重復(fù))以及時(shí)效性監(jiān)控(保證數(shù)據(jù)及時(shí)有效)等核心環(huán)節(jié)以提升數(shù)據(jù)一致性。[16]同時(shí)引人AI實(shí)時(shí)監(jiān)控技術(shù)構(gòu)建動(dòng)態(tài)監(jiān)控模型及版本關(guān)聯(lián)機(jī)制,對(duì)新增、修改、刪除等操作進(jìn)行全方位、不間斷跟蹤分析,及時(shí)自動(dòng)進(jìn)行補(bǔ)充、糾錯(cuò)與去重并記錄修改軌跡,支持歷史版本回溯與差異對(duì)比,確保檔案數(shù)據(jù)質(zhì)量滿足作為生產(chǎn)要素使用的條件,具備檔案數(shù)據(jù)要素價(jià)值潛能。[17]
(3)構(gòu)建安全防護(hù)體系
依托技術(shù)革新構(gòu)建“一監(jiān)一查”(即監(jiān)控與審查相結(jié)合)的數(shù)據(jù)要素安全防護(hù)體系。通過開發(fā)融媒體檔案來源認(rèn)證簽名技術(shù),利用區(qū)塊鏈的不可篡改性和分布式特性,防止數(shù)據(jù)造假,確保權(quán)屬不可篡改;建立檔案加解密、脫敏以及內(nèi)容審核和篩選機(jī)制,對(duì)于涉及個(gè)人隱私的敏感信息,采用加密和脫敏技術(shù)進(jìn)行處理,同時(shí)基于預(yù)設(shè)的規(guī)則和算法,審核檔案內(nèi)容是否存在敏感詞匯、違規(guī)內(nèi)容或不當(dāng)言論、檔案格式是否規(guī)范、元數(shù)據(jù)是否完整等,篩選符合預(yù)設(shè)要求的檔案;開發(fā)融媒體檔案授權(quán)驗(yàn)證訪問技術(shù),構(gòu)建動(dòng)態(tài)的、個(gè)性化的權(quán)限管理機(jī)制,根據(jù)用戶的角色、職責(zé)及業(yè)務(wù)需求合理分配數(shù)據(jù)訪問權(quán)限;建立數(shù)據(jù)共享和傳輸?shù)募用芡ǖ?,加?qiáng)終端和通信安全,防止數(shù)據(jù)泄露。此外,通過實(shí)施數(shù)據(jù)備份和恢復(fù)機(jī)制,進(jìn)行深度集成、彈性擴(kuò)展的存儲(chǔ)管理,構(gòu)建安全可信的數(shù)據(jù)智能存儲(chǔ)新生態(tài),全方位保障數(shù)據(jù)的安全性。
3.2知識(shí)服務(wù)智能躍遷:從智能賦能到人才培養(yǎng)
以知識(shí)圖譜為核心,構(gòu)建“數(shù)據(jù)一知識(shí)一決策”的智能服務(wù)體系,是高校融媒體檔案服務(wù)轉(zhuǎn)型的關(guān)鍵路徑。下文將通過技術(shù)深化、場(chǎng)景應(yīng)用與人才培養(yǎng)的多重驅(qū)動(dòng),探索從靜態(tài)關(guān)聯(lián)到動(dòng)態(tài)賦能、從被動(dòng)響應(yīng)到主動(dòng)賦能的實(shí)踐進(jìn)路
(1)構(gòu)建深度知識(shí)圖譜
通過深化知識(shí)圖譜構(gòu)建,能夠推動(dòng)檔案服務(wù)實(shí)現(xiàn)用戶需求導(dǎo)向的智能化轉(zhuǎn)型。運(yùn)用自然語(yǔ)言處理、數(shù)據(jù)挖掘和文本分析等技術(shù)識(shí)別實(shí)體間隱含的語(yǔ)義關(guān)聯(lián),突破傳統(tǒng)關(guān)鍵詞匹配的局限性,深化動(dòng)態(tài)語(yǔ)義網(wǎng)絡(luò)構(gòu)建,并通過深度學(xué)習(xí)模型訓(xùn)練和跨模態(tài)關(guān)系建模,進(jìn)行不同模態(tài)數(shù)據(jù)的特征表示以及相關(guān)性計(jì)算與比較[18],實(shí)現(xiàn)根據(jù)語(yǔ)義相關(guān)度對(duì)搜索結(jié)果的排序、更復(fù)雜的語(yǔ)義理解、跨模態(tài)檢索匹配任務(wù)以及熱點(diǎn)預(yù)測(cè)與智能推理等,通過知識(shí)的聯(lián)結(jié)和延展擴(kuò)大用戶的認(rèn)知范圍,實(shí)現(xiàn)公眾對(duì)融媒體檔案的多角度、多層次認(rèn)知。[19]同時(shí),還可以通過與校園身份認(rèn)證平臺(tái)以及融媒體檔案專題數(shù)據(jù)庫(kù)的系統(tǒng)協(xié)同,獲取用戶基本信息,包括性別、籍貫、部門、學(xué)科、專業(yè)等,基于用戶的瀏覽歷史、下載內(nèi)容、學(xué)科背景、研究方向等獲取其知識(shí)偏好信息,構(gòu)建多維度的用戶畫像,并根據(jù)用戶的學(xué)習(xí)階段、興趣變化等不斷調(diào)整、豐富用戶畫像庫(kù)。[20]最終實(shí)現(xiàn)基于用戶行為或內(nèi)容相似度的檔案數(shù)據(jù)產(chǎn)品智能推薦,使用戶獲得量身定制的數(shù)據(jù)產(chǎn)品服務(wù),實(shí)現(xiàn)從傳統(tǒng)被動(dòng)服務(wù)向主動(dòng)智能服務(wù)的轉(zhuǎn)型。
(2)挖掘場(chǎng)景化價(jià)值
數(shù)據(jù)要素價(jià)值實(shí)現(xiàn)的關(guān)鍵是場(chǎng)景化利用。[21]應(yīng)加強(qiáng)檔案價(jià)值挖掘,推動(dòng)實(shí)現(xiàn)檔案服務(wù)的精準(zhǔn)化與場(chǎng)景化。高校融媒體檔案中蘊(yùn)含著豐富的教育、科研和文化價(jià)值,通過多維度的交叉分析與融合應(yīng)用,能夠產(chǎn)生新的價(jià)值聚合效應(yīng),甚至在此過程中衍生出新的數(shù)據(jù),從而形成一個(gè)正向的價(jià)值增值循環(huán)體系。[22]一方面,基于用戶畫像與知識(shí)圖譜,檔案服務(wù)可精準(zhǔn)對(duì)接科研需求。例如通過數(shù)據(jù)挖掘和關(guān)聯(lián)分析,提取檔案中的隱含知識(shí),形成專題研究、趨勢(shì)分析等高價(jià)值內(nèi)容,發(fā)現(xiàn)研究領(lǐng)域的潛在趨勢(shì)和熱點(diǎn)問題,構(gòu)建跨學(xué)科的知識(shí)圖譜,促進(jìn)不同領(lǐng)域知識(shí)的交叉融合,實(shí)現(xiàn)拓寬深度、加深外延的多維多元個(gè)性化知識(shí)服務(wù)。[23]另一方面,在總結(jié)提煉高校融媒體檔案中如學(xué)校精神、文化傳統(tǒng)、學(xué)科建設(shè)、學(xué)術(shù)追求、成功案例、前沿思想等重要內(nèi)容的基礎(chǔ)上,形成系列化的文化育人素材庫(kù)和多元化的學(xué)習(xí)資源庫(kù),同時(shí)運(yùn)用先進(jìn)技術(shù)特別是元宇宙技術(shù)打造一個(gè)沉浸式的集學(xué)習(xí)、探索、交流于一體的立體化知識(shí)共享空間,將檔案資源融入課程設(shè)計(jì),讓學(xué)生通過語(yǔ)言、文字、畫面等與場(chǎng)景中的人物對(duì)話溝通,身臨其境地學(xué)習(xí)檔案知識(shí)、感知?dú)v史人物與歷史事件[24],培養(yǎng)學(xué)生的批判性思維和創(chuàng)新能力。
(3)培養(yǎng)復(fù)合型人才
構(gòu)建“檔案管理 + 技術(shù)應(yīng)用”的復(fù)合型人才培養(yǎng)體系。通過對(duì)全體檔案工作人員進(jìn)行基礎(chǔ)能力普及,對(duì)技術(shù)骨干進(jìn)行專項(xiàng)技能深化,形成分層培訓(xùn)體系,提升現(xiàn)有人員的數(shù)字素養(yǎng)。同時(shí)引進(jìn)兼具技術(shù)背景與檔案學(xué)知識(shí)的新生力量,打破專業(yè)壁壘,逐漸培養(yǎng)一支具備專業(yè)素養(yǎng)和創(chuàng)新能力的復(fù)合型檔案人才隊(duì)伍,鼓勵(lì)跨學(xué)科、跨領(lǐng)域的團(tuán)隊(duì)合作,促進(jìn)知識(shí)與技能的共享與交流,形成創(chuàng)新合力。唯有通過知識(shí)結(jié)構(gòu)升級(jí)與技能拓展[25],才能為高校融媒體檔案服務(wù)智能化躍遷提供可持續(xù)的人力資源保障,真正釋放數(shù)據(jù)要素價(jià)值。
3.3要素流通生態(tài)構(gòu)建:從規(guī)范確權(quán)到生態(tài)互聯(lián)
數(shù)據(jù)要素的轉(zhuǎn)化需以智能化識(shí)別、精準(zhǔn)化確權(quán)為基礎(chǔ),并依托多要素協(xié)同與生態(tài)共建實(shí)現(xiàn)價(jià)值釋放。
(1)建立智能確權(quán)體系
構(gòu)建智能化、精準(zhǔn)化的數(shù)據(jù)識(shí)別與確權(quán)體系。高校需應(yīng)用先進(jìn)技術(shù)對(duì)融媒體檔案進(jìn)行標(biāo)識(shí)標(biāo)注、分級(jí)分類,識(shí)別出具有資產(chǎn)化潛力的數(shù)據(jù)資源,并對(duì)其開展瀕源,明確數(shù)據(jù)的權(quán)屬關(guān)系,確保數(shù)據(jù)的有效利用和合法合規(guī)。[26]基于語(yǔ)義分析、深度學(xué)習(xí)以及圖像識(shí)別等技術(shù),形成適用于融媒體檔案數(shù)據(jù)分類鑒定的關(guān)鍵信息抽取模型,對(duì)融媒體檔案進(jìn)行多維度智能分類與標(biāo)簽化。例如在處理校園重大活動(dòng)檔案時(shí),運(yùn)用語(yǔ)義分析技術(shù)迅速梳理出活動(dòng)流程、參與人員及重要成果等核心要素,并結(jié)合圖像識(shí)別技術(shù)解析場(chǎng)景元素,如橫幅標(biāo)語(yǔ)、人物身份等,實(shí)現(xiàn)學(xué)術(shù)講座、文化活動(dòng)等專題數(shù)據(jù)庫(kù)的自動(dòng)化構(gòu)建,精準(zhǔn)評(píng)估數(shù)據(jù)質(zhì)量與潛在價(jià)值,為資產(chǎn)化開發(fā)奠定基礎(chǔ)。同時(shí),基于數(shù)據(jù)分類成果,高校應(yīng)制定完善融媒體檔案數(shù)據(jù)資產(chǎn)管理制度,以區(qū)塊鏈與數(shù)字簽名技術(shù)為核心,建立權(quán)屬溯源機(jī)制,例如針對(duì)師生個(gè)人創(chuàng)作內(nèi)容,通過數(shù)據(jù)確權(quán)平臺(tái)明確學(xué)校與創(chuàng)作者的使用權(quán)限,并簽訂動(dòng)態(tài)授權(quán)協(xié)議,確保數(shù)據(jù)流通合法合規(guī);制定分級(jí)分類管理制度,對(duì)校方所有的新聞、政策文件等公有數(shù)據(jù)實(shí)施統(tǒng)一管控,形成安全可信的內(nèi)控體系。
(2)共建服務(wù)生態(tài)
構(gòu)建共建共享的新型服務(wù)生態(tài),推動(dòng)不同要素深度融合。高校檔案部門應(yīng)圍繞融媒體檔案服務(wù)的需求和供給兩端,構(gòu)建完善的數(shù)據(jù)服務(wù)生態(tài)系統(tǒng)。讓不同來源的優(yōu)質(zhì)數(shù)據(jù)在新的業(yè)務(wù)需求和場(chǎng)域中匯聚融合,促進(jìn)數(shù)據(jù)要素的流通和交易。首先,應(yīng)進(jìn)行用戶參與模式下的內(nèi)容創(chuàng)新以及文化產(chǎn)品創(chuàng)作,通過知識(shí)共享平臺(tái)獲取用戶需求、創(chuàng)意及技術(shù)知識(shí)等方面的信息,與高校檔案部門形成互補(bǔ),讓檔案數(shù)據(jù)成為連接不同學(xué)科、不同背景人才的橋梁,促進(jìn)數(shù)據(jù)要素在高校內(nèi)部的流通和共享,推動(dòng)知識(shí)融合與價(jià)值再造。其次,應(yīng)通過加大經(jīng)費(fèi)投入、設(shè)立專項(xiàng)基金、吸引社會(huì)資本等方式,建立廣泛互聯(lián)、資源集聚、生態(tài)繁榮、價(jià)值共創(chuàng)、治理有序的可信融媒體檔案數(shù)據(jù)服務(wù)空間,促進(jìn)數(shù)據(jù)流通和交易。為數(shù)據(jù)生產(chǎn)者與內(nèi)容創(chuàng)作者提供價(jià)值變現(xiàn)渠道,延伸檔案服務(wù)產(chǎn)業(yè)鏈,推動(dòng)產(chǎn)學(xué)研用深度融合,實(shí)現(xiàn)數(shù)據(jù)產(chǎn)品價(jià)值最大化。最后,通過組建高校融媒體檔案數(shù)據(jù)共享服務(wù)聯(lián)盟,實(shí)現(xiàn)高校間融媒體檔案的共建和共享,使數(shù)據(jù)成為高校發(fā)展的生產(chǎn)要素,推動(dòng)高校檔案事業(yè)繁榮發(fā)展。
4結(jié)語(yǔ)
東南大學(xué)通過構(gòu)建覆蓋校內(nèi)外多平臺(tái)的融媒體檔案資源庫(kù),初步實(shí)現(xiàn)了網(wǎng)站、微博、微信等多源異構(gòu)數(shù)據(jù)的整合,并依托知識(shí)圖譜構(gòu)建探索了智能檢索與可視化分析服務(wù)。然而,實(shí)踐中仍面臨數(shù)據(jù)采集盲區(qū)、技術(shù)應(yīng)用淺層化及要素流通機(jī)制缺失等核心問題。針對(duì)這些問題,本研究提出了三大轉(zhuǎn)型路徑:通過數(shù)據(jù)治理體系升級(jí)破解采集與安全瓶頸;以動(dòng)態(tài)知識(shí)圖譜和用戶畫像驅(qū)動(dòng)知識(shí)服務(wù)智能化轉(zhuǎn)型;通過要素確權(quán)與生態(tài)共建打通數(shù)據(jù)流通壁壘。隨著數(shù)據(jù)要素市場(chǎng)化配置改革的深化,高校檔案管理將加速向“數(shù)據(jù)驅(qū)動(dòng)型”服務(wù)模式轉(zhuǎn)型,高校檔案機(jī)構(gòu)需在數(shù)據(jù)安全與價(jià)值釋放間尋求平衡,構(gòu)建“資源一要素一資產(chǎn)”的轉(zhuǎn)化閉環(huán),為教育數(shù)字化轉(zhuǎn)型提供基礎(chǔ)支撐。
*本文系江蘇省檔案科技項(xiàng)目“元宇宙 高校檔案創(chuàng)新發(fā)展與應(yīng)用研究”(項(xiàng)目編號(hào):2023-22)階段性研究成果。
作者貢獻(xiàn)說明
孫婷婷:論文選題、思路設(shè)計(jì),撰寫與修訂;趙爽:參與撰寫和修改論文。
注釋與參考文獻(xiàn)
[1]梅宏.數(shù)據(jù)如何要素化:資源化、資產(chǎn)化、資本化[J].施工企業(yè)管理,2022(12):42.
[2][14][15]楊鵬,金波.檔案數(shù)據(jù)要素論:資源要素化與要素價(jià)值化[J].情報(bào)科學(xué),2024(10):38-46.
[3」馬費(fèi)成,熊思玥,孫玉姣,等.數(shù)據(jù)分類分級(jí)確權(quán)對(duì)數(shù)據(jù)要素價(jià)值實(shí)現(xiàn)的影響[J].信息資源管理學(xué)報(bào),2024(1):4-12.
[4][26]周文泓,丁家友,祁天嬌,等.芻議數(shù)據(jù)要素化下的檔案事業(yè)發(fā)展[J]檔案與建設(shè),2024(7):32-36.
[5]許曉彤,張嘉瑋,李照川.檔案數(shù)據(jù)要素化的歷史源流、關(guān)鍵問題與價(jià)值空間LJ」.檔案與建設(shè),2024(5):12-21.
[6]楊鵬.檔案數(shù)據(jù)要素價(jià)值論[J].檔案與建設(shè),2024(4):26-35.
[7]楊智勇,岳幸暉.檔案數(shù)據(jù)價(jià)值鏈模型構(gòu)建及實(shí)現(xiàn)路徑探析[J].檔案與建設(shè),2024(4):18-25.
[8」蘇會(huì)靈.檔案數(shù)據(jù)要素流通的關(guān)鍵問題與對(duì)策研究[J].山西檔案,2024(2):62-64.
[9]付.數(shù)據(jù)要素流通中的檔案分級(jí)分類管理:理論內(nèi)涵、實(shí)踐困境與優(yōu)化路徑[J].山西檔案,2024(5):39-42.
[10]周文泓,賀譚濤,黃小宇,等.檔案館的社交媒體信息存檔實(shí)踐進(jìn)展與策略展望[J」.山西檔案,2021(1):55-60,13.
[11]孫婷婷,張軼群,柳萍.基于智慧校園的高校網(wǎng)站網(wǎng)頁(yè)歸檔研究——以東南大學(xué)為例[J].檔案與建設(shè),2022(3):55-57.
[12]李麗芳.檔案信息公開與防范敏感信息泄密的可行性研究[J].城建檔案,2017(3):90-91.
[13]周毅,陳美君.數(shù)據(jù)要素價(jià)值化視角下檔案數(shù)據(jù)隱私風(fēng)險(xiǎn)及其治理研究[J].檔案與建設(shè),2024(9):6-14.
[16]丁海斌,趙錦濤.數(shù)據(jù)集成技術(shù)在檔案管理系統(tǒng)中的應(yīng)用研究[J」.檔案管理,2022(6):94-99.
[17]金波,楊鵬,劉娟娟.檔案數(shù)據(jù)要素價(jià)值內(nèi)涵要義與生成機(jī)理[J].檔案學(xué)通訊,2024(6):4-12
[18][25]趙躍,陳香,陳水湖.面向單軌制的檔案人員電子文件管理專業(yè)能力研究J」.檔案與建設(shè),2022(11):26-31.
[19]李穎,沈保棟.數(shù)字人文視域下的歷史檔案開發(fā)路徑——以“跟著檔案觀上海”為例[J].檔案與建設(shè),2024(3):56-62.
[20]周林興,魏亮亮,艾文華.用戶畫像視角下檔案館知識(shí)服務(wù)推薦機(jī)理研究[J.檔案管理,2019(5):8-12.
[21」周文泓,胡濤.數(shù)據(jù)要素化導(dǎo)向下的檔案學(xué)研究前瞻:方向與議題J」.檔案學(xué)通訊,2025(3):38-44.
[22]譚洪波,耿志超.數(shù)據(jù)要素驅(qū)動(dòng)新質(zhì)生產(chǎn)力:理論邏輯、現(xiàn)實(shí)挑戰(zhàn)和推進(jìn)路徑[J].價(jià)格理論與實(shí)踐,2024(5):39-44,145.
[23」皇甫娟.面向知識(shí)服務(wù)的智慧圖書館多模態(tài)數(shù)據(jù)資源知識(shí)融合模式[J].圖書情報(bào)導(dǎo)刊,2023(4):22-27.
[24]陳天旭,肖強(qiáng).元宇宙視域下數(shù)字檔案館知識(shí)服務(wù)轉(zhuǎn)型研究[J].檔案學(xué)刊,2023(1):59-65.
(責(zé)任編輯:邵澍)