關(guān)鍵詞:數(shù)據(jù)安全政策;協(xié)同研究;主題識別;主題協(xié)同;NMF
DOI:10.3969/j.issn.1008-0821.2024.11.010
〔中圖分類號〕G203 〔文獻(xiàn)標(biāo)識碼〕A 〔文章編號〕1008-0821(2024)11-0099-09
全球數(shù)字經(jīng)濟(jì)蓬勃發(fā)展,催生出以數(shù)據(jù)為關(guān)鍵要素、以數(shù)字服務(wù)為核心、以數(shù)字訂購與交付為主要特征的數(shù)字貿(mào)易[1]。數(shù)據(jù)作為關(guān)鍵生產(chǎn)要素,具有可復(fù)制性與共享性,數(shù)字技術(shù)和生產(chǎn)生活不斷交匯融合,各類數(shù)據(jù)迅猛增長且海量聚集,對經(jīng)濟(jì)發(fā)展、人民生活都產(chǎn)生了重大而深刻的影響。2020年4月,中共中央、國務(wù)院印發(fā)《關(guān)于構(gòu)建更加完善的要素市場化配置體制的意見》[2],提出加快培育數(shù)據(jù)要素市場。2022年12月,中共中央、國務(wù)院發(fā)布《關(guān)于構(gòu)建數(shù)據(jù)基礎(chǔ)制度更好發(fā)揮數(shù)據(jù)要素作用的意見》[3](簡稱《數(shù)據(jù)二十條》),提出構(gòu)建數(shù)據(jù)要素治理制度。隨之而來的是大數(shù)據(jù)和人工智能技術(shù)發(fā)展速度遠(yuǎn)超過法律制度建設(shè),導(dǎo)致數(shù)據(jù)采集、存儲、管理、加工、應(yīng)用和流通等諸多環(huán)節(jié)處在暫時性無法可依的狀態(tài),加之?dāng)?shù)據(jù)安全攻擊技術(shù)智能化以及攻擊工具普遍化,使得全球數(shù)據(jù)安全問題頻發(fā),全球數(shù)據(jù)安全防護(hù)的形勢極其嚴(yán)峻,因此數(shù)據(jù)安全引起了學(xué)術(shù)界的廣泛關(guān)注。近年來,數(shù)據(jù)安全相關(guān)的科研論文大幅增加,而后數(shù)據(jù)安全政策也不斷增多,數(shù)據(jù)安全政策文本與科研論文從數(shù)量、深度、廣度上均持續(xù)增加。數(shù)據(jù)安全科研成果的產(chǎn)出能夠推動政策的頒布,而相關(guān)政策的出臺又能進(jìn)一步促進(jìn)以數(shù)據(jù)安全為主題的科學(xué)研究,數(shù)據(jù)安全政策與科研之間存在相互推動、作用與反饋的關(guān)系。因此,探究二者的協(xié)同關(guān)系,不但有助于分析數(shù)據(jù)安全政策與科研之間的趨勢特點(diǎn),還能推動政策完善并厘清科研方向。
1文獻(xiàn)綜述
分析國內(nèi)外文獻(xiàn)發(fā)現(xiàn),國內(nèi)學(xué)者針對該主題的研究集中在以下4個維度。①政府?dāng)?shù)據(jù)安全維度。馬海群等[4]采用層次分析法,從多元化政策評估主體以及政策評估指標(biāo)體系兩方面研究政府?dāng)?shù)據(jù)安全政策評估體系的構(gòu)建;冉連等[5]使用文本內(nèi)容分析法,對17個省級政府出臺的84份關(guān)于數(shù)據(jù)開放全生命周期安全管理政策文本進(jìn)行編碼分析與信息挖掘;毛子俊等[6]運(yùn)用文獻(xiàn)計量法,從政策外部屬性和政策工具兩個維度,研究我國71份與政務(wù)數(shù)據(jù)相關(guān)的政策文本;程慧平等[7]采用Nvivo對我國政務(wù)數(shù)據(jù)安全共享政策進(jìn)行研究。②開放數(shù)據(jù)安全維度。閆倩等[8]從文獻(xiàn)和我國實(shí)情分析我國開放數(shù)據(jù)政策和數(shù)據(jù)安全政策;陳玲等[9]從政策工具維度和政策主題維度構(gòu)建了政府開放數(shù)據(jù)政策的實(shí)施框架;張濤等[10]通過政策文本計算的方法,對開放數(shù)據(jù)與數(shù)據(jù)安全政策進(jìn)行協(xié)同研究。③科研數(shù)據(jù)安全維度。宋筱璇等[11]對國內(nèi)外科研數(shù)據(jù)安全政策進(jìn)行比較研究;盛小平等[12]對科學(xué)數(shù)據(jù)開放中存在的問題進(jìn)行探討;劉冰等[13]對英、美、澳高??蒲袛?shù)據(jù)政策進(jìn)行研究;朱玲等[14]對國外科學(xué)數(shù)據(jù)開放政策進(jìn)行研究并生成框架。④政策與科研協(xié)同維度。張濤等[15]用LDA+Word2vec進(jìn)行算法治理政策與科研協(xié)同研究;崔文波等[16]用相似度計算進(jìn)行算法推薦政策與科研協(xié)同研究;張玲等[17]使用LDA+TF-IDF進(jìn)行科研誠信政策與文獻(xiàn)主題演化對比分析;文禹衡等[18]使用計量分析法對數(shù)據(jù)確權(quán)政策與科研協(xié)同研究。此外,國外學(xué)者也從不同維度對數(shù)據(jù)安全問題展開研究,如:Semenov NA等[19]從技術(shù)層面對云計算中數(shù)據(jù)架構(gòu)安全進(jìn)行研究;AlabdulatifA等[20]從健康醫(yī)療角度探討數(shù)據(jù)安全;DixitP等[21]對印度數(shù)據(jù)安全政策進(jìn)行評估;DemirolD等[22]對大數(shù)據(jù)隱私安全等方面進(jìn)行研究;HajiheydariN等[23]對金融行業(yè)中大數(shù)據(jù)安全進(jìn)行分析;Atoum IA等[24]對大數(shù)據(jù)隱私管理存在的問題進(jìn)行研究;RenC等[25]從科研到政策擴(kuò)散度研究科研與政策的關(guān)系。
綜上所述,當(dāng)前國內(nèi)外對數(shù)據(jù)安全研究成果主要集中在兩個方面,一是國內(nèi)學(xué)者從政府?dāng)?shù)據(jù)安全、開放數(shù)據(jù)安全、科研數(shù)據(jù)安全3個方面對數(shù)據(jù)安全政策進(jìn)行了較為全面的分析。二是國外學(xué)者研究成果集中于領(lǐng)域數(shù)據(jù)安全層面、數(shù)據(jù)安全技術(shù)、數(shù)據(jù)隱私保護(hù)方面。當(dāng)前,數(shù)據(jù)安全領(lǐng)域研究成果雖然較為全面,但尚未出現(xiàn)數(shù)據(jù)安全政策和科研協(xié)同的研究成果。因此,本文以我國數(shù)據(jù)安全領(lǐng)域的547部政策和2466篇科研論文為樣本,結(jié)合NMF主題模型和Word2vec模型,分別對政策文本和科研論文進(jìn)行主題識別,并通過相似度計算方法探究我國數(shù)據(jù)安全政策與科研主題的協(xié)同情況。
2研究設(shè)計
本文選擇與數(shù)據(jù)安全相關(guān)的政策文本和科研論文作為研究樣本,樣本采集時間為2023年9月,為確保該研究數(shù)據(jù)年度上的完整性,因此研究時間跨度確定為2013—2022年,具體研究框架如圖1所示,主要包括:①從自建語料庫中獲取“數(shù)據(jù)安全”相關(guān)政策文本[26],從中國知網(wǎng)中獲取數(shù)據(jù)安全相關(guān)科研論文;②對所獲取到的政策和科研論文進(jìn)行預(yù)處理;③通過NMF進(jìn)行主題建模,運(yùn)用主題一致性指標(biāo)確定模型最優(yōu)主題數(shù)目,并對政策主題與科研主題進(jìn)行分析;④通過相似度計算對政策與科研主題協(xié)同關(guān)系進(jìn)行分析,旨在揭示二者間的協(xié)同性。
2.1文本數(shù)據(jù)采集
政策文本是政策的載體,反映決策者的價值觀,因此可以作為研究政策的重要樣本。在自建語料庫中選取數(shù)據(jù)類政策547部,在此基礎(chǔ)上,以“安全”字樣進(jìn)行人工篩查,提取帶有“安全”的政策文本語句片段共10636條,共885515個字符數(shù)作為政策研究樣本。此外,根據(jù)政策文本數(shù)據(jù)量分布情況,以兩年作為一個時間窗口劃分階段,共劃分5個階段,具體如表1所示。
科研論文是科研成果的精華所在,同時相比于專著、專利等其他文獻(xiàn),期刊論文更能反映當(dāng)前研究的最新成果,更加具有時效性,與政策頒布實(shí)施具有同期性。以中國知網(wǎng)為數(shù)據(jù)庫,基于已有文獻(xiàn)選擇“數(shù)據(jù)安全”進(jìn)行主題檢索,數(shù)據(jù)來源選擇CSSCI和北大核心。此外,為了提高選取文獻(xiàn)質(zhì)量,本文通過人工篩選的方法根據(jù)標(biāo)題、摘要以及學(xué)科分類等對文獻(xiàn)進(jìn)行梳理,剔除與主題明顯不相關(guān)、非學(xué)術(shù)類的文獻(xiàn),最終確定2466篇為研究樣本,共6347737個字符數(shù),提取文獻(xiàn)中的篇名、摘要和關(guān)鍵詞形成待分析樣本,如表2所示。
2.2文本預(yù)處理
文本預(yù)處理主要包括建立關(guān)鍵詞表、無效詞表、分詞。①關(guān)鍵詞表:提取論文關(guān)鍵詞作為初始詞表,并使用TF-IDF算法對待分析文本進(jìn)行領(lǐng)域關(guān)鍵詞提取,導(dǎo)入到初始特征詞表,進(jìn)行去重與篩選,最終形成11461條關(guān)鍵詞,關(guān)鍵詞表的建立是數(shù)據(jù)處理的重要環(huán)節(jié),直接決定著后續(xù)分析精確性。②無效詞表:為提高主題識別準(zhǔn)確度,防止高頻無效詞的干擾,需要在通用停用詞表基礎(chǔ)上構(gòu)建面向目標(biāo)領(lǐng)域的無效詞表,通常在第一次進(jìn)行主題聚類后,篩選出現(xiàn)頻率高且無實(shí)際意義關(guān)鍵詞,如“研究”“發(fā)展”等,導(dǎo)入無效詞表中,為保證準(zhǔn)確性,反復(fù)迭代上述過程,再融合停用詞表后形成無效詞表。③分詞:利用Python中Jieba工具對文本進(jìn)行分詞、加載有效詞表、去無效詞等預(yù)處理操作,最后去除超短語句(字符小于5的語句),超短語句對所計算結(jié)果影響較大,因此需要去除。
2.3文本計算
文本計算主要包括主題識別和相似度計算。①主題識別:利用主題一致性指標(biāo)選出最優(yōu)主題數(shù),通過NMF主題聚類出的主題詞,匯聚成主題詞表[27]。②相似度計算:利用Word2vec模型訓(xùn)練主題的詞向量,通過余弦相似度計算政策文本與科研論文主題的相似度數(shù)值。③協(xié)同分析:利用?;鶊D繪制政策與科研主題協(xié)同圖,最終對數(shù)據(jù)安全政策與科研主題進(jìn)行協(xié)同性分析。
3主題識別與協(xié)同研究
通過NMF和Word2vec模型對政策主題和科研主題進(jìn)行有效識別,并利用相似度計算方法對二者間協(xié)同關(guān)系進(jìn)行分析。
3.1政策主題分析
根據(jù)主題一致性確定5個階段政策最優(yōu)主題數(shù)為14、15、12、15、16,選取每個階段平均權(quán)重最高的3個詞作為主題詞,如表3所示。
從主題分布來看,我國數(shù)據(jù)安全政策中包含公共數(shù)據(jù)、政務(wù)數(shù)據(jù)、個人信息、大數(shù)據(jù)等主題,這表明我國數(shù)據(jù)安全國家層面的總體戰(zhàn)略布局初步形成,數(shù)據(jù)安全審查與監(jiān)管措施逐步完善,數(shù)據(jù)安全管理以及個人信息保護(hù)認(rèn)證體系逐步構(gòu)建。
1)階段1(2013—2014)。該階段處于萌芽階段,由于數(shù)據(jù)安全相關(guān)政策發(fā)布較早,主題分布較為零散化,主要以信息安全、網(wǎng)絡(luò)安全、監(jiān)管等主題為主,同時出現(xiàn)了“信息安全保障體系”“謠言”“假冒”等主題,早期政策主要偏向信息安全層面。
2)階段2(2015—2016)。該階段處于穩(wěn)步增長階段,政策數(shù)量顯著增多,政策主題分布更廣泛,如:數(shù)字資源開放、網(wǎng)絡(luò)安全、大數(shù)據(jù)安全、云計算技術(shù)、監(jiān)管領(lǐng)域、電子政務(wù)、信息安全等級保護(hù)等主題均有所涉及。從T6主題來看,應(yīng)急預(yù)警機(jī)制是我國數(shù)據(jù)安全體系構(gòu)建的重點(diǎn)[28],而該主題與階段1中T9主題具有演進(jìn)關(guān)系,并且從主題詞來看,實(shí)現(xiàn)從應(yīng)急事后處理到應(yīng)急事前預(yù)警轉(zhuǎn)化。從T13主題來看,電子政務(wù)平臺則是我國政府電子辦公的重要舉措,提升工作效率的同時也存在一定風(fēng)險問題,如漏洞、信息泄露、丟失等情況,電子政務(wù)也是政務(wù)數(shù)據(jù)形成初期的重要載體。
3)階段3(2017—2018)。該階段處于快速增長階段,數(shù)據(jù)安全政策數(shù)量多,主題呈現(xiàn)多元化。宏觀層面以大數(shù)據(jù)安全、網(wǎng)絡(luò)安全、信息安全為主,微觀層面則出現(xiàn)應(yīng)急預(yù)警、政務(wù)信息、測評、技術(shù)標(biāo)準(zhǔn)化等主題,其中T8主題和T10主題均為階段2演化而來,從主題詞來看,T8應(yīng)急管理主題具有較強(qiáng)演化關(guān)系,這也說明從政策層面對應(yīng)急管理應(yīng)更側(cè)重于應(yīng)急事前預(yù)警。T10電子政務(wù)主題實(shí)現(xiàn)了從階段2的電子政務(wù)網(wǎng)絡(luò)向階段3電子政務(wù)數(shù)據(jù)過渡的趨勢。
4)階段4(2019—2020)。該階段數(shù)據(jù)安全政策數(shù)量逐步減少,T14的公共數(shù)據(jù)開放主題較為突出,政策關(guān)注點(diǎn)形成了從網(wǎng)絡(luò)數(shù)據(jù)、大數(shù)據(jù)到政務(wù)數(shù)據(jù)再到公共數(shù)據(jù)的演進(jìn),其中,T2應(yīng)急主題已經(jīng)向應(yīng)急管理能力層面演進(jìn),而T4主題中的人工智能倫理和T15主題中區(qū)塊鏈技術(shù)均說明了該階段政策主題呈現(xiàn)出了技術(shù)細(xì)分化的趨勢。
5)階段5(2021—2022)。該階段更多關(guān)注的是數(shù)據(jù)安全體系構(gòu)建,隨著三法的正式頒布,我國數(shù)據(jù)安全頂層法律設(shè)計已經(jīng)初步形成。數(shù)據(jù)安全主題進(jìn)一步呈現(xiàn)出細(xì)分趨勢,其中全生命周期、保障措施、監(jiān)測預(yù)警機(jī)制、數(shù)據(jù)責(zé)任、安全可控等有所體現(xiàn),而T6應(yīng)急主題從應(yīng)急能力演進(jìn)為應(yīng)急預(yù)案主題詞,該主題從階段2到階段5的持續(xù)變化,并且不斷細(xì)化,由此可見國家在數(shù)據(jù)安全領(lǐng)域?qū)?yīng)急處置尤為關(guān)注。
3.2科研主題分析
根據(jù)主題一致性確定5個階段科研最優(yōu)主題數(shù)為12、11、12、14、12,選取每個階段平均權(quán)重最高的3個詞作為主題詞,如表4所示。
1)階段1(2013—2014)。該階段主題集中在云計算、物聯(lián)網(wǎng)、大數(shù)據(jù)等安全問題。數(shù)據(jù)安全風(fēng)險主要是數(shù)據(jù)在傳輸、存儲方面的風(fēng)險,而研究重點(diǎn)集中在技術(shù)層面,該階段所發(fā)布的政策尚未對技術(shù)層面做出相關(guān)規(guī)定;在技術(shù)層面,數(shù)據(jù)安全政策存在一定滯后性。此外,T4為數(shù)字圖書館主題、T7為檔案管理主題,因此圖書館學(xué)、檔案學(xué)領(lǐng)域?qū)?shù)據(jù)安全的相關(guān)研究起步也較早,數(shù)據(jù)安全管理長期以來均為信息資源管理學(xué)科的研究熱點(diǎn),圖書館領(lǐng)域?qū)崿F(xiàn)從“階段1和階段2數(shù)字圖書館主題—階段3敏感數(shù)據(jù)主題—階段4圖書館大數(shù)據(jù)風(fēng)險主題—階段5智慧圖書館主題”的演進(jìn)。
2)階段2(2015—2016)。該階段科研主題變化并不顯著,T6個人信息保護(hù)和T8科學(xué)數(shù)據(jù)管理為新增主題。該階段個人信息泄露及被濫用問題頻發(fā),使得個人信息保護(hù)已經(jīng)成為學(xué)術(shù)界研究的焦點(diǎn)問題,個人信息保護(hù)以“告知—同意”為核心的個人信息處理規(guī)則,強(qiáng)調(diào)自然人的自主權(quán)利,同時注重其他重要利益。而科學(xué)數(shù)據(jù)管理中數(shù)據(jù)安全問題也在該階段逐漸興起,并且針對高校科學(xué)數(shù)據(jù)管理方面形成一系列成果。
3)階段3(2017—2018)。該階段對政府?dāng)?shù)據(jù)開放的研究成果較多,出現(xiàn)T3開放數(shù)據(jù)政策、T5政府?dāng)?shù)據(jù)開放、T6政府?dāng)?shù)據(jù)治理等主題。而數(shù)據(jù)安全是數(shù)字政府建設(shè)生命線,其重要性毋庸置疑,我國政府?dāng)?shù)據(jù)不僅面臨傳統(tǒng)的網(wǎng)絡(luò)安全威脅,還會在數(shù)據(jù)開放過程中出現(xiàn)數(shù)據(jù)安全管理責(zé)任不清晰的問題,一旦薄弱部位被利用,就可能引發(fā)全局滲透風(fēng)險,該階段政府?dāng)?shù)據(jù)與政策階段3中T2和T10主題在同一階段內(nèi)具有協(xié)同關(guān)系,這也說明電子政務(wù)中政務(wù)數(shù)據(jù)開放與安全的重要作用。
4)階段4(2019—2020)。該階段則關(guān)注到T3數(shù)據(jù)治理、T4檔案數(shù)據(jù)治理、T7信息安全、T10公共安全數(shù)據(jù)等主題。數(shù)據(jù)治理概念逐步出現(xiàn),數(shù)據(jù)治理與數(shù)據(jù)質(zhì)量研究成果逐漸增加,從T4主題檔案數(shù)據(jù)治理可知,檔案業(yè)務(wù)逐漸從線下轉(zhuǎn)為線上,數(shù)據(jù)形式變得多樣,如何確保檔案在數(shù)據(jù)共享中的安全成為關(guān)鍵,檔案數(shù)據(jù)到階段5則演進(jìn)為檔案保護(hù)及檔案數(shù)據(jù)長期保存的主題。
5)階段5(2021—2022)。該階段T2跨境數(shù)據(jù)流動、T3數(shù)據(jù)要素等主題尤為突出??缇硵?shù)據(jù)流動安全需要構(gòu)建政策體系,健全保障數(shù)據(jù)跨境流動安全的法律規(guī)則,提升數(shù)據(jù)安全保障能力。當(dāng)前,國內(nèi)法與國際法還存在配套協(xié)同問題,如何讓法律間有效銜接,共同構(gòu)筑維護(hù)數(shù)據(jù)跨境流動安全的法律屏障成為當(dāng)下問題所在??蒲姓撐闹羞@兩個主題均與《數(shù)據(jù)二十條》政策相吻合,數(shù)據(jù)作為數(shù)字經(jīng)濟(jì)的核心生產(chǎn)要素之一,流通是數(shù)據(jù)要素價值釋放的重要途徑,在流通過程中如何確保數(shù)據(jù)要素安全則成為關(guān)鍵,可以預(yù)測未來數(shù)據(jù)要素和跨境數(shù)據(jù)流動中安全問題會成為政策和科研的熱點(diǎn)與焦點(diǎn)。
3.3政策與科研主題協(xié)同關(guān)系分析
通過對政策與科研主題相似度計算以揭示二者間協(xié)同關(guān)系,為使得協(xié)同關(guān)系更清晰,將相似度閾值設(shè)置為0.6,若相似度大于0.6,則認(rèn)為政策主題與科研主題存在較強(qiáng)協(xié)同性,采用?;鶊D進(jìn)行可視化呈現(xiàn),如圖2所示。
1)階段1(2013—2014)。政策中“大數(shù)據(jù)平臺”“大數(shù)據(jù)產(chǎn)業(yè)”“大數(shù)據(jù)環(huán)境”“數(shù)據(jù)資源”“監(jiān)管”“信息安全保障體系”“個人隱私”主題與科研主題存在協(xié)同關(guān)系。其中,主題詞有“網(wǎng)絡(luò)”“信息安全保障體系”“監(jiān)管”“開放”“認(rèn)證”“大數(shù)據(jù)產(chǎn)業(yè)”“大數(shù)據(jù)平臺”,其中“信息安全”比較突顯,說明早期我國關(guān)注的政策主要在信息安全領(lǐng)域,此外,該階段“大數(shù)據(jù)”相關(guān)主題較多,并且與不同階段科研主題均具有較強(qiáng)協(xié)同關(guān)系,2013年起,上海、重慶分別發(fā)布《上海推進(jìn)大數(shù)據(jù)研究與發(fā)展三年行動計劃》和《重慶市大數(shù)據(jù)行動計劃》。在科研方面,“大數(shù)據(jù)”相關(guān)研究成果持續(xù)增多,并在不同階段呈現(xiàn)出分化細(xì)化研究的趨勢,這說明數(shù)據(jù)安全在大數(shù)據(jù)領(lǐng)域政策和科研關(guān)注點(diǎn)較為一致。從階段1整體政策主題來看,與之協(xié)同的科研主題大多位于后續(xù)階段,一定程度上體現(xiàn)政策對于科研的引領(lǐng)作用。階段1科研主題對于同階段政策匹配度較低,具有一定滯后性,并不能支撐個人隱私、信息安全保障體系等主題,而是將研究重點(diǎn)落到云計算技術(shù)上。此外,該階段政策還出現(xiàn)了“網(wǎng)絡(luò)”“社會秩序”“物聯(lián)網(wǎng)”“應(yīng)急處置”等主題。
2)階段2(2015—2016)。階段2政策“大數(shù)據(jù)”“云計算”“大數(shù)據(jù)安全”“應(yīng)急處置”“網(wǎng)絡(luò)安全”“保障”“數(shù)據(jù)資源”等主題與科研主題存在協(xié)同關(guān)系。政策主題主要圍繞“安全”話題展開,如“大數(shù)據(jù)安全”“網(wǎng)絡(luò)安全”“應(yīng)急處置”主題詞,科研主題中“安全”主題貫穿著整個階段,可以看出科研主題在不斷深化研究深度和廣度。隨著“棱鏡門”事件的曝光,全球安全神經(jīng)被繃緊,我國相繼出臺一系列安全制度與規(guī)范,尤其是2016年11月7日全國人大通過的《中華人民共和國網(wǎng)絡(luò)安全法》,凸顯我國將網(wǎng)絡(luò)安全提升至國家安全的決心,而網(wǎng)絡(luò)安全主題從階段1持續(xù)至階段4,這說明網(wǎng)絡(luò)安全政策主題和科研主題具有相互促進(jìn)、互為協(xié)同的關(guān)系。該階段中部分政策主題與階段1科研主題呈現(xiàn)協(xié)同關(guān)系,說明階段1科研成果對階段2政策起到促進(jìn)作用。階段2科研主題集中在云計算、云存儲、網(wǎng)絡(luò)安全、大數(shù)據(jù)方面,對于階段1政策主題中出現(xiàn)的應(yīng)急響應(yīng)、制度建設(shè)等,在階段2科研主題中尚未出現(xiàn),在這些主題方面體現(xiàn)出科研主題與政策主題的不一致性。
3)階段3(2017—2018)。政策“大數(shù)據(jù)”“電子政務(wù)”“網(wǎng)絡(luò)安全”“保障”“應(yīng)急處置”“大數(shù)據(jù)安全”“信息安全”等主題與科研主題存在協(xié)同關(guān)系。階段3為數(shù)據(jù)安全政策密集發(fā)布階段,從政策數(shù)量來看,政策層級覆蓋面均較廣,政策主題關(guān)注的對象更加豐富,涉及“電子政務(wù)”,該階段圍繞“政務(wù)數(shù)據(jù)”和“政務(wù)服務(wù)”集中出臺相關(guān)政策,結(jié)合表4分析可知,“電子政務(wù)”和“政務(wù)信息”政策主題在科研主題之前,進(jìn)而促進(jìn)此后兩個階段“政府治理”“政務(wù)數(shù)據(jù)”等主題的科學(xué)研究。階段3科研主題中出現(xiàn)了政府?dāng)?shù)據(jù)開放、政府?dāng)?shù)據(jù)治理等,從政府?dāng)?shù)據(jù)開放共享這一主題來看,與階段4政策中公共數(shù)據(jù)主題以及階段5中政務(wù)數(shù)據(jù)主題均存在協(xié)同關(guān)系,這體現(xiàn)出在該領(lǐng)域科研對政策的引領(lǐng)作用。
4)階段4(2019—2020)。政策中“技術(shù)”“人工智能”“公共數(shù)據(jù)開放”“應(yīng)急處置”等主題與科研主題存在協(xié)同關(guān)系。該階段政策中逐步體現(xiàn)出技術(shù)主題,包括人工智能技術(shù),利用技術(shù)來應(yīng)對數(shù)據(jù)安全問題也成為未來政策與科研關(guān)注點(diǎn)之一,隨著上海、北京在2019年相繼發(fā)布《上海市加快推進(jìn)數(shù)據(jù)治理促進(jìn)公共數(shù)據(jù)應(yīng)用實(shí)施方案》和《北京市公共數(shù)據(jù)管理辦法(征求意見稿)》,政策層面公共數(shù)據(jù)開放與安全主題得以凸顯。此后,階段5出現(xiàn)公共數(shù)據(jù)一系列相關(guān)成果,雖然在科研主題層面未體現(xiàn)協(xié)同關(guān)系,但公共數(shù)據(jù)的科學(xué)研究必將與政策呈現(xiàn)出相互促進(jìn)的關(guān)系,尤其2023年出現(xiàn)公共數(shù)據(jù)開放運(yùn)營、公共數(shù)據(jù)安全、公共數(shù)據(jù)治理的科研成果。該階段科研主題聚焦于數(shù)據(jù)安全問題,其中大數(shù)據(jù)安全、網(wǎng)絡(luò)安全、信息安全均有所涉及。從協(xié)同關(guān)系上來看,此階段科研主題具有承上啟下的特點(diǎn),與前階段政策存在協(xié)同關(guān)系,對后階段政策有一定促進(jìn)作用。
5)階段5(2021—2022)。政策“數(shù)據(jù)處理者”“監(jiān)測預(yù)警”“保障”“政務(wù)數(shù)據(jù)”“大數(shù)據(jù)”等主題與科研主題存在協(xié)同關(guān)系。該階段“政務(wù)數(shù)據(jù)”較為突出,階段3與階段4的科研主題均對政務(wù)數(shù)據(jù)產(chǎn)生正向影響,并促進(jìn)政府頒布政務(wù)數(shù)據(jù)專項(xiàng)制度,如《云南省政務(wù)數(shù)據(jù)共享開放管理暫行辦法(征求意見稿)》《內(nèi)蒙古自治區(qū)政務(wù)數(shù)據(jù)資源管理辦法》《山西省政務(wù)數(shù)據(jù)資源共享管理辦法》等,而河南?。玻埃玻材瓿雠_了專項(xiàng)政務(wù)數(shù)據(jù)安全的管理辦法《河南省政務(wù)數(shù)據(jù)安全管理暫行辦法》,該主題充分說明科研對政策前向影響,并對政策頒布起到推動作用。該階段科研主題聚焦于跨境數(shù)據(jù)流動、數(shù)據(jù)開放、區(qū)塊鏈等問題。從協(xié)同關(guān)系上看,該階段科研受政策引領(lǐng)作用明顯,科研主題主要針對前階段所發(fā)布的政策展開研究。
總體來說,我國數(shù)據(jù)安全政策與科研主題呈現(xiàn)出協(xié)同一致、協(xié)同演進(jìn)的關(guān)系,并且在數(shù)據(jù)要素和跨境數(shù)據(jù)流動主題中出現(xiàn)明顯科研推動政策的協(xié)同趨勢。①協(xié)同一致關(guān)系。如:“大數(shù)據(jù)安全”“網(wǎng)絡(luò)安全”主題一直貫穿整個政策與科研主題中,尤其是在同一階段政策和科研中相互間具有較強(qiáng)的協(xié)同關(guān)系;②協(xié)同演進(jìn)關(guān)系。如:電子政務(wù)、政務(wù)服務(wù)、政府治理、政務(wù)數(shù)據(jù)等政策主題在演進(jìn)過程中,政策與科研互為影響,呈現(xiàn)出從階段3政策主題“電子政務(wù)”到科研主題“政府?dāng)?shù)據(jù)治理”“政府?dāng)?shù)據(jù)開放”到階段4科研主題“政府治理”再到階段5政策主題“政務(wù)數(shù)據(jù)”的協(xié)同演進(jìn)趨勢;③協(xié)同趨勢。在階段5科研主題中出現(xiàn)了“數(shù)據(jù)要素”“跨境數(shù)據(jù)流動”等,此前政策中尚未有該主題出現(xiàn),但2023年10月國家網(wǎng)信辦發(fā)布《規(guī)范和促進(jìn)數(shù)據(jù)跨境流動規(guī)定(征求意見稿)》,2023年12月,國家數(shù)據(jù)局等部門關(guān)于印發(fā)《“數(shù)據(jù)要素×”三年行動計劃(2024—2026年)》的通知,這兩部政策對我國數(shù)據(jù)產(chǎn)業(yè)發(fā)展均具有重要意義,并呈現(xiàn)出新興科研主題進(jìn)一步推動政策的發(fā)展趨勢。
4結(jié)束語
數(shù)字技術(shù)是當(dāng)今世界科技革命和產(chǎn)業(yè)革命的先導(dǎo)力量,數(shù)字技術(shù)賦能實(shí)體經(jīng)濟(jì)推動高質(zhì)量發(fā)展,其中數(shù)據(jù)安全是基石?!稊?shù)據(jù)二十條》中明確提出要把安全貫穿數(shù)據(jù)治理全過程,守住安全底線,明確監(jiān)管紅線,國家頒布的重要政策具有引領(lǐng)作用,為科學(xué)研究指明方向,科學(xué)研究要緊緊圍繞國家總體戰(zhàn)略。而在細(xì)分領(lǐng)域,同時又體現(xiàn)出科學(xué)研究具有引領(lǐng)作用,因?yàn)檎哳C布、實(shí)施、擴(kuò)散具有嚴(yán)謹(jǐn)性、科學(xué)性、周期長等特點(diǎn),科學(xué)研究先行探索,能夠?yàn)檎咧贫ㄌ峁└嗟睦碚摶A(chǔ)與現(xiàn)實(shí)意義。因此,本文以我國數(shù)據(jù)安全領(lǐng)域的547部政策和2466篇科研論文為樣本,結(jié)合NMF主題和Word2vec模型,分別對政策文本和科研論文進(jìn)行主題識別,并通過相似度計算方法探究我國數(shù)據(jù)安全政策與科研主題的協(xié)同情況,結(jié)論如下:一是我國數(shù)據(jù)安全發(fā)展經(jīng)歷了從信息安全、網(wǎng)絡(luò)安全、政府?dāng)?shù)據(jù)安全再到公共數(shù)據(jù)安全的階段。政策從階段1以信息安全和網(wǎng)絡(luò)安全為核心主題;階段2和階段3是數(shù)據(jù)安全政策數(shù)量和主題增長期,這一時期數(shù)據(jù)安全政策主題得以快速豐富,“大數(shù)據(jù)安全”“云技術(shù)安全”“電子政務(wù)”“政府?dāng)?shù)據(jù)治理”等主題開始被重點(diǎn)關(guān)注;階段4數(shù)據(jù)安全政策開始向細(xì)分領(lǐng)域突出,如“公共數(shù)據(jù)安全”“人工智能倫理”“區(qū)塊鏈技術(shù)”等政策主題;階段5科研主題中出現(xiàn)“數(shù)據(jù)安全治理”“數(shù)據(jù)要素”“跨境數(shù)據(jù)流動”等。二是我國數(shù)據(jù)安全政策與科研主題呈現(xiàn)出協(xié)同一致、協(xié)同演進(jìn)的關(guān)系。政策是科研的風(fēng)向標(biāo),發(fā)揮了一定引領(lǐng)作用,而部分科研主題在細(xì)分領(lǐng)域走在政策頒布前列,這是科研對政策頒布起到促進(jìn)作用的體現(xiàn),因此科學(xué)主題與政策主題出現(xiàn)相互促進(jìn)、協(xié)同一致的關(guān)系。如電子政務(wù)、政務(wù)服務(wù)、政府治理、政務(wù)數(shù)據(jù)等政策主題在演進(jìn)過程中,政策與科研互為影響,呈現(xiàn)出從階段3政策主題“電子政務(wù)”到科研主題“政府?dāng)?shù)據(jù)治理”“政府?dāng)?shù)據(jù)開放”到階段4科研主題“政府治理”再到階段5政策主題“政務(wù)數(shù)據(jù)”的協(xié)同演進(jìn)趨勢。
本研究尚存在一定局限:一是僅選取了CSSCI和北大核心的論文,并未將所有論文納入考慮范圍。二是政策獲取雖采取最大努力原則,可能還會有個別政策遺漏,這都可能會影響結(jié)果精準(zhǔn)性。未來研究團(tuán)隊(duì)將在數(shù)據(jù)與算法安全領(lǐng)域持續(xù)研究,將基于顯著度理論,對數(shù)據(jù)安全政策與科研的特征詞進(jìn)行提取,形成更加精準(zhǔn)細(xì)化的研究成果。