張顥芳 ,康春穎 ,張 偉
(1.黑龍江大學(xué) 數(shù)據(jù)科學(xué)與技術(shù)學(xué)院,黑龍江 哈爾濱 150000;2.黑龍江大學(xué) 現(xiàn)代教育技術(shù)中心,黑龍江 哈爾濱 150000)
滿語文曾在歷史上起過重要作用。隨著歷史的發(fā)展變化,如今滿語已成為瀕臨消亡的語言, 對這種語言的記錄、保存和研究具有搶救人類瀕危文化資源的重要價值與意義。時至今日,滿語口語僅在黑龍江省富??h三家子村、黑河市大五家子一些滿族村屯中還有遺存,其中僅有年齡在70 歲以上的十幾位老人還可以熟練掌握滿語,50 歲以上滿語會話較好者僅有數(shù)十人。滿語消亡已進入最后階段,形勢緊迫,亟待持續(xù)有效的搶救保護與調(diào)查研究[1]。在此背景下,滿語保護工作者們?yōu)閾尵葷M語搭建了一個大數(shù)據(jù)平臺。大數(shù)據(jù)平臺雖然為信息的處理帶來許多便利,也會引發(fā)新的安全風險與挑戰(zhàn)[2]。本文制定一份安全防范流程,并提出了安全防范模型圖,為此類數(shù)據(jù)平臺提供一個綜合性的安全防范框架。
基于滿語數(shù)據(jù)平臺自身的特點以及當前有關(guān)數(shù)據(jù)平臺安全防范的研究成果,本文首先論述了平臺將會使用的安全防范技術(shù)手段,為模型的建立提供技術(shù)支撐,然后根據(jù)平臺前期建設(shè)及后期維護的工作,設(shè)計出安全防范模型。
1.1.1 防護手段
安全防范中最基礎(chǔ)的防護手段是建立防火墻[3]。平臺科學(xué)地使用軟硬件防火墻,同時將并聯(lián)使用兩個防火墻以增加攻擊難度,并對平臺權(quán)限授予及來訪者身份管理進行系統(tǒng)的分級分類。
由于本平臺是在大數(shù)據(jù)驅(qū)動下的滿語數(shù)據(jù)平臺,平臺的數(shù)據(jù)信息將呈現(xiàn)出體量龐大、種類繁多以及傳播速度快等特點[4],因此平臺數(shù)據(jù)的加密保護將成為防護重點。
1.1.2 檢測手段
平臺的檢測手段有很多,主要分為三種,即漏洞掃描、狀態(tài)監(jiān)控和入侵檢測。漏洞掃描從內(nèi)容上大體分為兩種,一種是掃描Web 應(yīng)用漏洞,另一種是掃描Web 服務(wù)器漏洞。狀態(tài)監(jiān)控意味著在平臺運行的過程中,管理員需實時監(jiān)控平臺數(shù)據(jù)庫的運行狀態(tài)及訪問者狀態(tài)等并進行日志記錄,以保障平臺的安全穩(wěn)定。
入侵檢測則是一種更為積極的主動安全檢測手段,其工作內(nèi)容分為多種:檢測用戶的行為并進行分析,對平臺的異?;顒舆M行攔截與記錄,處理內(nèi)外部攻擊,利用安全防范模型對平臺進行風險評估等[5]。實施方法上則劃分為異常檢測法和混合檢測法。
1.1.3 恢復(fù)手段
數(shù)據(jù)備份是一種預(yù)防式的數(shù)據(jù)保護模式,可應(yīng)對平臺使用過程中出現(xiàn)的數(shù)據(jù)丟失及損壞情況[6]。導(dǎo)致平臺數(shù)據(jù)丟失及損壞的原因多種多樣,不僅是因為有攻擊者入侵,也有可能是由于平臺本身存在漏洞、管理員操作不當?shù)?。同時,數(shù)據(jù)備份還可用于對主數(shù)據(jù)庫和重要文件的監(jiān)控和跟蹤,在備份機中生成對應(yīng)的更新日志,備份系統(tǒng)會根據(jù)更新日志,自動對備份磁盤進行數(shù)據(jù)更新[7]。通過以上操作,最終將實現(xiàn)數(shù)據(jù)信息的備份,為平臺的恢復(fù)提供基礎(chǔ)保障。
根據(jù)滿語數(shù)據(jù)平臺的存儲結(jié)構(gòu)、系統(tǒng)功能及業(yè)務(wù)類別等方面的內(nèi)容,對其采取層次化安全技術(shù)防護,構(gòu)建滿語平臺安全防范模型。模型具體劃分為以下五個層級,如圖1 所示。
圖1 安全防范模型圖
物理層是搭建平臺總體框架的基礎(chǔ),它可以為連接各個設(shè)備并為其之間的數(shù)據(jù)通信提供傳輸媒介。物理層的內(nèi)容涵蓋軟硬件設(shè)備接口、平臺服務(wù)器、數(shù)據(jù)存儲系統(tǒng)基礎(chǔ)設(shè)施設(shè)備和網(wǎng)絡(luò)傳輸設(shè)備。在數(shù)據(jù)傳輸過程中,利用身份認證、權(quán)限管理、入侵檢測等方法,保障物理層所提供的傳輸安全。同時為進一步保障物理層安全,將采用軟硬件安全隔離以及底層數(shù)據(jù)加密技術(shù),使物理層不僅提供數(shù)據(jù)傳輸,更能保障平臺底層安全。
數(shù)據(jù)信息的采集內(nèi)容包含閱讀整理各類滿語文獻資料,并需要調(diào)查者走訪各滿族村落,了解滿語現(xiàn)狀并采訪當?shù)厝恕⑹占瘽M語使用者的發(fā)音音頻等。
其次數(shù)據(jù)信息的匯聚需要管理員將采集到的數(shù)據(jù)信息進行分類整理,然后以數(shù)據(jù)流的形式存入后臺數(shù)據(jù)庫中。并對關(guān)鍵數(shù)據(jù)進行加密處理,賦予不同用戶訪問數(shù)據(jù)的權(quán)限。同時提前對數(shù)據(jù)進行備份并實時更新數(shù)據(jù)信息。
2.3.1 數(shù)據(jù)整理
在數(shù)據(jù)平臺建設(shè)前,需對前期采集的大量數(shù)據(jù)進行整理。文字類型的數(shù)據(jù),可利用相關(guān)軟件進行數(shù)據(jù)整理,數(shù)據(jù)整理包括正確轉(zhuǎn)錄、行或列的重置、凈化數(shù)據(jù)、數(shù)據(jù)審核等。而對于語音和視頻類的數(shù)據(jù),管理員則需要根據(jù)前臺功能模塊的設(shè)計將其分類打包,方便后期以數(shù)據(jù)流的形式接入數(shù)據(jù)庫。同時利用網(wǎng)閘、防火墻等設(shè)備對流入的數(shù)據(jù)進行安全隔離,并通過數(shù)據(jù)管控做到對流入數(shù)據(jù)的溯源和追蹤。
2.3.2 前端設(shè)計
平臺的前臺設(shè)計主要是為了實現(xiàn)用戶界面交互,界面要求功能清晰明了,布局規(guī)整[8]。同時需要對用戶及其相應(yīng)的權(quán)限進行分級分類管理,設(shè)定分級分類名單,并通過數(shù)字簽名驗證身份。
另一方面,平臺前端作為交互的窗口,也會遇到各類數(shù)據(jù)平臺前端攻擊,如 XSS 攻擊、CSRF 攻擊等。平臺管理員需要針對此做到嚴格審查用戶上傳的信息、關(guān)注敏感詞匯、不將重要文件放在用戶都可以觸及的地方以及對平臺的重要操作進行跟蹤驗證等。
2.3.3 后臺設(shè)計
平臺數(shù)據(jù)庫的搭建工作是數(shù)據(jù)建設(shè)層的關(guān)鍵。數(shù)據(jù)庫安全的實現(xiàn)依托多方內(nèi)容,從數(shù)據(jù)庫的功能上劃分,分為兩個層次:第一層次是內(nèi)部環(huán)境,主要是指訪問控制,即不同用戶和管理員的訪問權(quán)限。在這一過程中,平臺需要依靠加密技術(shù)、數(shù)字簽名認證技術(shù)等實現(xiàn)訪問安全。第二層次是外部環(huán)境,在外部環(huán)境中平臺可能會面臨病毒入侵、惡意攻擊等問題。此時管理員需要對平臺進行預(yù)保護,比如數(shù)據(jù)庫備份、設(shè)立防火墻等,同時要應(yīng)用入侵檢測技術(shù),及時對平臺進行安全檢測。根據(jù)數(shù)據(jù)庫的實際授權(quán)情況,對數(shù)據(jù)庫進行相應(yīng)的加密處理。具體如圖2 所示。
圖2 數(shù)據(jù)庫安全的實現(xiàn)
2.4.1 日志分析
日志是指平臺使用者在一定的操作后使系統(tǒng)、軟硬件設(shè)備產(chǎn)生的相應(yīng)記錄[9]。日志分析主要分為三部分內(nèi)容:日志數(shù)據(jù)源、日志分析和日志報告。日志數(shù)據(jù)的狀態(tài)則分為:預(yù)處理、分析計算、整合和關(guān)聯(lián)。通過收集整理來源于平臺各處的日志消息,進行日志分析,從而發(fā)現(xiàn)平臺中潛在的威脅和安全隱患,及時作出相應(yīng)的準備和預(yù)防工作。經(jīng)過以上步驟的工作后,最終將生成日志分析報告,具體內(nèi)容如圖3 所示。
2.4.2平臺管理
數(shù)據(jù)平臺管理主要是指保障本項目所依托的Web 平臺整體的安全,包含用戶接口、前臺系統(tǒng)、后臺系統(tǒng)以及服務(wù)器主機等[10-11]。由于數(shù)據(jù)平臺易于攻擊,攻擊者可選擇的方式更是多種多樣,如網(wǎng)頁篡改、網(wǎng)站后門、數(shù)據(jù)篡改和網(wǎng)絡(luò)代理等。數(shù)據(jù)平臺管理安全主要包含用戶自防御、安全檢測、應(yīng)用防護和防護統(tǒng)計及結(jié)果分析幾部分的工作。具體如圖4 所示。
圖3 日志分析工作模塊
圖4 數(shù)據(jù)平臺安全管理圖
2.4.3 滲透測試
對于清代碑學(xué)發(fā)展的反思、批評的文章如戴逸[4]認為,“碑學(xué)派所說固然也抓住了帖學(xué)派的某些弱點,但門戶之見太深。貶斥異己,一筆抹殺,未必公正。平心而論,北碑派未必都是好字,南帖派也未必都是劣書,北碑南帖各有特色。”黃惇[5]亦認為,金農(nóng)、趙之謙的“稿書”融合碑帖,而楊守敬、沈曾植并不否定帖學(xué),同時提出:“為什么刻帖濾漫、翻刻失真即當拋棄,而碑刻法漫、殘破模糊,卻當備加贊揚呢?”叢文俊[6]更是提出,“就連倡碑名家阮元,書法亦未能逾出主流帖學(xué)之外?!?/p>
滲透測試(Penetration Test)是通過模擬黑客的攻擊方法和漏洞發(fā)掘技術(shù)來評估計算機系統(tǒng)安全的一種評估方法,該方法是從攻擊者角度發(fā)現(xiàn)分析系統(tǒng)的缺陷及漏洞,進而嘗試利用某些漏洞對信息系統(tǒng)實現(xiàn)主動攻擊,從而評估系統(tǒng)存在的可能安全風險問題[12]。借鑒文獻[13]和[14],給出滲透測試的操作流程如圖5所示。
滲透流程分為前期測試準備、中期測試執(zhí)行和后期風險評估。測試準備階段需要確定本次測試的基本情況,如本次測試的目的、方法、參與者和基本操作方案; 實驗過程中是否有一定的安全措施,能否應(yīng)對突發(fā)情況等。
測試執(zhí)行需要首先采集平臺基礎(chǔ)信息,如平臺的域名信息、whois 信息及 IP地址信息;平臺的設(shè)計框架及工作流程;平臺的敏感信息及目錄等[15]。然后正式進行滲透攻擊。現(xiàn)行的滲透方法有很多,如人工檢查、SQL 注入、XSS 跨腳本攻擊、CSRF 跨站請求攻擊等。再將實驗數(shù)據(jù)進行詳細記錄和比對,以便于后期解析平臺漏洞。
圖5 滲透測試流程圖
風險等級評估需要全組實驗人員對獲取的數(shù)據(jù)進行綜合和分析,進行漏洞解析,并給出大數(shù)據(jù)驅(qū)動下的滿語數(shù)據(jù)平臺的風險級別,風險級別一般劃分為“低”、“中”、“高”三個等級。測試者最終生成一份滲透報告,達到對平臺安全進行全面分析的目的。
終端層是指以有線方式或以移動方式連接的終端設(shè)備及相關(guān)傳輸網(wǎng)絡(luò)。用戶可在智能手機、臺式電腦、平板電腦以及相關(guān)移動互聯(lián)網(wǎng)設(shè)備上訪問本平臺。傳輸網(wǎng)絡(luò)則是指與安全服務(wù)分析層的連接,保障網(wǎng)絡(luò)的正常傳輸。
終端層的功能是實現(xiàn)人機交互,因而對終端層的管理需要根據(jù)來訪者的身份進行權(quán)限控制,授予用戶或管理員不同的讀寫能力。同時應(yīng)用數(shù)字簽名認證相關(guān)技術(shù)驗證來訪者身份,保障平臺整體的穩(wěn)定和安全。
安全防范模型投入滿語數(shù)據(jù)平臺應(yīng)用后,依照模型中安全服務(wù)分析層的內(nèi)容,對滿語平臺進行安全測試與評估。實驗流程分為前期訪談、中期檢查和后期測試,即對平臺管理者進行工作訪談,了解平臺搭建的具體情況;檢查平臺的相關(guān)安全設(shè)施和指標;應(yīng)用現(xiàn)行技術(shù)進行安全測試等。實驗的名稱、內(nèi)容、結(jié)果及改進意見如表1 所示。
上述實驗結(jié)束后,針對實驗過程中發(fā)現(xiàn)的問題及改進意見,生成實驗報告。同時根據(jù)實驗情況,給出本滿語平臺安全為“中”等級,平臺存在部分安全隱患,但總體安全情況良好,依據(jù)意見進行改進,有望達到安全“高”等級。應(yīng)用安全防范模型,對平臺進行安全檢測,過程條理清晰、內(nèi)容全面、結(jié)果科學(xué)有依,表明其可為數(shù)據(jù)平臺的安全檢測提供有效方案。
表1 滿語平臺安全測試
本文以滿語數(shù)據(jù)平臺為例,針對滿語保護的迫切性和相關(guān)數(shù)據(jù)資源的珍貴性,設(shè)計出安全防護模型以保障其平臺的安全。防護模型結(jié)合了當下多方面的防護理念及方法,其中詳細論述了安全服務(wù)分析層的內(nèi)容。然而數(shù)據(jù)平臺的安全防護工作不是一蹴而就的,需要平臺管理人員和技術(shù)人員對平臺進行定期檢查、堅持記錄整理日志信息、不斷設(shè)計新的防御方案等。未來的工作主要是嘗試將本文提出的安全防護模型應(yīng)用于各類數(shù)據(jù)平臺的保護工作中,在實踐中不斷調(diào)整模型方案,為大數(shù)據(jù)驅(qū)動下的數(shù)據(jù)平臺安全防護研究提供堅實依據(jù)。