唐振宇 趙寧 張斌 馬海群
摘?要:[目的/意義]分析信息環(huán)境對于高效開發(fā)利用開源情報及其產(chǎn)品的影響,為開源情報產(chǎn)品在各個領(lǐng)域更好地發(fā)揮作用提供借鑒和參考。[方法/過程]對國內(nèi)外涉及到開源情報開發(fā)利用的文獻進行分析,歸納總結(jié)其中涉及到哪些技術(shù)類因素和信息環(huán)境因素,采用系統(tǒng)動力學的方法對各個因素進行仿真模擬以測試不同因素在不同條件下對開源情報開發(fā)利用的影響。[結(jié)果/結(jié)論]從因果關(guān)系圖來看,“及時獲取特定語種的開源情報”“完備的技術(shù)體系”“數(shù)據(jù)可視化”3個因素都能對開源情報產(chǎn)品的開發(fā)和利用產(chǎn)生正向的影響,而且隨著測試時間的延長,三者呈現(xiàn)出快速增長的趨勢。在進行合理準確度的“背景評估”情況下,選擇合適、恰當?shù)乃阉饕?,同時快速準確地提取所需要的數(shù)據(jù)往往能夠促進開源情報產(chǎn)品開發(fā)更加符合用戶的預期;越是能夠及時廣泛地提取所需要的數(shù)據(jù),情報產(chǎn)品開發(fā)的可用性以及可行性就越高;選擇合理恰當?shù)乃阉饕?,不僅能有效進行實物信息搜集,間接促進開源情報產(chǎn)品的開發(fā),而且能夠直接促進產(chǎn)品化模式下的開源情報的開發(fā)。
關(guān)鍵詞:開源情報;系統(tǒng)動力學;信息環(huán)境;開發(fā)利用
DOI:10.3969/j.issn.1008-0821.2022.01.003
〔中圖分類號〕G250.2?〔文獻標識碼〕A?〔文章編號〕1008-0821(2022)01-0024-09
Abstract:[Purpose/Significance]Analyze the impact of the information environment on the efficient development and utilization of open source intelligence and its products,and provide reference for the better function of open source intelligence products in various fields.[Method/Process]In the study,the literature related to the development and utilization of open source intelligence was analyzed at home and abroad,the technical factors and information environment factors involved were summerized,and the method of system dynamics was used to simulate each factor to test the influence of different factors on the development and utilization of open source intelligence under different conditions.[Result/Conclusion]From the causality diagram,the three factors,namely“timely access to open source intelligence of specific languages”,“complete technical system”and“data visualization”can have a positive impact on the development and utilization of open source intelligence products,and with the extension of testing time,the three factors show a rapid growth trend.In the case of“background assessment”with reasonable accuracy,choosing the right search engine and extracting the required data quickly and accurately can promote the development of open source intelligence products,which is more in line with users expectations;The more timely and extensirely data can be extracted,the higher the availability and feasibility of intelligence product development;choosing a reasonable and appropriate search engine can not only effectively collect physical information,indirectly promote the development of open source intelligence products,but also directly promote the development of open source intelligence in the mode of productization.
Key words:open source intelligence;system dynamics;information environment;development and utilization
2020年12月11日,中共中央政治局就切實做好國家安全工作舉行第二十六次集體學習。習近平總書記指出,要堅決貫徹落實總體國家安全觀,并提出了具體的10點要求,其中包括“堅持統(tǒng)籌推進各領(lǐng)域安全,統(tǒng)籌應(yīng)對傳統(tǒng)安全和非傳統(tǒng)安全……”,而開源情報在各個領(lǐng)域中應(yīng)對非傳統(tǒng)安全問題的時候可以有效避免出現(xiàn)“信息不對稱”的劣勢[1]。信息化時代有著越來越廣泛、眾多的數(shù)據(jù),雖然技術(shù)發(fā)展日新月異,但是關(guān)于利用信息環(huán)境進行開源情報深層次挖掘、分析并以適當形式展示的研究卻很少。特別是在互聯(lián)網(wǎng)、全媒體和自媒體終端越來越普及的今天,更是需要將開源情報中的有價值信息清晰、準確地提取出來加以分析,并以適當?shù)漠a(chǎn)品化的形式展現(xiàn)給需要的用戶[2],從而更好地展現(xiàn)開源情報的價值,促進開源情報的發(fā)展。由此可見,不管是從國家層面還是開源情報自身層面,對開源情報的開發(fā)和利用都是一個重要問題。
1?國內(nèi)外文獻簡述
關(guān)于技術(shù)因素和信息環(huán)境對于開源情報影響的分析,國內(nèi)學者的研究較少,散見于其他文獻中,主要有:栗琳等[3]認為,技術(shù)的發(fā)展與情報之間存在天然的聯(lián)系,同時給情報的搜集、處理、存儲等方面帶來了變革,同時如何發(fā)揮在情報工作的各個流程中數(shù)據(jù)智能技術(shù)的潛力是今后各國在情報競爭之中需要占領(lǐng)的制高點;鄭少秋等[4]認為,網(wǎng)絡(luò)信息技術(shù)在我國海外非軍事行動中能起到巨大的支撐作用,同時指出網(wǎng)絡(luò)信息技術(shù)只有形成關(guān)鍵的技術(shù)體系,才能對我國的海外利益起到保障作用,并對網(wǎng)絡(luò)信息技術(shù)發(fā)展路線進行合理的規(guī)劃,以期為下一代網(wǎng)絡(luò)信息項目提供借鑒和參考;張猛[5]提出了一種基于Hadoop大數(shù)據(jù)組件生態(tài)的開源情報處理框架,該框架能夠有效改進目前基于TF-IDF權(quán)值的開源情報特征提取算法,有效提升數(shù)據(jù)的提取速度和數(shù)據(jù)量,并通過實例驗證了所提方法的準確性。
而國外信息環(huán)境和技術(shù)對于開源情報的影響分析主要集中在如下兩個方面:第一,具體的分析技術(shù)。美國國土安全部通過采用超級計算機數(shù)據(jù)處理分析系統(tǒng),對于可獲得的海量信息之間的隱藏關(guān)聯(lián)進行分析,從而獲得需要的情報[6];南非的Bradbury D[7]開發(fā)了一款用于公開源信息采集和處理的軟件,通過對人所在的社會網(wǎng)絡(luò)進行分析,進而理解多種抽象的概念并找出其在內(nèi)部存在的聯(lián)系;Will U K[8]也指出,將社會網(wǎng)絡(luò)分析軟件和地理信息可視化技術(shù)結(jié)合起來,能夠有效地挖掘恐怖分子的人際網(wǎng)絡(luò)以及預測可能存在的恐怖襲擊意圖。第二,開源情報在具體領(lǐng)域中的應(yīng)用,目前主要存在于反恐領(lǐng)域。美國康涅狄格大學[9]通過研發(fā)自適應(yīng)安全與分析系統(tǒng),采集來自各種渠道的開源情報信息,進而實現(xiàn)信息的搜尋、共享以及理解,從而幫助情報分析人員識別恐怖分子的活動,并對可能產(chǎn)生的下一步行動進行預判;Hale W C[10]認為,需要將關(guān)系數(shù)據(jù)庫理論與開源情報的搜集、分析結(jié)合起來,研究恐怖分子和恐怖活動之間存在的可能聯(lián)系,從而更好地進行相關(guān)分析和研究。
總體而言,國內(nèi)外已經(jīng)普遍認識到開源情報的價值,但是分析信息環(huán)境對于開源情報影響的研究不論是國外還是國內(nèi)都較少,同時也尚未形成相對完整的體系,已有研究或者是局限于某一具體的技術(shù),或者是考慮將兩個或者三個技術(shù)進行綜合分析,或者是局限于某一具體領(lǐng)域進行研究,或者是處于呼吁層面的分析。將開源情報以產(chǎn)品化的思維進行整體看待,分析不同因素之間彼此的因果關(guān)聯(lián)以及進行相關(guān)的數(shù)據(jù)仿真模擬研究還較為欠缺,而信息環(huán)境和大數(shù)據(jù)等技術(shù)的發(fā)展也使得開源情報的搜集和分析與以往產(chǎn)生了較大的變化。因此,本文采用系統(tǒng)動力學的方法,對開源情報開發(fā)和利用過程中涉及的技術(shù)因素和信息環(huán)境因素進行系統(tǒng)建模和仿真分析,同時結(jié)合分析結(jié)果提出相應(yīng)的建議,為開源情報的產(chǎn)品化利用起到推動作用,促進開源情報產(chǎn)品流程的優(yōu)化。
2?影響因素分析
在運用系統(tǒng)動力學進行分析時,合理、準確的確定影響因素是確保所構(gòu)建方程、模型質(zhì)量的關(guān)鍵。李宇佳等[11]認為,系統(tǒng)動力學涉及的影響因素是多方面的,且不同因素之間能夠相互影響、相互作用;姜鈺等[12]認為,同一影響因素在不同水平或者不同利用程度下會對整體系統(tǒng)的結(jié)果產(chǎn)生長期的影響;張麗麗等[13]在采用SD方法對旅游業(yè)進行研究時顯示,影響因素的選取既要考慮已有研究并與專家學者進行適當?shù)臏贤?,同時還應(yīng)考慮自身研究面臨的實際情況來綜合判定將哪些因素納入研究范疇之中;高航等[14]指出,應(yīng)該根據(jù)所研究問題不同階段或者回路來分別確定涉及的影響因素有哪些。據(jù)此,本文在中國知網(wǎng)以及WOS數(shù)據(jù)庫中做如下文獻調(diào)研:馬增軍等[15]認為,合理的信息需求能夠確保開源情報在搜集和分析的時候有一定的指向性,從而可以提前為情報決策作出準備,并實現(xiàn)情報內(nèi)容的專屬定制;王一帆[16]指出,搜索引擎是搜集開源情報的重要方式之一,在網(wǎng)絡(luò)偵查中能夠?qū)崿F(xiàn)對特定對象以及特定圖片信息的查詢;張恒[17]認為,在信息化環(huán)境下,龐大而復雜的數(shù)據(jù)內(nèi)容要求數(shù)據(jù)分析與情報處理技術(shù)體系具有更高的分析能力,才能為情報的搜集、分析、處理和研判提供更可靠的技術(shù)支撐以及更加準確的技術(shù)平臺;韓娜等[18]在分析外媒報道的涉華暴恐報道時指出,開源信息以不同語種進行發(fā)布,因地制宜地結(jié)合不同地區(qū)的自媒體終端,能夠更貼近國際受眾,達到情報發(fā)布方的目的;Parra V M等[19]認為,在商業(yè)領(lǐng)域?qū)﹂_源情報獲取的大數(shù)據(jù)進行分析時需要合理利用工具進行恰當?shù)臄?shù)據(jù)分析和文本挖掘,并通過對比開源情報工具Pentaho和Jaspersoft在處理不同大小數(shù)據(jù)時的指標說明應(yīng)該將兩個工具結(jié)合起來使用,從而達到最合適的效果;Thomsen C等[20]的研究指出,分析工具和技術(shù)在開源情報的應(yīng)用中不可或缺,運用二者所搜集的信息完整程度越高,信息描述的越清晰準確,得到的結(jié)論往往具有更強的說服力,并通過實例驗證了所提思路的準確性;Prevedello L M等[21]認為,將開源情報的搜集與分析和信息可視化相結(jié)合,能夠更好地拓寬開源情報的使用范圍,同時增加根據(jù)開源情報分析得到的結(jié)論的說服力,并列舉出了具體的使用步驟。
結(jié)合上述文獻調(diào)研的信息,提取其中涉及的關(guān)于信息環(huán)境和技術(shù)領(lǐng)域?qū)τ陂_源情報的影響因素,之后同專家學者進行溝通交流,聽取相關(guān)領(lǐng)域?qū)<业囊庖姴τ绊懸蛩剡M行適當?shù)难a充和修改,最終得到信息環(huán)境對開源情報開發(fā)利用的影響因素表,共計16個二級影響因素,如表1所示。
3?系統(tǒng)動力學模型構(gòu)建
系統(tǒng)動力學建立在非線性動力學以及反饋控制理論的基礎(chǔ)上[22],采用系統(tǒng)動力學方法分析信息環(huán)境因素對于開源情報的開發(fā)利用產(chǎn)生的影響,不僅能夠分析因素之間的相互依賴作用,同時能夠了解系統(tǒng)內(nèi)部結(jié)構(gòu)、功能以及行為之間的動態(tài)關(guān)系,并針對發(fā)現(xiàn)的問題提出相關(guān)建議。
3.1?因果關(guān)系圖的構(gòu)建
在前述識別出的“信息環(huán)境”因素及其各自包含的二級影響因素的基礎(chǔ)上,使用Vensim軟件構(gòu)建其對開源情報開發(fā)利用影響的因果回路圖,如圖1所示。
圖1中,共計包含兩個反饋回路:
回路1:數(shù)據(jù)挖掘→數(shù)據(jù)可視化→及時獲取特定語種的開源情報→數(shù)據(jù)的可信度分析→數(shù)據(jù)的可行性分析→數(shù)據(jù)集的清洗和預處理→數(shù)據(jù)挖掘;
回路2:數(shù)據(jù)的可信度分析→情報產(chǎn)品→清洗搜集實物信息→完備的技術(shù)體系→技術(shù)鏈和技術(shù)平臺→數(shù)據(jù)可視化→及時獲取特定語種的開源情報→數(shù)據(jù)的可信度分析。
3.2?系統(tǒng)流圖的構(gòu)建
構(gòu)建合理、恰當?shù)南到y(tǒng)流圖是后續(xù)采用系統(tǒng)動力學方法分析“信息環(huán)境”因素對開源情報的開發(fā)利用造成哪些影響,并進行數(shù)據(jù)仿真模擬的重要基礎(chǔ)。根據(jù)圖1的信息環(huán)境對開源情報開發(fā)利用影響的因果關(guān)系圖,借助Vensim軟件構(gòu)建系統(tǒng)流圖,如圖2所示。
3.3?主要方程及設(shè)計說明
近十多年來,開源情報已經(jīng)成為越來越被關(guān)注的研究課題。同時,隨著信息化環(huán)境的變革以及總體國家安全觀的提出,不僅僅使得情報工作面臨的問題與之前有了很大的不同,而且開源情報也慢慢地成為國家安全工作的重要組成部分,在國內(nèi)外各個領(lǐng)域中都發(fā)揮著自己的作用。因此,單純的通過一份調(diào)查問卷、訪談或者已有數(shù)據(jù)的衡量往往不能夠準確地表達不同因素之間的關(guān)系及其對整個系統(tǒng)的影響。通過已有的系統(tǒng)動力學研究文獻可以看出[23],采用該方法進行分析,不囿于具體的數(shù)值,而是更加注重要素之間的相互作用關(guān)系以及動態(tài)的變化過程。所以本次研究在借鑒已有學者研究[22-23]的基礎(chǔ)上,結(jié)合研究的實際情況,對涉及的因素進行初始化設(shè)定并進行多次仿真模擬,以求得最終與理論預想較為符合的仿真模型。具體方程以及設(shè)計說明如下,其中常量如E5、E6等按照重要程度進行賦值,重要程度越高,賦值越大,反之越低。
E1:信息搜集準確性=Time*2;
E2:信息搜集連續(xù)性=Time*2,即隨著模型運行時間的增長,越來越能夠準確以及連續(xù)地搜集情報產(chǎn)品的相關(guān)信息;
E3:及時廣泛的提取數(shù)據(jù)=9;
E4:及時獲取特定語種的開源情報=INTEG(0.9*(及時獲取特定語種的開源情報+背景評估+數(shù)據(jù)可視化),2),即初始值設(shè)為2;
E5:反饋=5;
E6:合理的搜索引擎=5;
E7:合理識別信息需求=Time*反饋*及時廣泛的提取數(shù)據(jù);
E8:完備的技術(shù)體系=0.5*技術(shù)成熟*清晰搜集實物信息;
E9:情報產(chǎn)品=0.5*(合理識別信息需求+數(shù)據(jù)的可信度分析)*IF THEN ELSE(背景評估>5,6,IF THEN ELSE(背景評估=5,5,4))/(反饋*改進);
E10:技術(shù)成熟=Time*4;隨著時間的增長,技術(shù)的成熟程度越來越高;
E11:技術(shù)鏈和技術(shù)平臺=完備的技術(shù)體系*1.5;
E12:改進=7;
E13:數(shù)據(jù)可視化=(技術(shù)鏈和技術(shù)平臺+數(shù)據(jù)挖掘)*1.5;
E14:數(shù)據(jù)挖掘=(技術(shù)鏈和技術(shù)平臺+數(shù)據(jù)集的清洗和預處理)*1.8;
E15:數(shù)據(jù)的可信度分析=背景評估*0.3*及時獲取特定語種的開源情報;
E16:數(shù)據(jù)的可行性分析=數(shù)據(jù)的可信度分析*0.4;
E17:數(shù)據(jù)集的清洗和預處理=數(shù)據(jù)的可行性分析*0.7;
E18:清晰搜集實物信息=(信息搜集準確性+信息搜集連續(xù)性+合理的搜索引擎)*(情報產(chǎn)品+IF THEN ELSE(及時廣泛地提取數(shù)據(jù)<9,2,IF THEN ELSE(及時廣泛地提取數(shù)據(jù)=9,10,20)))*0.8;
E19:背景評估=5。
3.4?模型檢測
系統(tǒng)流圖以及相關(guān)方程設(shè)定完畢之后,需要進行系統(tǒng)檢測以確保構(gòu)建的模型完整以及合理運行。在Vensim軟件中使用“Check Model”模塊,經(jīng)檢測得到“Model Is Ok”的結(jié)果,即所構(gòu)建的模型可以運行并進行下一步的分析。
4?模型仿真及結(jié)果分析
在上述對模型進行檢測的基礎(chǔ)上,通過對模型的初始條件進行設(shè)定,能夠有效地進行系統(tǒng)動力學的仿真模擬。在本次研究中的初始條件設(shè)定如下:平臺采用Vensim PLE7.3.5,INITIAL TIME=0,F(xiàn)INAL TIME=24,TIME STEP=1,UNITS FOR TIME=MONTH,INTEGRATION TYPE=EULER。通過調(diào)整不同參數(shù)的數(shù)值來了解系統(tǒng)的變化情況。
4.1?模型的仿真模擬
在既定參數(shù)的條件下,結(jié)合已有文獻分析發(fā)現(xiàn),“及時獲取特定語種的開源情報”“完備的技術(shù)體系”“數(shù)據(jù)可視化”3個因素在不同學者進行開源情報研究中占據(jù)比較重要的位置,因此選擇上述3個因素,觀察它們隨時間的變化情況,如圖3所示。
如圖3(a)所示,對特定語種的開源情報進行獲取是一個漫長的過程,在剛開始的時間段內(nèi)進行試探性的摸索,第20個月左右開始產(chǎn)生緩慢的增加,同時隨著“背景評估”越來越精準,“數(shù)據(jù)的可視化”以及“數(shù)據(jù)的可信度分析”能力的提高,獲取特定語種開源情報的能力越來越強,在第20個月之后呈現(xiàn)出快速增長的態(tài)勢。
“完備的技術(shù)體系”不僅需要技術(shù)上的成熟,同時還需要有一整套的技術(shù)鏈和技術(shù)平臺以及對實物信息的準確搜集。從圖3(b)的數(shù)據(jù)上來看,“完備的技術(shù)體系”構(gòu)建在前10個月的上升是緩慢的,主要是由于技術(shù)的積累不是一蹴而就的,需要進行長時間的積淀,但是從第10個月開始,完備的技術(shù)體系構(gòu)建程度逐漸加快,到第20個月之后的增長速度越來越快,并在研究時間段內(nèi)處于逐步上升的態(tài)勢。
“數(shù)據(jù)可視化”不僅僅依賴于成熟的技術(shù)鏈以及技術(shù)平臺,同時還與“數(shù)據(jù)挖掘”有著較密切的聯(lián)系,而“數(shù)據(jù)可視化”能達到的程度對于是否能夠及時有效地獲取特定語種的開源情報也有著至關(guān)重要的影響。從圖3(c)的數(shù)據(jù)來看,在前20個月的時間里,“數(shù)據(jù)可視化”的程度基本隨著時間的增長沒有變化,這說明該變量的基礎(chǔ)需要進行長時間的積淀,技術(shù)、平臺等都需要進行慢慢地積累,而從第20個月之后,技術(shù)的積累已經(jīng)達到了一定的程度,而且相關(guān)平臺的建設(shè)也基本符合數(shù)據(jù)可視化所提出的要求,隨著時間的增長,“數(shù)據(jù)可視化”的能力逐步增強,從而更好地對獲取特定語種的開源情報起到支撐和幫助作用,有力地促進開源情報的產(chǎn)品化。
4.2?模型的靈敏度分析
靈敏度分析是采用Vensim軟件進行系統(tǒng)動力學仿真模擬的一個重要步驟,通過調(diào)整某一變量的大小,觀察不同數(shù)值下該變量的變化對系統(tǒng)最后結(jié)果的影響[24]?;趯﹂_源情報產(chǎn)品開發(fā)利用影響因素的分析以及由此構(gòu)造出的因果關(guān)系圖、系統(tǒng)流圖的分析,對背景評估、及時廣泛的提取數(shù)據(jù)、合理的搜索引擎采用靈敏度測試,根據(jù)測試結(jié)果對開源情報產(chǎn)品的開發(fā)和利用提供科學化的策略與建議。之所以選擇上述3個因素進行靈敏度測試,主要原因在于信息技術(shù)的發(fā)展日新月異,同樣的技術(shù)在不同的背景環(huán)境下可能會產(chǎn)生不同的效果,而及時有效地進行廣泛的數(shù)據(jù)提取不僅能夠為背景評估提供有效的分析依據(jù),也能夠為開源情報的分析和利用提供有效的資料支撐。同時,情報產(chǎn)品、實物信息以及數(shù)據(jù)可信度也能夠直觀反映開源情報的開發(fā)和利用效果。
1)背景評估。合理有效的背景評估不僅能夠為開源情報產(chǎn)品的開發(fā)和利用提供參考,同時也能夠克服前期資料搜集工作中所遇到的障礙。現(xiàn)將“背景評估”的數(shù)值進行調(diào)整得到3條不同顏色的曲線,其中綠色曲線的數(shù)值為4,紅色曲線為5,藍色曲線為6,如圖4(a)~(c)所示。
如圖4(a)~(c)所示,隨著“背景評估”數(shù)值的逐漸提高,對“數(shù)據(jù)的可信度分析”“清晰搜集實物信息”以及“情報產(chǎn)品”的影響逐步增強,在前20個月的時間里,數(shù)值的改變對上述三者的影響不是很大,但是從第20個月之后呈現(xiàn)出較大的差別。結(jié)合3條曲線在第24個月所能達到的數(shù)值來看,“背景評估”進行得越充分,越能夠清晰有效地搜集實物信息,有助于開源情報產(chǎn)品開發(fā)利用技術(shù)的有效積累,提高情報產(chǎn)品的開發(fā)和利用效率[25],其次是對情報產(chǎn)品的影響,能夠確定開源情報產(chǎn)品具體的市場前景,從而擴大情報產(chǎn)品的利用范圍,最后是對數(shù)據(jù)可信度分析的影響,能夠盡量使得數(shù)據(jù)與現(xiàn)實情報產(chǎn)品的情況更加匹配。
2)及時廣泛的提取數(shù)據(jù)。及時、廣泛地提取與開源情報產(chǎn)品有關(guān)的數(shù)據(jù)能夠有效地支撐開源情報產(chǎn)品的開發(fā),并以量化的方式對產(chǎn)品的開發(fā)進度進行衡量。據(jù)此,調(diào)整“及時廣泛地提取數(shù)據(jù)”的數(shù)值,得到3條曲線,其中藍色曲線代表的數(shù)值為10,紅色曲線為9,綠色曲線為8。3個數(shù)值下對應(yīng)的“清晰搜集實物信息”“情報產(chǎn)品”以及“數(shù)據(jù)的可信度分析”靈敏度如圖5(a)~(c)所示。
從圖5(a)~(c)中可以看出,隨著時間的延續(xù),“及時廣泛地提取數(shù)據(jù)”對3個變量的影響基本都是正向的。但是在第20個月之前基本都是處在一個慢慢積累的過程,因為開源情報的來源較廣,數(shù)據(jù)的提取需要一個時間段才能夠完成,從第20個月開始,前期數(shù)據(jù)積累的效果逐漸顯現(xiàn),而且提取數(shù)據(jù)越全面、廣泛,那么實物信息搜集的就越完整,情報產(chǎn)品的開發(fā)和利用就能夠得到越廣泛的數(shù)據(jù)支撐,數(shù)據(jù)的可信度就越高。
3)合理的搜索引擎。適當?shù)乃阉饕婺軌驇椭_發(fā)人員篩選有價值的信息,找到需要的數(shù)據(jù),進而提高工作效率。因此調(diào)整“合理的搜索引擎”數(shù)值,得到3條曲線,其中紅色曲線對應(yīng)的數(shù)值為4.5,綠色曲線對應(yīng)的數(shù)值為5,藍色曲線對應(yīng)的數(shù)值為5.5,如圖6(a)~(c)所示。
從圖6(a)~(c)中可以看出,搜索引擎的合理程度對于實物信息搜集程度、“情報產(chǎn)品”以及“數(shù)據(jù)的可信度分析”三者明顯呈現(xiàn)出正相關(guān)且長期的影響。在初始階段尚處于數(shù)據(jù)積累時期,對三者的影響沒有完全顯現(xiàn)。在第18個月之后,不同合理程度的搜索引擎所產(chǎn)生的影響區(qū)別較為明顯,且隨著時間的延續(xù),區(qū)別越來越大,而且在一定范圍內(nèi),搜索引擎選擇得越合理,第24個月所得到的數(shù)值越好;從第24個月各曲線與縱軸相交的數(shù)值來看,“合理的搜索引擎”對于“清晰搜集實物信息”和“情報產(chǎn)品”的影響比對于“數(shù)據(jù)的可信度分析”的影響要高。
5?結(jié)論與建議
近年來,隨著總體國家安全觀的一步步落實以及我國所面臨的日益嚴重的非傳統(tǒng)安全問題帶來的威脅,開源情報越來越能體現(xiàn)出其獨有的作用。以產(chǎn)品化的思維對開源情報的內(nèi)容進行挖掘,并準確、完整地展示給用戶,從而真正讓開源情報的觀念和內(nèi)容深入人心是開源情報在開發(fā)和利用過程中需要考慮的主要問題。通過本文的研究可以發(fā)現(xiàn):信息環(huán)境方面對開源情報的影響不是線性的,“背景評估”“及時廣泛地提取數(shù)據(jù)”“合理的搜索引擎”對于“情報產(chǎn)品”“數(shù)據(jù)的可信度分析”以及“清晰搜集實物信息”基本呈現(xiàn)出正相關(guān)的影響。
而且背景評估越合理,提取數(shù)據(jù)越及時廣泛,以及選擇的搜索引擎越合理,越有利于情報產(chǎn)品的開發(fā)。同時根據(jù)系統(tǒng)流圖以及仿真模擬來看,及時獲取特定語種的開源情報有助于數(shù)據(jù)的可信度分析,并進一步促進情報產(chǎn)品的開發(fā),而“及時獲取特定語種的開源情報”隨著時間的延續(xù)是慢慢增長的;而“完備的技術(shù)體系”隨著時間的延續(xù)其增長態(tài)勢較之于其他幾個因素較快,該因素不僅有助于“數(shù)據(jù)的可視化”,同時也能夠進一步促進開源情報產(chǎn)品的合理開發(fā)和使用。因此,綜合系統(tǒng)流圖的仿真模擬以及各因素的靈敏度分析來看,只有在確保技術(shù)到位、信息充足以及分析合理的情況下,才能夠保證開源情報價值得到最大程度的挖掘,開源情報產(chǎn)品得以最合理的利用。所以,本文在從產(chǎn)品化思維的視角下對開源情報進行開發(fā)和利用提出以下建議,希望不僅有助于開源情報自身的研究得以更進一步,同時進一步推動開源情報在總體國家安全觀視閾下發(fā)揮應(yīng)有的作用。
第一,科學、合理、有效地進行開源情報產(chǎn)品的背景評估。以產(chǎn)品化的思維進行開源情報的開發(fā)和利用[26],首先需要對該產(chǎn)品的背景情況進行充分的調(diào)研與評估,才能夠更加及時地獲取針對此種情報產(chǎn)品的特定語種的開源情報。此外,背景評估是否充分也是對數(shù)據(jù)可信度進行檢驗的方式,而數(shù)據(jù)可信度的高低直接影響情報產(chǎn)品的質(zhì)量。同時,背景評估也是對開發(fā)出的開源情報合理性與否的一個直接衡量指標,開發(fā)出的開源情報產(chǎn)品必須是在現(xiàn)行背景下能夠合理發(fā)揮作用的才可以,如果產(chǎn)品性能過于落后,則不能體現(xiàn)出開源情報的優(yōu)越性,如果產(chǎn)品性能不能有效發(fā)揮,則是對開源情報產(chǎn)品的一種浪費,也不能體現(xiàn)開源情報的作用。因此,采用包括文獻調(diào)研、實地調(diào)研、走訪調(diào)研、訪談?wù){(diào)研等多種方式作為背景評估的手段,從而為后續(xù)情報產(chǎn)品的開發(fā)和利用打下基礎(chǔ)。
第二,廣泛、快速、及時有效地提取涉及開源情報評估以及產(chǎn)品開發(fā)需要的數(shù)據(jù)。提取恰當?shù)臄?shù)據(jù)不僅有助于對實物信息進行更加全面、宏觀的掌握[27],同時也能夠合理地識別用戶對于開源情報產(chǎn)品的潛在需求,進而更好地指導開源情報產(chǎn)品的開發(fā)。但是從前文分析來看,使數(shù)據(jù)發(fā)揮應(yīng)有的作用是一個需要前期漫長積累的過程,因此,可以結(jié)合大數(shù)據(jù)等技術(shù)在前期對可能需要的數(shù)據(jù)進行預判、預先整理或者搜集,從而節(jié)省開發(fā)時間,提高產(chǎn)品的開發(fā)效率。
第三,根據(jù)不同情報產(chǎn)品的類型,合理選擇不同的情報引擎來進行情報搜索。針對不同年齡段、不同階層、不同文化程度的用戶,提供滿足其自身需要的不同開源情報產(chǎn)品類型[28],而這些不同的產(chǎn)品類型對數(shù)據(jù)的側(cè)重點各不相同。不同的搜索引擎獲得的信息類型各不相同,有的側(cè)重于圖形、圖像,有的側(cè)重于具體數(shù)據(jù),有的偏向于文字表述,這就需要靈活采用一種或者幾種搜索引擎來結(jié)合使用,從而給不同類型的用戶更好的體驗,發(fā)揮情報“耳目、尖兵、參謀”的作用。
第四,注重從社交媒體等“大環(huán)境”中提取有效的開源情報。隨著5G、物聯(lián)網(wǎng)等信息技術(shù)的廣泛普及,各種移動終端、自媒體等數(shù)量呈現(xiàn)出井噴式的爆發(fā)增長,而由此帶來的信息基數(shù)的增長也是快速的,而如何從中提取出準確的開源情報也成為擺在情報分析人員面前的挑戰(zhàn)。將日常的環(huán)境因素、信息因素以及信息技術(shù)的發(fā)展等有效地結(jié)合起來,才能夠盡最大可能獲得全面有效的開源情報產(chǎn)品,最大化地發(fā)揮開源情報自身的作用。
總體來看,在信息化環(huán)境的變革下,特別是技術(shù)日新月異發(fā)展的情境下,情報所涉及的內(nèi)容和范疇已經(jīng)和之前有了很大的差別,既需要傳統(tǒng)的秘密情報,也需要將目前的開源情報納入其中來發(fā)揮作用,應(yīng)用產(chǎn)品化的思維對開源情報進行利用,能夠探索出促進開源情報為國家做出貢獻的新路徑。
參考文獻
[1]唐超.基于開源情報的風險監(jiān)測—預警—決策系統(tǒng)構(gòu)建[J].情報雜志,2013,32(1):145-149.
[2]劉文禮.面向網(wǎng)絡(luò)媒體的開源情報解析方法與誘導策略研究[D].長沙:國防科學技術(shù)大學,2014.
[3]栗琳,孫敏.數(shù)據(jù)智能技術(shù)驅(qū)動的情報全流程變革及發(fā)展[J].情報理論與實踐,2020,43(10):7-12.
[4]鄭少秋,汪中原,鄧克波,等.面向海外非戰(zhàn)爭軍事行動的網(wǎng)絡(luò)信息技術(shù)需求[J].指揮信息系統(tǒng)與技術(shù),2020,11(1):7-11,29.
[5]張猛.基于大數(shù)據(jù)框架的開源情報特征提取算法[J].艦船電子工程,2020,40(9):36-40.
[6]李會明.美國國家公開情報研究中心[J].國際資料信息,2008,(6):29-31.
[7]Bradbury D.In Plain View:Open Source Intelligence[J].Computer Fraud & Security,2011,(4):4-9.
[8]Wiil U K.Counterterrorism and Open Source Intelligence[M].Berlin:Springer,2011:1-6.
[9]陳勇,張佳驥,吳立德,等.基于開源信息的情報分析系統(tǒng)[J].無線電工程,2009,39(5):25-28.
[10]Hale W C.Twenty-first Century Terrorism,Twenty-first Century Answers-the Why and How of Collection,Analysis,and Dissemination of Open Source Intelligence[D].Huntsville:Sam Houston State University,2005.
[11]李宇佳,張向先,張克永.用戶體驗視角下的移動圖書館用戶需求研究——基于系統(tǒng)動力學方法[J].圖書情報工作,2015,59(6):90-96,119.
[12]姜鈺,賀雪濤.基于系統(tǒng)動力學的林下經(jīng)濟可持續(xù)發(fā)展戰(zhàn)略仿真分析[J].中國軟科學,2014,(1):105-114.
[13]張麗麗,賀舟,李秀婷.基于系統(tǒng)動力學的新疆旅游業(yè)可持續(xù)發(fā)展研究[J].管理評論,2014,26(7):37-45.
[14]高航,丁榮貴.基于系統(tǒng)動力學的網(wǎng)絡(luò)輿情風險模型仿真研究[J].情報雜志,2014,33(11):7-13.
[15]馬增軍,王凈.美軍開源情報發(fā)展歷程及任務(wù)管理體系綜述[J].現(xiàn)代情報,2015,35(7):172-176.
[16]王一帆.開源情報在我國反恐工作中的應(yīng)用研究[D].北京:中國人民公安大學,2017.
[17]張恒.基于開源情報的情報處理系統(tǒng)模型構(gòu)建[J].情報雜志,2014,33(3):54-57.
[18]韓娜,楊光.基于公開源情報的涉華暴恐問題國際輿論研究——以1996—2017年外媒報道為例[J].情報雜志,2019,38(8):113-120.
[19]Parra V M,Mohammad A,Syed A.et al.Pentaho and Jaspersoft:A Comparative Study of Business Intelligence Open Source Tools Processing Big Data to Evaluate Performances[J].International Journal of Advanced Computer ence and Applications,2016,7(10):20-29.
[20]Thomsen C,Pedersen T B.A Survey of Open Source Tools for Business Intelligence[J].International Journal of Data Warehousing and Mining,2009,5(3):56-75.
[21]Prevedello L M,Andriole K P,Hanson R.et al.Business Intelligence Tools for Radiology:Creating a Prototype Model Using Open-Source Tools[J].Journal of Digital Imaging,2008,23(2):133-141.
[22]馬海群,張濤,李鐘雋.新冠疫情下政府數(shù)據(jù)開放與安全的系統(tǒng)動力學研究[J].現(xiàn)代情報,2020,40(7):3-13.
[23]馬海群,馮暢.信息資源管理政策執(zhí)行力影響因素研究——以《關(guān)于加強信息資源開發(fā)利用工作的若干意見》為例[J].中國圖書館學報,2020,46(2):56-74.
[24]石永強,彭樹,張智勇,等.基于系統(tǒng)動力學第三方直通集配中心模式研究[J].管理科學學報,2015,18(2):13-22.
[25]楊建英,余至誠.開源情報在中國國家安全情報中的地位和作用分析[J].情報雜志,2019,38(10):21-26,145.
[26]丁波濤.國外開源情報工作的發(fā)展與我國的對策研究[J].情報資料工作,2011,(6):103-106.
[27]傅暢.面向?qū)n}應(yīng)用的開源情報挖掘系統(tǒng)研究與應(yīng)用[D].成都:電子科技大學,2016.
[28]文旆.開源運動及其影響研究[D].長沙:國防科學技術(shù)大學,2014.
(責任編輯:孫國雷)