田學澤
(長沙理工大學 交通運輸工程學院,長沙 410114)
公路工程是一項復雜的系統(tǒng)工程,其前期規(guī)劃至全生命周期中擁有大量的地形數(shù)據(jù),并需要經(jīng)常地進行參數(shù)設計與計算.傳統(tǒng)方法采用計算器進行,不僅繁瑣而且工作量大,同時也無法克服地形圖表示方法的抽象性、概括性及人員視角局限性等難點.地理信息系統(tǒng)(Geographic Information System,GIS)作為一種將采集、存儲、管理、分析、顯示及應用地理信息等功能集成于一體的計算機系統(tǒng),憑借其在分析與處理海量地理信息數(shù)據(jù)上的極大優(yōu)勢,在公路工程領域獲得廣泛應用[1].
目前,國內(nèi)外專家及學者在將GIS 應用于公路工程領域方面已進行了大量研究.Tan 等[2]將遙感與GIS 用于線狀滑坡地質(zhì)災害風險評估,獲得了更準確的評價結果;Al-Aamri 等[3]將GIS 用于繪制道路交通事故熱點地區(qū)的地圖;Bazlamit 等[4]采用GIS 進行路面養(yǎng)護管理系統(tǒng)的開發(fā);張弛等[5]將GIS 技術與智能進化算法相結合用于多年凍土區(qū)公路路線的智能選擇,為多年凍土區(qū)公路路線的選擇提供了新方法;程方圓等[6]采用GIS 與建筑信息模型(Building Information Modeling,BIM)技術相結合的數(shù)據(jù)集成方法進行公路隧道的數(shù)字化管理研究;林報嘉等[7]將XGBoost 機器學習模型與GIS 相結合進行公路崩塌災害易發(fā)性研究.由此可見,關于GIS 在公路工程領域應用的研究主題呈現(xiàn)出多元化,并存在不斷演化出新研究分支的態(tài)勢.因此,有必要對該領域的階段性成果進行系統(tǒng)梳理,以促進該領域?qū)W術的進一步探析.但目前僅有少量學者,如虞顏等[8]對GIS 在公路工程中的應用進行歸納性評述,而尚無以定量與定性相結合方法對公路工程領域GIS 應用進行可視化分析的研究.
鑒于此,本研究對近10 年來CNKI 數(shù)據(jù)庫中公路工程領域GIS 研究的相關文獻進行計量統(tǒng)計、聚類樹狀圖分析、因子分析與多維尺度分析,并結合社會網(wǎng)絡中的可視化知識圖譜與網(wǎng)絡中心性分析,直觀且系統(tǒng)地呈現(xiàn)出公路工程領域GIS研究的現(xiàn)狀結構及熱點,以期為公路工程領域GIS 的應用研究提供理論指導,及時發(fā)現(xiàn)被忽略且可能成為主流熱點的研究主題.
為保證搜集到的數(shù)據(jù)具有全面性與可靠性,研究選取文獻收錄與檢索量最大、數(shù)據(jù)最權威的中國知網(wǎng)(CNKI)數(shù)據(jù)庫為數(shù)據(jù)來源庫.首先,利用高級檢索將檢索條件設置為:主題=“公路工程并含GIS”,時間跨度為2010—2020 年(數(shù)據(jù)采集時間為2021 年1 月3 日),文獻來源類別=全部期刊,共檢索出795 篇相關文獻.經(jīng)剔除征稿通知、論文摘編、人物專訪、專題導讀及文獻評述等關聯(lián)性不大的文獻后,共獲得553 篇有效文獻.然后,對有效文獻數(shù)據(jù)進行清洗:1)采用data 數(shù)據(jù)園軟件剔除無效關鍵詞,如“應用”“影響因素”“應用研究”及“新技術”等無實際研究意義的關鍵詞;2)利用GIGO 軟件合并含義相同、相近或相似,但表達方式不同的關鍵詞,如將“GIS”“地理信息系統(tǒng)”“GIS 系統(tǒng)”與“交通地理信息系統(tǒng)”合并為“GIS”.
科學知識圖譜是一種以知識域(knowledge domain)為對象,采用文獻計量軟件,對文獻中的關鍵詞、機構及作者等信息進行挖掘,進而呈現(xiàn)出科學知識結構關系與演化歷程的圖像.其既能將知識以圖片的形式進行可視化,又可以揭示知識單元或知識群之間復雜的交叉、互動、演化及結構關系[9].目前,該方法已在各學科研究熱點與研究內(nèi)容演化路徑的量化分析中得到廣泛應用[10?13].
本研究采用COOC 1.8 軟件、SPSS 26.0 軟件與UCINET 相結合來分析經(jīng)處理后的文獻數(shù)據(jù),繪制科學知識圖譜及實現(xiàn)可視化分析.其中,COOC 可以快速實現(xiàn)文獻中關鍵詞的提取并將其轉換為共現(xiàn)矩陣與相異矩陣;SPSS 主要用于依據(jù)共現(xiàn)矩陣與相關矩陣進行聚類分析、因子分析及多維尺度分析,將高頻關鍵詞進行研究主題的劃分;而UCINET 是一款由社會網(wǎng)絡研究者開發(fā),經(jīng)加州大學林頓·弗里曼等網(wǎng)絡研究者編寫的功能強大的社會網(wǎng)絡分析工具[14],主要用于關鍵詞共現(xiàn)網(wǎng)絡圖譜的繪制與進行關鍵詞中心性分析.
研究熱點是針對某一領域研究人員在一定時期內(nèi)廣泛關注的主題,而最能反映研究熱點的是文獻中的關鍵詞[15?17].本研究采用COOC 軟件對上述553 篇有效文獻的關鍵詞進行提取,提取關鍵詞的詞頻皆為5 次及以上,共獲得34 個高頻關鍵詞,分別為GIS(361)、公路工程(80)、高速公路(66)、邊坡地質(zhì)災害易發(fā)性評價(27)、路線設計(27)、路面管理系統(tǒng)(25)、BIM 技術(23)、數(shù)據(jù)庫(19).以上關鍵詞基本表征了公路工程領域近10 年來GIS 應用研究的熱點話題,但僅對高頻關鍵詞的數(shù)量統(tǒng)計難以揭示它們之間的核心關系,還需進行高頻關鍵詞共現(xiàn)、相關矩陣分析與多元統(tǒng)計分析,以將熱點研究進行聚類和主題劃分.
2.1.1 共現(xiàn)矩陣
運用COOC 軟件中關鍵詞轉共現(xiàn)矩陣功能得到一個34 × 34 的高頻關鍵詞共現(xiàn)矩陣,見表1.矩陣中關鍵詞兩兩相交的數(shù)值表示兩者共同在文獻中出現(xiàn)的頻次,代表兩者的疏密程度.矩陣對角線上的數(shù)值表示各關鍵詞在文獻中出現(xiàn)的總頻次.由于共現(xiàn)頻次易受各關鍵詞頻次的影響,進而影響后續(xù)的多元統(tǒng)計分析與社會網(wǎng)絡分析.因此,須對高頻關鍵詞共現(xiàn)矩陣進行包容化處理,將其轉換為高頻關鍵詞相關矩陣,以更好地反映關鍵詞之間的親疏程度[18].
表1 公路工程領域GIS 研究高頻關鍵詞共現(xiàn)矩陣(部分)Table 1 Co-occurrence matrix of high-frequency keywords for GIS research in highway engineering field (part)
2.1.2 相關矩陣
運用Ochiai 系數(shù)進行共現(xiàn)矩陣包容化處理,公式為
式中:Ci j為 關鍵詞i和j的共現(xiàn)次數(shù);Ci和Cj分別為關鍵詞i和j的總頻次,即對角線上的數(shù)值.處理后相關矩陣見表2.矩陣中數(shù)值表示關鍵詞的相關度:數(shù)值越接近1,表明相關度越高;越接近0,表明相關度越低;數(shù)值為0 時,表明兩關鍵詞不相關.
2.2.1 聚類分析
聚類分析的目的是使同類事物的同質(zhì)性更高,異類事物的差異性更大.通過對關鍵詞進行聚類分析,可以將距離較近的關鍵詞聚集成同一類團,進而清晰地展示相關領域的研究熱點.將表2導入SPSS 26.0 軟件,通過系統(tǒng)聚類中的分層聚類可繪制出高頻關鍵詞的聚類分析圖譜,如圖1 所示.由圖1 可知,公路工程領域GIS 應用研究的熱點可分為3 個類別:第1 類由14、27、30、16、13、34、7、22、26 和23 組成;第2 類由24、25、15、32、11、17、21 和33 組成;第3 類由5、9、12、4、19、18、1、3、6、8、28、10、31、2、20 和29 組成.其中,第1 類和第3 類下分化出幾個小聚類,形成幾個具有較大交融性的研究分支;第2 類包含的關鍵詞較少,主要有空間分析、最佳路徑、公路交通網(wǎng)絡與交通網(wǎng)通達性評價等高頻關鍵詞,與公路工程領域GIS 應用的實際情況相符.
圖1 公路工程領域GIS 研究高頻關鍵詞樹狀聚類圖Fig.1 High-frequency keyword tree clustering diagram of GIS research in highway engineering field
表2 公路工程領域GIS 研究高頻關鍵詞相關矩陣(部分)Table 2 Correlation matrix of high-frequency keyword for GIS research in highway engineering field (part)
雖然聚類分析可將公路工程領域GIS 應用研究的熱點詞快速分類,但無法體現(xiàn)聚類后各類別的重要程度.因此,仍需進行因子分析與多維尺度分析,以顯示出各類別的重要程度及相對位置.
2.2.2 因子分析
因子分析可利用提取的主要因子,并依據(jù)因子成分得分值對相關性較高的原始指標進行歸類,為下一步多維尺度分析提供參考[19].首先,將表2 中高頻關鍵詞相關矩陣導入SPSS 26.0 軟件進行信度檢驗,Cronbach′s Alpha 值為0.758 >0.7,表明數(shù)據(jù)信度檢驗合格,可用于因子分析.其次,采用主成分分析法進行因子分析,共提取15 個特征值大于1 的公因子,見表3.15 個公因子類別分別為:(1)移動GIS、道路養(yǎng)護、系統(tǒng)開發(fā);(2)邊坡地質(zhì)災害易發(fā)性評價、危險性評價、滑坡監(jiān)測;(3)交通可達性、公路交通網(wǎng)絡;(4)數(shù)據(jù)庫、路面管理系統(tǒng)、GIS;(5)路面養(yǎng)護管理、可視化、BIM 技術;(6)高速公路監(jiān)控系統(tǒng)、高速公路;(7)道路選線、線路設計;(8)空間分析、最佳路徑;(9)信息管理系統(tǒng)、機電系統(tǒng);(10)RS 技術、交通網(wǎng)通達性評價、公路工程;(11)暴雨災害風險評估、ArcGIS;(12)3S 技術、公路信息化系統(tǒng);(13)三維GIS;(14)GPS、WebGIS;(15)空間分布特征.采用因子分析形成的類別較多,且各類別間的相關關系不明確.因此,本研究采用多維尺度分析法繪制多維尺度圖譜對其進行更深地剖析.
表3 總方差解釋Table 3 Explanation of total variance
2.2.3 多維尺度分析
多維尺度分析(Multidimensional Scaling)是一種可將高維度空間的研究對象轉換至低維空間中進行定位、分析與歸納,且保持原有研究對象數(shù)據(jù)關系不變的數(shù)據(jù)分析方法[20].在多維尺度分析圖譜中,關鍵詞的頻次越高,離圖譜的中心位置越近;反之,則越偏離圖譜中心.考慮到相關矩陣中數(shù)值0 較多會影響多維尺度分析結果的準確性,采用相異矩陣進行分析所得到的圖譜更符合實際.因此,在進行多維尺度分析前,需先將相關矩陣轉換為相異矩陣.相異矩陣可用1 ?Ochiai 系數(shù)獲得,見表4.將高頻關鍵詞相異矩陣導入SPSS 26.0軟件中,在度量功能選項卡中選擇多維尺度分析,繪制高頻關鍵詞二維尺度圖譜如圖2 所示.該圖譜在進行多維尺度分析過程中,Stress=0.125,RSQ=0.932,表明數(shù)據(jù)擬合情況可靠.
圖2 二維尺度圖譜Fig.2 Two-dimensional scale map
表4 公路工程領域GIS 研究高頻關鍵詞相異矩陣(部分)Table 4 Dissimilarity matrix of high-frequency keyword for GIS research in highway engineering field (part)
由圖可知,高頻關鍵詞依據(jù)間距可劃分為3 大主題區(qū)域.主題區(qū)域1 主要包括道路選線、路線設計、最佳路徑選擇、空間特征分布、空間分析等高頻關鍵詞,主要探討GIS 的系統(tǒng)設計及多樣化研發(fā),利用移動GIS、三維GIS 與WebGIS 等軟件對地理信息進行處理,以實現(xiàn)道路路線設計與最佳路徑選擇、空間特征分析,可將主題區(qū)域1 描述為GIS 的多樣化研發(fā)與應用;主題區(qū)域2 主要包括公路交通網(wǎng)絡、交通網(wǎng)通達性評價、滑坡監(jiān)測、危險性評價與邊坡地質(zhì)災害易發(fā)性評價等高頻關鍵詞,主要探討公路交通網(wǎng)和地質(zhì)災害方面的研究,可將主題區(qū)域2 描述為公路交通網(wǎng)與地質(zhì)災害評價;主題區(qū)域3 主要包括公路信息化系統(tǒng)、路面養(yǎng)護管理系統(tǒng)、高速公路監(jiān)控系統(tǒng)、信息管理系統(tǒng)與數(shù)據(jù)庫等高頻關鍵詞,主要探討實現(xiàn)公路管理信息化以及與BIM 技術、3S 技術等相結合實現(xiàn)公路管理可視化方面的研究,可將主題區(qū)域3 描述為公路管理信息化與可視化.
通過對最近10 年CNKI 數(shù)據(jù)庫收錄的有關公路工程領域GIS 應用研究的文獻進行聚類分析、因子分析與多維尺度分析,掌握了我國公路工程領域GIS 應用研究的總體現(xiàn)狀.為進一步對我國公路工程領域GIS 應用研究的現(xiàn)狀及發(fā)展趨勢進行深度了解,本研究采用社會網(wǎng)絡分析的可視化與3 種網(wǎng)絡中心度對關鍵詞間的聯(lián)結關系與關鍵詞在網(wǎng)絡中的位置進行分析.
為直觀顯示高頻關鍵詞的聯(lián)結關系,將高頻關鍵詞共現(xiàn)矩陣(見表1)導入UCINET 軟件,利用Netdraw 組件繪制高頻關鍵詞的共現(xiàn)網(wǎng)絡知識圖譜,如圖3 所示.在共現(xiàn)網(wǎng)絡圖譜中,節(jié)點表示關鍵詞,節(jié)點大小表示該關鍵詞出現(xiàn)的總頻次,節(jié)點間連線的粗細表示關鍵詞間共現(xiàn)的頻次[21].由圖3可知,公路工程領域GIS 應用研究共詞網(wǎng)絡圖譜連線較多,不存在孤立節(jié)點,且高頻關鍵詞間的聯(lián)結較為緊密,高頻關鍵詞間的交融與共存性較大.對共現(xiàn)網(wǎng)絡圖譜進行密度分析后發(fā)現(xiàn),該網(wǎng)絡的密度值為0.221,網(wǎng)絡密度值d=2l/[n(n?1)].式中:n為網(wǎng)絡圖譜中節(jié)點的數(shù)目;l為網(wǎng)絡圖譜中各節(jié)點之間連線的數(shù)目,除了可表示網(wǎng)絡圖譜中各個節(jié)點間的親疏關系之外,還可表明網(wǎng)絡圖譜的松緊及研究方向的集中與發(fā)散.本研究中網(wǎng)絡圖譜密度值d為0.221,表明該網(wǎng)絡較松散且研究方向趨于多樣化.
中心度是量化分析社會網(wǎng)絡中節(jié)點權利與地位的方法.若某個節(jié)點的中心度越高,則其在網(wǎng)絡中所處的位置越重要,與其他節(jié)點的聯(lián)系也越緊密,一般采用點度中心度、中間中心度與接近中心度等3 種中心度值進行綜合考量[22].對高頻關鍵詞共現(xiàn)網(wǎng)絡知識圖譜進行3 種中心度的度量,見表5.由表可知,在3 種中心度度量值中排名靠前的高頻關鍵詞基本一致且重復率較高,表明這些高頻關鍵詞處于社會網(wǎng)絡中的核心關鍵位置,是當前公路工程領域GIS 應用研究的熱點.
對圖3 和表5 分析可得:GIS、高速公路、公路工程、道路選線、可視化、滑坡監(jiān)測、邊坡地質(zhì)災害易發(fā)性等關鍵詞處于網(wǎng)絡圖譜的中心位置,且3 種中心度值均靠前,表明這些關鍵詞與其他關鍵詞間的聯(lián)系較為緊密,代表該領域的學術熱點;而BIM 技術、公路信息化系統(tǒng)、系統(tǒng)開發(fā)、高速公路監(jiān)控系統(tǒng)、公路交通網(wǎng)絡、交通可達性與空間分析等關鍵詞處于共現(xiàn)網(wǎng)絡圖譜外圍邊緣位置,且3 種中心度值靠后,雖然這些高頻關鍵詞與其他關鍵詞關聯(lián)度不強,但在推動公路工程領域?qū)崿F(xiàn)信息化與數(shù)據(jù)化管理方面起著重要作用.
圖3 高頻關鍵詞共現(xiàn)網(wǎng)絡知識圖譜Fig.3 High-frequency keyword co-occurrence network knowledge graph
表5 高頻關鍵詞共現(xiàn)圖譜中心度(部分)Table 5 Co-occurrence map centrality of high-frequency keywords(part)
1)本研究對公路工程領域GIS 應用研究的高頻關鍵詞進行詞頻統(tǒng)計,提出無實際研究內(nèi)容的名詞,得出邊坡地質(zhì)災害易發(fā)性評價、路線設計、路面管理系統(tǒng)、數(shù)據(jù)庫及滑坡監(jiān)測等為該領域研究的熱點.采用聚類分析、因子分析與多維尺度分析將高頻關鍵詞進行研究主題歸類,形成GIS 多樣化研發(fā)及應用、公路交通網(wǎng)與地質(zhì)災害評價、公路管理信息化與可視化等3 大主題類別.
2)運用社會網(wǎng)絡分析繪制高頻關鍵詞共現(xiàn)網(wǎng)絡圖譜并進行中心度分析,結果顯示:網(wǎng)絡圖譜密度值為0.221,該網(wǎng)絡較為松散且研究方向較為發(fā)散;代表主流研究熱點的關鍵詞間聯(lián)系較為緊密,皆位于網(wǎng)絡圖譜中心位置且中心度值均靠前.
3)通過對關鍵詞共現(xiàn)圖譜及中心度的分析發(fā)現(xiàn):BIM 技術、公路信息化系統(tǒng)、系統(tǒng)開發(fā)與高速公路監(jiān)控系統(tǒng)等關鍵詞位于圖譜邊緣且中心度靠后,但這些關鍵詞所代表的研究方向在促進公路工程領域?qū)崿F(xiàn)信息化與數(shù)據(jù)化方面起著重要作用,可作為新的研究熱點.
4)本研究采用知識圖譜的方法對國內(nèi)公路工程領域GIS 應用研究的熱點進行量化分析,由于提取的關鍵詞來源于CNKI 數(shù)據(jù)庫近10 年的相關文獻,且采用高頻關鍵詞進行分析,可能會對研究結果的準確性產(chǎn)生干擾,后續(xù)將探析更科學的研究方法.