陸安永, 楊會勤, 杭 鵬, 黃夢園, 費 馳, 齊金山
(1.淮陰師范學院 計算機科學與技術(shù)學院, 江蘇 淮安 223300; 2.貴州大學 明德學院 貴州 貴陽 550025)
計算機視覺是研究如何使用機器來模擬人眼的視覺功能,是人工智能的一個重要領(lǐng)域.計算視覺作為近年來的一門新興學科,其目標在于對目標的識別檢測形成從二維圖像到三維圖像認知能力的轉(zhuǎn)變.更簡單的說法就是用電腦和相機代替人的眼睛對所要觀察的目標進行識別、分割、分類、跟蹤和檢測,從檢測的圖像中提取觀察事物的信息,對信息進行圖像加工處理,使電腦成為更適合人眼觀察或檢測圖像的儀器設(shè)備,完成人類難以完成的任務(wù),從而提高工作的效率.計算機視覺依托神經(jīng)網(wǎng)絡(luò)、機器學習、圖像處理、信號處理等技術(shù)來完成視覺信息的分析和處理,從而建立從圖形、視頻、音頻以及三維表現(xiàn)數(shù)據(jù)中進行信息提取的人工智能系統(tǒng).從工作原理的角度來看,所謂視覺技術(shù)主要指的是以成像系統(tǒng)為基礎(chǔ)來模擬人的視覺器官,將其作為計算機的輸出手段,通過計算機來完成信息的處理和解釋.計算機視覺容易受噪聲、光照等環(huán)境因素以及檢測訓練集大小的影響,因此并不意味著計算機視覺就能完全替代人腦,其只作為我們解決問題的輔助手段,即計算機、相機設(shè)備以及各種成像系統(tǒng)并不一定完全按照“人眼”的方法完成數(shù)據(jù)的處理.
計算機視覺目前已廣泛應(yīng)用于醫(yī)療、工業(yè)、航空航天、軍事、交通等領(lǐng)域.在工業(yè)方面,隨著工業(yè)生產(chǎn)的高度機械化、智能化、自動化以及產(chǎn)品質(zhì)量的標準逐步提高,因此對工業(yè)視覺系統(tǒng)的精準性、有效性、時效性有很高的要求.為了滿足工業(yè)需求的發(fā)展,在工業(yè)領(lǐng)域引入了計算機視覺,將工業(yè)視覺和計算機視覺相融合以加快數(shù)據(jù)收集、整合數(shù)據(jù)的速度,提高機器和人工工作效率,進而促進工業(yè)信息化的快速發(fā)展.羅易智[1]詳細闡述了工業(yè)視覺系統(tǒng)、計算機視覺技術(shù)的發(fā)展狀況,分析了視覺技術(shù)中所使用的檢測技術(shù)、圖像處理技術(shù),同時針對視覺技術(shù)進行了多方位的綜合分析.李瑞娟[2]從缺陷種類的角度對印刷品進行了分析,隨后重點對圖像處理法以及方向圖像識別等兩種缺陷檢測方法進行了分析,針對各種檢測方法的優(yōu)缺點進行了分析,對印刷品缺陷檢測的未來發(fā)展進行了展望.我國工業(yè)發(fā)展在無人機行業(yè)的快速發(fā)展下取得了較大進步,在未來無人機巡線也將成為一個主要發(fā)展趨勢.張兆云等[3]在機器視覺在無人機巡線中的應(yīng)用綜述對計算機視覺巡檢技術(shù)以及其面對巡檢時目標檢測容易受天氣、噪音以及設(shè)備故障識別率低和通信信號延遲等問題做了詳細的闡述.在教學方面,劉明[4]選擇體育動作項目基于計算機系統(tǒng)設(shè)計出了一種硬件系統(tǒng)進行模擬,并將其實現(xiàn)了與體育教學實踐的融合,利用虛擬場景對體育運動員的各種姿態(tài)進行交互進而能對體育運動訓練和教學提供客觀、有效的數(shù)據(jù)支撐.醫(yī)療行業(yè)是當下人們最關(guān)心的問題,基于計算機視覺深度學習在醫(yī)學得到了發(fā)展,彭璟等[5]提出了醫(yī)學影像分割是計算機視覺在醫(yī)學影像處理過程中的一個重要領(lǐng)域,應(yīng)用全卷積神經(jīng)網(wǎng)絡(luò)的方法和循環(huán)神經(jīng)網(wǎng)絡(luò)的U-Net方法從醫(yī)學影像中分割出目標區(qū)域以完成聚類分割,對醫(yī)學影像進行數(shù)據(jù)的分析,為疾病診斷和治療提供幫助.戴衛(wèi)兵[6]在研究中以計算機視覺為基礎(chǔ)研發(fā)出一種汽車駕駛系統(tǒng)的圖像信息采集攝像頭技術(shù),能對行駛中的交通信號燈、車輛等進行檢測和識別,與此同時可以將檢測結(jié)構(gòu)件反饋給駕駛員,輔助駕駛員保證安全駕駛.該系統(tǒng)具備了較高的目標識別精確度,識別速度快,且具有較強魯棒性,在市場中的應(yīng)用前景廣泛.異常駕駛行為是造成交通事故的主要原因之一,為了保障行車安全,避免交通事故的發(fā)生,郭佳偉[7]在研究中開發(fā)出了一種建立在計算機視覺基礎(chǔ)上的駕駛員異常識別和預(yù)警系統(tǒng),該系統(tǒng)具備了較高的識別精準度和較強的實時性,其能夠在行使過程中針對駕駛員的狀態(tài)進行及時監(jiān)控和評估,及時發(fā)現(xiàn)異常行為并進行預(yù)警.
為進一步了解目前計算機視覺領(lǐng)域的研究現(xiàn)狀和熱點,本文運用文獻計量法和數(shù)學統(tǒng)計法,以Wed of Sciences核心合集數(shù)據(jù)庫收錄的與計算機視覺(Computer Vision)相關(guān)的近3萬篇文獻為研究對象,借助信息可視化軟件(CiteSpace),根據(jù)相應(yīng)的需求對計算機視覺研究的文獻發(fā)文量、熱點國家、熱點機構(gòu)、學科分布等情況進行分析并生成可視化知識圖譜,對相關(guān)圖譜進行深度分析以求探索計算機視覺的研究趨勢和研究前沿,為該領(lǐng)域的研究提供一定的參考依據(jù).
CiteSpace是一款應(yīng)用于科學文獻中識別并顯示科學發(fā)展新趨勢和新動態(tài)的軟件,也是一款很實用的可視化分析軟件,尤其是在科學引文分析方面,經(jīng)過該軟件分析后最終得出的就是一種被人們稱為是“知識圖譜”的可視化圖形.利用CiteSpace從事某一領(lǐng)域的研究分析時,通過文獻共被引和耦合網(wǎng)絡(luò)分析、主題和領(lǐng)域共現(xiàn)網(wǎng)絡(luò)分析、關(guān)鍵詞共現(xiàn)分析、學科分布分析、國家和作者分布分析等可繪制出各個學科領(lǐng)域的可視化科學知識圖譜,同時也可以生成知識基礎(chǔ)和研究前沿間的聚類視圖、時趨視圖、時間線視圖探索其研究前沿、熱點和演變過程.運用CiteSpace分析學科領(lǐng)域的研究現(xiàn)狀、發(fā)展進程、熱點前沿及其相對應(yīng)的基礎(chǔ)知識,科研人員可以從文獻中識別并發(fā)現(xiàn)所研究領(lǐng)域的發(fā)展新方向和新動態(tài).
基于CiteSpace文獻計量法從作者、國家、學科、機構(gòu)、關(guān)鍵詞等熱點分布突現(xiàn)文獻分析計算機視覺領(lǐng)域的國際熱點話題和研究前沿.首先將位于input文件夾的download.txt文件下載到CiteSpace中,并將其中數(shù)據(jù)完成導(dǎo)入,選擇2000-2020年作為時間段,同時設(shè)置1年的時間切片(Years PerSlice),以摘要(Abstrct)、關(guān)鍵詞 (Author Keywords DE)、標題(Title)和增加關(guān)鍵詞(Keywords PlusID)作為關(guān)鍵術(shù)語.詞類型(Term Type)、節(jié)點類型(Node Type)、連線(Links)、算法分析(Pruning)、可視化視圖(Visualization)等相關(guān)參數(shù)可根據(jù)文獻分析需求進行相應(yīng)的設(shè)置和調(diào)整,完成參數(shù)的設(shè)定和相關(guān)的操作點擊可視化信息軟件CiteSpace的“GO!”即可生成計算機視覺研究文獻的科學知識圖譜并且導(dǎo)出為文本格式,進而將導(dǎo)出數(shù)據(jù)整理到數(shù)據(jù)處理軟件Excel中,結(jié)合知識圖譜和Excel表格數(shù)據(jù)對計算機視覺領(lǐng)域的研究現(xiàn)狀、國際熱點話題和研究前沿進行深度分析.
確定研究文獻的關(guān)鍵詞: 計算機視覺(Computer Vision), 機器視覺(Machine Vision), 卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network), 人工智能(Artificial Intelligence), 深度學習(Deep-Learning), 圖像處理(Image processing), 特征提取(Feature-extraction), 圖像預(yù)處理(Image preprocessing), 目標檢測(Target detection), )圖像分割(Image segmentation).
CiteSpace選擇2000-2020年作為時間段,同時設(shè)置1年的時間切片(Years Per Slice),以國家(Country)作為節(jié)點類型Node Types,以Cosine來為相應(yīng)的連線強度,Within Slices作為其范圍,Pathfinder和Pruning sliced networks為其主要算法(Pruning),Cluster View-Static 和Show Merged Network時期主要可視化視圖,以此為基礎(chǔ)來完成了軟件參數(shù)以及閾值的設(shè)定,并最終繪制出了一種可視化的科學知識圖譜.
計算機視覺研究國家分布圖譜如圖1所示,其中連線代表不同國家合作關(guān)系,粗細程度表示的合作關(guān)系的密度,兩個國家的合作越緊密連線越粗.該知識圖譜中總共包括的節(jié)點數(shù)量為95個,另外連線的
圖1 計算機視覺研究國家分布圖譜
條數(shù)達到82條,聯(lián)系密度(density) 為 0.0184、LRF=3.0、LYB=5、e=1.0;不同節(jié)點表示的不同的國家,根據(jù)圖譜可以將全球范圍內(nèi)不同的計算機視覺領(lǐng)域的分布情況進行清晰展示.另外也可以發(fā)現(xiàn),不同節(jié)點之間連線的粗細以及密度都不高,這也說明不同國家之間的合作關(guān)系一般,各個國家關(guān)于計算機視覺研究仍處于相互獨立狀態(tài).在針對CiteSpace知識圖譜進行分析時,將其中心性定義為大于或者等于1的節(jié)點作為關(guān)鍵節(jié)點.在整個網(wǎng)絡(luò)中心中CT主要指的是不同節(jié)點產(chǎn)生的最短路線的數(shù)量,可以面向整個網(wǎng)絡(luò)來衡量其節(jié)點之間的連接作用.如果對某個節(jié)點來說其CT數(shù)值越大,就表示存在越多的最短路徑,也就表示其作用具有更大的影響程度.
分析計算機視覺文獻發(fā)表國家可視化圖譜和計算機視覺研究國家CT分布(表1)可知, 按照CT進行數(shù)學統(tǒng)計, 排名前三的分別是中國(CHINA)、 美國(USA)、 英國(ENGLAND),其次是法國(FRANCE)、
表1 計算機視覺研究國家CT分布
阿拉伯(ARABIA)、印度(INDIA),西班牙(SPAN).說明各個國家之間的相互影響還是比較大的.更加值得注意的是,通過知識譜圖能看出各個國家在科技領(lǐng)域存在著較大的競爭.
節(jié)點類型(Node Types)、選擇機構(gòu)(Institution)設(shè)置參數(shù)與國家分布的參數(shù)設(shè)置一致,由可視化軟件CiteSpace生成計算機視覺相關(guān)研究機構(gòu)合作圖譜(圖2).所得圖譜與計算機視覺相關(guān)研究的熱點國家合作關(guān)系圖譜較為相似,說明從事計算機視覺領(lǐng)域研究的機構(gòu)在全世界也同樣分布廣泛,但機構(gòu)之間的相互合作也和國家之間的合作關(guān)系呈較弱的態(tài)勢.國家科研機構(gòu)以及高校的合作是機構(gòu)合作密度的主要體現(xiàn),說明各個科研院所和高校在整個的計算機視覺研究領(lǐng)域中起著重要作用,為計算機視覺的發(fā)展做出了貢獻.本文的研究重點是從文獻的角度來分析計算機視覺研究現(xiàn)狀,因此最終會得到關(guān)于高校以及機構(gòu)的大量文獻.從圖2中可以看出,目前計算機視覺研究機構(gòu)分布比較廣泛,其中學術(shù)研究機構(gòu)居多.
為更好地分析計算機視覺研究的熱點機構(gòu),本文結(jié)合了中介中心性(CT)做進一步分析,如表2所示.分析表2中的數(shù)據(jù)可以發(fā)現(xiàn),來自中國的4家研究機構(gòu)(高校)進入了前10名,說明我國科研機構(gòu)從
事計算機視覺領(lǐng)域研究的人員越來越多.從計算機視覺研究機構(gòu)的CT排名表中,香港中文大學(Chinese Univ Hong Kong)、福州大學(Fuzhou Univ)以及中國科學院(Chinese Acad Sci)的CT值都超過了0.1,說明在計算機視覺方面我國的科研機構(gòu)也有著較大的影響力.通過計算機視覺熱點機構(gòu)的可視化圖譜分析并結(jié)合CT表,發(fā)現(xiàn)目前在計算機視覺研究領(lǐng)域中,中國、美國、英國等國的科研機構(gòu)在文獻發(fā)表數(shù)量方面都處于世界領(lǐng)先地位并有著密切的合作.在該研究領(lǐng)域同時排名靠前還有美國卡內(nèi)基·梅隆大學(Carnegie Mellon Uni)、哈佛大學(Harvard Uni)以及英國倫敦大學學院(UCL).
研究熱點是指在某一個學科研究領(lǐng)域中有著重大影響和作用且處在核心地位的一個或者多個研究主題,表明當前該研究領(lǐng)域的研究人員最為關(guān)注的主流研究方向和發(fā)展動態(tài)趨勢.對于科研人員能夠清楚地認識到所要鉆研領(lǐng)域的研究熱點是至關(guān)重要的.因此,為了分析當前計算機視覺的研究熱點,本文從已收集文獻中提取關(guān)鍵詞,運用可視化信息軟件CiteSpace對文獻采用共詞分析,同時結(jié)合最短路徑算法(Shortest path algorithm Path-finder),繪制文獻共引知識圖譜并對其關(guān)鍵路徑進行標識,從而生成計算機視覺領(lǐng)域的熱點知識圖譜,如圖3所示.該知識圖譜是將大量文獻的研究方向進行聚類操作,從而得到共引文獻分析,即關(guān)鍵詞和共詞共現(xiàn)可視化網(wǎng)絡(luò)分析圖譜.其由536個節(jié)點,429條連線組成,其中節(jié)點大小表示相關(guān)文獻被引次數(shù),相應(yīng)詞匯在共引文獻中的出現(xiàn)頻次,各節(jié)點之間的連線反映研究、文獻熱點詞匯之間的聯(lián)系強度.通過詞匯共現(xiàn)生成的聚類科學圖譜,可得到當前計算機視覺領(lǐng)域的熱點話題和研究前沿的網(wǎng)絡(luò)模式結(jié)構(gòu),找到計算機視覺研究進程中的研究熱點和發(fā)展態(tài)勢.
圖3 計算機視覺研究共引文獻及前沿分析圖譜
利用CiteSpace運行得出的數(shù)據(jù),借助Excel軟件可繪制出計算機視覺研究文獻共被引排名分布表(表3).從表3中被引頻次高的文獻可分析出計算機視覺領(lǐng)域的研究熱點等情況.但是筆者發(fā)現(xiàn)由于研究文獻的引用關(guān)系還要受到期刊類別(Journal category)、影響因子(Impact factor)等因素的影響,因此如果只按照研究文獻的被引頻次進行分析會導(dǎo)致一定的偏差.
表3 計算機視覺研究文獻共被引排名分布表
通過CT分析并參考表3中文獻共被引CT函數(shù)值較大的研究文獻,可以更加準確地了解該領(lǐng)域研究的熱點話題.通過對比表3和表4,可以得出結(jié)論,即CT值較高的文獻被引用的次數(shù)也相對較高.通過分析He K M在2016年、Long A在2015年、Ren S Q在2017年發(fā)表于高中介中心性相關(guān)文獻,可以發(fā)現(xiàn)近幾年計算機視覺研究主要集中在圖像識別、神經(jīng)網(wǎng)絡(luò)、目標檢測等階段,其起到的影響較強,從中也能得出計算機視覺研究領(lǐng)域的相關(guān)理論知識.
表4 計算機視覺研究文獻共被引CT排名表
結(jié)合計算機視覺研究共引文獻及研究熱點生成的時區(qū)視圖(圖4).綜合分析可得出從2015年開始有關(guān)計算視覺領(lǐng)域的研究文獻以及研究人員開始逐年增多,其研究方向集中在行為識別、機器學習等研究熱點.根據(jù)TimeLine圖譜呈現(xiàn)的分析結(jié)果進行分析可以說明這些研究主題一直是計算機視覺研究的熱點領(lǐng)域,并且在2015-2018年間的研究熱點在不斷地增多,近兩年(2019-2020)研究熱點的增長幅度有所減小,但是從更深層次的角度來看計算機視覺的研究熱點已“嶄露頭角”. 行為識別、人工智能、機器學習、深度學習等研究熱點相繼問世,并且這些熱點向其他熱點不斷地進行滲透、延伸,更加說明了前幾年的研究熱點依然會是計算機視覺領(lǐng)域的主要研究方向.當前計算機視覺研究的熱點集中在工業(yè)、醫(yī)療、航空航天、交通等多個領(lǐng)域,這表明計算機視覺研究已經(jīng)開始從基礎(chǔ)性的學科理論知識向?qū)嶋H應(yīng)用研究轉(zhuǎn)化,即將理論轉(zhuǎn)化為實踐;同時計算機視覺領(lǐng)域的研究也不會止步,在此基礎(chǔ)之上仍然會向新的研究方向進發(fā),不斷地為人類社會的發(fā)展做出邊際貢獻.
圖4 計算機視覺研究共引文獻TimeLine圖譜
結(jié)合當前我國計算機視覺研究和應(yīng)用現(xiàn)狀,基于CiteSpace文獻計量法對2000-2020年間Web of Sciences核心合集數(shù)據(jù)庫收錄的與計算機視覺研究相關(guān)文獻進行分析,結(jié)果表明該領(lǐng)域存在著文獻發(fā)表數(shù)量不多,各國家以及各個機構(gòu)之間的合作關(guān)系不緊密,計算機視覺研究仍然集中在基礎(chǔ)研究和應(yīng)用層面,具體表現(xiàn)如下:
1) 總體層面上形成的文獻數(shù)量較少.從文獻發(fā)表數(shù)量上看,關(guān)于計算機視覺研究在2013年之后,相關(guān)文獻數(shù)量呈現(xiàn)上升態(tài)勢,但總體發(fā)表數(shù)量還是不多,說明計算機視覺研究力度不夠.
2) 不同國家以及機構(gòu)之間沒有形成緊密合作.根據(jù)發(fā)表文獻分布狀況可知,在各國以及各機構(gòu)內(nèi)關(guān)于計算機視覺研究文獻較多,合作主要以機構(gòu)之間為主,國家之間的合作關(guān)系相對較弱.
3) 以基礎(chǔ)性學科研究為主.計算機視覺研究處于基礎(chǔ)階段,大部分研究還是集中于微觀層面.因此,計算機視覺研究需要進一步的規(guī)?;?、量產(chǎn)化、實際化.
計算機視覺研究目前還是一片待發(fā)現(xiàn)和研究的“藍?!?其發(fā)展?jié)摿€需要研究人員進一步探索和挖掘,需要進一步將理論研究轉(zhuǎn)化為邊際貢獻.希望本文的分析能夠為計算機視覺相關(guān)領(lǐng)域的研究提供一定的借鑒.