肖文芳,黃稚霆,歐俊宏,劉浩鵬,黃詩(shī)琪
(廣東醫(yī)科大學(xué) 生物醫(yī)學(xué)工程學(xué)院,廣東 湛江 524023)
人工智能技術(shù)發(fā)展起源于1956年的夏季[1],最初對(duì)人工智能的構(gòu)想只是使用設(shè)備模擬人類思維并處理問題。后續(xù)的研究使人工智能從單一的設(shè)備研發(fā)發(fā)展成一門涉獵廣泛的交叉學(xué)科。時(shí)至今日,人工智能的重要性已經(jīng)引起了全世界的重視。在事物識(shí)別與判斷,機(jī)器自動(dòng)化與智能化等領(lǐng)域都成為人工智能發(fā)展的重要領(lǐng)域。計(jì)算機(jī)視覺技術(shù)是在計(jì)算機(jī)上利用適當(dāng)?shù)乃惴▽?duì)采集的圖像等進(jìn)行分析的技術(shù),重點(diǎn)在于軟件,關(guān)注點(diǎn)是閱讀后如何使用科學(xué)方法進(jìn)行分析[2]。計(jì)算機(jī)視覺研究已經(jīng)在學(xué)術(shù)領(lǐng)域研究多年,發(fā)展出很多深刻的原理與技術(shù),近年的重點(diǎn)主要放在工業(yè)化進(jìn)程上,如利用GPU和視覺計(jì)算加速器處理數(shù)據(jù)。但計(jì)算機(jī)視覺技術(shù)走出實(shí)驗(yàn)室,走進(jìn)市場(chǎng),還需進(jìn)一步探索。
本文以CNKI為檢索平臺(tái),以“人工智能”與“計(jì)算機(jī)視覺”為檢索主題,時(shí)間區(qū)間為1979—2021年,經(jīng)過檢索與篩選,得到文獻(xiàn)6 028篇。借助CiteSpace[3]、VOSviewer[4]、SPSS[5]等可視化分析軟件,運(yùn)用詞頻分析法及聚類分析法等對(duì)檢出文獻(xiàn)的作者、機(jī)構(gòu)及關(guān)鍵詞進(jìn)行可視化分析與研究,以期把握基于人工智能的計(jì)算機(jī)視覺研究領(lǐng)域的內(nèi)容及特征,并對(duì)未來的研究趨勢(shì)進(jìn)行探討。
將CNKI收錄基于人工智能的計(jì)算機(jī)視覺技術(shù)的文獻(xiàn)數(shù)據(jù)導(dǎo)入VOSviewer軟件中,確定作者為其網(wǎng)絡(luò)節(jié)點(diǎn),經(jīng)過VOSviewer軟件進(jìn)行可視化后得到101個(gè)作者(圖1)。在LabelView視圖中節(jié)點(diǎn)與字體的大小取決于該節(jié)點(diǎn)的權(quán)重。由圖1可見,李偉、袁保宗、藤光輝、阮秋琦等的發(fā)文量較多,其中發(fā)文最多的李偉為23篇。
圖1 基于VOSviewer的作者頻次圖
作者的多維尺度分析實(shí)質(zhì)是依據(jù)作者之間的“距離”即關(guān)系的緊密程度對(duì)研究問題進(jìn)行聚類,能全面反映研究的主要角度與熱點(diǎn)。
利用SPSS進(jìn)行多維尺度分析,得到可視化結(jié)果,如圖2所示。然而仍需對(duì)結(jié)果進(jìn)行有效性和可靠性判斷,其中包括變量的二維分布圖。對(duì)輸出結(jié)果還要判斷其可靠性和有效性,主要通過應(yīng)力系數(shù)(stress)和擬合優(yōu)度的平方(RSQ)進(jìn)行判斷[6]。RSQ越大越好,一般大于0.6認(rèn)為是可接受的,而stress的標(biāo)準(zhǔn)一般0是完美,2.5是優(yōu),3是良,到20則代表擬合效果很差。畫圖后我們得到RSQ=0.988 81,Stress=0.060 81,因此可以認(rèn)為此結(jié)果是有效且可靠的。
圖2 基于SPSS的作者多維尺度分析圖
通過多維尺度分析的結(jié)果可以將基于人工智能技術(shù)的計(jì)算機(jī)視覺研究者分為以下4類。每一個(gè)類當(dāng)中的作者所研究的領(lǐng)域都具有一定的相似性。從圖中可以看出李偉、袁保宗、李德華等距離中心最近,屬于該領(lǐng)域較為有影響力的研究者。
節(jié)點(diǎn)大小代表相對(duì)詞頻,節(jié)點(diǎn)間連線代表共現(xiàn)關(guān)系,連線顏色深淺代表關(guān)聯(lián)度,節(jié)點(diǎn)發(fā)出的連線數(shù)量代表節(jié)點(diǎn)的中心度及在基于人工智能的計(jì)算機(jī)視覺領(lǐng)域的重要程度(圖3)。
由圖3可知,我國(guó)基于人工智能的計(jì)算機(jī)視覺研究領(lǐng)域中,除“人工智能”與“計(jì)算機(jī)視覺”2個(gè)上位關(guān)鍵詞外,“機(jī)器視覺”與“圖像處理”在余下的關(guān)鍵詞中占主要地位,大部分研究方向都與其有聯(lián)系??梢哉J(rèn)為,迄今為止在整個(gè)研究領(lǐng)域中,大部分研究都以機(jī)器視覺或圖像處理為出發(fā)點(diǎn)進(jìn)行研究。無論基于何種出發(fā)點(diǎn),大部分的小型聚類(圖3中未顯示文字的節(jié)點(diǎn)構(gòu)成的聚類)都與這2個(gè)出發(fā)點(diǎn)存在聯(lián)系,小型聚類間的相互聯(lián)系也相當(dāng)緊密,但小型聚類間并沒有產(chǎn)生出新的具有共同高頻詞(新研究重心)的大型聚類(新研究方向),這反映了基于人工智能的計(jì)算機(jī)視覺這一領(lǐng)域空有聯(lián)系,但缺少新的研究重心與方向,只能從過去的研究成果中尋求突破。使用SPSS對(duì)關(guān)鍵詞進(jìn)行多維尺度分析得到圖4。
圖3 關(guān)鍵詞共現(xiàn)圖譜顯示出現(xiàn)頻次15次以上的節(jié)點(diǎn)
結(jié)合圖4的可視化結(jié)果得出,基于人工智能的計(jì)算機(jī)視覺領(lǐng)域從1996—2018年的研究重?zé)狳c(diǎn)大致分為3個(gè)類別:以人工智能和計(jì)算機(jī)視覺為主為一派,以圖像處理和物體與模式識(shí)別為一派及以人機(jī)交互、機(jī)器學(xué)習(xí)為重點(diǎn)一派。同時(shí)也明顯看出人工智能與計(jì)算機(jī)視覺圖像處理這一類要明顯比另外2類離中心較近,屬于核心大類,是目前研究的重中之重。圖4呈現(xiàn)出小型聚類(小型研究方向)間的聯(lián)系是脆弱的,不可靠的,甚至在本質(zhì)上是不甚相關(guān)的。
圖4 基于SPSS的關(guān)鍵詞聚類分析圖
研究前沿的識(shí)別與追蹤能夠?yàn)檠芯空咛峁W(xué)科研究的最新演化動(dòng)態(tài),預(yù)測(cè)研究領(lǐng)域的發(fā)展,識(shí)別需要進(jìn)一步探索的問題。在研究中,前沿往往采用代表該研究相同的詞匯或短語(yǔ)出現(xiàn)次數(shù)的變化進(jìn)行分析。相對(duì)于傳統(tǒng)的高頻主題詞分析,突現(xiàn)主題術(shù)語(yǔ)更適合探測(cè)學(xué)科發(fā)展的新興趨勢(shì)和突然變化。在分析凸顯主題術(shù)語(yǔ)時(shí),可利用突現(xiàn)詞探測(cè)技術(shù)和算法,通過考察關(guān)鍵詞詞頻時(shí)間分布,從中探測(cè)出頻次變化率高的主題詞。
基于人工智能的計(jì)算機(jī)視覺研究前沿劃分為3個(gè)階段(圖5)。
圖5 基于CitesPace的1996—2018年突現(xiàn)率排名前25的關(guān)鍵詞
第一階段:在1996年,基于人工智能的計(jì)算機(jī)視覺研究處于研究初期,產(chǎn)生大量具有突現(xiàn)度和中心度的突現(xiàn)詞,表明人工智能為基礎(chǔ)的計(jì)算機(jī)視覺理論在提出的初期便成為學(xué)術(shù)研究的熱點(diǎn),形成多樣化的研究中心。“小波變換”“主動(dòng)視覺”“圖像識(shí)別”“圖像處理”從出現(xiàn)便呈現(xiàn)出較高的突現(xiàn)度??梢?,本領(lǐng)域初期研究是以圖像的識(shí)別和轉(zhuǎn)換處理為研究熱點(diǎn),隨著研究不斷深化,本領(lǐng)域也逐步界定了具有自身特色的概念和理念,并進(jìn)行推廣。
第二階段:從1997年到2006年,在過去提出的理論被繼續(xù)豐富的基礎(chǔ)上,大量的新研究熱點(diǎn)被提出并進(jìn)行研究?!坝?jì)算機(jī)制圖學(xué)”“計(jì)算機(jī)圖形學(xué)”等詞呈現(xiàn)出20以上的驚人突現(xiàn)度,毫無疑問這是當(dāng)時(shí)最火熱的研究熱點(diǎn)。這表明針對(duì)已識(shí)別的圖像處理與表現(xiàn)成為當(dāng)下的研究熱點(diǎn)。同時(shí),其他的數(shù)據(jù)轉(zhuǎn)換及處理技術(shù)也在飛速發(fā)展。
第三階段:從2006年至今,未見有新研究熱點(diǎn)的提出,原有的研究熱點(diǎn)也逐漸冷卻,2012年后,以往提出的研究熱點(diǎn)都趨于平靜。這表明在經(jīng)歷1996—2005年的理論推廣期和活躍期后,基于人工智能的計(jì)算機(jī)視覺研究進(jìn)入醞釀階段。
突現(xiàn)詞分析結(jié)果表明,人工智能與計(jì)算機(jī)視覺主研究點(diǎn)在歷年來拓展出了諸多研究方向,但各個(gè)方向都未形成明顯的研究派系。各研究方向正在完善自身的理論基礎(chǔ),期待厚積薄發(fā),成為新的研究熱點(diǎn)。
自1996年以來,基于人工智能的計(jì)算機(jī)視覺研究成果收獲頗豐。這足以表明基于人工智能的計(jì)算機(jī)視覺研究整體呈現(xiàn)活躍態(tài)勢(shì)。研究類別包含基本概念、基礎(chǔ)技術(shù)應(yīng)用、具體技術(shù)應(yīng)用、新發(fā)展方向等多方面從理論性到應(yīng)用性的研究。研究方式趨于多樣化。發(fā)文量也呈現(xiàn)隨時(shí)間發(fā)展而上升的趨勢(shì)。整體看來本領(lǐng)域正欣欣向榮。
但基于人工智能的計(jì)算機(jī)視覺研究領(lǐng)域依然存在許多不足。如研究重點(diǎn)的關(guān)聯(lián)不足,作者以及機(jī)構(gòu)間的合作較少,新概念的提出并未引起相關(guān)研究的爆發(fā)性增長(zhǎng)等問題。在未來的研究中,第一,應(yīng)當(dāng)加強(qiáng)作者及機(jī)構(gòu)間的聯(lián)系,強(qiáng)強(qiáng)聯(lián)手,以期做出更好的成果;第二,應(yīng)當(dāng)在保證基礎(chǔ)理論研究的情況下加大對(duì)新生技術(shù)以及概念的研究力度,當(dāng)新概念或技術(shù)成為熱點(diǎn)時(shí),才能更快地暴露其優(yōu)勢(shì)或劣勢(shì),從而決定未來的研究方向;第三,加強(qiáng)領(lǐng)域間的聯(lián)系,多向其他領(lǐng)域借鑒學(xué)習(xí),他山之石可以攻玉,以期獲得新的研究目標(biāo)或者成果。