文/馬俊
智能機器概念的提出,推動機器技術(shù)不斷的發(fā)展,促進(jìn)計算機視覺技術(shù)的發(fā)展。智能機器依靠視覺技術(shù)實現(xiàn)感知,智能機器具備“看”的功能,借助攝像機和處理器采取、提取和處理相關(guān)對象信息。深度學(xué)習(xí)技術(shù)是一項計算機視覺數(shù)據(jù)處理智能技術(shù),以客觀事物作為基礎(chǔ)提供相關(guān)數(shù)據(jù)信息,深入的發(fā)掘和利用,達(dá)到圖像識別等,計算機視覺技術(shù)處理速度快,數(shù)據(jù)量大,精確度高。
計算機視覺主要是借助高性能處理器,利用攝像機等對對象特征進(jìn)行識別、提取和跟蹤,在后續(xù)工作中開展人性化處理,獲得符合人眼觀察或者及其設(shè)備的圖像信息。結(jié)合計算機視覺發(fā)展的目標(biāo)來說,有利于人們對外部世界的認(rèn)知和記憶,實現(xiàn)周圍環(huán)境的感知,其中圖像識別和處理、目標(biāo)檢測、景物分析和應(yīng)用等具有比較多的研究。如圖像識別技術(shù)以圖像主要特征作為基礎(chǔ),借助攝像機獲得相關(guān)信息,對特征信息進(jìn)行多層次的加工處理,使得計算機對圖像主要特征深入掌握,根據(jù)相應(yīng)的機理和圖像匹配模板,完成圖像的識別。計算機視覺在利用深度學(xué)習(xí)前,傳統(tǒng)計算機識別方式將特征提取和分類器設(shè)計分開,之后進(jìn)行結(jié)合,大多采取手工設(shè)計方式。
深度學(xué)習(xí)作為機器學(xué)習(xí)的一個分支,借助人工神經(jīng)網(wǎng)絡(luò)模擬人腦實現(xiàn)數(shù)據(jù)的智能化處理。借助智能化處理開展深度學(xué)習(xí),實現(xiàn)機器的智能化。借助人工神經(jīng)網(wǎng)絡(luò)可以對數(shù)據(jù)進(jìn)行分析和處理,圖像、聲音和視頻等常用的感知。在人工神經(jīng)網(wǎng)絡(luò)中有著隱含的學(xué)習(xí)結(jié)構(gòu),利用輸入層感知相關(guān)數(shù)據(jù),通過智能處理和輸出層完成相關(guān)任務(wù),節(jié)點具有處理器的功能,根據(jù)特定的計算方式,輸入到下一層的節(jié)點。深度學(xué)生通過這樣的方式完成信息的傳遞,在無監(jiān)督訓(xùn)練下不斷積累處理經(jīng)驗。
借助計算機視覺技術(shù)完成安防領(lǐng)域解決方案,大多數(shù)公司選擇相應(yīng)的切入點,涉及到一些知名的企業(yè),如Face++、百度、騰訊以及阿里巴巴等。人臉識別技術(shù)是重要的應(yīng)用內(nèi)容之一,深度學(xué)習(xí)在該領(lǐng)域中具有非常重要的地位。人臉識別技術(shù)在安檢和反恐等安防領(lǐng)域具有重要意義。除了人臉識別技術(shù)意外,對行人角度的ReID技術(shù)開展研究,借助深度學(xué)習(xí)加強人的檢測,并且對目標(biāo)特征進(jìn)行刻畫,為后續(xù)跟蹤和異常行為提供有效保障。
無人駕駛領(lǐng)域中,激光、雷達(dá)等類型的傳感器價格比較貴,計算機視覺解決方案人們喜歡。利用無人駕駛中的攝像機采集的視頻數(shù)據(jù),對其內(nèi)容進(jìn)行理解和分析,為后期的決策控制提供依據(jù),如前車碰撞預(yù)警等。因此,利用計算機視覺技術(shù)完成相應(yīng)的任務(wù),包括目標(biāo)的檢測和識別、目標(biāo)跟蹤、車道線檢測分離等。以深度學(xué)習(xí)為基礎(chǔ)的目標(biāo)檢測和識別方法和目標(biāo)分割法,具有其明顯的優(yōu)勢。目前,深度學(xué)習(xí)芯片越來越多,特別是無人駕駛領(lǐng)域提供更好的支持,深度學(xué)習(xí)技術(shù)可以推動無人駕駛技術(shù)的發(fā)展。
傳統(tǒng)的智能家居產(chǎn)品主要是利用手機端和藍(lán)牙或者Wi-Fi等通訊方式完成家居控制以及使用。此種解決方案雖然可以實現(xiàn)家居智能化,但是智能化水平依然不足。借助深度學(xué)習(xí)可以推動智能家居的發(fā)展,除了語言識別和語音合成外,還需要借助視覺技術(shù)完成人機交流和互動,如手勢識別等。另外,深度學(xué)習(xí)在智慧教育領(lǐng)域有效的利用,如拍照試題等APP,利用手機如數(shù)圖片,借助智能計算方式,獲取相關(guān)內(nèi)容的分析和理解,如題目檢測、文字檢測和識別等,深度學(xué)習(xí)在問題解決中,有著非常大的優(yōu)勢。
在教育領(lǐng)域中,視覺技術(shù)涉及到文字檢測和識別,在簡歷識別、文檔識別以及身份識別等領(lǐng)有效理應(yīng),還涉及到關(guān)于圖片中文字的理解和分析,在這些任務(wù)中,深度學(xué)習(xí)是一種最佳的方式。圖片搜索的目的是找到和原圖相似的圖片,涉及到圖像搜索引擎,同時需要較好的圖像特征,深度學(xué)習(xí)作為有效的技術(shù)方式和手段,在圖像檢測環(huán)節(jié)有著重要作用。
深度學(xué)習(xí)在醫(yī)療健康領(lǐng)域的應(yīng)用中,主要涉及以下幾點內(nèi)容。
(1)提供臨床診斷輔助系統(tǒng)等醫(yī)療服務(wù),在早期的篩查、診斷、康復(fù)和手術(shù)風(fēng)險等場景中應(yīng)用;
(2)醫(yī)療結(jié)構(gòu)的信息化應(yīng)用,借助數(shù)據(jù)分析,可以有效提高醫(yī)療結(jié)構(gòu)的運營效率;
(3)醫(yī)學(xué)影像識別應(yīng)用,可以幫助醫(yī)生更加快速準(zhǔn)確的讀取病人影像;
(4)醫(yī)療大數(shù)據(jù)的應(yīng)用,深度學(xué)習(xí)可以為醫(yī)療大數(shù)據(jù)可視化提供幫助,提高數(shù)據(jù)的價值;
(5)藥企研發(fā)領(lǐng)域,可以有效解決研發(fā)周期長、成本較高的問題;
(6)健康管理服務(wù),借助相應(yīng)的設(shè)備,如可穿戴設(shè)備等,開展用戶個人健康的監(jiān)測,做好疾病風(fēng)險的預(yù)測和控制;
(7)基因測序領(lǐng)域,深度學(xué)習(xí)在基因數(shù)據(jù)分析中利用,可以提高醫(yī)療精準(zhǔn)度。
醫(yī)學(xué)影像是對疾病判斷的重要方式,放射科和病理科的醫(yī)生,借助醫(yī)學(xué)影像可以提高診斷效率,被很多醫(yī)療機構(gòu)利用。目前,國內(nèi)外的醫(yī)學(xué)專家隊伍,在心血管、腫瘤、神內(nèi)和五官等領(lǐng)域構(gòu)建多個精準(zhǔn)深度學(xué)習(xí)輔助模型,取得非常好的發(fā)展,并且取得不錯的成績。
深度學(xué)習(xí)是讓機器自主學(xué)習(xí)的工具,并且不斷的進(jìn)步和發(fā)展。深度學(xué)習(xí)取得非常好的效果,并且其應(yīng)用非常廣泛,計算機視覺中圖像識別、目標(biāo)跟蹤、圖像分類以及對象檢測等取得不小的成就。深度學(xué)習(xí)在機器領(lǐng)域利用比較狹隘,隨著無監(jiān)督學(xué)習(xí)的應(yīng)用,選擇代表性的機器開展訓(xùn)練,人工神經(jīng)網(wǎng)絡(luò)使得該系統(tǒng)具有自主學(xué)習(xí)能力,主動理解抽象概念。