爾雅莉
(山西晉中理工學(xué)院 山西省晉中市 030060)
在互聯(lián)網(wǎng)時代背景下,隨著人工智能技術(shù)不斷發(fā)展以及在現(xiàn)實生活中的深入應(yīng)用,相關(guān)技術(shù)理念也得到了廣泛普及,人們已經(jīng)對人工智能不再感到陌生。尤其是對智能識別技術(shù)而言,當(dāng)下該項技術(shù)已經(jīng)在人們?nèi)粘9ぷ魃钪械玫搅藦V泛應(yīng)用。比如智能語音識別技術(shù)、人臉識別技術(shù)等。通過對這些智能識別技術(shù)應(yīng)用實踐進(jìn)行討論分析,并認(rèn)識到其中的技術(shù)發(fā)展瓶頸,提出一些解決策略,這對于推動智能識別技術(shù)實現(xiàn)可持續(xù)深入發(fā)展有著重要的現(xiàn)實意義。
1.1.1 二維碼識別技術(shù)
當(dāng)前,隨著智能手機(jī)以及其他智能設(shè)備的普及,人們對二維碼識別技術(shù)已經(jīng)不再陌生,作為條形碼識別技術(shù)一種,二維碼識別技術(shù)能夠呈現(xiàn)一種形式各異但排列規(guī)律的平面圖形,每個不同圖形背后都有唯一的功能,“存儲”不同的信息,實現(xiàn)對數(shù)據(jù)符號信息的記錄;該項技術(shù)在代碼編制方面,充分利用了構(gòu)成計算機(jī)內(nèi)部邏輯基礎(chǔ)的“0”、“1”比特流概念,采用一些二進(jìn)制相對應(yīng)的幾何形體,來進(jìn)行文字信息的展示。我們可以借助智能設(shè)備,對這些二維碼進(jìn)行掃描,便能夠自動進(jìn)行圖像識別,啟動背后的程序,實現(xiàn)信息的自動化處理。二維碼在進(jìn)行信息表達(dá)時,既能在橫向方位表達(dá)信息,又在縱向方位表達(dá)信息,因此即使二維碼面積很小,也能夠成功表達(dá)大量的信息[1]。在具體應(yīng)用方面,二維碼除了用于現(xiàn)金支付,還可以用于互加好友、賬戶登錄等功能,只需要輕輕一掃,即可完成復(fù)雜操作,為人們娛樂、生活、工作帶來極大便利。
1.1.2 文字翻譯識別技術(shù)
機(jī)器翻譯智能識別技術(shù),能夠?qū)ξ淖诸愋畔⑦M(jìn)行智能識別,而再次進(jìn)行識別結(jié)果呈現(xiàn)時,又能夠以另一種文字形式呈現(xiàn),從而達(dá)到不同語言轉(zhuǎn)換翻譯的效果。當(dāng)下該項智能識別技術(shù)也已經(jīng)逐漸應(yīng)用成熟化,在一些翻譯軟件比如谷歌翻譯、有道翻譯等得到了廣泛的應(yīng)用。但當(dāng)下這種文字翻譯技術(shù)依然有著很大的進(jìn)步空間,由于文字之間的連接主要靠語法,而語法比較靈活多變,在文字翻譯識別方面,尚未達(dá)到語法完全正確表達(dá)的目標(biāo),一般翻譯地均比較直接,且有很多語法錯誤,并且無法對文章整體進(jìn)行智能識別判斷再進(jìn)行合適的翻譯,因此未來仍需要加強(qiáng)研究。
1.1.3 物流運輸識別技術(shù)
當(dāng)下關(guān)于物流運輸識別,多是依靠RFID 技術(shù)(指射頻識別技術(shù)),通過借助閱讀器與標(biāo)簽之間進(jìn)行非接觸式的數(shù)據(jù)通信,達(dá)到識別目標(biāo)的目的。如今隨著物流產(chǎn)業(yè)的快速發(fā)展,已經(jīng)難以滿足用戶對倉儲生產(chǎn)率以及物流系統(tǒng)準(zhǔn)確識別的要求?;诖?,在當(dāng)下射頻識別技術(shù)之上,在物流運輸中出現(xiàn)了一種新的識別技術(shù),即RFMs Pro 追蹤系統(tǒng),系統(tǒng)能夠通過創(chuàng)新的模塊化設(shè)計,為不同的物流應(yīng)用情況快速地修改機(jī)械結(jié)構(gòu),實現(xiàn)物流的精準(zhǔn)化識別。在具體實踐過程中,還能夠結(jié)合用戶現(xiàn)有的物流基礎(chǔ)設(shè)施和物料流,靈活進(jìn)行設(shè)計。在物流運輸方面,用戶無需親自進(jìn)行客戶物流產(chǎn)品掃描,只需將物流產(chǎn)品放置到傳送帶上,使其穿過系統(tǒng)智能識別通道,通道中的識別應(yīng)答器始終能夠準(zhǔn)確進(jìn)行對經(jīng)過物體的識別,無論物體呈現(xiàn)何種姿態(tài),抑或是物流傳輸速度如何快,該系統(tǒng)均能夠?qū)ξ锲沸畔⑦M(jìn)行精準(zhǔn)地識別,能夠顯著提升物流運輸識別的效率。不僅如此,即使在傳送帶因故障停止運行,在后續(xù)故障解除后,系統(tǒng)依然能夠從原始中斷地方,繼續(xù)進(jìn)行運行,因此不會對正常物流運輸帶來影響。在實際進(jìn)行物流運輸時,針對部分物品雖然配置了RFID 標(biāo)簽,但由于不需要記錄登記,因此被遺留在接近倉庫附近物流的區(qū)域。RFMs Pro 追蹤系統(tǒng)軟件在實際進(jìn)行識別時,也能夠采用過濾器,保證這些物品不會被系統(tǒng)識別記錄,從而有效保障了物流出貨站不會出現(xiàn)發(fā)貨錯誤的問題。不僅如此,RFMs Pro 追蹤系統(tǒng)還能對物流產(chǎn)品包裝進(jìn)行檢查,并將其與訂單信息對比,確保二者信息一致,從而有效降低運輸信息錯誤或者數(shù)量錯誤的可能性。除此之外,RFMs Pro 追蹤系統(tǒng)還能夠借助集成條碼掃描器、二維碼閱讀器等,來對物流運輸物體尺寸、體積等參數(shù)進(jìn)行識別策略,從而為后續(xù)物流運輸定制高端識別解決方案,確保整個物流運輸均能夠穩(wěn)定順利運行。
1.2.1 語音識別技術(shù)
圖1:面部識別時的關(guān)鍵特征點示例
圖2:深度學(xué)習(xí)過程
語音識別技術(shù)主要識別對象是人類的語音,并通過分析語音具體的表達(dá),來將語音信息轉(zhuǎn)化為文字信息,從而為人們交流溝通帶來了較大的便利。在具體應(yīng)用方面,如今很多通信以及手機(jī)游戲APP 均配置了語音識別轉(zhuǎn)換功能,比如“微信”、“王者榮耀”等,這些軟件均能夠支持語音與文字的發(fā)送,并且還能夠促使二者實現(xiàn)相互轉(zhuǎn)換,且有著非常高的準(zhǔn)確轉(zhuǎn)化率。除此之外,在語音識別技術(shù)方面,一些智能家居、車載智能語音助手等也進(jìn)行了相關(guān)的應(yīng)用,這些人工智能系統(tǒng)能夠智能識別人類語音,然后根據(jù)具體的語音表達(dá)含義,完成相關(guān)的操作[2]。但這些語音識別有著一定的范圍,且語音指令一般不能太過復(fù)雜,很多語音識別只能針對特定的功能,因此這種智能識別技術(shù)在未來仍有著較大的發(fā)展空間。除此之外,在具體實踐應(yīng)用中,語音智能識別技術(shù)還需要徹底攻克兩大難題,一是環(huán)境噪聲干擾問題,二是方言口音問題。
1.2.2 面部識別技術(shù)
面部識別技術(shù)是一種非常復(fù)雜的智能識別技術(shù),在具體識別過程中,需要先采集人臉信息,然后對采集的面部信息進(jìn)行分析,找出其中的關(guān)鍵特征,最后,再將這些關(guān)鍵特征與面部模型庫進(jìn)行對比,若能夠成功匹配,便能夠?qū)崿F(xiàn)身份信息識別確認(rèn)。2014年是面部識別技術(shù)應(yīng)用的轉(zhuǎn)折點,這一年人們正式將面部識別技術(shù)應(yīng)用到現(xiàn)實場景之中。早期面部識別多應(yīng)用考勤門禁、智能安防以及金融領(lǐng)域,如今隨著面部識別技術(shù)的日趨成熟,識別準(zhǔn)確性不斷提升,其應(yīng)用范圍也得到了有效的擴(kuò)展,比如在國內(nèi)很多省份中,在高考場合也引入了面部識別系統(tǒng),除此之外,一些手機(jī)APP 也進(jìn)行了人臉識別技術(shù)的應(yīng)用,比如支付寶、滴滴等在身份識別或者支付時可以應(yīng)用面部識別,一些游戲APP 也配置了“捏臉”功能,能夠通過識別自身面孔,再進(jìn)行“捏臉改進(jìn)”。面部智能識別技術(shù)在上述場景的應(yīng)用,均為人們的工作學(xué)習(xí)娛樂生活帶來的諸多便利,圖1 便是面部識別時的關(guān)鍵特征點示例。
1.2.3 步態(tài)識別技術(shù)
與上文提到的人臉、語音識別技術(shù)相比,步態(tài)識別技術(shù)起到最為顯著的突破便是從“靜態(tài)生命特征識別”轉(zhuǎn)為了“動態(tài)生命特征識別”,因此在具體的識別流程方面,通常也更加得復(fù)雜。在大部分情況下,進(jìn)行人臉、語音等識別時,都需要人進(jìn)行一定程度的配合,并且在識別時,要求人與識別設(shè)備保持較近的距離,才能有效保障識別的準(zhǔn)確度。而步態(tài)識別則能夠進(jìn)行遠(yuǎn)距離識別,且整個識別過程不需要人專門的進(jìn)行配合。在常規(guī)環(huán)境下,應(yīng)用步態(tài)智能識別技術(shù)是,識別距離能夠達(dá)到50 米。如果識別設(shè)備采用的是4K 高清攝像頭,那么步態(tài)識別距離甚至可達(dá)100 米。并且整個識別過程是通過對人全身進(jìn)行360 度掃描識別,因此識別范圍更廣,適應(yīng)性更強(qiáng)。與上述幾種靜態(tài)識別技術(shù)相同的地方在于,步態(tài)識別也會面臨一定的干擾影響,但相較于靜態(tài)識別帶來的干擾,步態(tài)識別面臨的干擾顯然更小。究其原因在于,首先步態(tài)識別距離較遠(yuǎn),因此有足夠的時間與空間進(jìn)行識別過程調(diào)整,并且有效去除干擾的影響。與此同時,由于步態(tài)識別能夠?qū)θ硇畔⑦M(jìn)行識別,因此即使外界光照存在明顯的變化,或者識別的人衣物發(fā)生變化,甚至面部被完全遮擋,依然不會對最終識別結(jié)果帶來影響。因此步態(tài)識別適應(yīng)性更廣,且更加靈活高效。更為重要的是,步態(tài)識別不需要人刻意的配合,能夠在目標(biāo)人物自然的狀態(tài)下進(jìn)行識別,用戶體驗更加友好,且能夠保證識別的準(zhǔn)確性。這是因為,長時間以來,一個人走路姿勢已經(jīng)養(yǎng)成了固定的習(xí)慣,在自然狀態(tài)下,很難進(jìn)行偽裝,因此在刑事偵查中,一些具有反偵察意識的罪犯,即便是能夠通過化妝、遮擋手段僥幸騙過人臉識別系統(tǒng),也難以通過偽裝走路姿勢來逃過偵查。因此在安防以及刑偵領(lǐng)域,步態(tài)智能識別技術(shù)有著不可比擬的優(yōu)勢。
針對當(dāng)下基于計算機(jī)人工智能的識別技術(shù),在未來發(fā)展方向上,將會有著以下發(fā)展趨勢:首先,智能識別技術(shù)功能將會越來越強(qiáng)大,以當(dāng)下的人臉識別為例,早期人臉識別技術(shù)主要應(yīng)用于安防行業(yè),不僅給整個安防行業(yè)注入了新的生命活力,同時也有效開辟了新的發(fā)展市場。如今該項智能識別技術(shù)已經(jīng)不再僅限于安防的使用,在一些冷門領(lǐng)域,人臉識別技術(shù)依然有著較大的應(yīng)用發(fā)展空間。比如在三維測量技術(shù)領(lǐng)域,通過借助3D 人臉識別算法,能夠?qū)υ摐y量技術(shù)的2D 投影的缺陷進(jìn)行有效地彌補。除此之外,從人臉識別技術(shù)本身來看,識別功能也越來越強(qiáng)大,傳統(tǒng)難點已經(jīng)被逐步解決,包括人臉旋轉(zhuǎn)、遮擋、相似度等在內(nèi)的都有了很好地應(yīng)對,這也成為了人臉識別技術(shù)的另一個最為重要的發(fā)展路線。在實際進(jìn)行人臉識別時,背后的AI 系統(tǒng)也在不斷進(jìn)行深度學(xué)習(xí),與機(jī)器學(xué)習(xí)不同,深度學(xué)習(xí)背后模仿的是人的神經(jīng)網(wǎng)絡(luò),我們只要把圖片交給神經(jīng)網(wǎng)絡(luò),神經(jīng)網(wǎng)絡(luò)就會給我們分好結(jié)果。這個是神經(jīng)網(wǎng)絡(luò)和機(jī)器學(xué)習(xí)不同的地方。深度學(xué)習(xí)領(lǐng)域?qū)ξ覀儊碚f就像一個黑盒,我們不知道中間發(fā)生了什么,所以這也是目前我們需要加大力度去學(xué)習(xí)的一個地方,深度學(xué)習(xí)過程圖圖2 所示。
另一方面,隨著大數(shù)據(jù)、深度學(xué)習(xí)等技術(shù)不斷發(fā)展,將其應(yīng)用于智能識別領(lǐng)域中,將會進(jìn)一步提升了智能識別的精確度,從而使得智能識別技術(shù)能夠“解鎖”更多應(yīng)用領(lǐng)域。比如在當(dāng)下的智能家電領(lǐng)域,主要應(yīng)有的智能識別技術(shù)為語言識別,而隨著人臉識別技術(shù)的不斷發(fā)展,同樣也能夠應(yīng)用于智能家居,因此智能家居與人臉識別技術(shù)的融合是未來發(fā)展的重點方向。不僅如此,在未來,智能識別技術(shù)將會與大數(shù)據(jù)技術(shù)進(jìn)行深度的融合,進(jìn)而能夠?qū)ψR別采集的信息進(jìn)行深度的應(yīng)用,從而在這一過程中使得智能識別技術(shù)發(fā)揮出更大的作用價值。
綜上所述,智能識別技術(shù)是人工智能領(lǐng)域重要的技術(shù)內(nèi)容之一,并且隨著智能技術(shù)的不斷發(fā)展,很多智能識別技術(shù)已經(jīng)在我們的日常生活中得到了廣泛的應(yīng)用,比如語音識別技術(shù)、二維碼識別技術(shù)等,通過加強(qiáng)對這些智能識別技術(shù)的應(yīng)用實踐討論,能夠讓我們對這些技術(shù)有個更深刻認(rèn)識,促使其得到更為廣泛的應(yīng)用,還有利于我們了解這些技術(shù)存在的一些問題,并提出一些針對性對策,從而推動智能識別技術(shù)應(yīng)用實踐實現(xiàn)更好地發(fā)展。