王 賡
(秦皇島市人防指揮信息保障中心,河北 秦皇島 066000)
大數(shù)據(jù)、云計(jì)算、人臉識(shí)別、圖像分析等多種網(wǎng)絡(luò)新興技術(shù)與概念的不斷涌現(xiàn),人工智能時(shí)代步入飛速發(fā)展時(shí)期。而自2016年谷歌研發(fā)的阿爾法狗與職業(yè)九段圍棋選手李世石開(kāi)展人機(jī)大戰(zhàn),并輕松擊敗李世石以后,人工智能與深度學(xué)習(xí)的融合成果體現(xiàn)得淋漓盡致,也成了科技熱搜話題排行榜首位。隨著近年來(lái)的不斷研究,更多的深度學(xué)習(xí)與人工智能在人們?nèi)粘I钪斜贿\(yùn)用,工業(yè)、醫(yī)療、家居等各種機(jī)器人的出現(xiàn)更是極大地推動(dòng)了社會(huì)的飛速發(fā)展。
深度學(xué)習(xí)的理念來(lái)自早期人工神經(jīng)網(wǎng)絡(luò)的相關(guān)探究,屬于機(jī)器學(xué)習(xí)算法中的一種,擁有極為強(qiáng)大的學(xué)習(xí)性能。經(jīng)過(guò)深入訓(xùn)練的神經(jīng)網(wǎng)絡(luò)計(jì)算方法,也是目前人工智能時(shí)代發(fā)展下重要的研究與發(fā)展方向。深度學(xué)習(xí)最突出的特性就在于對(duì)大數(shù)據(jù)的學(xué)習(xí)與使用。通過(guò)在之前的經(jīng)驗(yàn)中提取關(guān)鍵概念要素進(jìn)行訓(xùn)練與學(xué)習(xí),能夠?qū)χ蟮臎](méi)有經(jīng)過(guò)訓(xùn)練使用的數(shù)據(jù)進(jìn)行處理,并不是單純的一種算法或一種分析模型[1]。
在人工智能時(shí)代,深度學(xué)習(xí)已經(jīng)逐漸成為推進(jìn)其發(fā)展的重要方向。深度學(xué)習(xí)內(nèi)容的不斷創(chuàng)新、突破與發(fā)展,不斷為人工智能時(shí)代的進(jìn)步帶來(lái)新的算法與技術(shù)。之前單純依靠監(jiān)督式進(jìn)行學(xué)習(xí)的算法生成方式已經(jīng)被淘汰,因?yàn)楦嘧兓詳?shù)據(jù)的存在與大量理解力問(wèn)題的出現(xiàn),依靠以往的人工智能方式已經(jīng)難以解決[2]。進(jìn)行深度學(xué)習(xí),構(gòu)建多維算法模型,加入人工神經(jīng)網(wǎng)絡(luò)內(nèi)容的同時(shí)進(jìn)行深度訓(xùn)練成為當(dāng)前多元化人工智能時(shí)代的發(fā)展需要,并深受業(yè)內(nèi)關(guān)注。深度學(xué)習(xí)與人工智能的融合已經(jīng)逐漸成為相關(guān)領(lǐng)域的創(chuàng)新與研究熱點(diǎn)。
人工智能時(shí)代的不斷發(fā)展能夠?yàn)锳I的發(fā)展形成強(qiáng)有力的經(jīng)驗(yàn)數(shù)據(jù)支撐,利用深度學(xué)習(xí)的方式提升AI技術(shù)智能化的決策,最終逐漸接近人工決策能力的目標(biāo)。但是基于目前海量大數(shù)據(jù),AI無(wú)法進(jìn)行全部數(shù)據(jù)樣本的處理與分析,長(zhǎng)期超負(fù)荷的運(yùn)作將會(huì)嚴(yán)重影響AI的運(yùn)作性能。而識(shí)別技術(shù)的發(fā)展能夠?qū)υ擃悊?wèn)題提供良好的解決方案。識(shí)別技術(shù)能夠通過(guò)對(duì)大量數(shù)據(jù)樣本的分類提取,依據(jù)關(guān)鍵信息進(jìn)行分類,然后根據(jù)不同的類別分別進(jìn)行處理,能夠?qū)μ嵘鼳I專業(yè)處理性能與效率產(chǎn)生深遠(yuǎn)影響。
從社會(huì)經(jīng)濟(jì)運(yùn)行角度而言,人工智能時(shí)代的發(fā)展已經(jīng)逐步深入人類日常生活、工作,對(duì)社會(huì)的運(yùn)行產(chǎn)生重要影響。人工智能技術(shù)通過(guò)不斷在科學(xué)研究或各行各業(yè)應(yīng)用的深入,正逐漸改變以往的工作方式。人工智能創(chuàng)新技術(shù)的運(yùn)用逐漸對(duì)商業(yè)環(huán)境、社會(huì)運(yùn)轉(zhuǎn)形態(tài)等產(chǎn)生重要影響,通過(guò)不斷地提高工作效率,將更多的智能化應(yīng)用如醫(yī)療機(jī)器人、工業(yè)機(jī)器人等融入各行各業(yè)的實(shí)際發(fā)展,解決行業(yè)痛點(diǎn)問(wèn)題的同時(shí)推進(jìn)各環(huán)節(jié)的精細(xì)化管理,加快國(guó)家產(chǎn)業(yè)結(jié)構(gòu)轉(zhuǎn)型升級(jí),推進(jìn)更高附加產(chǎn)值的產(chǎn)業(yè)發(fā)展。
圖像處理是當(dāng)前人們生產(chǎn)生活中經(jīng)常面臨的問(wèn)題,主要是把各種來(lái)源的圖像通過(guò)相應(yīng)的方式對(duì)其進(jìn)行關(guān)鍵信息提取后分類處理。其主要的工作有對(duì)圖像進(jìn)行一定標(biāo)準(zhǔn)的分類、壓縮、提質(zhì)、關(guān)鍵信息獲取等。圖像處理技術(shù)的發(fā)展對(duì)安防、安檢、交通等多個(gè)行業(yè)都會(huì)產(chǎn)生重要影響。深度學(xué)習(xí)技術(shù)是基于人工神經(jīng)網(wǎng)絡(luò)理論發(fā)展起來(lái)的,即通過(guò)模仿人類學(xué)習(xí)方式與能力對(duì)機(jī)器進(jìn)行一定的訓(xùn)練之后,讓其具有與人腦相似的數(shù)據(jù)處理能力。
例如在交通領(lǐng)域中,通過(guò)深度學(xué)習(xí)的人工智能圖像識(shí)別技術(shù),研究無(wú)人駕駛技術(shù)的運(yùn)用。無(wú)人駕駛技術(shù)也是當(dāng)前人工智能時(shí)代基于深度學(xué)習(xí)技術(shù)的具體應(yīng)用熱點(diǎn),也是一項(xiàng)極具綜合信息技術(shù)的交通運(yùn)行方式。無(wú)人駕駛技術(shù)包含3個(gè)方面的內(nèi)容:一是監(jiān)控設(shè)備、雷達(dá)設(shè)備和測(cè)距設(shè)備等硬件的構(gòu)建,通過(guò)對(duì)交通環(huán)境的檢索,對(duì)周圍的交通狀況、行人車輛、交通崗等關(guān)鍵信息進(jìn)行收集,然后回傳至集中處理應(yīng)用系統(tǒng)中開(kāi)展集中性的分類提取與處理。該部分作為整個(gè)系統(tǒng)的核心,通過(guò)對(duì)各種關(guān)鍵信息進(jìn)行分析與判斷,結(jié)合綜合的道路情況對(duì)行駛車輛發(fā)出指令;然后指令接收系統(tǒng)根據(jù)處理系統(tǒng)發(fā)出的關(guān)鍵指令信息執(zhí)行指令,對(duì)關(guān)鍵控制點(diǎn)進(jìn)行適當(dāng)把控[3]。無(wú)人駕駛能夠?qū)煌ㄇ闆r進(jìn)行分析,針對(duì)一些突發(fā)狀況也能夠做出應(yīng)急處理,保證能夠準(zhǔn)確接收并執(zhí)行中央智能處理系統(tǒng)的指令,這也是當(dāng)前無(wú)人駕駛深度學(xué)習(xí)的關(guān)鍵內(nèi)容。
人工智能在語(yǔ)音識(shí)別與轉(zhuǎn)換方面的應(yīng)用,已經(jīng)逐漸從最開(kāi)始的簡(jiǎn)單語(yǔ)言識(shí)別逐漸走向智能化的多語(yǔ)種、多內(nèi)容的轉(zhuǎn)換。目前,語(yǔ)音識(shí)別主要采用混合高斯方式開(kāi)展模型構(gòu)建,該種模型構(gòu)建方式的利用能夠切實(shí)提高語(yǔ)音識(shí)別的準(zhǔn)確率,降低失誤率。但是語(yǔ)音識(shí)別也受環(huán)境因素影響,很多不可控制的自然環(huán)境或人為因素的干擾導(dǎo)致目前的語(yǔ)音識(shí)別技術(shù)在商業(yè)中的運(yùn)用還不廣泛。隨著深度學(xué)習(xí)技術(shù)的發(fā)展以及語(yǔ)音識(shí)別技術(shù)算法的不斷研究,識(shí)別的失誤率逐漸降低,已經(jīng)能夠滿足商業(yè)運(yùn)行環(huán)境對(duì)語(yǔ)音識(shí)別的要求,如科大訊飛等有關(guān)企業(yè)的語(yǔ)音識(shí)別技術(shù)已經(jīng)逐漸能夠在會(huì)議中進(jìn)行運(yùn)用,并取得了較好效果。
之前最常用的人臉識(shí)別方式主要包括主動(dòng)形狀與主動(dòng)表現(xiàn)兩種方式,除此以外還有其他的一些方式,例如使用部分描述與局部二值方式開(kāi)展識(shí)別或特點(diǎn)提取的方法,然后使用線性分析進(jìn)行研究等。受限于諸多的外界不穩(wěn)定因素影響,如光線強(qiáng)弱、臉部表情、遮擋物照片像素質(zhì)量等的影響,導(dǎo)致以往的人臉識(shí)別技術(shù)難以更精確地進(jìn)行人臉的判斷。
而深度學(xué)習(xí)技術(shù)的發(fā)展讓更精準(zhǔn)的算法與模型成為可能,能夠從基礎(chǔ)圖像信息中完成對(duì)人臉關(guān)鍵信息的提取與識(shí)別。通過(guò)對(duì)大量原始人臉圖片的表征學(xué)習(xí),讓深度學(xué)習(xí)對(duì)關(guān)鍵信息的把控更為精準(zhǔn),通過(guò)更多關(guān)鍵算法的運(yùn)作提高人臉識(shí)別精準(zhǔn)度。深度學(xué)習(xí)下的人臉識(shí)別技術(shù)能夠借助強(qiáng)大的圖片信息處理能力進(jìn)行深度關(guān)鍵信息的分析與提取,最終達(dá)到超過(guò)人類肉眼精準(zhǔn)度的識(shí)別。深度學(xué)習(xí)的發(fā)展極大地推進(jìn)了人臉識(shí)別中人工智能技術(shù)的進(jìn)步,當(dāng)前基于人臉識(shí)別的深度學(xué)習(xí)方法已達(dá)7種[4]。
綜上所述,科學(xué)技術(shù)的深入發(fā)展帶動(dòng)人工智能時(shí)代的快速進(jìn)步,人工智能技術(shù)在當(dāng)前社會(huì)經(jīng)濟(jì)發(fā)展中具有越來(lái)越重要的地位。深度學(xué)習(xí)作為機(jī)器學(xué)習(xí)中的重要組成方面,經(jīng)過(guò)不斷的深入研究與發(fā)展,已經(jīng)初步形成了發(fā)展雛形,基于相關(guān)人類神經(jīng)網(wǎng)絡(luò)與統(tǒng)計(jì)學(xué)等多方面的理論知識(shí),與人工智能充分有機(jī)融合,應(yīng)用于圖像識(shí)別、人臉識(shí)別等多種生活具體層面,并取得了較好的效果。