辛強(qiáng)偉 唐云凱
摘要:信息存儲(chǔ)、傳輸、處理等能力的增強(qiáng)為充分大范圍利用大數(shù)據(jù)提供了可能。大數(shù)據(jù)是人工智能的重要基礎(chǔ)之一,需要將大量數(shù)量進(jìn)行合理的處理,通過對(duì)大量數(shù)據(jù)的選擇、整合和分析,找出其中的正確規(guī)律加以運(yùn)用。人工智能系統(tǒng)的可靠性或精度需要得到保障,特別是一些實(shí)際應(yīng)用中對(duì)可靠性或精度要求極高。多維度數(shù)據(jù)組合可以降低數(shù)據(jù)的片面性和潛在的隱患,從而提升人工智能系統(tǒng)的可靠性和精度。
關(guān)鍵詞:人工智能;大數(shù)據(jù);多維度;組合
中圖分類號(hào):TP393? ? 文獻(xiàn)標(biāo)識(shí)碼:A? ? 文章編號(hào):1007-9416(2020)10-0000-00
0引言
人工智能即人造智能,指用機(jī)器(計(jì)算機(jī))模擬或?qū)崿F(xiàn)人類的智能。人工智能并非一個(gè)新概念,“人工智能”一詞最早是在1956年Dartmouth學(xué)會(huì)上提出的,它是研究和開發(fā)用于模擬、延伸和擴(kuò)展人的智能的科技。人工智能企圖了解智能的實(shí)質(zhì),對(duì)人的意識(shí)、思維過程進(jìn)行模擬,產(chǎn)生出能以人類智能相似的方式做出反應(yīng)的智能設(shè)備,該設(shè)備能像人那樣思考。人工智能領(lǐng)域的研究包括機(jī)器人、圖像識(shí)別、語言識(shí)別處理和專家系統(tǒng)等。
人工智能自誕生以來,應(yīng)用領(lǐng)域不斷擴(kuò)大,近些年由于大數(shù)據(jù)、通信技術(shù)、傳感器等技術(shù)的快速發(fā)展使人工智能又上了一個(gè)臺(tái)階,也使人工智能新的應(yīng)用有了基礎(chǔ)和可能[1-2]。例如計(jì)算機(jī)視覺和圖像處理、機(jī)器翻譯和自然語言理解、專家系統(tǒng)、智能搜索引擎、數(shù)據(jù)挖掘和知識(shí)發(fā)現(xiàn)、自動(dòng)駕駛、人像識(shí)別、文字識(shí)別、圖像識(shí)別、車牌識(shí)別和語音識(shí)別等[3]。
1分析
人工智能系統(tǒng)特點(diǎn)是快速計(jì)算與海量存儲(chǔ)能力,具有自主學(xué)習(xí)的能力,各模塊之間互相依賴并且可以同時(shí)學(xué)習(xí),具有實(shí)時(shí)的學(xué)習(xí)能力。人工智能系統(tǒng)的認(rèn)知可分為三個(gè)步驟:首先獲得數(shù)據(jù),然后對(duì)數(shù)據(jù)進(jìn)行加工整合得出結(jié)果,最后自我學(xué)習(xí)自我完善。人工智能系統(tǒng)要達(dá)到類人思考,像人一樣思考,代替人取代人,特別是在一些重復(fù)性、很繁重或者說很危險(xiǎn)的工作當(dāng)中代替人,這樣可以降低成本、提高效率和安全性。
機(jī)器學(xué)習(xí)是大數(shù)據(jù)的分析方式之一,也是人工智能的主要研究方向之一,有些大數(shù)據(jù)研發(fā)人員就是通過機(jī)器學(xué)習(xí)轉(zhuǎn)入了人工智能領(lǐng)域。機(jī)器學(xué)習(xí)涉及統(tǒng)計(jì)學(xué)、概率論、逼近論、算法復(fù)雜度理論等多門學(xué)科,研究計(jì)算機(jī)怎樣模擬或?qū)崿F(xiàn)人類的學(xué)習(xí)行為,以獲取新的知識(shí)或技能,重新組織已有的知識(shí)結(jié)構(gòu)使之不斷改善自身的性能。
此外,人工智能還涉及到模式識(shí)別。模式識(shí)別研究模式的自動(dòng)處理和判斷,根據(jù)樣本的特征將樣本劃分到一定的類別中去,使設(shè)備具有模仿人類通過感官接受外界信息、識(shí)別和理解周圍環(huán)境的感知能力,即用計(jì)算機(jī)來模擬人的各種識(shí)別能力,當(dāng)前主要應(yīng)用在人工智能領(lǐng)域的圖形識(shí)別和語音識(shí)別。然而,有些場(chǎng)景中對(duì)人工智能的應(yīng)用提出了嚴(yán)苛的要求,人工智能系統(tǒng)的可靠性或精度需要得到保障。比如在無人駕駛中對(duì)數(shù)據(jù)獲取的速度、精度以及數(shù)據(jù)通信傳輸?shù)乃俣龋加泻芨叩囊?。因此需要進(jìn)一步提出多種多樣的方法來不斷提升人工智能系統(tǒng)的可靠性或精度。
2多維度數(shù)據(jù)組合
反饋校正方式是一種提升系統(tǒng)性能的方法。反饋校正的基本原理是校正系統(tǒng)中對(duì)動(dòng)態(tài)性能改善有重大妨礙作用的某些環(huán)節(jié),恰當(dāng)選擇反饋校正的形式和參數(shù),使系統(tǒng)的性能滿足給定的指標(biāo)要求。但在反饋校正方式和多種學(xué)習(xí)訓(xùn)練方法(如機(jī)器學(xué)習(xí))之外需要另外的方法。
大數(shù)據(jù)作為人工智能發(fā)展的重要基礎(chǔ)之一,與人工智能存在緊密的聯(lián)系。正是基于大數(shù)據(jù)技術(shù)的快速發(fā)展,通過人工智能結(jié)合大數(shù)據(jù),近些年人工智能才取得了諸多突破。數(shù)據(jù)的價(jià)值如何體現(xiàn)出來,其中一個(gè)重要方面是數(shù)據(jù)要應(yīng)用到智能控制方面,智能控制是自動(dòng)控制,不是人工控制。智能化的實(shí)現(xiàn)要依靠數(shù)據(jù),數(shù)據(jù)量越大,那么它所反映出來的概率越準(zhǔn)確。
統(tǒng)計(jì)學(xué)、概率論、組合學(xué)都可以在人工智能當(dāng)中發(fā)揮重要的作用,特別是將三者結(jié)合起來使用。以往人工智能運(yùn)用較多的是統(tǒng)計(jì)學(xué)、概率論,并沒有明確地引入組合的思想,沒有與組合學(xué)充分結(jié)合。人工智能與組合學(xué)相結(jié)合可以有效地提高人工智能系統(tǒng)的性能。人工智能的實(shí)現(xiàn)需要大量的數(shù)據(jù),對(duì)于所取得的信息進(jìn)行科學(xué)的分析,以便作為決策或控制的依據(jù),這些都需要統(tǒng)計(jì)的支持。數(shù)據(jù)是人工智能的重要參考和依據(jù)。人工智能離不開對(duì)數(shù)據(jù)的分析,其中要用到大量的統(tǒng)計(jì)方法,以便對(duì)未來的狀況進(jìn)行預(yù)測(cè)。統(tǒng)計(jì)學(xué)應(yīng)用廣泛,例如,企業(yè)要對(duì)自己產(chǎn)品的市場(chǎng)潛力作出預(yù)測(cè),以便及時(shí)調(diào)整生產(chǎn)計(jì)劃,這就需要利用市場(chǎng)調(diào)查取得數(shù)據(jù),并對(duì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析;經(jīng)濟(jì)學(xué)家在預(yù)測(cè)通貨膨脹時(shí),運(yùn)用有關(guān)生產(chǎn)價(jià)格指數(shù)、生產(chǎn)能力、失業(yè)率等統(tǒng)計(jì)數(shù)據(jù),然后用統(tǒng)計(jì)模型進(jìn)行預(yù)測(cè)。統(tǒng)計(jì)學(xué)能讓人們正確地認(rèn)識(shí)事物,避免或減少錯(cuò)誤發(fā)生。概率論是研究隨機(jī)現(xiàn)象的統(tǒng)計(jì)規(guī)律的數(shù)學(xué)學(xué)科。結(jié)果具有多種可能性,而且在之前可以確定所有可能的結(jié)果,但不能準(zhǔn)確預(yù)言會(huì)出現(xiàn)哪種結(jié)果。概率是衡量事件發(fā)生的可能性的量度。在隨機(jī)情況下某個(gè)事件的發(fā)生具有偶然性,但在相同條件下大量重復(fù)的隨機(jī)試驗(yàn)卻常常表現(xiàn)出明顯的規(guī)律。組合學(xué)也稱組合數(shù)學(xué),它研究的是滿足各種附加條件的有限個(gè)對(duì)象的集合。組合學(xué)所研究的問題有:計(jì)數(shù)問題、存在性問題、構(gòu)造和算法問題、優(yōu)化問題等。組合學(xué)分為圖論、組合計(jì)數(shù)、組合設(shè)計(jì)、組合最優(yōu)化和組合幾何等。根據(jù)組合學(xué)研究與發(fā)展的現(xiàn)狀可分為五個(gè)分支:經(jīng)典組合學(xué)、組合序、組合設(shè)計(jì)、圖與超圖和組合多面形與最優(yōu)化。組合學(xué)不僅在軟件技術(shù)中有重要的應(yīng)用價(jià)值,在企業(yè)管理、金融分析、交通規(guī)劃等領(lǐng)域都有重要的應(yīng)用。例如,在美國(guó)有一家公司用組合學(xué)的方法來提高企業(yè)管理的效益,取得了很大的成功。
數(shù)據(jù)按照獲取時(shí)間大致可以分為實(shí)時(shí)數(shù)據(jù)和過往數(shù)據(jù),過往數(shù)據(jù)的作用是根據(jù)以往的數(shù)據(jù)來判斷和推理將來和未知。數(shù)據(jù)的獲取主要可以通過傳感器來完成,例如空調(diào)中的溫度和濕度傳感器,電視機(jī)的紅外遙控器,電冰箱、電飯煲中的溫度傳感器,照相機(jī)中的光傳感器,汽車的燃料計(jì)和速度計(jì)等,不勝枚舉。許多人工智能設(shè)備獲取信息是通過多種不同功能的傳感器來收集各種不同性質(zhì)的信息,例如溫濕度、紅外、震動(dòng)、氣體、氣壓、速度、加速度等數(shù)據(jù)。對(duì)于信息的理解則是通過對(duì)傳感器信息的處理來實(shí)現(xiàn)的。如果用人體來類比,計(jì)算機(jī)相當(dāng)人的大腦,執(zhí)行機(jī)構(gòu)相當(dāng)人的肌體,傳感器相當(dāng)于人的五官和皮膚,對(duì)外界或周邊環(huán)境進(jìn)行感知,將感知到的信息轉(zhuǎn)化為電信號(hào)并進(jìn)行傳輸。世界已經(jīng)進(jìn)入信息時(shí)代,構(gòu)成現(xiàn)代信息技術(shù)的三大支柱是:傳感器技術(shù)、通信技術(shù)和計(jì)算機(jī)技術(shù),三者在信息系統(tǒng)中分別起到“感官”、“神經(jīng)”和“大腦”的作用。運(yùn)用傳感器技術(shù)進(jìn)行信息采集,運(yùn)用通信技術(shù)進(jìn)行信息傳輸,運(yùn)用計(jì)算機(jī)技術(shù)進(jìn)行信息處理。在利用信息的過程中首先要獲取準(zhǔn)確可靠的信息,而傳感器是獲取信息的主要途徑和手段。目前傳感器已經(jīng)在眾多的領(lǐng)域得到應(yīng)用,除了工業(yè)、農(nóng)業(yè)、商業(yè)外,還廣泛用于自動(dòng)化生產(chǎn)、環(huán)境監(jiān)測(cè)、交通、醫(yī)療診斷、現(xiàn)代辦公設(shè)備、航空航天、智能樓宇和家用電器等領(lǐng)域。
人工智能學(xué)科是計(jì)算機(jī)科學(xué)中涉及研究、設(shè)計(jì)和應(yīng)用智能機(jī)器的一個(gè)重要分支,研究如何使機(jī)器具備智能的科學(xué)和技術(shù),通過使機(jī)器模擬和執(zhí)行人的大腦的某些智力功能,能在各類環(huán)境中執(zhí)行各種擬人任務(wù)的機(jī)器,并探索相關(guān)的理論和技術(shù)。人類智能指的是人類所具有的智力和行為能力,包括感知能力、記憶能力、思維能力、歸納與演繹能力、學(xué)習(xí)能力和行為能力。所有的這些能力都與人的大腦相關(guān)。人的大腦包括端腦和間腦,端腦包括左右大腦半球,端腦由約140億個(gè)細(xì)胞構(gòu)成,巨量的腦細(xì)胞之間存在著復(fù)雜的聯(lián)系。如果用網(wǎng)絡(luò)來表示,大腦毫無疑問是一個(gè)超大規(guī)模的復(fù)雜網(wǎng)絡(luò)。腦細(xì)胞的數(shù)量動(dòng)態(tài)變化,每天要死亡約10萬個(gè),越不用腦,腦細(xì)胞死亡越多,因此要勤于用腦。人腦中的主要成分是血液,血液占到80%,大腦雖只占人體體重的2%,但耗氧量達(dá)全身耗氧量的25%,血流量占心臟輸出血量的15%,一天內(nèi)流經(jīng)腦的血液為2000升。到目前為止,人類大腦依然是最復(fù)雜最神秘的科學(xué)難題,存在著大量的未知之謎。研究人工智能有助于人類對(duì)自身大腦的認(rèn)識(shí)?,F(xiàn)在計(jì)算機(jī)的智能水平還相對(duì)低下,人們研究人工智能的遠(yuǎn)大前景是讓計(jì)算機(jī)同人腦一樣,甚至超越人腦。用機(jī)器代替人,可以代替人從事繁重的工作,提高效率或品質(zhì),降低成本,也適合于一些危險(xiǎn)或艱苦的場(chǎng)合。人腦是一個(gè)動(dòng)態(tài)的、開放的、高度復(fù)雜的龐大信息系統(tǒng)。目前往往采用結(jié)構(gòu)模擬的方法,即根據(jù)人腦的生理結(jié)構(gòu)和工作機(jī)理實(shí)現(xiàn)計(jì)算機(jī)的智能,由于還不能對(duì)人的大腦做到真正和完全模擬,只是對(duì)它進(jìn)行局部或近視模擬。具體地說,就是用人工神經(jīng)網(wǎng)絡(luò)作為信息和知識(shí)的載體,用神經(jīng)計(jì)算的方法實(shí)現(xiàn)識(shí)別、學(xué)習(xí)、聯(lián)想和推理等功能,從而來模擬人類大腦的智能,使計(jì)算機(jī)表現(xiàn)出某種智能。結(jié)構(gòu)模擬法基于人類大腦的生理模型進(jìn)行數(shù)值計(jì)算,從微觀上模擬人類大腦以實(shí)現(xiàn)機(jī)器智能。這種方法先通過神經(jīng)網(wǎng)絡(luò)的自學(xué)習(xí)獲得知識(shí),然后利用知識(shí)來解決問題實(shí)現(xiàn)智能化。
人工智能依賴于大數(shù)據(jù),人工智能以數(shù)據(jù)為基礎(chǔ),往往通過數(shù)值計(jì)算進(jìn)行問題求解而實(shí)現(xiàn)智能。數(shù)據(jù)的類型大致可分為三類:傳統(tǒng)數(shù)據(jù)、機(jī)器和傳感器數(shù)據(jù)、社交數(shù)據(jù)。傳統(tǒng)數(shù)據(jù)包括各種調(diào)查數(shù)據(jù)、統(tǒng)計(jì)數(shù)據(jù)、銷售數(shù)據(jù)、庫存數(shù)據(jù)以及記錄數(shù)據(jù)等。機(jī)器和傳感器數(shù)據(jù)包括查詢記錄、瀏覽記錄、呼叫記錄、智能儀表、工業(yè)設(shè)備傳感器、設(shè)備日志、交易數(shù)據(jù)等。社交數(shù)據(jù)包括用戶行為記錄、反饋數(shù)據(jù)等,如微信這樣的社交媒體平臺(tái)。數(shù)據(jù)的種類是多種多樣的,數(shù)據(jù)的來源也是多種多樣的,人工智能結(jié)合大數(shù)據(jù)需要去偽存真,去除錯(cuò)誤數(shù)據(jù)、虛假信息和離群值。從大數(shù)據(jù)中可以提取多種數(shù)據(jù)和多個(gè)數(shù)據(jù)源,運(yùn)用組合(協(xié)同)降低風(fēng)險(xiǎn)。采用多維度數(shù)據(jù)組合以提升人工智能系統(tǒng)性能,應(yīng)用概率論和數(shù)理統(tǒng)計(jì),根據(jù)應(yīng)用場(chǎng)景的不同選擇多種類型的數(shù)據(jù)加以組合。多維度數(shù)據(jù)組合可以避免單一數(shù)據(jù)或低維度數(shù)據(jù)可能存在的片面和隱患,從而提升人工智能的可靠性和精度。
3結(jié)語
未來的世界人工智能將扮演重要的角色,其中的關(guān)鍵因素包括數(shù)據(jù)處理速度和通信速度的大幅提升。隨著5G技術(shù)的推廣和普及,使人工智能在人類生產(chǎn)和生活的各個(gè)方面會(huì)發(fā)揮越來越重要的作用。人工智能系統(tǒng)性能至關(guān)重要,多維度數(shù)據(jù)組合的方法有助于人工智能系統(tǒng)性能的提升。
參考文獻(xiàn)
[1] 林海倫,王元卓,賈巖濤,等.面向網(wǎng)絡(luò)大數(shù)據(jù)的知識(shí)融合方法綜述[J].計(jì)算機(jī)學(xué)報(bào),2017,40(1):1-27.
[2] 林培光,周佳倩,溫玉蓮.SCONV:一種基于情感分析的金融市場(chǎng)趨勢(shì)預(yù)測(cè)方法[J].計(jì)算機(jī)研究與發(fā)展,2020,57(8):1769-1778.
[3] 秦晨光,王海,任杰,等.基于多任務(wù)學(xué)習(xí)的方言語種識(shí)別[J].計(jì)算機(jī)研究與發(fā)展,2019,56(12):2632-2640.
收稿日期:2020-08-25
作者簡(jiǎn)介:辛強(qiáng)偉(1980—),男,陜西西安人,博士,講師,研究方向:物聯(lián)網(wǎng)。
Performance Optimization Analysis of Artificial Intelligence System Based on
Multi Dimensional Data Combination
XIN Qiang-wei,TANG Yun-kai
(School of Computer, Xianyang Normal University, Xianyang Shaanxi? 712000)
Abstract: The enhancement of the ability of information storage, transmission and processing makes it possible to make full use of big data. Big data is one of the important foundations of artificial intelligence. It is necessary to deal with a large number of data reasonably. Through the selection, integration and analysis of a large number of data, we can find out the correct rules and apply them. The reliability or accuracy of artificial intelligence system needs to be guaranteed, especially in some practical applications. Multi dimensional data combination can reduce the one sidedness and potential hidden danger of data, so as to improve the reliability and accuracy of artificial intelligence system.
Key words: Artificial intelligence; Big data; Multi dimensional; Combination