摘要:隨著計(jì)算機(jī)技術(shù)高速發(fā)展,各個(gè)行業(yè)的數(shù)據(jù)量大幅度增長(zhǎng),大數(shù)據(jù)技術(shù)的合理應(yīng)用受到了越來(lái)越多的關(guān)注。以此為基礎(chǔ),針對(duì)大數(shù)據(jù)潛在價(jià)值進(jìn)行充分挖掘十分重要,所以,需要首先明確大數(shù)據(jù)技術(shù)的應(yīng)用現(xiàn)狀,探究其中的計(jì)算智能方法以及相應(yīng)的實(shí)際應(yīng)用情況,最后再針對(duì)計(jì)算智能的進(jìn)一步發(fā)展進(jìn)行闡述,以能夠?yàn)榇髷?shù)據(jù)在電子數(shù)據(jù)檢驗(yàn)中應(yīng)用價(jià)值的持續(xù)提升提供基礎(chǔ)。所以對(duì)計(jì)算智能在電子數(shù)據(jù)檢驗(yàn)中的應(yīng)用情況進(jìn)行分析,以供參考。
關(guān)鍵詞:大數(shù)據(jù);計(jì)算智能;電子數(shù)據(jù)檢驗(yàn);現(xiàn)狀;展望
一、前言
在人工智能技術(shù)持續(xù)發(fā)展的狀態(tài)之下,計(jì)算智能的誕生可謂大勢(shì)所趨,對(duì)計(jì)算智能進(jìn)行應(yīng)用的目的,則在于有效解決傳統(tǒng)邏輯程序難以處理的諸多復(fù)雜問(wèn)題,且計(jì)算智能的運(yùn)行不必創(chuàng)建數(shù)學(xué)模型,也不需構(gòu)建相應(yīng)的知識(shí)體系,僅應(yīng)用大量數(shù)據(jù)即可針對(duì)各項(xiàng)輸入信息開展分析和處理工作,應(yīng)用價(jià)值和探究?jī)r(jià)值較高。根據(jù)相關(guān)研究結(jié)果,計(jì)算智能之中存在的各項(xiàng)特點(diǎn),與大數(shù)據(jù)技術(shù)的分析工作具有一定的相似之處,且將計(jì)算智能應(yīng)用于大數(shù)據(jù)之中,可更加高效地落實(shí)圖像處理、知識(shí)獲取以及智能控制等多項(xiàng)工作,由此可見,針對(duì)計(jì)算智能在電子數(shù)據(jù)檢驗(yàn)工作中進(jìn)行研究和分析具有重要意義。
二、大數(shù)據(jù)技術(shù)的應(yīng)用現(xiàn)狀
在商業(yè)領(lǐng)域中應(yīng)用大數(shù)據(jù)技術(shù),可以針對(duì)各類人群提供具有個(gè)性化的服務(wù),同時(shí)對(duì)行業(yè)未來(lái)發(fā)展規(guī)律進(jìn)行預(yù)測(cè),并使企業(yè)的生產(chǎn)和管理效率得到提升,還能夠根據(jù)隱藏線索創(chuàng)新產(chǎn)品和優(yōu)化服務(wù),特別是對(duì)于電子商務(wù)領(lǐng)域來(lái)說(shuō),買家的購(gòu)買數(shù)量、商品價(jià)格以及交易時(shí)間等均能夠?qū)ζ滟?gòu)買能力以及興趣愛好等進(jìn)行反映,所以電商平臺(tái)對(duì)于大數(shù)據(jù)技術(shù)的應(yīng)用十分重視;在醫(yī)療領(lǐng)域中應(yīng)用大數(shù)據(jù)技術(shù),因?yàn)槠渲械臄?shù)據(jù)內(nèi)容較為復(fù)雜,且處于持續(xù)變化的狀態(tài)當(dāng)中,所以若能針對(duì)其進(jìn)行合理的存儲(chǔ)、處理以及分析,并開發(fā)出其中的潛在應(yīng)用價(jià)值,則更有利于提升人類健康水平,也需要針對(duì)醫(yī)療數(shù)據(jù)進(jìn)行及時(shí)的組織、處理、分析和整合,從而可以有效落實(shí)智能健康管理、疾病控制以及應(yīng)急管理等多項(xiàng)服務(wù);在智能電網(wǎng)領(lǐng)域中應(yīng)用大數(shù)據(jù)技術(shù),可以掌握用戶用電習(xí)慣以及各方面相關(guān)信息,并以此為基礎(chǔ)促使電能生產(chǎn)以及供給得到持續(xù)優(yōu)化,也就更有利于支持電網(wǎng)升級(jí)、維護(hù)和改造[1]。
三、大數(shù)據(jù)分析中的計(jì)算智能方法
在大數(shù)據(jù)技術(shù)不斷發(fā)展的背景之下,計(jì)算智能的應(yīng)用效果不斷提升,并延伸出了三個(gè)方面的分支,具體見下圖1:
(一)人工神經(jīng)網(wǎng)絡(luò)
人工神經(jīng)網(wǎng)絡(luò)屬于一類數(shù)學(xué)模型,其將動(dòng)物神經(jīng)系統(tǒng)行為特征作為基礎(chǔ),開展分布式的并行信息處理工作,整體上容錯(cuò)性良好,非線性映射能力較強(qiáng),自適應(yīng)能力較強(qiáng),還可實(shí)現(xiàn)分布存儲(chǔ),屬于當(dāng)代應(yīng)用效果良好的一類計(jì)算智能方法,并且對(duì)其進(jìn)行應(yīng)用時(shí),不需具備任何先驗(yàn)知識(shí),相對(duì)于傳統(tǒng)模式的統(tǒng)計(jì)學(xué)方法來(lái)說(shuō),限制條件更少,應(yīng)用更加便捷。
社交網(wǎng)絡(luò)、設(shè)備傳感器以及搜索引擎等多種不同的大數(shù)據(jù)應(yīng)用,其中的數(shù)據(jù)均處于持續(xù)產(chǎn)生的狀態(tài),數(shù)據(jù)整體也就不斷變化,所以并不能由歷史數(shù)據(jù)方面入手,對(duì)無(wú)偏訓(xùn)練集進(jìn)行構(gòu)建,且數(shù)據(jù)規(guī)模過(guò)大、產(chǎn)生速度過(guò)快,并不能一次性完全載入到內(nèi)存之中。為了有效改善此情況,需要推動(dòng)在線學(xué)習(xí)算法持續(xù)發(fā)展,每次將一個(gè)樣本作為依據(jù),針對(duì)目標(biāo)函數(shù)進(jìn)行更新。例如感知器即屬于一類應(yīng)用頻率較高的在線學(xué)習(xí)模型,同時(shí)也在人工神經(jīng)網(wǎng)絡(luò)中占據(jù)重要地位,其可針對(duì)任意訓(xùn)練樣本的預(yù)測(cè)結(jié)果正確性,開展連接權(quán)重的更新工作,若預(yù)測(cè)結(jié)果為正確,權(quán)重不變,預(yù)測(cè)結(jié)果不正確,需要以輸入樣本特征向量為基礎(chǔ),同時(shí)結(jié)合正確標(biāo)記,對(duì)連接權(quán)重進(jìn)行更新。當(dāng)前以感知器為基礎(chǔ)構(gòu)成的在線學(xué)習(xí)算法,包括均值感知器算法、投票感知器算法、被動(dòng)主動(dòng)感知器算法、權(quán)重多數(shù)感知器算法、核感知器算法以及置信度群眾感知器算法[2]。
并且,以大數(shù)據(jù)環(huán)境為基礎(chǔ),人們對(duì)數(shù)據(jù)進(jìn)行生產(chǎn)以及采集的能力越來(lái)越強(qiáng),手段也更加豐富,由此,數(shù)據(jù)規(guī)模越來(lái)越大,維度持續(xù)增長(zhǎng),其中的不足之處也就隨之出現(xiàn),具體見下表1。
為了對(duì)這一問(wèn)題進(jìn)行有效解決,需要針對(duì)原始數(shù)據(jù)實(shí)施“約簡(jiǎn)”處理,將繁復(fù)的數(shù)據(jù)轉(zhuǎn)化成為較為簡(jiǎn)潔的數(shù)據(jù),使數(shù)據(jù)處理和搜索難度降低,將其中的冗余特征基本濾除。在此過(guò)程中,人工神經(jīng)網(wǎng)絡(luò)即為針對(duì)數(shù)據(jù)實(shí)施約簡(jiǎn)處理的重要措施之一,可以通過(guò)針對(duì)輸入特征以及輸出結(jié)果之間的相關(guān)性,合理過(guò)濾冗余信息,以獲取經(jīng)過(guò)精簡(jiǎn)處理的網(wǎng)絡(luò)結(jié)構(gòu),也就可以獲取到與需求相對(duì)應(yīng)的特征子集。
(二)模糊系統(tǒng)
在針對(duì)大數(shù)據(jù)技術(shù)進(jìn)行應(yīng)用的過(guò)程中,數(shù)據(jù)的采集效果能夠受到自然環(huán)境、系統(tǒng)狀態(tài)、設(shè)備精度等多方面客觀因素的影響,并呈現(xiàn)出模糊性特點(diǎn),且在實(shí)際應(yīng)用數(shù)據(jù)的過(guò)程中,也能夠在一定程度上體現(xiàn)出模糊性,例如社交網(wǎng)絡(luò)、電商網(wǎng)站之中的諸多用戶,均選擇根據(jù)自身主觀感受發(fā)表言論,所以其中存在“不精確”“不完全”“不確定”的特點(diǎn),也就是能夠呈現(xiàn)出模糊的現(xiàn)象。模糊系統(tǒng)即為針對(duì)模糊性現(xiàn)象進(jìn)行研究的系統(tǒng),此類模糊性出現(xiàn)的原因,在于事物之間存在差異,且其中過(guò)渡劃分不明確,也可將其視為現(xiàn)實(shí)世界“不確定”與二值邏輯“精確性”的中間值,能夠使推理結(jié)果具有更強(qiáng)的可解釋性,同時(shí)也屬于當(dāng)前應(yīng)用范圍較大的一類計(jì)算智能措施,可以在語(yǔ)言變量描述或是大數(shù)據(jù)分析之中體現(xiàn)出較高的實(shí)用價(jià)值[3]。
模糊聚類屬于一類非監(jiān)督的學(xué)習(xí)方法,可以針對(duì)數(shù)據(jù)中進(jìn)行隱藏的未知模式進(jìn)行探索,但是在當(dāng)前大數(shù)據(jù)的環(huán)境中,模糊聚類算法的發(fā)展存在可擴(kuò)展性問(wèn)題,也就是在大數(shù)據(jù)集中,算法準(zhǔn)度以及施工效率提升均受到了一定程度的顯著,而為了促使聚類算法擴(kuò)展性得到有效提升,相應(yīng)的措施主要可以分為三個(gè)方面,分別是“采樣”“在線處理”“分布式并行計(jì)算”。以此為基礎(chǔ),針對(duì)大數(shù)據(jù)環(huán)境中的模糊c均值(FCM)開展聚類算法處理,可以獲取三種不同的算法,具體見下表2。
可以采用實(shí)驗(yàn)的形式針對(duì)以上各項(xiàng)算法的速度、時(shí)空復(fù)雜度以及準(zhǔn)確率等多方面性能進(jìn)行了解,同時(shí)還可與小數(shù)據(jù)集或是同類算法進(jìn)行對(duì)比,以總結(jié)不同F(xiàn)CM算法各自適用的情境,并合理提出選擇建議等。但是從實(shí)際上來(lái)看,當(dāng)前對(duì)在線模糊聚類算法進(jìn)行應(yīng)用形式以批量在線為主,并不能在大數(shù)據(jù)流中實(shí)現(xiàn)數(shù)據(jù)需求的逐個(gè)處理,所以可以嘗試應(yīng)用以隨機(jī)梯度下降為基礎(chǔ)形成的模糊聚類算法,雖然該類型的算法可以將單個(gè)數(shù)據(jù)樣本作為基礎(chǔ),對(duì)簇中心以及隸屬度矩陣進(jìn)行更新,但是也極易受到簇中心的初始化的影響或是噪聲的影響。另外,運(yùn)用聚類算法的中心目標(biāo),在于掌握數(shù)據(jù)中的規(guī)律和發(fā)現(xiàn)其中的未知規(guī)律,如果僅僅采用標(biāo)記數(shù)據(jù)的方式對(duì)算法有效性進(jìn)行評(píng)價(jià),則過(guò)于片面[4]。
(三)粒子群
粒子群屬于一類群體智能算法,該算法以將生物群的社會(huì)行為作為基礎(chǔ),一般來(lái)說(shuō),問(wèn)題規(guī)?;蚴欠蔷€性均不會(huì)對(duì)其應(yīng)用效果產(chǎn)生影響,且該方法當(dāng)前已經(jīng)得到了較為廣泛的應(yīng)用。相對(duì)于常規(guī)的遺傳算法來(lái)說(shuō),粒子群的原理更加簡(jiǎn)潔,且應(yīng)用過(guò)程難度較低,收斂速度也較快,適合在大數(shù)據(jù)環(huán)境下針對(duì)各項(xiàng)復(fù)雜程度較高的優(yōu)化問(wèn)題進(jìn)行解決。但是在當(dāng)前大數(shù)據(jù)環(huán)境下,若能夠合理采用“分而治之”的問(wèn)題解決策略,能夠更加直接、更加高效的針對(duì)粒子群優(yōu)化問(wèn)題進(jìn)行解決。
以此為基礎(chǔ),在解決問(wèn)題的過(guò)程中,采用“隨機(jī)分組”的策略,針對(duì)高維解的空間進(jìn)行分解,使其轉(zhuǎn)變成為數(shù)個(gè)大小可以發(fā)生變化的低維子空間,也就是將一個(gè)復(fù)雜的、難以解決的問(wèn)題,劃分成為多個(gè)小型的、較為簡(jiǎn)單的問(wèn)題,使復(fù)雜問(wèn)題之中的各項(xiàng)變量,盡可能避免相互依賴,減少解決各個(gè)小問(wèn)題時(shí)的影響因素,從而有利于整理問(wèn)題解決思路,提升思路清晰程度,也就可以促使問(wèn)題解決效率得到顯著提升。但是,若將該方法應(yīng)用于不可進(jìn)行分割的問(wèn)題當(dāng)中,該方法的應(yīng)用效果將難以發(fā)揮。
蟻群與粒子群具有一定的相似度,二者同樣可以在海量數(shù)據(jù)的約簡(jiǎn)操作中起到重要作用。一般來(lái)說(shuō),在數(shù)據(jù)約簡(jiǎn)操作過(guò)程中,需要將特征子集的具體情況以及分類器所具有的分類性能共同作為基礎(chǔ),根據(jù)信息檢索需求,針對(duì)信息素進(jìn)行實(shí)時(shí)更新,以起到良好的數(shù)據(jù)約簡(jiǎn)效果,從而提升信息應(yīng)用效果。另外,若能夠?qū)⑾伻号c粒子群進(jìn)行結(jié)合應(yīng)用,則更有利于提升約簡(jiǎn)措施的應(yīng)用效果,同時(shí)可以使數(shù)據(jù)的應(yīng)用效率得到顯著提升,進(jìn)而則能夠?qū)崿F(xiàn)相關(guān)問(wèn)題的解決效率的提升,以及各方面決策能力的提升。
大數(shù)據(jù)分析在電子數(shù)據(jù)案件中應(yīng)用案例:
1.在某起企業(yè)P2P非法吸納公眾財(cái)產(chǎn)案件中,涉及檢材達(dá)到50臺(tái)服務(wù)器,多個(gè)大型企業(yè)管理系統(tǒng),檢材數(shù)據(jù)量超過(guò)20TB。作為電子數(shù)據(jù)鑒定從業(yè)人員,我們的任務(wù)就是在最短時(shí)間內(nèi)快速關(guān)聯(lián)分析,去重計(jì)算,匯總提取得到案件關(guān)鍵數(shù)據(jù)信息。利用大數(shù)據(jù)分析,實(shí)現(xiàn)從企業(yè)業(yè)務(wù)流大型數(shù)據(jù)庫(kù)中,找尋出資人、接待人、業(yè)務(wù)員信息,同時(shí)包含貸款項(xiàng)目的起止時(shí)間,運(yùn)行批次,資金流向,提成返現(xiàn),獎(jiǎng)勵(lì)贈(zèng)送等等資金信息。在系統(tǒng)環(huán)境中,逐步接近核心,協(xié)助辦案人員盡快摸清并配合財(cái)務(wù)審計(jì)完成案件數(shù)據(jù)審計(jì)工作。
2.在某起詐騙案件中,梳理涉案人員微信聊天數(shù)據(jù)中的關(guān)聯(lián)關(guān)系。由于微信聊天數(shù)據(jù)類型多樣,涉及文本,視頻,圖像,文件等多種非結(jié)構(gòu)化數(shù)據(jù),需要通過(guò)多種軟件處理清洗后,將非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行結(jié)構(gòu)化整理,并形成上下游鏈條用于合并綜合分析,為后續(xù)案件審理提供數(shù)據(jù)支撐。利用大數(shù)據(jù)智能識(shí)別OCR,語(yǔ)義提取,智能詞匯匯總等功能,將繁重的手工工作接手由計(jì)算機(jī)完成,并將識(shí)別率大大提升。
四、大數(shù)據(jù)分析中計(jì)算智能發(fā)展的分析
當(dāng)代信息技術(shù)高速發(fā)展,大數(shù)據(jù)的應(yīng)用范圍越來(lái)越大,同時(shí)也受到了越來(lái)越多的關(guān)注,其能夠?yàn)橛?jì)算智能發(fā)展提供重要基礎(chǔ),并推動(dòng)計(jì)算智能持續(xù)發(fā)展。但是在充分應(yīng)用大數(shù)據(jù)技術(shù)的過(guò)程中,也應(yīng)該意識(shí)到,大數(shù)據(jù)環(huán)境具有復(fù)雜性和運(yùn)動(dòng)性特點(diǎn),受此影響,計(jì)算智能發(fā)展過(guò)程難度較大,所以當(dāng)前計(jì)算智能尚不可充分應(yīng)用于工程領(lǐng)域,而若工程領(lǐng)域不具有計(jì)算智能的支持,因?yàn)閿?shù)據(jù)量過(guò)于龐大,所以其難以獲得突破性的成就,由此,可以選擇從其他角度出發(fā),采用腦啟發(fā)計(jì)算或是人機(jī)混合智能的方式,在大數(shù)據(jù)環(huán)境下充分應(yīng)用計(jì)算智能。
(一)腦啟發(fā)計(jì)算個(gè)人非結(jié)構(gòu)化數(shù)據(jù)方向分析
腦啟發(fā)計(jì)算屬于一項(xiàng)新型計(jì)算技術(shù),主要針對(duì)人類的大腦存儲(chǔ)信息、針對(duì)信息的反饋機(jī)理進(jìn)行研究,并以此為基礎(chǔ)形成一項(xiàng)新技術(shù),其可在較為復(fù)雜的環(huán)境中進(jìn)行應(yīng)用,能夠起到提升空間復(fù)雜程度的作用,也就可以強(qiáng)化不同單一事件的聯(lián)系,所以也可以認(rèn)為,腦啟發(fā)計(jì)算的本質(zhì)為神經(jīng)形態(tài),可以將神經(jīng)形態(tài)作為基礎(chǔ)開展更加高效的智能計(jì)算。
對(duì)腦啟發(fā)計(jì)算模式進(jìn)行開發(fā)的主要目的,在于構(gòu)建起一類高效運(yùn)轉(zhuǎn)的計(jì)算結(jié)構(gòu),此類計(jì)算結(jié)構(gòu)可以針對(duì)不成體系的、復(fù)雜程度較高的數(shù)據(jù)信息進(jìn)行即時(shí)計(jì)算,同時(shí)計(jì)算過(guò)程耗能較小。從實(shí)際上來(lái)看,腦啟發(fā)計(jì)算的設(shè)想在于,以數(shù)據(jù)科學(xué)為基礎(chǔ),構(gòu)建起計(jì)算工作的新路徑,并為人工智能的進(jìn)一步發(fā)展提供更加豐富的理論基礎(chǔ)。但是當(dāng)前腦啟發(fā)計(jì)算仍然處于起步階段,相關(guān)工作人員還需要針對(duì)人腦組織進(jìn)行更加深入的研究,同時(shí)進(jìn)一步了解人腦思維機(jī)制,以促使腦啟發(fā)計(jì)算的發(fā)展效果得到提升。
(二)人機(jī)混合智能在混合語(yǔ)義識(shí)別方向分析
計(jì)算智能在發(fā)展過(guò)程中的終極目標(biāo)為具有人腦一般的“智慧”,且在相關(guān)研究工作不斷深入的基礎(chǔ)上,專業(yè)的理論不斷完善,專業(yè)的算法也越來(lái)越高級(jí),計(jì)算智能的應(yīng)用效果也就隨之不斷提升,此時(shí)人機(jī)之間的信息交互必然更加便捷,速度也能得到顯著提升,還可逐漸推廣機(jī)器輔助決策,甚至可以實(shí)現(xiàn)機(jī)器的自主決策。所以,在人機(jī)混合智能時(shí)代到來(lái)以后,將人腦的深入思考與機(jī)器的快速穩(wěn)定進(jìn)行結(jié)合,可以開展更加復(fù)雜的計(jì)算工作,并解決難度更高的問(wèn)題。如個(gè)人電子數(shù)據(jù)中海量語(yǔ)音、視頻、文字等語(yǔ)義識(shí)別問(wèn)題。
(三)個(gè)人結(jié)構(gòu)化數(shù)據(jù)在團(tuán)體海量數(shù)據(jù)中碰撞分析
利用云計(jì)算,虛擬化等技術(shù)計(jì)算能力的不斷攀升,配合大數(shù)據(jù)平臺(tái)并行計(jì)算的技術(shù)發(fā)展,使得電子數(shù)據(jù)中,個(gè)人的大量結(jié)構(gòu)化數(shù)據(jù),包含通話、聊天數(shù)據(jù),好友,群成員,朋友圈等相互溝通渠道溝通信息,可以全部一次性加載在大數(shù)據(jù)平臺(tái)數(shù)據(jù)庫(kù)中,一次性與某個(gè)團(tuán)體的海量數(shù)據(jù)進(jìn)行碰撞分析,并在可以接收的時(shí)間內(nèi)完成并獲取交叉比對(duì)結(jié)果,提升效率,爭(zhēng)取到寶貴的辦案時(shí)間。
五、結(jié)語(yǔ)
當(dāng)代數(shù)據(jù)的數(shù)量越來(lái)越多,相關(guān)技術(shù)的應(yīng)用也就受到了越來(lái)越多的關(guān)注,在大數(shù)據(jù)技術(shù)充分發(fā)揮自身優(yōu)勢(shì)的過(guò)程中,其不足之處也逐漸暴露,所以需要針對(duì)以大數(shù)據(jù)技術(shù)為基礎(chǔ)的計(jì)算智能進(jìn)行深入研究,深入探析人工神經(jīng)網(wǎng)絡(luò)、模糊系統(tǒng)以及粒子群的具體應(yīng)用模式、應(yīng)用效果,以促使計(jì)算智能的發(fā)展效果持續(xù)提升。
參考文獻(xiàn)
[1]潘澤波.大數(shù)據(jù)分析中的計(jì)算智能研究現(xiàn)狀與展望[J].無(wú)線互聯(lián)科技,2021,18(12):72-73.
[2]劉明月,涂崎,汪洋,等.移動(dòng)云計(jì)算卸載技術(shù)研究現(xiàn)狀及其在電網(wǎng)中的應(yīng)用[J].電力信息與通信技術(shù),2021,19(01):49-56.
[3]金誠(chéng),江婷君,閔勇,等.在線社交網(wǎng)絡(luò)控制實(shí)驗(yàn)的現(xiàn)狀與展望[J].浙江大學(xué)學(xué)報(bào)(理學(xué)版),2020,47(01):1-11.
[4]尉志青,馬昊,張奇勛,等.感知-通信-計(jì)算融合的智能車聯(lián)網(wǎng)挑戰(zhàn)與趨勢(shì)[J].中興通訊技術(shù),2020,26(01):45-49.
(作者單位:北京國(guó)盾信息中心)